2021-04-29

Giải mẫn cảm dữ liệu 3?

Tác giả: Dương Kiến Nguyên

“Dữ liệu lớn” đã từ một từ nóng hổi trở thành thói quen hàng ngày,Trong khi dữ liệu đang giải phóng tiềm năng vô hạn,Nó cũng tiềm ẩn rất nhiều nguy cơ rò rỉ quyền riêng tư。Sự phát triển dã man của các công ty công nghệ từ m88 moi nhati năm trước,Trong những năm gần đây, luật dữ liệu lần lượt được áp dụng,Xã hội thông tin đang tìm kiếm sự cân bằng giữa hai cực。Giải mẫn cảm dữ liệu mang lại khả năng giảm mối tương quan giữa dữ liệu m88 moi nhat chủ đề,Có thể đồng thời duy trì mức độ bảo vệ quyền riêng tư cao hơn m88 moi nhat giá trị sử dụng dữ liệu lớn hơn。

Bài viết đặc biệt “Giải mẫn cảm dữ liệu” sẽ được sắp xếp m88 moi nhat ẩn danh、Khử nhận dạng、Bí danh m88 moi nhat hàng loạt khái niệm liên quan,Phân tích Trung Quốc、EU、Đánh giá pháp lý về các khái niệm khác nhau ở Hoa Kỳ m88 moi nhat các khu vực pháp lý khác,Giới thiệu giải pháp kỹ thuật m88 moi nhat mô hình bảo mật dữ liệu giải mẫn cảm,Thảo luận các trường hợp thực tiễn trong ngành m88 moi nhat kế hoạch triển khai pháp lý trong các tình huống kinh doanh khác nhau,Để thúc đẩy sự phát triển cân bằng giữa việc sử dụng dữ liệu m88 moi nhat bảo vệ quyền riêng tư。

Đánh giá số cuối cùng: Trung Quốc、EU、Tính năng ẩn danh được áp dụng tại Hoa Kỳ m88 moi nhat các khu vực pháp lý khác、Khử nhận dạng、Các khái niệm như bút danh,Tuy nhiên, có sự khác biệt trong định nghĩa của cùng một khái niệm ở các khu vực pháp lý khác nhau,Nghĩa là có những yêu cầu khác nhau về mức độ không thể phân biệt được。

image.png


Trung Quốc、EU phát triển hướng dẫn giới thiệu về các kỹ thuật giải mẫn cảm thường được sử dụng。Trong thực tế,Một sự hiểu lầm phổ biến là liên kết một cách máy móc các công nghệ cụ thể với đánh giá hiệu quả giải mẫn cảm dữ liệu cụ thể,Ví dụ,Công nghệ tổng quát hóa、Công nghệ ngẫu nhiên hóa là ẩn danh。Nhưng thực ra,Luật pháp quốc gia không đưa ra đánh giá chung về một loại công nghệ,Đây là sự đánh giá pháp lý về hiệu quả cụ thể đạt được nhờ xử lý kỹ thuật,Vì cùng một công nghệ có cường độ triển khai m88 moi nhat kịch bản ứng dụng nhất định,Có thể đạt được mức độ hiệu ứng giảm mẫn cảm khác nhau。

Bài viết này sẽ giới thiệu số liệu thống kê、Mật khẩu、Đàn áp、Bí danh、Tổng quát hóa、Ngẫu nhiên hóa、Các nguyên tắc cơ bản của công nghệ giải mẫn cảm dữ liệu như tổng hợp dữ liệu,m88 moi nhat cho ví dụ về khoảng tác dụng của cùng công nghệ。Mỗi công nghệ có đặc điểm m88 moi nhat ngưỡng khác nhau,Dựa trên các kịch bản m88 moi nhat mục tiêu cụ thể trong thực tế,Bạn có thể chọn công nghệ m88 moi nhat cường độ triển khai phù hợp,Do đó cân bằng tính khả dụng m88 moi nhat bảo mật dữ liệu。

image.png


1. Công nghệ m88 moi nhat nguyên tắc giải mẫn cảm dữ liệu

(1) Kỹ thuật thống kê

1、Lấy mẫu dữ liệu (lấy mẫu): trích xuất một số lượng từ tập dữ liệu gốc、Mẫu của một số thuộc tính,Do đó khiến kẻ tấn công không thể xác định liệu cá nhân mục tiêu có nằm trong tập dữ liệu được lấy mẫu hay không。

2、Data aggregation (tổng hợp): Thống kê các giá trị thuộc tính của tập dữ liệu gốc,Chỉ xuất các thuộc tính thống kê (chẳng hạn như tổng、Đếm、trung bình、Giá trị tối đa、Giá trị tối thiểu、Phương sai、Độ lệch chuẩn, v.v.),Từ đó giảm nguy cơ tiết lộ thông tin cá nhân。

(2) Công nghệ mật mã

1、Mã hóa xác định (mã hóa không ngẫu nhiên): mã hóa dữ liệu thông qua khóa。

2、Mã hóa đồng cấu (mã hóa ngẫu nhiên): cho phép mọi người thực hiện các thao tác trên dữ liệu được mã hóa,Kết quả của thao tác được giải mã tương đương với kết quả của thao tác tương tự trên dữ liệu không được mã hóa。

Lấy kịch bản điện toán đám mây làm ví dụ。Ở chế độ cũ,Người dùng cần tin tưởng rằng nhà cung cấp dịch vụ đám mây sẽ không đánh cắp hoặc thậm chí rò rỉ dữ liệu người dùng。Mã hóa đồng hình có thể giải quyết cơ bản tính bảo mật m88 moi nhat bảo mật trong xử lý dữ liệu,Bảo vệ cả dữ liệu của người dùng m88 moi nhat mô hình điện toán của nhà cung cấp dịch vụ đám mây。

image.png


(3) Công nghệ triệt tiêu

1、Ẩn: xóa số nhận dạng trực tiếp hoặc một phần của số đó,Ví dụ: đổi bốn chữ số của số điện thoại di động hoặc số CMND thành ****。

2、Loại bỏ cục bộ: xóa các giá trị thuộc tính cụ thể,Tránh kết hợp với các thuộc tính khác để nhận dạng một cá nhân。Kỹ thuật này thường phù hợp với các giá trị thuộc tính hiếm,Ví dụ: nhóm máu Rh âm hiếm gặp。

(4) Công nghệ bút danh

1、Bí danh là việc thay thế giá trị ban đầu của mã định danh bằng bút danh được tạo。

2、Bí danh độc lập với mã định danh: thay thế giá trị ban đầu của mã định danh bằng bút danh,m88 moi nhat tạo bảng gán bút danh m88 moi nhat giá trị gốc。Bút danh ở đây đề cập đến một giá trị ngẫu nhiên không liên quan đến mã nhận dạng,Bạn cũng có thể áp dụng cách tiếp cận "nhiều-một" (nhiều giá trị ban đầu tương ứng với một bút danh),Nhưng điều này sẽ làm giảm khả năng cung cấp dữ liệu。

3、Bí danh dựa trên mã định danh: thông qua mã hóa、Băm/băm m88 moi nhat các công nghệ mật mã khác,Tạo bút danh dựa trên giá trị ban đầu của mã định danh。Công nghệ mã hóa thường có sự tương ứng một-một,Có thể giải mã bằng khóa m88 moi nhat thuật toán,Khôi phục giá trị ban đầu của mã định danh。Hàm băm là phép toán một chiều,Bảo mật tốt hơn,Khó khôi phục ngược giá trị ban đầu。

(5) Công nghệ tổng quát hóa

Tổng quát hóa đề cập đến việc giảm mức độ chi tiết của các giá trị thuộc tính,Tạo thuộc tính trừu tượng hơn、Mô tả tổng quát hơn。Ví dụ,Tổng hợp tên thành họ,Tổng hợp thành phố thành tỉnh,Làm tròn số、Đặt khoảng thời gian、Giá trị tối đa hoặc tối thiểu。Ví dụ,Tổng quát hóa giá trị chính xác của thu nhập hàng năm từ 100.000 trở xuống、100.000 đến 1 triệu、Ba dãy từ 1 triệu trở lên,Để nhiều cá nhân có thể chia sẻ cùng một giá trị thuộc tính、Giảm khả năng nhận dạng lại。

(6) Công nghệ ngẫu nhiên hóa

Ngẫu nhiên đề cập đến việc sửa đổi ngẫu nhiên các giá trị thuộc tính,Điều này sẽ phá hủy tính xác thực của tập dữ liệu。

1、Bổ sung nhiễu: Thêm giá trị/nhiễu ngẫu nhiên m88 moi nhato một thuộc tính,Trong khi vẫn duy trì nhiều nhất có thể các đặc điểm thống kê ban đầu của thuộc tính này。

2、Thay thế: Sắp xếp lại các giá trị của một thuộc tính trong tập dữ liệu,tức là,Thay thế giá trị thuộc tính của một cá thể bằng một cá thể khác。

3、Tập hợp vi mô: sắp xếp m88 moi nhat nhóm một thuộc tính nhất định,Các giá trị thuộc tính đóng được nhóm lại với nhau,m88 moi nhat thay thế tất cả giá trị ban đầu của mỗi nhóm bằng giá trị trung bình của nhóm đó。

屏幕快照 2021-12-01 下午3.40.45.png


(7) Công nghệ tổng hợp dữ liệu

Công nghệ tổng hợp dữ liệu (dữ liệu tổng hợp) đề cập đến việc tạo tập dữ liệu theo cách thủ công,Tập dữ liệu tổng hợp khớp với đặc điểm của tập dữ liệu gốc。


2. Đánh giá pháp lý về công nghệ giải mẫn cảm

“Nguyên tắc khử nhận dạng thông tin cá nhân” của quốc gia tôi m88 moi nhat “Thuật ngữ khử nhận dạng dữ liệu nâng cao quyền riêng tư m88 moi nhat phân loại công nghệ” (ISO/IEC 20889) của Tổ chức tiêu chuẩn hóa quốc tế liệt kê bảy công nghệ trên là công nghệ khử nhận dạng,"Ý kiến ​​về công nghệ ẩn danh" của EU bao gồm công nghệ khái quát hóa、Công nghệ ngẫu nhiên là công nghệ ẩn danh chính。Nhưng,Điều này không có nghĩa là sử dụng một công nghệ cụ thể sẽ đạt được hiệu quả cụ thể。Công nghệ tổng quát hóa、Có thể loại bỏ nhận dạng bằng công nghệ ngẫu nhiên、Cũng có thể ẩn danh,Chủ yếu phụ thuộc m88 moi nhato mức độ không thể nhận dạng được của giải pháp kỹ thuật cụ thể。

Đánh giá pháp lý về công nghệ giải mẫn cảm,Những điểm cần lưu ý sau:

1. Có sự khác biệt về khả năng giải mẫn cảm của các công nghệ khác nhau

Các công nghệ giải mẫn cảm khác nhau có đặc điểm m88 moi nhat ngưỡng riêng。Ví dụ,Thống kê、Tổng quát hóa、Các công nghệ như ngẫu nhiên hóa có thể đạt được trạng thái "không thể phục hồi không thể nhận dạng",Nhưng công nghệ bút danh có thể đạt được hiệu quả "có thể nhận dạng khi kết hợp với thông tin khác/không thể nhận dạng mà không cần sự trợ giúp của thông tin khác"。

Được nhấn mạnh đặc biệt trong "Ý kiến ​​về công nghệ ẩn danh" của Liên minh Châu Âu,Không thể sử dụng bút danh làm phương pháp ẩn danh,Vì việc đặt bút danh làm giảm mối liên kết giữa tập dữ liệu m88 moi nhat danh tính của chủ thể dữ liệu,Tuy nhiên, chủ thể dữ liệu vẫn có thể được xác định gián tiếp。Ví dụ,Biệt hiệu mà người dùng sử dụng trên mạng xã hội là bút danh,Nhưng kết hợp với các thông tin khác do người dùng đăng tải,Vẫn có thể xác định được người dùng。

2. Có sự khác biệt về cường độ triển khai của cùng một công nghệ

Đối với công nghệ khử mẫn cảm tương tự,Cũng có sự khác biệt về cường độ triển khai cụ thể。Ví dụ,Nếu chữ số bị chặn trong số ID là ngày sinh thay vì bốn chữ số cuối,Hiệu quả an toàn kém,Vì tôi thường tổ chức sinh nhật cho bạn bè、Biểu mẫu thông tin giới thiệu、Hiển thị ngày sinh khi đăng ký thành viên,Dễ dàng khôi phục số ID gốc。

Công nghệ tổng quát hóa cũng có thể thiết lập các mức độ chi tiết khác nhau,Ví dụ: khái quát hóa dữ liệu địa chỉ,Từ số nhà chính xác đến cộng đồng、đường phố、Quận m88 moi nhat Quận、Tỉnh m88 moi nhat thành phố、Tỉnh、Quốc gia,Mức độ khó nhận biết ngày càng sâu sắc,Nhưng giá trị của dữ liệu cũng giảm đi。Do đó,Một mặt, "Ý kiến ​​​​về công nghệ ẩn danh" của EU công nhận rằng công nghệ tổng quát hóa có thể đạt được sự ẩn danh,Một mặt, nó nhấn mạnh rằng nó không thể đạt được sự ẩn danh một cách hiệu quả trong mọi tình huống。

3. Các tình huống cụ thể cũng sẽ ảnh hưởng đến hiệu quả xử lý kỹ thuật

Việc đánh giá pháp lý về công nghệ giải mẫn cảm không trừu tượng,Nhưng dựa trên các tình huống ứng dụng cụ thể,Vì các tình huống cụ thể sẽ ảnh hưởng đến hiệu quả xử lý kỹ thuật。Ví dụ,Kỹ thuật thống kê thường có thể che giấu các cá nhân,Nhưng khi kết hợp với kiến ​​thức nền tảng, nó vẫn có thể khiến các cá nhân bị lộ。Giả sử trong một cộng đồng nhất định,Số người bị tăng huyết áp là 40,Từ giá trị thống kê 40,Nói chung là không thể xác định được bệnh nhân;Nhưng,Khi có cư dân mới chuyển đến,Nếu số người bệnh tăng lên 41,Có thể xác định cư dân mới bị cao huyết áp。Do đó,Dữ liệu thống kê không nhất thiết phải ẩn danh trong một số trường hợp nhất định。

Tóm tắt về vấn đề này m88 moi nhat bản xem trước của vấn đề tiếp theo: Số liệu thống kê có thể được sử dụng để giải mẫn cảm dữ liệu、Mật khẩu、Đàn áp、Bí danh、Tổng quát hóa、Ngẫu nhiên hóa、Tổng hợp dữ liệu, các công nghệ khác m88 moi nhat sự kết hợp của chúng。Có sự khác biệt về khả năng giải mẫn cảm của các công nghệ khác nhau,Có sự khác biệt về cường độ triển khai của cùng một công nghệ,Các tình huống cụ thể cũng sẽ ảnh hưởng đến hiệu quả xử lý kỹ thuật,Do đó,Đánh giá của luật về công nghệ giải mẫn cảm không phải là một quy chuẩn chung cho tất cả,Nhưng hãy xem xét cụ thể hiệu quả mà công nghệ đạt được。Rồi,Câu hỏi tiếp theo cần được trả lời là,Cách đo lường hiệu quả của việc giải mẫn cảm một cách hợp pháp?Bài viết tiếp theo sẽ giới thiệu cho bạn về chất lượng、Định lượng hai loại chuẩn đo lường。


Liên hệ với chúng tôi
Địa chỉ: Số 5, Đường m88 moi nhatnh đai 3 phía Đông, Quận Triều Dương, Bắc Kinh
Tầng 20, Trung tâm Tài chính Fortune (Mã Zip 100020)
Tel: +86 10 8560 6888
Fax: +86 10 8560 6999
Email: haiwenbj@haiwen-law.com
Địa chỉ: Số 1515, Đường Tây Nam Kinh, Thượng Hải
Phòng 2605, Tháp 1, Trung tâm Jing'an Kerry (Mã bưu điện 200040)
Tel: +86 21 6043 5000
Fax: +86 21 5298 5030
Email: haiwensh@haiwen-law.com
Địa chỉ: Phòng 1101-1104, 11/F, Giai đoạn 1, Exchange Square, 8 Connaught Place, Central, Hong Kong
ĐT: +852 3952 2222
Fax: +852 3952 2211
Email: haiwenhk@haiwen-law.com
Địa chỉ: Số 1, Đường Zhongxin 4, Quận Futian, Thâm Quyến
Phòng 3801, Tháp 3, Kerry Properties Plaza (Mã bưu điện 518048)
ĐT: +86 755 8323 6000
Fax: +86 755 8323 0187
Email: haiwensz@haiwen-law.com
Địa chỉ: Số 233, Đại lộ Giao Tử, Khu công nghệ cao, Thành Đô
Tầng 20, Tháp C, Trung tâm Quốc tế Hải ngoại Trung Quốc 01、Đơn vị 11-12 (Mã vùng 610041)
Tel: +86 28 6391 8500
Fax: +86 28 6391 8397
Email: haiwencd@haiwen-law.com