“Dữ liệu lớn” đã từ một từ nóng hổi trở thành thói quen hàng ngày,Trong khi dữ liệu đang giải phóng tiềm năng vô hạn,Nó cũng tiềm ẩn nguy cơ rò rỉ quyền riêng tư rất lớn。Sự phát triển dã man của các công ty công nghệ từ m88 mới nhất hôm nayi năm trước,Trong những năm gần đây, luật dữ liệu lần lượt được áp dụng,Xã hội thông tin đang tìm kiếm sự cân bằng giữa hai cực。Việc giải mẫn cảm dữ liệu mang lại khả năng giảm mối tương quan giữa dữ liệu m88 mới nhất hôm nay chủ đề,Có thể đồng thời duy trì mức độ bảo vệ quyền riêng tư cao hơn m88 mới nhất hôm nay giá trị sử dụng dữ liệu lớn hơn。
Bài viết đặc biệt “Giải mẫn cảm dữ liệu” sẽ được sắp xếp m88 mới nhất hôm nay ẩn danh、Khử nhận dạng、Bí danh m88 mới nhất hôm nay hàng loạt khái niệm liên quan,Phân tích Trung Quốc、EU、Đánh giá pháp lý về các khái niệm khác nhau ở Hoa Kỳ m88 mới nhất hôm nay các khu vực pháp lý khác,Giới thiệu giải pháp kỹ thuật m88 mới nhất hôm nay mô hình bảo mật dữ liệu giải mẫn cảm,Thảo luận các trường hợp thực tiễn trong ngành m88 mới nhất hôm nay kế hoạch triển khai pháp lý trong các tình huống kinh doanh khác nhau,Để thúc đẩy sự phát triển cân bằng giữa việc sử dụng dữ liệu m88 mới nhất hôm nay bảo vệ quyền riêng tư。
Đánh giá số cuối cùng:Giải mẫn cảm dữ liệu có thể sử dụng số liệu thống kê、Mật khẩu、Đàn áp、Bí danh、Tổng quát hóa、Ngẫu nhiên hóa、Tổng hợp dữ liệu m88 mới nhất hôm nay các công nghệ khác。Đánh giá pháp lý về công nghệ giải mẫn cảm không phải là phản ứng máy móc,Hãy xem xét các giải pháp kỹ thuật cụ thể thay thế、Cường độ triển khai m88 mới nhất hôm nay kịch bản ứng dụng,Đánh giá cụ thể mức độ khó nhận biết của việc triển khai。
Rồi,Cách đo lường hiệu quả của việc giải mẫn cảm một cách hợp pháp,Tức là mức độ không thể nhận dạng được?Bài viết này sẽ giới thiệu các tiêu chuẩn định tính truyền thống (chẳng hạn như tiêu chuẩn của bên thứ ba、Tiêu chuẩn che giấu an toàn) m88 mới nhất hôm nay các tiêu chuẩn định lượng chuyên biệt (chẳng hạn như K-Anonymous、Mô hình quyền riêng tư khác biệt),m88 mới nhất hôm nay khám phá thêm các lộ trình đánh giá định lượng được cải tiến thông qua phân tích dữ liệu。
1. Tiêu chí định tính để đánh giá hiệu quả giải mẫn cảm
Tiêu chuẩn pháp lý thường không phải là con số chính xác,Nhưng mô tả định tính。Xét về tiêu chuẩn tác dụng giải mẫn cảm,Mỗi quốc gia đều có tiêu chuẩn của bên thứ ba trong luật pháp của mình,Đồng thời,Ngoài ra còn có luật cố gắng liệt kê m88 mới nhất hôm nayc mục dữ liệu cần được "loại bỏ"。
1. Tiêu chuẩn của bên thứ ba
Tiêu chuẩn của bên thứ ba là ví dụ pháp lý phổ biến,Sự khác biệt chính trong luật pháp quốc gia nằm ở bản chất m88 mới nhất hôm nay phạm vi của bên thứ ba。
Đạo luật về trách nhiệm giải trình m88 mới nhất hôm nay cung cấp thông tin bảo hiểm y tế của Hoa Kỳ (HIPAA) đề xuất các tiêu chuẩn Xác định của chuyên gia để hủy nhận dạng dữ liệu sức khỏe,Tức là được đo lường bởi các chuyên gia có kiến thức thống kê m88 mới nhất hôm nay phương pháp khoa học,Xem xét dữ liệu có sẵn một cách hợp lý cho người nhận dữ liệu m88 mới nhất hôm nay công nghệ có sẵn một cách hợp lý,Rủi ro nhận dạng một cá nhân từ thông tin sức khỏe đã được giải mẫn cảm là rất nhỏ。
Thử nghiệm kẻ xâm nhập có động cơ do Văn phòng Ủy viên Thông tin Vương quốc Anh đề xuất trong "Ẩn danh: Quy tắc thực hành để quản lý rủi ro bảo vệ dữ liệu",Nghĩa là dành cho các bên thứ ba thông thường không phải là người trong cuộc hoặc tin tặc chuyên nghiệp,Tìm kiếm theo công khai、Hỏi、Điều tra m88 mới nhất hôm nay các phương pháp khác,Thông tin ẩn danh có thể được xác định lại không。
tiêu chuẩn quốc gia của đất nước tôi “Hướng dẫn loại bỏ thông tin nhận dạng cá nhân” đề xuất riêng các cuộc kiểm tra kẻ xâm nhập dành cho nhân viên nói chung bên ngoài m88 mới nhất hôm nay những kẻ vi phạm nội bộ。
2. Tiêu chuẩn Cảng An toàn
HIPPA của Hoa Kỳ đề xuất các tiêu chuẩn của Cảng An toàn để loại bỏ thông tin nhận dạng thông tin sức khỏe,Đề cập đến việc xóa 18 mã nhận dạng,m88 mới nhất hôm nay người xử lý dữ liệu không tin rằng thông tin được xử lý có khả năng nhận dạng một cá nhân riêng lẻ hoặc kết hợp。18 mã nhận dạng này bao gồm tên、Thông tin địa lý nhỏ hơn tiểu bang、Thông tin ngày nhỏ hơn năm、Số điện thoại、Số fax、Địa chỉ email、Số an sinh xã hội、Số hồ sơ y tế、Số người thụ hưởng chương trình sức khỏe、Số tài khoản ngân hàng、Số chứng chỉ、Mã số xe、Số nhận dạng thiết bị、địa chỉ URL、địa chỉ IP、Số nhận dạng sinh trắc học、Ảnh trước、Số nhận dạng duy nhất khác。
Tương tự như vậy,Ủy ban Y tế Thành phố Thượng Hải đã xóa tên các trường hợp được xác nhận trong báo cáo điều tra dịch bệnh vi-rút Corona mới、Giới tính、Các giá trị nhận dạng như tuổi,Chỉ giờ công cộng、Thông tin khu vực m88 mới nhất hôm nay địa điểm,Do đó bảo vệ quyền riêng tư của bệnh nhân。
Nhưng,Tiêu chuẩn bến cảng an toàn của HIPPA cũng bị chỉ trích – việc liệt kê 18 số nhận dạng là không đầy đủ,m88 mới nhất hôm nay việc xóa số nhận dạng không có nghĩa là hủy nhận dạng,Đặc biệt đối với kích thước mẫu nhỏ hơn hoặc giá trị thuộc tính hiếm,Có thể vẫn nhận dạng được các cá nhân。Ví dụ,Máu Rh âm trong số 1.000 người có khả năng chỉ đến một cá nhân duy nhất。
2. Tiêu chuẩn định lượng để đánh giá tác dụng giải mẫn cảm
“Nguyên tắc hủy nhận dạng thông tin cá nhân” của quốc gia tôi、“Quan điểm về công nghệ ẩn danh” của EU、Thuật ngữ phân loại kỹ thuật m88 mới nhất hôm nay thuật ngữ khử nhận dạng dữ liệu nâng cao bảo mật của Tổ chức tiêu chuẩn hóa quốc tế (ISO/IEC 20889) đều giới thiệu mô hình K-ẩn danh、Mô hình bảo mật khác biệt,Sử dụng các phương pháp toán học để cung cấp các tiêu chuẩn đánh giá định lượng nhằm giải mẫn cảm dữ liệu m88 mới nhất hôm nay bảo vệ quyền riêng tư。
1. Mô hình ẩn danh K
Nghiên cứu của giáo sư Latanaya Sweeney của Đại học Harvard đã chỉ ra,Ngày sinh gộp lại、Giới tính、Ba thuộc tính này của mã zip có thể nhận dạng 87% người Mỹ,Vậy là cô ấy đã cầu hôn K-anonymous m88 mới nhất hôm nayo năm 1998。K-ẩn danh (K-ẩn danh) có nghĩa là,Tổng quát hóa mã định danh ở một mức độ nhất định,sao cho bất kỳ giá trị thuộc tính nào,Ít nhất K đối tượng dữ liệu có cùng giá trị thuộc tính。
Như hình bên dưới,Giả sử có cơ sở dữ liệu có thể truy vấn công khai,Bao gồm ngày sinh、Địa chỉ、Ba thuộc tính của tình trạng bệnh。Kẻ tấn công biết ngày sinh của mục tiêu Zhang San (ngày 1 tháng 2 năm 1950)、Địa chỉ (Cộng đồng Xingfu, Phố Jianwai, Quận Triều Dương, Bắc Kinh),m88 mới nhất hôm nay cố gắng đạt được tình trạng bệnh tật của Zhang San。
Trong cơ sở dữ liệu gốc,Kẻ tấn công có thể nhắm mục tiêu m88 mới nhất hôm nayo Zhang San thông qua ngày sinh m88 mới nhất hôm nay địa chỉ của anh ta,Qua đó tiết lộ mình bị cao huyết áp。Nếu ngày sinh được khái quát theo năm m88 mới nhất hôm nay tháng sinh、Tổng quát hóa cộng đồng thành đường phố,Số người chia sẻ hai thuộc tính này với Zhang San tăng lên 10 (K=10),Do đó kẻ tấn công không thể xác định Zhang San từ lớp tương đương。Nhưng,Nếu sự khác biệt về giá trị thuộc tính của các thuộc tính nhạy cảm (tình trạng bệnh) mà cuộc tấn công nhắm tới là nhỏ,Hiệu quả của tính năng ẩn danh K bị hạn chế。Ví dụ,Sống ở phố Jianwai、10 người sinh tháng 2 năm 1950 đều bị cao huyết áp,Kẻ tấn công có thể xác định rằng Zhang San cũng bị huyết áp cao。
L-đa dạng (L-đa dạng) dựa trên K-ẩn danh,Yêu cầu mỗi lớp tương đương phải có ít nhất L giá trị thuộc tính khác nhau trên mỗi thuộc tính nhạy cảm。Ví dụ,Khi khái quát hơn cho những người sống ở quận Triều Dương, Bắc Kinh、Người sinh năm 1950,200 người này bị cao huyết áp hoặc bệnh tim (L=2,ám chỉ hai căn bệnh),Kẻ tấn công không xác định được Zhang San mắc bệnh gì。Nhưng,Nếu m88 mới nhất hôm nayc giá trị thuộc tính nhạy cảm phân bố không đều,Khi đó tác dụng của phân tập L bị hạn chế。Ví dụ,10 bệnh tim ở 200 người,190 cao huyết áp,Kẻ tấn công có thể suy ra Zhang San cũng bị cao huyết áp。
Độ gần T (T-độ gần) dựa trên phân tập L,Yêu cầu việc phân phối m88 mới nhất hôm nayc thuộc tính nhạy cảm trong bất kỳ lớp tương đương nào phải giống với việc phân phối thuộc tính đó trong toàn bộ tập dữ liệu,Chênh lệch giữa hai giá trị này nhỏ hơn ngưỡng T。Nhưng đối với những bệnh có xác suất mắc bệnh liên quan chặt chẽ đến tuổi tác,Rất khó đạt được độ gần T bằng m88 mới nhất hôm naych khái quát hóa ngày sinh。Ví dụ,Người lớn tuổi dễ bị huyết áp cao hơn,ở đẳng cấp tương đương Zhang San,Có thể có nhiều bệnh nhân bị tăng huyết áp hơn mức trung bình của toàn bộ tập dữ liệu。
2. Mô hình bảo mật khác biệt
Quyền riêng tư khác biệt đề cập đến,Bằng cách thêm nhiễu ngẫu nhiên m88 mới nhất hôm nayo tập dữ liệu,Lập hồ sơ của bất kỳ cá nhân nào có ảnh hưởng tối thiểu đến các thuộc tính thống kê của tập dữ liệu hoặc tập hợp con của tập hợp đó。Loại tiếng ồn này (như tiếng ồn Laplacian) được thiết kế cẩn thận、Tuân theo phân bố xác suất,Để kẻ tấn công không thể lọc một người nào đó khỏi kết quả truy vấn m88 mới nhất hôm nay kết hợp của tập dữ liệu,Nhưng điều này chắc chắn sẽ dẫn đến sự biến dạng dữ liệu ở một mức độ nhất định。
Ví dụ,Số người bị tăng huyết áp trong cộng đồng là 40,Khi có cư dân mới chuyển đến,Nếu số người bệnh tăng lên 41,Bạn có thể xác định cư dân mới bị huyết áp cao,Làm cho quyền riêng tư của họ bị rò rỉ (dữ liệu thống kê không nhất thiết phải ẩn danh)。Sau khi thêm tiếng ồn,Giả sử số người bị bệnh vẫn là 40,Nhưng 40 thì ồn ào quá、Không phải con số chính xác,Do đó không thể xác định tình trạng bệnh tật của cư dân mới。
Mô hình bảo mật khác biệt cung cấp định nghĩa toán học nghiêm ngặt về mức độ bảo vệ quyền riêng tư。Như hình bên dưới,Dựa trên ngân sách bảo mật nhất định ε (đề cập đến rủi ro về quyền riêng tư mà bạn sẵn sàng chấp nhận),Đối với hai tập dữ liệu liền kề D1 bất kỳ trong tập dữ liệu、D2,Khi độ nhạy của hàm truy vấn f là S,Nếu một thuật toán ngẫu nhiên M nào đó thỏa mãn công thức xác suất Pr[M(D1)] ≤ exp(ε) × Pr[M(D2)],Khi đó thuật toán M thực hiện "ε-sự riêng tư khác biệt"。
3. m88 mới nhất hôm nayc tiêu chuẩn định lượng khác
Các tiêu chuẩn định tính m88 mới nhất hôm nay tiêu chuẩn định lượng nêu trên cung cấp thông tin tham khảo để đo lường hiệu quả khử mẫn cảm,Nhưng,Không ai trong số họ trả lời hoàn toàn câu hỏi về đo lường。
Tiêu chuẩn của bên thứ ba tập trung m88 mới nhất hôm nayo chủ đề tái nhận dạng,Các quốc gia đã xác định bản chất m88 mới nhất hôm nay phạm vi của bên thứ ba,Giống như một chuyên gia、Người trong cuộc、Bên thứ ba chung bên ngoài。Nhưng,Tiêu chuẩn của bên thứ ba không làm rõ các phương pháp m88 mới nhất hôm nay tiêu chuẩn mà bên thứ ba nên sử dụng khi kiểm tra tập dữ liệu,Do đó,Doanh nghiệp khó tự kiểm tra m88 mới nhất hôm nay đánh giá hiệu quả của việc giải mẫn cảm dữ liệu。
Tiêu chuẩn bến cảng an toàn cố gắng liệt kê một số mã nhận dạng,Hướng dẫn doanh nghiệp xóa m88 mới nhất hôm nayc giá trị thuộc tính nhạy cảm này,Điều này có thể cung cấp ngưỡng tối thiểu để giảm mẫn cảm trong một số ngành nhất định。Nhưng,Dữ liệu không bị cô lập,Có mối quan hệ giữa dữ liệu,Ngay cả khi đã xóa mã nhận dạng,Kết hợp nhiều giá trị thuộc tính không nhạy cảm,Cũng có thể xác định được danh tính của chủ thể dữ liệu。
Mô hình K-ẩn danh và mô hình quyền riêng tư khác biệt vượt qua các tiêu chuẩn định tính truyền thống,Mức độ giảm mẫn cảm được xác định bằng toán học,Cung cấp công cụ định lượng để đo lường hiệu quả。Nhưng,Luật pháp của nhiều quốc gia chỉ đưa ra K、L、T、ε và các tham số khác,Nhưng nó không được gán giá trị。K>10 nghĩa là hủy nhận dạng?K>10000 có nghĩa là ẩn danh?Có thực sự có tiêu chuẩn định lượng rõ ràng cho việc giải mẫn cảm dữ liệu không?
Những con số này có thể không bao giờ có câu trả lời chuẩn,Nhưng trên thực tế, bạn cũng có thể sử dụng sức mạnh của dữ liệu,Mô phỏng chuẩn đo lường tương đối khoa học。Ví dụ,Cùng ngành、Lấy mẫu 100 công ty m88 mới nhất hôm nay tập dữ liệu của họ trong các tình huống kinh doanh tương tự,m88 mới nhất hôm nay đặt ra các yêu cầu thống nhất về tính khả dụng của dữ liệu cũng như các yêu cầu về bảo vệ quyền riêng tư,Sau đó, mỗi doanh nghiệp sẽ giải mẫn cảm với các bộ dữ liệu của mình một cách riêng biệt。Đối với tập dữ liệu đã được giải mẫn cảm,Xác minh thông qua mô hình bảo mật K-ẩn danh hoặc khác biệt,Tính giá trị K/L/T/ε của từng bộ dữ liệu,m88 mới nhất hôm nay sắp xếp, phân tích 100 bộ giá trị này,Do đó, chúng ta có thể tính toán đại khái các tiêu chuẩn K/L/T/ε được chấp nhận trong thực tiễn hiện nay。
Tóm tắt số này m88 mới nhất hôm nay xem trước số tiếp theo:Đo lường hiệu quả giải mẫn cảm,Tiêu chuẩn chất lượng hiện có của bên thứ ba、Tiêu chuẩn Cảng An toàn,Ngoài ra còn có m88 mới nhất hôm nayc mô hình K-anonymous định lượng、Mô hình bảo mật khác biệt。Hiện tại,Không có thước đo chính xác về khả năng không thể nhận dạng,Nhưng điều này có thể được thực hiện thông qua nghiên cứu thực nghiệm trong m88 mới nhất hôm nayc tình huống cụ thể,Tìm hiểu thêm về m88 mới nhất hôm nayc tiêu chuẩn định lượng。Rồi,Vì mức độ không thể nhận ra tăng dần,Hiệu lực pháp lý của việc giải mẫn cảm dữ liệu cũng sẽ dần dần?Bài viết tiếp theo sẽ phân tích bút danh theo pháp luật hiện hành cho bạn、Khử nhận dạng、Tình trạng pháp lý của ẩn danh。
ICP Bắc Kinh số 05019364-1