Data science

Trong mã hóa đồng nhất, chúng tôi (phải) tin tưởng

Cũng giống như chúng ta đang trên đỉnh cao của việc đạt được sức mạnh như thần với phân tích nâng cao và học máy trên nguồn dữ liệu lớn, cùng với đó là các luật về quyền riêng tư như GDPR và CCPA để tiêu diệt dư luận. Nhưng nhờ sự xuất hiện của mã hóa đồng hình, bên dữ liệu lớn có thể tiếp tục – với điều kiện đủ số người tin tưởng vào nó. Mã hóa đồng nhất là một công nghệ tương đối mới mà bạn có thể sẽ được nghe nhiều hơn trong tương lai. Đó là bởi vì nó làm được điều mà thoạt nhìn có vẻ không thể: Nó cho phép các nhóm nhà nghiên cứu sử dụng các kỹ thuật phân tích và ML nâng cao trên dữ liệu được mã hóa. Toán học đằng sau mã hóa đồng hình đã được chứng minh hơn một thập kỷ trước, nhưng máy tính quá chậm để làm cho công nghệ trở nên thiết thực cho việc sử dụng hàng ngày. Điều đó đã thay đổi trong những năm gần đây và giờ đây các giải pháp mã hóa đồng hình đang được các công ty lớn áp dụng, Alon Kaufman, Giám đốc điều hành và đồng sáng lập của Duality Technologies, công ty cung cấp các giải pháp mã hóa đồng hình cho biết. Kaufman, một trong những chuyên gia hàng đầu thế giới về công nghệ nâng cao quyền riêng tư (PET) cho biết: “Có rất nhiều lý do tại sao các công ty muốn chia sẻ và làm việc cùng nhau. “Đồng thời, họ không sẵn sàng làm điều đó vì quyền riêng tư, vì mối quan tâm kinh doanh của riêng họ. Vì vậy, đó là những gì Tính năng kép cho phép. ” Các cá nhân và nhóm có lý do chính đáng để không chia sẻ dữ liệu của họ ngay hôm nay: Họ có thể mất quyền riêng tư. Đây không phải là một vấn đề tầm thường, đặc biệt là trong bối cảnh lạm dụng dữ liệu lớn của những gã khổng lồ công nghệ – chưa kể đến khả năng bị phạt tiền lớn nếu họ bị phát hiện vi phạm GDPR, CCPA, HIPAA và bất kỳ luật bảo mật mới nào khác. đã mọc lên trong vài năm qua. Chia sẻ dữ liệu Mặc dù có giá trị trong việc bảo vệ quyền riêng tư, nhưng có giá trị trong việc chia sẻ dữ liệu, cả ở cấp độ dân số và cấp độ cá nhân, giáo sư khoa học máy tính Michael Jordan của UC Berkeley cho biết. Jordan, cố vấn của Duality cho biết: “Một căn bệnh như ung thư là một căn bệnh chung mà tất cả chúng ta đều có thể mắc phải, theo những cách khác nhau nhưng có liên quan đến nhau. “Phân tích dữ liệu hợp tác sẽ là cách được giải quyết.” Các bệnh viện hiện đang bị cấm tổng hợp dữ liệu ung thư tương ứng với nhau và cho phép các nhà nghiên cứu sử dụng dữ liệu này để tìm ra các mô hình và phương pháp điều trị tiềm năng vì có nguy cơ vi phạm quyền riêng tư của mọi người. HIPAA có các yêu cầu mạnh mẽ về bảo vệ bệnh nhân và các hình phạt nếu vi phạm chúng có thể rất nghiêm khắc. “Tôi là một bệnh viện. Tôi có tất cả dữ liệu về bệnh ung thư tuyệt vời này. Tôi rất muốn chia sẻ với các bệnh viện khác để tất cả chúng ta có tầm nhìn xa hơn về ung thư như một hiện tượng, ”Jordan nói với Datanami. “Tôi không thể vì nghề luật cho tôi biết tôi không thể, và nghề luật thực sự không nghĩ thông suốt về điều đó. Họ chỉ nói, 'À, không thể mạo hiểm được.' Alon Kaufman là người đồng sáng lập và Giám đốc điều hành của Duality Technologies “Chà, nếu bạn có thể đến với nghề luật sư và nói rằng 'Chúng tôi có kỹ thuật này thực sự đảm bảo điều gì đó ở đây, rằng nỗi sợ hãi mà bạn có là không có thật', chúng tôi có thể có thể thoát khỏi nỗi sợ hãi đó, ”anh tiếp tục. “Sau đó, nhân viên pháp lý sẽ xem xét lại vấn đề và bắt đầu nói, 'Ồ, tôi thấy một số khía cạnh của dữ liệu có thể được chia sẻ mà không có rủi ro cho mọi người. Vì vậy, chúng ta có thể thay đổi luật pháp. ”“ Luật pháp vẫn chưa được thay đổi trong lĩnh vực chăm sóc sức khỏe. Nhưng các ngân hàng, công ty bảo hiểm và các công ty khác trong ngành dịch vụ tài chính đang tiến tới với mã hóa đồng hình để chống lại gian lận và đáp ứng các yêu cầu chống rửa tiền (AML), Kaufman nói. “Các cơ quan quản lý trong nhiều năm đã nói với các công ty, bạn phải thực hiện AML và gian lận theo cách hợp tác, nhưng này, chỉ một giây thôi, bạn không được phép chia sẻ dữ liệu này vì quyền riêng tư, ”Kaufman nói. “Họ đã đưa ra loại câu chuyện khó hiểu. Và họ đã áp dụng công nghệ này [homomorphic encryption] và hiện họ đang quảng bá những thứ này để cho phép chia sẻ dưới những ràng buộc này. ” Duality hiện đang làm việc với Oracle để triển khai mã hóa đồng hình trong phần mềm của mình nhằm chống lại tội phạm tài chính. Theo Kaufman, Oracle đang triển khai các biện pháp kiểm soát xung quanh những gì phân tích cộng tác được phép và những gì không thể chia sẻ. “Chúng tôi hiện có quan hệ đối tác với các công ty như Oracle và IBM, đây là những công ty nghiêm túc và vì vậy điều này chắc chắn giúp tạo dựng uy tín,” Kaufman nói. “Góc độ khác là đảm bảo các cơ quan quản lý ủng hộ việc này. Trong lĩnh vực tài chính, điều này đang xảy ra. Ở các lĩnh vực khác thì chưa. ” Định giá dữ liệu Trong khi công nghệ cơ bản cốt lõi của mã hóa đồng hình đã sẵn sàng, chúng tôi vẫn chưa xây dựng các hệ thống và cơ sở hạ tầng xung quanh nó để thực sự cho phép chia sẻ dữ liệu theo cách mà Jordan hình dung. Ông nói, có thể sẽ mất nhiều thập kỷ để xây dựng lòng tin và cấu trúc kinh tế có thể mở rộng hoàn toàn điều này ra thế giới. Ông nói: “Tôi nghĩ làn sóng đầu tiên thực sự giống một mô hình kinh tế hơn, một sự công nhận rằng chúng ta có mạng lưới những người ra quyết định và họ có những điều để chia sẻ. “Họ đang cạnh tranh, và họ phải có một số loại luật chơi. Họ phải biết quý trọng mọi thứ ”. Ví dụ, dữ liệu của bạn có giá trị bao nhiêu? Ông nói: Chỉ khi chúng tôi có cách để đặt giá trị vào dữ liệu thì chúng tôi mới sẵn sàng tham gia vào các hoạt động hợp tác nâng cao hơn. Quyền riêng tư là một rào cản đối với việc chia sẻ dữ liệu rộng rãi hơn (ZinetroN / Shutterstock) “Dữ liệu là một thứ khó định giá,” Jordan nói. “Bạn phải thăm dò nó một chút. Nếu bạn có cùng ngày với tôi, bằng cách nào đó để chúng ta đến với nhau, nó không có giá trị. Nếu chúng ta có dữ liệu bổ sung, nó có giá trị hơn nhiều. Vì vậy, bạn có thể đánh giá tính bổ sung? Bạn có thể đánh giá mức độ phù hợp? Bạn có thể đánh giá những điều đó không? Và bạn có thể đánh giá nó trước khi bạn cho đi toàn bộ dữ liệu không? ” “Vì vậy, bạn cần các công cụ, và mã hóa đồng hình chắc chắn là một. Đó là một trong những thứ mà Duality dẫn đầu trên toàn thế giới trong việc khai thác, ”anh tiếp tục. “Đã khai thác nó ở một thời điểm nào đó, nó sẽ có thể xây dựng trên nó. Nó sẽ là nền tảng vững chắc để làm những việc khác. ” Theo quan điểm của Jordan, đây sẽ là một quá trình gia tăng để xây dựng lòng tin của mọi người vào mã hóa đồng cấu hình và các giải pháp chia sẻ dữ liệu được xây dựng dựa trên nó. Mọi người sẽ có xu hướng chia sẻ một chút dữ liệu để đổi lại một số lợi ích. Nếu nó hoạt động như quảng cáo, họ sẽ làm nhiều hơn một chút, v.v. “Rất nhiều trong số chúng sẽ liên quan đến sự đánh đổi. Tôi sẵn sàng từ bỏ một chút riêng tư nếu tôi nhận được một số giá trị thực sự, ”anh nói. “Tôi muốn có thể đặt ra sự cân bằng có lợi cho mình trong bối cảnh một vấn đề cụ thể mà tôi đang cố gắng giải quyết. Chà, việc đặt ra sự cân bằng đưa chúng ta vào thế giới kinh tế học… Và vì vậy, các kỹ thuật dựa trên mã hóa bắt đầu cung cấp cho bạn một nền tảng vững chắc để có thể nói những thứ như bao nhiêu? Làm thế nào có liên quan? Làm thế nào hữu ích? Các thông số của sự cộng tác là gì? ” Đánh đổi kinh tế Thế giới cho đến nay vẫn là màu đen và khi nói đến việc chia sẻ dữ liệu, Kaufman nói: “Bạn chia sẻ dữ liệu của mình và không có quyền riêng tư, hoặc bạn không làm bất cứ điều gì và bạn không nhận được giá trị gì,” ông nói. “Điều này [homemorphic encryption] mở ra một phổ hoàn toàn mới, OK, nó không phải là một thế giới đen trắng, có những thứ mà bạn có thể chia sẻ. Có nhiều loại đảm bảo khác nhau mà bạn có thể nhận được. Và tôi sẽ nói nhiều hơn nữa là cuộc thảo luận phong phú và có giá trị hơn đang diễn ra ”. Không xa chúng ta sẽ có các công cụ và công nghệ cho phép các nhà khoa học và nhà nghiên cứu dữ liệu hợp tác sử dụng các tập dữ liệu được chia sẻ lớn. Jordan đang giúp đưa một số công nghệ này vào thế giới thực thông qua UC Ber started's RISELab, viết tắt của Real-time Intelligent Secure Execution. Giáo sư khoa học máy tính tại UC Berkeley, Michael Jordan, là cố vấn của Duality Technologies “Bạn sẽ thấy một cuộc cách mạng nhỏ khi loại công cụ này thực sự có trong Spark và Ray và tất cả những loại ngăn xếp khác. Jordan nói. “Chương trình nghị sự từ ngày đầu tiên sẽ làm cho nó dễ sử dụng như bất kỳ thứ gì khác. Thay vì gọi sự khác biệt giữa A và B, bạn sẽ gọi bạn là HME [homomorphic encryption] sự khác biệt giữa A và B. Và bây giờ khi bạn đã thực hiện mã đó, bạn có một sự đảm bảo về điều gì đó và điều đó có thể được coi là bất biến trong mã của bạn và có thể được thực hiện một cách tử tế, thực sự đơn giản và dễ dàng. ” Jordan nói, bạn vẫn sẽ cần một số trình độ chuyên môn để áp dụng phương pháp mã hóa homemorphic, nhưng nó sẽ đi theo con đường chung trong máy tính, nơi mà những thứ phức tạp trở nên đơn giản hơn theo thời gian. Ông nói: “Sẽ có một lớp chuyên môn cần thiết để thực sự triển khai những điều này một cách nghiêm túc. “Và sẽ không một người nào hiểu được toàn bộ sự việc. Sẽ có nhiều lớp niềm tin được xây dựng. ” Điều cuối cùng – về sự tin tưởng – là rất quan trọng nếu thế giới nói chung sẽ cảm thấy thoải mái khi mở và chia sẻ dữ liệu của họ. “Một trăm năm trước, lần đầu tiên mọi người mang điện đến nhà của họ. Họ mang đèn hoặc lò sưởi hoặc bất cứ thứ gì vào, và họ sẽ nói 'Bạn phải làm gì để thuyết phục tôi rằng điều này sẽ không thiêu rụi ngôi nhà của tôi?' “Tin tôi đi, tôi là một nhà công nghệ giỏi.” “Không. Chẳng hạn, bạn phải phát triển thứ này được gọi là Phòng thí nghiệm Nhà bảo hiểm, ở trên mọi ngọn đèn. Người ta viết rằng ai đó khác, một bên thứ ba, đã thử nghiệm công nghệ này và có thể đảm bảo không chỉ công nghệ nói chung hoạt động tốt mà tôi đã xem xét chiếc đèn cụ thể này. ” Jordan hình dung cùng một loại điều xảy ra với dữ liệu. Sẽ có các bên thứ ba đáng tin cậy hứa với chúng tôi rằng quyền riêng tư của chúng tôi sẽ được duy trì đồng thời cho phép chúng tôi hưởng lợi từ việc chia sẻ dữ liệu của mình. Về lâu dài, khi mọi người cảm thấy thoải mái khi chia sẻ dữ liệu của họ thông qua bên thứ ba, một hệ thống sẽ xuất hiện mang lại cho chúng tôi những lợi ích của việc chia sẻ dữ liệu trong khi giảm thiểu rủi ro – hoặc ít nhất, cho phép chúng tôi thực hiện phân tích rủi ro-lợi ích và đưa ra quyết định sáng suốt về việc chia sẻ dữ liệu. Phần cuối cùng là một phần quan trọng để đạt được loại hình nền kinh tế dữ liệu mà Jordan thấy. “Bạn đặt giá thầu, bạn được chấp nhận [và bạn thực hiện công việc. Đó là cách hoạt động của kinh tế học. Và bằng cách nào đó, học máy đã phát triển trong thế giới mà không cần kinh tế, không có giá thầu, vòng lặp xử lý và phản hồi cũng như thu thập dữ liệu, nơi có các bên quan tâm và tất cả những điều đó, ”Jordan nói. “Những năm tiếp theo 20, nó phải nắm lấy tất cả những điều này.” Các mục liên quan: Luật về quyền riêng tư dữ liệu của tiểu bang Gia tăng khi có lời kêu gọi đối với các nguyên tắc liên bang Phát triển sự tức giận vì sự lạm dụng dữ liệu lớn của Big Tech Có, bạn có thể làm AI mà không cần hy sinh quyền riêng tư

Back to top button