Data science

Tại sao các nhà khoa học dữ liệu phải có khả năng giải thích các thuật toán của họ

Các mô hình bạn tạo có các ứng dụng trong thế giới thực ảnh hưởng đến cách đồng nghiệp của bạn thực hiện công việc của họ. Điều đó có nghĩa là họ cần hiểu những gì bạn đã tạo, cách hoạt động và những hạn chế của nó. Họ không thể làm bất kỳ điều gì trong số những điều này nếu tất cả chỉ là một bí ẩn lớn mà họ không hiểu. “Tôi e rằng tôi không thể để bạn làm điều đó, Dave… Nhiệm vụ này quá quan trọng đối với tôi để để bạn gây nguy hiểm cho nó” Kể từ khi ngoạn mục 2001: A Space Odyssey đã trở thành bộ phim được xem nhiều nhất của 1968, con người vừa bị cuốn hút vừa sợ hãi bởi ý tưởng đưa AI hoặc máy học thuật toán kiểm soát miễn phí. Trong tác phẩm kinh điển của Kubrick, một siêu máy tính có tri giác, không thể sai lầm về mặt logic được gọi là HAL được giao nhiệm vụ hướng dẫn một sứ mệnh tới Sao Mộc. Khi cho rằng những người trên tàu có thể gây bất lợi cho nhiệm vụ, HAL bắt đầu giết họ. Đây là một ví dụ cực đoan, nhưng sự thận trọng còn lâu mới đặt sai chỗ. Khi chúng ta khám phá trong bài viết này, nhiều lần, chúng ta sẽ thấy các tình huống mà các thuật toán “chỉ thực hiện công việc của chúng” bỏ qua các nhu cầu hoặc các dấu hiệu đỏ mà chúng không được lập trình để nhận ra. Đây là một tin xấu cho những người và các công ty bị ảnh hưởng bởi AI và ML đã đi sai. Nhưng đó cũng là tin xấu đối với các tổ chức tránh xa tiềm năng biến đổi của các thuật toán học máy vì sợ hãi và không tin tưởng. Nắm bắt được vấn đề là điều quan trọng đối với bất kỳ CEO hoặc trưởng bộ phận nào muốn thành công trên thương trường. Là một nhà khoa học dữ liệu, nhiệm vụ của bạn là khai sáng chúng. Thuật toán không chỉ dành cho các nhà khoa học dữ liệu Để bắt đầu, điều quan trọng là luôn phải nhớ rằng bạn thực sự đang sử dụng các mô hình được hỗ trợ bởi AI và ML để làm gì. Có lẽ, nó để giúp trích xuất thông tin chi tiết và thiết lập các mẫu để trả lời các câu hỏi quan trọng về sức khỏe của tổ chức của bạn. Để tạo ra những cách tốt hơn để dự đoán mọi thứ đang đi đến đâu và làm cho hoạt động, quy trình và phân bổ ngân sách của doanh nghiệp bạn hiệu quả hơn, bất kể ngành nào. Nói cách khác, bạn không tạo ra các thuật toán thông minh bởi vì đó là một thử thách khoa học thú vị. Bạn đang tạo ra mọi thứ bằng các ứng dụng trong thế giới thực có ảnh hưởng đến cách đồng nghiệp của bạn thực hiện công việc của họ. Điều đó có nghĩa là họ cần hiểu những gì bạn đã tạo, cách hoạt động và những hạn chế của nó. Họ cần có thể hỏi bạn những câu hỏi sắc thái và nêu lên những lo ngại. Họ không thể làm bất cứ điều gì trong số những điều này nếu toàn bộ là một bí ẩn lớn mà họ không hiểu. Khi các thuật toán máy học mắc lỗi. Vào những thời điểm khác, các thuật toán có thể chứa các thành kiến ​​cố hữu làm sai lệch các dự đoán và dẫn đến các quyết định không công bằng và vô ích. Chỉ cần lấy trường hợp của vụ bê bối kết án phân biệt chủng tộc này ở Mỹ, nơi những tội phạm nhỏ được đánh giá có nhiều khả năng tái phạm hơn dựa trên màu da của họ, thay vì mức độ nghiêm trọng hoặc tần suất của tội phạm. Trong bối cảnh công ty, sự suy giảm thành kiến ​​tiêu cực trong các mô hình AI và ML của bạn có thể ít kịch tính hơn, nhưng chúng vẫn có thể gây hại cho doanh nghiệp của bạn hoặc thậm chí cả khách hàng của bạn. Ví dụ: các nỗ lực tiếp thị của bạn có thể loại trừ một số nhân khẩu học nhất định, gây bất lợi cho bạn và của họ. Hoặc bạn từ chối các kế hoạch tín dụng cho những khách hàng xứng đáng với họ, đơn giản vì họ có chung những đặc điểm không liên quan với những người không xứng đáng. Để ngăn chặn những điều này xảy ra, các đồng nghiệp không chuyên về kỹ thuật của bạn cần hiểu cách thuật toán được xây dựng – nói một cách đơn giản – đủ để thách thức cơ sở lý luận của bạn. Nếu không, chúng có thể dẫn đến kết quả sai lệch. Áp dụng các ràng buộc cho các mô hình AI và ML Một cách quan trọng ở phía trước là các nhà khoa học dữ liệu cộng tác với các nhóm kinh doanh khi quyết định áp dụng những ràng buộc nào cho các thuật toán. Lấy 2001: Một ví dụ về Space Odyssey. Vấn đề ở đây không phải là con tàu đã sử dụng một chương trình AI học sâu, mạnh mẽ để giải quyết các vấn đề hậu cần, dự đoán kết quả và chống lại những sai sót của con người để đưa con tàu đến Sao Mộc. Vấn đề là thuật toán học máy được tạo ra với nhiệm vụ duy nhất này không có bất kỳ ràng buộc nào. Nó được thiết kế để đạt được sứ mệnh một cách hiệu quả nhất bằng cách sử dụng bất kỳ phương tiện nào cần thiết – việc bảo tồn mạng sống con người không được coi là ưu tiên hàng đầu. Bây giờ hãy tưởng tượng cách một cách tiếp cận tương tự có thể áp dụng trong bối cảnh kinh doanh đơn giản hơn. Giả sử bạn xây dựng một thuật toán trong nền tảng khoa học dữ liệu để giúp bạn tìm nguồn cung cấp hiệu quả nhất về chi phí cho một vật liệu cụ thể được sử dụng trong một trong những sản phẩm yêu thích nhất của bạn. Hệ thống kết quả tìm kiếm trên web và đặt hàng tùy chọn có sẵn rẻ nhất đáp ứng mô tả. Trên thực tế, giá rẻ một cách đáng ngờ, mà bạn sẽ phát hiện ra nếu bạn hỏi ai đó từ nhóm thu mua hoặc R&D. Nhưng nếu không có những cuộc trò chuyện này, bạn không biết phải nhập các ràng buộc về giới hạn dưới hoặc nguồn của sản phẩm. Vật liệu hóa ra là hàng giả – và toàn bộ quá trình sản xuất bị hủy hoại. Làm thế nào các nhà khoa học dữ liệu có thể giao tiếp tốt hơn trên các thuật toán Hầu hết những người không phải là nhà khoa học dữ liệu thấy việc nói về cơ chế của AI và ML rất khó khăn. Rốt cuộc, đó là một kỷ luật phức tạp – đó là lý do tại sao bạn có nhu cầu cao như vậy. Nhưng chỉ vì một cái gì đó phức tạp ở cấp độ chi tiết, không có nghĩa là bạn không thể nói về nó một cách đơn giản. Điều quan trọng là thu hút tất cả những người sẽ sử dụng mô hình càng sớm càng tốt trong quá trình phát triển của nó. Nói chuyện với đồng nghiệp của bạn về cách họ sẽ sử dụng mô hình và những gì họ cần từ nó. Thảo luận về các ưu tiên và mối quan tâm khác ảnh hưởng đến việc xây dựng thuật toán và các ràng buộc mà bạn thực hiện. Giải thích chính xác cách các kết quả có thể được sử dụng để thông báo cho việc ra quyết định của họ nhưng cũng là nơi họ có thể muốn can thiệp vào sự phán xét của con người. Hãy làm rõ rằng cánh cửa của bạn luôn mở và dự án sẽ phát triển theo thời gian – bạn có thể tiếp tục điều chỉnh nếu nó chưa hoàn hảo. Hãy nhớ rằng mọi người sẽ tự tin hơn nhiều về việc sử dụng kết quả thuật toán của bạn nếu họ có thể tự điều chỉnh kết quả và điều chỉnh các thông số. Cố gắng tìm ra những giải pháp mang lại cho những người cá nhân quyền tự chủ đó. Bằng cách đó, nếu bản năng của họ cho họ biết có điều gì đó không ổn, họ có thể khám phá thêm điều này thay vì bỏ qua thuật toán hoặc bỏ qua các mối quan tâm có thể có giá trị. Lời kết: Định hình tương lai của AI Như Giáo sư Hannah Fry, tác giả cuốn sách Hello World: How to be human in the age of machine, đã giải thích trong một cuộc phỏng vấn với Economist: “Nếu bạn thiết kế một thuật toán để cho bạn biết câu trả lời nhưng mong đợi con người kiểm tra kỹ nó, đặt câu hỏi và biết khi nào cần ghi đè nó, về cơ bản bạn đang tạo ra một công thức cho thảm họa. Nó không phải là thứ mà chúng ta sẽ rất giỏi. Nhưng nếu bạn thiết kế các thuật toán của mình để mặc định sự không chắc chắn của họ một cách tự hào ở phía trước và trung tâm — cởi mở và trung thực với người dùng về cách họ đi đến quyết định của họ và tất cả sự lộn xộn và mơ hồ mà nó phải vượt qua để đạt được điều đó — thì sẽ dễ dàng hơn nhiều để biết khi nào chúng ta nên tin vào bản năng của chính mình. ” Nói cách khác, nếu các nhà khoa học dữ liệu khuyến khích các đồng nghiệp hoàn toàn tin tưởng vào trí tuệ không thể sai lầm, giống như HAL trong các thuật toán của họ, điều này không chỉ dẫn đến các vấn đề mà còn làm suy giảm lòng tin vào AI và ML trong tương lai. Thay vào đó, bạn cần có những cuộc trò chuyện rõ ràng, thẳng thắn, trung thực với đồng nghiệp về tiềm năng và hạn chế của công nghệ cũng như trách nhiệm của những người sử dụng nó – và bạn cần làm điều đó bằng ngôn ngữ mà họ hiểu.

  • Trang chủ
  • CRM
  • Email doanh nghiệp
  • Email marketing
  • Marketing News
  • Marketing tổng thể
  • SEO
  • Thiết kế Website
  • Web Hosting
  • Chatbot
  • Data science
  • Back to top button