Data science

Khai phá tiềm năng thực sự của ML: Cách học ngôn ngữ tự giám sát có thể đánh bại hiệu suất của con người

Mục tiêu cốt lõi của nhiều tổ chức sử dụng hệ thống trí tuệ nhân tạo (AI) là để chúng phản chiếu ngôn ngữ và trí thông minh của con người. Tuy nhiên, bắt chước ngôn ngữ của con người và làm chủ những phức tạp độc đáo của nó tiếp tục là một trong những thách thức lớn nhất của AI. Theo Chỉ số chấp nhận AI toàn cầu của IBM, gần 1/3 chuyên gia CNTT cho biết doanh nghiệp của họ hiện đang sử dụng AI, với 43% báo cáo rằng công ty của họ đã tăng tốc triển khai AI do đại dịch. Khi nhiều doanh nghiệp triển khai các hệ thống AI, những hạn chế của công nghệ cũng đang được nhận ra – bao gồm lượng dữ liệu cần thiết để đào tạo các thuật toán học máy (ML) và tính linh hoạt của các thuật toán này trong việc hiểu ngôn ngữ của con người. Ngày nay, nhiều ứng dụng AI trong dịch vụ khách hàng sử dụng các thuật toán ML đã được chứng minh là cần thiết khi hành vi của người tiêu dùng tiếp tục thay đổi. Các thuật toán ML có khả năng xử lý thông tin và tự động hóa các cuộc trò chuyện, giúp doanh nghiệp tăng khả năng trò chuyện với khách hàng mọi lúc và mọi nơi. Khi các doanh nghiệp bắt đầu thay đổi từ liên lạc tần suất cao, một chiều và hướng tới các cuộc trò chuyện hai chiều, các thuật toán này sẽ đóng một vai trò quan trọng trong hành trình của khách hàng. Tuy nhiên, hiểu sâu hơn về ngôn ngữ của con người sẽ là điều cần thiết khi các tổ chức tìm cách cải thiện tương tác của họ với khách hàng. Tôi tin rằng nếu các hệ thống AI có thể hiểu sâu hơn ngoài các phương tiện phân tích dữ liệu truyền thống, chúng sẽ vượt quá hiệu suất của con người trong các tác vụ ngôn ngữ. Điều này sẽ đưa AI tiến gần hơn một bước tới trí thông minh cấp độ con người và thay đổi cách chúng ta tương tác với các thương hiệu, doanh nghiệp và tổ chức trên quy mô toàn cầu. Nhờ học tập tự giám sát, các kỹ thuật ML hiện có sức mạnh để thay đổi điều này. Học máy tự giám sát làm giảm nhu cầu về dữ liệu có nhãn, chất lượng cao (Swill Klitch / Shutterstock) Học tự giám sát là gì? Khi còn bé, chúng ta học về thế giới chủ yếu thông qua quan sát và thử và sai. Điều này mở đường cho chúng ta phát triển nhận thức thông thường và khả năng học các nhiệm vụ phức tạp như lái xe ô tô. Nhưng làm thế nào mà con người có thể học được khi chỉ quan sát một vài ví dụ về một nhiệm vụ nhất định, còn các thuật toán học máy thì không thể? Đây là nơi mà việc học tự giám sát có thể giúp ích cho bạn. Kỹ thuật này thường liên quan đến việc lấy một tập dữ liệu đầu vào và che giấu một phần của nó. Sau đó, thuật toán học tập tự giám sát phải phân tích dữ liệu hiển thị, cho phép nó dự đoán dữ liệu ẩn còn lại. Kết quả là, quá trình này tạo ra các nhãn cho phép hệ thống học. Điều này mở ra một cơ hội lớn để sử dụng tốt hơn dữ liệu không được gắn nhãn và giúp các tổ chức hợp lý hóa các quy trình dữ liệu. Với phương pháp học tự giám sát, không cần phải có một người xem qua một cách thủ công lượng dữ liệu cực lớn và gắn nhãn nó. Học tập tự giám sát tạo ra một hệ thống AI hiệu quả về dữ liệu có thể phân tích và xử lý dữ liệu mà không cần sự can thiệp của con người, loại bỏ nhu cầu “giám sát” đầy đủ. Bộ não của chúng ta, và chắc chắn là bộ não của trẻ nhỏ, không ngừng cố gắng hiểu thế giới bằng cách dự đoán điều gì sẽ xảy ra tiếp theo. Nếu dự đoán không phù hợp với thực tế, chúng tôi rất ngạc nhiên và chúng tôi học hỏi. Theo cách tương tự, các thuật toán ML học cách lấp đầy những khoảng trống bằng cách sử dụng phương pháp học bán giám sát. Các thuật toán ML được đào tạo bằng cách sử dụng phương pháp học tự giám sát dường như bắt kịp các dấu hiệu thông thường của con người và có thể đánh bại hiệu suất của con người trong các nhiệm vụ ngôn ngữ. Bước đột phá trong học tập tự giám sát: Điều này sẽ cách mạng hóa việc học sâu như thế nào? Học tập tự giám sát tạo ra một hệ thống AI hiệu quả về dữ liệu có thể phân tích và xử lý dữ liệu mà không cần sự can thiệp của con người (charles taylor / Shutterstock) Phương pháp học tập tự giám sát đã cho phép những tiến bộ lớn trong xử lý ngôn ngữ tự nhiên (NLP), mang lại cho máy tính khả năng hiểu, viết và nói ngôn ngữ giống như con người. Bước đột phá thực sự trong NLP đến khi Google giới thiệu mô hình BERT trong 2018. Các kỹ sư đã tái chế một kiến ​​trúc thường được sử dụng để dịch máy và làm cho nó học nghĩa của một từ liên quan đến ngữ cảnh của nó trong một câu. NLP tiếp tục phá kỷ lục này đến kỷ lục khác về khả năng hiểu ngôn ngữ của con người: trong hai năm qua, NLP đã có nhiều đột phá hơn trong bốn thập kỷ qua. Các thuật toán AI này hiện đánh bại hiệu suất của con người trong việc hiểu chủ đề của một văn bản và tìm ra câu trả lời cho một câu hỏi ngẫu nhiên, làm như vậy nhiều hơn 100 ngôn ngữ cùng một lúc. Ngày nay, nhiều chatbot sử dụng công nghệ NLP để đáp ứng tốt hơn nhu cầu của khách hàng. Do sự gia tăng của tin nhắn di động, nhiều công ty đang chuyển sang chatbot và trợ lý ảo để trả lời các câu hỏi của khách hàng trong thời gian thực và tăng mức độ tương tác. Các thuật toán học sâu, một tập hợp con của ML, đã phát triển để nhận dạng các khuôn mặt với độ chính xác giống như con người, nếu không muốn nói là tốt hơn. Tuy nhiên, phải đến khi 2015 xây dựng một thuật toán có thể nhận dạng khuôn mặt với độ chính xác tương đương với con người. Ví dụ: DeepFace của Facebook là 97. 4% chính xác, chỉ là 97. 5% hiệu suất con người. Và thuật toán nhận dạng khuôn mặt của FBI chỉ đạt độ chính xác 85%, có nghĩa là nó vẫn sai trong hơn một trong số bảy trường hợp . Mặc dù học sâu là một khía cạnh quan trọng của các hệ thống AI và đã đạt được những bước tiến đáng kể trong những năm gần đây, nhưng nó đòi hỏi một lượng lớn dữ liệu để có được kết quả đầu ra hữu ích. Học tập tự giám sát sẽ đóng một vai trò quan trọng khi chúng tôi tìm cách giảm hơn nữa sự phụ thuộc vào dữ liệu của AI và vượt ra khỏi các giới hạn của học sâu. Quan trọng hơn, nó sẽ cung cấp cho các hệ thống AI khả năng hoạt động giống con người hơn và hiểu ngôn ngữ mà không cần can thiệp. Đạt được cột mốc này sẽ mở ra khả năng vô hạn trong thế giới ML – vấn đề chỉ là thời gian. Đôi nét về tác giả: Pieter Buteneers là một kỹ sư điện tử công nghiệp và công nghệ thông tin. Anh ấy bắt đầu sự nghiệp của mình trong lĩnh vực học thuật, đầu tiên là một nghiên cứu sinh và sau đó là một postdoc, nơi anh ấy đã nghiên cứu về Học máy, Học sâu, Giao diện máy tính não và Bệnh động kinh. Anh đã giành giải nhất trong cuộc thi Học sâu lớn nhất của 2015 cùng với một nhóm các nhà máy học từ Đại học Ghent: National Data Science Bowl được lưu trữ trên kaggle.com. Cùng năm đó, ông đã có một buổi nói chuyện TEDx về Giao diện Máy tính Brain. Trong 2019, anh ấy trở thành CTO của Chatlayer.ai, một nền tảng để xây dựng các chatbot đa ngôn ngữ 'những người' giao tiếp ở cấp độ con người. Trong 2020 Chatlayer.ai đã được Sinch mua lại và bây giờ Pieter lãnh đạo tất cả các nỗ lực Học máy tại Sinch với tư cách là Giám đốc Kỹ thuật trong ML & AI. Các mục liên quan: Các chuyên gia không đồng ý về công dụng của các mô hình ngôn ngữ lớn Một mô hình để cai trị tất cả: Mạng biến áp Sử dụng trong AI 2.0, Forrester nói ba mẹo để khuếch đại dữ liệu nhỏ cho học sâu

  • Trang chủ
  • CRM
  • Email doanh nghiệp
  • Email marketing
  • Marketing News
  • Marketing tổng thể
  • SEO
  • Thiết kế Website
  • Web Hosting
  • Chatbot
  • Data science
  • Back to top button