Data science

Làn sóng tiếp theo của phân tích nhận thức: Học máy nhận thức về đồ thị

Nói chung, ngành công nghiệp đang bắt đầu nhận ra mối liên hệ mật thiết giữa Trí tuệ nhân tạo và nền tảng kiến ​​thức ít được báo trước nhưng không kém phần khả thi của nó. Sự nổi bật ngày càng tăng của các biểu đồ tri thức trong hầu hết mọi dạng phân tích — từ các giải pháp Business Intelligence thông thường đến các công cụ khoa học dữ liệu — cho thấy thực tế này, cũng như mối quan tâm ngày càng tăng đối với Neuro-Symbolic AI. Trong hầu hết các trường hợp sử dụng này, đồ thị là khuôn khổ để lập luận một cách thông minh về các khái niệm kinh doanh với khả năng hiểu sâu hơn so với việc học máy đơn thuần. Tuy nhiên, điều mà nhiều tổ chức vẫn chưa nhận ra là có một chuyển động quan trọng không kém đang thu hút sự chú ý xung quanh cơ sở kiến ​​thức của AI giúp cải thiện đáng kể năng lực học tập thống kê của nó, làm cho thứ sau hiệu quả hơn nhiều. Trong các ứng dụng này, đồ thị không chỉ đơn giản là cung cấp một dạng AI thay thế cho học máy mà tự nhiên bổ sung cho nó. Chúng cung cấp cài đặt — khả năng trực quan, kích thước và cấu trúc liên kết — để mở rộng giá trị của các vectơ ở cốt lõi của AI thống kê với một loạt các kỹ thuật bao gồm nhúng, học đa tạp và phân cụm. Việc sử dụng cơ sở kiến ​​thức của AI để cải thiện cơ sở thống kê của nó thông qua khả năng của biểu đồ để tăng khả năng của máy học là minh chứng rõ ràng hơn cho sự thật không thể tranh cãi rằng, đối với AI, “nếu bạn không sử dụng nhiều phương pháp tiếp cận, bạn đang tự giới hạn mình trong tính tổng quát của “Giám đốc điều hành Kyndi Ryan Welsh nhận xét. Nhúng Các biểu đồ kiến ​​thức lợi thế chính cung cấp cho học máy là một môi trường hiểu biết về mối quan hệ để mô tả tất cả sự phức tạp của các kết nối giữa các nút riêng lẻ của dữ liệu. Một kỹ thuật được gọi là nhúng đặc biệt hữu ích trong vấn đề này. Theo Giám đốc điều hành Katana Graph, Keshav Pingali, “Nhúng là một cách để tìm mối quan hệ giữa các thực thể mà không phải lúc nào cũng rõ ràng nếu bạn nhìn vào khả năng kết nối của biểu đồ”. Trong một số trường hợp sử dụng, việc nhúng đơn giản hóa — nếu không muốn nói là không phù hợp — nhu cầu về kỹ thuật tính năng tốn thời gian hơn. Trong hầu hết các triển khai, chúng xác định các mối quan hệ phi tuyến tính giữa các thực thể để thông báo kết quả truy vấn và tìm kiếm các thuộc tính được sử dụng để xây dựng mô hình học máy. “Vẻ đẹp của việc nhúng là nếu bạn làm đúng, những nút dường như không liên quan nằm ở xa trong một biểu đồ cuối cùng lại gần nhau trong một không gian ba chiều,” Pingali nhận xét. Những kết quả như vậy rất quan trọng để xây dựng các mô hình học máy với các trọng số và biện pháp thích hợp để tối đa hóa việc sử dụng dữ liệu đào tạo cho các mô hình chính xác nhất có thể. Bản đồ Nhúng cũng là một phương tiện để tăng tốc khả năng tìm kiếm có nhận thức để trả lại các kết quả có sắc thái cho người dùng trong một phần nhỏ thời gian cần thiết để làm như vậy. Pingali đã đề cập rằng có nhiều cách để thực hiện nhúng, một số cách trong số đó liên quan đến Mạng thần kinh phù hợp và các kỹ thuật từ web tới web. “Những gì bạn làm trong mô hình không gian vectơ là bạn lấy mọi nút và ánh xạ nó vào một điểm nào đó trong không gian chiều lớn,” Pingali tiết lộ. “Và sau đó cách ánh xạ xảy ra là có các nút liên quan, các nút giống nhau về đặc tính của chúng, có thể không liên quan với nhau trong biểu đồ.” Nhúng định vị các nút đó lại với nhau để cấu trúc liên kết hiển thị các điểm tương đồng của chúng theo các vấn đề kinh doanh. Trong không gian dược phẩm, cách tiếp cận này rất hữu ích cho việc “tạo giả thuyết,” Pingali giải thích. “Rất tốn kém khi thử các loại thuốc trong phòng thí nghiệm để xem liệu chúng có hoạt động hay không, vì vậy nếu bạn có thể thu hẹp các ứng cử viên bằng cách sử dụng đồ thị và AI, thì điều đó sẽ tiết kiệm một số tiền khủng khiếp. ” Học Manifold Trong các trường hợp sử dụng khác, các công ty có thể tận dụng quá trình nhúng để tìm kiếm các thành phần hoặc hợp chất dược phẩm có liên quan nhất để điều trị một vấn đề chăm sóc sức khỏe như bệnh tiểu đường 2 chẳng hạn. Sự phân biệt mối quan hệ của việc nhúng từ cũng được sử dụng rộng rãi cho các khía cạnh của công nghệ ngôn ngữ tự nhiên bao gồm AI đàm thoại, tạo ngôn ngữ tự nhiên và hơn thế nữa, như một phần của “máy học thống kê cho phép chúng ta tìm hiểu sự liên quan giữa các từ”, Welsh tiết lộ. Ví dụ, các ứng dụng của nhúng từ — cung cấp một số tiện ích tìm kiếm nhận thức — có thể xác định mối liên hệ giữa các thuật ngữ 'khu chung cư' và 'tòa nhà'. Máy học có thể “liên hệ hai từ đó trong một không gian chiều thấp hơn được gọi là đa tạp, về cơ bản, bạn đang nhúng các mối quan hệ này vào không gian chiều thấp hơn này,” Welsh lưu ý. Học Manifold cung cấp khả năng giảm kích thước phi tuyến tính. Nó đặc biệt hiệu quả trên các bộ dữ liệu có kích thước cao và cung cấp một lượng giá trị hợp lý cho cả dữ liệu không được gắn nhãn và được gắn nhãn. Học Manifold thường được sử dụng cùng với các môi trường nhúng và đồ thị. Hỗn hợp này chịu trách nhiệm trực tiếp cho một số thành tựu tương đối gần đây trong công nghệ ngôn ngữ tự nhiên. Phân cụm Phân cụm là một hình thức học tập không giám sát vượt trội trong cài đặt đồ thị vì chúng mô tả sự phức tạp của các mối quan hệ giữa các nút, kiểu dữ liệu và phân loại theo những cách mà các hệ thống khác – đặc biệt là các hệ thống quan hệ – khó có thể so khớp được. Các kỹ thuật phân cụm là vô giá đối với việc triển khai học máy bởi vì chúng không cần bổ sung dữ liệu đào tạo được gắn nhãn mà đôi khi ngăn không cho các ứng dụng học tập có giám sát cấp doanh nghiệp được triển khai. Theo Pingali, milieus đồ thị thường được tìm kiếm để phân cụm khi có dữ liệu phân cấp liên quan (chẳng hạn như phân loại chẳng hạn). Pingali nói: “Các biểu đồ sẽ xuất hiện ngay tại đó, bởi vì bất cứ lúc nào bạn cũng có hệ thống phân cấp và cụm, v.v., bạn cần biểu diễn bằng biểu đồ. Biểu diễn dữ liệu biểu đồ tri thức, phân cụm Louvain và nhúng chịu trách nhiệm xử lý nhanh chóng dữ liệu cần thiết cho không gian fintech và những thứ khác. Pingali đã mô tả một trường hợp sử dụng fintech trong đó “chúng tôi có thể thực hiện phân cụm Louvain cho các tập dữ liệu có nhiều tỷ đỉnh và 30 tỷ cạnh. Nó sử dụng tất cả các công nghệ đồ thị mà chúng tôi sử dụng để nhúng đồ thị tri thức. Chúng tôi đang thực hiện tất cả các tính toán biểu đồ này theo một cách theo tỷ lệ. ” Một hồi cứu Tác động tổng thể của biểu đồ tri thức đối với việc nâng cao giá trị doanh nghiệp của việc triển khai học máy được minh họa một cách sâu sắc nhất trong quá trình hồi cứu về các trường hợp sử dụng ở trên. Theo chiều dọc fintech, máy tính nhận thức nhận biết đồ thị chịu trách nhiệm xử lý dữ liệu nhanh chóng với tốc độ cực cao cần thiết cho sự thành công của ngành công nghiệp này. Do đó, bằng cách mở rộng, cách tiếp cận này có thể làm điều tương tự đối với martech, insurtech và các ngành dịch vụ dựa trên dữ liệu mới nổi khác. Khả năng ứng dụng theo chiều ngang của việc học đa dạng và nhúng từ, được thực hiện thông qua các công nghệ ngôn ngữ tự nhiên bao gồm tìm kiếm đàm thoại, hiểu ngôn ngữ tự nhiên và hơn thế nữa, rất rõ ràng. Loại chức năng này đang ngấm ngầm vào một mảng BI hoặc các công cụ tìm kiếm, mặc dù nó được hỗ trợ đáng kể bởi các khía cạnh khác của biểu đồ tri thức liên quan đến hội nghị ngữ nghĩa. Cuối cùng, trong ngành dược phẩm (cũng như một số ngành khác), phương pháp tính toán nhận thức này đang thúc đẩy quá trình tạo tính năng cho các mô hình học máy trong khi đưa ra các truy vấn đặc biệt trong khung thời gian nhanh chóng. Các khả năng của đồ thị đang âm thầm làm nền tảng cho việc học máy nói chung; tác động của chúng đối với nhánh AI này sẽ chỉ trở nên rõ rệt hơn trong những ngày tới. Giới thiệu về Tác giả Jelani Harper là một nhà tư vấn biên tập phục vụ thị trường công nghệ thông tin. Ông chuyên về các ứng dụng theo hướng dữ liệu, tập trung vào các công nghệ ngữ nghĩa, quản trị và phân tích dữ liệu. Tham gia với chúng tôi trên Twitter: @ InsideBigData1 – https://twitter.com/InsideBigData1 Đăng ký nhận bản tin miễn phí InsideBIGDATA.

Back to top button