Data science

Sơ đồ tri thức, Bản thể học và AI

Mùa thu vừa qua, tất cả các khía cạnh của cấu trúc kiến ​​thức có thể tính toán được KBpedia – bản thể luận trên của nó (KKO), biểu đồ kiến ​​thức đầy đủ, ánh xạ tới các cơ sở kiến ​​thức hàng đầu chính và 70 các nhóm khái niệm logic được gọi là typologies – đã trở thành mã nguồn mở. Đạt được những bước tiến lớn trong việc gia tăng các định nghĩa và ánh xạ là trọng tâm chính của KBpedia phiên bản 1. 60. Như mọi khi, KBpedia kết hợp các khía cạnh chính của Wikipedia, Wikidata, schema.org, DBpedia, GeoNames, OpenCyc và UMBEL thành một tổng thể tích hợp và bổ sung cho chúng 20 ánh xạ từ vựng hàng đầu mang lại cơ sở kiến ​​thức mới và tích hợp với các từ vựng hiện có, lược đồ và dữ liệu cá thể để hoạt động trong cấu trúc KBpedia. Có 55,000 các khái niệm tham chiếu trong biểu đồ kiến ​​thức hướng dẫn của nó, liên kết thành một triệu thực thể ước tính 30, chủ yếu từ Wikidata. “Bên cạnh tất cả những lý do chúng tôi thiết kế KBpedia ngay từ đầu, nhu cầu rất lớn là mang lại một cấu trúc khả thi có thể tận dụng Wikidata và Wikipedia để cung cấp cho người dùng một phương tiện nhất quán để tìm kiếm, truy xuất và tổ chức tài sản của họ cho các mục đích của họ, Mike Bergman, hiệu trưởng cấp cao của Cognonto Corp. và là biên tập viên chính cho cấu trúc kiến ​​thức KBpedia cho biết. Điều này có thể chứng minh là một động lực chính để KBpedia được áp dụng nhiều hơn. Ông Bergman nói: Wikidata và Wikipedia là hai nguồn thông tin chính cung cấp thông tin cho KBpedia, và điều cần thiết để người dùng thao tác thông tin theo cách phối hợp là có một lớp phủ có thể tính toán được. Mặc dù đó là một trường hợp sử dụng rõ ràng, Bergman cũng hy vọng rằng bằng cách mở nguồn cung ứng KBpedia, “những người khác có thể thấy giá trị của nó theo những cách mà chúng tôi không thể, và tôi nghĩ rằng sự hài lòng của chúng tôi khi thấy những ý tưởng và đóng góp mới nảy nở,” Bergman nói. Ví dụ, KBpedia luôn giúp hỗ trợ máy học và trí tuệ nhân tạo dựa trên tri thức cho doanh nghiệp. Với biểu đồ tri thức quy mô lớn, hầu hết mọi nút đều là một điểm vào hoặc một khía cạnh. Có thể tính toán được, cấu trúc KBpedia có thể được lập lại và phân chia một cách hợp lý để tạo ra các bộ đào tạo và tiêu chuẩn tham chiếu cho Học máy và khả năng tương tác dữ liệu. Trong thông báo mã nguồn mở KBpedia, người ta lưu ý rằng “những bước tiến to lớn đã được thực hiện trong thập kỷ qua trong việc tận dụng cơ sở kiến ​​thức cho trí tuệ nhân tạo”. Tuy nhiên, thông báo vẫn tiếp tục, các hạn chế vẫn còn. Một là dựa vào các nguồn kiến ​​thức như Wikipedia chưa bao giờ được thiết kế cho các mục đích tích hợp dữ liệu hoặc AI. Vấn đề thứ hai là không có khối xây dựng lặp lại nào có thể được mở rộng cho bất kỳ miền nào. “AI rất gợi cảm và hấp dẫn, nhưng quá đắt. Chúng tôi hy vọng bản phát hành mã nguồn mở hiện tại của KBpedia sẽ giúp chúng tôi tiến gần hơn đến việc khắc phục những vấn đề này ”, thông cáo viết. Sự hỗ trợ của AI trong KBpedia – những khả năng luôn tồn tại nhưng trước đây chưa từng có nguồn mở và miễn phí cho mọi người – xuất hiện bởi nhiều hơn 300 tính năng dựa vào đó người dùng có thể đào tạo học máy. Các tính năng này bao gồm một nhóm các nhãn phong phú để thực hiện học máy được giám sát. Ngoài ra, các định nghĩa, tập hợp mã để mở rộng tìm kiếm ngữ nghĩa và văn bản mạnh mẽ có sẵn cho gần như tất cả các KBpedia 55, 000 các khái niệm tham chiếu. Việc tổ chức KBpedia thành các thực thể, sự kiện, khái niệm, thuộc tính và quan hệ vẫn cung cấp sức mạnh phân biệt hơn nữa. Đối với học máy được giám sát, bán giám sát và giám sát từ xa “bạn có thể trình bày các đầu vào không xác định và nhận các nhãn đầu ra để xác định và phân loại các thực thể,” Bergman nói. “Trong học tập có giám sát, một chi phí chính là gắn nhãn đầu ra và với biểu đồ kiến ​​thức được cấu trúc phù hợp, logic và nhất quán, người dùng có thể tạo các nhãn và tập hợp đào tạo đó trong vài phút.” Trong các phương pháp tiếp cận truyền thống đối với việc học có giám sát, các nhiệm vụ tương tự sẽ tiêu tốn 60 cho 80 phần trăm của tổng số nỗ lực cần thiết. Với việc học không giám sát, người dùng có thể tạo chức năng mới với loại tập dữ liệu phù hợp – “kho dữ liệu thông tin được giới hạn thích hợp bằng cách thao tác với cấu trúc kiến ​​thức KBpedia,” Bergman nói. Trong học tập không có giám sát, các kết quả đầu ra không được gắn nhãn trước và mẹo để xây dựng cấu trúc học tập không có giám sát tốt là tạo các ngữ liệu đào tạo để chạy các thuật toán chống lại. “Bạn phải đảm bảo rằng thuật toán cho các ngữ liệu đầu vào để học được ràng buộc chính xác với vấn đề bạn đang cố gắng giải quyết. Vì vậy, có thể điều chỉnh phạm vi và ranh giới của các ngữ liệu cũng rất hữu ích để có được kết quả học tập không bị giám sát tốt hơn, ”ông nói. Trợ giúp cho việc thực thi dữ liệu cấp C Với mã nguồn mở KBpedia phiên bản 1. 60, Bergman đang giải quyết một thực tế là nhiều CIO, CTO , CDO hoặc những người khác có trách nhiệm đối với các nguồn kiến ​​thức của tổ chức muốn tìm hiểu thêm về những việc cần làm với chúng. Ông nói: “Họ nghe về những điều đang xảy ra với học máy, nhưng họ có tất cả các tập dữ liệu nội bộ không nói chuyện với nhau và các vấn đề nội bộ về việc có một cái nhìn thống nhất trong toàn doanh nghiệp về thông tin của họ. Những vấn đề đó được giải quyết bởi thực tế, “KBpedia là một giàn giáo để tập hợp các nguồn kiến ​​thức nội bộ hiện có để khắc phục vấn đề 'ống lò'. Thứ hai, sau khi được tổ chức như vậy, họ có thể sử dụng cấu trúc vốn có của KBpedia để chia nhỏ các bộ đào tạo và kho tài liệu đào tạo của riêng họ cho việc học máy có giám sát và không bị giám sát với chi phí giảm đáng kể. ” Cuốn sách của Bergman, Một Thực tiễn Trình bày Tri thức, nhằm mục đích giúp các tổ chức giải quyết những vấn đề này. Ông nói: “Có nhiều cách để suy nghĩ về những vấn đề này và tiếp cận chúng một cách thực dụng và hợp lý. “Các khối xây dựng ở đó và với mã nguồn mở, họ có thể quản lý theo cách của mình khỏi ngõ cụt.” Cuốn sách về biểu diễn tri thức, giống như bản thân KBpedia, được dựa trên các tác phẩm của Charles S. Peirce, một nhà logic học, nhà khoa học và triết học thế kỷ XX. Ông đã cung cấp các hướng dẫn thực tế và các phạm trù phổ quát trong cách tiếp cận có cấu trúc để biểu diễn tri thức nhằm nắm bắt sự khác biệt trong các sự kiện, thực thể, quan hệ, thuộc tính, loại và khái niệm. Bergman nói: “Cuốn sách này là bối cảnh và nền tảng lý do tại sao chúng tôi xây dựng KBpedia, như một nỗ lực để tái tạo lại các lý thuyết của ông ấy về cách thể hiện kiến ​​thức. Bản phát hành hiện tại này của KBpedia và các bản khác sẽ ra mắt ngay sau khi nó hoàn thành 'đường cơ sở' của KBpedia, “Việc hoàn thành đường cơ sở có nghĩa là ánh xạ đầy đủ tới tất cả các nguồn bên ngoài hiện có (bảy cơ sở tri thức cấu thành bao gồm Wikidata và Wikipedia) và định nghĩa đầy đủ cho tất cả các khái niệm. ” Khi đường cơ sở này hoàn thành, các kế hoạch bao gồm ánh xạ tới các cơ sở tri thức cấu thành khác. Điều đó có thể bao gồm việc bổ sung những thứ như danh mục sản phẩm, tài nguyên ngôn ngữ như Mạng từ và các hệ thống phân loại khác, ông nói. Bergman cho biết: “Chúng tôi muốn có những cách khác để tạo ra những bước chuyển tiếp đến các cơ sở tri thức chất lượng cao khác. “Chúng tôi muốn đường cơ sở phải tương đối hoàn chỉnh và có mức độ bao phủ nhiều nhất có thể đối với các đóng góp bên ngoài.” Hình ảnh được sử dụng theo giấy phép từ Shutterstock.com

  • Trang chủ
  • CRM
  • Email doanh nghiệp
  • Email marketing
  • Marketing News
  • Marketing tổng thể
  • SEO
  • Thiết kế Website
  • Web Hosting
  • Chatbot
  • Data science
  • Back to top button