Data science

Những gì trong một cái tên? (hay còn gọi là Mô hình hóa dữ liệu là gì?)

Nhấp để tìm hiểu thêm về tác giả Thomas Frisendal. Đây là một đặc biệt mùa hè, về khía cạnh nhẹ nhàng hơn, nhưng đôi khi giải quyết một vấn đề đơn giản áp đảo. Bạn đang nói về điều gì? Đôi khi điều hiển nhiên không phải là… hiển nhiên. Nhiều người biết rằng tôi đang ở bên đồ thị-y của ngôi nhà. Nhưng giải thích một vấn đề đơn giản như vậy không phải là dễ dàng. Bởi vì không phải điều hiển nhiên là rõ ràng. Đó là về những gì chúng ta gọi là sự vật, và nó là về các bối cảnh chồng chéo. Vương quốc của các biểu đồ thực sự trông giống như một bản đồ của châu Âu thời trung cổ: các vương quốc nhỏ và các vương quốc ở khắp nơi. Vì vậy, chúng tôi muốn nói về đồ thị. Đồ thị bao gồm những gì? Chà, các nút và mối quan hệ giữa các nút với một loạt các thuộc tính trên các nút và các mối quan hệ, phải không? Này, này – dừng lại một chút! Đồ thị bao gồm các đỉnh và các cạnh, khẳng định với mọi người, những người đã từng có trình độ toán học đại học vào một thời điểm nào đó. “Lý thuyết đồ thị đúng yêu cầu bạn phải gọi chúng là đỉnh và cạnh” là câu thần chú! Và Ngôn ngữ truy vấn đồ thị sắp ra mắt, GQL, sẽ có cả hai bộ tên cùng một lúc, dưới dạng từ đồng nghĩa: Nodes = Vertices, Relationships = Edges. Làm thế nào mọi người có thể không đồng ý về những vấn đề đơn giản như vậy về những gì được gọi là các yếu tố cơ bản của đồ thị? Chúng ta hãy đi sâu vào sự phát triển của các thứ trong biểu đồ đại diện cho một vị trí (các nút và đỉnh) chứ không phải là một giữa (các mối quan hệ và các cạnh). Đi bộ trên rìa hoặc có thể vượt qua nó? Lý thuyết đồ thị, 1736-1936 Tên phần ở trên là tên một cuốn sách từ 1976 (Clarendon Press) của Norman L. Biggs, E. Keith Lloyd và Robin J. Wilson. Đó là một cuốn sách lịch sử toán học, được giới thiệu cho tôi bởi một giáo sư toán học làm việc với lý thuyết đồ thị. Và tôi đã điều tra từ vựng của các nhà toán học đồ thị trong 200 năm – tất cả các tài liệu tham khảo bên dưới là từ cuốn sách này. AD 1736: Cách tiếp cận đồ thị đầu tiên là của nhà toán học L. Euler trong 1736, đang giải quyết vấn đề lập kế hoạch tuyến đường ở thành phố Königsberg ở Phổ (bây giờ là Kaliningrad ở Nga). Thành phố bên một con sông, bao gồm một hòn đảo trên sông. Tổng cộng có bảy cây cầu bắc qua sông ở nhiều nơi khác nhau. Thử thách là tìm ra một tuyến đường mà bạn đã băng qua tất cả bảy cây cầu, nhưng chỉ một lần. Euler đã phát triển một giải pháp tổng quát, đây được coi là sự ra đời của lý thuyết đồ thị. Nhưng hãy đoán xem? Euler sử dụng thuật ngữ phù hợp với ngữ cảnh như tuyến đường / hành trình, khu vực, cầu và giao lộ. Làm thế nào rất thích hợp. AD 1750: L. Euler trong một bức thư gửi cho Christian Goldbach mô tả chất rắn với các mặt phẳng được mô tả dưới dạng đồ thị. Ở đây anh ấy đang sử dụng các thuật ngữ như khuôn mặt, góc và cạnh (!). Trọng tâm rõ ràng là các mặt phẳng hình học (tôpô). AD 1812: SAJ Lhuilier viết về phép đo đa diện. Ở đây chúng ta tìm thấy các góc, các mặt, các đỉnh (!) Và các cạnh (!); xác định các mặt và các mặt của đa diện. Bối cảnh là bản đồ trên bề mặt, là cấu trúc liên kết nhiều hơn là đồ thị. QUẢNG CÁO 1813: A.-L. Cauchy nghiên cứu về đa diện. Sử dụng các thuật ngữ như cạnh, đỉnh và hình tam giác. Rõ ràng là hình học hơn đồ thị. QUẢNG CÁO 1847: JB Listing xuất bản các nghiên cứu giới thiệu về cấu trúc liên kết. Bối cảnh của anh ấy là các phức hợp tuyến tính liên quan đến tập hợp các đường tạo thành bề mặt trong mặt phẳng hoặc hình cầu. QUẢNG CÁO 1856: TP Kirkman thảo luận về biểu diễn của polyedra. Bối cảnh là các đa giác và các bề mặt có các cạnh (!). Cùng năm WR Hamilton trở nên nổi tiếng với nhiều điều tương tự, nhưng được đóng khung là đại số không giao hoán. Điều này phát triển thành “Trò chơi Icosian, liên quan đến các đa giác có điểm và liên tiếp (các chuyến đi). Ngày nay góc này của lý thuyết đồ thị được gọi là mạch Hamilton – nhưng vẫn là một bối cảnh đa giác. AD 1857: A. Cayley điều tra cấu trúc cây bằng cách sử dụng cành. AD 1869: C. Jordan về tập hợp các đường. Chỉ sử dụng (“dòng”) mà còn cả các đỉnh (!) (Nhưng không có cạnh). Cuộc điều tra chủ yếu là về ánh xạ tới các cấu trúc hình học có “tính liên tục” và tính đối xứng. AD 1873: C. Hierholzer nghiên cứu khả năng đi qua một hệ thống dòng mà không lặp lại. Anh ấy nói về các nút, đường thẳng và đường dẫn. (Được phân loại là một bài toán cấu trúc liên kết.) AD 1879: A. Cayley viết trên màu bản đồ. Các khu vực của bản đồ – bao nhiêu màu sắc khác nhau là đủ cho bất kỳ bản đồ nào? Vấn đề này là một trong những thách thức lớn nhất trong lý thuyết đồ thị, mặc dù vấn đề là tôpô, không phải là vấn đề đồ thị, nếu bạn hỏi tôi. Nhưng có rất nhiều bài báo “đồ thị” trong thể loại này. QUẢNG CÁO 1890: PJ Heawood tô màu bản đồ cho các bề mặt bằng cách sử dụng các thuật ngữ như đường và ranh giới. AD 1891: L. Heffter viết về các vùng lân cận. Điểm, mặt và, có, cạnh (!). AD 1891: JPC Petersen định nghĩa đồ thị thông thường, có đỉnh và cạnh. Tuy nhiên, trọng tâm là xây dựng các đa giác trong một nét vẽ. QUẢNG CÁO 1895: G. Tarry điều tra “vấn đề mê cung”. Điều này liên quan đến các đoạn và các điểm giao nhau, làm việc theo các hướng. AD 1922: O. Veblen trên đồ thị tuyến tính. Điểm, ô, ma trận, đồ thị tuyến tính, mạch dựa trên đỉnh và cạnh (!). Cây dường như là tập hợp con của đồ thị tuyến tính như vậy. Điều này dựa trên cơ sở của GR Kirchhoff và H. Poincaré. Ngành này được gọi là cấu trúc liên kết đại số. AD 1922: P. Franklin viết về vấn đề bốn màu. Vâng, vấn đề bốn màu vẫn tồn tại và phát triển sau 43 năm . Franklin sử dụng các thuật ngữ như vùng, phần, đỉnh, cạnh và ngũ giác. AD 1936: D. König xuất bản “cuốn sách định nghĩa về lý thuyết đồ thị đầu tiên” (bằng tiếng Đức): “Theorie der Endlichen und Unendlichen Graphen.” König sử dụng các thuật ngữ như nút (điểm) và cạnh. Cuốn sách có sẵn bằng tiếng Anh (hai ấn bản) và bạn sẽ tìm thấy nó trong “cấu trúc liên kết”. Rõ ràng nhiều nhà toán học coi đồ thị như một công cụ trong cấu trúc liên kết. Nhận thức thực dụng và trực quan về ngữ nghĩa Chúng ta đang đối mặt với vấn đề nhận thức / tri giác ở đây? Làm thế nào mà “cạnh” đó lại trở thành con cưng của trái tim và khối óc học thuật? Hãy xem hai hình ảnh trực quan này: Mối quan hệ giữa biên tập ngôn ngữ tại Wikipedia Nguồn: CC-BY-SA-3.0 Wikipedia Computermacgyver Trên đây là biểu đồ mạng của các mẫu đồng biên tập trên Wikipedia. Các nút đại diện cho các ấn bản ngôn ngữ của bách khoa toàn thư và các cạnh được định hướng, có trọng số hiển thị nhật ký về số lượng người dùng chủ yếu chỉnh sửa một ấn bản ngôn ngữ cũng đã chỉnh sửa một ấn bản khác. Chỉ các cạnh có trọng số trên 1. 96 độ lệch chuẩn trên mức trung bình mới được hiển thị . Màu sắc biểu thị các cộng đồng được tìm thấy bởi thuật toán phát hiện cộng đồng trên infomap. Một ví dụ về bản đồ bốn màu Nguồn: CC-BY-SA-3.0 Wikipedia Inductiveload Bây giờ, hãy tự hỏi: Trong hình ảnh trực quan của mạng biên tập ngôn ngữ, tôi có thể nhìn thấy bất kỳ cạnh nào không? Câu trả lời (về phần tôi) là: Không, tôi thấy không có góc cạnh, nhưng tôi thấy có rất nhiều mối quan hệ. Và sau đó tự hỏi: Trong bản đồ bốn màu, tôi có thể nhìn thấy cạnh nào không? Câu trả lời (về phần tôi) là: Có, tất cả các vùng trên bản đồ đều có các cạnh giữa chúng và các vùng khác. Đây là manh mối có thể giải thích cho sự khác biệt ngữ nghĩa: Nguồn: IntegralPython, CC BY-SA 4.0 qua Wikimedia Commons Để giải quyết các vấn đề về màu sắc, các nhà toán học đã vẽ các biểu đồ, giống như biểu đồ ở trên. Và đoán (tôi nghĩ) chuyện gì đang xảy ra: Đối với họ, các đường là các cạnh, bởi vì chúng thể hiện các cạnh giữa các vùng trên bản đồ. Vì vậy, thuật ngữ “cạnh” bị mắc kẹt trong thế giới toán học, bị chi phối bởi các ứng dụng tôpô và hình học của lý thuyết đồ thị. Nhưng các đường trong biểu đồ không phải là các cạnh. Chúng đại diện cho mối quan hệ giữa các vùng (nghĩa là, ý nghĩa của các cạnh là biên giới giữa các vùng). Việc hiểu đúng ngữ nghĩa là bản chất – cũng là trong mùa hè! Đó là bước đi trên bờ cho bạn! Đừng ngã…

  • Trang chủ
  • CRM
  • Email doanh nghiệp
  • Email marketing
  • Marketing News
  • Marketing tổng thể
  • SEO
  • Thiết kế Website
  • Web Hosting
  • Chatbot
  • Data science
  • Back to top button