Marketing News

Khoa học dữ liệu của thuật giả kim kỹ thuật số

Trong tự nhiên, các hạt sẽ tự kết tụ một cách tự nhiên thành những cấu trúc tinh thể có những tính chất nhất định. Con người đã học cách tận dụng hành vi này để tạo ra các vật liệu có lợi trong phòng thí nghiệm, nhưng chúng ta bị giới hạn bởi bản chất vật lý của thử nghiệm. Một nhóm các nhà nghiên cứu tại Đại học Michigan dưới sự lãnh đạo của “nhà giả kim kỹ thuật số” Sharon C. Glotzer đang sử dụng khoa học dữ liệu và tài nguyên máy tính hiệu suất cao để dự đoán những hạt nano nào sẽ tự lắp ráp, do đó đẩy nhanh quá trình tạo ra các vật liệu mới . Glotzer, một trong những nhà nghiên cứu hàng đầu thế giới trong lĩnh vực tự lắp ráp các hạt nano, đứng đầu Glotzer Group, một nhóm gồm 30 hoặc vì vậy các nhà nghiên cứu tại Khoa Kỹ thuật Hóa học của Đại học Michigan và Viện Biointerfaces của nó. Trong hội nghị ACM SIGKDD 2021 tuần trước, Glotzer đã mô tả cách nhóm của cô ấy sử dụng phần mềm khoa học dữ liệu, phần cứng HPC và sự khéo léo của con người để biến phép thuật thành công. Tinh thể có mặt ở khắp nơi trong tự nhiên. Nước đá và muối ăn là những ví dụ về cấu trúc tinh thể hình thành một cách tự nhiên khi có các nguyên tố phù hợp với điều kiện thích hợp. Nhưng thiên nhiên có những tinh thể phức tạp hơn nhiều ẩn mình. Ở cấp độ vi mô, các cấu trúc tinh thể sẽ tự lắp ráp từ các phần tử khác nhau thành các đơn vị lặp lại cực kỳ phức tạp với hàng chục nghìn nguyên tử mỗi nguyên tử. Số lượng các kết hợp có thể có là quá lớn để có thể hiểu được, nhưng đây là lĩnh vực mà Glotzer và các đồng nghiệp của cô đã dành riêng để tìm hiểu. “Chúng tôi bị ám ảnh bởi việc hiểu làm thế nào mà sự phức tạp như vậy lại nảy sinh? Làm thế nào hệ thống tìm ra cách tự tổ chức thành các cấu trúc tinh thể khác nhau? Tại sao nó thích cấu trúc tinh thể này hơn cấu trúc tinh thể khác? Và làm thế nào để nó đến được đó? Nó làm như thế nào? ” Glotzer đã hỏi trong phiên làm việc của cô ấy tại KDD 2021, nơi hầu như được tổ chức do đại dịch COVID. “Chúng ta biết rằng cơ học lượng tử giải thích rất nhiều về liên kết. Nhiệt động lực học rất quan trọng trong việc quyết định giai đoạn ổn định sẽ như thế nào. Và bất kỳ cấu trúc tinh thể nào mà bạn có được đều phải tuân theo quy luật nhiệt động lực học thống kê, ”Glotzer tiếp tục. “Nhưng điều mà chúng ta không có lý thuyết là hiểu các yếu tố vi mô dẫn từ rối loạn đến trật tự.” (Hình ảnh do Glotzer Group cung cấp) Glotzer và các đồng nghiệp của cô ấy tấn công vấn đề một cách hợp lý, sử dụng khoa học dữ liệu và tài nguyên HPC. Mục tiêu là mở rộng hiểu biết của chúng ta về các con đường lắp ráp mà qua đó các hạt nano sẽ tự lắp ráp – tức là tự chúng tạo ra các cấu trúc tinh thể ổn định, với sự khuyến khích tối thiểu của con người. Cuối cùng, việc tạo ra các vật liệu mới có lợi ích cho con người trong nhiều trường hợp sử dụng khác nhau “Đó thực sự là một không gian thiết kế vô hạn của các khả năng,” Glotzer, người được mệnh danh là “nhà giả kim kỹ thuật số” nói trong một 2017 Bài báo trên Tạp chí Quanta. “Mô phỏng máy tính là công cụ hoàn hảo để khám phá không gian thiết kế bởi vì chúng tôi có thể làm điều đó nhanh hơn các thử nghiệm và chúng tôi có thể giữ cho một số thứ nhất định không đổi và thay đổi những thứ khác theo những cách mà có thể các thí nghiệm không làm được”. Nhóm của Glotzer không tập trung vào các cấu trúc kim loại, mà là “vật chất mềm”, những thứ như protein, DNA, capsid vi rút và các hạt gamma, cô nói. Một trong những khía cạnh quan trọng của nghiên cứu là biết phân tử hữu cơ nào sẽ hoạt động như chất liên kết, hoặc phối tử, kết nối các khối xây dựng với nhau. DNA là một ví dụ về phối tử. Các nhà nghiên cứu làm việc ngược lại so với nơi họ muốn. “Chúng tôi muốn bắt đầu từ 'Đây là các thuộc tính của hành vi mà chúng tôi muốn vật liệu của mình có.' Dựa trên đó, đây là cấu trúc của tinh thể mà chúng ta cần, ”Glotzer nói. “Vì vậy, dựa trên đó, chúng ta nên tạo ra những hạt nano nào và chúng ta nên sử dụng những yếu tố liên kết nào để khi chúng ta ném những hạt này vào một xô nước, chúng sẽ tự lắp ráp thành chính xác cấu trúc mà chúng ta muốn.” Các nhà hóa sinh ngày nay có rất nhiều quyền kiểm soát đối với quá trình sản xuất hạt nano. Theo Glotzer, ngày nay có thể “tạo ra về cơ bản bất kỳ dạng hạt nano nào từ rất nhiều loại vật liệu, với độ đồng nhất cao, sao cho tất cả các hạt đều có kích thước gần giống nhau và hình dạng giống nhau.” Được trình bày với một không gian rộng lớn và hấp dẫn chứa đầy các khối xây dựng và keo dán, nhiệm vụ của Glotzer là tìm ra cách tất cả những thứ này có thể kết hợp với nhau và kết hợp với nhau theo cách có lợi nhất. (Hình ảnh do Glotzer Group cung cấp) “Nếu tôi đưa cho bạn một cấu trúc tinh thể và nói, hãy cho tôi biết tôi nên sử dụng hình dạng hạt nano nào? Bạn sẽ rất khó để nói hình dạng đó nên như thế nào, ”cô nói. “Giả sử bạn có một loạt các hạt có hình dạng khác nhau và tất cả chúng đều có thể tự lắp ráp thành cấu trúc, giống như cấu trúc clathrate đó – cái nào tốt nhất? Cái nào làm cho pha lê tốt nhất với sản lượng cao nhất và chất lượng cao nhất? Đó là những dạng câu hỏi mà chúng tôi sử dụng mô phỏng máy tính để cố gắng trả lời ”. Có một số cách tiếp cận cơ bản mà Glotzer áp dụng. Một cách tiếp cận là tạo ra một mô phỏng sử dụng động lực học phân tử để dự đoán lực mà các hạt khác nhau sẽ tác động lên nhau và kết quả là cấu trúc có thể hình thành từ nó. Cái còn lại là mô phỏng Monte Carlo, theo đó hệ thống bắt chước chuyển động Brown của các hạt nano trong chất lỏng. “Khi chúng tôi nghiên cứu các hệ thống, chúng tôi không biết chúng sẽ làm gì,” cô nói. “Khi chúng ta bắt đầu với một hình dạng, chúng ta không biết chúng sẽ tạo ra cái gì, hoặc thậm chí chúng sẽ tạo ra bất cứ thứ gì. Chúng ta không biết liệu chúng có tự lắp ráp hay không, ở nồng độ hay áp suất hay nhiệt độ nào thì chúng sẽ tự lắp ráp thành cấu trúc tinh thể đó. Chúng tôi không biết bất kỳ điều gì trong số đó, và vì vậy chúng tôi phải thực hiện rất nhiều mô phỏng để hy vọng rằng chúng tôi bắt đầu thấy một cái gì đó tự lắp ráp. ” Tập đoàn Glotzer đã phát triển đoạn mã riêng có tên HOOMD-blue để chạy các mô phỏng. Cô cho biết nhóm của cô đã chạy hàng trăm nghìn mô phỏng qua 50, 000 hình dạng hạt. Bởi vì có quá nhiều sự không chắc chắn về những gì, nếu có, cấu trúc sẽ hình thành, nhóm của cô ấy cần tiếp cận với rất nhiều sức mạnh tính toán để làm cho nó trở nên đáng giá. Điều đó bao gồm Summit, 200 – siêu máy tính petaflops được lắp đặt tại Phòng thí nghiệm Quốc gia Oak Ridge. Tập đoàn Glotzer chia sẻ các công cụ mà họ đã phát triển để nghiên cứu quá trình tự lắp ráp các hạt nano (Hình ảnh do Tập đoàn Glotzer cung cấp) “Chúng tôi không biết kích thước của ô đơn vị là bao nhiêu và chúng tôi không muốn ảnh hưởng đến kích thước của nó vì chúng tôi có quá nhỏ trong một lô hạt, và vì vậy chúng ta phải có những hệ thống thực sự lớn, ”cô nói. “Tất cả những điều đó kết hợp với nhau có nghĩa là chúng tôi tạo ra lượng dữ liệu hàng ngày, hàng terabyte và terabyte dữ liệu và vì vậy chúng tôi cần một cách để tổ chức dữ liệu đó để chúng tôi có thể làm khoa học với nó.” Một trong những công cụ mà nhóm của Glotzer sử dụng là signac, một khung công tác ứng dụng-bất khả tri nhẹ, được viết bằng Python giúp người dùng quản lý và mở rộng quy mô công việc dựa trên tệp. Theo Glotzer, signac là chất keo kết nối các thành phần khác nhau trong quy trình làm việc HPC của nhóm cô ấy với nhau và rất quan trọng để đảm bảo rằng dữ liệu được tạo ra là minh bạch, có thể tái tạo, có thể sử dụng được bởi những người khác và có thể mở rộng. “Điều tuyệt vời của signac là quản lý dữ liệu không đồng nhất dựa trên tệp trên hệ thống tệp cục bộ, để tìm kiếm dữ liệu và truy cập nó,” cô nói. “Bạn có thể làm điều đó trong Python hoặc trên dòng lệnh, phát triển các quy trình tính toán có thể mở rộng và tái tạo, bao gồm các quy trình công việc rất phức tạp.” Chọn các mẫu có liên quan từ đống dữ liệu được tạo ra bởi các mô phỏng cũng rất quan trọng và đối với điều này, nhóm của Glotzer sử dụng các thuật toán học máy không được giám sát để tạo ra các bộ mô tả. Cô nói: “Ý tưởng là phát triển sự hiểu biết vi mô về các con đường lắp ráp bằng cách sử dụng máy học. “Vì vậy, chúng ta đang bắt đầu với các hạt, và chúng ta cần có một số bộ mô tả cho chúng ta biết môi trường hạt cục bộ là gì, để chúng ta có thể phân biệt cấu trúc tinh thể này với cấu trúc tinh thể khác, và nền văn hóa tinh thể từ chất lỏng hoặc các phần của dạng cấu trúc các phần khác của cấu trúc tinh thể. ” Giáo sư Đại học Michigan, Sharon C. Glotzer, nhận bằng Tiến sĩ. trong vật lý lý thuyết vật chất cô đặc mềm của Đại học Boston ở 1993 Một thách thức lớn nảy sinh ở đây là tính kích thước cao của dữ liệu. Nhóm của Glotzer sử dụng một thuật toán được gọi là Phép chiếu và xấp xỉ đồng nhất (UMAP) để giảm kích thước của dữ liệu trong khi vẫn giữ nguyên hình dạng ban đầu của nó trong không gian chiều giảm. Nó cũng cung cấp hiệu suất tốt trên GPU sử dụng thư viện RAPIC của Nvidia cho CUDA, cô nói. Được trang bị tham số thứ tự tôpô liên tục từ UMAP, nhóm của Glotzer giờ đây có cái nhìn sâu sắc về cách các hạt nano sẽ tự lắp ráp. Các kết quả được mã hóa màu từ phân tích đó cũng cung cấp cái nhìn sâu sắc về bản chất của việc đóng gói các hạt nano. Bà nói: “Chúng ta có thể theo dõi những điều này trên con đường từ chất lỏng sang tinh thể và biết mọi môi trường hạt thay đổi như thế nào theo thời gian trên con đường này. Khi Glotzer tập hợp các nhúng UMAP khác nhau, một bức tranh bắt đầu xuất hiện. Bà nói: “Chúng ta có thể thấy toàn bộ cấu trúc của đa tạp với tất cả các cấu trúc tinh thể khác nhau có thể hình thành từ tất cả các hệ thống khác nhau mà chúng ta đang xem xét, từ đầu là chất lỏng và kết thúc là tinh thể. “Thông tin này giúp chúng tôi thiết kế các lộ trình lắp ráp mới.” Để biết thêm thông tin về công việc của Glotzer, bạn có thể truy cập trang web của nhóm của cô ấy tại glotzerlab.engin.umich.edu/home. Các mục liên quan: Khoa học dữ liệu là gì? Người chiến thắng giải thưởng Turing Chia sẻ quan điểm của mình Phần mềm Clemson Tối ưu hóa việc truyền dữ liệu lớn AI Tranh thủ theo dõi các tương tác hóa học phức tạp ở con người Trang chủ Tiếp thị nội dung Chiến lược tiếp thị kỹ thuật số Chiến lược tiếp thị kỹ thuật số Chiến lược tiếp thị kỹ thuật số PPC SEO Xây dựng xã hội Phát triển web WordPress Khoa học dữ liệu

  • Trang chủ
  • CRM
  • Email doanh nghiệp
  • Email marketing
  • Marketing News
  • Marketing tổng thể
  • SEO
  • Thiết kế Website
  • Web Hosting
  • Chatbot
  • Data science
  • Back to top button