科學智能(AI for Science)通過學習、模擬、預測和優化自然界與人類社會的各種現象和規律來解決我們目前遇到的各類科研難題,從而推動科學發現和創新,這種模式目前被稱為科學研究和發現的第五範式。絡繹科學發起「科學智能 50 人」訪談計劃,旨在邀請科學智能領域優秀的專家代表,希望通過系列訪談,為廣大讀者呈現一個更全面、深入的科學智能領域的發展現狀和前沿洞察。
「如果我們要說出所有假設中最有力的一個,這個假設會不斷引導人們去嘗試理解生命,那就是所有的東西都是由原子組成的,生物所做的一切都可以通過原子的振動和擺動來理解。」著名物理學家理乍得·費曼(Richard Feynman)曾這樣表示。
對世界本源的探究永遠是一個無法拒絕的科研「誘惑」。然而,想要觀察和理解原子現象和行為,就需要在原子尺度上進行準確的觀測、模擬、預測,隨之而來的科研難題出現了:如何採集和處理超大規模數據量?如何降解模擬原子帶來的超高計算量和複雜度?還有微觀尺度自身的高計算精度的要求。
似乎更強大、更快、更精準的計算方法必須應時而出。早在 20 世紀 90 年代,研究人員就嘗試將機器學習融入分子動力學,但三十多年以來領域進展緩慢。直到近年來,隨着算力的劇烈提升,AI 技術的「突飛猛進」,為上述問題帶來了新的解決途徑。
圖丨賈偉樂(來源:賈偉樂)
中國科學院計算技術研究所研究員、博士生導師賈偉樂長期致力於高性能計算(High performance computing,HPC),結合 AI 來解決第一性原理計算面臨的高性能計算問題。他與合作者發展了一種「HPC+AI」的方法,創紀錄地實現超大規模超高精度的分子動力學模擬。在高性能計算機上,利用第一性原理方法生成的數據訓練出來的神經網絡模型,極大地拓寬了從頭計算分子動力學(ab initio)在現代超級計算機的空間和時間尺度的應用範圍。
該方法通過計算的手段來模擬真實的物理世界,並為基於從頭計算精度的、前所未有的大規模分子動力學模擬打開了大門,作為計算「新工具」為人們理解科學規律提供了新方法,可用於新材料、半導體器件、電池、製藥等領域的研究。
賈偉樂因該工作獲得了 2020 年的戈登·貝爾獎,該獎項具有「超級計算應用領域的諾貝爾獎」之稱。美國計算機協會對這項研究成果的評價道:「基於深度學習的分子動力學模擬通過機器學習和大規模並行的方法,將精確的物理建模帶入了更大尺度的材料模擬中,有望在將來為力學、化學、材料、生物乃至工程領域解決實際問題(如大分子藥物開發)發揮更大作用。」
將高精度分子動力學模擬規模提升至 170 億原子
賈偉樂本科畢業於西安電子科技大學,在中國科學院大學獲得碩士和博士學位,師從中國高性能計算及網格計算的學術帶頭人之一遲學斌研究員。在他求學和從事科學研究的十幾年裡,恰好見證了高性能計算技術的兩次重要變革,分別是約 10 年前的異構計算和當前的人工智能熱潮。
異構計算時代中,科學家們通過 GPU 異構部件提升計算性能。2013 年,賈偉樂作為聯合培養博士生前往美國勞倫斯伯克利國家實驗室,與汪林望教授合作將基於 CPU 的第一性原理計算軟件 PEtot 移植到 GPU 上,這也是他第一次進入微觀尺度模擬領域。
在物理領域,最基本的量子力學、分子動力學、計算流體力學等都有對應的方程,以解方程作為計算方式,成為傳統科學中繼實驗、理論後的「第三範式」。但問題在於,求解量子力學的 Kohn-Sham 方程需要求解大規模特徵值問題,其計算複雜度為 N3。不僅需要的算力單元多,耗時還很長。在這種情況下,一個典型的微觀尺度模擬的計算時空尺度,基本上被限制在數百原子和皮秒量級。
由於數值計算面臨著求解的時空尺度限制問題,科學家早在上世紀 90 年代,就開始使用機器學習的方法來擬合原子的勢能面。雖然傳統的機器學習方法如線性回歸有着小數據量、擬合迅速的優點,但是它在準確擬合原子勢能面在精度上存在着巨大挑戰。
隨着 GPU 技術的發展,高性能計算逐漸朝着與 AI 融合的方向發展。科學智能(AI For Science)把物理模型恰當地引入到機器學習中,在保證精度的同時,極大地提高了計算的速度,真正地將高性能計算和 AI 以及物理模型結合起來。因此,人們對被稱為「第五範式」的 AI for Science 充滿期待。
圖丨深度勢能模型示意圖(來源:ACM SIGPLAN Annual Symposium Principles and Practice of Parallel Programming)
為解決上述技術融合,賈偉樂與合作者實現了兩次「跳躍」,展示了在微觀尺度模擬中,把計算速度和計算體系規模從千原子量級提升到億及百億原子量級。
2020 年,賈偉樂在美國加州大學伯克利分校數學系林霖教授課題組從事博士後研究期間,與鄂維南院士等人把第一性原理計算的精度的分子動力學的時間和空間尺度都提升了 2-3 個數量級。在 IBM 的 Summit 超級計算機上,實現 1 億原子每天 1-2 納秒的分子動力學模擬。
2020 年底,他加入中國科學院計算技術研究所建立智能科學計算小組。2022 年,課題組的博士生郭卓強與合作者一起,又將分子動力學的計算規模提升至百億原子量級。在超算整機上的測試結果顯示,優化後的代碼可擴展到超級計算機 Fugaku 和 Summit 的全機,相應的計算規模可以擴大 134 倍,達到前所未有的 170 億個原子。1350 萬原子系統表明,計算模擬的速度提高 7 倍,一天能夠模擬 11.2 納秒的物理過程,這相比 2020 年的戈登·貝爾獎的工作又提升 1 到 2 個數量級。
圖丨表格模型與基線深度勢能模型相比的準確性(來源:ACM SIGPLAN Annual Symposium Principles and Practice of Parallel Programming)
從實際應用的角度,通過這種計算手段能實現怎樣的效果呢?「這意味着,以前需要在數千核的服務器上模擬一個月以上才能完成任務,通過新的 AI For Science 的方法只需要在現在的筆記本電腦上兩個小時之內完成。」賈偉樂說。
相關論文分別以《通過機器學習將分子動力學的極限從頭開始精確度提高到 1 億個原子》(Pushing the limit of molecular dynamics with ab initio accuracy to 100 million atoms with machine)[1],以及《將具有從頭計算精度的分子動力學極限擴展到 100 億個原子》(Extending the limit of molecular dynamics with ab initio accuracy to 10 billion atoms)為題在發表在International Conference for High Performance Computing和ACM SIGPLAN Annual Symposium Principles and Practice of Parallel Programming[2]。
期待 AI for Science 的工業級產品
AI for Science 有望為基礎科研和產業界帶來新變革。基礎研究方面,AI 驅動的微觀尺度模擬軟件和同類型軟件相比,效率提升了 3 個數量級,並被業內學者廣泛應用。值得關注的是,使用該軟件發展的相關成果陸續發表在 Nature、Science、 Physical Review Letters 等期刊。
雖然第一性原理計算的精度非常高,但由於算力成本過於昂貴,一直未被應用在工業界。賈偉樂表示,「現在,我們通過 HPC+AI 將量級大幅度提升後,各領域對該方法表現出強烈的需求。據我所知,國內頂尖的電池研發企業也在嘗試用該方法解決新材料相關的問題。」
第一性原理分子動力學涉及物理、數學、計算機等多領域,賈偉樂將該研究比喻成賽車比賽,他說:「要想贏得賽車比賽,需要賽車手、賽車調校人員及賽車製造人員的共同努力。作為純計算機背景的科研人員,我會從高性能計算角度去解決第一性原理的相關問題,也需要各領域合作者共同努力和創新。」
圖丨賈偉樂(前排右三)與課題組成員(來源:賈偉樂)
賈偉樂認為,雖然現在 AI 在圖片生成、人工智能對話等方向已表現出優勢,如果能將 AI 應用在傳統的工業領域,也將會產生實實在在的「創新」。
他說道:「如果我們能夠通過科學智能來設計新材料,比如發現性能更高的電池材料或者高溫高壓材料等,這將開闢新的賽道。目前國內已經存在多個 AI for Science 的初創企業,我期待在十年內可以看到 AI for Science 的工業級產品。」
參考資料:
https://awards.acm.org/bell
1.Weile Jia, Han Wang, Mohan Chen, Denghui Lu, Lin Lin, Roberto Car, Weinan E, and Linfeng Zhang. 2020. Pushing the limit of molecular dynamics with ab initio accuracy to 100 million atoms with machine learning. In Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis (SC '20). IEEE Press, Article 5, 1–14.
2.Zhuoqiang Guo , Denghui Lu, Yujin Yan , Siyu Hu , Rongrong Liu , Guangming Tan, Ninghui Sun, Wanrun Jiang , Lijun Liu , Yixiao Chen, Linfeng Zhang, Mohan Chen , Han Wang , Weile Jia. 2022. Extending the limit of molecular dynamics with ab initio accuracy to 10 billion atoms. Proceedings of the 27th ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming,205–218. https://doi.org/10.1145/3503221.3508425
聲明:本文僅供科研分享,助力科學傳播,不做盈利使用,如有侵權,請聯繫後台刪除。