高性能計算方法,將高精度分子動力學模擬規模提升至170億原子

2023年10月30日18:05:12 科學 1511

科學智能(AI for Science)通過學習、模擬、預測和優化自然界與人類社會的各種現象和規律來解決我們目前遇到的各類科研難題,從而推動科學發現和創新,這種模式目前被稱為科學研究和發現的第五範式。絡繹科學發起「科學智能 50 人」訪談計劃,旨在邀請科學智能領域優秀的專家代表,希望通過系列訪談,為廣大讀者呈現一個更全面、深入的科學智能領域的發展現狀和前沿洞察。


「如果我們要說出所有假設中最有力的一個,這個假設會不斷引導人們去嘗試理解生命,那就是所有的東西都是由原子組成的,生物所做的一切都可以通過原子的振動和擺動來理解。」著名物理學家理乍得·費曼Richard Feynman)曾這樣表示。


對世界本源的探究永遠是一個無法拒絕的科研「誘惑」。然而,想要觀察和理解原子現象和行為,就需要在原子尺度上進行準確的觀測、模擬、預測,隨之而來的科研難題出現了:如何採集和處理超大規模數據量?如何降解模擬原子帶來的超高計算量和複雜度?還有微觀尺度自身的高計算精度的要求。


似乎更強大、更快、更精準的計算方法必須應時而出。早在 20 世紀 90 年代,研究人員就嘗試將機器學習融入分子動力學,但三十多年以來領域進展緩慢。直到近年來,隨着算力的劇烈提升,AI 技術的「突飛猛進」,為上述問題帶來了新的解決途徑。


高性能計算方法,將高精度分子動力學模擬規模提升至170億原子 - 天天要聞

圖丨賈偉樂(來源:賈偉樂)


中國科學院計算技術研究所研究員、博士生導師賈偉樂長期致力於高性能計算(High performance computing,HPC),結合 AI 來解決第一性原理計算面臨的高性能計算問題。他與合作者發展了一種「HPC+AI」的方法,創紀錄地實現超大規模超高精度的分子動力學模擬。在高性能計算機上,利用第一性原理方法生成的數據訓練出來的神經網絡模型,極大地拓寬了從頭計算分子動力學(ab initio)在現代超級計算機的空間和時間尺度的應用範圍。


該方法通過計算的手段來模擬真實的物理世界,並為基於從頭計算精度的、前所未有的大規模分子動力學模擬打開了大門,作為計算「新工具」為人們理解科學規律提供了新方法,可用於新材料、半導體器件、電池、製藥等領域的研究。


賈偉樂因該工作獲得了 2020 年的戈登·貝爾獎,該獎項具有「超級計算應用領域的諾貝爾獎」之稱。美國計算機協會對這項研究成果的評價道:「基於深度學習的分子動力學模擬通過機器學習和大規模並行的方法,將精確的物理建模帶入了更大尺度的材料模擬中,有望在將來為力學、化學、材料、生物乃至工程領域解決實際問題(如大分子藥物開發)發揮更大作用。」


將高精度分子動力學模擬規模提升至 170 億原子


賈偉樂本科畢業於西安電子科技大學,在中國科學院大學獲得碩士和博士學位,師從中國高性能計算及網格計算的學術帶頭人之一遲學斌研究員。在他求學和從事科學研究的十幾年裡,恰好見證了高性能計算技術的兩次重要變革,分別是約 10 年前的異構計算和當前的人工智能熱潮。


異構計算時代中,科學家們通過 GPU 異構部件提升計算性能。2013 年,賈偉樂作為聯合培養博士生前往美國勞倫斯伯克利國家實驗室,與汪林望教授合作將基於 CPU 的第一性原理計算軟件 PEtot 移植到 GPU 上,這也是他第一次進入微觀尺度模擬領域。


在物理領域,最基本的量子力學、分子動力學、計算流體力學等都有對應的方程,以解方程作為計算方式,成為傳統科學中繼實驗、理論後的「第三範式」。但問題在於,求解量子力學的 Kohn-Sham 方程需要求解大規模特徵值問題,其計算複雜度為 N3。不僅需要的算力單元多,耗時還很長。在這種情況下,一個典型的微觀尺度模擬的計算時空尺度,基本上被限制在數百原子和皮秒量級。

由於數值計算面臨著求解的時空尺度限制問題,科學家早在上世紀 90 年代,就開始使用機器學習的方法來擬合原子的勢能面。雖然傳統的機器學習方法如線性回歸有着小數據量、擬合迅速的優點,但是它在準確擬合原子勢能面在精度上存在着巨大挑戰。


隨着 GPU 技術的發展,高性能計算逐漸朝着與 AI 融合的方向發展。科學智能(AI For Science)把物理模型恰當地引入到機器學習中,在保證精度的同時,極大地提高了計算的速度,真正地將高性能計算和 AI 以及物理模型結合起來。因此,人們對被稱為「第五範式」的 AI for Science 充滿期待。


高性能計算方法,將高精度分子動力學模擬規模提升至170億原子 - 天天要聞

圖丨深度勢能模型示意圖(來源:ACM SIGPLAN Annual Symposium Principles and Practice of Parallel Programming)


為解決上述技術融合,賈偉樂與合作者實現了兩次「跳躍」,展示了在微觀尺度模擬中,把計算速度和計算體系規模從千原子量級提升到億及百億原子量級。


2020 年,賈偉樂在美國加州大學伯克利分校數學系林霖教授課題組從事博士後研究期間,與鄂維南院士等人把第一性原理計算的精度的分子動力學的時間和空間尺度都提升了 2-3 個數量級。在 IBM 的 Summit 超級計算機上,實現 1 億原子每天 1-2 納秒的分子動力學模擬。


2020 年底,他加入中國科學院計算技術研究所建立智能科學計算小組。2022 年,課題組的博士生郭卓強與合作者一起,又將分子動力學的計算規模提升至百億原子量級。在超算整機上的測試結果顯示,優化後的代碼可擴展到超級計算機 Fugaku 和 Summit 的全機,相應的計算規模可以擴大 134 倍,達到前所未有的 170 億個原子。1350 萬原子系統表明,計算模擬的速度提高 7 倍,一天能夠模擬 11.2 納秒的物理過程,這相比 2020 年的戈登·貝爾獎的工作又提升 1 到 2 個數量級。



高性能計算方法,將高精度分子動力學模擬規模提升至170億原子 - 天天要聞

圖丨表格模型與基線深度勢能模型相比的準確性(來源:ACM SIGPLAN Annual Symposium Principles and Practice of Parallel Programming)


從實際應用的角度,通過這種計算手段能實現怎樣的效果呢?「這意味着,以前需要在數千核的服務器上模擬一個月以上才能完成任務,通過新的 AI For Science 的方法只需要在現在的筆記本電腦上兩個小時之內完成。」賈偉樂說。


相關論文分別以《通過機器學習將分子動力學的極限從頭開始精確度提高到 1 億個原子》(Pushing the limit of molecular dynamics with ab initio accuracy to 100 million atoms with machine)[1],以及《將具有從頭計算精度的分子動力學極限擴展到 100 億個原子》(Extending the limit of molecular dynamics with ab initio accuracy to 10 billion atoms)為題在發表在International Conference for High Performance Computing和ACM SIGPLAN Annual Symposium Principles and Practice of Parallel Programming[2]。


期待 AI for Science 的工業級產品


AI for Science 有望為基礎科研和產業界帶來新變革。基礎研究方面,AI 驅動的微觀尺度模擬軟件和同類型軟件相比,效率提升了 3 個數量級,並被業內學者廣泛應用。值得關注的是,使用該軟件發展的相關成果陸續發表在 NatureScience、 Physical Review Letters 等期刊。


雖然第一性原理計算的精度非常高,但由於算力成本過於昂貴,一直未被應用在工業界。賈偉樂表示,「現在,我們通過 HPC+AI 將量級大幅度提升後,各領域對該方法表現出強烈的需求。據我所知,國內頂尖的電池研發企業也在嘗試用該方法解決新材料相關的問題。」

第一性原理分子動力學涉及物理、數學、計算機等多領域,賈偉樂將該研究比喻成賽車比賽,他說:「要想贏得賽車比賽,需要賽車手、賽車調校人員及賽車製造人員的共同努力。作為純計算機背景的科研人員,我會從高性能計算角度去解決第一性原理的相關問題,也需要各領域合作者共同努力和創新。」


高性能計算方法,將高精度分子動力學模擬規模提升至170億原子 - 天天要聞

圖丨賈偉樂(前排右三)與課題組成員(來源:賈偉樂)


賈偉樂認為,雖然現在 AI 在圖片生成、人工智能對話等方向已表現出優勢,如果能將 AI 應用在傳統的工業領域,也將會產生實實在在的「創新」。


他說道:「如果我們能夠通過科學智能來設計新材料,比如發現性能更高的電池材料或者高溫高壓材料等,這將開闢新的賽道。目前國內已經存在多個 AI for Science 的初創企業,我期待在十年內可以看到 AI for Science 的工業級產品。」

參考資料:

https://awards.acm.org/bell

1.Weile Jia, Han Wang, Mohan Chen, Denghui Lu, Lin Lin, Roberto Car, Weinan E, and Linfeng Zhang. 2020. Pushing the limit of molecular dynamics with ab initio accuracy to 100 million atoms with machine learning. In Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis (SC '20). IEEE Press, Article 5, 1–14.

2.Zhuoqiang Guo , Denghui Lu, Yujin Yan , Siyu Hu , Rongrong Liu , Guangming Tan, Ninghui Sun, Wanrun Jiang , Lijun Liu , Yixiao Chen, Linfeng Zhang, Mohan Chen , Han Wang , Weile Jia. 2022. Extending the limit of molecular dynamics with ab initio accuracy to 10 billion atoms. Proceedings of the 27th ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming,205–218. https://doi.org/10.1145/3503221.3508425




聲明:本文僅供科研分享,助力科學傳播,不做盈利使用,如有侵權,請聯繫後台刪除。

科學分類資訊推薦

首張嗅覺圖譜問世 或重塑嗅覺形成認知 - 天天要聞

首張嗅覺圖譜問世 或重塑嗅覺形成認知

研究人員以前所未有的細節繪製了小鼠鼻腔中的嗅覺受體分佈圖譜。這一成果顛覆了人們對鼻子如何產生嗅覺的認知。△小鼠鼻腔的顯微鏡橫截面圖像,顯示了鼻腔上皮的解剖結構。圖片來源:Datta Lab4月28日發表於《細胞》的一項研究,揭示了感覺神經元上表達的約1100個嗅覺受體是如何在鼻腔內壁上皮組織中受到嚴格調控的空間位置...
心臟為什麼不會得癌症? - 天天要聞

心臟為什麼不會得癌症?

心臟為什麼不會得癌症?心肌細胞會進行有節律的搏動,並在個體出生後停止增殖,因此,心臟沒有再生能力。近日,意大利的里雅斯特大學醫學院Serena Zacchigna團隊完成的體內癌症模型和離體工程心臟組織實驗表明,心肌細胞搏動所產生的機械力負
暴雨、冰雹要來,廣東天氣明起大反轉!珠海接下來…… - 天天要聞

暴雨、冰雹要來,廣東天氣明起大反轉!珠海接下來……

【來源:珠海發佈】「五一」假期前兩天, 珠海天氣晴好,大家都去哪裡玩了?不過天氣馬上要反轉再反轉了! 廣東明天好天氣要暫時「下線」,局部有大暴雨、小冰雹;珠海明天午後也將有雷雨+10級大風…… 這場雨會持續多久?假期接下來的天氣會怎樣?趕緊
河北衡水:假日邂逅飛行 低空魅力引遊人 - 天天要聞

河北衡水:假日邂逅飛行 低空魅力引遊人

5月2日,位於河北省衡水市的中國航協衡水航空飛行營地,各類飛行表演和低空飛行器展示吸引市民遊客觀賞。中國桃城第四屆「翱翔中國」全國低空無人飛行器大賽暨第二屆京津冀低空飛行器集采會於5月1日至2日在此舉行。圖為遊客近距離參觀飛行器。
可拍原子運動過程 揭秘地下30米的「國之重器」 - 天天要聞

可拍原子運動過程 揭秘地下30米的「國之重器」

來源:央視新聞客戶端坐落在上海張江的硬X射線自由電子激光裝置是「十三五」國家重大科技基礎設施建設規劃優先啟動項目,也是上海(長三角)國際科技創新中心核心空間載體——張江科學城重大科技基礎設施集群的旗艦裝置,是我國實現2035年建成科技強國戰