比量子化學方法快六個數量級,一種基於絕熱狀態人工神經網絡方法

2022年07月04日19:38:09 科學 1708

編輯 | 蘿蔔皮

光誘導化學過程在自然界中無處不在,並具有廣泛的技術應用。例如,光異構化可以使具有光可切換支架的藥物被光激活。原則上,具有所需光物理特性(如高異構化量子產率)的光開關,可以通過反應模擬的虛擬篩選來識別。

然而在實踐中,這些模擬很少用於篩選,因為它們需要數百條軌跡和昂貴的量子化學方法來解釋非絕熱激發態效應。

在這裡,哈佛大學麻省理工學院的研究人員,開發了一種基於絕熱狀態的絕熱人工神經網絡(DANN),用於加速對偶氮苯衍生物及此類分子的模擬。該網絡比用於訓練的量子化學方法快六個數量級。DANN 可轉移到訓練集之外的偶氮苯分子,預測與實驗相關的未見物種的量子產率。

研究人員使用該模型虛擬篩選 3100 個假設分子,並識別具有高預測量子產率的「新物種」。使用高精度非絕熱動力學確認模型預測。其結果為快速準確地虛擬篩選光活性化合物鋪平了道路。

該研究以「Excited state non-adiabatic dynamics of large photoswitchable molecules using a chemically transferable machine learning potential」為題,於 2022 年 6 月 15 日發佈在《Nature Communications》。

比量子化學方法快六個數量級,一種基於絕熱狀態人工神經網絡方法 - 天天要聞

光是操縱分子系統的強大工具。它可以以高空間、光譜和時間精度進行控制,以促進各種過程,包括能量轉移、分子間反應和光異構化。這些過程用於合成、能量存儲、顯示技術、生物成像、診斷和醫學等多種領域。

例如,光活性藥物是可光切換的化合物,其生物活性可以通過光誘導異構化來切換。對生物活性的精確時空控制允許以高劑量遞送光活性藥物,同時具有最小的脫靶活性和副作用。這種療法是治療癌症、神經退行性疾病、細菌感染、糖尿病和失明的有希望的途徑。

理論在解釋和預測光化學方面起着關鍵作用,因為從熱激活基態過程中學到的經驗啟發式,通常不適用於激發態。基於量子力學的計算機模擬,可以在預測實驗觀測值方面達到令人印象深刻的準確性。這些包括光可切換化合物的異構化效率和吸收光譜,這是設計光活性藥物的關鍵。

然而,光化學中的從頭算方法受到其計算成本的嚴重限制。為了收集一個分子的有意義的統計數據,需要進行數百次重複模擬,每個模擬都涉及以亞飛秒時間步長串聯執行的數千次電子結構計算。單獨的量子化學計算要求特別高,需要激發態梯度和多參考效應的一些處理。在某些情況下,每個時間步都需要基態梯度和激發態梯度。使用從頭算方法計算數十或數百個分子的光化學性質是不切實際的,並且光動力學模擬尚未用於大規模虛擬篩選。

其中最準確和最昂貴的電子結構方法是多參考擾動技術,但它們的成本和手動主動空間選擇的要求限制了它們在虛擬篩選中的使用。

多年來,光化學界為了克服這兩個障礙,已經開發了一些令人振奮的方法。例如,縮減縮放技術和圖形處理單元可以顯著加速多參考計算。密度矩陣重整化組(DMRG)和多參考密度泛函理論(DFT)方法擴大了可以高精度處理的系統的規模。DMRG 還被用於自動選擇多參考方法的活動空間。以及不太準確,但更實惠的黑盒方法,包括自旋翻轉時間相關 DFT (SF-TDDFT) 和孔洞 Tamm-Dancoff DFT 等。

儘管有這些發展,非絕熱模擬的成本仍然很高。即使是相對實惠的 SF-TDDFT,對於虛擬篩選來說也是非常昂貴的。半經驗方法是目前唯一可負擔的大規模篩查方法。它們在許多系統中提供了定性正確的結果,但最終受限於它們的近似值,平均能量誤差為 15 kcal/mol。

另一種方法是使用數據驅動模型代替量子化學(QC)計算。在量子化學數據上訓練的機器學習(ML)模型現在可以以亞化學精度常規預測基態能量和力,並且只需幾毫秒即可做出預測。這些模型已成功用於各種基態模擬。它們還被用於加速許多模型系統中的非絕熱模擬。

然而,激發態 ML 尚未為數百個實際大小的分子提供負擔得起的光動力學,這是光藥理學預測模擬的最終目標。此外,尚未開發出可轉移到不同化合物的激發態原子間勢。因此,他們需要對每個「新物種」進行數千次 QC 計算來作為訓練數據。

在這裡,哈佛麻省理工的研究人員,在使用 ML 進行負擔得起的大規模光化學模擬和虛擬篩選方面取得了重大進展。為了開發可轉移的潛力,他們專註於來自同一化學家族的分子,研究偶氮苯的衍生物,一種原型光開關。

比量子化學方法快六個數量級,一種基於絕熱狀態人工神經網絡方法 - 天天要聞

圖示:偶氮苯衍生物中勢能表面的描述。(來源:論文)

這裡研究的衍生物包含多達 100 個原子,使其成為迄今為止符合激發態 ML 勢的最大系統。結合等變神經網絡和基於物理的絕熱模型,以及化學空間組合探索產生的數據,以及通過主動學習進行的配置採樣,他們生成了一個模型 DANN,該模型可轉移應用到大型的、看不見的偶氮苯衍生物。

比量子化學方法快六個數量級,一種基於絕熱狀態人工神經網絡方法 - 天天要聞

圖示:神經網絡架構和主動學習循環。(來源:論文)

這產生了超過六個數量級的計算節省。未知物種的預測異構化量子產率與實驗值相關。該模型用於預測 3100 多種假設物種的量子產率,揭示了具有高順式-反式和反式-順式量子產率的稀有分子。

比量子化學方法快六個數量級,一種基於絕熱狀態人工神經網絡方法 - 天天要聞

圖示:DANN-NAMD 的速度和準確性。(來源:論文)

DANN 模型顯示了偶氮苯衍生物之間的高精度和可轉移性。一個限制是,看不見的物種包含在一定程度上存在於訓練集中的功能組。對於更高代表性的功能組,模型性能通常更高,儘管一些組的代表性很高但難以擬合,而另一些組的代表性較弱且擬合良好。

此外,如果沒有額外的訓練數據,該模型不能應用於其他化學家族。比如,它大大高估了許多反式衍生物的激發態壽命。

另一方面,半經驗方法在各種化學物質中提供了定性正確的預測,但無法與 DANN 的域內準確性相匹配,並且無法通過更多參考數據進行改進。如在 OrbNet 模型中所做的那樣,從半經驗計算中添加特徵可能在未來證明是有用的。考慮到非局部效應和自旋態的最新發展提高了神經網絡的可轉移性,也可能對激發態有益。該模型可以通過高精度多參考計算、溶劑效應和包含明亮的 S2 狀態來進一步改進。

特別是自旋完全方法的使用至關重要,因為自旋污染阻礙了對基礎化合物模型的微調。它也可能總體上影響了 DANN 模型的準確性。因此,自旋完成、負擔得起的替代品特別令人感興趣。主動學習可以通過具有對抗性不確定性攻擊的可微採樣來加速,這將改善激發態的壽命。遷移學習也可用於提高特定分子的性能。只需要少量的從頭計算來微調單個物種的模型。

Diabatization 也可能被證明對反應性基態有用。反應勢壘通常可以理解為從一種絕熱狀態到另一種絕熱狀態的轉變。非絕熱基礎可以使反應表面更容易適應神經網絡。

比量子化學方法快六個數量級,一種基於絕熱狀態人工神經網絡方法 - 天天要聞

圖示:虛擬篩選的結果。(來源:論文)

總之,研究人員引入了一種非絕熱多態神經網絡潛力,在 SF-TDDFT BHHLYP/6-31G* 理論水平上對超過 630,000 個幾何形狀進行了訓練,涵蓋了超過 8000 個獨特的偶氮苯分子。他們使用 DANN-NAMD 預測了訓練集外衍生物的異構化量子產率,並將結果與實驗相關聯。

該團隊還確定了幾種具有高量子產率、紅移激發能量和反轉穩定性的假設化合物。訓練數據的網絡架構、非分解方法以及化學和配置多樣性使模型能夠產生強大且可轉移的潛力。該模型可以現成地應用於新分子,產生的結果近似於 SF-TDDFT 的結果,計算成本降低了幾個數量級。

論文鏈接:https://www.nature.com/articles/s41467-022-30999-w

科學分類資訊推薦

量子力學如此詭異,是不是意味着我們的人生毫無意義? - 天天要聞

量子力學如此詭異,是不是意味着我們的人生毫無意義?

量子力學,這門描述微觀粒子行為的物理學分支,以其獨特的理論和實驗結果,顛覆了人們對物質世界傳統認知的局限。量子力學中的疊加態和糾纏態等現象,以其超越日常經驗的詭異特性,引起了廣泛的關注和討論。不僅如此,這些現象在哲學層面也引發了深遠的思考,
明天,人工增雨! - 天天要聞

明天,人工增雨!

經歷了連續幾天的高溫終於雨要來啦~就在剛剛徐州氣象發佈人工增雨作業公告將於6月21日上午到6月21日夜間擇機開展人工增雨作業具體情況跟着小編一起來了解一下!來源丨徐州發佈、徐州氣象一審丨蘋果二審丨李璇三審丨仝勛監製丨劉礫總監製丨魯曉波「無線睢寧」商務合作:13815355808(微信同號)點和擴散一下...
上市公司3萬噸鈉電項目獲批 - 天天要聞

上市公司3萬噸鈉電項目獲批

上市公司3萬噸鈉電項目獲批作者:劉澤排版:點點起點鈉電關注到,6月19日,湖北虹潤高科新材料有限公司申報的「湖北虹潤鈉離子電池材料項目」獲葛店經濟技術開發區管理委員會批複。據了解,該項目總投資3.
武大博士畢業生高晟俊將前往極地科考站工作:能忍受寒冷和孤獨 - 天天要聞

武大博士畢業生高晟俊將前往極地科考站工作:能忍受寒冷和孤獨

6月20日,武漢大學2024年畢業典禮在九一二操場舉行。值得注意的是,儀式前,測繪學院博士畢業生高晟俊獲得了學校專門為其定製的學位服,在校徽下綉上他的武大學號。 高晟俊。圖/武漢大學微博 同日,高晟俊告訴九派新聞,他今年35歲,即將前往極地科考站工作,延續科考生活。 他對極地測繪的興趣源於武漢大學中國南極測...
人這輩子,最頂級的認知:要有「祛魅」思維 - 天天要聞

人這輩子,最頂級的認知:要有「祛魅」思維

01近些年,網絡上出現了一個熱詞,祛魅。百度百科的解釋是,對於科學和知識的神秘性、神聖性、魅惑力的消解。說得直白一點,就是站在客觀、理性的角度思考問題。就拿學歷來說,有人提出了一個觀點,要對學歷祛魅。意思是,我們要正確看待學歷,而不能認為學
擁抱「科學的春天」 大灣區躋身全球頂尖科技集群 - 天天要聞

擁抱「科學的春天」 大灣區躋身全球頂尖科技集群

伴隨着新質生產力成為各界的熱詞,一個新的「科學春天」正在到來。在粵港澳大灣區着力邁向國際一流灣區和世界級城市群的過程中,創科已然成為最重要的賦能者之一。在「機遇灣區」走訪活動中,創科也成為政產學研都無法繞開的一個關鍵詞。
植物如何抵抗和適應氣候變化?科學家最新研究揭秘機制 - 天天要聞

植物如何抵抗和適應氣候變化?科學家最新研究揭秘機制

中新網北京6月19日電(記者 孫自法)在全球氣候變化背景下,地球上的植物是如何抵抗和適應的,長期以來頗受學界關注和持續開展研究。  中國科學院青藏高原研究所6月19日向媒體發佈信息說,該所科研團隊和美國高校等科研同行最新合作研究發現,儘管氣候變暖導致植物生長季節延長,但植物仍能保持葉片生長和衰老時間的穩定平...
為你喝彩|風雲歲月:張鵬與中國氣象衛星的精準探索 - 天天要聞

為你喝彩|風雲歲月:張鵬與中國氣象衛星的精準探索

自1970年國家開始上馬風雲衛星工程,至2023年風雲三號07星的輝煌升空,中國氣象衛星的發展歷程已跨越了近半個世紀的風雨兼程。50多年來,風雲氣象衛星不僅見證了中國氣象預報技術的飛躍,也從早期的粗略預測逐步邁向了今日的精準預報。這一變革的