成功率提高7倍！新方法一句話就能讓AI秒出分子設計+合成步驟

2025年04月12日13:32:13 科技 1046

（來源：MIT News）

尋找具備研發新藥物和新材料所需特性分子的過程既繁瑣又昂貴，需要耗費大量計算資源，研究人員往往要花費數月時間，才能在浩如煙海的候選分子中篩選出數量有限的目標分子。

像 ChatGPT 這樣的大語言模型有望簡化這一流程，然而，讓大語言模型像理解句子中的單詞那樣理解和推理構成分子的原子與化學鍵卻存在技術壁壘。

近期，麻省理工學院和 MIT-IBM 沃森人工智能實驗室的研究人員開發出一種頗具前景的方法，利用基於圖的模型（Graph-based Model）來增強大語言模型（這些模型專為生成和預測分子結構而設計）。

該方法通過基礎大語言模型解析用戶自然語言需求後，能在分子設計、原理闡釋及合成路線規劃等環節智能切換 AI 模塊。

它將文本、圖形和合成步驟生成交織在一起，把單詞、圖形和反應整合為一個通用詞彙表，供大語言模型使用，實現多模態信息無縫銜接。

與現有的基於大語言模型的方法相比，這種多模態技術生成的分子更符合用戶設定的規格，有效合成方案成功率從 5% 提升至 35%。

該方法的效果優於規模比它大 10 倍以上、僅使用文本表示來設計分子和合成路線的大語言模型，這表明多模態融合是新系統成功的關鍵。

「這有望成為一個『端到端』的解決方案，能實現分子設計與合成全過程的自動化。如果大語言模型能在幾秒鐘內給出答案，將為製藥公司節省大量時間。」麻省理工學院研究生、該技術論文的合作者 Michael Sun 說道。

這項研究成果將在國際學習表徵會議上發表。論文的合作者還包括聖母大學研究生 Gang Liu、麻省理工學院電氣工程與計算機科學教授 Wojciech Matusik，以及 MIT-IBM 沃森人工智能實驗室資深科學家 Jie Chen。這項研究部分由美國國家科學基金會、海軍研究辦公室以及 MIT-IBM 沃森人工智能實驗室資助。

優勢互補

大型語言模型並非為理解化學的微妙之處而設計，這也是它們難以進行逆向分子設計的原因之一。逆向分子設計是指識別具有特定功能或特性的分子結構的過程。

大語言模型將文本轉換為一種名為標記的表示形式，用於按順序預測句子中的下一個單詞。但分子是由原子和化學鍵組成的「圖形結構」，不存在特定順序，這使得它們很難編碼為順序文本。

另一方面，基於圖的模型將原子和分子鍵表示為圖形中相互連接的節點和邊。儘管這些模型在逆向分子設計中應用廣泛，但它們需要複雜的輸入，無法理解自然語言，且生成的結果可能難以解釋。

麻省理工學院的研究人員將大語言模型與基於圖的模型整合到一個統一框架中，實現了優勢互補。

Llamole（Large Language Model for Molecule Discovery，分子發現大型語言模型）利用基礎大語言模型作為「智能調度員」，理解用戶的查詢，即用戶用通俗語言對具有特定屬性分子的需求。

例如，用戶在尋找一種分子量為 209、具有特定鍵特性，且能穿透血腦屏障並抑制 HIV 的分子。

當大語言模型響應用戶查詢預測文本時，系統會通過獨特的「觸發令牌」機制，在三大功能模塊間智能切換：1、結構生成模塊（基於圖擴散模型，根據輸入條件構建分子骨架）；2、語義轉換模塊（通過圖神經網絡將分子結構重新編碼為大語言模型可理解的詞元）；3、合成規劃模塊（根據中間體結構預測反應路徑，逆向推導從基礎原料到目標分子的完整合成方案）。

「這樣做的精妙之處在於模塊間的信息閉環，大語言模型在激活特定模塊前生成的所有內容，都會輸入到該模塊中。該模塊會以與之前一致的方式進行工作。」Michael Sun 說道，「同樣，每個模塊的輸出都會經過編碼，並反饋到大語言模型的生成過程中，這樣大語言模型就能了解每個模塊的作用，並繼續根據這些數據預測標記。」