杜克大學新突破,機器智能首次達到科學家級別的複雜問題解決能力

2025年10月24日19:03:06 科學 1454

杜克大學新突破,機器智能首次達到科學家級別的複雜問題解決能力 - 天天要聞


科學研究的自動化時代正在加速到來。杜克大學的工程師團隊成功構建了一套AI代理系統,能夠像訓練有素的科學家一樣獨立解決複雜的設計問題。這一突破性進展不僅展示了人工智慧在科學研究領域的巨大潛力,更預示著科學發現過程可能面臨根本性變革。該系統在處理不適定逆向設計問題時展現出與人類專家相當的能力,為AI全面參與科學研究開闢了新的可能性。

傳統的科學研究往往依賴研究人員的經驗、直覺和大量的試錯過程。特別是在面對不適定逆向設計問題時,科學家需要從已知的目標結果出發,在無數可能的解決方案中尋找最優路徑,而這個過程往往缺乏明確的指導原則。杜克大學電氣與計算機工程系的Willie Padilla教授正是在這樣的背景下開始思考AI自動化科學研究的可能性。

Padilla教授回憶起幾年前一位同事描述的具有挑戰性的化學反應建模問題,雖然他知道這是標準深度學習AI程序可以解決的問題,但由於時間限制無法親自參與。這個經歷促使他思考:如果能夠創建一組能夠自主解決此類問題的AI代理,將大大加快許多領域的進步速度。

多代理協作的科學發現模式

杜克大學新突破,機器智能首次達到科學家級別的複雜問題解決能力 - 天天要聞

圖片來源:ACS Photonics (2025)。DOI:10.1021/acsphotonics.5c01514

研究團隊開發的AI代理系統採用了分工協作的工作模式,每個大語言模型代理都被分配特定的任務職責。其中一個代理負責確保系統擁有所需的所有數據;另一個代理根據數千個現有示例從頭開始編寫深度神經網路代碼;還有一個代理專門檢查工作的準確性,並將結果傳遞給負責運行神經伴隨方法的代理。

這種多代理協作模式的核心在於一個總體管理LLM,它負責協調各個代理之間的溝通和工作流程。當系統在尋找解決方案的過程中遇到困難時,它能夠自主判斷是否需要更多數據點來開發更好的模型,或者當前模型是否在實現預期結果方面取得了足夠進展。

項目負責人、Padilla實驗室博士生Dary Lu強調了系統自我評估能力的重要性。他指出,系統會明確告知用戶是否遇到收益遞減需要生成更多數據,或者對錯誤率的下降感到滿意需要繼續迭代。這種能力類似於科學家需要隨時間發展的直覺判斷,也是整個系統中最難編程實現的部分。

在具體應用中,研究團隊選擇了超材料電磁響應設計作為測試案例。超材料是由許多單獨工程特徵組成的合成材料,具有眾多設計參數,這些特徵共同產生自然界中不存在的特性。設計能夠產生特定電磁響應的介電超材料正是一個典型的不適定逆向設計問題,需要在龐大的參數空間中尋找最優解。

人機能力對比的深度分析

為了驗證AI代理系統的實際能力,研究團隊讓其解決實驗室此前已經解決的同類不適定逆向設計問題。測試結果顯示了AI系統與人類專家之間既有差距也有相似之處的複雜圖景。

在數千次試驗的平均表現方面,AI系統確實不如此前的博士生研究員。這一結果反映了人類專家在處理複雜問題時的經驗優勢和直覺判斷能力。經過多年訓練的研究人員能夠更好地把握問題的整體脈絡,在解決方案的搜索過程中展現出更高的穩定性和一致性。

然而,AI系統的最佳解決方案卻非常接近人類專家的水平。這一發現具有重要意義,因為在實際應用中,往往只需要一個優秀的設計方案就足以滿足需求。AI系統雖然在平均表現上存在差距,但其峰值能力已經達到了與人類專家相當的水平。

這種表現特點反映了AI系統與人類思維方式的根本差異。人類專家依靠積累的經驗和直覺進行推理,能夠在大多數情況下保持相對穩定的表現水平。而AI系統則更多地依賴於大量的計算嘗試,通過窮盡式的搜索來尋找最優解,因此在個別情況下能夠找到極為優秀的解決方案。

科學研究自動化的深遠影響

Padilla教授認為,這一演示表明經過深思熟慮和徹底編程的代理系統能夠解決最複雜的問題,而且這種方法可以應用於計算電磁學之外的許多其他領域。這種通用性使得AI代理系統有望成為推動科學發現的重要工具。

Lu博士生指出,當前正處於此類系統能夠提高高技能工作者生產力的關鍵節點。能夠構建和運用這些代理系統將成為進入就業市場的寶貴技能。這一觀點反映了AI技術對傳統科研工作模式的深刻影響,未來的科研人員需要掌握與AI系統協作的能力。

從更宏觀的角度來看,這項研究成果預示著科學研究方法論的根本性變革。傳統的科學研究高度依賴個人的創造力、直覺和經驗,而AI代理系統的出現使得科學發現過程的某些環節可以實現自動化。這不僅能夠大幅提高研究效率,還可能發現人類科學家難以察覺的新模式和關聯。

Padilla教授對AI系統的未來發展前景充滿信心。他認為,擁有能夠進行自主研究並改進自身方法的AI系統將開始在推動人類知識發展方面取得重大進展。在更大規模和更快時間尺度上,這些系統很快將能夠產生真正新穎的研究結果。

然而,這種技術進步也帶來了新的挑戰和思考。AI系統在科學研究中的廣泛應用可能會改變科學家的角色定位,從直接進行研究轉向設計和監督AI系統的工作。這種變化要求科學界重新思考人才培養模式和研究評價體系。

此外,AI生成的科學發現在可重現性、可解釋性等方面也面臨新的挑戰。如何確保AI系統的研究結果符合科學研究的嚴格標準,如何在AI輔助下維持科學研究的創新性和原創性,這些都是需要深入探討的重要問題。

儘管存在這些挑戰,AI代理系統在科學研究中展現的潛力無疑是巨大的。隨著技術的不斷完善和應用領域的持續擴展,這種新的科學研究模式有望為人類知識的增長帶來前所未有的加速度。

科學分類資訊推薦

首張嗅覺圖譜問世 或重塑嗅覺形成認知 - 天天要聞

首張嗅覺圖譜問世 或重塑嗅覺形成認知

研究人員以前所未有的細節繪製了小鼠鼻腔中的嗅覺受體分布圖譜。這一成果顛覆了人們對鼻子如何產生嗅覺的認知。△小鼠鼻腔的顯微鏡橫截面圖像,顯示了鼻腔上皮的解剖結構。圖片來源:Datta Lab4月28日發表於《細胞》的一項研究,揭示了感覺神經元上表達的約1100個嗅覺受體是如何在鼻腔內壁上皮組織中受到嚴格調控的空間位置...
心臟為什麼不會得癌症? - 天天要聞

心臟為什麼不會得癌症?

心臟為什麼不會得癌症?心肌細胞會進行有節律的搏動,並在個體出生後停止增殖,因此,心臟沒有再生能力。近日,義大利的里雅斯特大學醫學院Serena Zacchigna團隊完成的體內癌症模型和離體工程心臟組織實驗表明,心肌細胞搏動所產生的機械力負
暴雨、冰雹要來,廣東天氣明起大反轉!珠海接下來…… - 天天要聞

暴雨、冰雹要來,廣東天氣明起大反轉!珠海接下來……

【來源:珠海發布】「五一」假期前兩天, 珠海天氣晴好,大家都去哪裡玩了?不過天氣馬上要反轉再反轉了! 廣東明天好天氣要暫時「下線」,局部有大暴雨、小冰雹;珠海明天午後也將有雷雨+10級大風…… 這場雨會持續多久?假期接下來的天氣會怎樣?趕緊
河北衡水:假日邂逅飛行 低空魅力引遊人 - 天天要聞

河北衡水:假日邂逅飛行 低空魅力引遊人

5月2日,位於河北省衡水市的中國航協衡水航空飛行營地,各類飛行表演和低空飛行器展示吸引市民遊客觀賞。中國桃城第四屆「翱翔中國」全國低空無人飛行器大賽暨第二屆京津冀低空飛行器集采會於5月1日至2日在此舉行。圖為遊客近距離參觀飛行器。
可拍原子運動過程 揭秘地下30米的「國之重器」 - 天天要聞

可拍原子運動過程 揭秘地下30米的「國之重器」

來源:央視新聞客戶端坐落在上海張江的硬X射線自由電子激光裝置是「十三五」國家重大科技基礎設施建設規劃優先啟動項目,也是上海(長三角)國際科技創新中心核心空間載體——張江科學城重大科技基礎設施集群的旗艦裝置,是我國實現2035年建成科技強國戰