IT之家 5 月 15 日消息,科技媒體 marktechpost 昨日(5 月 14 日)發布博文,報道稱谷歌 DeepMind 團隊推出革命性編碼工具 AlphaEvolve,基於 Gemini 2.0 大語言模型(LLMs),自動化演算法發現過程,解決傳統演算法設計和科學發現中依賴專家直覺和手動迭代的局限性。
AlphaEvolve 結合進化計算和自動化評估,自主生成、改進演算法代碼。不同於普通代碼助手,AlphaEvolve 能通過結構化反饋循環不斷提出、評估和優化候選方案,逐步逼近最優解,其系統架構支持非同步分散式運行,靈活應對從構造函數到整個優化流程的各類問題。
AlphaEvolve 的核心在於其多組件協同工作:提示構建模塊基於歷史高分方案生成輸入;Gemini 2.0 Pro 和 Flash 混合模型兼顧質量與速度;評估框架通過自定義評分函數量化演算法表現;進化循環則利用歷史程序資料庫平衡探索與利用。
在數學研究中,AlphaEvolve 在 50 多個公開數學問題上表現出色,約 75% 的案例中重現了已知解,20% 的案例中發現了更優解。例如,在「親吻數問題」(kissing number problem)中,它為 11 維情況找到了一種新配置,包含 593 個球體,刷新了下限記錄。
IT之家註:接吻數問題(Kissing Number Problem)是一個幾何學中的經典問題,旨在研究在 n 維歐幾里得空間中,有多少個相同大小的球體可以同時接觸一個中心球體,而彼此之間不重疊。這個最大數量被稱為 n 維的「接吻數」。
此外,它還改進了 4x4 複雜矩陣乘法演算法,僅用 48 次標量乘法完成計算,超越了 1969 年的經典 Strassen 方法,展現出在演算法數學領域的創新能力。
在通用性方面,AlphaEvolve 的表現也非常值得關注。在 Erdős 最小重疊問題中,75% 的案例匹配最先進成果,20% 甚至超越現有方案。在硬體設計和編譯器優化中,它為 TPU 電路和 FlashAttention 執行分別帶來顯著性能提升。
AlphaEvolve 最適合可演算法化表達並自動評估的問題,DeepMind 認為其在材料研究、藥物開發和工業流程優化等領域具有廣闊前景。
該系統目前對需現實實驗驗證的問題效果有限,但 DeepMind 正在探索結合語言模型進行初步定性評估的混合方法。
相較於 2023 年推出的 FunSearch 系統,AlphaEvolve 不僅能解決數學問題,還能創建更廣泛實用的完整演算法,標誌著自動化演算法發現的新里程碑。