【洞見·tmt】
最近,由北京通用人工智能研究院、北京大學心理與認知科學學院、北京大學智能學院、北京大學人工智能研究院,以及北京大學武漢人工智能研究院聯合組成的科研團隊取得一項重大突破:「基於引導樹搜索的奧數幾何問題提出與解答系統」。該成果近日發表在國際頂級學術期刊《自然·機器智能》。
研究團隊開發的「通矩模型」(tonggeometry)系統,是具備自主出題(proposing)與自動解題(solving)雙重能力的通用人工智能系統。這一突破標誌着我國科研團隊在自動化推理和具身智能的邏輯核心領域實現關鍵技術自研自控,不僅在性能上對標並超越了以deepmind alphageometry為代表的國際頂尖水平,更在功能多樣性和效率上實現了質的飛躍。
ai在幾何推理中為何如此困難
在ai領域,奧林匹克數學競賽一直被視為衡量機器邏輯思維與空間想像力的「最高殿堂」。其中,平面幾何問題因其獨特的數值精度與空間直覺的結合,被公認為自動化推理的「最後堡壘」。
ai在該領域面臨兩大核心挑戰:一是「組合爆炸」,幾何推理往往需要尋找並添加精妙的輔助線,每增加一個點或圓,搜索空間(即探索模型中所有可能的解決方案)都會呈指數級增長.
二是「高質量數據匱乏」,現有的幾何題目庫規模較小,難以支持大規模模型的訓練。2024年初,deepmind開發的alphageometry雖然在解題能力上取得了重要進展,但其主要依賴於大規模離線合成數據和昂貴的計算資源集群。
與之相比,我國科研團隊自主研發的tonggeometry展現出更具原創性的底層邏輯——它不僅是一個能解題的「優等生」,更是一位能從無到有、創造出具備數學審美價值的題目的「金牌教練」。

神經符號架構下的「數學直覺」
tonggeometry的技術核心在於一套「精密而優雅」的神經符號引導樹搜索架構。這使得ai系統能夠像人類數學家一樣,在邏輯樹的每一個節點上進行系統性探索。
為了解決幾何證明中困擾學界已久的「路徑爆炸」難題,團隊創新性地引入了「規範化表示」技術。這套機制賦予了ai一種「識破偽裝」的能力:在複雜的幾何空間中,同一個命題往往會因為圖形的旋轉、翻轉或縮放而產生無數種表現形式。tonggeometry能夠自動識別併合並這些對稱或同構的拓撲結構,將龐雜的搜索空間壓縮了幾個數量級。
而在ai尋找解題「靈感」的過程中,系統通過價值函數(value function)來模擬人類的數學審美。藉助強化學習技術,系統內置的「價值模型」能實時預判每一條推理路徑的潛力——它不僅判斷結論是否成立,更在乎推導過程是否簡潔、優美。
論文第一作者、北京通用人工智能研究院博士張馳談到,當ai發現一個命題的證明難度顯著高於其構建複雜度時,它便捕捉到了那一抹「直覺性的靈感」。這種「價值引導」讓tonggeometry在海量數據中精準篩選出那些具備奧賽水準的「優雅好題」,實現了從機械計算向智能創造的跨越。
從「暴力計算」到「數學審美」
在性能表現上,tonggeometry展現了國產原創技術的強大生命力。相比deepmind alphageometry需要依賴龐大的算力集群進行訓練和推理,tonggeometry僅需一張普通的國產消費級顯卡,即可在最多38分鐘內,解決近25年來所有的imo幾何難題。這種高效、低功耗、極具數學美感的推理範式。
目前,tonggeometry的原創能力已獲得學術界和數學競賽圈的高度評價。其自主生成的3道幾何新題,已正式入選2024年全國中學生數學聯賽(北京賽區)及美國精英奧賽(ersatz math olympiad)。這是ai原創題目首次進入高規格人類數學競賽,實現了從實驗室研究到真實場景應用的重大跨越。
論文共同通訊作者、北京大學心理與認知科學學院助理教授朱毅鑫表示:「tonggeometry的意義遠超數學競賽本身。它通過『小數據、大任務』的範式轉換,證明了人工智能可以不再單純依賴暴力計算,而是通過理解邏輯底層的對稱性與美感,實現自主的科學發現。這對於未來具身智能在複雜環境下的邏輯決策、自動化定理證明以及個性化教育,都具有深遠的戰略價值。」
此次成果由北京通用人工智能研究院主導,並集結了北京大學多個相關頂尖院系的科研力量,充分體現了我國在通用人工智能基礎研究領域「學-研-產」深度融合的正向研發優勢。(文/王維曦 李政葳)
來源:光明網