這次真的不一樣，數學正在經歷歷史上最大的變革

2026年03月31日21:03:09 科技 1879

人工智能如今可以生成證明、探索思想並解決問題。剩下的工作是決定哪些問題值得關注。

一名研究生坐在屏幕前，盯着一個通常需要數小時才能解決的問題。這不是一個瑣碎的問題，但也不是一個重大的開放性問題，而是介於兩者之間的那種練習，測試你是否真正理解了這門學科。

學生沒有從紙上開始，而是輸入了一個提示。

幾秒鐘後，系統生成了一個大綱。它提出了一種策略，介紹了一個引理，勾畫出了證明的框架。部分內容看起來是正確的，部分內容不太清楚，有一步似乎很可疑。

學生現在面臨的是一個不同的任務。不是“從頭解決問題”，而是“決定該相信什麼”。

他們檢查論證，重寫其中的部分，測試小案例，再次詢問系統，調整提示。這個過程變成了一個循環，生成、驗證、修正。

一個小時後，問題解決了。

但這個經歷與以往不同。工作並非從零開始，也沒有按部就班進行。它既不是完全由人類完成的，也不是完全由機器完成的。

數學思維的結構發生了變化。

變化正在發生

幾個世紀以來，數學一直是人類思想最清晰的表達之一。它是證明、嚴謹、抽象和耐心推理的學科。數學家可以花上幾個月，甚至幾年，逐步推進一個問題，仔細構建論證，每一步都能經得起審查。

這種畫面開始發生變化。不是因為數學變得不再嚴謹，也不是因為證明不再重要，更不是因為人類智慧突然變得無關緊要。

它在變化，因為人工智能進入了這一領域，不僅僅作為一個快速計算器或符號助手，而是作為一個系統，至少在某些有限和不均勻的方式上，現在能夠參與到數學推理的工作中。

如今，AI系統可以解決高難度的競賽問題，協助證明，形式化論證，生成實驗代碼，探索龐大的例子空間，發現隱藏的模式。

圍繞這些進展，仍然有很多炒作，也有很多誤解。但在噪音的背後，真正的變化正在發生。數學進入了一個新時代。

數學曾經的模樣

我們許多人心中都有一個傳統的數學形象。一個人獨自坐着，手拿紙張、粉筆，或許是黑板。他們深思熟慮，測試自己的想法。大多數想法失敗，少數存活下來。最終，經過艱苦的努力，一個證明出現了。

這個畫面並非虛假，它仍然描述了大量的數學工作。但它一直是不完整的。

數學從來不僅僅是孤獨的天才。它還依賴於符號、書籍、通信、研討會、計算、例子、圖表、猜想、失敗的嘗試，以及越來越多的軟件。從這個意義上來說，數學早就被工具塑造過了。好的工具不會取代思考，它們會重塑思考。

計算機做到了這一點。符號代數系統做到了這一點。數值計算做到了這一點。證明助手也做到了這一點。

而如今，AI以不同的規模做到了這一點。

改變對話的時刻

2024年，谷歌DeepMind開發的一個AI系統達到了一個里程碑，這在不久前看起來似乎不現實。

這個名為AlphaProof的系統能夠解決國際數學奧林匹克（IMO）銀獎得主水平的問題，IMO是數學中最具挑戰性的競賽之一。這些題目需要多步驟的推理、創造力，以及能夠將不同領域的想法結合起來的能力。這個AI系統解決了2024年IMO中的六道題中的四道，總得分28分，距離金獎門檻僅差1分。

數十年來，達到這個水平被視為非凡人類才華的標誌。

這次的不同之處在於，AI不僅僅給出了答案。它提供了有效的數學論證，形式上可以逐步檢查。結果不是猜測，也不是模式匹配。它更接近於一個證明。

這並不意味着該系統以人類的方式理解數學。但它顯示了AI已經跨越了一個門檻。它不再局限於計算，它現在至少在某些情況下，可以在數學推理的結構內操作。

這次不同

計算機已經協助數學家數十年，執行比人類更快的計算，測試大量的案例，檢查冗長的推理鏈。四色定理的證明之所以成名，是因為它依賴於計算機對成千上萬種配置的驗證。這些案例的數量龐大，以至於沒有人類能夠手工檢查它們，計算機代替了人類完成這項工作。

然而，新一代AI系統遠不止於算術或符號操作。它們可以閱讀數學文本，生成證明草圖，通過代碼探索例子，搜索文獻，提出類似於實際研究的推理路徑。

它們仍然不完全可靠，仍然會產生自信卻錯誤的結果。但它們不再局外，它們已經是數學的一部分，儘管不是處於核心位置。這就是為什麼數學家既感到興奮又感到不安的原因。

變化的速度

部分原因在於速度。就在不久前，人們會指出AI的初級錯誤，認為它在數學上的能力本質上是弱的。一個模型可能犯低級的算術錯誤，混淆符號，或者產生虛假的論證。這種情況曾經發生過，而且仍然會發生。但現在，如果我們只關注這些錯誤，就會錯失更大的圖景。進展如此迅速，甚至兩年前的例子現在看起來都已經過時了。

真正的問題在於，AI開始自動化某些類型的專家級例行工作。這並不意味着AI突然能夠按需生成深刻的概念性革命。它意味着AI越來越能夠執行以前需要有知識的專家來完成的任務：檢查案例，應用已知技術，生成相關的計算，提出可能的證明策略，或執行那些雖然真實但不特別具有創造性的技術步驟。

換句話說，AI正在進入一個以前完全屬於訓練有素的專家的數學領域。這就是為什麼反應如此強烈。因為一旦工具進入了某個職業的認知核心，人們就會立刻開始質疑這個職業本身是否正在被削弱。

明確表達的恐懼

這種恐懼有許多表現形式。有些人說，數學將主要變成提出問題，而AI做工作。還有人擔心研究會消失，學術界將主要集中在教學上。更極端的觀點認為，AI是對數學家們的生死威脅。

這些擔憂很容易被忽視，但它們並非無關緊要。如果機器能夠解決那些曾經需要多年訓練的問題，那麼這種訓練的價值將何在？如果它能生成證明，測試想法，探索案例，比任何人都快，那麼剩下的獨特人類工作是什麼？

這些問題超出了職業範圍。對許多人來說，數學不僅僅是一組技巧。它是思維的方式，是意義的源泉。數學可能部分被機器取代的可能性，不僅僅是令人不安的，它是非常個人化的。

所以，這種恐懼並不是不理智的，但它並不完全。

陶哲軒的觀點

在這個話題上，最有深度的聲音之一是陶哲軒，他以冷靜和理性的態度來看待這件事。他既沒有輕視AI，也沒有浪漫化它。他的一個關鍵區分是“廣度”與“深度”之間的區別。

陶哲軒（1975年出生），菲爾茲獎得主，是我們這個時代最具影響力的數學家之一。

人類，尤其是數學專家，在深度上更具優勢。他們堅持處理一個困難的想法，精鍊它，構建直覺，逐步構建論證。相比之下，AI系統通常在廣度上更強。它們可以迅速探索許多方向，測試變體，掃描大範圍，即使大多數嘗試最終都沒有結果。

如果數學是一個景觀，AI可以快速勘測，映射許多可能的路徑。而人類數學家則是跟隨一條路徑走到底，理解它的走向和意義。

這種區別在進展的方式上得以體現。人類的進步往往是漸進的，隨着時間的推移構建出結構。AI則傾向於跳躍。有時它能夠找到正確的路徑，有時它會生成看起來合理的片段，但缺乏連貫性。它還無法像人類合作者一樣，可靠地積累理解。

陶哲軒的觀點並不是AI很弱。在某些方面，AI的確很強。關鍵在於它的強項不同。

一種新的工作方式

如果AI在廣度上特彆強，那麼數學可能開始在結構上發生變化。

AI系統可以掃描大量問題集，測試已知技術，生成例子，探索變化，編寫代碼，提出可能的路徑，這些都遠遠超出了人類的能力範圍。然後，研究人員可以在需要解釋的地方介入，在想法必須被判斷、精鍊和連接成有意義的東西時進行干預。

這一點已經開始發生。現在的問題不再主要是生成想法，而是在隨之而來的工作中處理它們。問題變成了信息過載。我們如何在大量看似可信但不可靠的輸出中，發現真正的進展？我們如何區分深層結構與表面模式？

瓶頸已經轉移。挑戰不再是生成想法，而是識別哪些才是重要的。

當證明不再足夠時

這裡還有一個張力。AI系統很擅長看起來是正確的，但這並不等同於它們真的正確。

在數學中，這種區別非常重要。錯誤的證明並不是接近成功，它就是錯誤的。當前AI特別棘手的地方在於，它的錯誤往往不那麼顯眼。一個證明可能看起來很完美，使用了正確的術語，但仍然包含一個微妙但致命的錯誤。

人類學生也會犯錯，但錯誤的類型不同。AI的錯誤往往是結構上令人信服的，但邏輯上卻空洞，這使得它們很難快速被發現。

這也是像Lean這樣的正式證明系統變得尤為重要的原因。Lean是一個證明助手軟件系統，在這個系統中，數學命題和證明被用精確的形式語言書寫，這樣每一個邏輯步驟都可以被計算機檢查。它提供了一種將生成與驗證結合的方式：讓AI提出，讓系統進行檢查。

正式化如何改變證明

這一點需要特彆強調，因為它可能看起來比較技術性，但它並不只是技術性的問題。

傳統的數學寫作留下了許多隱含的部分。專家們知道哪些步驟是常規的，哪些是細膩的，哪些才是做實工作的部分。正式證明系統迫使每一個步驟都以顯式的形式出現。這可能感覺繁瑣，但它也改變了可見的東西。一旦證明被完全正式化，就可以以一種普通的表述往往無法揭示的方式檢查其內部結構。

這開啟了一個有趣的可能性。未來的數學家可能不僅僅是證明定理。他們可能還需要分析由機器生成的證明，識別真正的新引理，提取其中的基本策略，並將整個論證重新編寫成一個更清晰的概念框架。從這個意義上說，可能會出現一個專門的數學工作層，致力於壓縮、解釋和概念上的提煉。

一個巨大的證明並不等同於理解。但一旦證明存在，就可以進行研究、改進、重組，也許最終轉變成某種優雅的形式。

AI會發現真正的新數學嗎？

這是每個人都會問的問題，誠實的答案是我們還不知道。

應用已知技巧的規模與創造真正的新數學之間是有區別的。許多問題可能僅僅是因為沒人嘗試過正確的現有方法組合而得到解決。如果AI能夠高效地探索文獻，它可能會解決許多這樣的情況，清除那些被忽視而非深刻的問題。

但最難的問題之所以無法解決，往往是因為現有方法走了一部分路卻失敗了。剩下的部分通常需要一個新的視角，一種新的語言，或者是不同領域之間的意外聯繫。

AI能做到嗎？也許有一天能做到。現在尚不清楚當前的系統是否能夠建立這種突破所需的累積概念結構。它們能夠重新組合已知的策略，有時能找到令人驚訝的路徑，但真正的突破不僅僅是一個結果，它是對思維的重組。

這可能比看起來更難以自動化。

人類能做什麼？

討論往往變得過於悲觀或過於模糊。

一個常見的擔憂是，如果AI接管了更多的技術工作，數學家們會變得不再重要。但這假設了數學勞動與數學價值是完全相同的。歷史表明，情況並非如此。當計算器、符號系統和數值軟件接管了例行任務時，數學並沒有消失。它轉移到了更高的層面。人類的角色轉向了建模、解釋、戰略和抽象。

同樣的事情可能會再次發生，而且會在更高的層面上。未來的數學家可能會花更少的時間在例行的推導上，更多地時間用在問題的框定、判斷哪些想法重要、從大規模探索中提取結構，以及跨領域連接概念。他們將越來越多地在結合計算、正式證明和AI輔助探索的混合環境中工作。

這一轉變在課堂上已經開始顯現。如果AI能夠解決標準問題集，那麼解決問題就不再是重點。重點轉向了解釋、判斷和理解，不僅僅是證明結果是正確的，而且要知道它為什麼有效，在哪些情況下適用。

風險是真實的

然而，樂觀的故事並非註定會發生。確實存在真實的風險。

機器生成的論文洪流可能會淹沒同行評審。虛弱或誤導性的結果可能會比社區能夠評估的速度更快地傳播。年輕研究者可能會變得過於依賴他們並不完全理解的工具。如果數學碎片化為機器生成的技術輸出加上人類總結，那麼優雅的闡述可能會下降。如果AI系統變得強大，但被封閉起來，那麼前沿數學的獲取可能會變得更加不平等，而不是更加民主化。

這些是結構性的問題。數學的未來不僅僅由AI能做什麼來決定。它還將由數學界如何圍繞這些工具進行自我組織來決定。

即使存在這些風險，轉變的規模仍然是顯著的。