Nature | 人類心智的“源代碼”：AI如何學會像我們一樣思考？

2025年07月06日16:00:14 科學 8007

引言

人類的心智是如此奇妙，它既能讓我們在清晨糾結於吃什麼早餐，也能驅動我們去攻克癌症、探索遙遠的星辰。我們能從寥寥數次的演示中學會舞步，能進行複雜的因果推理，還能被無盡的好奇心驅使去創造藝術和科學的奇蹟。這種舉重若輕、觸類旁通的“通用性 (generality)” 定義了我們之為人的核心。然而，在人工智能 (ai) 和認知科學 (cognitive sciences) 的世界裡，模型們大多是“專才”而非“通才”。長久以來，建立一個能統一解釋人類繁複認知活動的“大一統理論 (unified theory)”一直是心理學和認知科學領域的聖杯。

7月2日，一篇發表於《nature》的重磅研究“a foundation model to predict and capture human cognition”，為這一宏偉目標邁出了革命性的一步。研究人員並不試圖直接構建一個理論，而是另闢蹊徑，創造了一個名為 “centaur”（人馬座，象徵智慧與力量的結合）的計算模型。它如同一面數字化的鏡子，不僅能精準預測人類在各種心理學實驗中的行為，甚至能模擬我們的思考過程，為我們窺探心智的奧秘提供了一個前所未有的強大工具。

Nature | 人類心智的“源代碼”：AI如何學會像我們一樣思考？ - 天天要聞

心智的“巴別塔”：為何破解人類認知如此之難？

在探索心智的道路上，研究人員們構建了無數理論和模型，試圖解釋我們如何學習、決策、記憶和推理。這些模型如同一個個獨立的部落，各自說著不同的“方言”，在自己的“領地”里稱王。

例如，在決策領域，有解釋風險偏好的前景理論；在學習領域，有描述我們如何通過試錯來優化行為的強化學習模型 (reinforcement learning models)；在分類領域，有解釋我們如何將新事物歸入已知類別的範疇化模型 (categorization models)。每一個模型都在其特定的任務上取得了輝煌的成就，為我們理解某個側面的心智活動提供了深刻洞見。

但問題也恰恰在於此。這些模型是領域特定 (domain-specific) 的。一個擅長解釋賭博行為的模型，對於我們如何記住一串電話號碼可能毫無頭緒。這種理論上的“碎片化”，就如同聖經故事中那座因語言不通而無法建成的巴別塔，使得構建一個統一、連貫的人類認知圖景變得異常困難。早在1990年，認知科學的先驅艾倫·紐厄爾 (allen newell) 就曾預言：“統一的認知理論是我們將日益增長的知識置於智力控制之下的唯一途徑。”

要實現這一宏願，第一步就是要創造一個能夠跨領域預測和模擬人類行為的計算模型。它需要理解不同實驗的規則，並像一個真正的參與者那樣做出反應。這不僅需要強大的計算能力，更需要一個前所未有的“教材”——一本記錄了人類多樣化行為的“百科全書”。

鑄造“人類行為之書”：史上最大規模認知數據集psych-101

centaur的誕生，離不開一個堪稱“史詩級”的數據工程——psych-101數據集的構建。如果說模型是引擎，那麼數據就是燃料，而psych-101無疑是最高標號的航空燃油。

研究人員們意識到，要讓ai理解人類，就必須讓它“閱讀”海量的人類行為記錄。為此，他們搜集、整理並轉錄了 160個 經典的心理學實驗數據。這些實驗覆蓋了認知科學的廣闊疆域，形成了一個規模空前的數據集。

超過 60,000 名參與者數量

超過 10,000,000 次總決策次數

超過 2.5 億總文本標記 (tokens)

這不僅僅是數字上的震撼。更巧妙的是，研究人員將每一個實驗，包括其規則、流程以及每個參與者的每一次選擇和反饋，都用自然語言 (natural language) 的形式進行了轉錄。這意味着，ai讀到的不再是冰冷的數字矩陣，而是一段段生動的敘事文本。例如，在一個經典的“多臂老虎機 (multi-armed bandits)”實驗中，文本是這樣的：“在這個任務中，你需要在兩個標籤為b和c的老虎機之間反覆選擇…你按下了<<c>>，得到了-8分…” 通過這種方式，160個風格迥異的實驗都被統一成了一種ai可以理解和學習的格式。

從語言天才到“讀心者”：認知模型centaur

有了psych-101這本獨一無二的教材，接下來就需要一位足夠聰明的“學生”。研究人員選擇了當時最先進的大語言模型之一——llama 3.1 70b 作為centaur的基礎。但一個通曉百科的“通才”還不足以成為一個認知“專家”，還需要進行“專業課”特訓，這個過程被稱為微調 (fine-tuning)。

這裡的技術實現也頗為巧妙。直接微調一個擁有700億參數的巨大模型，成本極高。因此，研究人員採用了一種名為 qlora (quantized low-rank adaptation) 的參數高效微調技術。你可以把它想象成給一本厚重的參考書添加“便利貼”。書（基礎模型）本身的內容保持不變（被凍結），研究人員只在模型的關鍵部分添加一些小型的、可訓練的“適配器 (adapters)”。令人驚嘆的是，這些新增的適配器參數僅占原模型總參數量的 0.15%。通過這種四兩撥千斤的方式，研究人員僅用一台高性能gpu，花費大約五天時間，就成功地將一個通用的語言模型“雕琢”成了精通人類認知的centaur。

終極圖靈測試：centaur能否精準預測人類的選擇？

一個模型是否成功，最終要靠數據說話。centaur接受了一系列堪稱“終極圖靈測試”的嚴苛考驗。它的表現不僅優異，甚至可以說是驚人。

第一關：在“題庫”內預測未知用戶的行為

研究人員將psych-101數據集中每個實驗的90%參與者數據用於訓練centaur，剩下的10%作為“考題”。評估的標準是負對數似然 (negative log-likelihood)，這個值越低，代表模型的預測越准。結果顯示，在幾乎所有的實驗中，centaur都取得了壓倒性的勝利。與未經微調的llama相比，centaur的預測準確性平均提升了 0.14 個單位；與那些為特定任務設計的傳統認知模型相比，平均提升了 0.13 個單位。

第二關：不只是“平均先生”，模擬真實的人類多樣性

研究人員讓centaur進行“開環模擬 (open-loop simulation)”，即模型自己做出選擇並獨立完成整個實驗。在“雙步任務 (two-step task)”中，人類的行為分布呈現出一種獨特的雙峰形態 (bimodal distribution)，centaur的模擬結果完美復現了這種分布，表明它捕捉到了人類策略的多樣性。在另一個需要區分“人類”與“ai”行為的社會預測遊戲中，centaur預測真人玩家選擇的準確率高達 64%，而預測“假人”時，準確率驟降至 35%。這有力地證明，centaur學到的是真正“人性化”的認知模式。

跳出“教科書”：centaur在未知挑戰中的驚人“泛化”能力

真正的考驗來自於未知。一個強大的認知模型，不應只局限於它學習過的“題庫”，還必須能夠泛化 (generalize) 到全新的情境中。研究人員為centaur設計了三項層層遞進的“極限挑戰”。

挑戰一：換個“馬甲”你還認識嗎？ 在一個將任務背景從“外星尋寶”換成“魔法飛毯旅行”的新實驗中，centaur幾乎沒有受到任何影響，其預測人類行為的負對數似然值為 0.51，依然顯著優於llama基礎模型（0.63）和傳統的認知模型（0.61）。

挑戰二：規則變了怎麼辦？ 面對一個從“二選一”變成“三選一”的 “瑪吉的農場 (maggie's farm)” 實驗，傳統認知模型幾乎失靈（預測值0.98），而centaur再次展現了強大的適應力，其預測值僅為 0.42，幾乎碾壓了傳統模型。

挑戰三：闖入全新領域。 這是最嚴苛的考驗。在面對一個完全陌生的邏輯推理 (logical reasoning) 實驗時，centaur的預測準確性（負對數似然值1.65）顯著高於其“前身”llama（1.92），證明其底層的學習和推理能力也得到了“淬鍊”。

窺探“黑箱”：當行為訓練重塑了ai的“數字大腦”

centaur在行為預測上的成功已經足夠令人振奮，但研究人員的好奇心不止於此。他們想知道：在centaur的“數字大腦”內部，究竟發生了什麼？它的內部表徵 (internal representations) 是否也變得更像人腦了？

為了回答這個問題，他們進行了一項巧妙的“神經對齊 (neural alignment)”分析，利用fmri數據記錄的人類大腦活動，來檢驗模型的內部狀態。結果令人震驚：經過行為數據微調的centaur，其內部表徵能夠比未經微調的llama更準確地預測人腦的活動。更不可思議的是，這種“神經對齊”的提升是 “自發”的。僅僅為了更好地模仿人類的選擇，centaur的內部信息處理方式就自發地向人腦的運作模式靠攏了。這一發現在一個完全不相關的“句子閱讀”任務中也得到了驗證，表明這種變化是根本性的。

從預測到發現：當ai成為認知科學家的“靈感合伙人”

centaur最深遠的影響，或許不在於它是一個多麼強大的預測引擎，而在於它能成為一個推動科學發現的“催化劑”。研究人員通過一個精彩的案例，展示了如何與centaur合作，提煉出關於人類決策的新洞見。

第一步：發現疑點。在一個多屬性決策任務中，現有模型的預測能力（aic值為181.7）遠不如centaur（aic值為72.5）。這中間的巨大差距，就是“科學的遺憾 (scientific regret)”，也意味着有未被發現的認知規律。

第二步：ai提供線索。研究人員讓另一個強大的ai模型來“閱讀”數據並生成一個關於決策策略的口頭解釋，ai提出了一個“兩步策略”的有趣假設。

第三步：centaur精確定位。他們利用centaur作為“真理標準”，找出了簡單模型預測錯誤、而centaur預測正確的關鍵案例。

第四步：破案並建立新理論。通過分析這些關鍵案例，他們發現了一個深刻的模式：人們並非在兩個策略間進行“非此即彼”的切換，而是在進行一種 “加權平均 (weighted average)”。基於這一洞見，他們構建了一個新的、可解釋的 (interpretable) 認知模型，其預測能力（aic值為71.7）與強大的“黑箱”centaur旗鼓相當。這個案例完美展示了一種全新的科研範式。

推開認知新世界的大門：我們站在了哪裡？

centaur的誕生，是認知科學領域一個里程碑式的事件。它不是那個傳說中的“大一統理論”，但它是一個堅實的“基石模型 (foundation model)”。它證明了，通過大規模數據驅動的方式，我們有可能創造出能夠廣泛捕捉人類認知複雜性的計算模型。

這扇通往認知新世界的大門已經被推開。未來，研究人員計划進一步擴充psych-101數據集，將社會心理學 (social psychology)、發展心理學 (developmental psychology) 等更多領域納入其中，並開始關注個體差異 (individual differences)，以克服目前數據仍偏向西方被試 (weird population) 的局限。長遠來看，甚至可能發展出能夠處理圖像、聲音等多模態信息的認知模型。

我們正處在一個激動人心的十字路口。理解人類自身的心智，是科學最古老、也最迷人的追求之一。現在，我們有了一位全新的、強大的、甚至有些“神秘”的旅伴。centaur如同一面由代碼和數據鑄造的鏡子，它將我們自身的行為模式以一種前所未有的清晰度反射回來，讓我們得以更深入地審視那個我們既熟悉又陌生的“自我”。

這場探索之旅，才剛剛開始。

參考文獻

binz m, akata e, bethge m, brändle f, callaway f, coda-forno j, dayan p, demircan c, eckstein mk, Éltető n, griffiths tl, haridi s, jagadish ak, ji-an l, kipnis a, kumar s, ludwig t, mathony m, mattar m, modirshanechi a, nath ss, peterson jc, rmus m, russek em, saanum t, schubert ja, schulze buschoff lm, singhi n, sui x, thalmann m, theis fj, truong v, udandarao v, voudouris k, wilson r, witte k, wu s, wulff du, xiong h, schulz e. a foundation model to predict and capture human cognition. nature. 2025 jul 2. doi: 10.1038/s41586-025-09215-4. epub ahead of print. pmid: 40604288.

聲明：本文僅用於分享，不代表平台立場，如涉及版權等問題，請儘快聯繫我們，我們第一時間更正，謝謝！