AI來玩超級馬里奧，ChatGPT慘敗，推理型容易反應慢

分類：科學

瀏覽數：1488

2025-03-08

近日，美國加州大學聖地亞哥分校的研究機構Hao AI Lab，將幾款人工智慧（AI）引入超級馬里奧遊戲中，看看這些AI們玩得好不好。

其中，美國人工智慧初創公司Anthropic發布Claude 3.7表現最好，其次是Claude 3.5。谷歌的Gemini 1.5 Pro 和Open AI 的 ChatGPT 4.0苦苦掙扎。

研究團隊內部開發的GamingAgent，為AI提供基本指令，例如「如果附近有障礙物或敵人，請向左移動或者跳躍以躲避」。AI則以Python代碼的形式生成輸入來控制馬里奧。

有趣的是，實驗室發現，像ChatGPT這樣的推理模型，即逐步「思考」問題以得出解決方案，表現得比「非推理」模型差，儘管它們通常在大多數基準測試中更強。

研究人員表示，推理模型在玩這類遊戲時遇到困難的主要原因是，它們需要一段時間（通常是幾秒鐘）來決定行動。

但在《超級馬里奧兄弟》中，時間就是一切，一秒鐘可能意味著安全完成跳躍和墜落致死之間的區別。

幾十年來，遊戲一直被用來對 AI 進行基準測試。但一些專家質疑，他他們認為將人工智慧的遊戲技能和技術進步聯繫起來是否明智。

編譯/瀟湘晨報記者傅圓圓

報料、維權通道：應用市場下載「晨視頻」客戶端，搜索「報料」一鍵直達；或微信添加報料客服：xxcbcsp；或撥打熱線0731-85571188。如需內容合作，請撥打政企服務專席19176699651。

科學分類資訊推薦