近日,美國加州大學聖地亞哥分校的研究機構Hao AI Lab,將幾款人工智慧(AI)引入超級馬里奧遊戲中,看看這些AI們玩得好不好。
其中,美國人工智慧初創公司Anthropic發布Claude 3.7表現最好,其次是Claude 3.5。谷歌的Gemini 1.5 Pro 和Open AI 的 ChatGPT 4.0苦苦掙扎。
研究團隊內部開發的GamingAgent,為AI提供基本指令,例如「如果附近有障礙物或敵人,請向左移動或者跳躍以躲避」。AI則以Python代碼的形式生成輸入來控制馬里奧。
有趣的是,實驗室發現,像ChatGPT這樣的推理模型,即逐步「思考」問題以得出解決方案,表現得比「非推理」模型差,儘管它們通常在大多數基準測試中更強。
研究人員表示,推理模型在玩這類遊戲時遇到困難的主要原因是,它們需要一段時間(通常是幾秒鐘)來決定行動。
但在《超級馬里奧兄弟》中,時間就是一切,一秒鐘可能意味著安全完成跳躍和墜落致死之間的區別。
幾十年來,遊戲一直被用來對 AI 進行基準測試。但一些專家質疑,他他們認為將人工智慧的遊戲技能和技術進步聯繫起來是否明智。
編譯/瀟湘晨報記者傅圓圓
報料、維權通道:應用市場下載「晨視頻」客戶端,搜索「報料」一鍵直達;或微信添加報料客服:xxcbcsp;或撥打熱線0731-85571188。如需內容合作,請撥打政企服務專席19176699651。