AI來玩超級馬里奧,ChatGPT慘敗,推理型容易反應慢

2025年03月08日18:43:09 科學 1488

近日,美國加州大學聖地亞哥分校的研究機構Hao AI Lab,將幾款人工智能(AI)引入超級馬里奧遊戲中,看看這些AI們玩得好不好。

AI來玩超級馬里奧,ChatGPT慘敗,推理型容易反應慢 - 天天要聞

其中,美國人工智能初創公司Anthropic發布Claude 3.7表現最好,其次是Claude 3.5。谷歌的Gemini 1.5 Pro 和Open AI 的 ChatGPT 4.0苦苦掙扎。

研究團隊內部開發的GamingAgent,為AI提供基本指令,例如“如果附近有障礙物或敵人,請向左移動或者跳躍以躲避”。AI則以Python代碼的形式生成輸入來控制馬里奧。

有趣的是,實驗室發現,像ChatGPT這樣的推理模型,即逐步“思考”問題以得出解決方案,表現得比“非推理”模型差,儘管它們通常在大多數基準測試中更強。

研究人員表示,推理模型在玩這類遊戲時遇到困難的主要原因是,它們需要一段時間(通常是幾秒鐘)來決定行動。

但在《超級馬里奧兄弟》中,時間就是一切,一秒鐘可能意味着安全完成跳躍和墜落致死之間的區別。

幾十年來,遊戲一直被用來對 AI 進行基準測試。但一些專家質疑,他他們認為將人工智能的遊戲技能和技術進步聯繫起來是否明智。

編譯/瀟湘晨報記者傅圓圓

報料、維權通道:應用市場下載“晨視頻”客戶端,搜索“報料”一鍵直達;或微信添加報料客服:xxcbcsp;或撥打熱線0731-85571188。如需內容合作,請撥打政企服務專席19176699651。

科學分類資訊推薦

蛇島探秘:走進2萬條蝮蛇的棲息家園 - 天天要聞

蛇島探秘:走進2萬條蝮蛇的棲息家園

新華社大連6月15日電 題:蛇島探秘:走進2萬條蝮蛇的棲息家園新華社記者張博群夏日,乘船從大連市旅順口區出發,不到半小時,一座籠罩在雲霧中的神秘海島映入眼帘。小島不大,面積僅0.73平方公里,距離陸地約10公里,島上棲息着近2萬條劇毒蝮蛇,
部分低空安全管控系統和低空探測雷達產品已獲得批量訂單 航空裝備概念股單日漲超17% 本周機構密集調研相關上市公司 - 天天要聞

部分低空安全管控系統和低空探測雷達產品已獲得批量訂單 航空裝備概念股單日漲超17% 本周機構密集調研相關上市公司

財聯社6月15日訊(編輯 宣林)據Choice數據統計,截至今日,滬深兩市本周共315家上市公司接受機構調研。按行業劃分,電子、醫藥生物和基礎化工行業接受機構調研頻度最高。此外,通信、有色金屬等行業關注度有所提升。細分領域看,汽車零部件、化學製藥和半導體板塊位列機構關注度前三名。此外,醫療器械、通信設備等行業機...
首席專家滕雲田,被查 - 天天要聞

首席專家滕雲田,被查

據中央紀委國家監委駐應急管理部紀檢監察組、湖北省紀委監委消息:中國地震局地球物理研究所二級研究員滕雲田涉嫌嚴重違紀違法,目前正接受中央紀委國家監委駐應急管理部紀檢監察組紀律審查和湖北省荊門市監察委員會監察調查。
國內頂尖洞穴潛水員在廣西洞潛時去世,失聯20天後遺體被找到 - 天天要聞

國內頂尖洞穴潛水員在廣西洞潛時去世,失聯20天後遺體被找到

6月14日,多位網友發布消息,國內頂尖的洞穴潛水員金雪峰女士的遺體於12日被找到,此前她在廣西南寧聖龍潭潛水時失聯。兩位參與搜尋的救援人員向極目新聞記者證實了這一消息。據參與搜尋的救援人員透露,金雪峰於5月20日在廣西南寧聖龍潭潛水時失聯,直到6月12日,遺體才被打撈上來。據網友介紹,南寧聖龍潭是被譽為自由潛...
黃金為何能成為硬通貨 - 天天要聞

黃金為何能成為硬通貨

黃金成為硬通貨,主要由其自身特性、歷史發展以及經濟屬性等多方面因素共同決定,以下為你詳細闡述:一、自身特性:● 穩定性:黃金具有良好的化學穩定性,不易與其他物質發生化學反應,很難被腐蝕、氧化。比如在出土的古代文物中,金器依然能保持完好的形態