AI来玩超级马里奥,ChatGPT惨败,推理型容易反应慢

2025年03月08日18:43:09 科学 1488

近日,美国加州大学圣地亚哥分校的研究机构Hao AI Lab,将几款人工智能(AI)引入超级马里奥游戏中,看看这些AI们玩得好不好。

AI来玩超级马里奥,ChatGPT惨败,推理型容易反应慢 - 天天要闻

其中,美国人工智能初创公司Anthropic发布Claude 3.7表现最好,其次是Claude 3.5。谷歌的Gemini 1.5 Pro 和Open AI 的 ChatGPT 4.0苦苦挣扎。

研究团队内部开发的GamingAgent,为AI提供基本指令,例如“如果附近有障碍物或敌人,请向左移动或者跳跃以躲避”。AI则以Python代码的形式生成输入来控制马里奥。

有趣的是,实验室发现,像ChatGPT这样的推理模型,即逐步“思考”问题以得出解决方案,表现得比“非推理”模型差,尽管它们通常在大多数基准测试中更强。

研究人员表示,推理模型在玩这类游戏时遇到困难的主要原因是,它们需要一段时间(通常是几秒钟)来决定行动。

但在《超级马里奥兄弟》中,时间就是一切,一秒钟可能意味着安全完成跳跃和坠落致死之间的区别。

几十年来,游戏一直被用来对 AI 进行基准测试。但一些专家质疑,他他们认为将人工智能的游戏技能和技术进步联系起来是否明智。

编译/潇湘晨报记者傅圆圆

报料、维权通道:应用市场下载“晨视频”客户端,搜索“报料”一键直达;或微信添加报料客服:xxcbcsp;或拨打热线0731-85571188。如需内容合作,请拨打政企服务专席19176699651。

科学分类资讯推荐

蛇岛探秘:走进2万条蝮蛇的栖息家园 - 天天要闻

蛇岛探秘:走进2万条蝮蛇的栖息家园

新华社大连6月15日电 题:蛇岛探秘:走进2万条蝮蛇的栖息家园新华社记者张博群夏日,乘船从大连市旅顺口区出发,不到半小时,一座笼罩在云雾中的神秘海岛映入眼帘。小岛不大,面积仅0.73平方公里,距离陆地约10公里,岛上栖息着近2万条剧毒蝮蛇,
部分低空安全管控系统和低空探测雷达产品已获得批量订单 航空装备概念股单日涨超17% 本周机构密集调研相关上市公司 - 天天要闻

部分低空安全管控系统和低空探测雷达产品已获得批量订单 航空装备概念股单日涨超17% 本周机构密集调研相关上市公司

财联社6月15日讯(编辑 宣林)据Choice数据统计,截至今日,沪深两市本周共315家上市公司接受机构调研。按行业划分,电子、医药生物和基础化工行业接受机构调研频度最高。此外,通信、有色金属等行业关注度有所提升。细分领域看,汽车零部件、化学制药和半导体板块位列机构关注度前三名。此外,医疗器械、通信设备等行业机...
首席专家滕云田,被查 - 天天要闻

首席专家滕云田,被查

据中央纪委国家监委驻应急管理部纪检监察组、湖北省纪委监委消息:中国地震局地球物理研究所二级研究员滕云田涉嫌严重违纪违法,目前正接受中央纪委国家监委驻应急管理部纪检监察组纪律审查和湖北省荆门市监察委员会监察调查。
国内顶尖洞穴潜水员在广西洞潜时去世,失联20天后遗体被找到 - 天天要闻

国内顶尖洞穴潜水员在广西洞潜时去世,失联20天后遗体被找到

6月14日,多位网友发布消息,国内顶尖的洞穴潜水员金雪峰女士的遗体于12日被找到,此前她在广西南宁圣龙潭潜水时失联。两位参与搜寻的救援人员向极目新闻记者证实了这一消息。据参与搜寻的救援人员透露,金雪峰于5月20日在广西南宁圣龙潭潜水时失联,直到6月12日,遗体才被打捞上来。据网友介绍,南宁圣龙潭是被誉为自由潜...
黄金为何能成为硬通货 - 天天要闻

黄金为何能成为硬通货

黄金成为硬通货,主要由其自身特性、历史发展以及经济属性等多方面因素共同决定,以下为你详细阐述:一、自身特性:● 稳定性:黄金具有良好的化学稳定性,不易与其他物质发生化学反应,很难被腐蚀、氧化。比如在出土的古代文物中,金器依然能保持完好的形态