谷歌发布推理模型 Gemini 2.5,这是其迄今为止“最智能的 AI 模型”

2025年03月27日21:12:11 科技 1124

谷歌昨日宣布正式发布Gemini 2.5,这是一种新的推理模型,该公司还声称这是其迄今为止“最智能的AI模型”。

谷歌发布推理模型 Gemini 2.5,这是其迄今为止“最智能的 AI 模型” - 天天要闻

“Gemini 2.5 模型是思维模型,能够在做出反应之前通过思维进行推理,从而提高性能和准确性。在人工智能领域,系统的“推理”能力不仅仅指分类和预测。它指的是分析信息、得出合乎逻辑的结论、结合背景和细微差别并做出明智决策的能力,”谷歌 DeepMind 首席技术官 Koray Kavukcuoglu 在一篇博文中如此写道。

Gemini 2.0 Flash Thinking是谷歌首个推理模型,而 Gemini 2.5 则在此基础上改进了基础模型,并改进了后期训练。谷歌在公告中透露,未来所有 AI 模型都将内置推理能力。

谷歌发布推理模型 Gemini 2.5,这是其迄今为止“最智能的 AI 模型” - 天天要闻

第一个 Gemini 2.5 模型是 Gemini 2.5 Pro Experimental,它在 LMArena 基准测试中远远领先于 OpenAI o3-mini、Claude 3.5 Sonnet 和 DeepSeek R1 等其他推理模型。

它还在 Humanity's Last Exam 上获得了 18.8% 的分数,这是“由数百名学科专家设计的数据集,旨在捕捉人类知识和推理的前沿”。它还擅长编码,特别是创建 Web 应用程序和代理应用程序,以及处理代码转换。相比之下,OpenAI o3-mini 得分为 14%,DeepSeek R1 得分为 8.6%。

该模型现已在 Google AI Studio 和 Gemini 应用程序中供高级订阅者使用。谷歌正在努力将其添加到 Vertex AI 中,并将在未来几周内公布该模型的定价。

在推出时,它提供了 100 万个令牌上下文窗口,并且该公司正在努力尽快添加 200 万个令牌上下文窗口。

科技分类资讯推荐

长安与东风重组新进展:朱华荣称不会改变长安既定战略 - 天天要闻

长安与东风重组新进展:朱华荣称不会改变长安既定战略

2月9日,长安汽车和东风集团股份(00489.HK)同步发布了控股股东“正在与其他国资央企集团筹划重组事项”的信息。长安汽车的控股股东是兵装集团,而东风集团股份的控股股东是东风公司。随即,长安汽车和东风集团这两家汽车央企将合并重组,成为业内关注的焦点。
公安部出手了!年龄限制放宽10年、送考下乡,2025年考驾照不难了 - 天天要闻

公安部出手了!年龄限制放宽10年、送考下乡,2025年考驾照不难了

电动车加强管理以后,要求机动车类型的车辆需要持证上路,但是老年人考驾照却受阻,一方面有年龄的限制,另一方面偏远山区考驾照不方便,所以在2025年公安部出手了,年龄限制放宽10年,同时推出送考下乡服务,还进一步的降低考驾照的费用,2025年起考摩托车驾照不难了。
从“星灵安全守护体系”到昊铂HL,看懂广汽科技日 - 天天要闻

从“星灵安全守护体系”到昊铂HL,看懂广汽科技日

发布会以技术切入,并全程围绕安全展开。广汽集团董事长、总经理冯兴亚率先登场,宣布2025年四季度将正式上市支持L3级智能驾驶的车型,他同时强调面向自动驾驶时代对智能驾驶技术、整车安全架构以及突发风险处理能力的要求更高。如何才能满足更高的要求?冯兴亚提到了“广汽
关税大棒下,最受伤的车企出现了 - 天天要闻

关税大棒下,最受伤的车企出现了

特朗普的关税大棒刚挥出,尚未吓退“外敌”,却先刺痛了自己。近日,拥有玛莎拉蒂、Jeep等14个品牌的全球第四大车企斯泰兰蒂斯突然宣布裁撤900名美国工人,关闭加拿大和墨西哥两家工厂,北美生产线陷入瘫痪。几乎同一时间,捷豹路虎宣布暂停对美出口一个月,奥迪更是直接