谷歌发布推理模型 Gemini 2.5,这是其迄今为止“最智能的 AI 模型”

2025年03月27日21:12:11 科技 1124

谷歌昨日宣布正式发布Gemini 2.5,这是一种新的推理模型,该公司还声称这是其迄今为止“最智能的AI模型”。

谷歌发布推理模型 Gemini 2.5,这是其迄今为止“最智能的 AI 模型” - 天天要闻

“Gemini 2.5 模型是思维模型,能够在做出反应之前通过思维进行推理,从而提高性能和准确性。在人工智能领域,系统的“推理”能力不仅仅指分类和预测。它指的是分析信息、得出合乎逻辑的结论、结合背景和细微差别并做出明智决策的能力,”谷歌 DeepMind 首席技术官 Koray Kavukcuoglu 在一篇博文中如此写道。

Gemini 2.0 Flash Thinking是谷歌首个推理模型,而 Gemini 2.5 则在此基础上改进了基础模型,并改进了后期训练。谷歌在公告中透露,未来所有 AI 模型都将内置推理能力。

谷歌发布推理模型 Gemini 2.5,这是其迄今为止“最智能的 AI 模型” - 天天要闻

第一个 Gemini 2.5 模型是 Gemini 2.5 Pro Experimental,它在 LMArena 基准测试中远远领先于 OpenAI o3-mini、Claude 3.5 Sonnet 和 DeepSeek R1 等其他推理模型。

它还在 Humanity's Last Exam 上获得了 18.8% 的分数,这是“由数百名学科专家设计的数据集,旨在捕捉人类知识和推理的前沿”。它还擅长编码,特别是创建 Web 应用程序和代理应用程序,以及处理代码转换。相比之下,OpenAI o3-mini 得分为 14%,DeepSeek R1 得分为 8.6%。

该模型现已在 Google AI Studio 和 Gemini 应用程序中供高级订阅者使用。谷歌正在努力将其添加到 Vertex AI 中,并将在未来几周内公布该模型的定价。

在推出时,它提供了 100 万个令牌上下文窗口,并且该公司正在努力尽快添加 200 万个令牌上下文窗口。

科技分类资讯推荐

人形机器人加速“进化”新时代画卷 - 天天要闻

人形机器人加速“进化”新时代画卷

人形机器人的“进化之旅”在科技的璀璨星河中,人形机器人宛如一颗耀眼的新星,正以惊人的速度加速“进化”,开启属于它们的新时代画卷。从“蹒跚学步”到“小步快跑”曾几何时,人形机器人还处在Demo演示和静态展览的阶段,如同初生婴儿般对世界充满好奇
小米:犯罪团伙操纵近万账号诋毁小米,犯罪金额巨大 - 天天要闻

小米:犯罪团伙操纵近万账号诋毁小米,犯罪金额巨大

据@小米法务部 5月19日消息:2025年5月15日,公司从司法机关处获悉,此前公司报案的一起有组织、有预谋的网络黑公关案件,已经告破。目前,公安机关已依法对多名犯罪嫌疑人采取刑事强制措施,案件还在进一步调查。据了解,自2024年12月起,直至近期小米汽车相关的系列热点事件,该犯罪团伙利用文案自动生成软件捏造关于小米...
QQ浏览器推出QBot:全面升级为AI浏览器 聚合5大AI新能力 - 天天要闻

QQ浏览器推出QBot:全面升级为AI浏览器 聚合5大AI新能力

快科技5月19日消息,QQ浏览器宣布推出QBot,升级为AI浏览器,搭载腾讯混元和DeepSeek双模型。升级后的QQ浏览器将成为超级助手,在浏览时提供多种AI功能,帮助用户更高效地获取和处理信息,满足工作、学习等需求。据悉,新版QQ浏览器可体验AI搜索、AI浏览、AI办公、AI学习、AI写作五大功能。如在搜索方面,支持用户以文字、...