谷歌发布推理模型 Gemini 2.5,这是其迄今为止“最智能的 AI 模型”

2025年03月27日21:12:11 科技 1124

谷歌昨日宣布正式发布Gemini 2.5,这是一种新的推理模型,该公司还声称这是其迄今为止“最智能的AI模型”。

谷歌发布推理模型 Gemini 2.5,这是其迄今为止“最智能的 AI 模型” - 天天要闻

“Gemini 2.5 模型是思维模型,能够在做出反应之前通过思维进行推理,从而提高性能和准确性。在人工智能领域,系统的“推理”能力不仅仅指分类和预测。它指的是分析信息、得出合乎逻辑的结论、结合背景和细微差别并做出明智决策的能力,”谷歌 DeepMind 首席技术官 Koray Kavukcuoglu 在一篇博文中如此写道。

Gemini 2.0 Flash Thinking是谷歌首个推理模型,而 Gemini 2.5 则在此基础上改进了基础模型,并改进了后期训练。谷歌在公告中透露,未来所有 AI 模型都将内置推理能力。

谷歌发布推理模型 Gemini 2.5,这是其迄今为止“最智能的 AI 模型” - 天天要闻

第一个 Gemini 2.5 模型是 Gemini 2.5 Pro Experimental,它在 LMArena 基准测试中远远领先于 OpenAI o3-mini、Claude 3.5 Sonnet 和 DeepSeek R1 等其他推理模型。

它还在 Humanity's Last Exam 上获得了 18.8% 的分数,这是“由数百名学科专家设计的数据集,旨在捕捉人类知识和推理的前沿”。它还擅长编码,特别是创建 Web 应用程序和代理应用程序,以及处理代码转换。相比之下,OpenAI o3-mini 得分为 14%,DeepSeek R1 得分为 8.6%。

该模型现已在 Google AI Studio 和 Gemini 应用程序中供高级订阅者使用。谷歌正在努力将其添加到 Vertex AI 中,并将在未来几周内公布该模型的定价。

在推出时,它提供了 100 万个令牌上下文窗口,并且该公司正在努力尽快添加 200 万个令牌上下文窗口。

科技分类资讯推荐

甘肃省科技创业孵化协会到唐山机器人特色产业基地交流考察 - 天天要闻

甘肃省科技创业孵化协会到唐山机器人特色产业基地交流考察

近日,甘肃省科技创业孵化协会会长孙晓辉携省内10余家科技企业孵化器管理运营代表一行13人,在河北省科技企业孵化协会秘书长李靖的陪同下,到唐山机器人特色产业基地、百川机器人共享制造工厂交流考察。在唐山机器人展示体验中心,考察团一行详细了解了机器人系统集成、机器人视觉、服务机器人、自动化药房、无人机技术服务...
OpenAI反诉马斯克:当理想主义撞上商业铁幕 - 天天要闻

OpenAI反诉马斯克:当理想主义撞上商业铁幕

美国时间4月9日,人工智能领域的“师徒反目”大戏迎来高潮:OpenAI正式向旧金山高等法院提交诉状,指控其联合创始人之一埃隆·马斯克存在“系统性骚扰行为”,并要求法院禁止其通过社交媒体和公开言论实施的“恶意宣传”。
刘强东和李斌一起吃饭,拍照姿势大有深意! - 天天要闻

刘强东和李斌一起吃饭,拍照姿势大有深意!

看到刘强东和李斌一起吃京东外卖,原来大佬喜欢这种拍照姿势。李斌发文和刘强东一起吃京东外卖,并且对京东外卖盛赞有加。我觉得刘强东有一句话说的特别好,那就是京东要做父母,孩子,客人都能放心吃的品质外卖。
已修复:三星确认微软 Swiftkey 不兼容 One UI 7,解锁无回车键 - 天天要闻

已修复:三星确认微软 Swiftkey 不兼容 One UI 7,解锁无回车键

IT之家 4 月 10 日消息,三星公司昨日确认,输入法应用 Microsoft Swiftkey 不兼容最新 One UI 7.0 更新,由于输入键盘没有显示回车按键,可能导致部分用户卡在锁屏界面无法进入桌面。IT之家注:Microsoft Swiftkey 是一款热门输入法应用程序,由于丰富的 AI 功能和卓越的输入体验,得到了很多用户的青睐,让其取代三
谷歌发布 Gemini 2.5 Flash AI 模型:专为省钱高效而生 - 天天要闻

谷歌发布 Gemini 2.5 Flash AI 模型:专为省钱高效而生

IT之家 4 月 10 日消息,谷歌今日推出了一款名为 Gemini 2.5 Flash 的全新 AI 模型,该模型注重高效能,并提供强劲的性能。据IT之家了解,Gemini 2.5 Flash 即将登陆谷歌的 AI 开发平台 Vertex AI。谷歌公司表示,该模型具备“动态且可控”的计算能力,开发者能够根据查询请求的复杂程度灵活调整处理时间。谷歌在一篇博