同声传译、全新AI模式搜索!谷歌重磅发布“最强通用AI模型”

2025年05月21日15:40:20 科技 4774

当地时间5月20日,谷歌2025年度i/o开发者大会展示了ai、多模态模型等最新成果。谷歌ceo皮查伊强调gemini 2.5 pro为最强通用ai模型,将在chrome、搜索及gemini app中推出智能体模式,实现与浏览器等软件交互。谷歌搜索添加ai模式标签页,支持长查询、自动分解意图并生成结构化答案。

继微软之后,谷歌也全面拥抱人工智能(ai)智能体(agent)。在开发者大会上,谷歌宣布要让智能体全面进驻谷歌的主打业务搜索以及ai助手gemini,并通过gemini与搜索结合,推出全新的ai模式搜索。

当地时间5月20日,谷歌2025年度i/o开发者大会的主题演讲展示了在ai、多模态模型、跨设备整合与开发者工具方面的最新成果。从升级后的gemini 2.5 pro模型到智能眼镜的xr应用,再到ai驱动的搜索与网页浏览体验。谷歌展现的不仅是模型的性能提升,更是ai从“信息工具”进化为“通用智能体”的进步。

本次发布内容主要包括:

模型:gemini 2.5 pro/flash/deepthink;diffusion;imagine 4;lyria;

应用:gemini app、canvas、chrome助理、ai mode、agent模式;

搜索:ai overview+mode;支持个性化、多步推理、自动执行任务;

创作:flow平台、文本转图像、图像转视频、原生音频合成|

硬件:android xr头显、智能眼镜原型、wearos、车载整合

谷歌最强通用ai模型gemini 2.5 pro

刚开场,登台的alphabet兼谷歌ceo皮查伊(sundar pichai)就强调了gemini的重要性,称“在谷歌,每天都是gemini季”,并力推新模型gemini 2.5 pro——“迄今为止我们最强大的通用ai模型”。

皮查伊说,自上次i/o大会以来,谷歌已推出十多款模型和20项ai功能,谷歌的发布速度已经是史上最快:

“我们希望尽快将最好的模型和产品交到大家手中,因此我们的发布速度比以往任何时候都快。”

皮查伊透露,gemini 2.5 pro模型已在大语言模型(llm)测评llm arena的所有类别排行榜上名列前茅。gemini是热门ai代码编辑器cursor上增长最快的模型。

他介绍,一年来,谷歌系统每月处理的token数量激增,从去年的9.7万亿增加到现在的480万亿,增长将近50倍。gemini的app每月有4亿多活跃用户。

“智能体模式”将上线chrome、搜索及gemini app

皮查伊宣布,谷歌将在chrome浏览器、搜索以及gemini的app中推出智能体模式(agent mode)。

智能体可以与浏览器和其他软件进行交互和操作。谷歌研究的ai智能体mariner现在可以同时管理多达10个任务,用户只需向其展示一次任务,它就会学习该任务,并将经验用于未来的案例。

智能体模式的实验版即将向gemini app的订阅者推出。

皮查伊现场演示gemini app中的智能体模式,要求它帮用户找公寓。得到指令后,gemini搜索房产网zillow,用电脑调整筛选条件,并使用模型上下文协议mcp预约看房。

皮查伊评价:

“这是一个新兴的时代。将研究成果转化为现实的最佳方式就是让它真正发挥作用。”

他说,在经用户许可的情况下,gemini现在可以在各种app中以“私密安全”的方式使用个人信息。

在ai综述的基础上,谷歌在搜索引擎中正式推出由gemini2.5模型驱动的ai模式。由于ai的特性,用户可以向搜索引擎提出更复杂、更难的问题。谷歌表示,现在用户从搜索引擎中得到的不只是信息,而是智慧。

同声传译、全新AI模式搜索!谷歌重磅发布“最强通用AI模型” - 天天要闻

图片来源:视频截图

未来谷歌还将ai模式与用户邮箱等个人信息打通,提供个性化的建议。与此同时,同类ai工具中常见的“深度研究”功能也将集成在这个模式中。

同时通过将先进多模态模型和实时对话等功能结合,谷歌也将在今年夏天推出实时影像搜索功能。用户可以开着摄像头向ai实时提问。

同声传译、全新AI模式搜索!谷歌重磅发布“最强通用AI模型” - 天天要闻

图片来源:视频截图

谷歌搜索添加ai模式标签页支持长达数百字提问

皮查伊称ai概览(ai overviews)是谷歌最成功的产品之一,每月有15亿用户在搜索中使用ai概览,它推动某些类型的查询增长了10%。这意味着,谷歌提供生成式ai服务的用户规模超过其他公司。

gemini模型将与谷歌搜索集合。它将通过ai模式(ai mode)增强智能,成为一种强大的新型ai搜索功能,可帮助解答问题。它是搜索中的新标签页,也将包含在ai概览中。

作为全新的搜索功能,ai模式让用户可以提出更长、更复杂的查询。它支持长达数百字的提问、自动分解查询意图、并生成结构化答案。该模式当地时间5月20日就上线,作为搜索的新标签页形势,向所有美国的用户推出。

新版本中,用户可以:

直接通过自然语言发问,系统会提供摘要式、结构化回答。

与搜索结果进行多轮对话,进一步深入了解相关内容。

获取图文并茂的“智能回答卡片”,例如自动整理出旅游行程、购物建议、编程指南等。

皮查伊称:“我们正在重新定义搜索的未来。不是找到链接,而是直接给出答案。”

谷歌搜索负责人liz reid介绍,ai模式会得到名为deep research的模型加持,谷歌称之为“深度搜索”(deepsearch)。该模型将通过逻辑搜索结果和高度相关的内容,更好地整理研究主题。

“就像你身边有一位博学助理。”它还会结合地图、评论、视频等生成图表和推荐内容。

reid说,ai模式将拥有谷歌所有最优秀的ai特性和功能。“随着时间的推移,我们将逐步将ai模式的许多尖端特性和功能融入核心搜索体验。”她还说,ai模式现在就将支持ai概览

谷歌光束、同声传译功能

谷歌光束(google beam):极具未来主义的视频会议设备,从不同角度捕捉用户影像,使用ai技术将这些视频流合并,并在3d光场显示器上呈现用户的3d形象,帧率最高可达每秒60帧。首批“谷歌光束”设备将于今年晚些时候通过合作伙伴惠普推出,具体定价尚不清楚。

同声传译、全新AI模式搜索!谷歌重磅发布“最强通用AI模型” - 天天要闻

图片来源:视频截图

同声传译:在谷歌会议软件google meet中,用户可以使用不同语言进行实时对话,同时保留原声的音色、语调和情感表达。目前已经向订阅用户开放英语和西班牙语之间的实时翻译,未来几周将陆续增加意大利语、德语和葡萄牙语等更多语言。

同声传译、全新AI模式搜索!谷歌重磅发布“最强通用AI模型” - 天天要闻

图片来源:视频截图

此外,ai模式下也将提供购物决策的全流程支持——从“买什么”到“去哪里买”一步到位。谷歌也在实验室中推出虚拟试穿衣服工具,用户可以上传一张自己的照片,直观感受购物车里的衣服“穿在”自己身上的样子。

同声传译、全新AI模式搜索!谷歌重磅发布“最强通用AI模型” - 天天要闻

ai视频生成制作工具flow

这款工具旨在简化ai生成视频的创作流程。flow与veo 3视频生成模型,针对veo 2模型的更多控制功能,以及图像生成模型imagen 4一同亮相。

同声传译、全新AI模式搜索!谷歌重磅发布“最强通用AI模型” - 天天要闻

通过flow,用户可以通过文字或图片素材生成8秒的ai视频片段,随后使用flow的场景构建工具将多个片段拼接成完整视频。

与此同时, veo 3模型不仅生成质量更高、理解提示词更准确,还能同步生成视频和音频,包括不同角色的对话。此外,veo 2将增加相机控制和对象移除等工具,imagen 4在生成图片时也能准确生成真实文本,而不是一堆乱码。

推出的安卓xr平台针对一系列ai眼镜设备

谷歌工程主管shahram izadi介绍称,除了手机外,未来几个月里谷歌将会把gemini ai功能拓展至智能手表、汽车控制台、电视上,以及你的眼镜上。

izadi介绍称,谷歌推出的安卓xr平台针对一系列ai眼镜设备,意味着每个人可能会购买不止一副ai眼镜。例如看电影或者工作时,你需要更具沉浸感的头戴式设备;而出行购物时,你会需要轻便的眼镜提供实时信息。

同声传译、全新AI模式搜索!谷歌重磅发布“最强通用AI模型” - 天天要闻

图片来源:视频截图

安卓xr是谷歌与三星、高通一起开发的平台,自从去年公布项目后,现在已经有数百家软件开发商为这个平台提供适配。三星的project moohan是第一款安卓xr设备,并将在今年晚些时候开放购买。

谷歌也宣布,与中国ar品牌xreal达成战略合作,以project aura的名义推出第二款安卓xr设备,也是首款搭载安卓xr平台的ar眼镜。


来源:红星新闻等

科技分类资讯推荐

OpenAI控诉微软反竞争行为 科技巨头合作现裂痕 - 天天要闻

OpenAI控诉微软反竞争行为 科技巨头合作现裂痕

科技界最受瞩目的“联姻”正面临严峻考验。微软与OpenAI这对曾被视作天作之合的AI黄金搭档,如今关系紧张到可能重塑整个人工智能产业格局。这场风波始于OpenAI宣布从非营利组织转型为营利公司的计划。本该是常规的商业决策,却因微软对OpenAI未来拥有重大话语权而演变成复杂对峙。资金链背后的控制权博弈OpenAI亟需微软批准...
618存量之战:电商平台重新定义“增长” - 天天要闻

618存量之战:电商平台重新定义“增长”

当618走到第17个年头,这一曾经被电商平台及大小商家寄予厚望的“消费狂欢节”,正在趋于平静。跟去年相比提前了近一周,前后跨度超过一个月,这一承载着中国电商产业高速增长记忆的促销节点,随着消费市场的变化,正在悄然转型。
华为鸿蒙 HarmonyOS NEXT 系统新版实况窗通用胶囊模板发布 - 天天要闻

华为鸿蒙 HarmonyOS NEXT 系统新版实况窗通用胶囊模板发布

IT之家 6 月 19 日消息,在 6 月 11 日举行的华为 Pura 80 系列及全场景新品发布会上,华为全新实况窗正式亮相,号称“无需打开应用状态一眼便知”。IT之家注意到,华为开发者联盟官网现发布了新版实况窗通用胶囊模板。据介绍,新版实况窗拥有三种设备样式,将在挖孔居中的设备上进行软硬结合的显示,与状态栏固定元素(时...
【关注】三级医院评审标准深度迭代1:2025版精简架构与效能升级 - 天天要闻

【关注】三级医院评审标准深度迭代1:2025版精简架构与效能升级

摘要:《三级医院评审标准(2025 年版)》相较 2022 年版实现大幅精简与效能升级。结构上,从三大部分、107 节、364 条、24247 字精简为两大部分、97 节、232 条、9370 字,精简幅度超 63%,并删除 “现场检查” 独立章节,转向常态监测与内涵建设。标准说明部分定位更精准,划分为修订与使用说明板块,内容更详实;前置要...
机器人怎么变成了“果农”?|新质生产力调研 - 天天要闻

机器人怎么变成了“果农”?|新质生产力调研

编者按:发展“新质生产力”正成为我国推动高质量发展的内在要求和重要着力点。2024年2月29日,中共中央政治局会议指出,要大力推进现代化产业体系建设,加快发展新质生产力。为调研新质生产力的发展成果,财联社、《科创板日报》联合推出“新质生产力专题调研”。本次,新质生产力专题调研团走进中国联通重庆市分公司,实...
全闪存NAS遇上飞牛系统:零刻 ME mini 主机是否有惊喜呢? - 天天要闻

全闪存NAS遇上飞牛系统:零刻 ME mini 主机是否有惊喜呢?

作为一名数码极客玩家来讲,全闪存NAS我也尝试过好几台了。自己也深知全闪存NAS就是一小撮极客玩家才会尝试的产品,但是这样的产品也确实给我带来了不少的乐趣,出色的硬件性能以及低功耗高性能的特点都不断吸引我去尝试。正好我也拿到了零刻ME mi
广西首台工业版人形机器人在柳州下线,将进入车企开展实训 - 天天要闻

广西首台工业版人形机器人在柳州下线,将进入车企开展实训

IT之家 6 月 18 日消息,综合央视新闻、柳州日报报道,广西首台工业版人形机器人 6 月 18 日在柳州下线,填补了广西在高端机器人核心部件及整机制造领域的空白。这台机器人是来自柳州优必选智能科技有限公司的 Walker S1,此次共下线 20 台。与传统机械臂相比,工业版人形机器人凭借其类人形态、灵活关节及强大的智能决策能...
华为汪涛:解锁5G-A潜能,共赢移动AI时代 - 天天要闻

华为汪涛:解锁5G-A潜能,共赢移动AI时代

潮新闻客户端 记者 张云山 在2025 MWC 上海期间举办的全球移动宽带菁英论坛上,华为常务董事汪涛发表了“共赢移动AI时代:解锁5G-A潜能,释放商业价值”主题演讲。他表示,移动AI时....