
本文來自微信公眾號:直面AI,作者:小金牙,編輯:肖陽,題圖來自:視覺中國
又是一年谷歌I/O開發者大會,不出所料地,主題演講又是一場AI交響樂。去年,「AI」一詞在谷歌I/O大會上被提及120次,今年依然是主角,被提及92次。
其中最受關注的,是谷歌將AI更深入地植入搜索及Chrome瀏覽器:
谷歌搜索將不滿足於在生成結果中顯示「谷歌摘要」,而是直接會在結果分類中新增「AI模式」標籤,展示效果類似獨立AI搜索應用。
Chrome瀏覽器中將加入Gemini AI助手,未來將能夠「跨多個標籤頁工作,並代表用戶瀏覽網站。

這是谷歌對近期爭議的直接回應。一方面,谷歌搜索被唱衰。蘋果高管聲稱谷歌搜索受到Perplexity、ChatGPT等競品的挑戰,Safari瀏覽器的搜索量(默認引擎是谷歌搜索)出現2022年以來首次下降。
另一方面,AI初創公司開始對瀏覽器虎視眈眈,Chrome也在被重新審視。Perplexity即將發佈瀏覽器,名字都起好了。而OpenAI也有類似傳言,並直言有興趣收購Chrome。
谷歌對搜索和瀏覽器的進一步升級,在表明其「繼續偉大」的決心。
當然,本次谷歌I/O大會主題演講的亮點不止於此,還有安卓XR平台最新進展、3D視頻聊天項目升級、文生圖工具Imagen和文生視頻工具Veo升級、AI電影製作應用推出、Project Astra更加主動等等。
谷歌幾乎要把所有東西用AI重做一遍了。
一、谷歌搜索的「AI模式」與Chrome的Gemini
在去年的I/O大會上,谷歌推出了搜索中的「AI摘要」功能。
簡而言之,就是搜索的時候,在最上部會形成一個AI生成的摘要,幫助用戶進行總結(百度也有類似的功能)。AI摘要推出後,也出了一些岔子,比如老生常談的幻覺問題。
如今,谷歌更進一步,宣布要為搜索添加「AI模式」。
「AI模式」的入口將與「全部」「圖像」「諮詢」等並列,且位於首位,在搜索框下部顯示。

在AI模式下,用戶用自然語言給出搜索請求,模型直接生成總結式的回答,以圖文形式展示,並在右邊給出相關網頁。
AI 模式使用谷歌的前沿模型,並利用了該公司所謂的「查詢扇出」技術。谷歌表示,該方法將用戶的查詢分解為更小的子主題,同時運行多個單獨的搜索。谷歌解釋說,這使得 AI 模式能夠執行比傳統谷歌搜索更深入的搜索。
不難看出,使用體驗和任何主流AI應用的搜索模式並無二致。但這對谷歌來說是一大步,既是對Perplexity、ChatGPT等挑戰者的回應,也是對自身長久以來關鍵詞-網頁結果的搜索邏輯的一種內部顛覆。
另一項重大改變,是Gemini AI助手將被接入Chrome瀏覽器。
在 Chrome 瀏覽器中,你會在右上角看到一個閃閃發光的小圖標。點擊它,Gemini 聊天機械人窗口就會打開——它是一個浮動的 UI,你可以移動它並調整其大小。在那裡,你可以詢問關於網站的問題。

最初,用戶可以在瀏覽各個標籤頁時使用 Gemini 進行對話。但「今年晚些時候」,Chrome 中的 Gemini 將允許用戶一次選擇多個標籤頁,並針對所有標籤頁提出問題。
進一步地,谷歌未來會讓Gemini可以不僅僅是為你總結和答疑,也能直接代勞幫你瀏覽網頁。在某個演示中,在 Chrome 瀏覽器中打開 Gemini Live,幫助瀏覽一個食譜網站。用戶要求 Gemini 滾動到配料部分,AI 便會快速跳轉到該部分。用戶請求 Gemini 幫助將所需的糖量從杯轉換為克時,Gemini 也做出了響應。
沒錯,未來的想像空間依然是留給AI Agent的。
二、谷歌助手走開,Gemini助手上位
最近風很大的Agent,谷歌自然也不會缺席。從谷歌對Gemini助手的野望當中就可以看到端倪。
先梳理一下關係:谷歌從很早以前開始就有一個助手應用,叫谷歌助手(Google Assistant),但是如今Gemini應用正在擔負起未來真正「超級助手」的期待。
其中Gemini Live是「助手」這一角色的絕佳體現。

在這個功能之下,用戶不用費勁去描述自己看到的,或者發送圖片等素材,讓AI去分析,而是可以直接讓AI「看到」屏幕上的內容或者是通過攝像頭讓AI「看到」周遭的事物。然後,AI就可以像一個真正的小幫手一樣,為你排憂解難。
Gemini Live具有攝像頭和屏幕共享功能,現在可在 Android 和 iOS 上免費供所有人使用,因此用戶可以將手機對準任何物體並通過語音進行交談。
在I/O開發者大會上,谷歌宣布將其Frontier Gemini 2.5 Pro模型擴展為「世界模型」,這意味着它將能夠理解所見事物,並據谷歌稱制定計劃。用人工智能的術語來說,它正在變得更加具有代理性。
谷歌DeepMind首席執行官Demis Hassabis表示,這些更新是構建「通用AI助手」的「關鍵步驟」,可以更好地理解用戶並代表他們採取行動。
未來還會有什麼新進展?Gemini Live是對谷歌早先啟動的項目Project Astra的延伸,一個利用視覺感知周圍世界的AI代理。值得一提的是,本次I/O大會上,能看到Project Astra變得更加「主動」。

在可以利用手機攝像頭「觀察」你周圍物體的基礎上,它可以讓它代替你完成任務,即使你沒有明確要求它這樣做。比如它可以根據它所看到的內容選擇說話,比如指出你作業中的錯誤。
谷歌勾勒的「通用AI助手」頗為誘人,一個可以隨處陪伴你的助手——無論是在你的手機里,還是在一副增強現實眼鏡里——它能夠在幾秒鐘內感知世界、回答問題並向你傳遞信息。
三、Gemini其實是個藝術家
創意專業人士和程序員請注意:谷歌對其創意工具的增強要麼會讓你的工作更輕鬆、更高效,要麼會讓你變得過時。
值得關注的有兩個迭代和兩個新產品。
首先說迭代。
在本次I/O大會上,谷歌對圖像生成模型和視頻生成模型都進行了迭代,分別推出了Imagen 4和Veo 3。
Imagen 4能夠渲染織物、水滴和動物毛髮等「精細細節」。該模型既能處理照片級寫實風格,也能處理抽象風格,能夠創建各種寬高比、分辨率高達 2K 的圖像。谷歌實驗室負責人 Josh Woodward 在新聞發佈會上表示:「我們還投入了大量精力,並針對其生成文本和地形的方式進行了改進,因此它非常適合製作幻燈片、邀請函,或者任何其他需要融合圖像和文字的內容。」

從ChatGPT內置的熱門功能到Midjourney V7,市面上的AI圖像工具琳琅滿目,Imagen 4的競爭力是什麼?除了前述特長,谷歌還指出,Imagen 4 速度很快——比 Imagen 3 還要快。而且它很快就會變得更快。在不久的將來,谷歌計劃發佈 Imagen 4 的一個變體,其速度將比 Imagen 3快10 倍。
Veo 3,毋庸置疑,是OpenAI Sora的競品。這次,谷歌也在差異化優勢上下了功夫。
那就是——Veo 3的視頻+音頻輸出,可以生成帶有聲音的視頻。例如,它可以創建帶有鳥鳴音頻的鳥類視頻,或者創建帶有交通噪音的城市街道視頻,也可以在視頻中融入角色對話。
這並不是一個可以自動給生成的視頻「配音」的工具,但是谷歌對其好用程度很有信心。谷歌表示,Veo 3 在真實世界物理和唇形同步方面也表現出色。
再說新產品。
谷歌推出了一款全新產品Flow,定義其為「AI電影製作工具」。
Flow將Veo、Imagen和Gemini整合在一起,打造電影級的剪輯和場景。用戶可以用自然語言描述他們想要的最終輸出效果,Flow會立即為他們製作。

具體點來說,使用Flow,用戶可以使用文本轉視頻提示和素材轉視頻提示等功能(基本上,分享幾張圖片,Flow可以結合提示來使用它們,幫助模型了解您想要的內容),來製作時長8秒的AI生成短片。然後,用戶還可以使用Flow的場景構建工具將多個短片拼接在一起。
谷歌在官方博文中提供了幾個利用Flow製作的「電影」案例,時長數分鐘,其中的人物、背景、質感都相當穩定。
接下來的這個新產品就和影音無關了,谷歌推出了一個「異步編碼代理」Jules,旨在讓你把餐巾紙上潦草寫下的粗略設計變成完整的代碼或圖形設計,同時向你展示它在此過程中所做的工作。
四、XR眼鏡怎麼能少了谷歌?
另外一個I/O大會主題演講中不能忽視的亮點,是安卓XR(Android XR)的最新進展。
該系統去年12月發佈,專為 XR 頭顯、智能眼鏡等擴展現實設備設計,通過與AI深度整合實現「無接觸輔助」功能。
谷歌盯上XR生態並不令人意外。谷歌的安卓系統是智能手機時代最重要的底層操作系統之一,而XR設備被視為是下一代智能終端的潛力股。此前Meta就一度想要開發XR操作系統,做XR時代的「安卓」(但是沒能成功)。
谷歌希望在增強現實、混合現實和虛擬現實領域實現 Android 在智能手機領域所取得的成就。
這次,谷歌宣布將與 Gentle Monster、Warby Parker 等眼鏡品牌攜手,推出更多具備時尚設計感的智能眼鏡產品。與此同時,谷歌也將與開雲眼鏡等更多合作夥伴展開聯動。為進一步推動技術生態,谷歌還將深化與三星的合作,聯合打造專為眼鏡類設備設計的軟硬件參考平台,預計開發者將在今年晚些時候獲得適配支持。

值得一提的是,在大會上,中國科技公司Xreal 發佈了 Project Aura,這是搭載 Android XR 平台的第二款官方設備。谷歌和 Xreal 計劃在 2025 年 6 月的增強現實世界博覽會(AWE)上公布更多關於 Project Aura 的消息。
本文來自微信公眾號:直面AI,作者:小金牙,編輯:肖陽
本內容為作者獨立觀點,不代表虎嗅立場。未經允許不得轉載,授權事宜請聯繫 [email protected]
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4373994.html?f=jinritoutiao