谷歌最強視頻生成AI模型Veo3亮相:背景音、人物對話都不在話下

2025年05月21日04:00:16 科技 7214

it之家 5 月 21 日消息,在今年的 i/o 開發者大會上,谷歌發布新一代視頻生成模型 veo3,這也是其首個可生成視頻背景音效的模型。它不僅能合成畫面,還能為鳥鳴或街頭交通等場景配上相應的音效,甚至還可生成人物對話。

谷歌最強視頻生成AI模型Veo3亮相:背景音、人物對話都不在話下 - 天天要聞

谷歌稱,veo 3 在物理模擬與口型同步方面也表現優異。目前,該模型僅面向美國地區的 gemini ultra 用戶,以及 vertex ai 的企業用戶開放,也已集成進谷歌的 ai 影視製作工具 flow 中。

谷歌最強視頻生成AI模型Veo3亮相:背景音、人物對話都不在話下 - 天天要聞

用戶仍可為 veo 2 提供人物、風格、場景或物體的圖像參考,並通過 flow 使用鏡頭控制功能進行旋轉、縮放,甚至將畫面從豎屏調整為橫屏,或在視頻中添加、刪除元素。

當前用戶越來越難以辨別 ai 生成內容,谷歌為此推出了 synthid detector。用戶可上傳媒體文件以檢測其是否包含 synthid 水印,這是谷歌用於識別 ai 作品的標記工具。不過,目前並非所有圖像生成模型都支持這一水印。

谷歌 i/o 開發者大會仍在進行,it之家將保持關注。

科技分類資訊推薦

影像重慶 數創未來|重慶衛視數字文創基地搭建發布平台:用數智技術創造影像重慶新未來 - 天天要聞

影像重慶 數創未來|重慶衛視數字文創基地搭建發布平台:用數智技術創造影像重慶新未來

5月21日重慶衛視數字文創基地開園及項目發布會將發布“用數智技術創造影像重慶新未來”項目發布單位:影像重慶創作人聯盟 以下為項目簡介這些……這些…… 還有這些……這些作品是不是都曾驚艷過你? 你知道嗎這一部部流量爆款一幀幀出圈的光影其實,皆為重慶造! 曾實——用數字影像演繹重慶的文化符號 劉軍——用數...
突發,華為麒麟8020來了! - 天天要聞

突發,華為麒麟8020來了!

華為nova14系列發布之後,大家比較關心的問題,就是搭載什麼型號的處理器。在正式發布之前,外界對華為nova14系列的猜測,普遍認為會搭載最新的華為麒麟8010處理器和麒麟9010處理器。但是,當華為nova14系列正式發布之後,大家才發
小米15SPro今天亮相了,但大招不只一個 - 天天要聞

小米15SPro今天亮相了,但大招不只一個

這幾天熱度最高的話題,應當要數小米玄戒O1了。自從雷軍官宣小米玄戒O1處理器之後,網友們對玄戒O1的性能、規格都十分好奇。都想知道,自從小米發布澎湃S1處理器之後,第二款手機處理器的表現到底如何。
微星500Hz顯示器正式上市 MAG 272QP QD-OLED X50電腦展登場 - 天天要聞

微星500Hz顯示器正式上市 MAG 272QP QD-OLED X50電腦展登場

微星在今天的COMPUTEX 2025電腦展上展出了曾在CES亮相過的MAG 272QP QD-OLED X50顯示器,這款顯示器不僅採用了新一代QD-OLED面板技術,還提供500Hz的超高刷新率,可以說是目前FPS遊戲玩家能體驗到的最為流暢的顯示器產品之一。微星MAG 272QP QD-OLED X50顯示器不僅帶來了500Hz刷新率,得益於QD-OLE
理想L系列智能煥新版:重塑家庭出行新標準 - 天天要聞

理想L系列智能煥新版:重塑家庭出行新標準

2025年5月8日,理想L系列智能煥新版的發布,在汽車市場投下重磅炸彈。此次升級涵蓋輔助駕駛、底盤、座艙等多個維度,不僅是產品力的提升,更是理想汽車對家庭出行需求深度洞察後的戰略布局,有望重塑家庭出行新標準。
谷歌最強文生圖 AI 模型 Imagen 4 亮相,比上一代快 10 倍 - 天天要聞

谷歌最強文生圖 AI 模型 Imagen 4 亮相,比上一代快 10 倍

IT之家 5 月 21 日消息,谷歌的文生圖 AI 模型迎來 Imagen 4 最新版本,號稱比上一代快 10 倍。Imagen 4 生成的圖像更精緻,細節更豐富,AI 味道也更少,IT之家附官方示例如下:此外,Imagen 4 可以更好地生成文字、排版設計,比如下方的海報:...
谷歌 AI Pro 和 AI Ultra 訂閱計劃公布,每月 19.99 美元起 - 天天要聞

谷歌 AI Pro 和 AI Ultra 訂閱計劃公布,每月 19.99 美元起

IT之家 5 月 21 日消息,谷歌在今日發布了多個 AI 工具的重大更新,包括 Gemini、Flow 等。谷歌將推出兩個訂閱等級,為用戶提供一站式 AI 服務。Google AI Pro 訂閱價格為每月 19.99 美元(IT之家註:現匯率約合 144 元人民幣),包括 Gemini 2.5 Pro、視頻生成模式 Veo 2,以及 2TB 雲存儲。新的
谷歌最強視頻生成AI模型Veo3亮相:背景音、人物對話都不在話下 - 天天要聞

谷歌最強視頻生成AI模型Veo3亮相:背景音、人物對話都不在話下

IT之家 5 月 21 日消息,在今年的 I/O 開發者大會上,谷歌發布新一代視頻生成模型 Veo3,這也是其首個可生成視頻背景音效的模型。它不僅能合成畫面,還能為鳥鳴或街頭交通等場景配上相應的音效,甚至還可生成人物對話。 谷歌稱,Veo 3 在物理模擬與口型同步方面也表現優異。目前,該模型僅面向美國地區的 Gemini Ultra 用戶...
首款 Android XR 設備:三星 Project Moohan 頭顯亮相 - 天天要聞

首款 Android XR 設備:三星 Project Moohan 頭顯亮相

IT之家 5 月 21 日消息,谷歌今日公布了 Android XR 的最新進展,首款 Android XR 設備 —— 三星 Project Moohan 正式亮相。該頭顯採用了簡潔的設計,類似蘋果 Vision Pro,不過是採用安卓生態,並支持谷歌 Gemini。該頭顯允許用戶與 Gemini 談論看到的一切,無論是現實世界還是虛擬屏幕。Project
谷歌第二款官方Android XR設備:Xreal Project Aura智能眼鏡發布 - 天天要聞

谷歌第二款官方Android XR設備:Xreal Project Aura智能眼鏡發布

IT之家 5 月 21 日消息,在今年的谷歌 I/O 大會上,Xreal 發布了 Project Aura,這是搭載 Android XR 平台的第二款官方設備。該產品是一副輕量級的智能眼鏡,搭載高通驍龍處理器(IT之家註:未公布具體型號)。根據谷歌與 Xreal 的說法,這款設備融合了 Gemini AI,既能實現光學透視(OST),也能提供虛擬透視(VS