谷歌最強視頻生成AI模型Veo3亮相:背景音、人物對話都不在話下

2025年05月21日04:00:16 科技 7214

it之家 5 月 21 日消息,在今年的 i/o 開發者大會上,谷歌發布新一代視頻生成模型 veo3,這也是其首個可生成視頻背景音效的模型。它不僅能合成畫面,還能為鳥鳴或街頭交通等場景配上相應的音效,甚至還可生成人物對話。

谷歌最強視頻生成AI模型Veo3亮相:背景音、人物對話都不在話下 - 天天要聞

谷歌稱,veo 3 在物理模擬與口型同步方面也表現優異。目前,該模型僅面向美國地區的 gemini ultra 用戶,以及 vertex ai 的企業用戶開放,也已集成進谷歌的 ai 影視製作工具 flow 中。

谷歌最強視頻生成AI模型Veo3亮相:背景音、人物對話都不在話下 - 天天要聞

用戶仍可為 veo 2 提供人物、風格、場景或物體的圖像參考,並通過 flow 使用鏡頭控制功能進行旋轉、縮放,甚至將畫面從豎屏調整為橫屏,或在視頻中添加、刪除元素。

當前用戶越來越難以辨別 ai 生成內容,谷歌為此推出了 synthid detector。用戶可上傳媒體文件以檢測其是否包含 synthid 水印,這是谷歌用於識別 ai 作品的標記工具。不過,目前並非所有圖像生成模型都支持這一水印。

谷歌 i/o 開發者大會仍在進行,it之家將保持關注。

科技分類資訊推薦

感謝南航機長不殺之恩 - 天天要聞

感謝南航機長不殺之恩

作者:朱文強 7月1日上午,南航吉林分公司機長李煜眾從南航長春基地縱身躍下,結束了自己年僅31歲的生命。 墜樓前,李煜眾持刀扎傷兩位上級,此事被當地公安列為刑事案件偵辦,據官方通....
雷軍都勸你看看小鵬和理想!小米YU7爆賣24萬台,卻一車難提 - 天天要聞

雷軍都勸你看看小鵬和理想!小米YU7爆賣24萬台,卻一車難提

雷軍大概沒想到,有一天自己也得站在直播間里,給友商拉業務。不是因為慈悲,而是因為——實在產不出來了。一句「急著用車的朋友,可以看看小鵬和理想」,聽著像佛系推薦,實則是一個被24萬個訂單砸懵的CEO,在高壓鍋里憋出的無奈求生欲。而更好笑的是,
失去靈魂!現在的微波爐怎麼不會轉圈了? - 天天要聞

失去靈魂!現在的微波爐怎麼不會轉圈了?

傳統印象中,微波爐是與「旋轉」緊密聯繫的電器。擰下旋鈕,玻璃轉盤帶動食物在溫暖的黃光中旋轉——然後,伴隨著「叮」的一聲,熱氣騰騰的飯菜就可以上桌了。甚至連微波加熱都叫「轉一下」,旋轉可以說是微波爐的靈魂 | BuzzFeed/giphy然而
山西省2025年全民數字素養與技能提升月現場活動成功舉辦 - 天天要聞

山西省2025年全民數字素養與技能提升月現場活動成功舉辦

山西省2025年全民數字素養與技能提升月現場活動。記者 錢龍 攝7月4日下午,山西省2025年全民數字素養與技能提升月現場活動在太原舉辦。活動中,中央網信辦信息化發展局二級巡視員喬燕婷,省委宣傳部副部長、省委網信辦(省網信辦)主任劉鵬,省人社廳副廳長吳海亮先後致辭,省委網信辦、省發改委、省數據局聯合發布山西省人...
中國手機市場新格局:華為奪魁,小米放緩,蘋果重返前三 - 天天要聞

中國手機市場新格局:華為奪魁,小米放緩,蘋果重返前三

在國補政策的推動下,多家手機品牌煥發了新的生機。今年二季度,在國補和渠道降價疊加618購物節的推動下,蘋果重返中國市場前三。「蘋果在5月調整iPhone價格的時機非常合適,且反響良好,恰好趕在618促銷前一周啟動。」Counterpoint研究副總監Ethan Qi評論道。不同於往年的發展,今年全球手機市場在多種不確定性因素的影響...