Meta「AI導演」一句話搞定視頻素材,網友:我已跟不上AI發展速度

2022年09月30日13:10:23 科技 1973

魚羊 Alex 發自 凹非寺

量子位 | 公眾號 QbitAI

Meta「AI導演」一句話搞定視頻素材,網友:我已跟不上AI發展速度 - 天天要聞

畫家執筆在畫布上戳戳點點,形成手繪作品獨有的筆觸。

你以為這是哪部紀錄片的畫面?

No,No,No!

視頻里的每一幀,都是AI生成的

還是你告訴它,來段「畫筆在畫布上的特寫」,它就能直接整出畫面的那種。

不僅能無中生畫筆,按著馬頭喝水也不是不可以。

同樣是一句「馬兒喝水」,這隻AI就拋出了這樣的畫面:

Meta「AI導演」一句話搞定視頻素材,網友:我已跟不上AI發展速度 - 天天要聞

好傢夥,這是以後拍視頻真能全靠一張嘴的節奏啊……

不錯,那廂一句話讓AI畫畫的Text to Image正搞得風生水起,這廂Meta AI的研究人員又雙叒給生成AI來了個超進化。

這回是真能「用嘴做視頻」了:

AI名為Make-A-Video,直接從DALL·E、Stable Diffusion搞火的靜態生成飛升動態。

給它幾個單詞或幾行文字,就能生成這個世界上其實並不存在的視頻畫面,掌握的風格還很多元。

不僅紀錄片風格能hold住,整點科幻效果也沒啥問題。

Meta「AI導演」一句話搞定視頻素材,網友:我已跟不上AI發展速度 - 天天要聞

兩種風格混合一下,機器人在時代廣場蹦迪的畫面好像也沒啥違和感。

Meta「AI導演」一句話搞定視頻素材,網友:我已跟不上AI發展速度 - 天天要聞

文藝小清新的動畫風格,看樣子Make-A-Video也把握住了。

Meta「AI導演」一句話搞定視頻素材,網友:我已跟不上AI發展速度 - 天天要聞

這麼一波操作下來,那真是把不少網友都看懵了,連評論都簡化到了三個字母:

Meta「AI導演」一句話搞定視頻素材,網友:我已跟不上AI發展速度 - 天天要聞

而大佬LeCun則意味深長地表示:該來的總是會來的。

Meta「AI導演」一句話搞定視頻素材,網友:我已跟不上AI發展速度 - 天天要聞

畢竟一句話生成視頻這事兒,之前就有不少業內人士覺得「快了快了」。只不過Meta這一手,確實有點神速:

比我想像中快了9個月。

Meta「AI導演」一句話搞定視頻素材,網友:我已跟不上AI發展速度 - 天天要聞

甚至還有人表示:我已經有點適應不了AI的進化速度了……

Meta「AI導演」一句話搞定視頻素材,網友:我已跟不上AI發展速度 - 天天要聞

文本圖像生成模型超進化版

你可能會覺得Make-A-Video是個視頻版的DALL·E。

實際上,差不多就是這麼回事兒(手動狗頭)

前面提到,Make-A-Video是文本圖像生成(T2I)模型的超進化,那是因為這個AI工作的第一步,其實還是依靠文本生成圖像。

從數據的角度來說,就是DALL·E等靜態圖像生成模型的訓練數據,是成對的文本-圖像數據。

而Make-A-Video雖然最終生成的是視頻,但並沒有專門用成對的文本-視頻數據訓練,而是依然靠文本-圖像對數據,來讓AI學會根據文字復現畫面。

視頻數據當然也有涉及,但主要是使用單獨的視頻片段來教給AI真實世界的運動方式。


具體到模型架構上,Make-A-Video主要由三部分組成:

  • 文本圖像生成模型P
  • 時空卷積層和注意力層
  • 用於提高幀率的幀插值網路和兩個用來提升畫質的超分網路

整個模型的工作過程是醬嬸的:

首先,根據輸入文本生成圖像嵌入。

然後,解碼器Dt生成16幀64×64的RGB圖像。

插值網路↑F會對初步結果進行插值,以達到理想幀率。

接著,第一重超分網路會將畫面的解析度提高到256×256。第二重超分網路則繼續優化,將畫質進一步提升至768×768。

基於這樣的原理,Make-A-Video不僅能根據文字生成視頻,還具備了以下幾種能力。

將靜態圖像轉成視頻:

Meta「AI導演」一句話搞定視頻素材,網友:我已跟不上AI發展速度 - 天天要聞

根據前後兩張圖片生成一段視頻:

Meta「AI導演」一句話搞定視頻素材,網友:我已跟不上AI發展速度 - 天天要聞

根據原視頻生成新視頻:

Meta「AI導演」一句話搞定視頻素材,網友:我已跟不上AI發展速度 - 天天要聞

刷新文本視頻生成模型SOTA

其實,Meta的Make-A-Video並不是文本生成視頻(T2V)的首次嘗試。

比如,清華大學和智源在今年早些時候就推出了他們自研的「一句話生成視頻」AI:CogVideo,而且這是目前唯一一個開源的T2V模型。

更早之前,GODIVA和微軟的「女媧」也都實現過根據文字描述生成視頻。

不過這一次,Make-A-Video在生成質量上有明顯的提升。

在MSR-VTT數據集上的實驗結果顯示,在FID(13.17)和CLIPSIM(0.3049)兩項指標上,Make-A-Video都大幅刷新了SOTA。

Meta「AI導演」一句話搞定視頻素材,網友:我已跟不上AI發展速度 - 天天要聞

此外,Meta AI的團隊還使用了Imagen的DrawBench,進行人為主觀評估。

他們邀請測試者親身體驗Make-A-Video,主觀評估視頻與文本之間的邏輯對應關係。

結果顯示,Make-A-Video在質量和忠實度上都優於其他兩種方法。

Meta「AI導演」一句話搞定視頻素材,網友:我已跟不上AI發展速度 - 天天要聞

One More Thing

有意思的是,Meta發布新AI的同時,似乎也拉開了T2V模型競速的序幕。

Stable Diffusion的母公司StabilityAI就坐不住了,創始人兼CEO Emad放話道:

我們將發布一個比Make-A-Video更好的模型,大家都能用的那種!

Meta「AI導演」一句話搞定視頻素材,網友:我已跟不上AI發展速度 - 天天要聞

而就在前幾天,ICLR網站上也出現了一篇相關論文Phenaki

生成效果是這樣的:

Meta「AI導演」一句話搞定視頻素材,網友:我已跟不上AI發展速度 - 天天要聞

對了,雖然Make-A-Video尚未公開,但Meta AI官方也表示,準備推出一個Demo讓大家可以實際上手體驗,感興趣的小夥伴可以蹲一波了~

論文地址:
https://makeavideo.studio/Make-A-Video.pdf
參考鏈接:
[1]https://ai.facebook.com/blog/generative-ai-text-to-video/
[2]https://twitter.com/boztank/status/1575541759009964032
[3]https://twitter.com/ylecun/status/1575497338252304384
[4]https://www.theverge.com/2022/9/29/23378210/meta-text-to-video-ai-generation-make-a-video-model-dall-e
[5]https://phenaki.video

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態

科技分類資訊推薦

阿維塔12煥新升艙,價格下探至 26萬,還配三個激光雷達 - 天天要聞

阿維塔12煥新升艙,價格下探至 26萬,還配三個激光雷達

在「風阻係數」受質疑期間上市的2025款阿維塔12,顯得特別受人關注。日前,阿維塔12迎來了2025款煥新升艙。新車推出純電和增程雙動力,共6個車型版本,官方指導價為26. 99萬-42. 99萬元,權益後到手價為25. 99萬-41. 99萬元。阿維塔12新款車型新增岱紅內飾配色。搭配中控浮島樺木直排紋、炭灰色裝飾、Nappa真皮和超纖仿麂皮...
華為何剛:Mate40用戶至少還有千萬,升級鴻蒙5.0還沒結論 - 天天要聞

華為何剛:Mate40用戶至少還有千萬,升級鴻蒙5.0還沒結論

5月9日,華為終端BG CEO何剛回到母校西安電子科技大學,並出席鴻蒙校園公開課。被問及如何規劃華為Mate 40系列升級鴻蒙5.0的計劃,他表示,當前確實沒有結論,但聽到了該機型至少1000萬用戶升級的呼聲,接下來華為會認真分析怎麼做。 華為Mate 40系列是華為公司於2020年10月22日發布的手機,於2020年12月21日上市。Mate 40...
超能機器人推出「雛鷹計劃」,降低AI機器人創業門檻,縮短大學生創業團隊「從0到1」的周期—— 「我們要的不是打工人,而是AI機器人賽道的造夢者」 - 天天要聞

超能機器人推出「雛鷹計劃」,降低AI機器人創業門檻,縮短大學生創業團隊「從0到1」的周期—— 「我們要的不是打工人,而是AI機器人賽道的造夢者」

湖南日報全媒體記者 曹嫻 通訊員 許芳 近日,來自湖南工業大學和湖南科技大學4名大學生組成的創業團隊,在湖南超能機器人技術有限公司推出的「AI+機器人」大學生創業孵化計劃——「雛鷹計劃」中脫穎而出,憑藉清晰的商業化路徑獲得超能機器人「創業直通卡」。這支平均年齡約22歲的創業團隊,後續將參與「湘江1號」健康陪護...
民企打工人能當院士了 - 天天要聞

民企打工人能當院士了

近日,中國科學院、中國工程院分別發布2025年院士增選指南,兩年一度的院士增選工作正式啟動。 根據指南,兩院此次增選名額各增加最多100名。更令人矚目的是,中國工程院明確將8個名額主要用於....
通訊丨在國際光伏展感受中國「太陽能經濟」活力 - 天天要聞

通訊丨在國際光伏展感受中國「太陽能經濟」活力

新華社德國慕尼黑5月9日電 通訊|在國際光伏展感受中國「太陽能經濟」活力新華社記者車雲龍 黃燕為期三天的2025年歐洲國際太陽能展9日在德國慕尼黑閉幕。在這一全球光伏產業具有風向標意義的重要展會上,中國企業以創新產品和系統集成方面的強勁優勢贏得業界矚目。5月7日,參觀者在德國慕尼黑舉行的2025年歐洲國際太陽能展...
榮耀400系列預告片宣傳獨特的影像美學 - 天天要聞

榮耀400系列預告片宣傳獨特的影像美學

榮耀正在通過預告片宣傳榮耀 400 系列的影像美學。榮耀在X平台上分享了一段新的視頻片段,揭示了即將推出的數字智能手機系列的完整設計,突出了一些重大升級。根據我們之前報道,榮耀已確認榮耀 400 系列將於 5 月 22 日發布。
關於自動扣款,支付寶、微信緊急回應! - 天天要聞

關於自動扣款,支付寶、微信緊急回應!

近日「支付寶、微信 自動扣款服務」登上微博熱搜有網友發帖稱開通某個商家或APP的「先用後付」或「離店再付」之類的自動扣款服務後是給了對方直接扣款的授權,這一授權沒有期限,用過一次免密支付後商家隨時可以直接從賬戶扣款。不少網友擔心自己的資金安