文字生成圖像已經過時,Meta 推出文字生成視頻 AI 系統

2022年10月02日19:26:37 科技 1825

IT之家 10 月 2 日消息,Meta 公司近日發布了一個人工智慧系統,可以根據文字提示生成短視頻。

文字生成圖像已經過時,Meta 推出文字生成視頻 AI 系統 - 天天要聞

IT之家了解到,這個系統名為 Make-A-Video,允許用戶輸入一連串的詞語,比如「一隻穿著超級英雄服裝、披著紅色斗篷在天空中飛翔的狗」,然後生成一個五秒鐘的短視頻。

雖然效果相當粗糙,但這個系統顯然要比文字轉圖片 AI 系統更高級。

上個月,人工智慧實驗室 OpenAI 向所有人提供了其最新的文本轉圖像人工智慧系統 DALL-E,而人工智慧初創公司 Stability.AI 則推出了 Stable Diffusion,這是一個開源的文本轉圖像系統。

但文本轉視頻 AI 系統伴隨著一些更大的挑戰。首先,這些模型需要大量的計算能力。它們比大型文本到圖像的人工智慧模型的計算量還要大,後者使用數百萬張圖像進行訓練,因為僅僅拼湊一個短視頻就需要數百張圖像。這意味著在可預見的未來,只有大型科技公司才有能力建立這些系統。它們的訓練也比較棘手,因為沒有大規模的高質量視頻與文本配對的數據集。

為了解決這個問題,Meta 結合了三個開源圖像和視頻數據集的數據來訓練其模型。標準的文本轉圖像數據集的標記靜態圖像幫助人工智慧學習物體的名稱和它們的樣子。一個視頻資料庫幫助它學習這些物體應該如何在世界中移動。這兩種方法的結合幫助 Make-A-Video 能夠從文本中大規模地生成視頻。

Meta 公司稱,該技術可以「為創作者和藝術家帶來新的機會」。但是,隨著技術的發展,人們擔心它可能被用作創造和傳播錯誤信息和深度偽造的有力工具,它可能會使人們更難區分網上的真實和虛假內容。

打造 Make-A-Video 的研究人員過濾掉了攻擊性的圖片和文字,但對於由數百萬和數以百萬計的文字和圖片組成的數據集,幾乎不可能完全刪除有偏見和有害的內容。

Meta 公司的一位發言人說,目前還沒有向公眾提供這個模型,「作為這項研究的一部分,我們將繼續探索進一步完善和減少潛在風險的方法」。

科技分類資訊推薦

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略 - 天天要聞

長安與東風重組新進展:朱華榮稱不會改變長安既定戰略

2月9日,長安汽車和東風集團股份(00489.HK)同步發布了控股股東「正在與其他國資央企集團籌劃重組事項」的信息。長安汽車的控股股東是兵裝集團,而東風集團股份的控股股東是東風公司。隨即,長安汽車和東風集團這兩家汽車央企將合併重組,成為業內關注的焦點。
公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了 - 天天要聞

公安部出手了!年齡限制放寬10年、送考下鄉,2025年考駕照不難了

電動車加強管理以後,要求機動車類型的車輛需要持證上路,但是老年人考駕照卻受阻,一方面有年齡的限制,另一方面偏遠山區考駕照不方便,所以在2025年公安部出手了,年齡限制放寬10年,同時推出送考下鄉服務,還進一步的降低考駕照的費用,2025年起考摩托車駕照不難了。
從「星靈安全守護體系」到昊鉑HL,看懂廣汽科技日 - 天天要聞

從「星靈安全守護體系」到昊鉑HL,看懂廣汽科技日

發布會以技術切入,並全程圍繞安全展開。廣汽集團董事長、總經理馮興亞率先登場,宣布2025年四季度將正式上市支持L3級智能駕駛的車型,他同時強調面向自動駕駛時代對智能駕駛技術、整車安全架構以及突發風險處理能力的要求更高。如何才能滿足更高的要求?馮興亞提到了「廣汽
關稅大棒下,最受傷的車企出現了 - 天天要聞

關稅大棒下,最受傷的車企出現了

特朗普的關稅大棒剛揮出,尚未嚇退「外敵」,卻先刺痛了自己。近日,擁有瑪莎拉蒂、Jeep等14個品牌的全球第四大車企斯泰蘭蒂斯突然宣布裁撤900名美國工人,關閉加拿大和墨西哥兩家工廠,北美生產線陷入癱瘓。幾乎同一時間,捷豹路虎宣布暫停對美出口一個月,奧迪更是直接