奧特曼再放大招!OpenAI公布首個文生視頻模型Sora,質量如何?

2024年03月02日10:31:34 動漫 4603

財聯社2月16日訊(編輯 唐葉天)北京時間今日凌晨,全球人工智能模型領跑者openai推出了一款能根據文字指令即時生成短視頻的模型,命名為sora。此前在2023年轟轟烈烈的多模態ai模型競賽中,谷歌、meta和初創公司runway、pika labs都發佈過類似的模型。但本次openai展示的視頻仍然以高質量獲得關注。目前openai官網上sora相關的信息有限,openai沒有給出訓練模型的素材來源,僅表示:「我們正在教ai理解和模擬運動中的物理世界,目的是訓練模型,幫助人們解決需要真實世界交互的問題。」並稱sora能夠從文本說明中生成長達60秒的視頻,並能夠提供具有多個角色,特定類型的動作和詳細的背景細節的場景。sora還能在一個生成的視頻中創建多個鏡頭,體現人物和視覺風格。此外,sora可以一次性生成整個視頻,也可以擴展生成的視頻,使其更長。openai表示:通過讓模型一次生成多幀畫面,我們解決了一個具有挑戰性的問題,即:即使生成的主體暫時離開視線內,也能確保主體不變

奧特曼再放大招!OpenAI公布首個文生視頻模型Sora,質量如何? - 天天要聞

openai同時提示:當前的sora模型也有弱點。它可能難以準確模擬複雜場景中的物理現象,也可能無法理解具體的因果關係。例如,一個人可能會咬一口餅乾,但咬過之後,餅乾上可能就沒有咬痕了。該模型還可能混淆提示的空間細節,例如混淆左和右,並可能難以準確描述隨時間發生的事件,例如跟隨特定的攝像機軌跡。關於openai的ceo山姆·奧特曼一直呼籲的ai安全問題,openai表示「目前,sora已經開放向『紅隊人員』(對ai大模型潛在的有害輸出進行「紅隊測試」)以評估關鍵領域的危害或風險。我們還允許一些視覺藝術家、設計師和電影製作人訪問,以獲得關於如何改進模型的反饋意見,使其對創意專業人士最有幫助。」

sora生成視頻效果如何?

openai表示,sora建立在過去對dall-e和gpt模型的研究基礎之上。它採用了dall·e 3的技術,能夠在生成的視頻中更忠實地遵循用戶的文字說明。除了能夠文生視頻外,該模型還能根據現有的靜態圖像生成視頻,並能準確、細緻地對圖像內容進行動畫處理。該模型還能提取現有視頻,並對其進行擴展或填充缺失的幀。目前openai官網上已經更新了48個sora生成的視頻demo,色彩艷麗,效果逼真。

奧特曼再放大招!OpenAI公布首個文生視頻模型Sora,質量如何? - 天天要聞

來自openai sora的ai生成視頻圖像:猛獁象在雪地中行走

以上截圖的視頻文字提示如下:幾頭巨大的長毛猛獁象踏着雪地走來,它們長長的毛髮隨風輕揚,遠處是白雪覆蓋的樹木和壯觀的雪山,午後的光線伴着飄渺的雲朵和遠處高懸的太陽,營造出溫暖的光暈,低機位拍攝的景象令人驚嘆,捕捉到了大型毛茸茸的哺乳動物,攝影和景深都非常漂亮。動態的光影表現也有印象深刻的案例,如一位女性在東京路燈的霓虹燈下行走的視頻,以及阿馬爾菲海岸教堂的鳥瞰圖,以及一個卡通怪物好奇地跪在融化的蠟燭前等。

奧特曼再放大招!OpenAI公布首個文生視頻模型Sora,質量如何? - 天天要聞

來自openai sora的ai生成視頻圖像:一位女性在東京路燈的霓虹燈下行走

以上截圖的視頻文字提示如下:一位時尚女性走在東京的街道上,街道上到處都是溫暖的霓虹燈和動畫城市標誌。她身穿黑色皮夾克、紅色長裙和黑色靴子,手拿黑色錢包。她戴着太陽鏡,塗著紅色唇膏。她走起路來自信而隨意。街道潮濕而反光,與五顏六色的燈光形成鏡面效果。許多行人走來走去。

奧特曼在線接單

sora公布後,openaiceo山姆-奧特曼請社交媒體用戶在線發送文字提示的創意內容。如一位來自新罕布殊爾州的自由攝影師在x上給出的提示:「由一位祖母級社交媒體博主進行的自製意式糰子烹飪指導課,場景設置在鄉村風格的托斯卡納鄉下廚房,並配有電影級燈光。」altman在約一小時後回復了一個逼真的視頻。

奧特曼再放大招!OpenAI公布首個文生視頻模型Sora,質量如何? - 天天要聞

奧特曼此舉,對外展示了sora模型即時生成視頻的能力。

東吳證券觀點此前表示,近年視覺算法在泛化性、可提示性、生成質量和穩定性等方面突破將推動技術拐點到來以及爆款應用出現。3d資產生成、視頻生成等領域受益於擴散算法成熟,但數據與算法難點多於圖像生成,考慮到llm對ai各領域的加速作用以及已出現較好的開源模型,2024年行業或取得更大的發展。

2023年末至2024年初,pika、heygen等ai文生視頻應用陸續出圈,驗證了多模態技術的不斷進步與成熟。剛剛公布的的sora模型無疑加劇了這一賽道的激烈競爭。

(財聯社 唐葉天)

動漫分類資訊推薦

漫漫評 | 「幽靈槍」追兇 - 天天要聞

漫漫評 | 「幽靈槍」追兇

槍聲在校園和街道真切響起,執法部門卻束手無策。槍支暴力帶來的傷痛真實存在,悲劇接連不斷。舊痕未愈,再添新傷。在此起彼伏的槍聲中,沒有槍支序號,無法被執法部門追蹤的「幽靈槍」,無疑再次加深了美國社會問題的瘡疤,為此埋單的是那些無辜逝去的生命和一個個破碎的家庭。監製:孟祥麟策劃:劉慧漫畫:劉俊文字:岳秋...
耕海牧漁,向海洋要食物 | 現場評論 - 天天要聞

耕海牧漁,向海洋要食物 | 現場評論

耕海牧漁,向海洋要食物——樹立並踐行大食物觀悠悠萬事,吃飯為大。解決吃飯問題,不能光盯着有限的耕地,要把思路打開,樹立大食物觀。在福建工作期間,習近平同志在《擺脫貧困》一書中就提出:「現在講的糧食即食物,大糧食觀念替代了以糧為綱的舊觀念。」本版今起推出系列評論,聚焦福建樹立並踐行大食物觀的實踐探索...
市內四區明起禁飛「低慢小」 - 天天要聞

市內四區明起禁飛「低慢小」

為確保我市近期舉辦的多項大型活動順利舉行,切實維護公共安全,杜絕各類違法違規飛行活動,5 月 15 日,市政府發佈了《關於對無人機等"低慢小"航空器及空飄物實施臨時管控的通告》。■管控對象"低慢小"航空器和空飄物,主要包括無人機、飛艇、航空模型、三角翼、滑翔傘、動力傘、熱氣球、無人駕駛自由氣球、孔明燈等。■管...
5月16日停機維護更新公告 - 天天要聞

5月16日停機維護更新公告

親愛的石灰們:感謝大家對《石器時代:覺醒》的熱情關注和支持,為了給您帶來更好的遊戲體驗,我們計劃將2024年5月16日星期四10:00-14:00對全服進行停機更新,更新期間無法登錄遊戲。實際開服時間可能會稍有延遲或提前,對於因停機給大家帶來的不便,我們深表歉意!更新完畢後將為您送上補償。更新時間:2024年5月16日星期...
小村「鄰里話坊」播下文明之花 - 天天要聞

小村「鄰里話坊」播下文明之花

□淄博日報/淄博晚報/博覽新聞 記者 侯林 管家、志願者與居民共話家常,幫助解決鄰里糾紛;村民一起閱讀、健身、娛樂,共享休閑時光;組織健康講座、親子讀書會,開展豐富多彩的文明實踐....
《新生》大結局:唯獨何珊視角的謊言沒被戳穿,費可捨命相救是假 - 天天要聞

《新生》大結局:唯獨何珊視角的謊言沒被戳穿,費可捨命相救是假

《新生》大結局播出,第十集看完,不免失望。可惜了前六集迷人的氣質,與最近蹭蹭上來的熱度。在前期鋪墊得如此精彩緊湊的懸疑劇中,最後一集承擔得重大的解密與收尾的功能。可以說是本劇成敗之關鍵了,每一分鐘都不能有閑筆,每一段戲都對整部劇集完成完整的邏輯閉環,起着重要的作用。在這麼「寸土寸金」的時段,還要來一...
火影忍者:柱間細胞能夠抵消萬花筒的副作用嗎? - 天天要聞

火影忍者:柱間細胞能夠抵消萬花筒的副作用嗎?

帶土體內擁有一定程度的柱間細胞,設定上除去永恆萬花筒寫輪眼不會失明,就只有柱間細胞的力量能夠減少萬花筒帶來的消耗,畢竟柱間細胞代表的是仙人體的力量,其中蘊含強大的生命力(蘊含較強的陽遁屬性查克拉)應該可以抵消部分萬花筒帶來的瞳力消耗,寫輪眼中則是蘊含較強的陰遁屬性查克拉,陰陽遁之