奧特曼再放大招!OpenAI公布首個文生視頻模型Sora,質量如何?

2024年03月02日10:31:34 動漫 4603

財聯社2月16日訊(編輯 唐葉天)北京時間今日凌晨,全球人工智能模型領跑者openai推出了一款能根據文字指令即時生成短視頻的模型,命名為sora。此前在2023年轟轟烈烈的多模態ai模型競賽中,谷歌、meta和初創公司runway、pika labs都發佈過類似的模型。但本次openai展示的視頻仍然以高質量獲得關注。目前openai官網上sora相關的信息有限,openai沒有給出訓練模型的素材來源,僅表示:「我們正在教ai理解和模擬運動中的物理世界,目的是訓練模型,幫助人們解決需要真實世界交互的問題。」並稱sora能夠從文本說明中生成長達60秒的視頻,並能夠提供具有多個角色,特定類型的動作和詳細的背景細節的場景。sora還能在一個生成的視頻中創建多個鏡頭,體現人物和視覺風格。此外,sora可以一次性生成整個視頻,也可以擴展生成的視頻,使其更長。openai表示:通過讓模型一次生成多幀畫面,我們解決了一個具有挑戰性的問題,即:即使生成的主體暫時離開視線內,也能確保主體不變

奧特曼再放大招!OpenAI公布首個文生視頻模型Sora,質量如何? - 天天要聞

openai同時提示:當前的sora模型也有弱點。它可能難以準確模擬複雜場景中的物理現象,也可能無法理解具體的因果關係。例如,一個人可能會咬一口餅乾,但咬過之後,餅乾上可能就沒有咬痕了。該模型還可能混淆提示的空間細節,例如混淆左和右,並可能難以準確描述隨時間發生的事件,例如跟隨特定的攝像機軌跡。關於openai的ceo山姆·奧特曼一直呼籲的ai安全問題,openai表示「目前,sora已經開放向『紅隊人員』(對ai大模型潛在的有害輸出進行「紅隊測試」)以評估關鍵領域的危害或風險。我們還允許一些視覺藝術家、設計師和電影製作人訪問,以獲得關於如何改進模型的反饋意見,使其對創意專業人士最有幫助。」

sora生成視頻效果如何?

openai表示,sora建立在過去對dall-e和gpt模型的研究基礎之上。它採用了dall·e 3的技術,能夠在生成的視頻中更忠實地遵循用戶的文字說明。除了能夠文生視頻外,該模型還能根據現有的靜態圖像生成視頻,並能準確、細緻地對圖像內容進行動畫處理。該模型還能提取現有視頻,並對其進行擴展或填充缺失的幀。目前openai官網上已經更新了48個sora生成的視頻demo,色彩艷麗,效果逼真。

奧特曼再放大招!OpenAI公布首個文生視頻模型Sora,質量如何? - 天天要聞

來自openai sora的ai生成視頻圖像:猛獁象在雪地中行走

以上截圖的視頻文字提示如下:幾頭巨大的長毛猛獁象踏着雪地走來,它們長長的毛髮隨風輕揚,遠處是白雪覆蓋的樹木和壯觀的雪山,午後的光線伴着飄渺的雲朵和遠處高懸的太陽,營造出溫暖的光暈,低機位拍攝的景象令人驚嘆,捕捉到了大型毛茸茸的哺乳動物,攝影和景深都非常漂亮。動態的光影表現也有印象深刻的案例,如一位女性在東京路燈的霓虹燈下行走的視頻,以及阿馬爾菲海岸教堂的鳥瞰圖,以及一個卡通怪物好奇地跪在融化的蠟燭前等。

奧特曼再放大招!OpenAI公布首個文生視頻模型Sora,質量如何? - 天天要聞

來自openai sora的ai生成視頻圖像:一位女性在東京路燈的霓虹燈下行走

以上截圖的視頻文字提示如下:一位時尚女性走在東京的街道上,街道上到處都是溫暖的霓虹燈和動畫城市標誌。她身穿黑色皮夾克、紅色長裙和黑色靴子,手拿黑色錢包。她戴着太陽鏡,塗著紅色唇膏。她走起路來自信而隨意。街道潮濕而反光,與五顏六色的燈光形成鏡面效果。許多行人走來走去。

奧特曼在線接單

sora公布後,openaiceo山姆-奧特曼請社交媒體用戶在線發送文字提示的創意內容。如一位來自新罕布殊爾州的自由攝影師在x上給出的提示:「由一位祖母級社交媒體博主進行的自製意式糰子烹飪指導課,場景設置在鄉村風格的托斯卡納鄉下廚房,並配有電影級燈光。」altman在約一小時後回復了一個逼真的視頻。

奧特曼再放大招!OpenAI公布首個文生視頻模型Sora,質量如何? - 天天要聞

奧特曼此舉,對外展示了sora模型即時生成視頻的能力。

東吳證券觀點此前表示,近年視覺算法在泛化性、可提示性、生成質量和穩定性等方面突破將推動技術拐點到來以及爆款應用出現。3d資產生成、視頻生成等領域受益於擴散算法成熟,但數據與算法難點多於圖像生成,考慮到llm對ai各領域的加速作用以及已出現較好的開源模型,2024年行業或取得更大的發展。

2023年末至2024年初,pika、heygen等ai文生視頻應用陸續出圈,驗證了多模態技術的不斷進步與成熟。剛剛公布的的sora模型無疑加劇了這一賽道的激烈競爭。

(財聯社 唐葉天)

動漫分類資訊推薦

幻化大賽,機械侏儒也可以幻化的很帥! - 天天要聞

幻化大賽,機械侏儒也可以幻化的很帥!

來看看本期選手的發揮,沒想到機械侏儒可以弄的那麼帥。友情提醒:因為微信公眾號平台改變了規則,請在閱讀後點擊「在看」並加星標,這樣才能在下一次推送時及時收到本號文章。- 更多內容,點擊上方 -關注「魔獸世界研究所」公眾號關注魔獸世界研究所,在後台回復抽獎二字,可參與魔獸世界蛋蛋手辦的抽獎活動,每月都有,永...
火山引擎引爆大模型市場首場價格戰 - 天天要聞

火山引擎引爆大模型市場首場價格戰

萬模大戰現在難言勝者,但價格戰已經開始,它無疑大大降低了用戶使用的成本,火山引擎一面降價一面成立了手機、汽車兩個生態聯盟。汽車領域的合作夥伴包括吉利汽車、長城汽車、捷途汽車、賽力斯、智己汽車等20餘家廠商。文丨智駕網  王欣編輯丨浪浪山與明知山位元組系的火山引擎又攪起了大模型領域的一場激戰,划出了一個從...
夜讀丨50條微信個性簽名(第二撥),來了! - 天天要聞

夜讀丨50條微信個性簽名(第二撥),來了!

昨晚《夜讀》發佈《50條微信個性簽名,喜歡自取!》後,不到半天就收到了超過3000條評論,大家除了分享自己的微信簽名外,還有很多這樣的留言:一約既定,小編又帶着圖文來啦!  50條微信個性簽名(第二撥來啦)01.歡迎光臨我的快樂02.閱己,悅己,越己03.雲邊有個小賣部,貨架堆着歲月和夕陽04.趁我還鮮活,不允許...
誰「辜負」了2024年這輪大漲? - 天天要聞

誰「辜負」了2024年這輪大漲?

2024年,A股市場迎來暌違多年的系統性築底上漲表現,由此帶動主動權益類金融產品整體有較強表現。初步統計有85%左右的新基金(權益為主方向)實現了凈收益。而就在偏股混合基金年內「走出來」之時,年內依然有幾隻新發的偏股基金出現了明顯的回撤。初始倉位很輕,偏股指數又系統性上漲,這些基金是如何在這樣的有利環境下虧...
粗心爺爺接孫子放學結果走散 好心人「送娃」 - 天天要聞

粗心爺爺接孫子放學結果走散 好心人「送娃」

新民晚報訊(記者 徐馳)昨天晚高峰5時20分左右,熱心市民劉先生向軌交3號線虹橋路值班站長王歡歡反映,站台上孤零零地站着一個男孩子,身邊沒有家長陪同,疑似走失。  王歡歡前往現場後發現,男孩大約7歲,背着一隻書包,正在不斷地觀察着四周的情況,看上去十分緊張。「小朋友,你要去哪裡呀?是不是在等家長?」面對詢...
漫漫評 | 「幽靈槍」追兇 - 天天要聞

漫漫評 | 「幽靈槍」追兇

槍聲在校園和街道真切響起,執法部門卻束手無策。槍支暴力帶來的傷痛真實存在,悲劇接連不斷。舊痕未愈,再添新傷。在此起彼伏的槍聲中,沒有槍支序號,無法被執法部門追蹤的「幽靈槍」,無疑再次加深了美國社會問題的瘡疤,為此埋單的是那些無辜逝去的生命和一個個破碎的家庭。監製:孟祥麟策劃:劉慧漫畫:劉俊文字:岳秋...
耕海牧漁,向海洋要食物 | 現場評論 - 天天要聞

耕海牧漁,向海洋要食物 | 現場評論

耕海牧漁,向海洋要食物——樹立並踐行大食物觀悠悠萬事,吃飯為大。解決吃飯問題,不能光盯着有限的耕地,要把思路打開,樹立大食物觀。在福建工作期間,習近平同志在《擺脫貧困》一書中就提出:「現在講的糧食即食物,大糧食觀念替代了以糧為綱的舊觀念。」本版今起推出系列評論,聚焦福建樹立並踐行大食物觀的實踐探索...
市內四區明起禁飛「低慢小」 - 天天要聞

市內四區明起禁飛「低慢小」

為確保我市近期舉辦的多項大型活動順利舉行,切實維護公共安全,杜絕各類違法違規飛行活動,5 月 15 日,市政府發佈了《關於對無人機等"低慢小"航空器及空飄物實施臨時管控的通告》。■管控對象"低慢小"航空器和空飄物,主要包括無人機、飛艇、航空模型、三角翼、滑翔傘、動力傘、熱氣球、無人駕駛自由氣球、孔明燈等。■管...
5月16日停機維護更新公告 - 天天要聞

5月16日停機維護更新公告

親愛的石灰們:感謝大家對《石器時代:覺醒》的熱情關注和支持,為了給您帶來更好的遊戲體驗,我們計劃將2024年5月16日星期四10:00-14:00對全服進行停機更新,更新期間無法登錄遊戲。實際開服時間可能會稍有延遲或提前,對於因停機給大家帶來的不便,我們深表歉意!更新完畢後將為您送上補償。更新時間:2024年5月16日星期...