奧特曼再放大招!OpenAI公布首個文生視頻模型Sora,質量如何?

2024年03月02日10:31:34 動漫 4603

財聯社2月16日訊(編輯 唐葉天)北京時間今日凌晨,全球人工智慧模型領跑者openai推出了一款能根據文字指令即時生成短視頻的模型,命名為sora。此前在2023年轟轟烈烈的多模態ai模型競賽中,谷歌、meta和初創公司runway、pika labs都發布過類似的模型。但本次openai展示的視頻仍然以高質量獲得關注。目前openai官網上sora相關的信息有限,openai沒有給出訓練模型的素材來源,僅表示:「我們正在教ai理解和模擬運動中的物理世界,目的是訓練模型,幫助人們解決需要真實世界交互的問題。」並稱sora能夠從文本說明中生成長達60秒的視頻,並能夠提供具有多個角色,特定類型的動作和詳細的背景細節的場景。sora還能在一個生成的視頻中創建多個鏡頭,體現人物和視覺風格。此外,sora可以一次性生成整個視頻,也可以擴展生成的視頻,使其更長。openai表示:通過讓模型一次生成多幀畫面,我們解決了一個具有挑戰性的問題,即:即使生成的主體暫時離開視線內,也能確保主體不變

奧特曼再放大招!OpenAI公布首個文生視頻模型Sora,質量如何? - 天天要聞

openai同時提示:當前的sora模型也有弱點。它可能難以準確模擬複雜場景中的物理現象,也可能無法理解具體的因果關係。例如,一個人可能會咬一口餅乾,但咬過之後,餅乾上可能就沒有咬痕了。該模型還可能混淆提示的空間細節,例如混淆左和右,並可能難以準確描述隨時間發生的事件,例如跟隨特定的攝像機軌跡。關於openai的ceo山姆·奧特曼一直呼籲的ai安全問題,openai表示「目前,sora已經開放向『紅隊人員』(對ai大模型潛在的有害輸出進行「紅隊測試」)以評估關鍵領域的危害或風險。我們還允許一些視覺藝術家、設計師和電影製作人訪問,以獲得關於如何改進模型的反饋意見,使其對創意專業人士最有幫助。」

sora生成視頻效果如何?

openai表示,sora建立在過去對dall-e和gpt模型的研究基礎之上。它採用了dall·e 3的技術,能夠在生成的視頻中更忠實地遵循用戶的文字說明。除了能夠文生視頻外,該模型還能根據現有的靜態圖像生成視頻,並能準確、細緻地對圖像內容進行動畫處理。該模型還能提取現有視頻,並對其進行擴展或填充缺失的幀。目前openai官網上已經更新了48個sora生成的視頻demo,色彩艷麗,效果逼真。

奧特曼再放大招!OpenAI公布首個文生視頻模型Sora,質量如何? - 天天要聞

來自openai sora的ai生成視頻圖像:猛獁象在雪地中行走

以上截圖的視頻文字提示如下:幾頭巨大的長毛猛獁象踏著雪地走來,它們長長的毛髮隨風輕揚,遠處是白雪覆蓋的樹木和壯觀的雪山,午後的光線伴著飄渺的雲朵和遠處高懸的太陽,營造出溫暖的光暈,低機位拍攝的景象令人驚嘆,捕捉到了大型毛茸茸的哺乳動物,攝影和景深都非常漂亮。動態的光影表現也有印象深刻的案例,如一位女性在東京路燈的霓虹燈下行走的視頻,以及阿馬爾菲海岸教堂的鳥瞰圖,以及一個卡通怪物好奇地跪在融化的蠟燭前等。

奧特曼再放大招!OpenAI公布首個文生視頻模型Sora,質量如何? - 天天要聞

來自openai sora的ai生成視頻圖像:一位女性在東京路燈的霓虹燈下行走

以上截圖的視頻文字提示如下:一位時尚女性走在東京的街道上,街道上到處都是溫暖的霓虹燈和動畫城市標誌。她身穿黑色皮夾克、紅色長裙和黑色靴子,手拿黑色錢包。她戴著太陽鏡,塗著紅色唇膏。她走起路來自信而隨意。街道潮濕而反光,與五顏六色的燈光形成鏡面效果。許多行人走來走去。

奧特曼在線接單

sora公布後,openaiceo山姆-奧特曼請社交媒體用戶在線發送文字提示的創意內容。如一位來自新罕布希爾州的自由攝影師在x上給出的提示:「由一位祖母級社交媒體博主進行的自製意式糰子烹飪指導課,場景設置在鄉村風格的托斯卡納鄉下廚房,並配有電影級燈光。」altman在約一小時後回復了一個逼真的視頻。

奧特曼再放大招!OpenAI公布首個文生視頻模型Sora,質量如何? - 天天要聞

奧特曼此舉,對外展示了sora模型即時生成視頻的能力。

東吳證券觀點此前表示,近年視覺演算法在泛化性、可提示性、生成質量和穩定性等方面突破將推動技術拐點到來以及爆款應用出現。3d資產生成、視頻生成等領域受益於擴散演算法成熟,但數據與演算法難點多於圖像生成,考慮到llm對ai各領域的加速作用以及已出現較好的開源模型,2024年行業或取得更大的發展。

2023年末至2024年初,pika、heygen等ai文生視頻應用陸續出圈,驗證了多模態技術的不斷進步與成熟。剛剛公布的的sora模型無疑加劇了這一賽道的激烈競爭。

(財聯社 唐葉天)

動漫分類資訊推薦

軍媒披露:新的0號叫趙磊 - 天天要聞

軍媒披露:新的0號叫趙磊

4月25日,神舟十八號載人飛船發射取得圓滿成功。航天員葉光富、李聰、李廣蘇順利進駐中國空間站,與神舟十七號航天員乘組「會師」。據中國軍網披露,此次擔任0號指揮員的是趙磊。據此前央視直播畫面,他是一名「80後」。視頻來源:中國軍網在神舟飛船發射前,指揮大廳中發出倒計時口令的人被稱為「0號」。「0號」是飛船發射...
章慧敏:拐角有故事 - 天天要聞

章慧敏:拐角有故事

往事悠悠,拐角的故事如此親切,它是我心靈的記錄。安排在「愚園路電台」的下午茶,實屬老友的創意。被她邀請來喝咖啡的一群人,都屬友齡40年以上的骨灰級啦。曾經的我們都是這條愚園路上的原住民:有住在緊鄰咖啡館旁邊的岐山村、宏業花園,有住在憶定邨、福世花園……每一條弄堂都留下過我們少年時代的足跡,相互串門的愉...
哪吒L正式上市,12.99萬元起售 - 天天要聞

哪吒L正式上市,12.99萬元起售

新京報貝殼財經訊(記者王琳琳)4月22日,新京報貝殼財經記者從哪吒汽車官方獲悉,哪吒汽車山海平台首款SUV哪吒L正式上市,新車共推出四款增程版本車型,官方指導價格為12.99萬元-15.99萬元;其中入門級車型220閃充版將於今年8月推出。哪吒汽車方面表示,哪吒L還將推出純電版車型。哪吒L。圖/車企官網哪吒L定位於中大型SUV...
高校四大名著圖文主題展有趣有味有情 - 天天要聞

高校四大名著圖文主題展有趣有味有情

近日,在武昌首義學院圖書館聯合藝術設計學院舉辦的「引今築典」——四大名著圖文主題展上,四大名著精品圖書和16幅根據四大名著內容進行創新應用設計的優秀海報作品,帶領師生們從藝術視角,沉浸式重溫經典,重視閱讀經典,讓師生直呼「有趣、有味、有情!」展覽現場,一幅幅獨具匠心、創意滿滿、色彩絢麗的作品分外引人注...
文本轉語音產品AI化使用配音師聲音被判侵權!公司道歉賠錢 - 天天要聞

文本轉語音產品AI化使用配音師聲音被判侵權!公司道歉賠錢

4月24日,南都記者從北京互聯網法院獲悉該院一審開庭宣判全國首例AI生成聲音人格權侵權案相關詳情。部分被告未經原告許可AI化使用了原告聲音,構成對原告聲音權益的侵犯,其侵權行為造成了原告聲音權益受損的後果,應承擔相應的法律責任。最終,部分被告對原告賠禮道歉和賠償損失。全國首例AI生成聲音人格權侵權案一審宣判...
跳井連救2人,蔡文被評定為烈士 - 天天要聞

跳井連救2人,蔡文被評定為烈士

4月22日,福建省退役軍人事務廳網站發布《福建省人民政府關於評定蔡文同志為烈士的批複》:2023年7月14日,蔡文同志在福州市馬尾區閩漁新村小區外,為營救掉落窖井的2名檢修工人英勇犧牲。根據《烈士褒揚條例》第八條第一款第二項規定,同意評定蔡文同志為烈士。圖源:福建省退役軍人事務廳網站蔡文,男,漢族,1982年3月2...
交了3萬元報名考試,結果沒了下文?女子氣憤:辦公地點都空了! - 天天要聞

交了3萬元報名考試,結果沒了下文?女子氣憤:辦公地點都空了!

去年8月份,福州的小劉為了參加教師資格考試以及普通話水平測試,與一家機構簽訂了諮詢服務合同。而當小劉再次來到這家公司時,卻發現已經人去樓空。花3萬餘元報名教資考試 機構承諾考不過全額退款小劉說,她此前一直在福州從事教師行業的工作。為了參加教師資格證和普通話水平測試,去年8月份,在朋友的介紹下,她交了三萬...
道枝駿佑《今夜,就算這份愛從世上消失》有望引進 - 天天要聞

道枝駿佑《今夜,就算這份愛從世上消失》有望引進

1905電影網訊 日前,由三木孝浩執導,月川翔、松本花奈編劇,道枝駿佑、福本莉子、古川琴音主演的電影《今夜,就算這份愛從世上消失》有望引進,並開通官方微博。據豆瓣片目信息顯示,影片或將定檔5月20日在內地上映。電影《今夜,就算這份愛從世上消失》根據一條岬同名小說改編,影片延續了日式電影特有的溫情和青春戀愛故...