生成式 AI 最大飛躍!OpenAI 首個視頻生成模型重磅發布

2024年02月18日15:15:04 科技 1513

作者 | Tina、褚杏娟

2 月 16 日,OpenAI 在其官網發布文生視頻模型 Sora。據介紹,該模型可以生成長達一分鐘的視頻,同時保持視覺品質並遵循用戶提示。


Sora 在日語中意為天空,該技術背後的團隊包括 Tim Brooks 和 Bill Peebles,之所以選擇這個名字,是希望它能激起無限的創造潛力。


生成式 AI 最大飛躍!OpenAI 首個視頻生成模型重磅發布 - 天天要聞


OpenAI 給出了不少令人印象深刻的例子:在龍年春節里的舞龍活動,人山人海的場景真假難辨,甚至還有群眾拿著手機跟拍的細節;動物世界中,站在樹上、戴著王冠的猴子等;在社交媒體上教大家做曲奇的老奶奶;戴著耳機聽音樂的兩隻金毛狗.....


生成式 AI 最大飛躍!OpenAI 首個視頻生成模型重磅發布 - 天天要聞


生成式 AI 最大飛躍!OpenAI 首個視頻生成模型重磅發布 - 天天要聞


有網友評論說,AI 能根據文字生成圖片的時候,他就在想離生成視頻的日期不遠了,沒想到這麼快!「又有一波『固執的』從業者和藝術家們要失業了,從業者門檻進一步拉低!YouTube/TikTok 等一眾長視頻或短視頻網站估計要迎來一波新的流量。」


一些 YouTube 網紅確實開始擔心,MrBeast 發帖半開玩笑地求奧特曼不要讓他失業。


生成式 AI 最大飛躍!OpenAI 首個視頻生成模型重磅發布 - 天天要聞


有投資者則發表評論說,他們早就認為「內容生成干不過大公司,初創公司要做產品和應用……」他們一直認為 Pika 應該轉型……


而 OpenAI 員工 will depue 則表示,他們過去兩個月一直忙於此事,目前 Sora 還處於早期宣傳階段。根據 OpenAI 隨後發布的論文來看,這個模型的能力確實已經超出了 OpenAI 最初所宣傳的。


生成式 AI 最大飛躍!OpenAI 首個視頻生成模型重磅發布 - 天天要聞


這篇論文揭示了 Sora 架構的一些關鍵方面,比如它可以生成任意解析度和寬高比的視頻(最高 1080p)。根據論文,Sora 能夠執行各種圖像和視頻編輯任務,比如創建循環視頻、延長視頻時長或更改現有視頻的背景。


生成式 AI 最大飛躍!OpenAI 首個視頻生成模型重磅發布 - 天天要聞

將 DALL·E 2 或 DALL·E 3 生成的圖片轉為視頻


然而,最令人感興趣的是 Sora「模擬數字世界」的能力。它不僅僅是生成單個照片或視頻,而是確定環境中每個對象的物理特性,並根據這些計算渲染照片或視頻(或互動式 3D 世界,視情況而定)。正如 Nvidia 高級研究員 Jim Fan 所評論的那樣,Sora 更像是一個「數據驅動的物理引擎」,而不是一個創意引擎。


對於 Sora 目前存在的弱點,OpenAI 也不避諱:模型在準確模擬複雜場景的物理特性方面可能會遇到困難,也可能無法理解具體的因果關係實例。

生成式 AI 最大飛躍!OpenAI 首個視頻生成模型重磅發布 - 天天要聞


例如「五隻灰狼幼崽在一條偏僻的碎石路上互相嬉戲、追逐」,狼的數量會變化,一些憑空出現或消失。


現在,Sora 正面向部分成員開放,以評估關鍵領域的潛在危害或風險。

原文鏈接:https://www.infoq.cn/article/u3USgtmYw11CHkZRh7EO

科技分類資訊推薦

小米頂級拍照旗艦狂降3000元,16GB+512GB+120倍變焦,最後還是等到了 - 天天要聞

小米頂級拍照旗艦狂降3000元,16GB+512GB+120倍變焦,最後還是等到了

早幾年提到「拍照手機」,不少人腦海里第一個蹦出來的還是華為。但眼下這個市場早已悄悄發生了變化。如今的消費者在選影像旗艦時,早已不再盯著某一家看,尤其是價格敏感型用戶,面對溢價較高、性能受限的情況,開始把注意力轉向了性價比更高、影像體驗同樣出
英特爾發布 6862 圖形驅動,相比 Q1 版本性能最高提升 37% - 天天要聞

英特爾發布 6862 圖形驅動,相比 Q1 版本性能最高提升 37%

IT之家 7 月 11 日消息,英特爾公司於 7 月 8 日,面向銳炫(Arc) B、A 系列顯卡、集成 Arc 核顯的酷睿 Ultra 系列處理器,發布了 32.0.101.6862(Q2.25)圖形驅動,主要提升性能。IT之家查詢英特爾官方公告,本次驅動更新為 710.5MB,相比較 2025 年第 1 季度驅動,在 SPECviewperf 15 基準
OpenAI悄然將Shopify納入購物搜索合作夥伴 - 天天要聞

OpenAI悄然將Shopify納入購物搜索合作夥伴

OpenAI 已悄然將 Shopify 添加為第三方搜索合作夥伴,以增強其購物搜索功能,從而呈現豐富的購物搜索結果。Shopify 的加入並未正式宣布,但已悄然嵌入 OpenAI ChatGPT 搜索文檔中。
ACL 2025 | 數據多不如風格齊?SCAR精選 - 天天要聞

ACL 2025 | 數據多不如風格齊?SCAR精選

本文共3600字,建議閱讀10分鐘SCAR 方法在大語言模型指令微調領域取得了重要突破。一、總覽這是 RMIT 大學、新南威爾士大學和莫納什大學聯合發表的論文。