生成式 AI 最大飛躍!OpenAI 首個視頻生成模型重磅發佈

2024年02月18日15:15:04 科技 1513

作者 | Tina、褚杏娟

2 月 16 日,OpenAI 在其官網發佈文生視頻模型 Sora。據介紹,該模型可以生成長達一分鐘的視頻,同時保持視覺品質並遵循用戶提示。


Sora 在日語中意為天空,該技術背後的團隊包括 Tim Brooks 和 Bill Peebles,之所以選擇這個名字,是希望它能激起無限的創造潛力。


生成式 AI 最大飛躍!OpenAI 首個視頻生成模型重磅發佈 - 天天要聞


OpenAI 給出了不少令人印象深刻的例子:在龍年春節里的舞龍活動,人山人海的場景真假難辨,甚至還有群眾拿着手機跟拍的細節;動物世界中,站在樹上、戴着王冠的猴子等;在社交媒體上教大家做曲奇的老奶奶;戴着耳機聽音樂的兩隻金毛狗.....


生成式 AI 最大飛躍!OpenAI 首個視頻生成模型重磅發佈 - 天天要聞


生成式 AI 最大飛躍!OpenAI 首個視頻生成模型重磅發佈 - 天天要聞


有網友評論說,AI 能根據文字生成圖片的時候,他就在想離生成視頻的日期不遠了,沒想到這麼快!「又有一波『固執的』從業者和藝術家們要失業了,從業者門檻進一步拉低!YouTube/TikTok 等一眾長視頻或短視頻網站估計要迎來一波新的流量。」


一些 YouTube 網紅確實開始擔心,MrBeast 發帖半開玩笑地求奧特曼不要讓他失業。


生成式 AI 最大飛躍!OpenAI 首個視頻生成模型重磅發佈 - 天天要聞


有投資者則發表評論說,他們早就認為「內容生成干不過大公司,初創公司要做產品和應用……」他們一直認為 Pika 應該轉型……


而 OpenAI 員工 will depue 則表示,他們過去兩個月一直忙於此事,目前 Sora 還處於早期宣傳階段。根據 OpenAI 隨後發佈的論文來看,這個模型的能力確實已經超出了 OpenAI 最初所宣傳的。


生成式 AI 最大飛躍!OpenAI 首個視頻生成模型重磅發佈 - 天天要聞


這篇論文揭示了 Sora 架構的一些關鍵方面,比如它可以生成任意分辨率和寬高比的視頻(最高 1080p)。根據論文,Sora 能夠執行各種圖像和視頻編輯任務,比如創建循環視頻、延長視頻時長或更改現有視頻的背景。


生成式 AI 最大飛躍!OpenAI 首個視頻生成模型重磅發佈 - 天天要聞

將 DALL·E 2 或 DALL·E 3 生成的圖片轉為視頻


然而,最令人感興趣的是 Sora「模擬數字世界」的能力。它不僅僅是生成單個照片或視頻,而是確定環境中每個對象的物理特性,並根據這些計算渲染照片或視頻(或交互式 3D 世界,視情況而定)。正如 Nvidia 高級研究員 Jim Fan 所評論的那樣,Sora 更像是一個「數據驅動的物理引擎」,而不是一個創意引擎。


對於 Sora 目前存在的弱點,OpenAI 也不避諱:模型在準確模擬複雜場景的物理特性方面可能會遇到困難,也可能無法理解具體的因果關係實例。

生成式 AI 最大飛躍!OpenAI 首個視頻生成模型重磅發佈 - 天天要聞


例如「五隻灰狼幼崽在一條偏僻的碎石路上互相嬉戲、追逐」,狼的數量會變化,一些憑空出現或消失。


現在,Sora 正面向部分成員開放,以評估關鍵領域的潛在危害或風險。

原文鏈接:https://www.infoq.cn/article/u3USgtmYw11CHkZRh7EO

科技分類資訊推薦

離開中國的鈴木,現在還在海外推出新車? - 天天要聞

離開中國的鈴木,現在還在海外推出新車?

鈴木原廠在 2024 年 11 月初時正式發佈品牌首款純電產品 e Vitara,亦為純電概念車 eVX 的量產版,動力規格上擁有前驅與四驅設定、電池容量有着 49kWh 和 61kWh 規格,新車將會是印度制的身份來銷售,並將在夏季於歐洲、印度和日本等市場上
攜充電寶乘機新規發佈,深圳機場可提供7天暫存 - 天天要聞

攜充電寶乘機新規發佈,深圳機場可提供7天暫存

6月28日起,深圳機場開始執行民航局緊急通知的要求,禁止旅客攜帶沒有3C標識、3C標識不清晰、被召回型號或批次的充電寶乘坐境內航班。新規施行首日,深圳機場多措並舉,在嚴格落實局方要求的同時,儘可能為旅客現場處置不能攜帶的充電寶提供便利,同時增派人員,確保現場運行平穩有序。在深圳機場航站樓內,從出發層入口到...
讓機械人觸覺達人手800倍,上海交大教授正加速機械人「就業上崗」速度 - 天天要聞

讓機械人觸覺達人手800倍,上海交大教授正加速機械人「就業上崗」速度

「機械人的功能再炫酷,最終還是得能『用』。」上海交通大學船舶海洋與建築工程學院長聘副教授馬道林,一直致力於解決具身智能發展的難點——觸覺,這正是機械人能「用」的基礎。馬道林關於這一研究的論文在全球頂級學術會議——國際機械人與自動化大會(ICRA)上獲最佳論文獎,這是4000多篇參會論文中的唯一。而他去年5月...
特斯拉:已在中國大陸地區開放超2100座超級充電站 - 天天要聞

特斯拉:已在中國大陸地區開放超2100座超級充電站

【環球網科技綜合報道】6月29日消息,特斯拉日前宣布,其全球超級充電樁已突破7萬根。截至目前,中國大陸地區已建設開放超2100座特斯拉超級充電站,逾11600根特斯拉超級充電樁,配合超2500根目的地充電樁。特斯拉充電網絡的布局也已經100%覆蓋了中國大陸的所有省會城市及直轄市。特斯拉此前曾宣布,中國市場首批V4超級充電...
英偉達新高下,AI服務器業「賣身」求生與算力「價格崩塌」 - 天天要聞

英偉達新高下,AI服務器業「賣身」求生與算力「價格崩塌」

【環球網財經綜合報道】本周英偉達股價刷新歷史新高,黃仁勛稱推理需更多算力,然而AI服務器業內卻暗流涌動。東方IC近期,AI服務器業內變動頻繁。6月20日晚,傑美特公告籌劃現金購買思騰合力控制權,可能構成重大資產重組,交易完成後將拓展算力相關業務能力。5月19日晚,慧博雲通披露預案,擬收購寶德計算機67.91%股份並募...
榮耀 400 系列手機全球累計激活量突破 100 萬台 - 天天要聞

榮耀 400 系列手機全球累計激活量突破 100 萬台

IT之家 6 月 29 日消息,據博主 @旺仔百事通 分享,榮耀 400 系列全球累計激活量突破 100 萬台,打破近三年榮耀手機激活量最快破百萬記錄。據IT之家此前報道,今年 5 月,榮耀 400 / 400 Pro 手機發佈,新機搭載 2 億超清寫真人像主攝,分別採用驍龍 7 Gen4 處理器和驍龍 8 Gen3 處理器、同時全系配備 7200mAh 第
下一代DNS發展論壇 | 馮登國:構建自主可控的RPKI及安全路由機制 - 天天要聞

下一代DNS發展論壇 | 馮登國:構建自主可控的RPKI及安全路由機制

2025年6月26日,以「網絡根基 中國貢獻」為主題的第四屆下一代DNS發展論壇在京舉行。本屆論壇,由中國互聯網協會、中國通信標準化協會指導,互聯網域名系統國家地方聯合工程研究中心(ZDNS)與互聯網域名管理技術國家工程實驗室聯合主辦。主論壇上,馮登國教授圍繞《RPKI:認識與思考》作主題報告。 RPKI:確保路由通告真實...
民航局「3C禁令」引發充電寶行業格局重塑 - 天天要聞

民航局「3C禁令」引發充電寶行業格局重塑

【環球網財經綜合報道】日前,民航局發佈「3C禁令」,禁止攜帶無3C標識及被召回的充電寶上境內航班,收緊了對充電寶的航空安全管控,國內多地機場已明確將按此規定實施。這一禁令「擊中」充電寶主要使用場景,影響重大。民航局官網截圖我國自2023年8月1日起對充電寶實施3C認證管理,2024年8月1日起,未獲認證證書和標註認證...