OpenAI CTO穆拉蒂:Sora將於年底發布,未來會增加語音功能

2024年03月29日00:22:34 科技 5522

劃重點

OpenAI CTO穆拉蒂:Sora將於年底發布,未來會增加語音功能 - 天天要聞

騰訊科技訊 據國外媒體報道,美國當地時間周三,人工智慧初創公司openai的cto米拉·穆拉蒂(mira murati)接受外媒專訪。在訪談中,穆拉蒂詳細介紹了openai文本轉視頻人工智慧工具sora以及其發布計劃,還談了訓練數據、紅隊測試以及與電影業合作等話題。以下為外媒報道摘要:

人工智慧正在迎來下一個「魔法時刻」,在這個時代,你的話語將不再僅僅是文字,它們將被賦予生命,轉化為生動逼真的視頻。這正是openai最新研發的sora所帶來的革命性變革,它讓視頻製作變得更加簡單、高效。

sora或許將在今年晚些時候與我們正式見面。然而,在此之前,openai已向公眾展示了其驚人之處:利用精心編寫的提示和強大的處理能力,許多原本需要人工參與的視頻製作環節變得輕而易舉。想像一下,許多充滿創意的提示,如美人魚與她的螃蟹夥伴一同點評智能手機,或是一頭牛悠然自得地漫步在瓷器店中,這些場景在sora的魔力下都將成為可能。

當openai上個月開始預覽其利用生成人工智慧工具製作的視頻時,互聯網瞬間沸騰了。此前的人工智慧視頻技術已經可以呈現出斷斷續續、解析度較低的片段,而sora所生成的視頻卻如同自然紀錄片或大片級別的作品,令人嘆為觀止。

sora不僅為我們所熟悉的人工智慧感覺循環注入了新的活力,更引發了人們對其能力的驚嘆和社會的深深憂慮。穆拉蒂在採訪中保證,openai在發布這一強大工具時將採取極為慎重的態度。然而,即便如此,我們也不能保證一切都會朝著好的方向發展。

穆拉蒂透露,一段20秒時長、720p解析度的無聲視頻,僅僅幾分鐘就能製作完成。但她表示,他們計劃在未來為視頻增加語音功能,讓內容更加完整。

sora究竟是如何工作的?穆拉蒂解釋稱,sora的人工智慧模型通過大量視頻數據的學習,學會了識別和理解各種物體與動作。當你給它一個文本提示時,它能夠迅速勾勒出整個場景,並逐幀填充細節,從而生成出令人驚艷的視頻內容。

人工智慧就像黑盒子

業內觀察人士和競爭對手們(包括runway的首席執行官)紛紛將openai在視頻生成技術方面取得的成就歸功於其龐大的計算能力和豐富的訓練數據。然而,近期openai卻陷入了版權侵權訴訟的漩渦,被指控未經許可抓取內容以訓練chatgpt。

openai在訓練sora時使用了哪些數據?穆拉蒂回答稱:「我們使用了公開可用的數據和授權數據。」當被進一步問及是否包括youtube、instagram和facebook等平台上的視頻時,她表示並不清楚具體情況。不過,穆拉蒂後來證實,授權材料確實包括了來自一些攝影圖片網站的內容。

對於普通用戶來說,人工智慧模型就像是一個黑盒子,我們只知道輸入提示和輸出內容,卻無法窺探其中的工作機制。因此,我們永遠無法確切知道為什麼某些事物在生成時會呈現出特定的樣子。

穆拉蒂還透露,目前利用sora生成視頻的成本遠高於使用該公司圖像生成器dall-e生成圖像。然而,她表示在sora於今年年末向公眾發布時,他們將努力優化演算法,以降低所需的計算能力,從而使更多人能夠享受到這項技術帶來的便利。

在當前的早期階段,我們如何能夠識別出視頻是由人工智慧生成的而不是真實拍攝的呢?仔細觀察sora的作品,你會發現一些明顯的痕迹。比如,有的視頻中,人手上長出十根手指,穆拉蒂對此解釋道:「要準確地描繪手部運動真的很難。」

在另一段視頻中,創作者要求sora展示一個機器人從電影製片人手中搶走攝像機的場景。然而,生成的視頻中,原本的人類電影製片人突然變成了一個動作不自然的電影製作機器人,而且背景中的車輛也在不經意間發生了顏色的變化,從黃色計程車變成了銀色轎車。穆拉蒂對此解釋說,儘管該模型在保持場景連續性方面已經做得相當好,但仍有待完善。

如何識別ai生成視頻?

那麼,當這些技術故障被解決後,我們該如何區分真實視頻和人工智慧生成的視頻呢?穆拉蒂提到了可能的解決方案:在視頻的底部添加水印。她表示,這些視頻最終將包含元數據,用以標明其來源,這有助於我們識別和追溯其生成方式。

除了技術問題,openai還在致力於通過紅隊測試來確保sora的安全性和可靠性。紅隊成員嘗試使用各種提示來挑戰sora,以發現可能存在的漏洞、偏見和其他有害結果。穆拉蒂稱:「這就是為什麼我們實際上還沒有部署這些系統的原因。我們需要先弄清楚這些問題,然後才能廣泛部署它們。」

穆拉蒂透露,sora的提示詞政策可能會借鑒其圖像生成器dall-e的先例。比如,sora將不允許生成公眾人物的圖像。

而關於可能涉及裸體的內容,穆拉蒂表示,公司正在與藝術家們緊密合作,探討如何在不限制創造力的前提下,為這類內容設置適當的「護欄和限制」。

與好萊塢合作

隨著像sora這樣的工具不斷進步和完善,我們不禁要問:人類將如何適應這樣的變革?在一個僅需文字提示就能取代無人機操作員或角色插畫師的世界裡,人類將扮演怎樣的角色?對於好萊塢等行業來說,這種變革既帶來了擔憂,也帶來了興奮。

泰勒·佩里(tyler perry)在親眼目睹sora的出色表現後,決定暫停他原本計劃耗資8億美元的工作室擴建計劃。他意識到,這項技術有可能大幅度減少在布景和外景拍攝上的費用,但同時也引發了人們對未來職業前景的擔憂。美國動畫協會主席珍妮特·莫雷諾·金(jeanette moreno king)認為,雖然藝術決策仍然需要人類的參與和判斷,但「未來是模糊的」,充滿了不確定性。

與此同時,愛德華·薩奇(edward saatchi)和他的人工智慧視頻工作室fable正在構想著一個更加前衛的概念——一個人工智慧版的netflix。用戶只需輸入一個提示,系統便能生成出完整的劇集,滿足觀眾的觀看需求。

當被問及sora對視頻製作工作可能帶來的影響時,穆拉蒂再次強調了openai在發布這項技術時的謹慎態度。她表示,openai已經讓一些行業內部人士提前進入測試階段,以便更好地了解並應對可能出現的挑戰。她說:「我們希望電影界人士和世界各地的創作者都能參與進來,與我們共同探索如何進一步推動這些行業發展。」

儘管openai在推進這項技術時表現得像瓷器店裡的一頭公牛,那麼它需要小心翼翼地避免破壞現有的秩序。但不可避免的是,隨著技術的不斷進步和應用,它終將開始「撞碎瓷盤」,進而引發視頻製作行業的深刻變革。(編譯/金鹿)

科技分類資訊推薦

TCL再發3款王炸級Mini LED電視新品 Q10K、Q10K Pro和T7K向影音愛好者致敬 - 天天要聞

TCL再發3款王炸級Mini LED電視新品 Q10K、Q10K Pro和T7K向影音愛好者致敬

4月21日,TCL召開了以「向影音愛好者致敬」為主題的2024 TCL典藏級Mini LED電視新品發布會。發布會上,TCL連發了3款全新王炸級Mini LED電視產品,分別是典藏級Mini LED電視Q10K、真XDR高畫質Mini LED電視T7K、以及線上唯一超旗艦電視產品:典藏級旗艦Mini LED電視Q10K Pro。三大產品覆蓋了55/65/75
好「芯」才有好Mini LED!海信電視E8系列重磅登場 - 天天要聞

好「芯」才有好Mini LED!海信電視E8系列重磅登場

當前,Mini LED作為一個「熱詞」,成為很多消費者選擇電視的要素,認為Mini LED等於好的畫質。但實際上,光學系統非常複雜,Mini LED只是光源,放到整個電視系統中,佔比還不到7%。對於一台電視來說,好的畫質需要系統化的顯示主幹技術,而非單一器件。系統化的顯示主幹技術,要從一顆強大的「芯」開始!作為國內唯一擁有自...
微軟演示 VASA-1 深度偽造因效果太好不適合向公眾發布 - 天天要聞

微軟演示 VASA-1 深度偽造因效果太好不適合向公眾發布

站長之家(ChinaZ.com) 4 月 21 日消息:本周,微軟演示了 VASA–1,這是一個基於靜態圖像、音頻樣本和文本腳本來創建人物講話視頻的框架,微軟聲稱——這是正確的——這個框架太危險了,不適合向公眾發布。這些由 AI 生成的視頻,可以讓人物以克隆的聲音令人信服地配合腳本說話,正是美國聯邦貿易委員會上個月警告的那種情形...
跑分不輸一流資料庫 OceanBase 4.3實現秒級實時分析 - 天天要聞

跑分不輸一流資料庫 OceanBase 4.3實現秒級實時分析

作者:孫妍 來源:IT時報國產資料庫OceanBase在「關鍵業務負載」的一體化戰略上再邁一步。現場跑分顯示,在同等硬體條件下,OceanBase4.3的AP查詢性能已達到業內一流列存大寬表資料庫同一水平。4月20日,在第二屆OceanBase開發者大會上,一場緊張的跑分測試將現場氣氛拉到了高潮。OceanBase4.3版本在當天正式發布,推出全新...
長沙新落地智能網聯產業孵化基地,未來可為汽車研發、測試「一條龍」服務 - 天天要聞

長沙新落地智能網聯產業孵化基地,未來可為汽車研發、測試「一條龍」服務

4月20日,長沙智能網聯汽車產業發展再迎集群載體——湘江智能網聯產業孵化基地(一期)開園。在這裡,智能網聯汽車產業鏈上企業可以享受眾創空間、孵化空間到加速器「一條龍」服務。湘江智能網聯產業孵化基地,是湘江智能網聯產業園首開區重點項目、也是湘江科學城的重要組成部分,擁有中部地區首個省級智能網聯汽車領域專...
百家數字經濟頭部企業齊聚大興共謀數字新機 - 天天要聞

百家數字經濟頭部企業齊聚大興共謀數字新機

4月20—21日,「清華·大興 數創新篇」2024年中國數字經濟產業鏈系列首場研討會在北京大興成功舉辦。本次研討會由清華大學全球證券市場研究院、北京大興經濟開發區管理委員會(以下簡稱:大興經開區)共....
TCL再發3款王炸級Mini LED電視新品向影音愛好者致敬 - 天天要聞

TCL再發3款王炸級Mini LED電視新品向影音愛好者致敬

4月21日,TCL召開了以「向影音愛好者致敬」為主題的2024 TCL 典藏級Mini LED電視新品發布會。發布會上,TCL連發了3款全新王炸級Mini LED電視產品,分別是典藏級Mini LED電視Q10K 、真XDR高畫質Mini LED電視 T7K、以及線上唯一超旗艦電視產品:典藏級旗艦Mini LED電視Q10K Pro。三大產品覆蓋了55/65