OpenAI CTO穆拉蒂:Sora將於年底發布,未來會增加語音功能

2024年03月29日00:22:34 科技 5522

劃重點

OpenAI CTO穆拉蒂:Sora將於年底發布,未來會增加語音功能 - 天天要聞

騰訊科技訊 據國外媒體報道,美國當地時間周三,人工智慧初創公司openai的cto米拉·穆拉蒂(mira murati)接受外媒專訪。在訪談中,穆拉蒂詳細介紹了openai文本轉視頻人工智慧工具sora以及其發布計劃,還談了訓練數據、紅隊測試以及與電影業合作等話題。以下為外媒報道摘要:

人工智慧正在迎來下一個「魔法時刻」,在這個時代,你的話語將不再僅僅是文字,它們將被賦予生命,轉化為生動逼真的視頻。這正是openai最新研發的sora所帶來的革命性變革,它讓視頻製作變得更加簡單、高效。

sora或許將在今年晚些時候與我們正式見面。然而,在此之前,openai已向公眾展示了其驚人之處:利用精心編寫的提示和強大的處理能力,許多原本需要人工參與的視頻製作環節變得輕而易舉。想像一下,許多充滿創意的提示,如美人魚與她的螃蟹夥伴一同點評智能手機,或是一頭牛悠然自得地漫步在瓷器店中,這些場景在sora的魔力下都將成為可能。

當openai上個月開始預覽其利用生成人工智慧工具製作的視頻時,互聯網瞬間沸騰了。此前的人工智慧視頻技術已經可以呈現出斷斷續續、解析度較低的片段,而sora所生成的視頻卻如同自然紀錄片或大片級別的作品,令人嘆為觀止。

sora不僅為我們所熟悉的人工智慧感覺循環注入了新的活力,更引發了人們對其能力的驚嘆和社會的深深憂慮。穆拉蒂在採訪中保證,openai在發布這一強大工具時將採取極為慎重的態度。然而,即便如此,我們也不能保證一切都會朝著好的方向發展。

穆拉蒂透露,一段20秒時長、720p解析度的無聲視頻,僅僅幾分鐘就能製作完成。但她表示,他們計劃在未來為視頻增加語音功能,讓內容更加完整。

sora究竟是如何工作的?穆拉蒂解釋稱,sora的人工智慧模型通過大量視頻數據的學習,學會了識別和理解各種物體與動作。當你給它一個文本提示時,它能夠迅速勾勒出整個場景,並逐幀填充細節,從而生成出令人驚艷的視頻內容。

人工智慧就像黑盒子

業內觀察人士和競爭對手們(包括runway的首席執行官)紛紛將openai在視頻生成技術方面取得的成就歸功於其龐大的計算能力和豐富的訓練數據。然而,近期openai卻陷入了版權侵權訴訟的漩渦,被指控未經許可抓取內容以訓練chatgpt。

openai在訓練sora時使用了哪些數據?穆拉蒂回答稱:「我們使用了公開可用的數據和授權數據。」當被進一步問及是否包括youtube、instagram和facebook等平台上的視頻時,她表示並不清楚具體情況。不過,穆拉蒂後來證實,授權材料確實包括了來自一些攝影圖片網站的內容。

對於普通用戶來說,人工智慧模型就像是一個黑盒子,我們只知道輸入提示和輸出內容,卻無法窺探其中的工作機制。因此,我們永遠無法確切知道為什麼某些事物在生成時會呈現出特定的樣子。

穆拉蒂還透露,目前利用sora生成視頻的成本遠高於使用該公司圖像生成器dall-e生成圖像。然而,她表示在sora於今年年末向公眾發布時,他們將努力優化演算法,以降低所需的計算能力,從而使更多人能夠享受到這項技術帶來的便利。

在當前的早期階段,我們如何能夠識別出視頻是由人工智慧生成的而不是真實拍攝的呢?仔細觀察sora的作品,你會發現一些明顯的痕迹。比如,有的視頻中,人手上長出十根手指,穆拉蒂對此解釋道:「要準確地描繪手部運動真的很難。」

在另一段視頻中,創作者要求sora展示一個機器人從電影製片人手中搶走攝像機的場景。然而,生成的視頻中,原本的人類電影製片人突然變成了一個動作不自然的電影製作機器人,而且背景中的車輛也在不經意間發生了顏色的變化,從黃色計程車變成了銀色轎車。穆拉蒂對此解釋說,儘管該模型在保持場景連續性方面已經做得相當好,但仍有待完善。

如何識別ai生成視頻?

那麼,當這些技術故障被解決後,我們該如何區分真實視頻和人工智慧生成的視頻呢?穆拉蒂提到了可能的解決方案:在視頻的底部添加水印。她表示,這些視頻最終將包含元數據,用以標明其來源,這有助於我們識別和追溯其生成方式。

除了技術問題,openai還在致力於通過紅隊測試來確保sora的安全性和可靠性。紅隊成員嘗試使用各種提示來挑戰sora,以發現可能存在的漏洞、偏見和其他有害結果。穆拉蒂稱:「這就是為什麼我們實際上還沒有部署這些系統的原因。我們需要先弄清楚這些問題,然後才能廣泛部署它們。」

穆拉蒂透露,sora的提示詞政策可能會借鑒其圖像生成器dall-e的先例。比如,sora將不允許生成公眾人物的圖像。

而關於可能涉及裸體的內容,穆拉蒂表示,公司正在與藝術家們緊密合作,探討如何在不限制創造力的前提下,為這類內容設置適當的「護欄和限制」。

與好萊塢合作

隨著像sora這樣的工具不斷進步和完善,我們不禁要問:人類將如何適應這樣的變革?在一個僅需文字提示就能取代無人機操作員或角色插畫師的世界裡,人類將扮演怎樣的角色?對於好萊塢等行業來說,這種變革既帶來了擔憂,也帶來了興奮。

泰勒·佩里(tyler perry)在親眼目睹sora的出色表現後,決定暫停他原本計劃耗資8億美元的工作室擴建計劃。他意識到,這項技術有可能大幅度減少在布景和外景拍攝上的費用,但同時也引發了人們對未來職業前景的擔憂。美國動畫協會主席珍妮特·莫雷諾·金(jeanette moreno king)認為,雖然藝術決策仍然需要人類的參與和判斷,但「未來是模糊的」,充滿了不確定性。

與此同時,愛德華·薩奇(edward saatchi)和他的人工智慧視頻工作室fable正在構想著一個更加前衛的概念——一個人工智慧版的netflix。用戶只需輸入一個提示,系統便能生成出完整的劇集,滿足觀眾的觀看需求。

當被問及sora對視頻製作工作可能帶來的影響時,穆拉蒂再次強調了openai在發布這項技術時的謹慎態度。她表示,openai已經讓一些行業內部人士提前進入測試階段,以便更好地了解並應對可能出現的挑戰。她說:「我們希望電影界人士和世界各地的創作者都能參與進來,與我們共同探索如何進一步推動這些行業發展。」

儘管openai在推進這項技術時表現得像瓷器店裡的一頭公牛,那麼它需要小心翼翼地避免破壞現有的秩序。但不可避免的是,隨著技術的不斷進步和應用,它終將開始「撞碎瓷盤」,進而引發視頻製作行業的深刻變革。(編譯/金鹿)

科技分類資訊推薦

在520用iPhone拍出愛 每個人都可以擁有屬於你的瞬間 - 天天要聞

在520用iPhone拍出愛 每個人都可以擁有屬於你的瞬間

我們的生活中總有一些珍貴而無法複製的瞬間,智能手機的出現,讓我們能夠更好地去記錄它們,並分享給身邊的人。諧音「我愛你」的5月20日,是一個向戀人、家人、朋友甚至自己表達愛意的最佳時刻。為什麼不在這一天,拿起我們手邊的iPhone去捕捉那些動人心弦的瞬間?
北大一研究院鄭州正式開建|雷軍駕駛小米汽車疑似遭惡意別車 - 天天要聞

北大一研究院鄭州正式開建|雷軍駕駛小米汽車疑似遭惡意別車

5月18日,河南首批低空無人機物流配送航線啟動儀式在鄭州舉行。上午10時13分,一架無人機載著用戶下單的手機,從河南科技市場數碼港啟程,用時11分鐘即抵達新天地通訊大廈。另外開通的兩條航線分別為從鄭州公園茂到正弘匯、二砂文創公園到鄭州市植物園。今日關注◆北大一研究院鄭州正式開建5月18日上午,北京大學鄭州新材料...
會議通知:第三屆社會遙感地理計算暨中國遙感應用協會社會遙感地理計算專業委員會學術年會(三號通知) - 天天要聞

會議通知:第三屆社會遙感地理計算暨中國遙感應用協會社會遙感地理計算專業委員會學術年會(三號通知)

遙感科學、地理信息科學與人文社會科學跨學科交叉融合,催生了社會遙感地理計算這一創新性的研究方向,衍生了遙感經濟學、遙感新聞學、醫學遙感與環境健康、遙感國際關係分析、時空大數據與犯罪地理、遙感考古與文化遺產智能計算、生態價值遙感監測、歷史GIS與遙感分析、文學GIS與語言地理、社交媒體數據分析、空間優化、時空智能計算、數字資產活化等眾多分支。
京東 618 蘋果 iPhone 15 Pro 到手價 6099 元起,限量現貨 - 天天要聞

京東 618 蘋果 iPhone 15 Pro 到手價 6099 元起,限量現貨

IT之家 5 月 19 日消息,Apple 產品京東自營旗艦店現已開啟 618 優惠活動,iPhone 15 Pro 到手價 6099 元起,iPhone 15 Pro Max 到手價 7949 元起,活動時間為 5 月 19 日到 5 月 28 日。IT之家匯總如下:iPhone 15 Pro128GB 6099 元(首發價 7999 元)256GB 69
馬斯克最新動作!腦機試驗開始招募第二名患者!首試者:「這款設備讓我震驚」 - 天天要聞

馬斯克最新動作!腦機試驗開始招募第二名患者!首試者:「這款設備讓我震驚」

每經編輯:畢陸名當地時間周五,腦機介面公司Neuralink的創始人埃隆·馬斯克宣布,繼年初首個參與該公司腦機設備植入實驗的患者手術成功100天後,正式開始招募第二個接受腦機植入的患者。圖片來源:社交媒體截圖Neuralink開發的N1 Implant需要通過手術放置在使用者頭骨中,使植入者光憑「意念」就能操作電腦、手機。目前這...
科技成為視障人士的「眼睛」 曾經的不可思議變得容易 - 天天要聞

科技成為視障人士的「眼睛」 曾經的不可思議變得容易

目前全國約有1700萬視障人士,越來越多的數字技術也正化身視障人士的「眼睛」。廣州視障女孩諾子就在科技的助力下,完成了一個人乘坐交通工具、參加漫展、外出旅遊等原來視障人士難以想像的嘗試。在廣州生活的諾子,六年前因患神經系統罕見病,導致視力一級和肢體三級障礙。她剛剛使用的這款軟體,可以通過視頻電話的方式,...
消除隱患!電動自行車電池有了新標準 還需要做這些工作 - 天天要聞

消除隱患!電動自行車電池有了新標準 還需要做這些工作

本周,北京、上海、浙江等多地開展了涉及電動自行車的消防安全排查,主要圍繞電動自行車「改裝」這一問題進行查處。當越來越多人享受著電動車帶來的出行便利時,越來越大的消防安全風險也在累積。相關事故一次次提醒我們注意:電動自行車究竟是哪些部件、哪些環節出了問題,才會給我們帶來如此巨大的隱患?我們又該如何消除...
智能新紀元:vivo Watch GT的日常革命 - 天天要聞

智能新紀元:vivo Watch GT的日常革命

個人故事與科技的邂逅在一個陽光明媚的周末,我走進了一家聞名遐邇的電子產品商店,心中滿懷著對未知的好奇和對新奇事物的渴望。那是我第一次接觸到智能手錶——一個小巧精緻的裝置,它的光滑屏幕和精密的感測器讓我感到驚訝。
AI原創新聞製造者:擇優選用關鍵因素及技術要求 - 天天要聞

AI原創新聞製造者:擇優選用關鍵因素及技術要求

身為對撰寫飽含熱忱的研究人員,本人深深關注AI原創新聞製造者領域。當今社會,信息激增,用戶對文章的需求水漲船高,AI原創新聞製造者正成為新的便捷工具,助用戶高效產出優質文章。擇優選用此類工具時,我會關注它的創意原創性、文章品質及操作簡易程度等關鍵因素。