封面新聞記者 張崢 實習生 劉涵
當東京街頭一位時尚女郎款款走來,而這竟是全部由AI創作的視頻,不要吃驚,這是OpenAI公司研發的文生視頻工具:Sora。Sora在全球範圍內的爆火,對於科技的進步有著怎樣的象徵?對於普通人的生活又會有什麼影響?對於這些問題,你想聽聽相關專家的解答嗎?
2月21日,封面新聞邀請到了重慶大學新聞學院教授劉海明,四川大學中華文化傳承與全球傳播數字融合實驗室教授宋耀,四川博主「AI瘋人院」熱搜視頻、AI生成動畫短片《西遊記》創作者馮彬,通過微博連線的方式和大家聊了聊人工智慧文生視頻工具。馮彬還現場展示了一段鳳凰飛舞的AI生成視頻。實時數據顯示,有近16萬粉絲收看了直播。

如何看待Sora的誕生?
Sora像是一枚在AI圈子炸響的「炸彈」,從業者們都對此表現出驚喜。宋耀認為這是「跨時代」的作品,從ChatGPT的「文生文」到Sora的「文生視頻」,AI這兩年的技術進步無疑是飛躍式的。「Sora最重大的意義,是標誌著世界模型成為可能。」由AI創造一個與現實世界一模一樣的模擬世界,讓「黑客帝國」中的暢想成為可能。
而在AI動畫領域擁有豐富經驗的馮彬則對其物理引擎感到欣喜。在從前的AI生成視頻中,往往都是「畢加索」式的抽象派風格視頻,眼睛在畫面左邊,嘴巴又跑到了畫面的右邊。而與現實更貼切的Sora則不僅能把鼻子嘴巴安放在正確的位置,還能展示動態的60秒連貫視頻,這是行業內里程碑式的創作。
劉海明則認為這樣的飛躍是可以預料的。人工智慧由於其自我學習的特性,迭代肯定越來越快,技術的爆發期遲早要到來。
AI視頻是怎樣誕生的?
關於如此逼真的AI視頻是怎樣誕生的?Sora又是跟誰學習到如此精緻的「畫功」的呢?宋耀首先答疑解惑。
「AI本質上是機器對於人類成果的模仿學習,而Sora也是通過大量學習人類拍攝過、創作過的視頻與動畫,然後再把其中的元素們進行擬合。」
「走在東京街頭的時髦女性並沒有現實的原型。 」宋耀解釋。可能是AI從電影A里選眼睛,從電影B里選妝容等,再將這些元素擬合在一個視頻里,才會帶來如此「以假亂真」的效果。
馮彬則現場為收看直播的觀眾展示了一次由AI創造視頻的全過程。他輸入了創造一幅「鳳凰」畫的指令,並表示,可以輸入迪士尼卡通風格,也可以輸入中國風,不同的提示詞下出現的鳳凰畫面不同,而每次AI輸出成果後,還要通過指令繼續對畫面進行調整。在AI與人的意見多次交互後,才能生出栩栩如生的鳳凰動畫。「AI創造目前離不開人的控制。」馮彬最後總結。

AI生成的鳳凰
Sora會讓視頻創作者們「人人自危」嗎?
在對新技術的誕生表達欣喜之餘,其可能帶來的社會變革也讓一些人產生了危機感。Sora的創造能力如此優秀,相應的視頻創作者們會害怕被AI代替嗎?對此,三位嘉賓給出了自己的解答。
「AI的本質,還是站在人類的肩膀上。」劉海明教授說道,「在ChatGPT誕生時,也有許多人擔心文字工作者們,比如記者的工作會被取代。可是AI由於其學習的特性,總是具有一定的滯後性,而記者是在記錄當下發生的事情,AI是不能取代的。」
馮彬也表達了相似的觀點:「各種從業人員擁有的主觀性的感受才是真正的壁壘。對於美的感受,色調的感受,繪畫的經驗,這些一定是AI短時間內不會替代的,反而AI更像是對某一行業的輔助工具。」就像他用runway演示鳳凰的製作一樣,「需要視頻製作的專業人士去指導,操控AI作品的生成與把控。」
宋耀則在技術領域提出了自己的看法。「從代替人類工作的水平衡量,目前Sora的技術依然不夠成熟。」由於依賴現實經驗的學習,所以Sora的很多物理交互模型依然有著缺陷。「人咬一口漢堡,咬到每一層會施多少力?杯子掉在地上,每一塊玻璃會怎麼破碎?這些細微的物理模型對目前的Sora來說還需要繼續學習。」
同時,三位教授對於最近熱議的「AI賣課割韭菜」事件的看法非常一致。「Sora都沒有公測,我們又怎樣才能學習呢?」宋教授打趣道。「大可不必焦慮」「讓子彈多飛一會兒」,三位專家這樣建議。

【如果您有新聞線索,歡迎向我們報料,一經採納有費用酬謝。報料微信關註:ihxdsb,報料QQ:3386405712】