AI深水炸彈已然爆炸

禁止劇透,劇透拉黑。

沒有絲毫預熱和劇透,Open AI深夜直接丟下核彈炸了街,從業者深感要變天。2月16日凌晨,Open AI發佈了首個"文生視頻"模型Sora。官方介紹Sora能根據文字指令創造出包含豐富細節的逼真場景角色,且能用多角度鏡頭生成一鏡到底的60秒長視頻。

目前官網上已經更新了48個樣片,視頻中人物背景都具有驚人的一致性,並且藉助於對語言的深刻理解,Sora創造出的角色能表達豐富的情感。更令業內驚嘆的是,Sora身上似乎開始出現"世界模型"的雛形。通過大量觀察訓練,它學會了許多關於真實世界的物理規律。

要知道原先動畫影視公司為讓動物的數百萬根毛髮、皮膚紋理、衣物等細節在3D建模中表現得如現實場景般真實,為此專門成立研究部門,且投入了不菲的成本和時間才得以實現。而如今Sora只需要一行描述,幾次提示便能自動完成。

雖然Open AI坦言Sora仍有一些效果上的瑕疵,也因潛在的風險暫未對公眾開放,但憑藉著極度真實的視覺效果,這一足以"模糊虛實"的王炸級技術正粗暴地衝擊着大眾心智。

事實上文生視頻並非Open AI的獨門,賽道早已湧入大量玩家。去年下半年開始,谷歌Meta及部分AI創業公司相繼下場試水,國內的位元組跳動也於11月推出了文生視頻模型Pixel Dance、阿里雲的Animate Anyone以及百度文心大模型的類似功能同樣在內測,入局者眾多但各家效果卻未達預期。

當Runway Gen2、Pika Pix、Verse等AI視頻工具還在突破數秒內的連貫性時,Sora已經將時長拉至1分鐘,大幅度拉高生成視頻的可用性。影眸科技CTO張啟煊評價道:Sora跟Pika Runway及同類玩家已拉開代差,