文 / 梁添
來源 / 節點財經
剛被「AI殺死SaaS」,引發全球資本市場軟件股震蕩的消息刷屏,這不,「AI顛覆影視工業」的論調又甚囂塵上,只不過這次的主角是中國公司——位元組跳動於2月7日開啟灰度測試的,AI視頻生成模型Seedance2.0,迅速在行業內外引發關注。
短短几天內,Seedance 2.0 的測評內容幾乎刷屏,社交平台和技術社區充斥着對其能力的討論。遊戲科學 CEO 馮驥甚至直言,這是「當前地表最強的視頻生成模型,沒有之一」。在海外平台,相關演示視頻同樣引發熱議,不少網友用「insane」來形容其效果。
相比起Anthropic重挫軟件股Seedance 2.0則帶動傳媒板塊盤中漲勢擴大。2月10日,讀客文化、榮信文化20%漲停,光線傳媒等十餘只個股跟漲。資本市場的敏銳嗅覺似乎在預示,這一次,AI對影視工業的改造,不再是空中樓閣。
為了體驗具體效果,我直接在小雲雀app里使用了 Seedance 2.0,下面講的體驗也都基於這個平台。
豐富的運鏡與分鏡能力
如果你是AI視頻的忠實擁躉,你會清楚,以往AI視頻往往更接近「一鏡到底」的效果,即便嘗試拆分鏡頭,也容易出現節奏失衡或畫面失真的問題。
而在 Seedance 2.0擺脫了早期視頻模型常見的固定機位輸出模式。
模型能夠根據用戶提供的Prompt,自行規劃鏡頭與節奏,創作者只需專註故事本身。
比如,官方展示的「黑衣人街頭逃亡」片段中,鏡頭不再是單調的平移,而是展現了一定難度的調度能力:從背後的推進跟拍,到平行移鏡,再到人物摔倒,水果掉落在地。從呈現結果看,模型彷彿是一位經驗豐富的攝影師,能看懂物理世界。
為了驗證這一點,我並未直接使用複雜的官方 Prompt,而是用自然語言輸入了一個簡單指令:「一隻布偶貓用爪子把一隻兔子按倒在地上。 」
儘管因為服務器爆滿,我足足排隊了 30 分鐘,這也側面印證了市場的火熱,但生成的 10秒視頻效果十分靈動,宛若實景拍攝。
你要是認真去逐幀截圖看,會發現細節也比較到位。布偶貓的尾巴的自然擺動,寵物身上的毛髮,十分細膩。而且兩個寵物的互動也十分自然,比我在幾個月前測評的另一款視頻模型效果好很多。
當然,如果你擔心ai生成的內容風格會不喜歡,或者你想要特定的風格,你也可以給定圖片、視頻、音頻素材,並且艾特明白特定參考對象。只要意圖表達足夠清晰,模型在理解和整合不同參考信息時表現出較強的穩定性。
過去你想創作一個內容,或許得懂分鏡和運鏡,現在這些專業內容直接交給AI就能完成,這種突破意味着,過去高度依賴分鏡師、導演和攝影團隊完成的前期拍攝規劃,正在被壓縮為一個創作者即可完成的流程。視頻內容真真正正實現了平權。二、當聲音成為畫面的自然語言
傳統視頻模型由於生成過程中的隨機性,往往難以保證畫面與聲音之間的邏輯一致性。
Seedance 2.0 的另一個殺手鐧在於"音畫協同"。
官方文檔提到,模型在訓練階段就強化了視聽融合。使得視頻生成不再只是畫面輸出,而是能夠同步生成相匹配的音效與配樂,在人物對白場景中也能較好地保持口型與情緒的一致。
在測試"ASMR 水晶刀切玫瑰"的場景時,我特意關注了聲音的細節。當刀刃切入花瓣的瞬間,那細微的酥脆聲與畫面完全同步,沒有絲毫延遲。
在另一個「19世紀倫敦街頭」的案例中,蒸汽機車駛過時,不僅風吹起了女主的裙擺,嘈雜的人聲、車輪聲與風聲也隨之呼嘯而過。
在《節點財經》看來,直接為創作者省去了後期音效製作環節,讓生成的內容直接具備了「成片」屬性。可以說,AI 視頻正在吞噬的並不只是剪輯或配音這樣的單一工種,而是開始覆蓋影視製作中多個原本分散的協作環節。
從「抽卡」到「穩定可控」
簡單的分鏡、鏡頭切換、音樂畫面協同,Seedance 2.0都能輕鬆拿捏,那麼在特別豐富的場景中呢?Seedance 2.0的指令遵循能力又如何呢?
影視從業者或許再熟悉不過了,很多AI視頻,上一秒主角是長發,下一秒可能就變成了短髮,或者一個人有三條胳膊之類,這種「變形」讓 AI 很難用於長內容。
為此,我們增加了難度,來測評Seedance 2.0 在超多鏡頭下的「穩定性」。
為了測試模型能力,我們參考官方提供的一組高難度「暗黑魔法」腳本,要求生成一段長達 15 秒、包含三個分鏡,包括仰拍、環繞、特寫的複雜視頻,甚至要求鏡頭在三個不同人物間快速切換。
鏡頭猛烈向前推近,伴隨着強烈的能量衝擊波!左側紅衣女將眼神銳利如刀,猛然拔出腰間長劍,劍身爆發出熾熱的火焰,她振臂高呼:「犯我疆土者,雖遠必誅!」。鏡頭圍繞中間的白衣男主和綠衣女主進行快速環繞俯衝,綠衣女主手中的法杖頂端寶石光芒大盛,地面上浮現出古老的魔法陣。右側金甲武將發出一聲震天怒吼,將巨斧重重砸在地面,激起一圈金色的能量漣漪,風云為之變色。背景天空中的流光變成巨大的火流星划過,遠處的城市燃起熊熊烽火,整個畫面充滿了山雨欲來的緊張感和毀天滅地的戰鬥氣勢。最後,鏡頭快速拉遠,定格在五位英雄共同釋放力量、準備迎接最終決戰的宏大史詩場面。
在我們看來這段腳本頗為複雜,達到了270字,作為對比,文章前面使用的腳本只有寥寥幾十字,當然,我們也直接採用了官方的圖片:
為了讓大家充分感受Seedance 2.0的運鏡能力,我們還從小雲雀app找了很多現成的用戶案例供大家參考。
比如,大戰奧特曼,這畫面真的很像真人版奧特曼電視劇。
再比如,雨夜廢棄工廠打鬥,宛若中國香港電影大片般地質感。
再比如,一對多的打鬥場面,動作十分絲滑。彷彿真人走進遊戲世界。
可以看出,Seedance 2.0擁有十分成熟的運鏡能力,這也使得視頻生成正在從高度隨機的「抽卡階段」,進入到相對可控、可復現的生產階段,這也是 AI 視頻能否真正進入內容產業鏈的關鍵前提。
工具不再稀缺,誰才不可替代?
從各路案例看下來,Seedance2.0最突出的就是運鏡和剪輯能力,以及人物和場景的一致性。
如果只是看視頻截圖,真的讓人分不清楚到底是AI、專業班底製作還是實拍,但是如果你看了很多官方、用戶素材的話,你會發現部分視頻的人物情感細膩度、文本的呈現、甚至部分內容穩定性上,仍有提升空間。
從這一點看,或許Seedance 2.0還不足以徹底改變影視界,但它的出現,在於大規模降低了影像表達的門檻。
過去,影像是一種高度依賴組織、資金和工業體系的媒介。很多人有想法,但是沒有資格實現。現在,工具開始把「想像」與「呈現」之間那道最厚的牆拆掉,讓個人第一次可以在不依附體系的情況下,把腦中的畫面變成可觀看的內容。
這並不會立刻取代導演或影視工業,但會悄然改變創作權力的分佈方式,以及哪些人能夠持續進入表達的場域。這反而會逼迫行業重新回答一個問題,在工具不再稀缺的時代,什麼樣的創作者才能不可替代。
從長遠角度看,無疑讓我們看到了AI重塑內容行業的未來。正如馮驥所說的「kill the game」,更像是對技術水準的情緒化評價,而非對行業現實的直接判斷。
多模態正是2026年各家模廠的必爭之地,真正的變化,才剛剛開始,未來值得我們期待。
*題圖由AI生成