a16z認為的下一個千億賽道來了！你知道嗎？

2025年04月11日16:53:07 科技 1844

本文將深度剖析這一千億級賽道的技術躍遷路徑——從嘴型同步到全身動作捕捉，從情緒驅動到實時交互；揭示其商業落地場景如何覆蓋C端UGC創作、B端廣告自動化、企業級培訓分身；並展望未來五年內可能突破的五大技術瓶頸。

昨天的文章里講了兩個我做AI出海顧問期間遇到的兩個「比較坑」的產品方向兩個「特別坑」的AI產品創業方向，你知道嗎，今天再來講講我遇到比較好的一個方向，就是AI視頻這塊。

我合作過5家AI視頻類的公司，有專門做視頻生成的，也有做視頻剪輯的。這兩類算是不同賽道，但隨着技術進步，從產品層面在逐漸融合。

視頻生成賽道比較典型的代表是Pika、Runway等產品，視頻剪輯賽吧典型代表是HeyGen、Opus Clip等產品。生成賽道一開始吸引人的點還是在於新鮮感，而視頻剪輯賽道，從AI虛擬人到長視頻剪短視頻、再到口型同步，還有直接生成AI UGC以及商品融合等等。

這個賽道很典型的特徵就是市場足夠大，用戶需求很大，而且有不同人群的需求，比如純粹的創作者有創造需求，做增長的有營銷視頻需求，做銷售的有產品介紹視頻需求，甚至在創作者領域還可以再細分，比如專門面向播客人群，面向二次元人群等等。競爭也激烈，絕對是一個紅海賽道，但所幸市場足夠大，我合作過的視頻類產品，增長和營收都很不錯，因為確確實實帶來了新的生產力革命，整個用戶使用是完全閉環的。

當AI不再只是「生成內容」，而是「成為內容」的一部分，一場內容生產的革命就此開啟。

過去幾年，AI已經能生成逼真的圖片、視頻和聲音，悄然通過視覺和聽覺的圖靈測試。但2025年最令人激動的突破，毫無疑問是——AI虛擬人（AI Avatar）。

這些不再「恐怖」的AI角色，正以驚人的速度衝出「恐怖谷」，開始全面滲透內容創作、廣告營銷、企業培訓等多個領域。這不僅是AI的一次技術躍遷，更是內容產業的一次範式轉變。

今天正好看到a16z發了最新的一篇關於AI Avatar虛擬人這方面的報告，以下是精華信息總結，給大家分享。

一、AI虛擬人研究的演化軌跡：從嘴型匹配到全身互動

真正的挑戰不是嘴巴動了，而是表情、頭部和身體的每一處細節是否同步、自然。

生成一個「會說話的臉」並不簡單。研究人員面臨的最大難題是：語音（phoneme）到嘴型（viseme）的精準匹配，再加上面部肌肉、眼神、甚至上半身動作的自然聯動。

AI虛擬人技術近幾年突飛猛進，從最早的CNN、GAN，到NeRF、3DMM、Transformer、Diffusion模型，如今已發展到基於Transformer的擴散模型（DiT）。最新代表作如ByteDance的 OmniHuman 和Hedra的 Character-3，已可實現逼真的半身/全身動作、表情同步、甚至環境互動。