a16z认为的下一个千亿赛道来了!你知道吗?

2025年04月11日16:53:07 科技 1844

本文将深度剖析这一千亿级赛道的技术跃迁路径——从嘴型同步到全身动作捕捉,从情绪驱动到实时交互;揭示其商业落地场景如何覆盖C端UGC创作、B端广告自动化、企业级培训分身;并展望未来五年内可能突破的五大技术瓶颈。

a16z认为的下一个千亿赛道来了!你知道吗? - 天天要闻

昨天的文章里讲了两个我做AI出海顾问期间遇到的两个“比较坑”的产品方向两个“特别坑”的AI产品创业方向,你知道吗,今天再来讲讲我遇到比较好的一个方向,就是AI视频这块。

我合作过5家AI视频类的公司,有专门做视频生成的,也有做视频剪辑的。这两类算是不同赛道,但随着技术进步,从产品层面在逐渐融合。

视频生成赛道比较典型的代表是Pika、Runway等产品,视频剪辑赛吧典型代表是HeyGen、Opus Clip等产品。生成赛道一开始吸引人的点还是在于新鲜感,而视频剪辑赛道,从AI虚拟人到长视频剪短视频、再到口型同步,还有直接生成AI UGC以及商品融合等等。

这个赛道很典型的特征就是市场足够大,用户需求很大,而且有不同人群的需求,比如纯粹的创作者有创造需求,做增长的有营销视频需求,做销售的有产品介绍视频需求,甚至在创作者领域还可以再细分,比如专门面向播客人群,面向二次元人群等等。竞争也激烈,绝对是一个红海赛道,但所幸市场足够大,我合作过的视频类产品,增长和营收都很不错,因为确确实实带来了新的生产力革命,整个用户使用是完全闭环的。

当AI不再只是“生成内容”,而是“成为内容”的一部分,一场内容生产的革命就此开启。

过去几年,AI已经能生成逼真的图片、视频和声音,悄然通过视觉和听觉的图灵测试。但2025年最令人激动的突破,毫无疑问是——AI虚拟人(AI Avatar)。

这些不再“恐怖”的AI角色,正以惊人的速度冲出“恐怖谷”,开始全面渗透内容创作、广告营销、企业培训等多个领域。这不仅是AI的一次技术跃迁,更是内容产业的一次范式转变。

今天正好看到a16z发了最新的一篇关于AI Avatar虚拟人这方面的报告,以下是精华信息总结,给大家分享。

一、AI虚拟人研究的演化轨迹:从嘴型匹配到全身互动

真正的挑战不是嘴巴动了,而是表情、头部和身体的每一处细节是否同步、自然。

生成一个“会说话的脸”并不简单。研究人员面临的最大难题是:语音(phoneme)到嘴型(viseme)的精准匹配,再加上面部肌肉、眼神、甚至上半身动作的自然联动。

AI虚拟人技术近几年突飞猛进,从最早的CNN、GAN,到NeRF、3DMM、Transformer、Diffusion模型,如今已发展到基于Transformer的扩散模型(DiT)。最新代表作如ByteDance的 OmniHuman 和Hedra的 Character-3,已可实现逼真的半身/全身动作、表情同步、甚至环境互动。

a16z认为的下一个千亿赛道来了!你知道吗? - 天天要闻

二、AI虚拟人的“真实工作”:不是玩具,而是生产力工具

AI虚拟人不再只是好玩的技术展示,而是创造实际商业价值的工具,从消费者内容创作到企业培训,都能看到它的身影。

1. 普通用户:人人都能创造角色

一个图 + 一段音频 = 你的AI主播上线了!

从动漫角色、游戏人物、虚拟偶像,到播客主持人、AI主播,只需一张图片+一段语音,用户就能一键生成“会说话”的视频。

代表产品如 Hedra,甚至能支持情绪指令控制角色表情;Runway、Viggle 还支持真人视频驱动角色动作。YouTube 上《The Monoverse》系列就是一个全AI制作的代表作。

更令人期待的是,“实时对话”正逐渐成为现实。想象一下,未来的语言学习不再是冷冰冰的语音助手,而是一个有表情、有动作、有性格的“AI语言老师”。

2. 中小企业:一键生成广告

AI虚拟人最先在广告领域爆发。相比传统广告拍摄,AI视频创作无需演员、无需摄影棚、无需剪辑师,几分钟搞定一条高质量短视频。

工具如 Creatify、Arcads 支持输入商品链接,自动生成脚本、画面、BGM、AI演员,大幅降低广告制作门槛。现在,电商、游戏、App广告中,AI人已经随处可见。

B2B企业也在跟进:Yuzu Labs、Vidyard 提供带AI代言人的视频外联邮件、产品介绍、活动宣传等内容。

3. 大型企业:培训与内容本地化神器

企业层面,AI虚拟人应用主要集中在:

  • 培训视频自动化:如 Synthesia 可生成入职培训、产品教程等内容,节省人力;
  • 多语言内容本地化:配合 ElevenLabs 的AI语音翻译,一条视频可快速转成多国语言;
  • CEO分身:用AI复刻CEO形象,生成个性化沟通视频,扩大“高管影响力”。

三、AI虚拟人的技术组成:不仅是脸,还要有“灵魂”

要打造一个真正自然的AI虚拟人,需要攻克以下五大模块:

a16z认为的下一个千亿赛道来了!你知道吗? - 天天要闻

此外,若要实现实时交互,还需:

  • 大脑(记忆与对话):连接知识库、具备个性与记忆;
  • 低延迟流媒体传输:如 LiveKit、Agora 正在攻克该难题。

四、哪些痛点仍待突破?

五个令人期待的未来发展方向

我亲测后发现,这个领域还有几个激动人心的发展方向:

1. 角色变形和场景切换

不再局限于固定造型!想象一下,同一个角色可以:

  • 在视频中换装、更换发型
  • 从坐姿切换到站姿
  • 从室内场景切换到室外
  • 拥有多种情绪状态和姿势供选择

HeyGen已经开始提供这项功能,他们的AI主持人Raul有20种不同的外观和场景!

2. 更自然的表情和情感

AI能理解内容情感,做出合适反应:

  • 说到可怕的事情时表现出恐惧
  • 听到笑话时自然微笑
  • 讲述伤心故事时流露悲伤
  • 根据语调自动调整表情强度

Captions新推出的Mirage模型在这方面取得了显著进步,表情范围和自然度大幅提升。

3. 与现实世界互动

AI角色能”触摸”周围物品:

  • 在广告中拿起展示的产品
  • 与屏幕上的图表互动
  • 指向背景中的特定元素
  • 操作虚拟设备

Topview在这方面已经取得了突破,他们开发了一种流程,允许AI角色在广告中展示实际产品。

4. 全身动作与手势表达

超越简单的上半身动作:

  • 自然的手势配合语音内容
  • 走动、坐下等全身动作
  • 舞蹈和复杂动作序列
  • 根据性格特点定制动作风格

目前Argil允许用户为视频不同部分选择不同类型的肢体语言,但未来的技术将更加自然流畅。

5. 实时应用的爆发

延迟和可靠性接近人类水平:

  • 与AI医生进行视频咨询
  • 与AI导购一起浏览产品
  • 与你最喜欢的电视剧角色视频聊天
  • AI老师提供实时反馈和辅导

Tavus的最新模型已经能够实现较低延迟的实时对话,我实际测试了与AI数字人的视频对话,体验接近真人交流。

五、未来趋势预测:AI虚拟人将成为千亿级赛道

有人用它讲故事,有人用它卖货,有人用它打造自己的“数字分身”。

随着底层模型质量的显著提升,AI虚拟人正从“看上去有点怪”走向“你甚至分不清真假”。

我们预计,内容创作型AI的下一个风口就是AI虚拟人。

  • 做营销的公司需要能自动写脚本、选演员、生成广告的视频平台;
  • 做教育、讲故事、创作IP的人,需要能管理角色、场景、剪辑的视频创作工具;
  • 企业则需要可大规模部署的培训、沟通、客户服务解决方案。

这不再是“AI代替人类”,而是“每个人都能拥有自己的数字化表达分身”。多家公司已经在这个领域崭露头角,可能会诞生多个十亿美元级别的企业。关键在于找到特定的用例和目标客户,并围绕它们构建完整的工作流程。

结语:虚拟人类时代已经开始

AI虚拟人不仅仅是一个“技术突破”,它代表着一个全新内容表达方式的诞生。

当你可以让任何形象说话、表达、互动,我们正在进入一个人人都是导演、每张图都能开口说话的时代。‍

本文由人人都是产品经理作者【深思圈】,微信公众号:【深思圈】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

科技分类资讯推荐

零跑全新C11上市,14.98万起售 - 天天要闻

零跑全新C11上市,14.98万起售

7月10日,零跑汽车旗下智能越享中型SUV——全新C11正式上市,上市指导价14.98-16.58万元。零跑C11上市4年来,累计销量已突破25万台,是零跑的重要的走量车型,全新C11在造型设计、智能座舱、续航性能、辅助驾驶、驾控体验及安全基因等六大维度实现全面升级。此次上市的全新C11延续纯电与增程双动力版本,其中,纯电车型搭载...
张旭院士:我国类脑智能规模应用潜力巨大 - 天天要闻

张旭院士:我国类脑智能规模应用潜力巨大

7月11日,省加快推进现代化产业体系建设专题会议(人工智能与机器人产业专场)在广州举行。现场,来自相关领域的专家学者、企业家、人大代表、研究机构代表踊跃发言,为广东人工智能与机器人产业的发展积极建言、出谋划策。中国科学院院士、广东省智能科学与技术研究院院长张旭表示,类脑智能技术作为新一代智能技术的核心...
【芯片】Tensor G5曝光,Pixel10工程机现身海鲜市场 - 天天要闻

【芯片】Tensor G5曝光,Pixel10工程机现身海鲜市场

近日谷歌Pixel 10 Pro Fold出现在了GeekBench跑分数据库中:新机搭载了谷歌全新的Tensor G5处理器,据悉这代终于是告别了三星工艺,转而拥抱台积电N3E工艺。从显示信息来看,Tensor G5采用了1+5+2的八核CPU架构,1*3.78GHz X4超大核+5*3.05GHz A725大核+2*2.25GHz A520小核构成。单核
【新机】2K屏+潜望长焦,iQOO 15曝光 - 天天要闻

【新机】2K屏+潜望长焦,iQOO 15曝光

说到iQOO的数字旗舰系列,这代iQOO13相机被刀还是挺可惜的,主要也是为了避免和老大哥X200产生冲突。今天@数码闲聊站曝光了下代iQOO旗舰的信息:新机可能会跳过iQOO 14,直接命名为iQOO 15,这代将会有中杯/大杯两个杯型。新机将会采用6.85英寸2K LIPO三星定制直面屏,屏幕边框极窄,支持Pol-less去偏光技术,还具有AR抗眩...
清华专家破百年陈规!沪上论坛曝电力革新,陈磊构想太敢了 - 天天要闻

清华专家破百年陈规!沪上论坛曝电力革新,陈磊构想太敢了

听说了吗?清华大学的专家居然说要彻底打破电力系统运行了上百年的规矩!就在上海那场新能源论坛上,陈磊研究员抛出个重磅观点 —— 以后用电不用再看频率脸色,有功功率想咋调就咋调!这事儿要是真能成,咱们家里的空调、电动车充电可就再也不会因为电网不
消费活力释放,上海零售商业形态向“文商旅体展”融合演进 - 天天要闻

消费活力释放,上海零售商业形态向“文商旅体展”融合演进

2025年二季度,在上海市政府经济刺激方案推动下,上海商业市场消费活力逐步释放,但零售物业租赁指标的复苏态势仍显平缓。核心商圈平均租金为1877元/平方米/月,平均出租率为94.71%,整体表现与去年同期持平,其中徐家汇、陆家嘴等商圈凭借成熟商业生态,表现相对突出。但与非核心商圈相比,从存量、新增供应、净吸纳量等指...