AI终于能生成流畅3D动作片了,不同动作衔接无bug,准确识别指令

2022年10月06日13:56:21 资讯 1000

萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

让3D动画小人做一套丝滑的动作,需要手动渲染多久?

AI终于能生成流畅3D动作片了,不同动作衔接无bug,准确识别指令 - 天天要闻

现在交给AI,输入几句话就能搞定不同代表不同动作)

看向地面并抓住高尔夫球杆,挥动球杆,小跑一段,蹲下。

AI终于能生成流畅3D动作片了,不同动作衔接无bug,准确识别指令 - 天天要闻

此前,AI控制的3D人体模型基本只能“每次做一个动作”或“每次完成一条指令”,难以连续完成指令。

AI终于能生成流畅3D动作片了,不同动作衔接无bug,准确识别指令 - 天天要闻

现在,无需剪辑或编辑,只需按顺序输入几条命令,3D人物就能自动完成每一套动作,全程丝滑无bug。

这只新AI的名字叫TEACH,来自马普所和古斯塔夫·艾菲尔大学。

AI终于能生成流畅3D动作片了,不同动作衔接无bug,准确识别指令 - 天天要闻

网友们脑洞大开:

这样以后拍3D动画电影,是不是只用剧本就能搞定了?

AI终于能生成流畅3D动作片了,不同动作衔接无bug,准确识别指令 - 天天要闻

显然,游戏和仿真行业可以考虑一下了。

AI终于能生成流畅3D动作片了,不同动作衔接无bug,准确识别指令 - 天天要闻

那么,这样的3D人物动作神器是怎么来的呢?

用编码器“记住”前一个动作

TEACH的架构,基于团队不久前提出的另一个3D人体运动生成框架TEMOS

TEMOS基于Transformer架构设计,利用人体真实运动数据进行训练。

它在训练时会采用两个编码器,分别是动作编码器(Motion Encoder)和文本编码器(Text Encoder),同时通过动作解码器(Motion Decoder)输出。

但在使用时,原本的动作编码器就会被“扔掉”、只保留文本编码器,这样模型直接输入文本后,就能输出对应的动作。

AI终于能生成流畅3D动作片了,不同动作衔接无bug,准确识别指令 - 天天要闻

与其他输入单一文本、输出确定性动作的AI不同,TEMOS能通过单一文本,生成多种不同的人体运动

例如“人绕圈”和“站着走几步路停下来”这种单一指令,就能生成好几种不同的运动方式:

AI终于能生成流畅3D动作片了,不同动作衔接无bug,准确识别指令 - 天天要闻

△转圈方式、走路步幅都不一样

TEACH的架构正是基于TEMOS设计,动作编码器直接就从TEMOS那儿搬了过来。

但TEACH重新设计了文本编码器,其中包括一个名叫Past Encoder的编码器,它会在生成每一个动作时,提供前一个动作的上下文,以增加动作与动作之间的连贯性。

AI终于能生成流畅3D动作片了,不同动作衔接无bug,准确识别指令 - 天天要闻

如果是一系列指令中的第一个动作,就禁用Past Encoder,毕竟没有前一个动作可以学了。

TEACH在BABEL数据集上进行训练,这是一个时长43小时的动捕数据集,包含过渡动作、整体抽象动作、以及每一帧的具体动作。

AI终于能生成流畅3D动作片了,不同动作衔接无bug,准确识别指令 - 天天要闻

在训练时,BABEL的这一系列动捕数据会被切分成很多个子集,每个子集中包含一些过渡动作,让TEACH能学会过渡并输出。

至于为什么不用另一个数据集KIT进行训练,作者们也给出了自己的看法。

例如在动词类型上,BABEL出现要比KIT更具体,相比之下KIT更喜欢用do/perform这种“模糊的”词汇。

AI终于能生成流畅3D动作片了,不同动作衔接无bug,准确识别指令 - 天天要闻

研究人员将TEACH与TEMOS就连续动作生成效果进行了对比。

比TEMOS效果更好

先来看看TEACH生成一系列动作的效果,连续不重样:

AI终于能生成流畅3D动作片了,不同动作衔接无bug,准确识别指令 - 天天要闻

随后,研究人员将TEMOS与TEACH进行了对比。

他们使用两种方法对TEMOS模型进行了训练,并分别将它们称之为Independent和Joint,区别在于训练用的数据上。

其中,Independent直接用单个动作训练,在生成时将前后两个动作用对齐、球面线性插值等方式融合在一起;Joint直接用动作对和分隔开的语言标签作为输入。

Slerp是一种线性插值运算,主要用于在两个表示旋转的四元数之间平滑插值,让变换过程看起来更流畅。

AI终于能生成流畅3D动作片了,不同动作衔接无bug,准确识别指令 - 天天要闻

以生成“挥挥右手,举起左手”连续两个动作为例。

Independent的表现效果最差,人物当场坐下了;Joint效果好一点,但人物并没有举起左手;效果最好的是TEACH,在挥动右手后又举起了左手,最后才放下。

AI终于能生成流畅3D动作片了,不同动作衔接无bug,准确识别指令 - 天天要闻

在BABEL数据集上测试表明,TEACH的生成误差是最低的,除此之外Independent和Joint的表现都不太好。

AI终于能生成流畅3D动作片了,不同动作衔接无bug,准确识别指令 - 天天要闻

研究人员还测了测使用上一个动作的最佳帧数,发现当使用前一个动作的5帧时,生成的过渡动作效果最好。

AI终于能生成流畅3D动作片了,不同动作衔接无bug,准确识别指令 - 天天要闻

作者介绍

AI终于能生成流畅3D动作片了,不同动作衔接无bug,准确识别指令 - 天天要闻

Nikos Athanasiou,马普所在读研究生,研究方向是多模态AI,喜欢探索人类行动和语言背后的关系。

AI终于能生成流畅3D动作片了,不同动作衔接无bug,准确识别指令 - 天天要闻

Mathis Petrovich,在古斯塔夫·艾菲尔大学(Université Gustave Eiffel)读博,同时也在马普所工作,研究方向是基于标签或文字说明产生真实的、多样化人体运动。

AI终于能生成流畅3D动作片了,不同动作衔接无bug,准确识别指令 - 天天要闻

Michael J. Black,马克思·普朗克智能系统研究所主任,如今谷歌学术上论文引用次数达到62000+次。

AI终于能生成流畅3D动作片了,不同动作衔接无bug,准确识别指令 - 天天要闻

Gul Varol,古斯塔夫·艾菲尔大学助理教授,研究方向是计算机视觉、视频特征学习、人体运动分析等。

目前TEACH已经开源,感兴趣的小伙伴们可以戳下方地址体验了~

GitHub地址:
https://github.com/athn-nik/teach

论文地址:
https://arxiv.org/abs/2209.04066

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

资讯分类资讯推荐

范玮琪力挺陈建州,第三位受害人站出来,好姐妹makiyo也补刀 - 天天要闻

范玮琪力挺陈建州,第三位受害人站出来,好姐妹makiyo也补刀

#陈建州风波牵连多位明星#近期,台湾省艺人陈建州性骚扰事件越演越烈,已经有三位女艺人大牙、郭源元和黑涩会美眉妖娇出来指控陈建州对她们的性骚扰行为。陈建州妻子范玮琪则发文力挺老公。范玮琪发文表示自己孕期一直在家,外出黑人一直陪同,黑人不可能存在带女性回家的可能。
一战华工的珍贵照片 - 天天要闻

一战华工的珍贵照片

赴欧劳工上船前消毒洗澡,发放印有编号的外衣、裤子、腰带及内衣、草帽及鞋袜等,还统一配置毛毯、铺盖、水杯和铁饭碗的工具包,并在离国前集中在威海等地稍作军训。
阳后还有这个后遗症,向风而行征文 - 天天要闻

阳后还有这个后遗症,向风而行征文

#头条创作挑战赛第二期#​#暖冬的生活记#​#电视剧向风而来行征文#​最近我右侧的眼睛好难受,每天睡醒就然糊糊的,一天感觉看东西不太清楚,视力下降很明显,头也晕晕的,闷闷的,不是很舒服。我不知道其他人阳后有没有这个症状。
北大高材生感叹道:“这辈子我就没说过几次真话!” - 天天要闻

北大高材生感叹道:“这辈子我就没说过几次真话!”

我有一个姓于的朋友,大家都管他叫老于。老于今年五七多岁,北大毕业,清华读的硕士,北师大读的博士,妥妥的学霸。他现在是一家厅级单位的副总工,待遇也不错。在我们这些人眼里,那可是人中龙凤,几乎是神一样的存在。有一次几个朋友一起喝酒,喝多以后,大家照例吹捧这位学霸朋友。
画家把字画作价3万放老板店里寄卖,老板索要2成佣金,被画家拒绝 - 天天要闻

画家把字画作价3万放老板店里寄卖,老板索要2成佣金,被画家拒绝

街上有那种卖字画的店铺,这种店铺非常的少,因为懂画的人也少。店铺的老板是个爱画之人,不是名家的画,只要是画的好,价格合适,他也会收下,或者帮忙寄卖。王立是一名没有任何名气的画家,经常会拿一些画到店里寄卖,几百到几千的价格都有。这一天,王立又拿来一幅画,说是要寄卖。
04年辽宁老汉捡石头修猪圈,发现"白发人头",专家赶来:终于找到了 - 天天要闻

04年辽宁老汉捡石头修猪圈,发现"白发人头",专家赶来:终于找到了

二〇二二年,很多很有名的节目被网友们重新翻出来,比如《今日说法》,网友们甚至还列出了必看节目单。说到必看的“电子榨菜”,网友们纷纷调侃起了一档节目,它十分喜欢以农村口耳相传的惊悚故事为开头,经过不断的探索,最终以科学的手段解释灵异现象,它就是《走近科学》。
运河拾韵:爱的波涛(十三) || 朱钧贤 - 天天要闻

运河拾韵:爱的波涛(十三) || 朱钧贤

作者:朱钧贤 摄影:竹叶青“老板,还有什么吩咐?”雪娟和素英同时止步,愕然的转过身来。徐文琪将手中的钢笔在桌子上敲了敲,注视了她们一眼,道:“还有几个问题要对你讲一讲,我们饭店是食品服务性质的,首先必须要求清洁和卫生,还有的是要注意服务态度必须热情周到,使客人满意。