AI終於能生成流暢3D動作片了，不同動作銜接無bug，準確識別指令

2022年10月06日13:56:21 資訊 1000

蕭簫發自凹非寺
量子位 | 公眾號 QbitAI

讓3D動畫小人做一套絲滑的動作，需要手動渲染多久？

現在交給AI，輸入幾句話就能搞定（不同顏色代表不同動作）：

看向地面並抓住高爾夫球杆，揮動球杆，小跑一段，蹲下。

此前，AI控制的3D人體模型基本只能「每次做一個動作」或「每次完成一條指令」，難以連續完成指令。

現在，無需剪輯或編輯，只需按順序輸入幾條命令，3D人物就能自動完成每一套動作，全程絲滑無bug。

這隻新AI的名字叫TEACH，來自馬普所和古斯塔夫·艾菲爾大學。

網友們腦洞大開：

這樣以後拍3D動畫電影，是不是只用劇本就能搞定了？

顯然，遊戲和模擬行業可以考慮一下了。

那麼，這樣的3D人物動作神器是怎麼來的呢？

用編碼器「記住」前一個動作

TEACH的架構，基於團隊不久前提出的另一個3D人體運動生成框架TEMOS。

TEMOS基於Transformer架構設計，利用人體真實運動數據進行訓練。

它在訓練時會採用兩個編碼器，分別是動作編碼器（Motion Encoder）和文本編碼器（Text Encoder），同時通過動作解碼器（Motion Decoder）輸出。

但在使用時，原本的動作編碼器就會被「扔掉」、只保留文本編碼器，這樣模型直接輸入文本後，就能輸出對應的動作。

與其他輸入單一文本、輸出確定性動作的AI不同，TEMOS能通過單一文本，生成多種不同的人體運動。

例如「人繞圈」和「站著走幾步路停下來」這種單一指令，就能生成好幾種不同的運動方式：

△轉圈方式、走路步幅都不一樣

TEACH的架構正是基於TEMOS設計，動作編碼器直接就從TEMOS那兒搬了過來。

但TEACH重新設計了文本編碼器，其中包括一個名叫Past Encoder的編碼器，它會在生成每一個動作時，提供前一個動作的上下文，以增加動作與動作之間的連貫性。

如果是一系列指令中的第一個動作，就禁用Past Encoder，畢竟沒有前一個動作可以學了。

TEACH在BABEL數據集上進行訓練，這是一個時長43小時的動捕數據集，包含過渡動作、整體抽象動作、以及每一幀的具體動作。

在訓練時，BABEL的這一系列動捕數據會被切分成很多個子集，每個子集中包含一些過渡動作，讓TEACH能學會過渡並輸出。

至於為什麼不用另一個數據集KIT進行訓練，作者們也給出了自己的看法。

例如在動詞類型上，BABEL出現要比KIT更具體，相比之下KIT更喜歡用do/perform這種「模糊的」辭彙。

研究人員將TEACH與TEMOS就連續動作生成效果進行了對比。

比TEMOS效果更好

先來看看TEACH生成一系列動作的效果，連續不重樣：

隨後，研究人員將TEMOS與TEACH進行了對比。

他們使用兩種方法對TEMOS模型進行了訓練，並分別將它們稱之為Independent和Joint，區別在於訓練用的數據上。

其中，Independent直接用單個動作訓練，在生成時將前後兩個動作用對齊、球麵線性插值等方式融合在一起；Joint直接用動作對和分隔開的語言標籤作為輸入。

Slerp是一種線性插值運算，主要用於在兩個表示旋轉的四元數之間平滑插值，讓變換過程看起來更流暢。

以生成「揮揮右手，舉起左手」連續兩個動作為例。

Independent的表現效果最差，人物當場坐下了；Joint效果好一點，但人物並沒有舉起左手；效果最好的是TEACH，在揮動右手後又舉起了左手，最後才放下。

在BABEL數據集上測試表明，TEACH的生成誤差是最低的，除此之外Independent和Joint的表現都不太好。

研究人員還測了測使用上一個動作的最佳幀數，發現當使用前一個動作的5幀時，生成的過渡動作效果最好。

作者介紹

Nikos Athanasiou，馬普所在讀研究生，研究方向是多模態AI，喜歡探索人類行動和語言背後的關係。

Mathis Petrovich，在古斯塔夫·艾菲爾大學（Université Gustave Eiffel）讀博，同時也在馬普所工作，研究方向是基於標籤或文字說明產生真實的、多樣化人體運動。

Michael J. Black，馬克思·普朗克智能系統研究所主任，如今谷歌學術上論文引用次數達到62000+次。

Gul Varol，古斯塔夫·艾菲爾大學助理教授，研究方向是計算機視覺、視頻特徵學習、人體運動分析等。

目前TEACH已經開源，感興趣的小夥伴們可以戳下方地址體驗了~

GitHub地址：
https://github.com/athn-nik/teach

論文地址：
https://arxiv.org/abs/2209.04066

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們，第一時間獲知前沿科技動態

資訊

范瑋琪力挺陳建州，第三位受害人站出來，好姐妹makiyo也補刀

#陳建州風波牽連多位明星#近期，台灣省藝人陳建州性騷擾事件越演越烈，已經有三位女藝人大牙、郭源元和黑澀會美眉妖嬌出來指控陳建州對她們的性騷擾行為。陳建州妻子范瑋琪則發文力挺老公。范瑋琪發文表示自己孕期一直在家，外出黑人一直陪同，黑人不可能存在帶女性回家的可能。

06月29日

德媒公布一組驚人的數據，看後才知道中國新能源汽車竟然這麼猛

要不是《德國經濟周刊》親自報道，在歐洲，尤其是德國這樣的汽車強國，誰會相信中國新能源汽車竟然這麼厲害？看過這組驚人的數據後，德媒總算說了一次大實話，作為中國人，應當為我們的新能源汽車產業實現換道超車取得的成績點贊！

06月27日

PUA（情緒勒索）到底有多可怕？我是如何擺脫PUA，又不受傷害的？

你有沒有感覺到自己被公司的領導給控制了?大家好，我是賀翔，今天咱們來系統性的聊聊PUA，我會告訴你三件事兒:如何判斷自己正在遭受 PUA?

06月23日

一戰華工的珍貴照片

赴歐勞工上船前消毒洗澡，發放印有編號的外衣、褲子、腰帶及內衣、草帽及鞋襪等，還統一配置毛毯、鋪蓋、水杯和鐵飯碗的工具包，並在離國前集中在威海等地稍作軍訓。

01月03日 1546

陽後還有這個後遺症，向風而行徵文

#頭條創作挑戰賽第二期##暖冬的生活記##電視劇向風而來行徵文#最近我右側的眼睛好難受，每天睡醒就然糊糊的，一天感覺看東西不太清楚，視力下降很明顯，頭也暈暈的，悶悶的，不是很舒服。我不知道其他人陽後有沒有這個癥狀。

01月03日 1663

北大高材生感嘆道：「這輩子我就沒說過幾次真話！」

我有一個姓於的朋友，大家都管他叫老於。老於今年五七多歲，北大畢業，清華讀的碩士，北師大讀的博士，妥妥的學霸。他現在是一家廳級單位的副總工，待遇也不錯。在我們這些人眼裡，那可是人中龍鳳，幾乎是神一樣的存在。有一次幾個朋友一起喝酒，喝多以後，大家照例吹捧這位學霸朋友。

01月03日 1976

張文宏最新發聲，一個好消息和兩個壞消息，疫情或許迎來轉機了！

自從12月7日疫情放開以來，全民核酸取消了，行程碼下線了，跨區也不再隔離了，一切都在朝著正常生活恢復。

01月03日 1376

畫家把字畫作價3萬放老闆店裡寄賣，老闆索要2成傭金，被畫家拒絕

街上有那種賣字畫的店鋪，這種店鋪非常的少，因為懂畫的人也少。店鋪的老闆是個愛畫之人，不是名家的畫，只要是畫的好，價格合適，他也會收下，或者幫忙寄賣。王立是一名沒有任何名氣的畫家，經常會拿一些畫到店裡寄賣，幾百到幾千的價格都有。這一天，王立又拿來一幅畫，說是要寄賣。

01月03日 1853

04年遼寧老漢撿石頭修豬圈,發現"白髮人頭",專家趕來:終於找到了

二〇二二年，很多很有名的節目被網友們重新翻出來，比如《今日說法》，網友們甚至還列出了必看節目單。說到必看的「電子榨菜」，網友們紛紛調侃起了一檔節目，它十分喜歡以農村口耳相傳的驚悚故事為開頭，經過不斷的探索，最終以科學的手段解釋靈異現象，它就是《走近科學》。

01月03日 1294

運河拾韻：愛的波濤（十三） || 朱鈞賢

作者：朱鈞賢攝影：竹葉青「老闆，還有什麼吩咐？」雪娟和素英同時止步，愕然的轉過身來。徐文琪將手中的鋼筆在桌子上敲了敲，注視了她們一眼，道：「還有幾個問題要對你講一講，我們飯店是食品服務性質的，首先必須要求清潔和衛生，還有的是要注意服務態度必須熱情周到，使客人滿意。

01月03日 1668

用編碼器「記住」前一個動作

比TEMOS效果更好

作者介紹

資訊分類資訊推薦

資訊分類視頻推薦

彙集主播賣貨帶貨翻車名場面搞笑,場面極度爆笑尷尬,生產廠家早已哭暈了...

盤點全網主播帶貨賣貨翻車名場面,笑出八塊腹肌,商家已經哭暈在廁所,好笑又好氣...

女人為什麼喜歡給男人用嘴，3位女士的真實感受...

人氣吃播大翻車!?千萬網紅挖空公司，設備全偷走，結局反轉秒打臉...

盤點全網主播帶貨賣貨翻車名場面,笑出八塊腹肌,商家已經哭暈在廁所,好笑又好氣...

盤點主播們的美顏翻車現場，美顏意外掉落，簡直災難現場...

那些主播帶貨翻車現場，場面極度尷尬，商家已經哭暈在廁所...

首次直播賣票「還在講解」20萬張就售完！ 劉德華傻眼：什麼意思？我覺得很假喔ＸＤ...

陳凱歌這一推，讓章子怡尊嚴碎一地，內娛拜高踩低體現的淋漓盡致...

【大陸】心都要化了！河南一萌娃打針模樣可愛得像幅油畫...

首次直播賣票「還在講解」20萬張就售完！　劉德華傻眼：什麼意思？我覺得很假喔ＸＤ...