你剛要笑,它就猜到了然後和你一起笑......這樣的「好機友」你想擁有嗎?

撰文 | cloud

審校 | 河邊的卡西莫多

機械人越來越像人了,但和人互動時,它如果不明所以地咧開嘴笑了……這大概並不會傳達出開心之情,而是讓人感到恐懼。

不過現在,一款名叫emo的機械人就不會這麼瘮人。它可以分析人類的面部表情,並在人類做出表情前的0.839秒就預測出人類即將做出的表情,於是它可以和人類幾乎同時一起微笑,從而避免尷尬或讓人害怕。

機械人emo會預測人類的微笑,並一起笑|參考資料[1]

目前,大多數機械人只會在人類做完表情後再做出反應。這種滯後會讓機械人顯得不真實、不真誠。對人而言,在面對面的溝通過程中,微笑之類的非語言交流非常重要。「我認為準確預測人類面部表情是人機交互(human-robot interaction)領域的一場革命,」該研究的主要作者、美國哥倫比亞大學創意機器實驗室(creative machines lab)的博士生胡宇航說道。

在2021年,他和研究團隊還開發了一個名叫eva的機械人,這是首批能夠自我模仿人類面部表情的機械人之一。從eva到emo,我們可以看到機械人在模仿人類面部表情方面實現了顯著的進步。

機械人emo實時預測、模仿研究者的面部表情。這是一個有聲音的視頻|參考資料[1]

事實上,要實現這一點很困難,這首先需要研究人員打造出一張能夠實現逼真的面部肌肉運動的機械人臉,其次還要讓機械人通過人工智能學習人類表情的細微差別,並迅速做出準確的反應。

如何造頭?

與機械人eva相比,emo具有顯著的硬件改進。eva臉部只有10個執行器,而emo有26個獨立的執行器——這些組件可以更精密地控制機械人臉部的運動,而且也提供了更大的自由度,可以實現不對稱的面部表情。

沒有皮膚時的樣子|columbia engineering

機械人emo的每隻眼睛都配備了具有高分辨率的rgb相機,可以實現人形視覺感知,並追蹤和自己對話的人類的眼睛,進行眼神交流。rgb相機基於人眼對顏色感知的方式,能夠分別記錄紅、綠、藍三種基本顏色的信息,並將其組合生成彩色圖像,從而呈現出真實的視覺信息。其生成的圖像可用來做目標識別、顏色分割等各種數據處理和分析。

眼睛可以追蹤人類移動,然後和人進行眼神互動|columbia engineering

而機械人的整個面部皮膚由柔軟的硅膠製成,並使用30塊磁鐵連接到硬件上。磁鐵連接的設計使得機械人可以輕鬆換皮膚,從而獲得不同的外觀,並能讓人得以更好地維護它的「臉皮」。

emo的臉可以換皮膚。|columbia engineering

當被問及機械人的臉為什麼是藍色時,研究團隊的負責人、哥倫比亞大學機械工程教授霍德·利普森(hod lipson)表示,他們想離開或者走出所謂的「恐怖谷」。

恐怖谷(uncanny valley)理論,即人形機械人的外貌逼真度越高,人們對它的親近感就越強。然而,當一個逼真度很高的人形卻仍存在微小的不自然之處時,人們則會對其感到反感,甚至恐懼。而超過這個「谷底」後,隨着機械人外貌完全擬人了之後,它會再次贏得人們的好感。 

所以,研究團隊就想:「好吧,讓我們把它們變成藍色,我們甚至不想讓它們看着像個人。」事實上,研究人員製作了好幾塊不同顏色的臉皮——除了藍色,機械人的臉皮顏色還有綠色、紫色等等。

圖片來源:參考資料[1]

「照鏡子」自我學習

除了複雜縝密的硬件和驅動裝置,研究人員還為機械人開發了兩個獨立的人工智能模型。一個模型可以分析人類微小的面部表情線索,然後預測人即將做出的表情。另一個模型則負責計算如何讓機械人的臉部快速做出相應的表情。

第一個模型是通過網絡視頻上的人臉表情視頻進行訓練。通過逐幀觀察,經過幾個小時的訓練後,機械人就可以觀察出人們準備做某個表情之前的微小面部變化,從而預測人的表情。

第二個模型的訓練過程則是讓機械人自己「照鏡子」。確切地說,機械人是面對着一部rbg攝像機,實時觀測自己的表情。研究人員通過rgb相機來捕捉機械人面部的細微變化,並提取面部標誌,通過面部特徵和運動命令的數據集來訓練模型。

機械人自己學習面部表情和運動命令之間關係。|參考資料[1]

說白了,這就像人類通過照鏡子來練習面部表情。「它知道當它拉伸所有這些肌肉時,它的臉會是什麼樣子。」利普森說道。這個在沒有人類監督的情況下,機械人自己學習面部表情和運動命令之間關係的訓練過程,被研究人員稱作「自我建模」(self modeling)。

學習框架|參考資料[1]

在實驗中,為了避免機械人頭出現碰撞或柔軟的面部皮膚被撕裂,機械人的運動動作受到了限制。

機器將更加像人

雖然機械人在掌握非語言交流方面還有很長的路要走,但現在這個微笑算是向前邁出了一步。「我認為這是一個重要的一步。」 利普森說道。

「我是一個厭倦了的機械人專家,我不會對機器微笑,但當這個機械人對我微笑時,我會對它回以微笑。」在同步微笑之後,

研究團隊之後還打算拓寬機械人的表情範圍,並進一步研究口型同步。現在,機械人emo只會分析人類的面部表情,還無法通過分析語言文本與人類對話。研究人員希望後續能把機械人與chatgpt等大型語言模型相結合,實現更加自然的人機互動。

圖片來源:columbia engineering

雖然這有望帶來大量積極的應用,但其潛在的倫理問題也讓一些人感到擔心。「我們真的不想讓它看起來像人類。但是,如果你給它戴上假髮,塗上口紅,加上各種各樣的東西,它就真的開始像人了。」利普森補充道。

「我認為這是不可避免的,最終這些機械人都將越來越像人類,而我們將不得不……無論我們是否喜歡,我們都得開始和它們建立聯繫。」

圖片來源:columbia engineering

參考文獻

[1] hu, y., chen, b., lin, j., wang, y., wang, y., mehlman, c., & lipson, h. (2024). human-robot facial coexpression. sci. rob., 9(88). retrieved from https://www.science.org/doi/10.1126/scirobotics.adi4724

[2] wilkins, a. (2024). this robot predicts when you're going to smile – and smiles back. new sci. retrieved from https://www.newscientist.com/article/2424545-this-robot-predicts-when-youre-going-to-smile-and-smiles-back[3] saha, p. (2021). watch these rare ocean creatures caught on candid robot camera. popular science. retrieved from https://www.popsci.com/animals/deep-sea-life-videos[4] teaching robots to smile, and the effects of a rare mandolin on a scientist』s career. (2024, april 09). retrieved from https://www.science.org/content/podcast/teaching-robots-smile-and-effects-rare-mandolin-scientist-s-career[5] networks, t. (2024). meet emo: the friendly robotic face that uses ai to anticipate a person』s smile. informatics from technology networks. retrieved from https://www.technologynetworks.com/informatics/news/meet-emo-the-friendly-robotic-face-that-uses-ai-to-anticipate-a-persons-smile-385270