
柳夜熙視頻截圖。
「我,叫柳夜熙」。
近期,新晉美妝達人柳夜熙出道視頻刷爆網路,視頻特效部分高級感拉滿,虛擬人逼真生動,髮絲紋理、手部動作幾乎與真人無異,虛擬人與現實人的交互也異常順滑。這位會捉妖的美妝達人視頻發布不到30小時,粉絲數一路猛漲至130萬。截至11月23日,首條視頻點贊量達到336.6萬,粉絲數也已經達到536萬。
柳夜熙背後公司創壹科技的創始人謝多盛告訴貝殼財經記者,此次兩分鐘的視頻僅是柳夜熙登場預告,後續故事將會以單集劇情的形式陸續在抖音發布。目前,創壹科技公司服務於柳夜熙背後的大中台團隊有150餘人,小前台團隊人數則在10人以內。
2007年,當「初音未來」用電子合成音第一次唱歌,並被日本秋葉原宅男們稱為「公主殿下」時,不少人以為這只是二次元的狂歡。隨著「洛天依」走進李佳琦直播間帶貨、「柳夜熙」一天吸引百萬粉絲,虛擬人已經不知不覺進入普通大眾生活。
今年,隨著元宇宙概念躥紅,作為其要素之一的虛擬人同樣被推至台前。「2018年,當我們進入這一賽道時,很多人對什麼是虛擬人根本不了解,但到了今年彷彿所有人都明白了,很多投資人也在尋找相關投資標的。」次世文化公司創始人陳燕告訴新京報貝殼財經記者。
貝殼財經記者採訪虛擬人從業者了解到,目前虛擬人分為超寫實虛擬人、虛擬偶像和虛擬人交互產品三大類,並已在不同領域實現商業價值。不過,每秒上千到幾萬的高昂製作成本、實時渲染技術難題以及難以逾越人腦的AI技術也成為虛擬人發展的瓶頸。

正在進行臉部表情捕捉的塞壬。受訪者供圖
●打造
有虛擬偶像吸粉超千萬,「幾分鐘視頻成本數萬元」
手舉偶像海報,一字排開,口中齊聲大喊「生日快樂」……11月2日前後,中科院大學、上海交大以及海外劍橋、紐約大學學生不約而同在B站上傳慶生視頻。粉絲應援陣容強大,至於主人公,並非傳統意義上的真人,而是A-Soul的虛擬偶像「珈樂Carol」。
A-Soul是樂華娛樂2020年11月推出的虛擬偶像團體,起初一度遭到原生虛擬主播粉絲的抵制,但開播不久後,其細膩的建模和「中之人」過硬的業務素質,讓不少反對者「黑轉粉」。
一年時間,A-Soul團隊已經躋身B站頭部虛擬主播,其中成員「嘉然」B站粉絲數達到126萬。A-Soul走紅甚至衍生出「我真的好喜歡你啊」、「可愛捏」、「帶我走吧」等不少亞文化「梗」。
虛擬偶像團體破圈,有著行業爆發的影子。根據B站董事長陳睿公開的數字,2019年B站有超過32000名虛擬主播開播。
但是,扎堆進場試水,並不意味著都能見到成功的曙光。一組公開數據顯示,截至2021年8月18日,B站相對有關注度的3472個虛擬主播中,1827人當月營收0元,也就是說,超過半數沒有一分錢入賬。
「實際上,只要設計出一套3D模型,再購買一套動作捕捉設備,就可以成為初級虛擬偶像。」虛擬偶像產業觀察者劉文(化名)告訴貝殼財經記者,普通虛擬遊戲主播採用的技術系基於面部動作捕捉,換句話說,只要套上一個2D或3D的「皮」,就可以成為一名虛擬主播,並且能像真人主播一樣直播。
不過,劉文稱,動捕設備和3D建模都需要成本,效果越好的設備和模型成本越高,這導致不少虛擬主播入不敷出。
火星文化創始人李浩早在2017年就啟動了虛擬偶像業務,目前旗下虛擬形象「默默醬」在全網粉絲已經超過1800萬。他對貝殼財經記者表示,目前虛擬偶像在製作流程上大同小異,「首先使用建模工具製作3D模型並不斷迭代,再通過動作捕捉技術驅動人物模型的動作,以及找一個『中之人』。」
李浩告訴記者,目前絕大多數虛擬主播採用「中之人」和動捕技術進行直播。「『初音未來』和『洛天依』最初發布時都是採用電子合成音,但從日本第二批虛擬偶像誕生開始,『中之人』開始大量使用,這是因為必須要讓虛擬偶像在說話的時候更像人。目前在技術上,電子合成音說話和真人有相對較高的吻合度,但唱歌時就會產生明顯的技術壁壘,無法有效處理喘息、氣流音等效果,會讓觀眾覺得『不對勁』,而採用動捕技術可以有效地降低製作成本。」
實際上,虛擬偶像直播比真人直播要難上一個數量級。據了解,目前面部動捕與身體動捕屬於不同的技術,所以在極端情況下,當一名虛擬偶像出現在直播間,其面部、身體要由兩個人分別攜帶動捕設備。此外,還需要技術人員將兩塊動捕動畫進行合成,再與「中之人」的語音錄製進行音視頻合成,最終才能呈現出觀眾看到的直播間效果。
去年4月,「洛天依」與李佳琦同框直播的噱頭引發一波關注。直播過程中,一度出現李佳琦能聽到「洛天依」的聲音,觀眾卻聽不見的「翻車事故」。
李浩向記者介紹,虛擬偶像背後往往需要一個團隊來支持,「以『默默醬』為例,內容團隊有十個人,包括導演、劇本、動捕人員、聲優等。而技術方面,根據發布視頻的不同,動畫師還要對『默默醬』的模型進行修改。一條普通的短視頻成本可能在6000元左右,幾分鐘的定製類視頻成本則要數萬元。」
如果說虛擬偶像的技術和動畫團隊可以替代,「中之人」毫無疑問是虛擬偶像的靈魂。樂元素2018年9月推出虛擬偶像企劃《戰鬥吧歌姬!》,運營兩年多後,6位歌姬的「中之人」今年2月「畢業」,並在B站發布了告別視頻。此後,當運營方宣布重新招募「中之人」,不少粉絲在留言中表示:「換『中之人』還是舊皮的話不能接受。」
「我們和『中之人』深度綁定,如果虛擬偶像沒有了『中之人』,起碼要停更一個月,因為即便找到新的聲優訓練聲音,聊天沒問題,但唱歌很容易被看穿。」李浩說。

數字航天員、數字記者「小諍」。受訪者供圖
●瓶頸
柳夜熙燒錢爆紅背後:高昂成本與技術高牆
早在半年前,創壹科技就嗅到了元宇宙的風口,並開始著手打造柳夜熙這一虛擬人IP,從市場定位、人物設定、人物製作、故事情節創作、拍攝執行、後期製作等各個方面都經過了不斷的打磨。柳夜熙的東方面孔、中國風的妝容與捉妖師的身份契合了當下盛行的國潮風尚,同時妝容中熒光元素運用、充滿科幻感的特效與賽博朋克風格的後期色調又迎合了Z時代年輕人的喜好。
對於柳夜熙的走紅,創壹科技創始人謝多盛表示並不意外。團隊復盤時也曾對此展開過討論:柳夜熙的爆紅50%是因為元宇宙的概念熱度,30%是因為其2.5次元的設定和技術水平,20%是視頻創意和世界觀的搭建。目前市面上的虛擬人大多是以虛擬偶像的模式運營為主,可大致分為養成類、人格化類、二次元女團等類型,虛擬人所處時空也多是二次元或者三次元。而創壹科技對於柳夜熙的定位則是2.5次元——二次元是純CG,三次元是現實世界,2.5次元則是遊離於二者之間的存在。
就當前來看,柳夜熙等後續虛擬人IP的變現方式短期內難以實現,僅靠燒錢能否維持其長時間的運轉仍要打上一個問號。但在創壹的戰略布局中,柳夜熙等後續虛擬人的變現方式主要有兩種——傳統IP經濟和元宇宙未來的商業可能。
貝殼財經記者注意到,目前進行直播的虛擬偶像大多以二次元畫風為主,而「柳夜熙」、「翎」等與真人觀感類似的虛擬偶像,更大程度上被稱為「超寫實虛擬人」,這類虛擬人往往並不直播,而是出現在微博、抖音、小紅書等社交平台,像網紅一樣通過自己的照片和視頻吸引粉絲,接商業代言。
「我們不做傳統的二次元,也不碰虛擬主播的領域。」「翎」的製作方、次世文化公司創始人陳燕告訴貝殼財經記者,「我們推出的虛擬人主要應用在泛娛樂領域、品牌領域,粉絲也大多是比較關注時尚生活的群體,如果說二次元虛擬偶像的粉絲可以類比B站粉絲,那麼超寫實虛擬人的粉絲與小紅書的粉絲構成更相似。」
貝殼財經記者梳理看到,以「翎」這種中國風超寫實虛擬人為例,所接商業廣告大多與時尚明星近似,包括奢侈品和美妝品牌等。
相比二次元虛擬偶像,超寫實虛擬人的視頻製作成本也上了一個台階。「柳夜熙」團隊接受貝殼財經記者採訪時表示,推出「柳夜熙」之前的半年多時間,研發成本、人員成本、技術成本等投入「遠超百萬」。
陳燕向貝殼財經記者透露,為了覆蓋成本,公司內部做了非常嚴格的產品規劃,在下場每一個產品之前,會做五六個步驟的內部評估,包含每一個IP在什麼場景使用它,企圖打造的一個IP是什麼級別。「以『翎』為例,我們會細化到將視頻拆解成15秒、1分到2分鐘,一個季度策劃一次大事件等,否則如果周更或者日更的話,根本就無法覆蓋成本。」
事實上,國內較早亮相的寫實類虛擬人可以追溯至2018年5月,NExT Studios與Epic聯合推出的高保真數字虛擬人塞壬(Siren)。該項目研發過程中,可以看到虛擬人行業技術昂貴的一面。
騰訊互娛工程師David 曾在《虛擬數字人Siren的誕生》一文中用「艱難」一詞來形容塞壬項目,「電影畫面一幀動輒幾小時的渲染時間,相比於電影行業,我們所有的計算都必須在當時發生。虛擬人的程序以60幀每秒運行,所有的計算都必須在16毫秒的時間段內做完。」最終,來自四個國家的頂級團隊克服軟硬體等各方面帶來的技術瓶頸後,完成了這一項目。
目前大部分超寫實虛擬人項目仍然難以做到實時直播。「現在市面上能做到實時的(虛擬人)基本上都是風格化的角色,寫實風格的通常都是用離線CG流程做的視頻,有的只是拿虛幻引擎作為渲染器用,我們一直堅守在實時+寫實這條線上,因為我們的目標就是將寫實數字人做到實時,落地在實時交互的場景。」NExT Studios新技術研發中心副總監葛誠說。
隨著技術迭代,超寫實虛擬人的應用場景將越來越廣泛。6月20日,新華社和騰訊聯合推出數字航天員、數字記者「小諍」,這名超寫實虛擬人將承擔起普通記者難以實現的載人航天工程、行星探測工程「現場報道」任務。葛誠告訴貝殼財經記者,NExT數字人團隊一直維持在20個人以內。
●變革
虛擬人+AI會成為元宇宙「引路人」嗎?
隨著技術發展,超寫實虛擬人、虛擬偶像甚至智能交互產品的界限已經逐漸模糊,未來虛擬人領域能否實現技術上的「統一」,帶給市場很大想像空間。
騰訊互娛方面表示,在疫情這類「黑天鵝」事件下,人和人之間被隔離開,會越發地需要進行互動、連接,虛擬人和虛擬世界就不只是作為娛樂的場景,需要考慮人類之間的社會性、依賴性,數字人能夠發揮更大的社會價值。「小諍」除了數字航天員和數字記者身份外,未來也將會進行更多面向用戶、年輕人的互動。「小諍」被越來越多朋友所認識、喜愛後,也可以成為代表主流價值觀的當代年輕人「虛擬偶像」之一。
「實際上,相比虛擬人漂亮的外表,能夠跟用戶產生持續的交流更重要。」陳燕說,他的願景是在守好已有業務線的情況下,追求與用戶交互以及虛擬IP的智能化和場景化,發展為一家「虛擬人生態」公司。
「目前,次世文化正在跟『小冰』等頂尖AI公司合作,力圖拓展更多智能化的虛擬產品,也就是說虛擬人既是IP,但也會加入很多AI智能功能,來滿足各種細分場景的需求。」他說。
人物建模、實時渲染和語音識別、動作識別等技術發展,讓不少從業者看到了虛擬人未來的應用前景。2021世界人工智慧大會開幕式上,接連出現四個虛擬人與真人主持同台出場——B站虛擬偶像「泠鳶」,百度的「小度」,小米的「小愛同學」和微軟的「小冰」。其中,後三位虛擬人均已有自己的應用場景,比如用戶可以通過喊「小愛同學」在小愛音箱上實現點歌。
貝殼財經記者看到,當前不少虛擬人產品已經在市面上進行推廣,如科大訊飛、相芯科技等公司相繼推出TO B的虛擬人產品。
有虛擬人產品銷售業務人員告訴貝殼財經記者,使用其提供的成品虛擬新聞主播,費用一年為100萬元左右,虛擬主播可以根據輸入的文字內容自動生成適配的語音和表情,從而把文字報道轉換為視頻播報。「如果定製自己形象的虛擬主播則需要幾百萬,因為我們需要對你們提供的模特進行動捕和演算法分析。」
「很多人看虛擬人,只看到了表象的東西,但我一直覺得虛擬人只是一個載體,最終推動虛擬人發展的是人的需求。現實世界中,當一個人身體存在缺陷,通過構建自身的虛擬形象,可以在虛擬世界裡重新選擇(自身形象)。通過AI技術,一個虛擬人IP也應該跟人類建立起更穩固的關係。」陳燕說。
京東集團副總裁梅濤接受貝殼財經記者採訪時稱,虛擬數字人的AI技術可能會在未來產生顛覆性效果。「以京東自己的數字人為例,既有2D和3D卡通數字人,也有真人數字人。數字人涉及的技術非常廣,既包括視覺和語音識別,還有語音合成和對話、圖形學。未來我們希望數字人能夠真正完成一些任務,比如跟小孩聊天、陪伴老人、市民熱線、智能客服等,為此我們基於京東電商場景中智能客服的豐富實踐,來打造富有自己特色的數字人,希望未來一到兩年形成比較成熟的標準化服務。大家也可以看到,現在也有很多初創公司在做數字人,經過幾年發展,可以說數字人技術和產品快要到一個爆發期。」
據了解,2018年SIGGRAPH Asia展台上,「塞壬」曾經展示過以AI驅動的樣片,但當時AI只能做一輪對話。
「現在AI已經可以實現多輪對話了,更加智能,AI驅動數字人,未來可期。虛實融合是未來大趨勢,數字人逐漸能和真實世界發生情感上的共鳴,就可以作為社會的一分子存在,想想我們小時候看的變形金剛、聖鬥士、機器貓、葫蘆娃都是虛擬角色,也成為了影響我們那一代人的IP。隨著數字人蓬勃發展,可以預見未來會有更多和這個真實社會產生紐帶的虛擬角色。『中之人』是目前數字人逃脫不開的話題,但是相信未來,AI在某些特定領域能更好地驅動數字人。」葛誠表示。
「虛擬偶像能直播,必須要有『中之人』。超寫實虛擬人像人,不能直播『沒有靈魂』。手機里的智能語音可以交互,但交互水平還太低。」劉文對貝殼財經記者表示,如果把虛擬偶像、超寫實虛擬人和市場上已有的虛擬助手融合在一起,這可能就是虛擬人通向元宇宙的未來。
新京報貝殼財經記者 羅亦丹 李夢涵 編輯 王進雨 校對 賈寧