GVoice AI Codec語音技術正式上線和平精英,語音開黑爽度倍增

不知道你有沒有經歷過這樣的情況:你正在和隊友愉快「開黑」,率領著隊友大殺四方時,突然語音斷了,原本大好的局勢一下子因為溝通不暢而陷入危局,簡直令人崩潰!

隨著移動端遊戲日益火爆,遊戲的社交性變成玩家的剛需,語音系統成為衡量遊戲品質的重中之重,遊戲廠商們也更加重視遊戲內語音系統的開發。

最近,騰訊遊戲發布了最新的語音技術方案,騰訊光子S工作室《和平精英》團隊與騰訊AI Lab、騰訊遊戲CROS GVoice(騰訊遊戲語音)等專業團隊,不斷深挖語音編解碼器的升級技術,將AI Codec技術應用於《和平精英》遊戲中,實現了AI Codec 更低碼率更高質量的語音編碼,在行業內遙遙領先,成為首個將AI Codec技術全面應用於遊戲語音領域的產品。

網速差,語音「開黑」不暢成痛點

艾媒諮詢曾有數據統計表明,40%的玩家因社交因素而中意一款遊戲;15.6%的玩家選擇退游則是因為遊戲社交性不足。由此可見,如何提高遊戲的社交性是各大遊戲廠商必須面臨的首要難題。

遊戲內的有效交流可以增加玩家的互動體驗感,但隨著手游的發展,玩家們對遊戲語音的質量、延遲時間、使用環境等要求也愈發苛刻。

實際上,遊戲實時語音一直是個老生常談的話題,它不單單是實現實時通話那麼簡單。評判語音的好壞,語音的聽感質量是重中之重,這個前提使得:傳輸碼率越低,玩家流量消耗就越少;佔用算力越少,CPU處理就越快。

直至今天,遊戲語音傳輸技術在兩方面尋找突破點。

最先要攻克的難題就是——在網速不暢的情況下,如何保證語音交流的穩定性?在不降低聽感質量的前提下,語音信息碼率越低,傳輸的連貫性則更穩定,通俗的說,低碼率在弱網中更具優勢。

算力的損耗則是第二個難關。大型遊戲普遍對CPU要求較高,因此,在不改變玩家交流體驗的同時讓語音功能最大限度的少佔用CPU,不至於對操作和資源計算產生擠壓,也變得尤為重要。

人工智慧——遊戲語音的「BUFF」加成

當語音開黑、遊戲社交逐漸變成玩家的普遍需求時,各國科技企業也紛紛投入這一領域。

傳統的音頻解碼技術Codec在保證語音質量的前提下專註於降低網路帶寬資源和傳輸碼率來確保語音信息傳遞不失真。隨著科技發展,傳統的信號處理方法逐漸被基於神經網路的語音編碼器所替代,成為業內領先技術。由此,人工智慧技術進化而來的AI Codec也備受業界關注。

遊戲界為了使人工智慧對遊戲語音的「BUFF」加持效果顯著,做了許多試驗。比如業內熟知的Opus聲音編碼格式和2019年出現的超低碼率 AI Codec,但在傳輸和人聲質量上都不盡人意。

Google也對這一領域有所涉及。2021年初發布的AI Codec Lyra雖然能保證在低碼率傳輸下不失真,但語音延遲問題始終無法解決。年中發布的AI Codec模型SoundStream,雖較Lyra有所提升,但在大多數手機上的兼容穩定性較差。

移動端AI Codec語音技術首次上線《和平精英》

與此同時,國內廠商也不甘示弱,致力於遊戲內語音交互技術的升級。

《和平精英》作為國內戰術競技手游的佼佼者,一直把提升遊戲品質和玩家體驗視為宗旨。由於遊戲語音的使用範圍廣、頻率高,對玩家遊戲體驗影響大,《和平精英》團隊對此也非常關注。

《和平精英》團隊於2021年底同騰訊AI Lab、CROS遊戲語音GVoice團隊聯合立項GVoice AI Codec研發項目,基於已有的技術積累,新項目更重視高質量、低碼率和低功耗的遊戲內實時語音環境的實現。通過對遊戲場景的針對性優化,相比傳統即時通訊軟體,GVoice AI Codec在遊戲內語音處理演算法的音質表現更加出色,即使是弱網環境也能以低碼率確保無損音質,且適用於移動端。

據悉,GVoice AI Codec 通過自研編解碼模型演算法,實現傳輸帶寬壓縮,並以 5-12kbps 的 AI Codec 將原有24kbps 的Opus替換,使玩家的主觀聽覺體驗不受影響。也就說明,GVoice AI Codec不僅能保證音質,其低碼率也使流量消耗更少。

算力消耗方面,GVoice AI Codec則是需要通過模型壓縮、量化、並行運算、移動端指令集適配等工程化措施,降低運算的複雜度和資源消耗。數據表明,在手機OnePlus 3雙工通話下測試GVoice AI Codec比Opus格式 CPU佔用率資源增長約為2.3%;在iPhone 6s下測試,採用GVoice AI Codec後CPU佔用率增長約1.3%。這說明,GVoice AI Codec用極低的CPU使用率增幅,實現了耗流量低的高質量實時通話。

(左圖為原始語音,右圖為GVoice AI Codec 編解碼後語音,從波形上看右圖語音保真度高,主觀聽感接近原始語音)

GVoice AI Codec技術上線《和平精英》後,語音服務質量得到大幅提升。由於對語音流量的優化,GVoice AI Codec使玩家在出行、戶外等弱網環境下的語音流暢性大為提升,戰況焦灼時出現的卡麥、斷麥情況被極大程度的避免。另外,GVoice AI Codec使用AI模型演算法,在人聲傳輸方面比之傳統語音演算法將大幅改善,在《和平精英》中玩家們的語音清晰度也隨之提升,無論是打配合還是閑聊都讓社交體驗感倍增。項目組在不同嘈雜環境、多種遊戲情景下經過多輪比對,得到了玩家的一致好評反饋。

對遊戲發展來說,GVoice AI Codec應用於《和平精英》,為更多遊戲語音技術的研發提供了支持,讓相關技術用於其他遊戲的可能性大為提升。

缺乏社交的遊戲難以為繼。隨著遊戲品種的豐富,GVoice AI Codec 將成為更多遊戲提升體驗感的必備技術,引領行業標準。