GVoice AI Codec语音技术正式上线和平精英,语音开黑爽度倍增

不知道你有没有经历过这样的情况:你正在和队友愉快“开黑”,率领着队友大杀四方时,突然语音断了,原本大好的局势一下子因为沟通不畅而陷入危局,简直令人崩溃!

随着移动端游戏日益火爆,游戏的社交性变成玩家的刚需,语音系统成为衡量游戏品质的重中之重,游戏厂商们也更加重视游戏内语音系统的开发。

最近,腾讯游戏发布了最新的语音技术方案,腾讯光子S工作室《和平精英》团队与腾讯AI Lab、腾讯游戏CROS GVoice(腾讯游戏语音)等专业团队,不断深挖语音编解码器的升级技术,将AI Codec技术应用于《和平精英》游戏中,实现了AI Codec 更低码率更高质量的语音编码,在行业内遥遥领先,成为首个将AI Codec技术全面应用于游戏语音领域的产品。

网速差,语音“开黑”不畅成痛点

艾媒咨询曾有数据统计表明,40%的玩家因社交因素而中意一款游戏;15.6%的玩家选择退游则是因为游戏社交性不足。由此可见,如何提高游戏的社交性是各大游戏厂商必须面临的首要难题。

游戏内的有效交流可以增加玩家的互动体验感,但随着手游的发展,玩家们对游戏语音的质量、延迟时间、使用环境等要求也愈发苛刻。

实际上,游戏实时语音一直是个老生常谈的话题,它不单单是实现实时通话那么简单。评判语音的好坏,语音的听感质量是重中之重,这个前提使得:传输码率越低,玩家流量消耗就越少;占用算力越少,CPU处理就越快。

直至今天,游戏语音传输技术在两方面寻找突破点。

最先要攻克的难题就是——在网速不畅的情况下,如何保证语音交流的稳定性?在不降低听感质量的前提下,语音信息码率越低,传输的连贯性则更稳定,通俗的说,低码率在弱网中更具优势。

算力的损耗则是第二个难关。大型游戏普遍对CPU要求较高,因此,在不改变玩家交流体验的同时让语音功能最大限度的少占用CPU,不至于对操作和资源计算产生挤压,也变得尤为重要。

人工智能——游戏语音的“BUFF”加成

当语音开黑、游戏社交逐渐变成玩家的普遍需求时,各国科技企业也纷纷投入这一领域。

传统的音频解码技术Codec在保证语音质量的前提下专注于降低网络带宽资源和传输码率来确保语音信息传递不失真。随着科技发展,传统的信号处理方法逐渐被基于神经网络的语音编码器所替代,成为业内领先技术。由此,人工智能技术进化而来的AI Codec也备受业界关注。

游戏界为了使人工智能对游戏语音的“BUFF”加持效果显著,做了许多试验。比如业内熟知的Opus声音编码格式和2019年出现的超低码率 AI Codec,但在传输和人声质量上都不尽人意。

Google也对这一领域有所涉及。2021年初发布的AI Codec Lyra虽然能保证在低码率传输下不失真,但语音延迟问题始终无法解决。年中发布的AI Codec模型SoundStream,虽较Lyra有所提升,但在大多数手机上的兼容稳定性较差。

移动端AI Codec语音技术首次上线《和平精英》

与此同时,国内厂商也不甘示弱,致力于游戏内语音交互技术的升级。

《和平精英》作为国内战术竞技手游的佼佼者,一直把提升游戏品质和玩家体验视为宗旨。由于游戏语音的使用范围广、频率高,对玩家游戏体验影响大,《和平精英》团队对此也非常关注。

《和平精英》团队于2021年底同腾讯AI Lab、CROS游戏语音GVoice团队联合立项GVoice AI Codec研发项目,基于已有的技术积累,新项目更重视高质量、低码率和低功耗的游戏内实时语音环境的实现。通过对游戏场景的针对性优化,相比传统即时通讯软件,GVoice AI Codec在游戏内语音处理算法的音质表现更加出色,即使是弱网环境也能以低码率确保无损音质,且适用于移动端。

据悉,GVoice AI Codec 通过自研编解码模型算法,实现传输带宽压缩,并以 5-12kbps 的 AI Codec 将原有24kbps 的Opus替换,使玩家的主观听觉体验不受影响。也就说明,GVoice AI Codec不仅能保证音质,其低码率也使流量消耗更少。

算力消耗方面,GVoice AI Codec则是需要通过模型压缩、量化、并行运算、移动端指令集适配等工程化措施,降低运算的复杂度和资源消耗。数据表明,在手机OnePlus 3双工通话下测试GVoice AI Codec比Opus格式 CPU占用率资源增长约为2.3%;在iPhone 6s下测试,采用GVoice AI Codec后CPU占用率增长约1.3%。这说明,GVoice AI Codec用极低的CPU使用率增幅,实现了耗流量低的高质量实时通话。

(左图为原始语音,右图为GVoice AI Codec 编解码后语音,从波形上看右图语音保真度高,主观听感接近原始语音)

GVoice AI Codec技术上线《和平精英》后,语音服务质量得到大幅提升。由于对语音流量的优化,GVoice AI Codec使玩家在出行、户外等弱网环境下的语音流畅性大为提升,战况焦灼时出现的卡麦、断麦情况被极大程度的避免。另外,GVoice AI Codec使用AI模型算法,在人声传输方面比之传统语音算法将大幅改善,在《和平精英》中玩家们的语音清晰度也随之提升,无论是打配合还是闲聊都让社交体验感倍增。项目组在不同嘈杂环境、多种游戏情景下经过多轮比对,得到了玩家的一致好评反馈。

对游戏发展来说,GVoice AI Codec应用于《和平精英》,为更多游戏语音技术的研发提供了支持,让相关技术用于其他游戏的可能性大为提升。

缺乏社交的游戏难以为继。随着游戏品种的丰富,GVoice AI Codec 将成为更多游戏提升体验感的必备技术,引领行业标准。