TeleAI 星辰语音大模型升级,支持中英双语及 40 种方言任意混说

2024年11月03日10:10:16 科技 4826

it之家 11 月 3 日消息,中国电信人工智能研究院(teleai)在今年 5 月发布业内首个支持 30 种方言自由混说的语音识别大模型 —— 星辰超多方言语音识别大模型。

时隔不到半年,teleai 星辰语音大模型的多方言能力再次升级,攻克了湛江话、宜宾话、洛阳话、烟台话等方言,将方言种类从 30 种提升至 40 种,并引入对英文的识别

与传统的有标注训练方法相比,teleai 通过预训练语音识别模型,利用海量无标注数据进行预训练,再通过少量有标注数据进行微调。

由于方言语音数据普遍存在无标注数据多而有标注数据少的特点,这种“预训练 + 微调”的模型方案与方言场景的需求能够高度契合。

TeleAI 星辰语音大模型升级,支持中英双语及 40 种方言任意混说 - 天天要闻

teleai 还在模型结构和成本优化上进行了创新,实现对人工标注数据的需求量大幅降低约 50 倍,且保障模型效果与有监督训练的方言模型水平相当。

it之家附 github 开源地址:https://github.com/tele-ai/telespeech-asr

科技分类资讯推荐

大爷写《我的母亲》火爆全网!视频发布者最新发声 - 天天要闻

大爷写《我的母亲》火爆全网!视频发布者最新发声

连日来,一段关于大爷挑战写作1957年高考同题作文《我的母亲》的视频火爆全网。不少网民表示,文字质朴,催人泪下,深深被打动。7月11日,大皖新闻记者联系上了视频发布者连文杰。对方表示,视频中展示的作文内容由大爷独立写作,产生的版权收入也全给大爷。大爷写作文视频走红网络。大爷写的作文在网上爆火大皖新闻记者注...
10.38万元起,吉利银河A7发布预售价 - 天天要闻

10.38万元起,吉利银河A7发布预售价

7月11日,吉利银河发布了预售价,预售价格范围为10.38-13.38万元,在发布预售价格的同时,官方也带来了多项权益,包括500元订金抵扣1500元,赠送价值8800元的Flyme Sound音响等。
“中欣卡”突然停摆,超150万用户退款难 - 天天要闻

“中欣卡”突然停摆,超150万用户退款难

覆盖北京2000多家门店、拥有超150万持卡用户的预付卡“中欣卡”近日停摆,线上线下消费渠道均被暂停,恢复时间未知。大量持卡用户面临资金冻结困境。消费渠道全面“瘫痪”近日,中欣卡发布公告称“因业务调整,全面暂停所有门店合作,无法消费”。中国新闻网《民生调查局》记者发现,其官网合作商户名录已清空,线上提货渠...
突发,聊聊Manus“删博跑路” - 天天要闻

突发,聊聊Manus“删博跑路”

摘要:“如果最后有不错的结果,证明作为中国出生的创始人,也能在新的环境下做好全球化的产品,那就太好了”凤凰网科技 出品作者|董雨晴7月11日,AI Agent产品Manus官方账号清空了发布在微博、小红书的内容。两天前,Manus刚刚陷入裁
AI取代硅谷程序员?这些美国大厂高管这么说 - 天天要闻

AI取代硅谷程序员?这些美国大厂高管这么说

人工智能(AI)正在加速重塑全球劳动力市场。 当地时间10日,美国招聘平台Indeed及员工评价网站Glassdoor宣布,为应对人工智能带来的产业变革,将裁减约1300个职位,占集团员工总数的6%。微软首席商业官阿尔索夫(Judson Althoff)称,AI已承担35%的产品代码编写工作,显著加快了产品开发周期。 美国威达信集团(Marsh McL...