TeleAI 星辰语音大模型升级,支持中英双语及 40 种方言任意混说

2024年11月03日10:10:16 科技 4826

it之家 11 月 3 日消息,中国电信人工智能研究院(teleai)在今年 5 月发布业内首个支持 30 种方言自由混说的语音识别大模型 —— 星辰超多方言语音识别大模型。

时隔不到半年,teleai 星辰语音大模型的多方言能力再次升级,攻克了湛江话、宜宾话、洛阳话、烟台话等方言,将方言种类从 30 种提升至 40 种,并引入对英文的识别

与传统的有标注训练方法相比,teleai 通过预训练语音识别模型,利用海量无标注数据进行预训练,再通过少量有标注数据进行微调。

由于方言语音数据普遍存在无标注数据多而有标注数据少的特点,这种“预训练 + 微调”的模型方案与方言场景的需求能够高度契合。

TeleAI 星辰语音大模型升级,支持中英双语及 40 种方言任意混说 - 天天要闻

teleai 还在模型结构和成本优化上进行了创新,实现对人工标注数据的需求量大幅降低约 50 倍,且保障模型效果与有监督训练的方言模型水平相当。

it之家附 github 开源地址:https://github.com/tele-ai/telespeech-asr

科技分类资讯推荐

突发,聊聊Manus“删博跑路” - 天天要闻

突发,聊聊Manus“删博跑路”

摘要:“如果最后有不错的结果,证明作为中国出生的创始人,也能在新的环境下做好全球化的产品,那就太好了”凤凰网科技 出品作者|董雨晴7月11日,AI Agent产品Manus官方账号清空了发布在微博、小红书的内容。两天前,Manus刚刚陷入裁
AI取代硅谷程序员?这些美国大厂高管这么说 - 天天要闻

AI取代硅谷程序员?这些美国大厂高管这么说

人工智能(AI)正在加速重塑全球劳动力市场。 当地时间10日,美国招聘平台Indeed及员工评价网站Glassdoor宣布,为应对人工智能带来的产业变革,将裁减约1300个职位,占集团员工总数的6%。微软首席商业官阿尔索夫(Judson Althoff)称,AI已承担35%的产品代码编写工作,显著加快了产品开发周期。 美国威达信集团(Marsh McL...
配备荣耀绿洲护眼屏,荣耀X70还有超窄边框设计 - 天天要闻

配备荣耀绿洲护眼屏,荣耀X70还有超窄边框设计

7 月 11 日消息,荣耀官方表示即将发布的 X70 新品将配备一块行业罕见的好屏幕,拥有 1.5K 分辨率、6000nit 超高亮度,屏幕黑边甚至控制在 1.3mm,带来更沉浸的体验。根据此前曝光的信息,荣耀X70 支持 IP66、IP68、IP69、IP69K 级防尘防水,其中 IP69K 级可以让设备在高压、高温水流冲击下也能有防护能力。不仅如此,荣耀
零跑全新C11上市,14.98万起售 - 天天要闻

零跑全新C11上市,14.98万起售

7月10日,零跑汽车旗下智能越享中型SUV——全新C11正式上市,上市指导价14.98-16.58万元。零跑C11上市4年来,累计销量已突破25万台,是零跑的重要的走量车型,全新C11在造型设计、智能座舱、续航性能、辅助驾驶、驾控体验及安全基因等六大维度实现全面升级。此次上市的全新C11延续纯电与增程双动力版本,其中,纯电车型搭载...
张旭院士:我国类脑智能规模应用潜力巨大 - 天天要闻

张旭院士:我国类脑智能规模应用潜力巨大

7月11日,省加快推进现代化产业体系建设专题会议(人工智能与机器人产业专场)在广州举行。现场,来自相关领域的专家学者、企业家、人大代表、研究机构代表踊跃发言,为广东人工智能与机器人产业的发展积极建言、出谋划策。中国科学院院士、广东省智能科学与技术研究院院长张旭表示,类脑智能技术作为新一代智能技术的核心...