TeleAI 星辰語音大模型升級,支持中英雙語及 40 種方言任意混說

2024年11月03日10:10:16 科技 4826

it之家 11 月 3 日消息,中國電信人工智慧研究院(teleai)在今年 5 月發布業內首個支持 30 種方言自由混說的語音識別大模型 —— 星辰超多方言語音識別大模型。

時隔不到半年,teleai 星辰語音大模型的多方言能力再次升級,攻克了湛江話、宜賓話、洛陽話、煙台話等方言,將方言種類從 30 種提升至 40 種,並引入對英文的識別

與傳統的有標註訓練方法相比,teleai 通過預訓練語音識別模型,利用海量無標註數據進行預訓練,再通過少量有標註數據進行微調。

由於方言語音數據普遍存在無標註數據多而有標註數據少的特點,這種「預訓練 + 微調」的模型方案與方言場景的需求能夠高度契合。

TeleAI 星辰語音大模型升級,支持中英雙語及 40 種方言任意混說 - 天天要聞

teleai 還在模型結構和成本優化上進行了創新,實現對人工標註數據的需求量大幅降低約 50 倍,且保障模型效果與有監督訓練的方言模型水平相當。

it之家附 github 開源地址:https://github.com/tele-ai/telespeech-asr

科技分類資訊推薦

大爺寫《我的母親》火爆全網!視頻發布者最新發聲 - 天天要聞

大爺寫《我的母親》火爆全網!視頻發布者最新發聲

連日來,一段關於大爺挑戰寫作1957年高考同題作文《我的母親》的視頻火爆全網。不少網民表示,文字質樸,催人淚下,深深被打動。7月11日,大皖新聞記者聯繫上了視頻發布者連文傑。對方表示,視頻中展示的作文內容由大爺獨立寫作,產生的版權收入也全給大爺。大爺寫作文視頻走紅網路。大爺寫的作文在網上爆火大皖新聞記者注...
10.38萬元起,吉利銀河A7發布預售價 - 天天要聞

10.38萬元起,吉利銀河A7發布預售價

7月11日,吉利銀河發布了預售價,預售價格範圍為10.38-13.38萬元,在發布預售價格的同時,官方也帶來了多項權益,包括500元訂金抵扣1500元,贈送價值8800元的Flyme Sound音響等。
「中欣卡」突然停擺,超150萬用戶退款難 - 天天要聞

「中欣卡」突然停擺,超150萬用戶退款難

覆蓋北京2000多家門店、擁有超150萬持卡用戶的預付卡「中欣卡」近日停擺,線上線下消費渠道均被暫停,恢復時間未知。大量持卡用戶面臨資金凍結困境。消費渠道全面「癱瘓」近日,中欣卡發布公告稱「因業務調整,全面暫停所有門店合作,無法消費」。中國新聞網《民生調查局》記者發現,其官網合作商戶名錄已清空,線上提貨渠...
突發,聊聊Manus「刪博跑路」 - 天天要聞

突發,聊聊Manus「刪博跑路」

摘要:「如果最後有不錯的結果,證明作為中國出生的創始人,也能在新的環境下做好全球化的產品,那就太好了」鳳凰網科技 出品作者|董雨晴7月11日,AI Agent產品Manus官方賬號清空了發布在微博、小紅書的內容。兩天前,Manus剛剛陷入裁
AI取代矽谷程序員?這些美國大廠高管這麼說 - 天天要聞

AI取代矽谷程序員?這些美國大廠高管這麼說

人工智慧(AI)正在加速重塑全球勞動力市場。 當地時間10日,美國招聘平台Indeed及員工評價網站Glassdoor宣布,為應對人工智慧帶來的產業變革,將裁減約1300個職位,占集團員工總數的6%。微軟首席商業官阿爾索夫(Judson Althoff)稱,AI已承擔35%的產品代碼編寫工作,顯著加快了產品開發周期。 美國威達信集團(Marsh McL...