TeleAI 星辰語音大模型升級,支持中英雙語及 40 種方言任意混說

2024年11月03日10:10:16 科技 4826

it之家 11 月 3 日消息,中國電信人工智慧研究院(teleai)在今年 5 月發布業內首個支持 30 種方言自由混說的語音識別大模型 —— 星辰超多方言語音識別大模型。

時隔不到半年,teleai 星辰語音大模型的多方言能力再次升級,攻克了湛江話、宜賓話、洛陽話、煙台話等方言,將方言種類從 30 種提升至 40 種,並引入對英文的識別

與傳統的有標註訓練方法相比,teleai 通過預訓練語音識別模型,利用海量無標註數據進行預訓練,再通過少量有標註數據進行微調。

由於方言語音數據普遍存在無標註數據多而有標註數據少的特點,這種「預訓練 + 微調」的模型方案與方言場景的需求能夠高度契合。

TeleAI 星辰語音大模型升級,支持中英雙語及 40 種方言任意混說 - 天天要聞

teleai 還在模型結構和成本優化上進行了創新,實現對人工標註數據的需求量大幅降低約 50 倍,且保障模型效果與有監督訓練的方言模型水平相當。

it之家附 github 開源地址:https://github.com/tele-ai/telespeech-asr

科技分類資訊推薦

清華專家破百年陳規!滬上論壇曝電力革新,陳磊構想太敢了 - 天天要聞

清華專家破百年陳規!滬上論壇曝電力革新,陳磊構想太敢了

聽說了嗎?清華大學的專家居然說要徹底打破電力系統運行了上百年的規矩!就在上海那場新能源論壇上,陳磊研究員拋出個重磅觀點 —— 以後用電不用再看頻率臉色,有功功率想咋調就咋調!這事兒要是真能成,咱們家裡的空調、電動車充電可就再也不會因為電網不
消費活力釋放,上海零售商業形態向「文商旅體展」融合演進 - 天天要聞

消費活力釋放,上海零售商業形態向「文商旅體展」融合演進

2025年二季度,在上海市政府經濟刺激方案推動下,上海商業市場消費活力逐步釋放,但零售物業租賃指標的復甦態勢仍顯平緩。核心商圈平均租金為1877元/平方米/月,平均出租率為94.71%,整體表現與去年同期持平,其中徐家匯、陸家嘴等商圈憑藉成熟商業生態,表現相對突出。但與非核心商圈相比,從存量、新增供應、凈吸納量等指...
OPPO K13 Turbo 系列真機曝光,7 月 21 日發布 - 天天要聞

OPPO K13 Turbo 系列真機曝光,7 月 21 日發布

IT之家 7 月 11 日消息,博主 @i冰宇宙 今日分享了一款帶保密殼的新機真機圖,配備 RGB 燈效以及主動散熱風扇,預計為剛剛官宣的 OPPO K13 Turbo 系列。IT之家注意到,OPPO K13 Turbo 系列將於 7 月 21 日發布,在 GeekBench 6.3.0 中單核成績為 2156 分,多核成績為 6652 分,預計搭載高通驍龍
醒醒吧!CEO猛吹AI寫95%代碼,績效考核卻還在拼程序員手速? - 天天要聞

醒醒吧!CEO猛吹AI寫95%代碼,績效考核卻還在拼程序員手速?

編譯 | Tina在 AI 工具席捲開發圈之後,一批技術老兵的工作方式悄然發生變化。Superhuman (原生 AI 郵件應用)工程負責人 Loic Houssier 正是這場轉型的親歷者之一。這位出身數學背景、擁有密碼學工程經驗的 VP,曾帶領團隊經歷了從大型 B2C 到核心底層架構的複雜挑戰。而當 ChatGPT、Claude Code 等工具走進日常
從領先到落後:英特爾正經歷「寒冬」 - 天天要聞

從領先到落後:英特爾正經歷「寒冬」

【環球網科技綜合報道】7月11日,據外媒報道,英特爾首席執行官陳立武近日在發表內部講話時直言英特爾已不再是領先晶元製造商,甚至不在前十。其市值如今僅約1000億美元,與18個月前相比大幅縮水,而英偉達市值卻一度突破4萬億美元,形成鮮明對比。「二三十年前,我們確實是行業領導者。可如今的世界已經變了,我們已不在全...