這個國家級智能語音創新中心,顛覆你的耳朵

2024年05月17日13:15:09 科技 1772

向東,是中國科學技術大學高新校區;向北,是合肥市政府與中國科學院合肥物質科學研究院共同設立的合肥創新院——位於安徽合肥的中國聲谷,是全國首個人工智能領域的國家級產業基地,已入駐科大訊飛華米科技等2000餘個企業,年產值超2000億元。

聲谷北門,「國家智能語音創新中心」的牌子格外醒目。依託當地智能語音及人工智能產業集群,創新中心聚焦智能語音領域開展關鍵共性技術研究,產生了一批科技創新成果。在這裡,如何加強科技創新特別是原創性、顛覆性科技創新?怎樣及時將創新成果應用於產業?記者實地探訪創新中心。

這個國家級智能語音創新中心,顛覆你的耳朵 - 天天要聞

智慧無人實驗室——

可24小時不間斷智能語音交互檢測

這個國家級智能語音創新中心,顛覆你的耳朵 - 天天要聞

這個國家級智能語音創新中心,顛覆你的耳朵 - 天天要聞這個國家級智能語音創新中心,顛覆你的耳朵 - 天天要聞

智能交互評測機械人

「你好空調,屋裡太熱了。」「好的,已為您打開製冷模式。」人機對話越來越多出現在家庭中。和冰箱、洗衣機等家電相比,人們對空調的智能語音交互需求更強。然而,保證空調的「耳朵」足夠靈敏,並不容易。

「過去只能在密閉房間里,由測試人員播放聲音並觀察記錄空調響應情況。」山東青島海爾空調器有限總公司測試中心主任高孺說,人工測試方式不僅效率低下,而且很難模擬複雜使用場景。去年3月,高孺偶然聽說國家智能語音創新中心在建智能語音交互的智慧無人實驗室,便立刻去實地了解情況。

這個國家級智能語音創新中心,顛覆你的耳朵 - 天天要聞

進入智慧無人實驗室,宛如置身專業錄音棚——四周布滿調節混響的吸音擴散板和亞克力半球,各式音箱分佈其中。「通過混響調節,能模擬10平方米至300平方米的聲場環境,19個音箱能模仿多種場景的背景噪聲。50平方米的實驗室可以還原95%以上的語音交互使用場景。」國家智能語音創新中心公共檢測服務平台開發工程師李孟輝介紹,實驗室可實現24小時不間斷智能語音交互檢測,依託中心數百萬條的語料庫,各類語音涵蓋近200種語音、語言,以及各個年齡段、各類人群的口音。

以空調檢測為例,工作人員只需設置好相關參數,智能機械人即可到達指定地點,通過仿生人工嘴播放聲音。測試台旁的拾音器,會自動識別空調反饋結果。實驗室上方的攝像頭,會對空調顯示面板進行拍攝。檢測任務結束,將自動生成檢測報告,對響應成功率、響應時間、失敗原因等進行反饋。

通過與中心合作,海爾青島「複製」了實驗環境。「今年投入使用。按一次測試20秒計算,一天可完成超4000次測試。」高孺說,有智慧無人實驗室助力,如今海爾生產的空調,不僅可以進行普通話的語音交互,還可以「聽懂」多地方言,部分出口產品掌握了多語種能力。

據介紹,中心採用「公司+聯盟」的形式組建,匯聚了國內智能語音領域的龍頭企業、科研機構,中心則作為發動機,驅動股東單位以及聯盟的協作運轉。「這種模式有助於促進中心與企業、企業與企業之間的合作交流,推動科技創新成果在製造業中的應用發展。」國家智能語音創新中心總經理吳江照說。

工業AI方案——

變電站單站巡檢時間縮短到30分鐘以內

當一個配備有20餘台10千伏開關櫃的變電站出現異響時,如何快速識別故障區域?「很難直接用耳朵分辨異響來源,過去只能逐個檢查。」國網馬鞍山供電公司運維檢修專工汪隆臻說,「現在使用聲紋識別裝置,能快速鎖定出現故障的位置。」

所謂聲紋識別裝置,由中心聯合科大訊飛與國家電網安徽電科院共同研發。「中心此前就在探索聲紋技術如何應用於工業化場景,溝通後發現安徽電科院也有這方面需求,於是『一拍即合』。」科大訊飛工業智能研究院副院長李俊說。

聲紋識別裝置還能判斷故障原因。「我們的專業技術人員加入研發,分析各類聲音樣本代表何種故障,進而訓練裝置的算法模型。」安徽電科院電力運檢工程師張晨晨說。

如今,聲紋識別裝置已應用於浙江、安徽、廣東寧夏等地的40餘座變電站,能夠準確發現局部放電、短路衝擊、夾件鬆動、冷卻器異響等問題,將單站巡檢時間縮短至30分鐘以內,還降低了人工現場作業的頻次和安全風險。

聲紋識別只是中心提供的多種工業AI(人工智能)方案的一種。各類方案加速落地,為傳統產業集聚新動能。

中心工業AI項目負責人黃偉這段時間忙着和同事一起,給合肥海爾工業園的空調總裝生產線安裝智能質檢設備。「此前有一條生產線安裝了智能質檢設備,效果不錯,現在要在更多生產線上進行鋪設。」黃偉說。

過去,一名工人一天要檢測千餘台空調。「檢查品牌標識時,因為反覆觀看,很可能會出現視覺疲勞。」合肥海爾空調器有限公司總經理戴永勝說,「如果是具備語音交互功能的產品,還需要工人發出語音指令。」為提高檢測效率,戴永勝找到國家智能語音創新中心,聯手研發智能質檢設備。

記者在現場看到,智能質檢設備形如在生產線上加裝了半封閉式長方體鐵盒。當空調由生產線進入時,設備內部音箱發出語音指令,攝像頭和錄音設備則會判定產品給出的回應是否正確。分佈在其他位置的掃碼器、攝像頭,還會對商標、能效等級、型號銘牌等信息進行確認。當產品「走」出質檢設備時,檢測結果隨之在後台顯示。

「智能質檢設備可以完成產品功能、語音交互、標識外觀等7類20餘條質檢任務,準確率高達98.5%。」戴永勝介紹,一條生產線的質檢設備,每天可完成超4000台產品的檢測,未來計劃在公司家電生產線上全面應用。

AI模型全託管雲服務平台——

支持超過1000個算法模型上線運行

作為語音領域頭部企業,科大訊飛掌握大量語音識別、語音合成的算法模型。「不同語種涉及不同算法,過去每套算法各自分散落地,耗時周期長,人力投入大,需要做大量重複的建設和運維工作。」國家智能語音創新中心AI模型全託管雲服務平台項目總監鄭威說。

吳江照也認同:「創新型企業或者科研院所如果想讓某套算法落地,不僅需要算法工程師,還要有工程框架設計師、測試人員、運維人員,同時還要有算力資源的支持。」

2020年初,中心和科大訊飛的語音雲平台研發部共同開發了AI模型全託管雲服務平台。將設計好的算法導入其中,就能實現科研成果落地,整個過程一般不超過兩天。

如今,平台託管的算法模型種類不限於智能語音領域。應用型企業可以選擇需要的算法模型,「就像逛超市一樣,大家對自然語言理解、圖像識別、聲紋識別等方面的需求,都可以在平台上找到對應的能力引擎。」吳江照說。

平台為商湯科技小牛翻譯、中科大等多個廠商和高校提供託管服務,支持超1000個算法模型的運行。平台接入總應用數超200萬,累計覆蓋終端用戶近40億,日均總服務量超20億次。

圍繞創新成果落地,一系列政策舉措相繼實施:合肥市經信局舉辦產業融合對接會,邀請20餘家重點製造業企業參會,6家企業初步達成合作意向;安徽省印發《打造通用人工智能產業創新和應用高地若干政策》,提出加快全時全域場景應用,構建良好產業生態。

「各項舉措持續支持,中心的創新動能將不斷增強。」吳江照說。

編輯手記

了解企業需求服務產業發展

祁嘉潤

「聲音可以做什麼?」回想上學時,物理老師提問,想必現在的孩子們會給出與過去截然不同的答案。語音助手、智能聲控、AI交互……聲音,給人們日常生活帶來越來越多的可能性。

國家智能語音創新中心的故事,傳遞出聲音的另一種力量:幫助電器企業檢測智能語音交互情況,用聲紋技術讓電力檢修變得更容易、更高效……聲音領域的科技創新成果加速落地,給製造業以強大賦能。

以科技創新引領產業創新。製造業創新中心連接着科研機構、高校和企業,在服務產業發展上具有得天獨厚的優勢,應下大力氣,主動了解企業需求、行業趨勢、產業短板,及時將科技創新成果應用到具體產業和產業鏈上,充分發揮自主創新策源地、科技成果轉化地的作用。

科技分類資訊推薦

最新消息!她已離職!曾凌晨發文道歉 - 天天要聞

最新消息!她已離職!曾凌晨發文道歉

本月初,百度副總裁璩靜在短視頻平台上發佈的幾條出鏡視頻引髮網友關注,特別是其提到「員工鬧分手提離職我秒批」等職場話題引髮網友質疑,一度登上微博熱搜。
淘寶取消「618」預售機制後,京東宣布「現貨開賣」 - 天天要聞

淘寶取消「618」預售機制後,京東宣布「現貨開賣」

繼5月7日天貓宣布取消「618」預售機制後,5月8日,京東也正式宣布「現貨開賣」。今年京東618將於5月31日晚8點全面開啟。據了解,現貨開賣的同時,京東還將同步推出百億補貼日活動。在6月2日、6月3日、6月8日,還將先後推出9.
細思極恐網絡暴力和群毆 - 天天要聞

細思極恐網絡暴力和群毆

互聯網高速發展利用時代踏實做事和說實話的人都不被人待見,時時刻刻遭受網絡暴力,聲討,群毆,格力電器董明珠,踏踏實實做企業,創稅收,促進就業,,為國家為人民奉獻大半輩子青春,心血, 汗水,本該退休安享晚年,侍弄兒孫遺憾找不到合適放心接班人,七
探秘vivo影像之美,與X系列技術溝通會共同見證卓越藍圖 - 天天要聞

探秘vivo影像之美,與X系列技術溝通會共同見證卓越藍圖

前段時間的vivo X系列新品發佈讓我們記憶深刻,而剛剛結束結束的「影像新藍圖X系列技術溝通會」也十分精彩,這次溝通會不僅告訴了大家vivo在影像領域的最新成果,也讓粉絲們對vivo影像背後的故事有更多了解,在vivo影像的發展歷程中可以分成兩方面,一方面,vivo通過自主研發,不斷提升自身的影像技術實力,另一方面,vivo...
華為再次亮劍,鴻蒙系統亮點多多 - 天天要聞

華為再次亮劍,鴻蒙系統亮點多多

5月15日,華為夏季全場景新品發佈會簡直是一場視覺與科技的盛宴,看得我熱血沸騰!不得不說,華為這次真的是大招頻出,新品多到讓人眼花繚亂!先說說那個華為MatePad 11.5 」 S吧,一亮相就讓人眼前一亮!它的設計簡約而不失時尚,屏幕清晰得讓人彷彿置身其中。
【新機】升級了個寂寞?藍廠新機發佈 - 天天要聞

【新機】升級了個寂寞?藍廠新機發佈

昨天晚上藍廠發佈了新機iQOO Neo9s Pro,機子採用了6.78英寸1.5K 8T LTPO直面屏,支持144Hz刷新率。搭載天璣9300+,前置1600萬像素,後置IMX920主攝+5000萬超廣角。電池容量5160mAh,支持120W快充。新增白色版本,用上了白色玻璃後蓋,顏值確實提升了不少。不過還是塑料中框+短焦指紋。12+256GB 2699元
AI Agent在哪些行業領域會產生影響? - 天天要聞

AI Agent在哪些行業領域會產生影響?

在如今飛速前進的科技浪潮中,人工智能(AI)技術的創新正以前所未有的速度重塑我們的生活和工作的每一個角落。在這一浪潮中,Agent AI智能體以其卓越的能力脫穎而出,它通過模擬人類智能行為,能夠勝任一系列複雜任務,並在多個領域展現出了其無法替代的價值。