這個國家級智能語音創新中心,顛覆你的耳朵

2024年05月17日13:15:09 科技 1772

向東,是中國科學技術大學高新校區;向北,是合肥市政府與中國科學院合肥物質科學研究院共同設立的合肥創新院——位於安徽合肥的中國聲谷,是全國首個人工智慧領域的國家級產業基地,已入駐科大訊飛華米科技等2000餘個企業,年產值超2000億元。

聲谷北門,「國家智能語音創新中心」的牌子格外醒目。依託當地智能語音及人工智慧產業集群,創新中心聚焦智能語音領域開展關鍵共性技術研究,產生了一批科技創新成果。在這裡,如何加強科技創新特別是原創性、顛覆性科技創新?怎樣及時將創新成果應用於產業?記者實地探訪創新中心。

這個國家級智能語音創新中心,顛覆你的耳朵 - 天天要聞

智慧無人實驗室——

可24小時不間斷智能語音交互檢測

這個國家級智能語音創新中心,顛覆你的耳朵 - 天天要聞

這個國家級智能語音創新中心,顛覆你的耳朵 - 天天要聞這個國家級智能語音創新中心,顛覆你的耳朵 - 天天要聞

智能交互評測機器人

「你好空調,屋裡太熱了。」「好的,已為您打開製冷模式。」人機對話越來越多出現在家庭中。和冰箱、洗衣機等家電相比,人們對空調的智能語音交互需求更強。然而,保證空調的「耳朵」足夠靈敏,並不容易。

「過去只能在密閉房間里,由測試人員播放聲音並觀察記錄空調響應情況。」山東青島海爾空調器有限總公司測試中心主任高孺說,人工測試方式不僅效率低下,而且很難模擬複雜使用場景。去年3月,高孺偶然聽說國家智能語音創新中心在建智能語音交互的智慧無人實驗室,便立刻去實地了解情況。

這個國家級智能語音創新中心,顛覆你的耳朵 - 天天要聞

進入智慧無人實驗室,宛如置身專業錄音棚——四周布滿調節混響的吸音擴散板和亞克力半球,各式音箱分布其中。「通過混響調節,能模擬10平方米至300平方米的聲場環境,19個音箱能模仿多種場景的背景雜訊。50平方米的實驗室可以還原95%以上的語音交互使用場景。」國家智能語音創新中心公共檢測服務平台開發工程師李孟輝介紹,實驗室可實現24小時不間斷智能語音交互檢測,依託中心數百萬條的語料庫,各類語音涵蓋近200種語音、語言,以及各個年齡段、各類人群的口音。

以空調檢測為例,工作人員只需設置好相關參數,智能機器人即可到達指定地點,通過仿生人工嘴播放聲音。測試台旁的拾音器,會自動識別空調反饋結果。實驗室上方的攝像頭,會對空調顯示面板進行拍攝。檢測任務結束,將自動生成檢測報告,對響應成功率、響應時間、失敗原因等進行反饋。

通過與中心合作,海爾青島「複製」了實驗環境。「今年投入使用。按一次測試20秒計算,一天可完成超4000次測試。」高孺說,有智慧無人實驗室助力,如今海爾生產的空調,不僅可以進行普通話的語音交互,還可以「聽懂」多地方言,部分出口產品掌握了多語種能力。

據介紹,中心採用「公司+聯盟」的形式組建,匯聚了國內智能語音領域的龍頭企業、科研機構,中心則作為發動機,驅動股東單位以及聯盟的協作運轉。「這種模式有助於促進中心與企業、企業與企業之間的合作交流,推動科技創新成果在製造業中的應用發展。」國家智能語音創新中心總經理吳江照說。

工業AI方案——

變電站單站巡檢時間縮短到30分鐘以內

當一個配備有20餘台10千伏開關櫃的變電站出現異響時,如何快速識別故障區域?「很難直接用耳朵分辨異響來源,過去只能逐個檢查。」國網馬鞍山供電公司運維檢修專工汪隆臻說,「現在使用聲紋識別裝置,能快速鎖定出現故障的位置。」

所謂聲紋識別裝置,由中心聯合科大訊飛與國家電網安徽電科院共同研發。「中心此前就在探索聲紋技術如何應用於工業化場景,溝通後發現安徽電科院也有這方面需求,於是『一拍即合』。」科大訊飛工業智能研究院副院長李俊說。

聲紋識別裝置還能判斷故障原因。「我們的專業技術人員加入研發,分析各類聲音樣本代表何種故障,進而訓練裝置的演算法模型。」安徽電科院電力運檢工程師張晨晨說。

如今,聲紋識別裝置已應用於浙江、安徽、廣東寧夏等地的40餘座變電站,能夠準確發現局部放電、短路衝擊、夾件鬆動、冷卻器異響等問題,將單站巡檢時間縮短至30分鐘以內,還降低了人工現場作業的頻次和安全風險。

聲紋識別只是中心提供的多種工業AI(人工智慧)方案的一種。各類方案加速落地,為傳統產業集聚新動能。

中心工業AI項目負責人黃偉這段時間忙著和同事一起,給合肥海爾工業園的空調總裝生產線安裝智能質檢設備。「此前有一條生產線安裝了智能質檢設備,效果不錯,現在要在更多生產線上進行鋪設。」黃偉說。

過去,一名工人一天要檢測千餘台空調。「檢查品牌標識時,因為反覆觀看,很可能會出現視覺疲勞。」合肥海爾空調器有限公司總經理戴永勝說,「如果是具備語音交互功能的產品,還需要工人發出語音指令。」為提高檢測效率,戴永勝找到國家智能語音創新中心,聯手研發智能質檢設備。

記者在現場看到,智能質檢設備形如在生產線上加裝了半封閉式長方體鐵盒。當空調由生產線進入時,設備內部音箱發出語音指令,攝像頭和錄音設備則會判定產品給出的回應是否正確。分布在其他位置的掃碼器、攝像頭,還會對商標、能效等級、型號銘牌等信息進行確認。當產品「走」出質檢設備時,檢測結果隨之在後台顯示。

「智能質檢設備可以完成產品功能、語音交互、標識外觀等7類20餘條質檢任務,準確率高達98.5%。」戴永勝介紹,一條生產線的質檢設備,每天可完成超4000台產品的檢測,未來計劃在公司家電生產線上全面應用。

AI模型全託管雲服務平台——

支持超過1000個演算法模型上線運行

作為語音領域頭部企業,科大訊飛掌握大量語音識別、語音合成的演算法模型。「不同語種涉及不同演算法,過去每套演算法各自分散落地,耗時周期長,人力投入大,需要做大量重複的建設和運維工作。」國家智能語音創新中心AI模型全託管雲服務平台項目總監鄭威說。

吳江照也認同:「創新型企業或者科研院所如果想讓某套演算法落地,不僅需要演算法工程師,還要有工程框架設計師、測試人員、運維人員,同時還要有算力資源的支持。」

2020年初,中心和科大訊飛的語音雲平台研發部共同開發了AI模型全託管雲服務平台。將設計好的演算法導入其中,就能實現科研成果落地,整個過程一般不超過兩天。

如今,平台託管的演算法模型種類不限於智能語音領域。應用型企業可以選擇需要的演算法模型,「就像逛超市一樣,大家對自然語言理解、圖像識別、聲紋識別等方面的需求,都可以在平台上找到對應的能力引擎。」吳江照說。

平台為商湯科技小牛翻譯、中科大等多個廠商和高校提供託管服務,支持超1000個演算法模型的運行。平台接入總應用數超200萬,累計覆蓋終端用戶近40億,日均總服務量超20億次。

圍繞創新成果落地,一系列政策舉措相繼實施:合肥市經信局舉辦產業融合對接會,邀請20餘家重點製造業企業參會,6家企業初步達成合作意向;安徽省印發《打造通用人工智慧產業創新和應用高地若干政策》,提出加快全時全域場景應用,構建良好產業生態。

「各項舉措持續支持,中心的創新動能將不斷增強。」吳江照說。

編輯手記

了解企業需求服務產業發展

祁嘉潤

「聲音可以做什麼?」回想上學時,物理老師提問,想必現在的孩子們會給出與過去截然不同的答案。語音助手、智能聲控、AI交互……聲音,給人們日常生活帶來越來越多的可能性。

國家智能語音創新中心的故事,傳遞出聲音的另一種力量:幫助電器企業檢測智能語音交互情況,用聲紋技術讓電力檢修變得更容易、更高效……聲音領域的科技創新成果加速落地,給製造業以強大賦能。

以科技創新引領產業創新。製造業創新中心連接著科研機構、高校和企業,在服務產業發展上具有得天獨厚的優勢,應下大力氣,主動了解企業需求、行業趨勢、產業短板,及時將科技創新成果應用到具體產業和產業鏈上,充分發揮自主創新策源地、科技成果轉化地的作用。

科技分類資訊推薦

北方桑拿天超長待機 未來一周這些地區人員注意防暑 - 天天要聞

北方桑拿天超長待機 未來一周這些地區人員注意防暑

近期,我國南北方多地持續高溫酷熱未來一周,北方桑拿天頻現不少地方體感溫度可達40℃以上將生生被「蒸」服其中,山東、河南等地熱得十分突出濟南、鄭州桑拿天將天天見北京、天津、石家莊等地桑拿天也可持續6天未來十天河北中南部、黃淮、江漢及陝西關中等地將持續高溫部分地區最高氣溫可達39至41℃注意防暑降溫!(來...
蘋果智能再遭挫折:頂級AI模型高管被「挖牆腳」 - 天天要聞

蘋果智能再遭挫折:頂級AI模型高管被「挖牆腳」

1月19日,瑞士達沃斯,世界經濟論壇開幕前,Meta展館內的Meta AI。圖片來源:Hollie Adams—Bloomberg via Getty Images蘋果公司(Apple Inc.)AI模型主管即將離職,加入Meta Platforms Inc.,這標誌著iPhone製造商蘋果公司在AI領域的艱難努力中再遭挫折。知情人士透露,負責公司Apple
齊魯文化大模型入選山東省重大科技創新工程 - 天天要聞

齊魯文化大模型入選山東省重大科技創新工程

齊魯晚報·齊魯壹點記者 時培磊根據《關於下達2025年山東省重點研發計劃(重大科技創新工程)項目的通知》,由山東數字文化集團申報的齊魯文化大模型項目入選山東省重點研發計劃(重大科技創新工程),為全省文化領域唯一。
13999 元起,三星新一代摺疊屏手機 Galaxy Z Fold7 國行價格偷跑 - 天天要聞

13999 元起,三星新一代摺疊屏手機 Galaxy Z Fold7 國行價格偷跑

IT之家 7 月 9 日消息,三星新一代摺疊屏旗艦手機 Galaxy Z Fold7 將於今日晚間 10 點正式發布,京東提前曝光了新機的規格和價格,IT之家附商品頁爆料國行價格如下:12GB+256GB 售價 13999 元12GB+512GB 售價 14999 元16GB+1TB 售價 17499 元作為參考,上一代 Galaxy Z Fold6 的最低
董宇輝蘭知春序備案官網域名 - 天天要聞

董宇輝蘭知春序備案官網域名

天眼查App顯示,近日,蘭知春序(西安)科技有限公司新增一則網站備案信息,域名為「lanzhicx.com」,審核日期為6月23日。目前,該網站暫時無法打開。
牆板安裝、地磚鋪貼……首屆粵港澳建築機器人大賽好燃 - 天天要聞

牆板安裝、地磚鋪貼……首屆粵港澳建築機器人大賽好燃

7月8日,首屆粵港澳建築機器人大賽在華南理工大學(廣州國際校區)舉辦。據悉,本次大賽由廣東省住房和城鄉建設廳、香港特別行政區政府發展局聯合指導,粵港澳智能建造產業發展聯盟與香港建造業議會主辦,中建三局深圳公司等企業聯合承辦。
多個賬號仿冒「K1373砸窗小伙」 平台:新增攔截仿冒策略 - 天天要聞

多個賬號仿冒「K1373砸窗小伙」 平台:新增攔截仿冒策略

7月9日上午,紅星新聞記者瀏覽發現,自官方通報「男子在列車上砸車窗通風」事件後,社交平台上湧現出多個以「K1373砸窗小伙」「砸車窗小伙」等命名的網路賬號。其中,有一名為「砸玻璃的小夥子」的用戶更是在抖音發布視頻作品,表示自己就是那個砸玻璃的男人。 ▲社交平台上出現多個相關的賬號記者查看這些賬號,發現其中大...