挑戰賽 | MagicHub中英混語音識別挑戰賽發布基線系統和開發訓練集

2022年08月24日18:13:45 教育 1993

2022年8月12日起，由Magic Data、好未來、清華大學、中國科學院聲學研究所主辦聯合主辦的「Magichub中英混ASR挑戰賽」自開展以來，已經收到三十多支國內外研究機構、知名企業及高校的參賽隊伍註冊報名，包括荔枝FM、特斯聯、網易遊戲、中移在線、中科院、華中科技大學、中國科學技術大學、西北工業大學、廈門大學、天津大學等。8月24日，主辦方正式向參賽隊伍開放開發訓練集和基線系統。

報名持續進行中

https://magichub.com/join-competition/?id=11627

開發訓練集

主辦方開放了以下訓練與開發數據集：

1、MagicData-RAMC 包括351組多輪普通話對話，時長共計180小時。每組對話的標註信息包括轉錄文本、語音活動時間戳、說話人信息、錄製信息和話題信息。說話人信息包括了性別、年齡和地域，錄製信息包括了環境和設備。請參賽者查看郵件進行數據集下載。

2、TAL_CSASR中英文混合語音數據集，為好未來英語課授課音頻，時長共計587小時。包含中英文混合講話的情況，每條音頻只有一位說話人，共包括超過200名說話人。請參賽者查看郵件進行數據集下載。

3、開發集（Dev），包含14名說話人，總時長約6.8小時。

所有參與者都應遵守以下規則：

1. DATA：只允許使用MagicData-RAMC 和 TAL_CSASR。數據增強可以使用兩個雜訊數據集，即 MUSAN（openslr17), RIRNoise (openslr 28)。

2. 嚴禁以任何形式使用測試集，包括但不限於使用測試數據集對模型進行微調或訓練。

3.允許多系統融合。然而不鼓勵使用具有相同結構的系統進行融合。

4. 所有模型都應在允許的數據集上進行訓練。具體來說，預訓練模型不允許使用其他數據集（包括未標記的數據）。

5、最終解釋權歸主辦方所有。

基線系統介紹

為了幫助參賽者評估系統性能，主辦方提供了基線系統性能供參賽者參考。該系統採用Transformer模型，基於ETEH平台開發。

具體信息請見：

https://github.com/MagicHub-io/CSASR_Challenge

打分工具

使用開源的打分工具Sclite進行打分。評分指標採用混合錯誤率（Mixed Error Rate, MER），即對中文計算字錯誤率、對英文計算詞錯誤率。

打分樣例請見：

https://github.com/MagicHub-io/CSASR_Challenge/blob/main/dev_scoring_sclite.sh

基線系統答疑指導

對基線系統有任何疑問，請訪問以下鏈接獲取幫助，將有專家團隊給予解答。

答疑直通車：

https://github.com/MagicHub-io/CSASR_Challenge#contact

獎項設置

比賽分別設置一等獎、二等獎和三等獎，將評選出三組獲獎團隊/個人，獲獎者將有機會參加國際及國內頂會的現場演示及交流活動。

一等獎 1名：華為Watch+阿噗筋膜槍(價值3000元)+獲獎證書

二等獎 2名：Magic Data錦鯉大禮包+好未來&凌美聯名鋼筆禮盒(價值1500元)+獲獎證書

三等獎 3名：Magic Data定製禮品+阿噗體重秤(價值500元)+獲獎證書

賽程設置

競賽組委會支持團隊

挑戰賽相關問題，可請發送郵件至 [email protected]，郵件標題為「中英混ASR挑戰賽疑問」。疑問將由以下組委會資深技術專家提供專業技術問答和指導。指導專家均在語音領域深耕多年，有著豐富研究和實戰經驗，相信參賽者們在他們的指導下能夠得到啟發與收穫。

報名方式

報名地址：https://magichub.com/join-competition/?id=11627

參賽人數：每隊參賽人數4人以內 (含4人)

更多詳情：www.magichub.com

教育

美國大規模撤銷外國留學生簽證，已經蔓延至南部多所高校 - 天天要聞

美國大規模撤銷外國留學生簽證，已經蔓延至南部多所高校

美國近期對外國留學生的簽證政策愈演愈烈，多所位於美國南部的公立和私立大學已經證實，部分國際學生的簽證被撤銷，或者在聯邦學生與交流訪問者信息系統（SEVIS）中的身份狀態發生了改變。一、學....

04月13日 1711

匈牙利獲取駕照的成本大幅上漲 - 天天要聞

匈牙利獲取駕照的成本大幅上漲

匈牙利媒體報道：根據中央統計局（KSH）的最新數據，匈牙利考取駕照的平均價格在四年內上漲了 60%，由於汽油、維修費用以及教練費等成本都更加昂貴，使得獲取駕照的費用可能高達 80 萬至 90 萬福林。然而，問題不僅僅是成本普遍上漲，人們對待

04月13日 1885

導數與零點，這種題目很綜合：容納了很多知識點 - 天天要聞

導數與零點，這種題目很綜合：容納了很多知識點

這篇我們繼續說導數上圖這種壓軸題，有時候是3問，有時候是兩問。通常第一問都是送分題，即便如此，第一問出的也是很有水平的。就拿這道題來說。 x軸是函數的切....

04月13日 3566

中國成教協會教師繼續教育專業委員會全體大會在駐馬店召開 - 天天要聞

中國成教協會教師繼續教育專業委員會全體大會在駐馬店召開

4月12日，中國成人教育協會教師繼續教育專業委員會第九次全體大會暨教師繼續教育高質量發展研討會在駐馬店幼兒師範高等專科學校演播廳召開。

04月13日 1256

新高考為什麼要倡導「教考銜接」？有三個重要原因 - 天天要聞

新高考為什麼要倡導「教考銜接」？有三個重要原因

同舊高考相比，新高考有一個近些年喊得很響的理念——教考銜接。什麼是教考銜接，簡單來說，就是學校教什麼，高考就考什麼。大家知道，舊高考也有一個喊得很響的理念——以考定教。這個理念指揮了高考十幾年，其弊端已經十分明顯。

04月13日 1140

濱州醫學院：政校企攜手賦能共促醫學人才高質量就業 - 天天要聞

濱州醫學院：政校企攜手賦能共促醫學人才高質量就業

中國青年報客戶端訊（中青報·中青網記者邢婷）近日，濱州醫學院舉辦「就選山東『醫』往『職』前」2025年春季校園雙選會暨「美好『衛』來『健』康煙台」醫學人才築夢煙台招聘會。招聘會現場，350家用人單位攜1.2萬個就業崗位進校攬才。該校4300餘名畢業生參加招聘會，2500餘名畢業生與用人單位達成初步就業意向，實現醫...

04月13日 1822

「百校千企萬崗」，江蘇共青團「送崗直通車」進江科大助力大學生就業 - 天天要聞

「百校千企萬崗」，江蘇共青團「送崗直通車」進江科大助力大學生就業

中國青年報客戶端訊（中青報·中青網記者李超）4月11日，江蘇共青團「送崗直通車」開進江蘇科技大學舉辦「百校千企萬崗」示範招聘會。這是江蘇共青團青少年民生實事項目之一，聯動各界協同發力，為應屆高校畢業生搭建高質量就業橋樑，助力青年學子實現「好就業、就好業」。江蘇省百校千企萬崗」示範招聘會現場。主辦方供...

04月13日 6962

潮評丨入職要簽「不參加考公考編承諾書」企業管理越線了 - 天天要聞

潮評丨入職要簽「不參加考公考編承諾書」企業管理越線了

潮新聞客戶端評論員高路安徽新銳教育集團通報旗下學校教職工「考公考編」情況。

04月13日 1090

何同學的反討好之困 - 天天要聞

何同學的反討好之困

本文來自微信公眾號：王智遠，作者：王智遠，題圖來自：AI生成事情是這樣：4月11日晚，何同學在微博上分享了自己打車的經歷；他說以前打網約車時，司機讓他給好評，總是嘴上答應，但事後就忘了。他覺得這樣不太好，所以，現在改。如果司機服務真的很棒，他才會主動好評；不然就會直接拒絕；他還提到，自己以前比較愛討好別...

04月13日 6496

大風天去不了考場，報名費打水飄？教育部教育考試院：這錢，我退！ - 天天要聞

大風天去不了考場，報名費打水飄？教育部教育考試院：這錢，我退！

4月11日至13日，受較強冷空氣影響，華北出現歷史同期罕見的持續性大風。其中，河北北部等地局地陣風風力可達12～13級，中央氣象台發布橙色預警，提醒公眾減少戶外活動，多地景點臨時關閉，部分中小學及高校宣布停課或轉為線上教學。△ 社交平台相關話題截圖受此影響，已經報名參加本屆韓國語能力考試（TOPIK）的考生群體對...

04月13日 5153