語音技術(shù)圈頂會之一INTERSPEECH 2020,以“Cognitive Intelligence for Speech Processing”為主題,即將登陸上海。2020口音英語語音識別技術(shù)研討會暨挑戰(zhàn)賽(以下簡稱2020AESRC)作為本年度INTERSPEECH的旗艦技術(shù)活動,計劃于2020年10月25日在中國上海同步舉行。
競賽背景
英語作為最具影響力的全球性交流語言之一,與其相關(guān)的英語語音識別系統(tǒng)也在學(xué)術(shù)界和工業(yè)界受到廣泛關(guān)注。 當前階段,標準英語ASR系統(tǒng)已經(jīng)能夠獲得較高的識別正確率,滿足一定場景的商用要求,但是口音英語識別仍然是具有挑戰(zhàn)性的課題,商用系統(tǒng)往往通過大量的口音標注數(shù)據(jù)覆蓋來緩解口音帶來的識別性能影響。
口音語音識別面臨著口音本身的不一致性、語速與音素發(fā)音的多變性帶來的建模難題。另外,帶有口音標注的語音數(shù)據(jù)的短缺也嚴重限制了相關(guān)研究的開展。
Interspeech 2020口音英語語音識別挑戰(zhàn)賽 (Interspeech2020 Accented English Speech Recognition, AESR) 向參賽者開放了來自不同國家的共八種口音英語數(shù)據(jù),覆蓋了各種發(fā)音特點、口音輕重,旨在加強英語語種識別、口音語音識別的研究交流。期待來自學(xué)術(shù)界與工業(yè)界的學(xué)術(shù)研究者能夠相互切磋,有所收獲。
賽道介紹
賽道1:口音種類識別
使用官方提供的各種口音英語的訓(xùn)練數(shù)據(jù),訓(xùn)練語種分類模型。提交測試集合上的語種識別結(jié)果。
賽道2:口音英語語音識別
使用規(guī)則限定的訓(xùn)練數(shù)據(jù),訓(xùn)練語音識別模型。提交測試集合上的語音識別結(jié)果文本。測試集合中會出現(xiàn)訓(xùn)練集外的口音以驗證模型泛化性能。
指定數(shù)據(jù)
數(shù)據(jù)堂向參賽者提供8個國家(俄羅斯、韓國、美國、葡萄牙、日本、印度、英國、中國)的口音英語數(shù)據(jù),每個國家20小時,總量160小時。
訓(xùn)練數(shù)據(jù)將與按如下格式組織的metadata同時開放。
兩個賽道中允許使用Librispeech數(shù)據(jù) http://www.openslr.org/12/
獎項設(shè)置
參賽日程
2020年8月20日 參賽報名截止
2020年8月21日 組委會提供訓(xùn)練數(shù)據(jù)
2020年9月22日 組委會提供測試集
2020年9月24日 參賽團隊提交測試結(jié)果
2020年9月30日 組委會公布評測結(jié)果
2020年10月9日 參賽團隊提交方案介紹
2020年10月25日 獲獎團隊頒獎
競賽指導(dǎo)委員會競
聯(lián)合主辦單位
中國計算機協(xié)會語音對話與聽覺專業(yè)組
西北工業(yè)大學(xué)音頻語音與語言處理研究組
上海交通大學(xué)智能語音實驗室
新加坡南洋理工大學(xué)計算機科學(xué)與工程學(xué)院
美國約翰霍普金斯大學(xué)語言與語音處理中心
西安高新產(chǎn)業(yè)技術(shù)開發(fā)區(qū)軟件園發(fā)展中心
陜西鯤鵬生態(tài)創(chuàng)新中心
數(shù)據(jù)堂(北京)科技股份有限公司
大賽面向語音技術(shù)愛好者,高等院校、科研單位、企業(yè)、創(chuàng)客團隊等人員均可報名參賽,每位選手只能加入1支隊伍。