近日,由快手音視頻技術(shù)部聯(lián)合意大利羅馬第一大學(xué)(Sapienza University of Rome, Italy),在國(guó)際音頻頂級(jí)會(huì)議 ICASSP 2022 上發(fā)起的深度3D音頻信號(hào)處理挑戰(zhàn)賽(L3DAS22:Machine Learning for 3D Audio Signal Processing)成績(jī)正式發(fā)布。此次比賽共有來(lái)自全球近50支學(xué)術(shù)界和工業(yè)界團(tuán)隊(duì)報(bào)名,比賽成果將在今年5月 ICASSP 2022 大會(huì)的 Special Session 上進(jìn)行分享。
作為第一屆L3DAS21比賽的冠軍,快手音視頻技術(shù)部音頻算法團(tuán)隊(duì)在深度學(xué)習(xí)的音頻信號(hào)處理方向上持續(xù)探索。此次團(tuán)隊(duì)聯(lián)合意大利羅馬第一大學(xué)發(fā)起挑戰(zhàn)賽,旨在提供一個(gè)通用的數(shù)據(jù)集和公平的測(cè)試平臺(tái),促進(jìn)真實(shí)場(chǎng)景下3D深度音頻信號(hào)處理核心技術(shù)的研究。基于深度學(xué)習(xí)的3D音頻信號(hào)處理技術(shù)引起學(xué)術(shù)界和工業(yè)界廣泛關(guān)注,在虛擬和真實(shí)會(huì)議、游戲開發(fā)、音樂制作,自動(dòng)駕駛及監(jiān)控等領(lǐng)域深入應(yīng)用。相較于單通道音頻,3D音頻攜帶的增量三維聲源方位信息,有助于提升語(yǔ)音和情感識(shí)別、聲源分離、語(yǔ)音增強(qiáng)和去噪,以及聲學(xué)回聲消除算法的效果。
本次挑戰(zhàn)賽共設(shè)置了兩個(gè)任務(wù):
任務(wù)一:多通道3D語(yǔ)音增強(qiáng)任務(wù),專注于辦公場(chǎng)景下的實(shí)時(shí)語(yǔ)音增強(qiáng)需求。
任務(wù)二:真實(shí)場(chǎng)景下特定聲源檢測(cè)和定位任務(wù),專注于自動(dòng)駕駛、監(jiān)控等應(yīng)用場(chǎng)景。
經(jīng)過(guò)近三個(gè)月的激烈角逐,挑戰(zhàn)賽結(jié)果正式出爐。任務(wù)一中,卡耐基梅隆大學(xué)、百度和騰訊分列前三名;中科院聲學(xué)所、重慶郵電大學(xué)和新加坡ForteMedia分列任務(wù)二的前三名。同時(shí),快手將為每個(gè)任務(wù)的前兩名團(tuán)隊(duì)提供豐厚獎(jiǎng)金。此次挑戰(zhàn)賽數(shù)據(jù)集模擬了40,000余個(gè)3D環(huán)境,提供了2組 Ambisonics 格式的3D錄音。參賽團(tuán)隊(duì)的成績(jī)通過(guò)語(yǔ)音可懂度指標(biāo)(Short-Time Objective Intelligibility, STOI)和單詞錯(cuò)誤率(Word Error Rate, WER)兩個(gè)指標(biāo)進(jìn)行綜合評(píng)定。
圖1:任務(wù)一: 語(yǔ)音增強(qiáng)比賽成績(jī)
圖2:任務(wù)二:聲源檢測(cè)及定位比賽成績(jī)
快手音視頻技術(shù)部匯聚了音頻領(lǐng)域頂尖人才,結(jié)合快手業(yè)務(wù)推進(jìn)了前沿算法的應(yīng)用和落地,深入實(shí)時(shí)語(yǔ)音通信、音頻音效及后處理、音頻內(nèi)容理解、音頻編解碼、音頻硬件等多個(gè)領(lǐng)域。團(tuán)隊(duì)成員在IEEE ICASSP、Interspeech、ACM/IEEE TALSP等頂級(jí)學(xué)術(shù)會(huì)議和期刊上,均有發(fā)表系列學(xué)術(shù)論文,并多次斬獲音頻挑戰(zhàn)賽冠軍。
快手定義的“音視頻”不局限于畫面觀感,更強(qiáng)調(diào)“視”“聽”統(tǒng)一的極致體驗(yàn)。在不同場(chǎng)景中,快手音視頻技術(shù)部通過(guò)將豐富的音頻處理能力與視頻處理能力相結(jié)合,自動(dòng)形成算法決策,為用戶呈現(xiàn)真正的視聽盛宴。對(duì)于前沿技術(shù),團(tuán)隊(duì)將持續(xù)投入研發(fā)與探索,保持領(lǐng)先,以應(yīng)對(duì)更為豐富多元的應(yīng)用場(chǎng)景。
比賽官網(wǎng):https://www.l3das.com/icassp2022/results.html