近日,在國際語音頂級會議INTERSPEECH 2022首屆Spoofing-Aware Speaker Verification(SASV)挑戰(zhàn)賽中,由昆山杜克大學(xué)與OPPO小布助手團隊聯(lián)合組建的隊伍“DKU-OPPO”,在與全球23支頂尖隊伍同臺競技鏖戰(zhàn)后脫穎而出,榮獲大賽亞軍。
INTERSPEECH是由國際語音通訊協(xié)會創(chuàng)辦的頂級旗艦國際會議,是全球最大的綜合性語音信號處理領(lǐng)域的科技盛會之一。作為INTERSPEECH 2022的特別會議,首屆SASV由韓國、法國、芬蘭等國家多個研究機構(gòu)共同組織,旨在促進同時集成聲紋識別和偽造音檢測兩項技術(shù)的聯(lián)合系統(tǒng)的進步。
領(lǐng)跑國際競賽,開啟聲紋識別和偽造音檢測聯(lián)合系統(tǒng)新征程
在聲紋識別領(lǐng)域,大多數(shù)研究機構(gòu)要么關(guān)注聲紋識別技術(shù),要么關(guān)注偽造音檢測技術(shù),很少同時關(guān)注兩個技術(shù),并在技術(shù)層面進行聯(lián)合優(yōu)化。隨著聲紋識別技術(shù)和偽造音檢測技術(shù)的發(fā)展和進步,同時集成兩項技術(shù)的聯(lián)合系統(tǒng)亟需提上議程。
針對上述挑戰(zhàn),DKU-OPPO憑借在實際應(yīng)用場景中獲得的豐富經(jīng)驗,對參賽系統(tǒng)進行了級聯(lián)設(shè)計Cascade-ASV-CM,針對聲紋識別模型和偽造音檢測模型分別進行聯(lián)合優(yōu)化,在得分層面進行邏輯融合。
在激烈角逐下,DKU-OPPO最終以各項領(lǐng)先的成績奪得亞軍,并顯著領(lǐng)先于第三名團隊,為同時集成聲紋識別和偽造音檢測兩項技術(shù)的聯(lián)合系統(tǒng)提供了優(yōu)異的解決方案。
合力突破聲紋識別瓶頸,推動行業(yè)技術(shù)發(fā)展
聲紋識別也稱為說話人識別,是從一段語音中自動識別出說話人身份的一門技術(shù)。按照任務(wù)不同,可以分為說話人確認和說話人辨識。說話人確認(Automatic Speaker Verification),即判別出一段語音是否為某個人所講;說話人辨認(Automatic Speaker Recognition),即識別出一段語音具體為哪個人所講。
近些年,隨著深度學(xué)習的快速發(fā)展,聲紋識別的性能得到了顯著提升。然而,在實際場景中,聲紋識別仍面臨著諸多挑戰(zhàn),在技術(shù)攻克與落地應(yīng)用中并非易事。例如聲紋欺詐,即利用技術(shù)手段達到讓偽造目標說話人的聲音欺騙并通過聲紋識別系統(tǒng)的目的。
聲紋欺詐手段主要包括三點:1、利用特定人語音合成技術(shù)生成被攻擊者高質(zhì)量語音;2、利用變聲技術(shù)模擬并生成被攻擊者的聲音;3、錄音重放,即錄制被攻擊者的聲音,并使用錄音設(shè)備進行重放。
在此背景下,相關(guān)學(xué)者于2015年開始組辦ASVSpoof比賽,以吸引更多的人加入偽造音檢測技術(shù)研究的隊伍。但正如前文所提到的,同時集成聲紋識別和偽造音檢測兩項技術(shù)的聯(lián)合系統(tǒng)在需求日益增長的聲紋識別領(lǐng)域仍是一片空白。
首屆SASV挑戰(zhàn)賽的成功落地,不僅創(chuàng)造性地為同時集成聲紋識別和偽造音檢測兩項技術(shù)的聯(lián)合系統(tǒng)提供了解決方案,還進一步推進了聲紋識別技術(shù)的安全性提升。在突破聲紋識別技術(shù)瓶頸的同時,讓更安全可信的服務(wù)成為可能。
持續(xù)開放創(chuàng)新,共建人工智能技術(shù)生態(tài)
在本屆SASV挑戰(zhàn)賽上,與昆山杜克大學(xué)聯(lián)合組隊并獲得亞軍,是小布助手持續(xù)開放創(chuàng)新的一個縮影。近年來,小布助手積極擴展合作生態(tài),以產(chǎn)學(xué)研布局帶動跨界融合創(chuàng)新,與昆山杜克大學(xué)、清華大學(xué)、北京智源人工智能研究院等高校及機構(gòu)組織建立緊密的產(chǎn)學(xué)研合作,并在行業(yè)權(quán)威的中文語言理解測評基準(CLUE)等國際競賽中取得了亮眼的成績。
伴隨著5G、人工智能、云計算、物聯(lián)網(wǎng)等前沿技術(shù)的發(fā)展,小布助手將持續(xù)深耕技術(shù)領(lǐng)域,積極參與行業(yè)生態(tài)建設(shè),以關(guān)鍵成果在實際業(yè)務(wù)場景中的應(yīng)用落地推動技術(shù)創(chuàng)新,共建人工智能新時代。