近日,TME安全團(tuán)隊在語音信號處理領(lǐng)域上取得了新突破,團(tuán)隊自研成果論文“音頻性別識別與年齡預(yù)測技術(shù)”《Exploring Multi-task Learning Based Gender Recognition and Age Estimation for Class-imbalanced Data 》入選了全球語音與聲學(xué)頂級會議INTERSPEECH 2022。
INTERSPEECH是由國際語音通訊協(xié)會(International Speech Communication Association, ISCA)創(chuàng)辦的語音信號處理領(lǐng)域頂級旗艦國際會議,在國際上享有盛譽并具有廣泛的學(xué)術(shù)影響力。歷屆INTERSPEECH會議都備受全球各地語音語言領(lǐng)域人士的廣泛關(guān)注,該會議曾兩次在我國舉辦,最近一次是2020年由中科院自動所牽頭在上海舉辦。此次TME安全團(tuán)隊的自研成果論文入選,是國際學(xué)術(shù)界對其在語音信號領(lǐng)域科研實力的極高認(rèn)可。
INTERSPEECH 官網(wǎng)及論文信息
攻克核心難題,將落地未成年人網(wǎng)絡(luò)安全場景
在以往對音頻性別識別與年齡預(yù)測的同類研究中,不同性別與年齡的音頻數(shù)據(jù)常常呈現(xiàn)出明顯的長尾分布和非平衡現(xiàn)象。如何能在訓(xùn)練數(shù)據(jù)量不豐富、數(shù)據(jù)分布不均衡、音頻時長短等挑戰(zhàn)下實現(xiàn)長尾數(shù)據(jù)的精準(zhǔn)與魯棒識別,成為一項極具有挑戰(zhàn)性的任務(wù)。
在論文中,TME安全團(tuán)隊創(chuàng)新性地提出了一種多任務(wù)學(xué)習(xí)的音頻性別識別與年齡預(yù)測方法。與此前研究方法相比,多任務(wù)學(xué)習(xí)法通過深度神經(jīng)網(wǎng)絡(luò),提取表征說話人的特征,構(gòu)建性別和年齡的關(guān)聯(lián)和約束關(guān)系,從而提高識別的準(zhǔn)確率;此外,針對訓(xùn)練數(shù)據(jù)等難題,TME安全團(tuán)隊則采用了基于說話人識別任務(wù)的預(yù)訓(xùn)練模型,對數(shù)據(jù)樣本標(biāo)簽進(jìn)行平滑預(yù)處理和設(shè)計加權(quán)損失函數(shù)最大程度降低數(shù)據(jù)分布不均衡影響,提升識別性能。實驗表明,運用論文中所提方法,在類別數(shù)據(jù)分布不均衡的測試集上能實現(xiàn)更高的性別識別準(zhǔn)確率和更小的年齡預(yù)測誤差。
據(jù)了解,在取得理論研究突破的同時,TME安全團(tuán)隊也將努力推動此項技術(shù)應(yīng)用于直播、游戲、消費等多個未成年人網(wǎng)絡(luò)保護(hù)場景。在《中華人民共和國未成年人保護(hù)法》《未成年人網(wǎng)絡(luò)保護(hù)條例(征求意見稿)》《關(guān)于規(guī)范網(wǎng)絡(luò)直播打賞 加強未成年人保護(hù)的意見》等多部法規(guī)條例的指導(dǎo)下,TME安全團(tuán)隊將通過技術(shù)應(yīng)用,快速識別使用者的年齡和性別特征,助力平臺不斷落實未成年人保護(hù)措施,引導(dǎo)未成年人正確使用互聯(lián)網(wǎng)產(chǎn)品,從而為未成年人打造積極、清朗的網(wǎng)絡(luò)空間。
科技向善,TME安全團(tuán)隊助力守護(hù)網(wǎng)絡(luò)安全
此次論文被接收,是TME安全團(tuán)隊在語音信號處理領(lǐng)域上的新突破,也是業(yè)務(wù)應(yīng)用推動科技創(chuàng)新的典型實踐。長期以來,為了守護(hù)網(wǎng)絡(luò)安全,TME安全團(tuán)隊堅守“科技向善”理念,從安全算法的創(chuàng)新和安全平臺的建立入手,輔以用戶教育引導(dǎo)工作,建立出一整套完善的內(nèi)容安全技術(shù)體系,為用戶打造出綠色溫暖、安全積極的產(chǎn)品使用體驗,守護(hù)TME安全內(nèi)容生態(tài)。
TME技術(shù)副總裁傅鴻城講解內(nèi)容安全技術(shù)
TME安全團(tuán)隊在音頻、視覺和文本等方面都積累了深厚完善的算法能力,構(gòu)建出一套TME多模態(tài)內(nèi)容安全算法體系。在音頻領(lǐng)域,TME安全團(tuán)隊著力推進(jìn)研發(fā)異常事件檢測、爆炸恐怖涉黃音頻分類、音頻指紋庫等技術(shù),賦能音頻內(nèi)容安全審核,提升了音頻內(nèi)容質(zhì)量;同時,TME還推出諸如反垃圾文本、反惡意刷量、反廣告反欺詐等安全算法,打擊了惡意內(nèi)容和惡意用戶的侵?jǐn)_,保障了廣大用戶的體驗和權(quán)益。
基于完善算法體系,TME安全中心還建成了黑盾智慧安全平臺,形成了一套完善的審核能力和工具,全面覆蓋了機審、人審、回查等全流程,極大地提高了內(nèi)容審核效率,降低了內(nèi)容違規(guī)風(fēng)險,為維護(hù)清朗網(wǎng)絡(luò)空間貢獻(xiàn)出自己的力量。
此外,基于科技向善理念,TME安全團(tuán)隊在大力治理內(nèi)容生態(tài)之余,還加強了用戶教育引導(dǎo)工作。例如今年上半年,在全民K歌和QQ音樂平臺上,安全團(tuán)隊通過“安全小助手”“安全中心”等兩個賬號一共發(fā)送了135期宣傳作品,包括聯(lián)合全民K歌平臺大V推出的《天下無詐-全民反詐》、《愛你(“殺豬盤”版本)》等,獲得了用戶的強烈反響,寓教于樂,讓反詐觀念深入人心。
正如騰訊音樂集團(tuán)技術(shù)副總裁傅鴻城所講:“內(nèi)容安全是網(wǎng)絡(luò)治理的重要組成部分,而強大的安全技術(shù)能力也成為新媒體網(wǎng)絡(luò)平臺越來越重要的保障能力。未來,面對網(wǎng)絡(luò)空間中變化多端的不同挑戰(zhàn),TME安全團(tuán)隊也將持續(xù)深入技術(shù)創(chuàng)新,關(guān)注未成年人等重點群體,推進(jìn)落地更多應(yīng)用場景,構(gòu)建起更先進(jìn)完善的內(nèi)容安全技術(shù)體系,全面保障用戶的體驗和權(quán)益。”