無論視頻會議還是線下會議,我們總是被外界各種噪音所困擾,從而影響溝通進度。對此,為了應對復雜聲學場景下的實時語音通信技術挑戰(zhàn),解決企業(yè)會議室開會難題,騰訊會議推出天籟語音模組方案,12m超長距離拾音,一次性解決你開會時的各種噪聲。
1. 聽不清:參加培訓,因為主講人講話離麥克風太遠,參與培訓的人員經(jīng)常聽得一頭霧水,會議中如果多人同時說話,聲音也會明顯失真。
2. 常卡頓:通過視頻會議進行工作匯報,往往會遇到聲音延遲、卡頓、忽快忽慢,或者和對方同時安靜或者說話的尷尬情況,影響溝通進度。
3. 有混響和噪音。要是會議場地很空曠,聲音經(jīng)常出現(xiàn)反射或混響,各類噪聲也會嚴重影響開會質量。
針對這些情況,騰訊會議旗下天籟實驗室有一個新命題:攻克復雜聲學場景下遠場拾音的技術挑戰(zhàn),解決企業(yè)會議室以及視頻會議的開會難題。
現(xiàn)在,天籟實驗室推出天籟語音模組方案,由騰訊AI Lab多項技術加持,可以實現(xiàn)12米超長距離拾音,打造會議室里的“順風耳”。
不僅如此,天籟語音模組基于深度學習模型,對數(shù)百種常見噪聲進行消除訓練,可以將空調聲、風扇聲以及會議室場景下特定的各種突發(fā)噪聲進行針對性消除。
針對多人同時說話時聲音明顯失真現(xiàn)象,天籟語音模組方案則能有效實現(xiàn)雙講無剪切、無回聲泄露、無近端語音抑制,有效確保多人討論時,每個人的聲音都聽得見、聽得清、聽得真。
天籟語音模組,由騰訊會議旗下頂尖音頻實驗室——天籟實驗室研發(fā)而成。基于軟硬一體的聲學硬件設計,在騰訊AI Lab多項技術加持下,通過麥克風陣列和多模態(tài)深度學習技術相融合,首次結合房間聲場感知,采集和空間聲場重建技術,開創(chuàng)性地解決會議室復雜場景下,遠場多人音頻通信、語音助手、多人講話語音轉寫、多人講話實時追蹤,和多人自動取景等實時音視頻技術難題,實現(xiàn)在遠場復雜物理空間下通信體驗的突破性提升。
劃重點,這一方案已授權開放給騰訊會議硬件認證合作伙伴,并率先應用在騰訊會議Rooms專款機型上,助力打造會議室場景高清、純凈、流暢的開會體驗。
騰訊會議一直致力于構建開放的視頻會議生態(tài)。未來,騰訊會議將持續(xù)開放音視頻認證標準和技術能力,聯(lián)合硬件設備廠商,共同為企業(yè)量身打造軟硬一體的云視頻會議解決方案,讓企業(yè)更會開會。