近日,全球知名智能影像品牌影石 Insta360 發布新一代專業級旗艦相機 Insta360 X3。作為 Insta360 系列產品的長期語音技術合作伙伴,繼今年8月上市的 Insta360 Link 之后,出門問問AI算法再次加持 Insta360 重磅專業級旗艦新品,通過內置4麥陣列、全景聲、AI降噪、自動增益、人聲增強、語音識別等技術,保證 Insta360 X3 在運動場景及嘈雜環境下依然保持高質量的音頻效果。
作為影石全景運動相機旗艦產品,「X系列」面世后重新定義運動相機,至此歷經4年,迎來第三代更新。經過不斷迭代打磨的X3,將全景影像、防抖科技與運動拍攝創新結合,并提升AI語音的用戶體驗,以出門問問加持的全新語音控制,輕松實現語音指令,并使用出門問問全新升級的48K音頻增強算法,為用戶帶來“聲臨其境”般的聽覺盛宴。
出門問問語音識別與降噪算法
賦能 Insta360 X3 專業級旗艦相機
出門問問 TicHear™ 為保證語音質量的清晰優質 ,全新升級到48K高采樣率音頻處理引擎,為 Insta360 X3 帶來身臨其境般的聽覺盛宴,并充分利用麥克風陣列前端+深度學習降噪協同來增強語音質量。
Insta360 X3 搭載了4顆高性能的MEMS麥克風來配合 TicHear™ 工作,形成多個垂射陣列方向的波束成形器,來實現4指向的全景聲、增強目標方向上的信號,同時抑制非目標方向上的信號,波束形成對于抑制噪音干擾和抑制混響方面都有一定的效果 。
為了實現更出色的運動表現,風噪處理是不可避免的問題。Insta360 X3 搭載出門問問 TicHear™ 引擎,內置深度神經網絡降風噪功能。關于風噪壓抑算法,在常規的降風噪算法中,再引入自研的深度神經網絡降噪引擎,可進一步壓制平滑多種風噪,同時采用海量風噪標注過的數據作為樣本,通過機器自主進行樣本數據集學習處理模型和模型參數,在特定場景以及瞬時非平穩情況下均可以獲得比傳統方法更好的效果。
為了實現更出色的語音控制表現,Insta360 X3 內置出門問問 TicHear™ 引擎的Always-on voice 模塊,結合麥克風陣列前端處理,并優化了訓練方式和豐富數據集,保證了低信噪比場景下語音識別的準確性。同時使用級聯的結構,在保持高召回率的前提下,將誤喚醒壓到最低。
外部帶噪語音進入麥克風之后,會經波束成形、噪聲壓制、自動增益控制(AGC)和動態范圍控制(DRC)和音頻均衡器(EQ)等一系列算法處理,最終輸出清晰的HiFi級別立體聲48K音頻,極大提升寬容度,并同時保證遠場拾音和自然度和還原度。
出門問問語音技術持續升級
加持專業級產品體驗
基于出門問問在智能穿戴算法方面的領先優勢,產品支持使用中英文喚醒詞來喚醒語音助手,輔以通話降噪、快捷口令等功能,讓用戶隨時隨地體驗語音交互帶來的高效數字生活服務。除旗艦新品 Insta360 ONE X3之外,Insta360 ONE R系列、GO2 系列、ONE RS系列、ONE X2系列、Insta360 Link系列 等 Insta360 產品,均搭載出門問問 TicHear™ 解決方案,實現產品的質優體驗。
出門問問 TicHear™ 解決方案包含完整的信號處理與識別的技術棧,獲得的成果頻頻得到合作伙伴們的高度贊許。目前,出門問問將 TicHear™ 整套算法移植到自家無線音頻芯片M510系列芯片上,利用M510系列芯片先進制成及特有的流水線設計,如并行指令、長指令等進行了大量匯編級別優化,使之占用更低的內存和功耗,以滿足客戶對能耗的高要求。
出門問問M510軟硬一體無線智能音頻芯片 實現產品化落地量產
除 Insta360 之外,目前出門問問已攜手大眾汽車集團、vivo、一加、三星、高通、BES、ASR、RTL等業界頭部合作伙伴,將前沿語音技術落地在車載、智能手表、真無線耳機、智能手機、直播和會議類、專業相機、筆記本電腦、智能家居等諸多領域。出門問問一直以定義下一代人機交互為使命,不斷加持專業級產品體驗,賦能以語音交互為主的技術落地場景。