【ITBEAR科技資訊】7月10日消息,奇富科技智能語音團隊的最新研究成果《Qifusion-Net:基于特征融合的流式/非流式端到端語音識別框架》論文,近日被全球頂尖的語音與聲學會議INTERSPEECH 2024收錄。這一成果再次彰顯了奇富科技在語音識別技術領域的深厚實力。
據悉,INTERSPEECH是由國際語音通訊協會(ISCA)主辦的頂級旗艦國際會議,備受全球語音語言領域人士的關注。奇富科技團隊的論文被收錄,不僅代表了其研究得到了國際認可,也展示了該團隊在語音識別技術上的領先地位。
據ITBEAR科技資訊了解,Qifusion框架模型是奇富科技智能語音團隊的重要研究成果,具有多個顯著特點。該模型支持更豐富的方言種類,在原有八種主流方言的基礎上,進一步強化了多個用戶密集地區的方言識別能力,平均識別準確率相對提升了25%,尤其在川渝地區,方言識別準確率更是提升了超過35%。其次,Qifusion框架模型具備自動識別不同口音的能力,并能對解碼結果進行口音信息修正,顯著降低了方言口音的語音識別誤差率和整體語音識別字錯率,提升了用戶體驗。該模型還采用了創新的層自適應融合結構,能高效提取方言信息,并支持即說即譯功能,實現了對方言口音音頻的實時解碼和精準轉譯。
奇富科技智能語音團隊將受邀參加9月舉行的INTERSPEECH 2024科技盛會,并將發表主題報告,分享其在語音識別領域的最新創新成果。屆時,該團隊將與全球同行共同探討語音科技的未來發展,為推動語音技術的進步貢獻力量。