“中國語音識別技術的突破,將帶動著場景下的語音交互更加智能化、實用化,更在未來十年帶動萬物互聯的整體布局與發展,賦能人工智能的黃金新十年。”
6月23日,第四屆世界智能大會開幕式暨主題峰會上,科大訊飛董事長劉慶峰表示,立足于應用場景驅動,AI認知智能行業應用不斷落地,智慧教育、智能醫療、智慧城市、智能客服、智慧司法,將實實在在解決剛需,推動中國人工智能迎來黃金十年。
在萬物互聯時代,語音成為核心交互入口,以其普適性和可操作性而越來越被人們所接受。科大訊飛一直專長于此,在前端降噪麥克風降噪、語音識別、語音合成、自然語言處理多個環節,均做到了全球領先的位置。
今年5月份,國際多通道語音分離和識別大賽(CHiME)組委會在線揭曉最新一屆CHiME-6成績,科大訊飛聯合中科大語音及語言信息處理國家工程實驗室(USTC-NELSLIP)在給定說話人邊界的多通道語音識別兩個參賽任務上奪冠。自2016年以來,科大訊飛第三次參加這項國際競賽并連續奪冠,并且接連打破自己創造的記錄,把語音識別精度連續提高。
CHiME-6可以說是史上最難語音識別任務,比賽使用的語音素材包括多個生活場景——多人在廚房邊做飯邊聊天、在起居室邊用餐邊聊天、在客廳聊天,帶來諸多難點,如大量的語音交疊(Speech Overlap)、遠場混響和噪聲干擾對錄音的影響、對話風格非常自由、近乎隨意、訓練數據有限。最終科大訊飛大幅刷新該項賽事歷史最好成績。
劉慶峰在大會演講中介紹,科大訊飛之所以如此堅持不懈地提高諸多復雜環境下語音識別的難度,是為了滿足萬物互聯時代的語音交互需求。“現在大會上,如果你口音比較標準,環境較安靜,大概準確率可以97%以上。實際中更多場景是到3~5米、5~8米之外去講話,還有其他人同時發言,比如起居室、家庭客廳,環境噪音多,識別準確度就不一樣了。”
在萬物互聯時代,智能手機的使用頻率遠遠高于其他終端,手機的語音交互功能也顯得尤為重要。
科大訊飛多年以來,一直在和手機廠商一起打造語音助手,提供穩定、高質量、智能的服務。因其在智能語音交互領域的長期深耕和專注,贏得眾多廠商青睞,國內90%的高端智能手機款中均有科大訊飛提供底層支撐。
今年三月份,華為發布了高端旗艦手機P40系列,同時推出備受關注的全新海外語音助手Celia,這其中科大訊飛為華為P40 Celia 提供了多語種語音助手服務。憑借科大訊飛智能語音技術出色的多語種能力, Celia為更多國家和地區用戶帶來便捷服務。同時助力華為在多語種實戰中超過競品,避免華為在國際上遭遇智能語音技術卡脖子。
目前,科大訊飛合作伙伴涵蓋了語音技術應用各領域的龍頭企業,智能手機方面,華為、OPPO、vivo等手機廠商均與訊飛具有良好合作,家電領域如格力、海爾、美的等企業;在智能汽車領域,科大訊飛還推出了智能汽車語音助理、智能車載系統、一體化車機等汽車智能化產品,持續保持中國汽車智能語音交互第一品牌。
一直以來,科大訊飛以“讓機器能聽會說,能理解會思考,用人工智能建設美好世界”為使命,作為人工智能國家隊,科大訊飛在人工智能以及智能語音核心技術始終保持國際領先。
科大訊飛也承擔著建設智能語音國家新一代人工智能開放創新平臺的重任,憑借在人工智能與智能語音領域的專長,科大訊飛一直在用人工智能解決人類剛需的道路上探索,賦能萬物互聯時代。