(ChinaZ.com)10月23日 消息:今天下午,科大訊飛AI研究院常務副院長劉聰發表了關于“構筑AI科技樹,煥新美好新生活”的主題演講。在演講中,劉聰提到了如何保持AI技術不斷突破以及如何實現應用落地的問題。
劉聰認為,在人工智能的應用場景中,最重要的一個就是語音交互。他稱語音識別是訊飛的傳統強項。近年來,科大訊飛陸續推出了方言識別、遠場交互、多麥克風陣列等相關的功能,將語音聽寫從簡單場景的可用做到了通用。
下一步,科大訊飛將持續深耕語音識別,去挑戰更加復雜的場景,去實現從語音到聲音,從單純的文字內容的識別,到音頻的全場景解析。例如直播場景這樣有游戲、音樂以及笑聲、掌聲等各種音效嘈雜的背景下,如何有針對性地提取想要的聲音。
面對這種復雜的環境,科大訊飛已經有一套全場景音頻解析的整體方案。目前,可達訊飛在直播場景下的識別準確率已經從從60%提到了85%。未來,這些相關技術會在科大訊飛的開放平臺、訊飛聽見等上線。