10月23日,以“AI煥新·更美好”為主題的2020年科大訊飛全球1024開發(fā)者節(jié)在安徽廣播電視臺亞洲一號演播廳隆重開幕。在A.I.新技術(shù)發(fā)布會上,科大訊飛AI研究院常務(wù)副院長劉聰針對如何保持核心技術(shù)領(lǐng)先、實現(xiàn)不斷發(fā)展和突破的過程,提出了A.I.科技樹的構(gòu)筑理念,并帶來了科大訊飛在A.I.技術(shù)領(lǐng)域的最新進展。
通過真正解決社會剛需問題來創(chuàng)造美好生活,是科大訊飛成立20多年來一直追求的理念。劉聰介紹,當前,科大訊飛的A.I.技術(shù)已經(jīng)在諸如教育、醫(yī)療、汽車、司法、播音主持等多領(lǐng)域落地應(yīng)用,特別是在今年疫情期間,人工智能技術(shù)為疫情的防控帶來了非常大的價值,比如科大訊飛的A.I.電話機器人就在輔助診斷、疫情排查、人員防控等方面起到了很大的作用。
同時,隨著AI技術(shù)在行業(yè)的深化,對技術(shù)的效果功能也會有更高的要求。劉聰提出,以基礎(chǔ)算法為主干,以技術(shù)體系為生長方向,以場景理解為發(fā)展動力,這就形成了科大訊飛AI科技樹的構(gòu)筑過程。這也是過去這些年訊飛核心技術(shù)發(fā)展的內(nèi)在邏輯。
談到科大訊飛在A.I.技術(shù)領(lǐng)域的最新進展,劉聰以語音識別、語音合成、OCR圖文識別等代表性技術(shù)為例做了詳細的闡述。
語音識別是訊飛的傳統(tǒng)強項,從早期的早呼叫導航到現(xiàn)在的語音控制,訊飛在這一方面的技術(shù)始終保持著領(lǐng)先。劉聰提出,今后要想實現(xiàn)更多的突破,語音識別需要持續(xù)的去挑戰(zhàn)更加復雜的場景,去實現(xiàn)從語音到聲音,從單純的文字內(nèi)容的識別,到音頻的全場景解析;同時,語音合成也需要實現(xiàn)從語音到聲音的全場景音頻合成;而OCR圖文識別技術(shù)的突破則需要結(jié)合圖神經(jīng)卷積網(wǎng)絡(luò)等結(jié)構(gòu)化分析的技術(shù)和基于對抗生成網(wǎng)絡(luò)的圖文數(shù)據(jù)生成技術(shù)。
核心技術(shù)驅(qū)動是A.I.長期發(fā)展的原動力,對于科大訊飛來說,保持不斷創(chuàng)新的技術(shù)以及突破,就是其實現(xiàn)長期可持續(xù)發(fā)展的關(guān)鍵。而通過不斷地推動核心技術(shù)發(fā)展,為生活賦予更多的可能,是科大訊飛的初衷。正如劉聰在發(fā)布會的最后所說,“未來我們也會一如既往的讓科技樹更加茂盛,并通過行業(yè)應(yīng)用反哺,持續(xù)的發(fā)揮價值。”