近日,2021全球數字經濟大會在北京舉行。大會以“創新引領 數據驅動——建設全球數字經濟標桿城市”為主題,由北京市人民政府、國家發展和改革委員會、工業和信息化部、商務部、國家互聯網信息辦公室共同主辦。出門問問作為中國領先的人工智能公司受邀出席,創始人兼CEO李志飛在人工智能產業治理主題論壇中發表《語音開源與人工智能產業穩健發展》的主題演講,與業界共話科技企業的社會擔當與責任。
全球首個面向產業界的語音開源工具 WeNet
隨著語音識別在過去幾年的迅速發展,一方面語音識別的準確率大幅提升,另一方面語音識別已廣泛應用至智能可穿戴、智能音箱、智能車載等諸多產業,整個產業界對開源框架的依賴性較高,而與此同時,語音識別的主流開源框架卻長年為國外所壟斷開發,且偏學術界,比如90年代的GMM和近年來的DNN和HMM以及E2E、NN等。
出門問問 WeNet 的問世,即為全球首個面向產品和工業界的端到端語音識別框架,在正式發布后短短6個月的時間里,于世界最大的代碼托管平臺 Github 上獲得超過1000個 star,成為當前最流行的產品級端到端語音識別框架。相較于目前主流語音識別開源工具,WeNet 在研發之初就確立了“生產力第一” (Production First and Production Ready) 的設計原則,以解決語音識別在實際產品和應用中的實際問題為出發點和落腳點,同時兼顧簡潔性、易用性。目前,也正是因為這些基本的設計準則,WeNet 非常易于產品化,在工業界和高校有廣泛的應用。
WeNet 使用當前全世界最前沿的深度學習模型結構U2++。先用CTC進行流式解碼,然后用Attention Decoder去重打分,提高識別準確率。WeNet 的出現解決了目前主流語音開源工具之痛點,且各項性能指標達到業界最優,成為世界級技術領先的開源工具。如果用簡單的幾個詞總結 WeNet 的特性,那就是“更快、更高、更強、更有生產力”。目前,WeNet 1.0 以其“小而精”的鮮明特色,已構建了一個完整完善的語音識別所需的方方面面的能力,且具有工業界應用的典型案例。
語音開源促進人工智能產業穩健發展
“當前,工業界對語音AI的需求越來越清晰,主要體現在自主可控、靈活定制、數據安全等三個方面。創建自主可控的語音開源工具勢在必行。”李志飛表示,出門問問 WeNet 通過打造社區支撐、提供行業解決方案、落地私有部署等方面,為AI行業創建共享機制、構建良好生態,進而助力AI產業的穩健發展。
基于共促人工智能穩健發展的初衷,也讓 WeNet 的開源社區發展非常迅速。在滿足工業界需求的同時,WeNet 得到了用戶的廣泛認可——被譽為“產品化集成度最好的框架”。據不完全統計,目前已有數百家公司采用 WeNet 進行語音識別產品研發,或借助 WeNet 設計思想來構建自己的語音識別系統。這其中包括幾十家互聯網和其他垂直行業的知名頭部公司,其應用范圍涵蓋了智能車載、智能家居、智能客服、音頻內容生產、直播、會議等大量語音識別應用場景。
同時,出門問問也為企業使用 WeNet 部署語音識別提供商業化和技術支持。企業皆可基于自己的數據和服務體系,擁有私有化系統。正是由于產業界的迅速發展,使語音識別在算法層面越來越通用和端到端,使其系統復雜度和使用門檻大幅度降低,在這種情況下AI系統開源或是一個大趨勢。
“語音識別只是數字經濟和AI產業中的一個細分領域,WeNet 是開源星河中的一顆新星,我們希望通過 WeNet 能夠結合很多開源力量和社區力量,把系統模型和私有部署做到最極致,中國科技創新和AI產業發展需要更多這樣的星星之火,讓AI開源成燎原之勢、為國為民。”李志飛呼吁以開源生態促進人工智能產業穩健發展。
聯合發布人工智能擔當宣言 構建負責任的AI
在本次大會的人工智能產業治理主題論壇中,出門問問等數十家研究機構與創新企業聯合北京智源人工智能研究院發布國內首個《人工智能產業擔當宣言》。宣言強調科技企業在推動人工智能自律自治穩健發展中積極承擔社會責任。
人工智能的發展是為了人類。宣言首先強調,人工智能系統的設計、研發、實施和推廣應符合可持續發展理念,以促進社會安全和福祉為目標,以尊重人類尊嚴和權益為前提。其次在技術能力方面,宣言提出要最大限度確保人工智能系統安全可信,提高魯棒性及抗干擾性,要增強算法透明性和可解釋性,同時保障各方權利和隱私,對用戶數據提供充分的安全保障。
作為中國領先的人工智能公司,出門問問倡導積極探索和構建開源開放協作的共享機制,創建自主可控的語音開源工具,在技術創新的基礎上構建企業間深度合作的伙伴關系,共同確保人工智能產業的健康發展。
出門問問創始人兼CEO李志飛表示,讓人工智能更好地服務于人類是行業共同的目標,科技從業者更應感受到科技治理的緊迫性和使命感,擁抱開放共享,共舉科技擔當。