11月初,AI語音行業“元老級”選手云知聲遞交科創板上市招股說明書,計劃沖擊“AI語音第一股”。
根據招股說明書,云知聲擬募集資金91162.75萬元,用于人工智能技術中臺建設、面向物聯網邊緣計算的人工智能芯片研發平臺建設和基于人工智能技術的智慧醫院解決方案建設等三個項目,目前已進入問詢階段。
在競爭激烈的AI語音賽道里,云知聲為何能當沖擊科創板“AI語音第一股”?
白熱化競爭下的造芯實力
作為一家AI語音公司,能造芯是云知聲科技硬實力的關鍵。
最初AI語音公司們決定自研芯片,有觀點認為這只不過是AI芯片市場被過度炒作之后的一場表演。事實上,得益于快速增長的語音市場需求和AI語音算法的成熟,造芯是AI語音自然發展的趨勢,如今也已成為各大AI語音公司提升競爭力的關鍵。
快速增長的市場需求單從智能音箱的出貨量上就能看出,據國際咨詢機構IDC發布的《2019年中國智能音箱市場出貨量》報告顯示,中國2019年智能音箱市場出貨量達到4589萬臺,同比增長109.7%。根據中商產業研究院預測,盡管2020年受疫情的影響,我國智能音箱市場出貨量也預計達到5041萬臺。
隨著智能音箱井噴期而來的,便是通用芯片向專用AI語音芯片的過渡。中小型AI語音公司自研芯片是機會也是挑戰。用云知聲創始人兼CEO的話講,“不做芯片就是死路一條”。
另外,包括智能音箱在內的智能設備,更多是在云端實現語音交互,存在語音延時和數據安全問題,端側智能則會讓用戶在使用智能設備時有更好的體驗。
擁有8年AI語音行業和技術經驗的云知聲很早就意識到自研芯片的必要性和可行性,在已有的硬核技術根基之上,于2015年就啟動造芯計劃,并于2018年5月就推出了首款AI語音芯片“雨燕”,成為行業內首家宣布造芯并成功量產的AI語音公司。
據悉,“雨燕”主要用于生活場景下的白色家電、智能音箱及中控,工作狀態下功耗小于800mW,延遲低于300ms。
云知聲芯片性能對比
緊接著,2019年,云知聲進一步擴大產品可適配物聯網設備范圍,陸續推出車規級芯片“雪豹”和面向家居領域的第二款升級版芯片“蜂鳥”系列,啟動具備“圖像+語音”多模態交互功能的芯片“海豚”的研發。
截止目前,“雨燕”、“蜂鳥”系列均已量產,既直接對外銷售,也自用于部分公司模組和整機類產品,“雪豹”已進入產品穩定性測試及車規階段。
善用新技術的“少數派”
造芯并不是云知聲的目的,而是手段。除了芯片,云知聲還有很多硬核技術,而且在很多時候,云知聲都是那個率先將新技術引入行業的“少數派”。
云知聲最先在2012年率先將深度神經網絡(DNN)應用于商業語音識別系統。深度神經網絡的前身是多層感知機,層數的多少直接決定其對現實的刻畫能力,引入DDN算法能夠有效提高識別率。一般而言,在語音識別中,4層網絡就可以被視為“深度”,而在圖像識別中多為20層以上。
引入DNN之前,云知聲的語音識別引擎基于傳統統計模型,準確率達到85%,甚至超過科大訊飛,不過仍然沒有達到可以商用的水平。云知聲率先引入DNN,推動了語音識別引擎的可商用性,DNN也成為眾多企業的選擇。
此后,云知聲持續進行前沿算法的商業實踐,在卷積神經網絡(CNN)、回歸神經網絡(RNN)、端到端序列建模、生成對抗網絡(GAN)、注意力轉換模型(Transformer)、雙向編碼表征轉換模型(BERT)、知識蒸餾(KD)、自監督學習(SSL)等主流技術方法的引入上,都是業界最早的實踐者之一。
另一個“少數派”的動作是在2014年率先提出“云-端-芯”的產品戰略,這一戰略的意義在于是對眾多語音核心技術的模塊化梳理和整合,面對市場需求時擁有快速產品化的能力。
AI語音的核心是實現人與機器甚至是機器與機器的無障礙交流,因此AI語音的實現可以按流程拆分為對語音信號的拾取和重建,機器對語音所含信息的綜合理解,以及類人[Y3] 自然語言表達,即聲音感知、認知和生成。
順利完成這些步驟,需要靠包括回聲消除、降噪增強、語音喚醒、語音識別、聲紋識別等核心語音技術的支持,這些技術的種類復雜又割裂獨立,想要提高運行效率就需要找到最合適的方法將其結合起來。
“云-端-芯”戰略就是行之有效解決方法,邊緣側芯片以更低的成本和功耗提供硬件算力需求,軟件為不同類別的終端設備做適配,形成相對標準化的“交鑰匙”方案。
當邊緣側芯片無法處理更復雜的語音和語音問題時,就需要借助云端高性能計算服務器來完成。云知聲自主搭建的智慧云平臺,以公有云的形式或者根據客戶特定需求進行私有化部署,搭載各項核心技術引擎解析用戶需求,將用戶需求與云端服務對接。
矩陣式產品建立壁壘
率先引入DNN等先進算法和“云-端-芯”戰略之后,云知聲在家居、醫療等多個細分場景均有較為成熟的落地方案,這是云知聲沖擊科創板“AI語音第一股”的底氣。
最初,云知聲面向住宅和酒店場景,以空調語音模組為突破口,同格力等家電龍頭企業合作,于2016年率先在白電領域落地智能語音模組,確立市場地位。
同年,云知聲與北京協和醫院合作,率先在國內落地醫療轉寫解決方案并被快速推廣,目前已在100多家醫院上線使用,超過500家醫院測試使用。
在建立醫療知識圖譜方面,借助于合作醫院以及自由專業醫生團隊以及原有的自然語言處理技術,云知聲構建了大規模全科室的醫療知識圖譜及相關應用平臺,并且被多家三甲醫院采購。基于醫療知識圖譜和預訓練語言模型,云知聲歷經1年時間,在400M的語料上完成醫療實體識別模型的訓練,相應的技術在2020年CCKS評測任務“面向中文電子病歷的醫療命名實體識別”中獲得冠軍。
正如希望通過研發芯片提升商業化能力,云知聲也憑借產品升級提升競爭力。只提供類似于智能語音會議系統、智能語音客服等通用的單一語音工具,在競爭激烈的語音賽道上并無區分度,于是云知聲將單一產品升級為綜合解決方案,面向酒店、社區等場景規模交付。
招股說明書顯示,云知聲依托“云-端-芯”產品中臺,形成了智能語音交互產品、智慧物聯網解決方案、人工智能技術服務三條業務線,數十個產品類型的矩陣式產品結構。其中智慧物聯網解決方案就是云知聲在場景落地方面的升級,并且從此次招股說明書中擬募集資金的用途方面也可以看出,這也將是云知聲未來的重點建設內容,以此建立行業壁壘。
那么,云知聲的智慧物聯網解決方案究竟如何?
基于原有的單一產品,以智能語音和控制為核心,云知聲提供面向酒店、社區和醫院的智慧解決方案且均有落地案例。
智慧酒店整體解決方案支持在入住、電梯、客房、客控、客需、公區、退房等環節的智能化升級;智慧社區實現對社區車輛、人員、環境的全面監測和精準管理,打造安全、智能、高效的社區環境,目前已在昆明、天津等新房社區中落地使用。值得一提的是,云知聲同世茂進行合作,依據其智慧酒店和智慧社區解決方案與世茂共同探索“智慧+地產”新模式。另外,云知聲攜手建發,共建新基建新標桿。
智慧醫院提供面向診前、診中、診后全流程環節的升級,包括導醫機器人、遠程會診系統、個人健康助理機器人等服務,濟南市千佛山醫院、鎮江市第四人民醫院均有依托云知聲的方案做選擇性升級。
在最重要的診斷和手術部分,云知聲基于最先進的深度學習技術開發了手術和診斷自動編碼系統,其中手術編碼系統用到的技術獲得2019年CHIP評測冠軍,診斷編碼相關技術獲得2020年CHIP評測亞軍。同時和中科院自動化所合作發表多篇關于診斷編碼的頂級會議論文。在自動編碼系統基礎上云知聲開發了CHS-DRGS入組系統,該系統除了能給出當前病歷的模擬入組,還能對首頁的填寫錯誤進行修正,給出修正后的推薦入組。
值得一提的是,近期國家醫保局緊密出臺DRGS 、DIP等系列政策,雷鋒網(公眾號:雷鋒網)了解到云知聲正響應這一政策需求和順應行業趨勢,面向醫保的病案首頁質控和直接面向控費的報銷稽核兩方面,延續和拓展既有的病歷質控產品線產品,目前已實現落地。這將大大拓寬云知聲醫療業務產品矩陣,進而打開突破現有的智能語音及智慧醫院的市場空間的天花板。
目前,云知聲的智慧化方案已經落地北京、天津、廣州、南京、長沙、珠海、福州、霞浦、武夷山等多個城市。此外,雷鋒網了解到,云知聲近期還與“中國房地產開發企業50強”之一建發公司展開合作,打造“建發·云養地產”項目,實現住宅智能化。
云知聲智慧社區方案
顯然,云知聲的發展早已不再局限于單純的語音交互產品,而是通過向智慧物聯網延伸拓寬市場,建立其專屬的行業壁壘。
小結
AI語音“行業元老”云知聲,憑借其靈敏的產品嗅覺和行業前瞻性,從算法到芯片,到“云-端-芯”,再到在各個細分場景的落地,在競爭激烈的AI語音行業走過8年,擁有實打實的競爭力。若成功上市,云知聲將進一步升級自研芯片和物聯網解決方案的能力。
這一次,全棧硬核的AI技術產品的云知聲能否成功沖擊科創板“AI語音第一股”?我們拭目以待。