AI席卷百業,作為AI時代的兩個主要入口,智能語音產業已經進入爆發期,計算機視覺在新基建的推動下正在成為AI落地規模最大、應用最廣的領域。
在語音和文本智能領域,無論是面向公有云市場的七陌云客服,還是面向大中型機構的容CC,容聯一直在引領行業創新,構建了基于智能客服、智能聯絡中心的商業閉環。
在視覺領域,容聯又是如何在原有能力上做延伸和商業化落地的?近日,CPS中安網對容聯云通訊AI視覺解決方案總監陳開仡進行了采訪,并關于通訊服務、AI技術、智能化視頻監控等話題進行了交流與探討。以下為訪談內容:
Q:容聯云通訊的核心技術和產品優勢主要集中在哪些方面?容聯提出的視覺智能服務與傳統視頻監控的區別是哪些?
陳開仡:當語音和文本、視頻智能化在通訊業務中的應用已經大量普及的時候,容聯意識到當下市場對于圖像識別具有大量的需求,因此容聯開始了計算機視覺(CV)的調研和研發。
由于CV與NLP深度學習技術上具有相通性,并且容聯擁有NLP引擎相關技術的積累,因此迅速掌握了CV場景的相關技術。
容聯的優勢在于針對特定場景的數據進行增強處理,將AI和傳統技術結合,以及前沿技術工程化的能力。
比如說準確率,以智慧工地為例,容聯的“慧眼”視覺分析平臺可結合工地復雜現場做全方面檢測,做安全帽佩戴檢測時容聯產品準確率可以超過90%。
AI算法極度依賴數據,但是很多情況下有效的數據采集又比較難,容聯自有的數據增強處理技術可以在素材比較少的情況下獲得比較好的效果。
深度學習技術十分依賴訓練數據,且深度學習輸出結果中一般都有“閾值”限制,實際應用中,很難設定適用于所有場景的統一閾值。
目前AI技術在落地過程中仍然受到數據量、數據質量、標注成本、數據域變化等問題的制約,單純依靠深度學習模型難以解決復雜場景下的實際CV問題。
容聯具備一系列針對實際應用場景的工程化優化手段,包括圖像的時序分析機制、檢測目標屬性過濾機制、目標跟蹤及ReID機制等,提高算法在落地應用時的精度。
除了技術上的壁壘,容聯產品一個重要的壁壘還是其在行業中的積累,因為做某個行業的視頻識別本質上就是還是拼行業數據的積累、以及對行業的理解力。實際操作中,準確洞悉行業痛點是一個周期很長且很重的事情。
另外關于視覺智能服務與傳統視頻監控的區別,傳統技術的一般特點是通用性較強,容聯提出的視覺智能服務結合深度學習后,可在傳統視頻監控的基礎上,得到神經網絡模型輸出的具有語義信息的結果,在保持通用性的同時提升精度。
例如,目標跟蹤場景,利用深度學習檢測圖像中特定種類物體位置,結合傳統背景建模、幀差法、光流法等,達到通用性與專用性的平衡協調。
Q:容聯 CV 的商業化落地聚焦在哪些行業?這些行業關注的重點是什么,解決了什么問題, 提升了什么價值?
陳開仡:目前容聯聚焦的行業有智慧社區、加油站、化工、城管、衛監、明廚亮灶等行業,這些行業的重點各有不同。
以監控場景為例,50個攝像頭,每天24小時,產生的視頻量1200小時,一個月就是36000小時。即使監控崗位人員三班倒也無法做到100%覆蓋,期間很容易漏過一些突發事件,事發后再去追溯會很困難。
再比如制造業工業產線場景,工人有規定的操作規范,規定的位置,通常會有監管人員進行監督。但是產線很長,又在不停運動,監管人員很難覆蓋全部工位進行督導。產品因操作不當產生的瑕疵會直接影響用戶評價,對企業造成不良的影響。
我們通過智慧視覺算法,對以上行業的關鍵場景進行智能的監管,提升了管理的效率、覆蓋率,也提高了安全管控水平,同時降低了風險并且降低了監管成本。
Q:在這個市場上有做硬件的廠商,有做整體解決方案,有圍繞最終用戶的系統集成商,容聯跟產業上下游的廠商的區別在哪里?有哪些合作?
陳開仡:容聯采用的是AI能力+垂直行業+服務的模式,并且在多個領域都有大客戶積累,善于深挖用戶場景,發現痛點;單個用戶的痛點可能是行業痛點,針對痛點進行定制化方案,將方案沉淀為行業方案,提升整體行業智能化水平是容聯的目標。
另外容聯的產品設計秉承松耦合原則,模塊之間支持靈活的拆分重組,可以單獨提供,或跟上下游廠商產品進行靈活融合,根據客戶的需求進行方案的定制。
Q:了解到容聯的視覺算法商城很豐富,現在還有正在挖掘的場景和算法,容聯未來還關注到哪些是沒有被開發的行業需求?是否可以簡單談一下未來趨勢。
陳開仡:目前還有一些行業的需求還未被開發,例如衛監、教育、國土資源、軍工、港務、物流等等。
關于未來趨勢的預測從技術角度來講:一個值得關注的未來趨勢是從識別到理解,套用古人的說法就是從知其然到知其所以然。
過去十多年,計算機視覺在識別方面取得了顯著的進展,但是現在僅僅進行識別遠遠不是我們所期望的,或者說只是邁出了智能化的第一步。
僅僅有結果對企業對行業的價值仍舊有限,可以對結果進行解釋,價值會更大。把物體和物體,物體和環境的聯系建立起來,有了這樣的從基本屬性到對象直至環境的關系,就有可能實現從知其然到知其所以然。
未來最重要的趨勢就是從無需知識支撐的識別到需要知識支撐的理解,做到知識圖譜的效果,或者可以稱之為“計算機視覺圖譜”。
從市場規模角度而言:目前計算機視覺行業增速持續保持較高的增長趨勢,深度學習和卷積神經網絡技術的推動著計算機視覺技術,同時也驅動著整個人工智能行業的迅速發展,計算機視覺技術已在各行各業有著舉足輕重的作用。
伴隨著技術成熟度提高,硬件性能的飛速提升,人臉識別、物體識別、工序識別、復雜場景識別等分類、分割算法不算提升精度,未來將有更多的場景能夠應用計算機視覺技術,計算機視覺企業應在強化技術打造的前提下,發掘更多垂直領域需求,解決企業痛點。
Q:安防行業受智能化、信息化技術影響,邊界逐漸模糊,泛安防成為行業未來趨勢,眾多巨頭跨界入局,行業競爭加劇,容聯面對如此激烈的市場格局,會如何應對?未來的戰略和規劃會做哪些調整?
陳開仡:泛安防時代,無論是技術還是市場,安防行業不再是一個封閉的行業。
首先是關于產品升級,容聯將側重于三個方面去創新:
第一,讓安防從被動防范到主動預警,從“看”變為“做”;利用視覺智能把安防體系從被動的記錄、檢查,逐漸轉變為自動剖析、主動預警或即時處置。
第二,讓智能安防云端化。安防行業面對的一大問題就是場景“碎片化”,這是一個不可忽視問題,大量的碎片場景帶來大量的數據積累,安防體系中存儲的數據量級成指數增長,這時候應用會逐漸轉向云端進行處理,將復雜任務云化,既可以增加處理效率,也可以合理的進行資源的分配,容聯也會針對云端領域的應用場景做深入的研究。
第三,應用場景落地。安防行業已從前兩年關注各類AI算法的功能和性能,轉向重視算法與具體業務的匹配銜接,追求將AI性能落實到具體業務應用上,形成具體的解決方案。容聯將致力于解決各種垂直應用場景。
同時隨著5G、AI的興起,外加政策的扶持,我們認為邊緣場景將會為安防行業帶來新鮮活力,所以云、邊、端一體化也是我們一個重要的產品規劃。
據悉,11月5日,「容聯云通訊」宣布完成 1.25億美元 F輪融資,由中國國有資本風險投資基金領投,新東方產業基金、Mirae Asset(未來資產)、藍藤資本和CloudAlpha等戰略及財務投資方共同參與。騰達資本、花旗環球金融亞洲有限公司和招商證券(香港)擔任財務顧問。
這是國內云通訊領域迄今為止規模最大的一筆私募股權融資。
容聯表示,本輪融資完成后,容聯將進一步加大在智能通訊云服務方向的技術研發投入,提升產品厚度及競爭壁壘;同時持續創新,擴容邊界,在5G、新基建的浪潮中,更好地助力企業和政府組織實現數字化改造與智能化升級,推動中國企業通訊市場變革。