“要在產業中充分發揮智能的作用,我們需要把數據、算法、知識進行高度融合。對產業賦能,還需要平臺、工具、流程的自動化。這樣,我們才能夠實現產業智能解決方案的規模化。同樣的方法論、解決方案既可以用于解決一個行業的高價值難題,也可以為更多的行業賦能。”5月26日,國雙CTO劉激揚出席“2019全球人工智能技術大會(GAITC)”,在分享主題演講“領域知識與深度學習相結合構建實用級產業智能應用”時如是總結。
一起來領略國雙CTO的現場演講金句吧~
干貨滿滿,不容錯過!
1.知識和深度學習模型是解決問題的兩種資源
我們總結出來的第一條經驗是把知識,特別是行業知識、經驗,領域知識,以及深度學習的模型當作解決問題的不同資源,在面對任何一個問題的時候,根據問題的特征,用不同的資源組合來解決問題:比較簡單的問題可以用知識去解決;還有一些問題可以用深度學習實現;但是,大量有價值的產業領域問題是需要用專業知識和機器學習一起去解決,形成整合的解決方案。不同的解決方案會產生不同的成本和效果。
2.知識+深度學習解決現實問題的模式
我們解決產業領域問題的模式分成這樣幾個步驟:第一步是分解問題,看看要解決這個問題應該有些哪些環節;第二步是在各個環節搭建方案,有的環節需要用知識,有的環節需要用深度學習,或者需要把這兩個資源甚至其他的資源組合起來;第三步,把整體方案投入到生產當中,去預測和驗證;第四步,根據驗證過程的數據優化解決方案,并把獲得的數據反饋到系統當中,既豐富了知識,又提升了解決問題的準確度或性能。所以我們的解決方案是一個閉環,在這個閉環里面,把知識、深度學習、以及解決問題的其他資源充分融合在一起,形成最佳的解決方案。
3、層層遞進的3種應用范式
國雙認為知識與機器學習相結合的過程有三種不同的應用范式,從簡單到復雜,從單一到多元,依次分別是:知識確定模型、知識嵌入模型、知識融合模型。
4.知識確定模型:數字營銷案例
首先,如何利用行業知識幫助機器學習找到它要學習的對象。以數字營銷領域為例,我們與行業專家合作搭建了標簽體系。通過標簽體系,機器學習就知道在文本里面捕捉哪些內容,明確要學習的對象。利用專家知識構建知識體系、構建標簽體系,幫助深度學習建模,構建解決細粒度情感分析的深度學習網絡。不論要分析的是汽車、快銷還是餐飲等行業的文本,這套方法都可以快速復用。國雙運用這個解決問題的框架,在2018年的AI Challenger大賽中,獲得了第三名。
5、知識嵌入模型:智慧司法案例
其次,知識嵌入模型,基于場景從知識庫獲取專業領域知識,再通過編碼嵌入模型提升效果。以智慧司法領域為例,我們從裁判文書中抽取每一個案件的要素,再根據對法律法規的理解形成知識圖譜。犯了什么罪,觸犯了什么法律,有沒有自首…,這些特征都需要嵌入到系統里面去。我們將這個模型應用在法律文書解析、智能文書生成、定罪量刑輔助、等智慧司法產品中,優化了傳統審判流程,提高了法官的工作效率。在去年舉辦的首屆中國“法研杯”司法人工智能挑戰賽中,國雙獲得了冠軍。
6、知識融合模型:油氣勘探案例
第三,知識融合模型,基于專家知識設計處理框架,使用模型構建框架中的各個環節。以油氣領域為例,我們把專家經驗和領域知識運用到解決問題的框架中去,而后用人工智能的系統模型來做特征分析、建模,來驗證這個模型是不是有效果,大大縮短了工作周期。通過這套系統,我們已經將老井潛力層識別誤差率從60%降為20%。
國雙在數年行業實踐中有很多體會,
為什么一千人的公司可以做這么多的事情呢?
這是國雙的技術棧。國雙在相應的服務領域里引進了行業專家,與數據科學家和數據工程師密切合作:數字營銷領域有服務這個領域多年的數字營銷專家,司法領域我們聘請了多位法官、律師一起工作;在油氣領域里面邀請了在油氣行業里面從業幾十年的資深專家。同時,我們還在努力地搭建完善國雙產業智能平臺,在面向各領域的應用中共享國雙的大數據和產業智能的技術能力,讓我們可以為各行各業賦能。