每一次技術革命,都是一次生產力與生產關系的大變革。AI時代呼嘯而至,深度學習、強化學習、圖神經網絡顯示出強大的技術張力,但為何在產業應用落地中又會遇到種種挑戰,讓不少產業從業者擔憂——AI到底離我們有多遠?
黃埔學院,“首席AI架構師”的搖籃,對于這一產業之問,自然也是學院講師、學員必須回答的問題。
得其法者事半功倍,不得其法者事倍功半。11月4日,百度黃埔學院第四期開啟為期6周的線上預科班,通過AI思維、AI方法、AI技術、AI選擇等環環相扣的課程,讓大家“得法前行”,找到新技術推動產業升級的全流程方法論。
(黃埔學院第四期預科班課程)
跨上AI的戰車,從技術邏輯和商業邏輯雙面看
跨上AI戰車的第一步,企業首先需要確認現階段是否適合進行AI轉型。如果對AI本身的邏輯缺乏深入的理解,究竟能不能使用、如何使用AI去落地就成了難題。結合飛槳實踐落地過程中各行業AI應用案例,企業想成功應用AI系統,要遵循技術和商業邏輯兩大原則。
(AI應用可行的兩大前提)
從技術邏輯來看,AI應用作為一個決策系統不是單獨存在的,它包含完整的上下游。上游是我們采集的數據信息,下游則是我們要執行實施的自動化。因此,當企業發現所在的應用場景上下游都完備,只需AI決策系統時,企業AI場景應用落地的步伐就可以加快。像如今互聯網、金融領域AI應用最先落地,重要原因便是其產業鏈上下游完備。
而AI要滿足的商業邏輯前提是對關鍵業務的效率提升要大于付出的成本。
目前,中國無人超市的技術已非常成熟,但依然沒有在中國看到遍地的無人超市,就是因為今天要實現無人超市的技術所花費的成本高于兩個人力成本。所以無人超市這個技術雖已經實現了效率上的大幅提升,但是因為效率提升程度不及花費的成本,所以目前還只能是實驗田。
所以,快速跨上AI戰車還需要考慮背后的商業邏輯。企業之所以運用AI技術滿足我們今天的商業發展,是想提升企業自身的關鍵業務。同時“成本”作為企業發考慮的重要因素之一,也成為選擇AI應用的關鍵項。總結來看就是,選擇AI技術提升效率不能只“幫扶”企業效率提升一小步,但卻要“冒險”付出大成本。
——《跨上AI的戰車》
從學術研究到產業落地“多法結合”推動整個系統準確率提升
要想習得真經,企業除了明白是否適合AI轉型,還需要切實的了解如何運用AI實現應用。我們發現在產業落地這個過程中,通常會面臨三大問題:
1、 數據的規模和平衡性
2、 模型的泛化能力及魯棒性
3、 場景領域的長尾、變化需求
(面對AI技術難題的正攻法思路)
我們有很多學術的方法去解決、突破技術難題,大家都可以去嘗試。也可以通過各種論文,去了解先進前沿的技巧。但還有很多時候,整個系統的準確率并不是單純的一個算法模塊的準確率。可能你需要嘗試配合一個傳統算法,或者是配合一個流程的設計,甚至必要的時候可以配合人員操作的兜底方式來協同配合,達到真正的場景可用。
這里提到一個信任機制的建立,比如醫療場景,如果是一個全自動的系統,患者能不能接受這樣一個機器直接給出結論?很多時候我們當然希望它是一個全自動的系統,但是這里往往要考慮的就是一個場景的容錯范圍,人命關天,就完全不能弄錯了。還有一些零售結賬的場景,質檢上需要9個9,很多這樣的場景,可能目前還是需要一個human in the loop。
——《產業計算機視覺落地難點與應對》
掌握主流和全面的技術復雜任務先拆分簡化,抽象問題是關鍵能力
當遇到復雜場景的問題時,將其拆分成一些小的任務與目標。因為小的任務相對簡單一些,而復雜任務相對難一些,把復雜任務拆分成小任務本身就是一個技術建模的過程。拆分成小的任務之后,針對每一個小任務,我們都可以進行非常細致的技術選型。
(抽象問題的拆分舉例)
這個其實在我們實際場景中是非常常用的,因為真實的業務場景它可能不是一個任務,而是眾多任務。比如說文本糾錯、復雜的問答系統、復雜的對話系統等,它可能包含了多個子任務。
——《產業NLP任務的技術選型與落地》
很多油田電力和工礦企業,它里面存在很多傳統的機械指針式的儀表,這種儀表與數字儀表不同,機械表無法將表具的讀數實時發送到監控系統,需要人工進行讀表檢查,這種表大部分是用來做監控用的。
比如說監控設備的運行是否正常,而且這些表大部分是部署在廠區的各個位置,為了監測儀器是否工作正常,或者系統是否工作正常,工廠或者是一些企業都要派大量的人力到現場去進行巡檢,檢查表的讀數是否正常,進而去判斷整套系統或者儀器是否正常,這樣的話就會消耗很多企業的人力成本,而且每次巡檢周期長,頻次非常低。實際解決問題之前,需要清晰的梳理出表計識別項目會面臨到的難點問題:
1、 表具種類多,相似度大,樣本采集困難且不易分類
2、 在復雜環境下,讀數精確度不易保證
3、 室外環境惡劣導致讀數難以識別
(技術方案拆解:目標檢測+語義分割)
所以我們沒選擇直接識別的方案,因為直接識別會遇到多尺度的問題。我們選用了更為復雜的方案:目標檢測+語義分割,當我的讀數難度變小了,精確度會得到更好的保證,這是最核心的。同時,因為模型復雜度的提升,我的推理時間變長了。不過沒關系,因為在表計巡檢的場景里,對時效要求并不高。所以很多時候,大家問這樣的方案好不好那樣的方案好不好,還是要首先去回答自己的問題,你的場景到底有什么樣的限制條件。沒有最好,只有最適合。
——《能源電力傳統儀表綜合無人巡檢》
Last but not least,優選工具
京東物流最開始自己要做快遞單識別,其工程是非常復雜的。中國的四級地址,有的用戶名字叫“一個橘子”,區號和電話號碼連在一起,還有大量的附言詞。在這之中我們要做大量的分詞、文本解析、結構化處理、信息的補全、消歧等,最后進行語義相似度的打分和匹配。有監督+無監督的方法結合去應用。整個團隊花了很長的時間,去建立一整套的系統。
(京東物流快遞單識別所使用的ERNIEAPI)
完成了這些工作,跨過了這些坑之后,當我遇到百度文心ERNIE,瞬間覺得豁然開朗,覺得它比我更懂我應該做什么。剛才說的所有那些很復雜的東西,從以前的Framework轉到飛槳以后,前面三個API其實就搞定了。最后一個API地址識別,我畫了小太陽,對我們的工作效率提升帶來了很大的幫助。
很多應屆生同學他們進來就能很快地上手。對于他們來說,一開始覺得這件事太難了,可能很難堅持下來。在新同學還不是特別懂深度學習的原理情況下,能夠把整個技術做出來,能夠有結果,這是件非常讓人興奮的事。
——《京東物流快遞單智能識別》
聽完這些課程,你是不是對AI產業落地有了不一樣,亦或是更深刻的認識?是不是也想加入其中,成為推動產業落地的AI架構師?
對于從黃埔學院畢業的135名學員,授課老師們一直在強調“AI架構師”要具備從復雜的業務問題抽象出AI技術問題的能力,要對主流AI訓練和部署落地流程有充分的掌握,結合相關算法技術和業務場景需求,做出恰當的AI技術選型,設計高效合理、并具有充分預見性的實現方案。還要在業務場景下建立起以AI技術應用為核心的完備技術體系,充分發揮AI技術對業務的助力作用,對技術團隊產生很強的技術影響力。
置身其中的技術人都說,AI落地不是學術問題,而是創意問題。關鍵是,如何有創意的使用AI技術。
12月1日,百度黃埔學院第四期開放線下正式班申請,需要你帶著“AI項目開題報告”有備而來,與百度T10+架構師一起,面對面探索產業智能化升級的新場景、新未來。