9月1日,2022世界人工智能大會(WAIC)在上海順利開幕。本屆大會以“智聯世界,元生無界”為主題,匯聚了全球人工智能、元宇宙等前沿科技領域的精英代表和最新成果。
共達地作為AI平臺化應用的積極探索者,攜新品“GDDi自動化AI訓練平臺3.0”(以下簡稱“GDDi3.0”)重磅亮相世博展覽館(展位號:2FA104),吸引往來觀眾駐足體驗。作為行業首個可供“小白”使用的專業AI算法訓練平臺,觀眾可通過 GDDi 3.0體驗零代碼的專業算法生產過程。在數十分鐘內,通過簡單三個步驟,從0到1訓練一套算法,并在現場一鍵部署,實時互動,檢驗算法精度。
超大規模+精細化的AI落地趨勢
2019年我國AI攝像頭出貨量為684萬個,預計2022年出貨量達3458萬,年復合增長率超過70%。但深入到應用場景來看,AI技術的滲透率極低。以落地量最大的安防市場為例,2020年安防攝像頭AI滲透率不足5%,其余場景包括制造、醫療、教育等領域的滲透率則更低。
以作為國民經濟重要支柱的制造業為例。中國是全世界唯一擁有聯合國產業分類中全部工業門類的國家,在世界500多種主要工業產品當中,中國有220多種工業產品的產量占居全球第一。如果計算所有細分工業鏈條中的完整的工業制品,數量則將如浩瀚星辰般龐大,對應的AI算法需求也將不可估量。但眾所周知,AI在工業制造領域落地極為困難。
細究背后的原因,一方面是算法生產的專業門檻極高、周期極長,成本極高,一個成熟算法的生產需要耗費一支15人算法團隊數月時間,另一方面是工業制造場景細分極多,對算法要求越來越精細。井噴的碎片化需求與高成本低效率的生產方式之間的矛盾,成為AI與產業聯合的死結。
這與共達地在業務一線獲取的信息一致。作為專業的算法公司,共達地對接的需求已經遠非人臉、車牌這類傳統型業務,而是安全帽的識別、反光衣的識別、火焰煙霧的識別等滲透到各類細微場景的需求。且以上場景的需求還能再細分,以火焰識別為例,森林大火和加油站的煙頭識別是兩種完全不同的算法,場景的光照明暗,物體在攝像機里的尺寸大小,都會影響算法模型的構建。
這些困境共同導致,當前計算機視覺領域90%的市場增長來源于人臉識別、非機動車識別、OCR識別這三大領域。也就是說,在這TOP3領域外的其余計算機視覺算法需求,尚處于待開發、待滿足的狀態,成為“隱形的長尾市場”。
“GDDi自動化AI訓練平臺3.0”亮相WAIC
從蒸汽時代到信息時代,人類歷史上的每一次技術革命,都引發了生產力的指數級增長。但從目前的情況看,AI還只是一種相對低效的生產力。訓練一套算法需要15名專業算法工程師數月時間,這種生產效率現狀決定了,AI算法是昂貴的、高門檻的,無法真正成為有普適意義的經濟動能。
針對當前供需之間的矛盾,共達地推出“GDDi自動化AI訓練平臺3.0”(以下簡稱“GDDi3.0”)。如果把人工智能比作新“電能”,共達地打造GDDi3.0則是一項面向千行百業的電能“平權計劃”,通過生產工具的升級實現生產能力的平權,提升生產效率、降低應用成本,加速實現人工智能的規模化商用。
01-門檻低,人人皆可AI
與行業上普遍將AutoML用作專業算法工程師的效率工具不同,GDDi3.0是一套可供政企客戶、集成商、業務經理、產品經理等非專業機構和人士使用的行業級生產工具,支持用戶以零代碼的形式訓練可商用算法,門檻極低。
用戶只需在定義場景需求后,通過GDDi3.0平臺完成1)上傳數據;2)選擇芯片;3)一鍵部署,三個步驟即可訓練一套適配業務需求的算法。在這個過程中,原本依賴專業算法工程師的數據評估、模型搭建、超參調優、Loss 函數與 Head 等“黑盒”工作,都將由GDDi3.0自動完成,讓原本像打造奢侈品一樣復雜、繁瑣的算法生產工藝,變得和操作流水線一樣簡單。
02-精度高,能力超過專業人員
GDDi3.0支持99%計算機視覺場景,這意味著絕大多數客戶的CV算法需求,GDDi3.0都能滿足。且實驗數據顯示,通過GDDi3.0訓練出來的算法平均精度超過92%,表現優于人類算法工程師。
除此之外,在應用過程中,GDDi3.0還能回傳終端數據,實現以天為單位的快速迭代,讓算法深入場景,實時成長,越用越精準。
共達地算法訓練平臺與其他方案的算法精度比較
03效率高,算法規模化應用基石
供需矛盾背后的核心是生產效率和應用成本的問題。為驗證GDDi3.0平臺的開發效率,共達地曾安排2名產品經理利用2個月的工作“業余”時間,借助GDDi3.0 完成近百個長尾場景算法的訓練,且訓練精度均達到行業交付標準。同樣的工作量,在傳統人工智能公司,需要一支專業算法工程師團隊數年時間。
從“數人數年”,到“一人數月”,生產效率的大幅提升帶來的是算法應用成本的大幅降低。業務數據現實,通過GDDi3.0可使得解決方案整體成本降低90%,這為規模化滿足長尾市場的算法需求提供了現實基礎。
04部署快,與適配100+主流芯片
在傳統生產模式下,算法主要面向云端服務器設計算法結構,應用到終邊端時,不僅需要花費大量工時做算法遷移,算法與芯片結構的不適配,還會導致實際算力利用率小于10%,算法精度下降70%左右。
GGDi3.0通過提前適配寒武紀、華為、海思、英特爾、英偉達等百余款主流芯片,使得基于訓練平臺生產的算法可以提前靈活適配云端服務器、邊緣端AI BOX和終端攝像頭等硬件形態,并在5秒內一鍵完成部署,讓應用環節極簡化。
共達地AutoML自動化AI訓練技術賦能千行百業
事實上,在發布新品GDDi3.0前,共達地已經基于領先的產品化、商業化能力,將AutoML自動化AI訓練技術應用到多個行業。目前,共達地主要面向行業提供三類服務:一是算法的定制,主要面向需求量小、完全不具備AI能力的客戶;二是“算法商城”,即市面上的主流算法需求,可通過共達地算法商城直接采買,一天內即可部署;三是平臺服務,即客戶可通過共達地AutoML自動化AI訓練平臺自行建設算法生產能力,適用于算法需求量較大且有一定AI基礎的客戶。除此之外,共達地還可以輔助提供需求分析、數據服務等,以更完備的產業生態助力客戶轉型。
以平臺服務為例,共達地基于AutoML自動化AI訓練平臺與專注于計算機視覺深度研發的人工智能公司千視通達成合作,千視通使用共達地AutoML自動化AI訓練平臺快速生產算法,并通過其深耕多年的行業渠道,將算法集成為行業解決方案交付給終端客戶。基于自動化AI訓練平臺,千視通將算法開發周期從原本數月縮短至了數小時內,并且在常規數據集下算法精度可媲美人類工程師。此外,通過共達地對主流大廠芯片的廣泛適配,做到了云/邊/端靈活部署,一鍵下發至設備,并可自動獲取現場數據進行低成本的自動持續迭代優化,讓精度無限接近理想值。目前,這項合作已廣泛落地在智慧交通、智慧園區、智慧金融網點等多個領域,并成功入選信通院2022“人工智能平臺應用優秀案例”。
例如,在智慧城市建設中,湖南某步行街需要對撐傘/桌椅占道經營、游攤小販違規占道經營、垃圾桶滿溢識別等場景進行識別,這類需求屬于智慧城市建設升級過程中,各省市普遍涌現出來的新需求。
按照傳統的操作方式,需要有專門的工作人員完成數據采集、數據標注、模型結構設計、超參調節、芯片適配、迭代優化、部署應用等13大環節,耗費專業算法工程師團隊約數年時間才能完成。但通過共達地AutoML自動化AI訓練平臺,千視通工作人員通過實地監控錄像,異地完成了數據的采集與標注,以0代碼的方式在數小時內完成了AI能力的建構,并在一周內進行了有效交付。
從實際生活經驗出發,步行街這類場景很容易出現意料不到的情況。這類雖然概率很小但一定會出現的現象被稱為“長尾效應”。這意味著,算法如果不能適配場景的生長而自生長的話,就會隨著應用的逐步深入淪為“人工智障”。在本次湖南某步行街的合作項目中,前端采集的數據能以天為單位回傳至共達地自動化訓練平臺,使算法根據實際場景進行自主學習、快速迭代,越用越聰明,越用越實用。實現“讓算法入鄉隨俗”。
從一支團隊團隊數年的工作,縮減至一名業務員一周的工作,從“死算法”到“活算法”;此間種種變化,不僅僅是成本的下降和準確率的提升,更是對未來的有力驗證——一方面是傳統產業普遍實現智能升級,從PPT上的希望變成了可觸摸的現實;另一方面是AI產業從理論高空規模化扎根到產業大地中,也從希望變成了可觸摸的現實。
再比如,在算法的定制方面,共達地與深圳前海某企業達成合作。該客戶下轄數千平米的大型倉庫,存放了大規模鋼卷以及許多金融機構存放至此的大型保值貨物,僅能通過叉車進行挪動,對安全性的要求較高。
若采用傳統監控攝像+人力巡檢的模式,不僅數千平米倉庫需要大量巡檢員,費時費力,而且會發生錯檢漏檢,甚至出現之前監守自盜的事故。而這類事故發生時難識別,事后借助錄像回溯容易造成巨額損失,故該企業希望引入AI算法,建立起常態化實時監控,識別出未經許可的叉車在貨物存放期間,擅自進入存放區域挪動貨物的情況,并上報給一位專員管理,防患于未然。
雖然這個項目屬于安防領域,但“叉車識別”屬于長尾算法,傳統AI企業較少涉及,客戶無法從現有市場得到現成解決方案。此外,客戶可提供訓練的數據量較少,且希望快速交付,但傳統的AI廠商定制一套算法經常需要數十人團隊耗費數月進行手動訓練,加上數據量上的門檻,難以滿足客戶需求。再者,客戶沒有技術團隊可提供支持,不知道如何部署算法,要求最終交付方案的使用門檻極低,但一般AI廠商主要交付算法SDK,客戶需要另外尋找硬件進行部署,而部署環節因芯片適配問題導致的算法精度降低、算力浪費又成為一重問題。
共達地基于AutoML自動化AI訓練平臺,最初僅用企業提供的500多張叉車圖片數據,有效提取了關鍵特征,結合自動化調參,一小時左右初步生成了叉車識別的算法模型。由于共達地已主動適配了十幾個主流大廠的近百款芯片,客戶無需再尋找其他廠商進行軟硬件的集成工作,可直接將新算法一鍵下發至共達地的邊緣端硬件盒子。
在應用過程中,前端以天為單位采集現場數據并回傳至共達地AI自動化訓練平臺進行算法的自主學習、快速迭代,讓精度無限逼近實際應用場景的理想值,最終解決了客戶的難題。
從AI+產業,到產業+AI
在人工智能商業化發展初期,主要是AI作為領先技術對產業主動發起的探索,即“AI+產業”,主要有兩種模式。
一是縱向的解決方案思路,即面向場景需求,提供定制化AI能力,集中實現某個領域的智能化。這種思路在過去幾年的發展中創造了AI+安防、AI+金融、AI+社保等領域的盛況,其核心價值在于驗證了AI與產業結合的商業價值,讓人工智能的發展向前邁出一大步。
另一種是橫向的平臺思路,即通過面向人智能領域的開發者進行開源,實現行業范圍內的技術能力涌現。這種思路讓人工智能落地的場景和可能性不再局限于安防、金融等集中場景,AI的開發能力也不再局限于少數人工智能公司,其核心價值在于擴大了人工智能的邊界。
但隨著產業智能化轉型的深入,雙方的關系從“AI+產業”扭轉為“產業+AI”,即產業界和消費者切實感受到了人工智能作為領先技術帶來的強大影響力,并由此涌現出對人工智能的無限想象。
從“AI+產業”到“產業+AI”,并不僅僅意味著產業端意識的覺醒,更意味生產力的“蝶變”和產業關系的“重構”。
從這個角度講,GDDi3.0的推出,通過面向行業廣泛開放零代碼式的專業AI開發能力,不只是快速地生產AI,更打破AI供給端、需求端的固定關系,讓生產者、中間商、使用者等角色多元融合。
這意味著,從公司層面來說,傳統的算法公司也可以通過共達地的平臺進行高效地算法訓練,以滿足復雜場景下的碎片化需求。在這種情況下,AI公司就從單純的AI生產者,變成了生產者兼使用者。
同樣的,產業集成商也能以0代碼的形式,從無到有建立自主的AI生產能力,基于多年積累的行業know-how,在中間商這層身份的基礎上,增加“AI生產者”的角色。
對于企業主,即傳統產業鏈中的AI購買者、應用者而言,低門檻實現自己的AI構想也變成一件觸手可及的事情,既不需要顧慮場景是否太細碎、需求是否太小,也不用擔心冗長的周期和高昂的成本。共達地負責將AI開發的難度從專業Photoshop降低到美圖秀秀的級別,企業主負責釋放業務想象力,這才是產業+AI。
將AI生產能力集成于一個自動化訓練平臺,人人可用,人人會用,讓先進的人工智能力量進入尋常百姓家,就像一款人人皆可下載的APP一樣,AI as a Service。這就是共達地正在做的事,解放AI生產力,重塑AI生產關系。這種嘗試不僅僅是AI商業化的嘗試,更是一場社會革新探索,就像教育的普及一樣,讓每個人、每個產業都具備低門檻擁抱未來的可能。