引:算法商城是偽命題嗎?
同樣都是成熟算法,為什么有的落地后精度低于10%,有的卻能達(dá)到90%以上?
隨著碎片化AI需求的涌現(xiàn),市場(chǎng)上出現(xiàn)越來(lái)越多“算法商城”,給客戶(hù)提供“點(diǎn)單-交貨-支付”的輕型算法服務(wù),讓“買(mǎi)算法”就像“下載APP”一樣簡(jiǎn)單。
但落地到現(xiàn)實(shí)中,開(kāi)篇的問(wèn)題就出來(lái)了。帶著這些疑問(wèn),我們今天來(lái)聊一聊,與共達(dá)地AutoML、智慧工地、AI算法商城有關(guān)的案例。
“南水北調(diào)”路上的困境
案例發(fā)生在“南水北調(diào)”河北路段某工地上。
客戶(hù)想對(duì)工人是否佩戴安全帽、是否穿著反光衣進(jìn)行識(shí)別。
無(wú)需贅述,這個(gè)需求不論對(duì)于人工智能領(lǐng)域還是智慧工地領(lǐng)域,都是“老熟人”。市面上有大量“安全帽識(shí)別”、“反光衣識(shí)別”類(lèi)成熟算法,在整個(gè)智慧工地建設(shè)中,也屬于末端小需求。
但就是在這個(gè)末端小需求上,翻了車(chē)。
最初,客戶(hù)采購(gòu)了市面上某AI廠(chǎng)商算法商城中的成熟算法,順利部署到應(yīng)用場(chǎng)景后,精度竟然不足10%——用客戶(hù)的話(huà)說(shuō),滿(mǎn)屏誤報(bào),讓人瞠目結(jié)舌。
雙方開(kāi)始排查問(wèn)題,迭代算法。
事情并不復(fù)雜,該算法商城提供的成熟算法,在常規(guī)場(chǎng)景下,準(zhǔn)確率確實(shí)能達(dá)到商用水平,但實(shí)際應(yīng)用場(chǎng)景卻并不常規(guī)。一是攝像頭距離被被識(shí)別物非常遠(yuǎn),且變焦球機(jī)來(lái)回運(yùn)動(dòng),被識(shí)別的安全帽和反光衣都變成了“極小目標(biāo)”;二是識(shí)別場(chǎng)景是在夜間,算法“看到”的數(shù)據(jù)特征與訓(xùn)練算法時(shí)所使用的數(shù)據(jù)特征千差萬(wàn)別。
由此,應(yīng)用場(chǎng)景識(shí)別準(zhǔn)確率低于10%也就不奇怪了。
現(xiàn)場(chǎng)實(shí)景:識(shí)別對(duì)象距攝像頭較遠(yuǎn)
后面的迭代之路漫長(zhǎng)且艱辛。
對(duì)于這家AI廠(chǎng)商而言,客戶(hù)要的并不是常規(guī)的安全帽識(shí)別、反光衣識(shí)別,需要安排專(zhuān)門(mén)的算法工程師團(tuán)隊(duì)就夜間場(chǎng)景特征重新迭代算法,這場(chǎng)合作也就不是“下載算法”型的輕量交易,而是堆人頭、堆工時(shí)的重型算法定制。
客戶(hù)的感受也很糟糕。早期的滿(mǎn)口承諾被滿(mǎn)屏誤報(bào)狠狠打臉。重新迭代算法還要配合提供近萬(wàn)張圖片,既沒(méi)有專(zhuān)門(mén)的人力支持,也沒(méi)有懂行的專(zhuān)家,新增的工期和成本更是讓人一肚子怨氣。合作陷入了僵局。
案例梳理到這里,AI落地過(guò)程中的幾個(gè)大坑已經(jīng)浮現(xiàn)了:
一、業(yè)務(wù)壁壘。懂算法的人不懂場(chǎng)景,懂場(chǎng)景的人不懂技術(shù),導(dǎo)致明明可以在前期說(shuō)明的應(yīng)用風(fēng)險(xiǎn)沒(méi)有被及時(shí)識(shí)別,為合作埋下隱患。
二、場(chǎng)景適配。通過(guò)預(yù)訓(xùn)練大量算法,打造算法商城,填補(bǔ)市場(chǎng)上的算法供應(yīng)空白,擴(kuò)大人工智能的應(yīng)用邊界,這是一個(gè)很好的思路。但事實(shí)上,不存在真正“成熟”的算法,或者說(shuō),成熟的算法必然是不斷“成長(zhǎng)”的算法。所以,適配碎片化場(chǎng)景時(shí),是否支持高效、輕量的“適當(dāng)定制”,成為算法商城的一道坎。
三、算法產(chǎn)能。當(dāng)問(wèn)題進(jìn)入到“定制”環(huán)節(jié)時(shí),就需要重新拷問(wèn)傳統(tǒng)堆人頭、堆工時(shí)生產(chǎn)算法的模式,在效率、成本上是否能跟上客戶(hù)需求了。目前市場(chǎng)給出的答案是否定的。
對(duì)于這一點(diǎn),深度參與這個(gè)項(xiàng)目的AI”老炮“吳先生深有感觸:“我們?cè)谝痪€(xiàn)市場(chǎng)上,看到越來(lái)越多政企客戶(hù)的招標(biāo)書(shū)中,主動(dòng)把AI作為重點(diǎn)建設(shè)內(nèi)容,這是以前所沒(méi)有的場(chǎng)景。當(dāng)新的客戶(hù)、新的需求冒出來(lái)時(shí),如果你一套算法研發(fā)周期動(dòng)輒幾個(gè)月,成本上百萬(wàn),客戶(hù)根本接受不了,更不用說(shuō)扛過(guò)試用階段,往二期、三期推。”
夜間場(chǎng)景
所以,分析完這些問(wèn)題,一個(gè)清晰的結(jié)論浮現(xiàn)出來(lái):當(dāng)前人工智能應(yīng)用環(huán)節(jié)中的問(wèn)題,歸根結(jié)底還是算法供給端的結(jié)構(gòu)性問(wèn)題——AI算法生產(chǎn)工具低效、生產(chǎn)模式落后所導(dǎo)致的問(wèn)題,今天在智慧工地上可能是精度驟降,明天可能是工期漫長(zhǎng),后天則可能是硬件適配問(wèn)題——源頭的癥結(jié)在表層可以有千萬(wàn)種展現(xiàn),我們要去解決根本問(wèn)題。
更簡(jiǎn)單但更強(qiáng)大,可能嗎?
共達(dá)地接觸這個(gè)項(xiàng)目時(shí),工期已經(jīng)變得非常緊張,于是我們采取了“摸著場(chǎng)景過(guò)河”的策略。
在共達(dá)地的算法商城里,也有“成熟”的安全帽識(shí)別算法和反光衣識(shí)別算法。于是,初期我們也把這些算法部署到應(yīng)用場(chǎng)景,也取得了極低的識(shí)別準(zhǔn)確率,不到70%。
但主菜在后面。共達(dá)地的項(xiàng)目經(jīng)理分析了常見(jiàn)誤報(bào),主要來(lái)源于兩類(lèi)場(chǎng)景:一是被識(shí)別物與攝像頭較遠(yuǎn),低于識(shí)別的基本像素要求;二是容易將“像”安全帽的物品誤識(shí)別為安全帽,尤其是當(dāng)場(chǎng)景復(fù)雜、光線(xiàn)變化時(shí)。
于是,共達(dá)地的項(xiàng)目經(jīng)理一方面對(duì)系統(tǒng)誤報(bào)進(jìn)行重新標(biāo)注,手動(dòng)糾正算法的重點(diǎn)錯(cuò)誤;另一方面登錄前端盒子,采集現(xiàn)場(chǎng)真實(shí)視頻流,進(jìn)行針對(duì)性地?cái)?shù)據(jù)補(bǔ)充和喂養(yǎng)。然后以一天一個(gè)版本的速度進(jìn)行算法迭代,終于在5天迭代3個(gè)版本后,實(shí)際應(yīng)用場(chǎng)景的算法精度超過(guò)95%,達(dá)到客戶(hù)的要求。
共達(dá)地算法的應(yīng)用效果
這個(gè)過(guò)程講起來(lái)特別簡(jiǎn)單,但越是簡(jiǎn)單的事物,背后越是有一套龐大的支持系統(tǒng)。大家可能已經(jīng)留意到幾個(gè)關(guān)鍵指標(biāo):
一是在數(shù)據(jù)補(bǔ)充和優(yōu)化方面,似乎沒(méi)有遇到太多障礙。
在傳統(tǒng)的算法定制模式中,需要上千近萬(wàn)張圖片,才能喂養(yǎng)出一個(gè)精度較高的算法。但對(duì)于大部分傳統(tǒng)產(chǎn)業(yè)客戶(hù)而言,既無(wú)法提供足量照片,也無(wú)法提供有力的人員支持。
所以,共達(dá)地在技術(shù)層面,支持基于較小樣本的算法訓(xùn)練;在策略上,支持異地采集,第三方標(biāo)注服務(wù),通過(guò)小步快跑的方式,讓算法基于場(chǎng)景迭代、生長(zhǎng)。在這個(gè)案例中,每次迭代優(yōu)化500-1000張圖片,三次迭代下來(lái)也只處理了不超過(guò)3000張圖片,加上與曼孚、數(shù)據(jù)堂等數(shù)據(jù)服務(wù)機(jī)構(gòu)的合作,極大地提高了效率。
二是成熟算法的輕量定制過(guò)程十分流暢。
客戶(hù)與原AI廠(chǎng)商的合作之所以難以推進(jìn),主要在于重新定制算法將耗費(fèi)大量人力和時(shí)間。這是傳統(tǒng)AI生產(chǎn)模式的客觀(guān)現(xiàn)實(shí)。
共達(dá)地的差異點(diǎn)在于,無(wú)論是算法商城中的“成熟”算法,還是部署到應(yīng)用場(chǎng)景后算法的持續(xù)迭代,都是基于共達(dá)地AutoML自動(dòng)化AI訓(xùn)練平臺(tái)完成的。也正是因?yàn)槠脚_(tái)完成了原本依賴(lài)人力的80%的工作,所以才能讓算法以天為單位迭代。
三是不僅交付效率高,人員投入還少。
在項(xiàng)目對(duì)接和交付過(guò)程中,主要由共達(dá)地項(xiàng)目負(fù)責(zé)人主導(dǎo),沒(méi)有算法工程師的參與,客戶(hù)全程幾乎零人員投入——這是許多AI廠(chǎng)商和產(chǎn)業(yè)客戶(hù)共同期盼的分工方式。
這種分工背后,除了共達(dá)地AutoML自動(dòng)化AI訓(xùn)練平臺(tái)承擔(dān)了80%的“黑盒”工作外,還有數(shù)據(jù)處理環(huán)節(jié),曼孚、數(shù)據(jù)堂等專(zhuān)業(yè)服務(wù)服務(wù)機(jī)構(gòu)的加入,讓工作效率提升了許多;同時(shí)部署環(huán)節(jié)百余款主流芯片的提前適配,也讓工時(shí)縮短了數(shù)月。
正是背后這一整套復(fù)雜系統(tǒng),支撐了業(yè)務(wù)環(huán)節(jié)的簡(jiǎn)單交付。
定制VS標(biāo)品
回到最初的問(wèn)題:同樣是算法商城,各家到底有什么區(qū)別?
事實(shí)上在這個(gè)案例中,共達(dá)地交付的不只是一款算法,而是一整套“軟件平臺(tái)+硬件設(shè)備+生態(tài)服務(wù)”的閉環(huán)能力。
在這個(gè)體系下,不論這個(gè)項(xiàng)目負(fù)責(zé)人來(lái)自共達(dá)地,還是集成商、政企客戶(hù),都不重要。因?yàn)?ldquo;生產(chǎn)算法”這項(xiàng)工作,已經(jīng)從高度依賴(lài)從業(yè)者的專(zhuān)業(yè)算法知識(shí)儲(chǔ)備,變成僅僅需要了解業(yè)務(wù)需求和操作流程。這就像許多復(fù)雜儀器的生產(chǎn),從老師傅手工打磨,進(jìn)化為工業(yè)流水線(xiàn)。工人只需要知道如何操作機(jī)器,就具備了出色交付的基礎(chǔ)。
而在這套能力內(nèi),軟件、硬件、生態(tài)各個(gè)環(huán)節(jié)是互相扣合、依存的。當(dāng)我們談?wù)?ldquo;產(chǎn)業(yè)+AI”時(shí),AI算法的大規(guī)模、高效率供應(yīng)只是一方面,更重要的是,當(dāng)原本離AI較遠(yuǎn)的傳統(tǒng)產(chǎn)業(yè),涌現(xiàn)出大量需求時(shí),整個(gè)AI產(chǎn)業(yè)是否能及時(shí)提供客戶(hù)隨時(shí)可獲得、到手即可用、應(yīng)用成本低、全程服務(wù)支持的完整能力。
在這一點(diǎn)上,共達(dá)地的算法商城解決的是產(chǎn)能供應(yīng)問(wèn)題,與硬件、芯片、數(shù)據(jù)服務(wù)商等的生態(tài)合作,解決的是落地鏈路問(wèn)題。
共達(dá)地:AI as a service
對(duì)于這種變化,AI”老炮“吳先生的評(píng)價(jià)是”先行者“。吳先生見(jiàn)過(guò)太多”黃掉“的需求,背后的原因也無(wú)外乎成本高、周期長(zhǎng)、技術(shù)不穩(wěn)定——這些都是AI落地的頑疾,也無(wú)一不依賴(lài)生態(tài)上的整合,如果這些問(wèn)題不能被硬核地解決掉,就只能讓AI賦能的夢(mèng)想被湮沒(méi)。
當(dāng)整個(gè)完整生態(tài)聚合到一起時(shí),客戶(hù)不需要額外購(gòu)買(mǎi)硬件、不需要費(fèi)時(shí)費(fèi)力處理數(shù)據(jù),不需要為軟硬件適配問(wèn)題所導(dǎo)致的工時(shí)和人力成本買(mǎi)單,所有這些能在上游供應(yīng)端通過(guò)合作共贏解決的問(wèn)題,都不會(huì)流到下游成為客戶(hù)的爛攤子。
也只有在有了生態(tài)支撐后,算法商城的輕型交付才具備了可行性。算法商城作為中轉(zhuǎn)站,一方面承接基于AutoML自動(dòng)化AI訓(xùn)練平臺(tái)生產(chǎn)的海量算法,另一方面作為與產(chǎn)業(yè)客戶(hù)溝通的平臺(tái)。當(dāng)客戶(hù)選中某一款算法時(shí),根據(jù)應(yīng)用場(chǎng)景特征,數(shù)據(jù)服務(wù)前置到算法迭代過(guò)程中,硬件服務(wù)前置到算法部署環(huán)節(jié)中,產(chǎn)生基于標(biāo)品的輕量定制——“標(biāo)品”負(fù)責(zé)拓展AI與產(chǎn)業(yè)融合的邊界,“定制”負(fù)責(zé)落地過(guò)程的絲滑適配,讓算法商城從“死的算法交付”,變?yōu)?ldquo;活的算法服務(wù)”,或許才能真正撓中產(chǎn)業(yè)客戶(hù)真正的癢點(diǎn)。