“AI+制造”被認(rèn)為是制造業(yè)發(fā)展的必然趨勢,也是我國產(chǎn)業(yè)轉(zhuǎn)型升級的重要推動(dòng)力,其在制造業(yè)領(lǐng)域的應(yīng)用,本質(zhì)上是為了提高制造業(yè)的生產(chǎn)效率,降低生產(chǎn)成本。
過去幾年,有不少AI公司開始推出了智能制造的解決方案,雖然取得了一定的成果,但并沒有全面實(shí)現(xiàn)落地。原因在于,市場需求十分瑣碎,沒有統(tǒng)一標(biāo)準(zhǔn),其積累的有效數(shù)據(jù)可復(fù)用性非常小,因此幾乎每個(gè)項(xiàng)目都需要從頭開始為企業(yè)做定制化算法開發(fā)。這種模式成本較高,開發(fā)周期也更長,很難給企業(yè)帶來真正的降本增效。
與此同時(shí),智能制造也已經(jīng)開始由單點(diǎn)的局部能力提升,演變?yōu)槊嫦蛉种悄艿南到y(tǒng)工程。企業(yè)的需求也從單一的產(chǎn)品需求轉(zhuǎn)變成對整體解決方案的需求。顯然,市場變化之下,傳統(tǒng)的算法生產(chǎn)模式已經(jīng)很難滿足企業(yè)需要,智能制造算法也必然要在整體生產(chǎn)流程、個(gè)性化定制、可靠性生產(chǎn)和柔性生產(chǎn)等方面均有一定的適配能力。
大模型技術(shù)成為算法開發(fā)新方向
對于AI解決方案商而言,算法開發(fā)呈現(xiàn)出以下四個(gè)特點(diǎn):
從原先的點(diǎn)對點(diǎn)定制開發(fā)逐步轉(zhuǎn)向系統(tǒng)協(xié)同開發(fā);
做好產(chǎn)品個(gè)性化的同時(shí)努力為數(shù)據(jù)和解決方案的標(biāo)準(zhǔn)化提供參考;
面向用戶標(biāo)準(zhǔn)開發(fā)時(shí)梳理數(shù)據(jù)邊界定義和可靠性建模方法,探索更加魯棒的人工智能相關(guān)理論和應(yīng)用技術(shù);
提高解決方案的適配能力,實(shí)現(xiàn)更高程度的生產(chǎn)智能化和資源利用率。
這要求AI公司改變原有的算法生產(chǎn)模式,在諸多技術(shù)之中,面向通用人工智能的大模型技術(shù)是聚焦點(diǎn)。
在該技術(shù)發(fā)展過程中,開源大模型起到了非常大的推動(dòng)作用,其中最知名的大模型是Meta的LLaMa、斯坦福的Alpaca和伯克利的 Vicuna等模型。這三個(gè)開源大模型的意義在于,展示了基于開源與公開數(shù)據(jù)集訓(xùn)練出高質(zhì)量模型的可能性,生成的模型雖然不如ChatGPT-4,但對于多模態(tài)、信息的理解程度,這些模型的表現(xiàn)已經(jīng)非常不錯(cuò)。
具體數(shù)據(jù)、代碼及訓(xùn)練費(fèi)用如下表所示:
換句話說,利用大模型技術(shù)來改變原有的算法開發(fā),降低成本,并非空中樓閣,已經(jīng)在逐步落地。而其對于制造業(yè)來說,正如中國工程院院士李伯虎在2023年世界人工智能大會上指出的:“制造業(yè)是國民經(jīng)濟(jì)的主體,AI大模型要加強(qiáng)制造業(yè)‘技術(shù)、產(chǎn)業(yè)、應(yīng)用’的進(jìn)一步融合,研發(fā)面向制造業(yè)的AI大模型技術(shù),推動(dòng)我國制造業(yè)數(shù)字化轉(zhuǎn)型與智能化升級。”
大模型技術(shù)正當(dāng)時(shí),探索技術(shù)應(yīng)用可能性
作為扎根工業(yè)制造的AI公司,在大模型技術(shù)浪潮下,微億智造順應(yīng)時(shí)勢開始探索大模型在工業(yè)領(lǐng)域的應(yīng)用。一方面,繼續(xù)跟進(jìn)開源數(shù)據(jù)的大模型技術(shù),不斷迭代技術(shù);另一方面,也在構(gòu)建面向工業(yè)數(shù)據(jù)的大模型和推動(dòng)大模型在工業(yè)制造場景的落地應(yīng)用。
高效的知識整合方法
眾所周知,預(yù)訓(xùn)練大模型是一種高效的知識整合方法,具備很強(qiáng)的數(shù)據(jù)歸納能力,近年來在語言、語音、圖像等數(shù)據(jù)建模上取得了令人矚目的進(jìn)展。然而,工業(yè)生產(chǎn)數(shù)據(jù)和通用領(lǐng)域數(shù)據(jù)存在一定的域偏差,且有效標(biāo)注的數(shù)據(jù)相對較少,這導(dǎo)致直接進(jìn)行大規(guī)模預(yù)訓(xùn)練的前提條件不足。
為此,微億智造將通用場景與某些智能產(chǎn)線場景進(jìn)行域遷移,提高類似場景應(yīng)用的智能化水平。同時(shí),微億智造根據(jù)智能產(chǎn)線生產(chǎn)流程,將相關(guān)知識引入到模型的概率決策中,做到數(shù)據(jù)與知識的融合推理,提高產(chǎn)線場景建模能力。
以“工小匠|AI數(shù)字質(zhì)檢員”為例,微億智造基于大模型域遷移和數(shù)據(jù)與知識融合推理所推出的缺陷檢測方法,能夠有效緩解因缺陷數(shù)據(jù)少且分布不平衡對檢測性能的影響。經(jīng)實(shí)測,“工小匠”在項(xiàng)目樣本需求量減少70%的情況下,平均檢測準(zhǔn)確率仍能達(dá)95%以上,大大縮短了項(xiàng)目周期以及產(chǎn)線的改造成本,提高了解決方案的應(yīng)用適配能力。
可靠的數(shù)據(jù)增廣路徑
微億智造在通用大模型基礎(chǔ)上根據(jù)工業(yè)質(zhì)檢、智能生產(chǎn)、智能監(jiān)控等場景設(shè)計(jì)了多重解決方案,如輕量級快速交付解決方案、高召回人機(jī)協(xié)作解決方案、高品質(zhì)系統(tǒng)解決方案等,大大提高了解決方案的適配性。
此外,為了提高數(shù)據(jù)增廣的有效性,微億智造在數(shù)據(jù)仿真和可視化交互方面也做了許多工作,主要包括面向工業(yè)異常數(shù)據(jù)的可編輯內(nèi)容生成、數(shù)據(jù)分布可視化等。
在可編輯內(nèi)容生成方面,針對缺陷樣本收集難、數(shù)據(jù)標(biāo)注成本高等問題,微億智造通過自研貼圖和合成工具“神筆馬良”,利用可編輯的AI內(nèi)容生成來精確生成不同位置和形狀的高仿真缺陷樣本,從而提高數(shù)據(jù)增廣的有效性。而且,“神筆馬良”在模型構(gòu)建、迭代及部署等各環(huán)節(jié)都發(fā)揮著重要的作用,不僅大大壓縮了項(xiàng)目周期,還能提高模型性能。
而數(shù)據(jù)分布可視化主要用于解決項(xiàng)目中的數(shù)據(jù)邊界定義問題。如下圖所示,通過該可視化圖,項(xiàng)目實(shí)施人員能夠關(guān)注不同類別數(shù)據(jù)的模糊地帶,從而提高數(shù)據(jù)邊界確定的效率。
目前,微億智造已構(gòu)建了面向工業(yè)質(zhì)檢和智能工廠的大模型,并在此基礎(chǔ)上通過知識融入的預(yù)訓(xùn)練和基于提示器的學(xué)習(xí)等算法創(chuàng)新,使得一些目標(biāo)檢測和識別任務(wù)能夠從不同維度知識中獲取信息增益,從而提升系統(tǒng)建模能力和可靠性。
同時(shí),為了解決產(chǎn)品的多樣性和用戶標(biāo)準(zhǔn)的主觀性問題,微億智造將所有解決方案和配置進(jìn)行參數(shù)化,采用基于自動(dòng)參數(shù)搜索的技術(shù)來生成智能解決方案,并持續(xù)強(qiáng)化學(xué)習(xí)技術(shù)引入生產(chǎn)流程優(yōu)化,逐步幫助企業(yè)生產(chǎn)由人機(jī)協(xié)同模式往更加智能的自動(dòng)化模式推進(jìn)。
微億智造自研的高度模塊化的算法開發(fā)框架
如上圖所示,微億智造自研了一套高度模塊化的算法開發(fā)框架,在云端和終端都給出了一系列面向各種智能制造場景的全流程解決方案。該框架能夠面向指定場景實(shí)現(xiàn)解決方案推薦、數(shù)據(jù)增廣、模型訓(xùn)練與評估、一鍵化測試與部署等功能,從而極大地提高算法開發(fā)和應(yīng)用落地的效率,讓一些標(biāo)準(zhǔn)化的解決方案在成本上能夠推廣到小批量產(chǎn)品生產(chǎn)中,真正惠及廣大企業(yè)。
總結(jié)
未來一段時(shí)間,部分需要在現(xiàn)場由人腦進(jìn)行復(fù)雜情況判斷的工序也會被人工智能技術(shù)逐步滲透。與此同時(shí),隨著機(jī)器視覺、手勢識別等技術(shù)與工業(yè)機(jī)器人的深入融合,人機(jī)協(xié)作也將在更多工作場景和更多復(fù)雜工序中成為主流。