7月,特斯聯“九章人工智能算法賦能平臺”計算機視覺基礎模型核心算法,在國際頂級會議——2021國際計算機視覺大會(ICCV 2021)賽事中,擊敗眾多強敵,躋身賽事排名前10%。競逐者包括:字節跳動人工智能實驗室、中國移動研究院、日本最大移動通信運營商NNT DOCOMO,以及清華大學、武漢大學、中國科技大學、墨爾本大學等69家國際大型企業、頂尖高校及研究機構。
堅持深耕、不斷開拓人工智能最前沿算法,是特斯聯斬落豪強,載譽而歸的秘笈。本期“先鋒科技場”將首次揭秘該行業領先算法。
大勢所趨
隨著全球人工智能產業高速發展, 人工智能(AI)近年被抽象成多種算法應用于不同領域。AI已全面進入機器學習時代。AI未來發展將是關鍵技術與產業的深入結合——單純算法已無法滿足更細分領域及行業對AI的需求,尤其在萬物互聯的AIoT(人工智能+物聯網)時代,越來越多的訂制化AI需求亟需解決。
原有開發模式實際已成為新形勢下AI發展的瓶頸。當前,用戶AI訂制通常遵循“找公司-對需求-交付研究-算法產品化編碼-上線使用”流程。這往往導致研發周期長、研發成本高,難以滿足AIoT時代各行業用戶AI產品開發需求。
對此,AI開放平臺應運而生。其能集成AI算法、算力與開發工具,通過接口調用,使企業、個人或開發者高效使用平臺AI能力,實現AI產品開發及賦能。隨著大量AI廠商高速崛起,中國在技術平臺領域已逐漸擺脫對海外廠商的依賴,涌現出多家AI開放平臺。
雖然我國目前AI開放平臺發展勢頭良好,但現有平臺在用戶規模、使用場景、用戶技術基礎等多個方面,仍然受限。這些平臺均主要針對專業AI開發者設計,對AI零基礎用戶開發人工智能產品“不甚友好”。
此背景下,特斯聯核心算法研究團隊開發出普適性AI算法開放平臺——“九章AI算法賦能平臺”。它力克半監督、標簽內容以及“聯邦學習”(Federated Learning)等方面的核心技術難點,實現了CV(計算機視覺)、NLP(自然語言處理)、推薦預測、知識圖譜算法的自訓練。
九章平臺可針對多場景及各規模用戶(尤其可針對AI零基礎用戶),進行零代碼、低代碼自有算法孵化,顛覆已有AI研發人員開發模式,顯著降低AI研發成本及周期。
在業界備受矚目的校企合作方面,近年來各方努力已獲成效,但仍有較大提升空間。目前,企業對高校研究成果頗感興趣,需求較大;高校亦希望其研究能夠解決實際行業問題,故十分渴望行業課題導入。但是,高校研究成果進行行業落地時,往往水土不服;高校產學研課題亦往往隨著學生畢業被迫中斷,持續性堪憂。
特斯聯“九章AI算法賦能平臺“可在弱監督體系下,能夠實現平臺和訓練模型算法有效對接。使基于訓練算法模式的校企需求對接,取代“向企業提供推理算法代碼”這一傳統模式。不僅如此,該平臺可實現算法積累與深化。
本期“先鋒科技場”就將揭秘九章AI算法賦能平臺的核心技術之一——基于半監督的CV自訓練學習算法。
甄選模型
監督學習技術通過學習大量訓練樣本,構建預測模型。其中每一訓練樣本均被貼上明確標簽,顯示其真值輸出。盡管當前技術已取得巨大成功,高數據標注成本常導致諸多任務無法獲得強監督信息(如“全部真值標簽”等)。因此,采用半監督學習,通常是執行實際任務的更佳方案。
半監督分為三類——不完全監督、不確切監督、不準確監督。特斯聯九章AI賦能平臺致力于讓AI能力偏弱或“貧乏”用戶,也能擁有AI算法孵化服務能力。因此,弱化人工參與算法訓練尤為重要。
但不同半監督類型亦存在自身短板。不完全監督若只擁有少量被標注數據,不足以訓練出優秀模型。不確切監督僅能滿足已給定監督信息、但信息不夠精確的場景。不準確監督在監督過程中,會出現被標注數據存在錯誤監督信息的情形。三類半監督模式人工干預較大,無法形成自訓練學習算法體系,無法達到普適性AI算法開放平臺需求。
為構建基于半監督的自訓練學習算法,特斯聯核心算法研究團隊主要采用基于Transformer模型的Swin Transformer作為骨干模型,以此搭建特征學習基礎算法,進而構建自訓練體系。此外,團隊通過參加國際計算機視覺大會(ICCV)等國際頂級會議,有效驗證了基于半監督的CV自訓練學習算法在實際產業應用中的貼合度,并載譽而歸。
深耕算法
特斯聯核心算法團隊針對上述三大半監督類型難題,將主動學習、半監督學習、多示例學習、帶噪學習等技術引入自訓練體系,最大限度從已知標簽樣本特征中,挖掘潛在內嵌信息,反哺至未知標簽數據,從而減少人工干預。
特斯聯以Swin Transformer為骨干模型,針對半監督,設計可學習樣本全局及局部“特征學習模塊”。
而選用Transformer為骨干網絡,則可使輸出的全局特征信息更為豐富,使“全局特征相似度學習模塊”從樣本特征中挖掘出更多信息。此外,“局部特征細粒度學習模塊”聚焦樣本局部特征,可與Transformer形成互補,統一對外提供基準骨干網絡。
特征學習模塊方面,特斯聯基于BNNeck,采用“全局+局部”模式展開研究。全局層面,通過度量學習(Circle Loss + Center Loss)提取全局特征。局部細粒度特征學習層面,則首先計算每一局部模型間相關性,隨后交叉融合局部模塊相關性較高的特征,輸入至各局部細粒度分類器,學習相應局部細粒度特征。如圖所示,交叉融合可分為如下四種:
接下來的重點,為構建自訓練體系。其主要分為兩個階段。第一階段——強監督訓練:利用少部分數據,對以上特征學習算法作初步強監督訓練,降低后期自訓練難度,提高自訓練性能。第二階段——標簽內容生成:通過主動學習、半監督學習、帶噪學習等技術,充分利用余下的大部分數據。
在此,將不再贅述強監督訓練。標簽內容生成工作,則會從主動學習/無監督學習、半監督學習兩個方面展開。
主動學習/無監督學習分為四個步驟。旨在通過“挖掘小部分數據,帶動大部分數據”,解決半監督下不完全監督短板。在有限的平臺資源上,令大部分未標注數據高效得到相應標簽。
半監督學習方面,通過以上無監督學習能夠獲得可靠性強,且具有標簽的Query子集和Gallery子集G*。但兩者均僅有缺少局部細粒度標簽的弱標簽信息。通過半監督學習實現L、G*,以及帶有局部細粒度標簽的訓練集數據T,可對特征學習模型作全量調優。隨后,在S=[L,G*,T]上尋找更優局部細粒度學習器;并利用訓練集數據分布上的局部細粒度子模型,建立多個局部細粒度學習器,對未標簽樣例加注標簽。局部細粒度學習器可基于其未更新前對L、G*所生成的局部細粒度標簽,以及更新后所預測的結果,計算損失值進行學習。這一方面使L、G*在某種層面上,補充了T可能缺失的潛在信息;另一方面可通過學習器,幫助模型在L、G*上挖掘局部特征。
多輪、細致的實驗結果證明:主動學習、半監督學習在解決半監督下的不完全監督問題中,表現穩定;多示例學習方法在不確切監督問題中表現穩定;帶噪學習方法在不精確監督問題中表現穩定。