近日,第五屆人工智能與機器人國際會議(ISAIR2020)公布論文錄用結果,其中由影譜科技和北京大學智能影像生產實驗室研究發表的兩篇學術論文《基于實例遷移學習的跨領域文本分類算法》和《基于步態行為振動的Gabor原子分解地形分類》雙雙被ISAIR2020錄用。這是繼論文《基于遷移學習的情感分析研究》入選國際期刊《IEEE Access》后,該實驗室的研究成果再次獲得國際學術界的認可。
據了解,ISAIR2020由國際人工智能和機器人學會、電氣和電子工程師協會(IEEE)所轄大數據特別技術委員會、模式識別國際協會(IAPR)、國際光學和光子學學會共同組織舉辦。作為人工智能與機器人交叉領域的重要國際會議,匯聚了全球領先的一流前沿研究成果。影譜科技智能影像生產實驗室作為國內首個專注于視頻領域的智能影像生產實驗室,一直致力于智能影像技術及虛擬現實等技術理論延伸與技術研究,此次學術成果獲ISAIR2020收錄,正是源于該實驗室在相關領域的長期積累和不懈探索。
在機器學習和深度學習的熱潮中,目前擁有廣泛實際應用潛力的遷移學習成為較熱門的研究方向。遷移學習技術因其領域間知識、技能和經驗的遷移能力,已成為跨領域文本分類的重要手段和研究熱點。由于跨領域文本分類在數據挖掘領域具有廣闊應用前景,而通過遷移學習技術,可借助于已有知識的領域幫助目標領域數據實現語義信息的共享和遷移,簡單而又高效地解決跨領域文本處理問題。
在本次入選ISAIR2020的論文《基于實例遷移學習的跨領域文本分類算法》中,影譜科技智能影像生產實驗室的研究團隊提出一種基于實例的跨領域分類算法MTrA。該算法以TrAdaBoost為基礎,采用一種集成的學習方式,并將源域和目標域的特征分布差異考慮在內,采用最大均值差異值作為兩域分布差異的權重參數,并在源域數據的權重更新方式中增添了考慮源域分類準確性的權重回補因子,平衡了源域樣本的權重更新方式。MTrA采用標準數據集20 Newsgroups進行分組實驗,分類準確性與TrAdaBoost算法相比大約提升了9.4%,證明了本算法的有效性和優勢。
圖:實驗組rec vs talk在不同迭代中準確性的變化
圖:實驗組recvssci在不同迭代中準確度的變化
圖:實驗組sci vs talk在不同迭代中準確性的變化
此外,隨著深度學習等技術的不斷突破,越來越多的生物特征被提取出來并進行識別,如人臉識別、指紋識別、虹膜識別等。而在此基礎上,步態識別,作為全球前沿的生物特征識別技術之一,也正逐漸走進人們的視野。
本次入選的論文《基于步態行為振動的Gabor原子分解地形分類》,就是以異常步態行為的檢測與識別為研究方向,通過技術突破,使得異常步態識別的準確性和速度得以明顯提升。影譜科技智能影像生產實驗室的研究團隊采用一種內置三軸加速度傳感器的智能移動終端,實現了對人體步態的采集。同時,利用匹配將信號數據分解成Gabor原子的線性組合后采用時頻聯合分析方法,分析了三維空間中的運動特性。為了解決時頻分析中復雜的計算問題,在研究中對異常步態數據進行了訓練、分類和識別。
圖:基于振動的地形分類算法流程圖