日前,第25屆國際模式識別會議(ICPR2020, International Conference on Pattern Recognition)正在意大利以線上的方式舉行,各項挑戰賽的結果也陸續公布。深蘭科技DeepBlueAI團隊,一舉斬獲“大規模商品識別挑戰賽”和“圖表信息提取競賽”兩項冠軍,以及“EndoTect 胃腸道疾病自動檢測競賽”中兩個賽道的亞軍,既驗證了技術實力,又為新零售、電商、醫療等領域提供了高效的解決方案。深蘭科技也將在2021年,持續以人工智能技術為抓手,踐行為各行業輸送養分的“沃土”的理念。
作為模式識別的國際重要會議,已有50年歷史的ICPR涵蓋了計算機視覺、圖像、聲音、語音、傳感器模式處理和機器智能等領域。本次會議的重量級競賽——“大規模商品圖像識別挑戰賽”由ICPR 2020、Kaggle和JDAI等聯合舉辦,要求參賽者對產品圖片的細粒度分類提供解決方案,積極推動電商及新零售行業的發展。深蘭科技Deep BlueAI團隊勇奪冠軍。
隨著互聯網技術和電子商務的迅猛發展,網購已成為主流的購物方式,如何快速地從圖像和視頻中自動識別出產品存貨單元(SKU)級別的類別,并解決SKU級別的產品在視覺上相似、必須進行細粒度分類的需求,成為人工智能零售系統亟待完善的問題。JDAI構建了一個名為Products-10K的產品識別數據集,包含了約10000種經常被中國消費者購買的產品。挑戰賽則基于該數據集展開,具有每個類別的數據量相對較少,并且類內間距大、類間間距小的特點,給分類帶來了巨大的挑戰。
DeepBlueAI團隊針對大規模細粒度商品圖像識別任務,通過數據分析、數據增強、網絡結構設計以及Loss改進等方法,設計了一個簡易的細粒度圖像識別算法。該算法取得了Public & Private第一名的成績,并領先第2名兩個百分點,有望幫助人工智能零售系統快速并準確地從圖像和視頻中自動識別出SKU級別的類別,優化消費者的購物體驗。據悉,同類方案已在深蘭AI自販柜中得以使用。用戶通過掃描手脈,開門拿取商品、關門結算扣費,能實現猶如在冰箱準確取物的消費體驗,其中對產品識別精確度的要求非常之高。
“圖表信息提取競賽”則由7個子賽題組成,任務涵蓋圖表分類、圖表文本識別、文本功能分類、軸分析、圖例分析、圖元素提取等。對于每個子賽題,比賽按照數據集又分為UB PMC與Adobe Synth兩個賽道,每個賽道單獨計分,最終按照每個子賽題的得分總和進行排名。在該比賽的多個任務中,數據類別存在著分布極為不均衡的問題。聯想、華南理工、合合等隊伍參加了本次競賽,DeepBlueAI團隊最終拿下4個賽道冠軍,以總分35分拿到總成績第一名,獲得本次比賽的總冠軍。
“EndoTect 胃腸道疾病自動檢測競賽”,具有極大的社會意義。胃腸道檢查通常使用內窺鏡,這個方法高度依賴操作人員的技能和經驗,可能造成人為誤差。競賽則意欲通過模式識別技術,幫助醫生通過在內窺鏡檢查過程中進行實時自動框架分析,提高發現病變的幾率。DeepBlueAI參加了競賽三個賽道中的兩個,數據集分布不均衡、多種類別類間間距小,息肉大小相差較大且形狀不規則等實際情況,為比賽增加了不小的難度。最終,團隊在賽道一“對23種常見消化系統疾病的腸鏡圖片分類”,以及賽道三“對常見的消化系統疾病息肉進行分割”中均獲得亞軍。
ICPR2020吸引了來自56個國家和地區的科研人員或機構,產生了諸多有價值的論文和解決方案,為各領域提供了新的想法和合作機會。未來,深蘭科技將持續在計算機視覺領域推動核心技術的研發及創新,并不斷擴展技術成果的應用落地,使人工智能更貼近民生、服務大眾。