近年來,人工智能(AI)蓬勃發展,在計算機視覺、自然語言處理和機器翻譯等任務上,AI的準確性甚至超過了人類。深度學習是AI領域目前研究的熱點,深度學習與GIS融合能夠更高效地解決現實問題,比如在精準農業領域幫助提高農作物產量、通過預測模型助力警務打擊犯罪等等,因此也創造了前所未有的巨大機遇,具有廣闊的應用前景。
近日,新一代國產地理信息平臺GeoScene 2.1正式發布,在地理人工智能GeoAI方面實現了重大技術突破。GeoScene平臺和深度學習結合的重點目前主要在計算機視覺領域,可以實現基于衛星遙感、航空航天、無人機圖像、激光雷達點云等的目標識別和圖像分類任務。平臺提供端到端的深度學習解決方案,從樣本制作、到模型訓練、推理分析以及結果后處理,提供了豐富的產品、工具、APIs,無論業務人員,還是數據科學家,亦或開發者,都能選擇合適趁手的“兵器”,體驗深度學習的魅力,盡享智能化帶來的樂趣。
具體來看,GeoScene全流程的GeoAI支持樣本制作一鍵導出,提供即拿即用的樣本標注工具和樣本導出工具,可將GIS數據導出為深度學習框架所支持的樣本;訓練模型豐方面,內置豐富的模型,如SSD、Unet、MaskRCNN、Deeplab、PointCNN等,無需切換環境即可訓練;推理方面,提供多種推理工具,支持場景實現,支持服務器端分布式推理及GPU推理;精度評估方面,通過使用深度學習工具將檢測到的目標與地面真相數據進行比較,計算深度學習模型的精度,如目標檢測結果精度計算。
圖1 GeoScene全流程的GeoAI賦能敏捷應用
2.1版本中,為了滿足更豐富的應用場景需求,平臺也在不斷擴展高質量深度學習模型的類型、數量。目前內置模型達到20余種,覆蓋了圖像分類、圖像翻譯、變化檢測、語義分割等應用方向,新增支持道路提取、變化檢測、影像翻譯等深度學習算法模型,全方位賦能用戶業務應用升級,使得驅動數字化轉型的過程更加高效和智能化。
以道路提取為例,MultiTaskRoadExtractor模型是一個像素分類模型,與傳統的像素分類不同的是,此像素分類專門針對于道路。就像是模型名稱一樣,模型的另外一個特點是多任務。先來看一下模型結構:
圖2-1 MultiTaskRoadExtractor模型結構
此模型結構屬于編碼器解碼器結構,但是在解碼的時候,一部分用來生成語義掩膜,另一部分解碼器則去做了道路拓撲與道路連通性檢查。做的事情如圖2-2所示:
圖2-2 拓撲與道路連通性檢查
在圖2-2b中可以明顯的看到紅圈內為道路斷點,在拓撲上與道路連通性上都有問題,所以通過檢查將語義分割掩膜完善,進而完善模型。
再看下變化檢測,變化檢測是深度學習計算機視覺領域一個小方向,其所做的事情顧名思義,提取出兩幅不同時向變化的地方(如圖3-1)。一般來說,變化檢測根據場景以及人們的關注可以分為單類別變化以及多類別變化。單類別的常見場景如建筑物增減變化,多類別的常見場景如國情普查數據變化。
圖3-1:變化檢測
GeoScene中的變化檢測模型ChangeDetector來源于STANet(2020年5月發布),模型整體架構如圖3-2所示:
圖3-2:STANet模型結構
從模型結構上可以很清晰的了解整個模型工作流重點。整體模型是一個類似Unet的編碼解碼過程,其中比較重要的是兩期影像先進行特征圖提取后會經過特定的注意力機制模塊。圖3-2中的I為輸入的兩期影像數據,X為提取的特征圖,Z為經過特定的注意力機制之后的特征圖,Metric Module為損失函數,P為最終的語義圖。在特征圖提取時的backbone是ResNet家族,代表著可以選擇任意ResNet家族的backbone應用于模型。此模型適用于單類別變化檢測,如建筑物增減、查違拆違等業務場景。
圖3-3:變化檢測實例
6月3日至4日,2021年易智瑞空間信息技術開發者大會將在北京舉行。屆時,全新發布的GeoScene 2.1將重磅亮相,進一步激發廣大開發者創新活力,為各行各業數字化轉型提供重要支撐。屆時,大會將對GeoScene在GeoAI方面的最新進展進行深入解讀,并對新版本中提供的豐富AI模型進行應用展示。