中日韩欧美一二区,久久国产一级毛片,国产精品久久欧美久久一区

隨著自動駕駛技術在不同場景下的持續落地，目標檢測作為其中的一項核心模塊，對檢測算法的精度和穩定性要求越來越高。近日，在國際機器人技術與自動化會議（ICRA 2021）舉辦的第四屆nuScenes三維目標檢測挑戰賽中，來自百度研究院的機器人與自動駕駛實驗室(RAL)團隊在三維物體檢測任務的多項評價指標中榮獲第一，并將關鍵指標nuScenes Detection Score (NDS)從上一屆的71.4%提升至74.9%，刷新了三維目標檢測比賽成績。

ICRA2021 nuScenes三維物體檢測挑戰賽官方排行榜

榜單地址：https://www.nuscenes.org/object-detection?externalData=all&mapData=all&modalities=Any

第四屆nuScenes目標檢測挑戰賽吸引了來自全球各地的多支參賽隊伍，不僅有百度、華為、滴滴等知名企業，還涵蓋了德克薩斯大學奧斯汀分校、上海交通大學、中國科技大學、哈爾濱工程大學等國內外重點高校。

本屆挑戰賽使用的nuScenes[1]數據集是自動駕駛目標檢測領域中最流行的公開數據集之一，集成了多種傳感器（如相機，LiDAR, Radar等），提供了包含二維、三維物體標注、點云分割、高精地圖等豐富的標注信息。數據集整體共包含1000個場景、140萬幀圖像、39萬幀激光雷達點云數據、23個物體類別、140萬個三維標注框，數據規模和難度遠超之前的自動駕駛數據集KITTI。

百度研究院的機器人與自動駕駛實驗室(RAL)團隊在比賽中提出了一種多模態和多任務的信息融合框架FusionPainting[3] ,并且結合多模型融合等技術，推出了CenterPoint-Fusion的技術方案，將評價的關鍵指標NDS從上一屆冠軍的71.4%提升至74.9%，全類平均正確率（mean Average Precision)從上一屆冠軍的67.1%提升至72.4%。憑借本次挑戰賽中多個評測指標第一的優異成績，百度在自動駕駛領域的技術實力再次彰顯。

CenterPoint-Fusion算法優勢何在？

激光雷達（LiDAR）可以直接以三維點云的形式提供周圍場景的深度信息，因此廣泛的應用于自動駕駛的感知模塊中。但是相比于圖像數據，激光點云具有密度稀疏，紋理信息不豐富的缺點,因此在檢測任務中對于物體的類別分辨往往不準確。

利用相機和Lidar之間的標定參數，PointPainting[2]將圖像的語義信息附加到點云上，再利用融合的點云信息進行物體檢測，能有效的提升檢測的精度。但是由于圖像分割器的特征圖尺寸大小的限制，分割結果在物體的邊界上有模糊效應，再反投影到3D點云上時會造成物體邊界的點云類別信息不準確，從而影響最終檢測的效果。

基于多模態自適應融合的FusionPainting流程圖

相比于二維圖像分割有物體邊界模糊的缺點，直接在三維點云上進行分割卻能得到清晰的物體邊界。為了有效的解決這種邊界模糊的問題，百度提出了融合二維圖像分割與三維點云分割結果的FusionPainting框架[3]。對于每一個三維點，既通過二維圖像分割獲得語義信息，又通過三維點云分割獲得語義信息，最終通過一個自適應的注意力模塊來對兩種信息進行有效的融合。融合后的點云可以作為任何三維物體檢測器的輸入，從而最終得到三維物體檢測結果。

在此框架的基礎上，百度進一步添加了多模型融合、半監督學習、測試階段數據增強等技術，充分發揮多模態和多模型的作用，進一步提升了目標檢測的效果。

nuScene數據集三維物體檢測檢測效果示例，其中不同的顏色代表不同類別的物體

本次在nuScenes三維目標檢測挑戰賽中奪冠的百度研究院機器人與自動駕駛實驗室，在自動駕駛感知和機器人領域有著豐富的技術積累和成果輸出，研究成果發表在CVPR、ICCV、ECCV、NeurIPS、AAAI、ICRA 與IROS等頂級國際學術會議和《Science Robotics》，《IEEE T-PAMI》、《IEEE T-IP》、《IEEE T-ITS》、《SAGE IJRR》等頂級期刊上。

百度布局自動駕駛以來，不僅在自動駕駛技術和智能駕駛領域市場占據了先發優勢，并通過持續深耕，在技術創新和應用落地上也取得了令人矚目的成就。在自動駕駛這場改變人類軌跡的長跑中，百度還將繼續技術創新，做這條道路上堅定的領跑者。

參考文獻：

Caesar, Holger and Bankiti, Varun and Lang, Alex H and Vora, Sourabh and Liong, Venice Erin and Xu, Qiang and Krishnan, Anush and Pan, Yu and Baldan, Giancarlo and Beijbom, Oscar. nuscenes: A multimodal dataset for autonomous driving. Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2020: 11621-11631.

Vora, Sourabh and Lang, Alex H and Helou, Bassam and Beijbom, Oscar. Pointpainting: Sequential fusion for 3d object detection. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 4604-4612.

Shaoqing Xu , Dingfu Zhou, Jin Fang, Junbo Yin, Bin Zhou and Liangjun Zhang. FusionPainting: Multimodal Fusion with Adaptive Attention for 3D Object Detection. Accepted by IEEE International Conference on Intelligent Transportation Systems (ITSC), 2021.