得益于深度學習和人工智能領域的突破,自動駕駛技術取得了越來越快的進步,Robotaxi、干線物流、無人配送車、無人環衛、無人巴士、無人泊車等智駕場景落地逐漸深入,發展一片向好。但目前自動駕駛汽車想要實現實際道路行駛,還有眾多需要解決的技術問題。
自動駕駛需要解決“感知”和“決策”兩個方面的問題。感知是使用多種融合的傳感器,通常包括攝像頭、激光雷達、毫米波雷達、GPS/IMU等設備來感知路面、車輛和行人;決策則是使用感知到的信息來判斷應該如何行動。所以有效的感知將是作出可靠決策的前提。
簡單來說,自動駕駛系統根據從感知融合模塊得到的環境信息,如其他車輛、紅綠燈、行人等數據反饋,才可做出具體行為決策,如剎車、變道、超車等等。
而當前解決感知問題的主要方式就是“數據訓練”,通過監督學習的方法將大量各種情況的訓練數據提供給算法,讓生成的模型具備普適的感知能力。基于自動駕駛落地需求對海量原始數據進行框選、提取、分類等一系列處理,將混雜數據轉化為機器學習可識別的智能駕駛專業數據,幫助駕駛技術更好的感知實際道路、車輛位置和障礙物信息、疲勞檢測等,實時感知在途風險,實現智能行車、自動泊車等預定目標。
智能駕駛時代的關鍵——背后的高質量數據
對于自動駕駛汽車來說,想要在瞬息萬變的復雜真實駕駛場景中發揮感知作用,背后就需要有海量道路場景的數據通過專業人員進行標注,從而轉化為算法訓練的數據支撐。這使得數據標注工作成為一項十分重要且有價值的工作。
前幾日,以高質量、場景化服務著稱的AI訓練數據商云測數據在2021世界人工智能大會上重磅發布了新一代自動駕駛數據解決方案,面向自動駕駛項目研發初期到落地過程,提供場景數據庫、定制化數據采集標注、數據標注&數據管理平臺等一站式數據服務,助力自動駕駛技術感知層面的快速落地。
據了解,云測數據的新一代智能駕駛數據解決方案在為智能駕駛相關企業提供大規模感知數據能力的同時,可減少數據采集周期、提升數據標注效率,并大幅降低AI模型訓練成本,極大地加速智能駕駛相關應用的落地迭代周期,節省大量研發時間和成本。
這一解決方案對駕駛領域,特別是在加速自動駕駛產業場景化、安全落地、用戶體檢提升、安全行駛等落地等方面具有積極意義。
那么,新一代自動駕駛數據解決方案具備哪些特點和優勢呢?
首先,這一方案具有豐富的自動駕駛場景基礎數據庫?;谥悄荞{艙和車外環境感知落地發展需求,云測數據按主流傳感器型號建立了智能駕駛場景數據庫,包含多場景、多天氣狀況、多環境狀況,涵蓋了覆蓋活體驗證、手勢識別、視線追蹤、動作識別等多場景。
其次,具有更高質量的駕駛場景數據采集標注服務。云測數據自主研發數據標注平臺,平臺功能強大,覆蓋所有自動駕駛所需要的2D/3D等不同類型的標注工具,可滿足各種數據標注需求且配置靈活,累計在智能駕駛領域標注2D/3D數據已達數億幀,最高數據標注準確率可達99.99%,這一紀錄也使云測數據成為國內最高標注精度記錄保持者。
云測數據還堅持自建數據標注基地,標注員、質檢員、項目經理統一管理、規范生產,且制定了一套包含任務分配、需求分析、需求確認、數據清洗、試標確認、進度控制、質量保障等完整的作業流程體系在保證數據準確率的同時有效保證標注作業的信息流轉,提升標注效率。全方位數據安全與隱私保障能力,多重措施滿足企業對于數據安全的訴求,幫助企業構建核心數據壁壘。
第三,云測數據建有先進的數據標注平臺&數據管理平臺。云測數據標注平臺擁有業內全面且強大的標注工具,支持功能定制,支持與各類系統對接,可靈活配置。支持私有化部署在企業本地,智駕企業可在內網組織員工進行數據標注工作。
在自動駕駛AI數據標注過程中,面臨“種類繁多、時間效率、數據質量”等眾多難題。云測數據標注平臺可完美解決AI落地場景多樣性、豐富性的數據需求。 并通過標注平臺將全流程優化,可助力AI數據訓練過程綜合效率提升200%,標注流程質量把控,數據標注最高精度99.99% 。
在自動駕駛AI數據訓練過程中,數據管理也面臨巨大挑戰,如數據資產、管理方式、版本管理等等。云測數據標注平臺支持多維度靈活數據檢索,可視化數據管理,助推AI數據產能升級。可實現資產權限管理、標簽化檢索、標簽結果可視化、標注數據版本管理等功能。
目前,云測數據已與業內包括自主、合資車企,大型Tier1、Tier2,無人出租車等自動駕駛相關等眾多企業,建立了持久良好的合作關系。
高精度的訓練數據更受關注
從1886年的卡爾·弗里德里希·本茨發明出汽車開始,拓寬了人們的出行半徑,加速了人流與物流的流動速度。到1939年,第一款配備自動變速器的汽車問世,解放了駕駛員的右手(左舵駕駛,右舵駕駛則解放左手);再到世紀交替時,ACC自適應巡航解放了駕駛員的雙腳。而現在的智能駕駛技術問世,科幻電影中的自動駕駛離我們的距離正在快速接近。
在AI時代,真正的智能駕駛汽車應該是什么樣的?中國工程院院士、中國人工智能學會理事長李德毅給出了答案:“必須像人一樣具備學習能力,能處理各種工況。”要得到這樣的結果,需要讓汽車自身的算法能做到處理更多、更復雜的場景,而這就需要有海量、準確、高質的場景數據,進而對其進行標注。
作為AI技術的底層支撐,高質量的訓練數據越來越受到業界的重視,成為智能駕駛真正落地的“幕后英雄”??梢哉f,自動駕駛真正商業化落地的關鍵之一,就是要通過人工智能算法處理更多更復雜的場景。
從宏觀角度來看,現有算法、算力無法準確處理復雜交通環境下無限可能的長尾場景,這時候高質量AI數據的覆蓋就顯得更加重要,具象到自動駕駛落地需求來看,高質量的場景數據也已成為各方業務領先競爭的關鍵。