2021年,自動駕駛領域格外熱鬧,互聯(lián)網(wǎng)大廠、新造車勢力和傳統(tǒng)企業(yè)紛紛進場布局自動駕駛,很多自動駕駛車輛從封閉路測場地走向真實道路。2022年伊始,自動駕駛賽道仍充滿速度與激情,伴隨著商業(yè)化落地的快速滲透,相關咨詢機構預測自動駕駛將正式進入商業(yè)化元年”。
什么是自動駕駛系統(tǒng)?
自動駕駛系統(tǒng)采用先進的通信、計算機、網(wǎng)絡和控制技術,對汽車實現(xiàn)實時、連續(xù)控制。自動駕駛系統(tǒng)是一種對駕駛員執(zhí)行的工作完全自動化、高度集中控制的列車運行系統(tǒng)。自動駕駛系統(tǒng)具有汽車自動喚醒啟動和休眠、自動行駛、自動停車、自動開關車門等功能,并配置了多種運行模式,例如常規(guī)運行、降級運行、運行中斷等多種運行模式,可實現(xiàn)節(jié)能結源,優(yōu)化系統(tǒng)能耗和速度的合理匹配。還可以對自動駕駛汽車上的駕駛員及乘客的狀況、車內狀況、設備狀態(tài)進行監(jiān)視和檢測,如發(fā)現(xiàn)異常狀況會將信息快速傳送至控制中心,并及時作出處理。
自動駕駛的五個等級
自動駕駛的等級劃分自動駕駛被分為L0-L5 的6個等級。
L0為人工駕駛,即無自動駕駛。由駕駛員全方面操控汽車,可以得到警示或干預系統(tǒng)的輔助;
L1為輔助駕駛,通過駕駛環(huán)境對方向盤和加減速中的一項操作提供駕駛支持,其他的駕駛動作都由駕駛員進行操作;
L2為半自動自動駕駛,通過駕駛環(huán)境對方向盤和加減速中的多項操作提供駕駛支持,其他的駕駛動作都由駕駛員進行操作;
L3為高度自動駕駛,由自動駕駛系統(tǒng)完成所有的駕駛操作。根據(jù)系統(tǒng)要求,駕駛者需要在突發(fā)緊急情況時提供應答;
L4為超高度自動駕駛,由自動駕駛系統(tǒng)完成所有的駕駛操作。根據(jù)系統(tǒng)要求,駕駛者不一定需要對所有的系統(tǒng)請求做出應答,包括限定道路和環(huán)境條件等;
L5為全自動駕駛,在所有駕駛者都能應付的道路和行車環(huán)境條件下,都可以由自動駕駛系統(tǒng)自主完成所有的駕駛操作。
L0至L5的核心區(qū)別在于汽車的自動化程度,體現(xiàn)在轉向與加減速控制、對汽車周圍環(huán)境的觀察、處理緊急突發(fā)狀況的應變能力。就目前來說,人們還在進行L3、L4級的研發(fā)中,離L5全自動駕駛還有一段較長的距離。
數(shù)據(jù)標注對自動駕駛的重要性
自動駕駛主流算法模型主要以有監(jiān)督的深度學習方式為主,是基于已知變量和因變量推導函數(shù)關系的算法模型,需要大量的結構化標注數(shù)據(jù)對模型進行訓練和調優(yōu)。
相比其他的人工智能使用場景,自動駕駛對于數(shù)據(jù)標注有著更高的要求。因為自動駕駛在實際行駛過程中需要面對更多更復雜的場景,會有許多突發(fā)狀況。當自動駕駛汽車在路面上行駛時,它既需要判斷路線的正確性,還需要對路面上的障礙進行識別,在行車過程中,周圍的環(huán)境變化是很難預料的,因此,為自動駕駛技術提供足夠且真實的場景數(shù)據(jù)是解決自動駕駛技術安全性問題的關鍵。數(shù)據(jù)標注的準確性越高,就越能保證大量數(shù)據(jù)能被正確且合理應用。
自動駕駛領域中常見的數(shù)據(jù)標注方法
在自動駕駛領域中常見的數(shù)據(jù)標注方法有:2D框標注,指示牌、信號燈標注,3D立方體標注,車輛多邊形標注,3D雷達點云標注,有線段標注,圖像語義分割,視頻跟蹤標注,ASR 轉寫等。
1、2D框標注
2D框標注被廣泛應用于對車輛與行人的識別當中,即對圖片中的車輛和行人進行標注,并通過框的屬性來開展測試模型。
景聯(lián)文科技采集標注了《2D拉框標注訓練集100000張》,《巡檢小車2D標注圖像訓練集49980張》等直接用于自動駕駛算法研究的數(shù)據(jù)集。
2、3D立方體標注
3D立方體標注就是對車輛進行3D標注,主要應用于訓練自動駕駛對周圍行駛的車或超車車輛的體積進行判斷。
景聯(lián)文科技采集標注了《21000張車輛3D立方體標注圖像數(shù)據(jù)集》,可直接用于自動駕駛算法研究。
3、車輛多邊形標注
車輛多邊形標注可以精準的標注出車輛的形狀信息,主要應用于對車輛類型進行識別。
景聯(lián)文科技采集標注了《23000張車輛多邊形標注圖像數(shù)據(jù)集》,可直接用于自動駕駛算法研究。
4、多段線標注
多段線標注多用于對道路地面標線進行的包括分類標注、區(qū)域標注和語義標注的一種綜合性標注,在智能駕駛場景中被應用在標注車道線,使自動駕駛車輛可以按照車道線的規(guī)則進行行駛。
景聯(lián)文科技采集標注了《24400張多段線標注圖像數(shù)據(jù)集》,可直接用于自動駕駛算法研究。
5、指示牌、信號燈標注
指示牌、信號燈標注是一種對在道路上懸掛的指示牌和信號燈進行的綜合標注,標注包括區(qū)域標注、語義標注,使自動駕駛能夠根據(jù)交通規(guī)則進行安全的行駛。
景聯(lián)文采集標注了《10000張指示牌標注圖像數(shù)據(jù)集》、《15000張信號燈標注圖像數(shù)據(jù)集》等數(shù)據(jù)集,可直接用于自動駕駛算法研究。
6、圖像語義分割
語義分割是一種較為廣泛的標注,就是對圖片中的不同區(qū)域進行分割標注,將圖像變成帶有一定語義信息的色塊,并給每個像素都標注上其對應的標簽,從而實現(xiàn)從底層到高層的語義推理過程,最終得到一張具有各個像素語義標注信息的分割圖像。這些類型可能是“行人,車輛,建筑物,天空,植被等等。這可以很好的幫助智能駕駛車輛識別道路上的可行駛區(qū)域。
景聯(lián)文科技采集標注了《50000張圖像語義分割數(shù)據(jù)集》,可直接用于自動駕駛算法研究。
7、視頻跟蹤標注
視頻跟蹤標注是指跟蹤標注視頻中行駛的車輛,按照圖片幀抓取進行標框標注,標注后的照片再按照順序重新組合排列成視頻數(shù)據(jù),可以用來訓練自動駕駛模型。
景聯(lián)文科技采集標注了《21400段視頻跟蹤標注數(shù)據(jù)集》,可用于自動駕駛算法研究。
8、3D點云標注
3D雷達點云標注是將視頻場景通過3D圖像來精確描繪出對象形狀、運動軌跡等信息,3D雷達點云標注主要被用在自動駕駛虛擬現(xiàn)實的搭建之中。
3D點云連續(xù)幀標注是自動駕駛場景中應用較為廣泛的一種數(shù)據(jù)處理標注類型,對三維空間的感知能力以及多幀同時協(xié)同處理能力的要求較高,標注時需要關注連續(xù)幀對象ID、對象框大小、軟性與剛性物體標注標準等內容。
景聯(lián)文科技采集標注了《24000張車輛行人3D點云標注圖像訓練集》,對馬路采集圖片進行3d點云信息數(shù)據(jù)標注,可直接提供給算法廠家用于研究自動駕駛算法研究。
9、ASR語音轉寫
ASR語音轉寫常被用于自動駕駛系統(tǒng)中的語音助手領域,可以很好地協(xié)助駕駛員管理和控制車輛。
景聯(lián)文科技采集標注了《88000段車載喚醒詞語音數(shù)據(jù)集》,在駕駛車內靜止環(huán)境下,關窗,開發(fā)動機,空調2檔,主駕位置,麥克風間距140mm的情況下進行采集,可直接用于自動駕駛有關人機交互的算法研究中,大力節(jié)約了算法研究廠商的研發(fā)時間。
景聯(lián)文科技為自動駕駛提供數(shù)據(jù)支持
作為一家專業(yè)的數(shù)據(jù)采集標注公司,景聯(lián)文在AI數(shù)據(jù)服務行業(yè)有獨特的優(yōu)勢,
技術優(yōu)勢
景聯(lián)文科技獲得高新技術企業(yè)認定,有專業(yè)的技術團隊,自研數(shù)據(jù)標注平臺,擁有成熟的標注、審核、質檢機制,支持計算機視覺(拉框標注、語義分割、3D點云標注、關鍵點標注、線標注、2D/3D融合標注、目標跟蹤、圖片分類等)、語音工程(語音切割、ASR語音轉寫、語音情緒判定、聲紋識別標注等)、自然語言處理(OCR轉寫、文本信息抽取、NLU語句泛化)多類型數(shù)據(jù)標注,通過預標注的智能化數(shù)據(jù)處理方式能降低數(shù)據(jù)標注時間,節(jié)約人力成本。
服務優(yōu)勢
景聯(lián)文科技通過數(shù)百個真實項目實戰(zhàn),內部形成了完善的標注人才培養(yǎng)系統(tǒng),從項目經(jīng)理到質檢員到標注員,都要定期進行具體業(yè)務場景的標注課程培訓,通過層層考核才可以領取標注任務。景聯(lián)文尤其重視對項目經(jīng)理的培養(yǎng),團隊項目經(jīng)理除了熟練掌握工程化數(shù)據(jù)標注的項目組織、管理和質量控制的技術與方法外,對人工智能技相關術算法也有一定了解,與客戶的對接過程中能夠高效理解需求快速響應。景聯(lián)文科技實行管家式服務制,為每一個項目配備專屬商務經(jīng)理和對最熟悉該領域業(yè)務的項目經(jīng)理,提前部署,提前開始,提前交付,針對客戶的加急需求提供24小時加班業(yè)務,針對客戶的駐場需求提供全國各大城市標注人員駐場服務,盡全力為客戶提供省心省力省成本的一站式數(shù)據(jù)方案。
景聯(lián)文科技提供互聯(lián)網(wǎng)企業(yè),安防社區(qū),智慧交通駕駛,健康醫(yī)療,3C,內容審核六大領域AI數(shù)據(jù)解決方案,針對智能駕駛訓練數(shù)據(jù)需求提供如下服務。
1.現(xiàn)有數(shù)據(jù)集出售
在數(shù)據(jù)獲取階段,景聯(lián)文現(xiàn)有數(shù)據(jù)庫擁有超過500小時的車載語音交互數(shù)據(jù)集,覆蓋多種車型,天氣,道路類型及語音噪音場景,擁有20萬張駕駛員乘客行為檢測識別數(shù)據(jù)集,重點包括駕駛員打電話,抽煙等危險行為,動態(tài)靜態(tài)手語手勢數(shù)據(jù)集,部分成品標注訓練集即買即用,部分原始數(shù)據(jù)集也可以根據(jù)客戶的具體需求進行標注。
2.數(shù)據(jù)采集
針對更加對場景還原性更高的智能駕駛數(shù)據(jù)采集項目,不管是駕駛員行為,街景場景,還是車載語音數(shù)據(jù),景聯(lián)文科技都擁有非常豐富的場景搭建能力和項目實施經(jīng)驗,支持自動駕駛場景下駕駛艙內艙外不同類型的數(shù)據(jù)采集任務,包含多場景,多天氣狀況,多環(huán)境狀況,涵蓋了覆蓋身份認證,活體驗證,手勢識別,視線追蹤,動作識別,動態(tài)目標檢測,標志牌等多場景,包括不同車型下語音數(shù)據(jù)采集,多語種車載語音數(shù)據(jù)集,遠場和近場語音數(shù)據(jù)采集,提供超過50余種語言和方言語料,輔助自動駕駛技術在復雜的環(huán)境下感知實際行車道路、車輛位置和周圍障礙物信息,可滿足自動駕駛領域不同落地場景下的高質量AI訓練數(shù)據(jù)需求。
3.數(shù)據(jù)標注
景聯(lián)文科技支持自動駕駛全部類型標注業(yè)務,在2D框標注,指示牌、信號燈標注,3D立方體標注,車輛多邊形標注,3D雷達點云標注,有線段標注,圖像語義分割,視頻跟蹤標注,ASR 轉寫等每個業(yè)務中都有超過數(shù)幾十次的標注實戰(zhàn)經(jīng)驗。
其中,激光雷達是自動駕駛汽車的核心感知傳感器,也是道路上的路側傳感器,3D激光點云標注總體規(guī)則基本為完整腦補框,不允許漏點,框需貼合真實形狀、類型屬性準確、序列中標注框尺寸保持一致,靜止時保持穩(wěn)定無抖動、tracking信息準確、標注尺寸和類型對應、應標盡標等,其本質就是在點云上面拉框調整貼合度和航向角。
景聯(lián)文科技自建的標注平臺支持對點云的渲染與標注,通過對渲染引擎等方面的優(yōu)化,可流暢使用三維邊界框標注點云上的目標,還可標注該目標的類別、行為和置信度,平臺還支持點云和圖片的深度融合標注,通過對點云上的目標的三維邊界框標注,使該幀點云對應的2D圖像上的該目標也會被自動標注,點云的精準定位也可助力算法訓練。景聯(lián)文科技擁有豐富的3D點云標注經(jīng)驗,可滿足甲方的要求,對數(shù)據(jù)質量做到全程把控,標注合格率可達99%。
成功案例
案例一、景聯(lián)文科技于2021年成功中標某頭部科技廠商的車輛行人及指示牌信號燈為一體的數(shù)據(jù)2D拉框標注項目,該項目難度非常大,需要在白天和晚上兩種不同環(huán)境中的圖片上進行標注,總標注圖片量達到20萬條,框數(shù)達到40w個,準確率要達到98%,而且客戶要求的交付時間非常緊,工期只有15天,項目難度非常高,
景聯(lián)文科技的采標團隊利用自身完善且快捷的標注平臺、穩(wěn)定且高素質的標注團隊,輕松實現(xiàn)2D拉框的快速標注,經(jīng)過全量質檢和兩輪抽檢三次數(shù)據(jù)質檢后,進行分批提交數(shù)據(jù),針對已提交數(shù)據(jù)所反饋的問題,及時與客戶確認,加班對團隊進行培訓,調整標注規(guī)范返修數(shù)據(jù)。最終該項目在期限內提前足額完成交付,一次合格率達到 99.8%!最終交付數(shù)據(jù)完美達到客戶要求。
案例二、2021年,景聯(lián)文科技在3D點云領域中,與國內知名自動駕駛車輛企業(yè)達成深度合作關系,合作過程中景聯(lián)文標注點云圖片共計3w+幀,合計10w+個點云框,涵蓋了高速行駛路段,市區(qū)路段,指定測試場地等日常行車環(huán)境。
同時景聯(lián)文科技在標注3D點云過程中非常注重對品質的把控,在合作過程中景聯(lián)文科技交付的點云標注框合格率達到了99%,對每一幀的點云數(shù)據(jù)都嚴格依照參考圖片標注,不漏標一個點云標注框,確保交付給客戶的每一幀點云都是精心標注后的臻品。
在標注過程中,景聯(lián)文科技保持著干凈利落的一貫作風,嚴謹排布標注方案,調用一切可用資源,有條不紊的按計劃進行數(shù)據(jù)標注,我們能在客戶指定的工期內,提前交付保質保量的數(shù)據(jù),對工期進行嚴格把控。