自動(dòng)駕駛車(chē)企引入數(shù)據(jù)驅(qū)動(dòng)的端到端的開(kāi)發(fā)流程
盤(pán)點(diǎn)車(chē)企在自動(dòng)駕駛領(lǐng)域的布局,除了特斯拉、理想、蔚來(lái)、小鵬等造車(chē)新勢(shì)力,傳統(tǒng)車(chē)企也愈加重視自動(dòng)駕駛業(yè)務(wù),紛紛成立獨(dú)立子公司專(zhuān)注于智能駕駛的開(kāi)發(fā),如一汽集團(tuán)成立人工智能子公司一汽(南京)科技開(kāi)發(fā)有限公司;長(zhǎng)城汽車(chē)成立毫末智行;上汽集團(tuán)籌建軟件中心上汽零束等。
自動(dòng)駕駛行業(yè)專(zhuān)家們使用基于深度學(xué)習(xí)的開(kāi)發(fā)流程——也就是數(shù)據(jù)驅(qū)動(dòng)的端到端的開(kāi)發(fā)流程來(lái)研發(fā)自動(dòng)駕駛系統(tǒng),基本按照如下思路:數(shù)據(jù)采集->數(shù)據(jù)存儲(chǔ)->數(shù)據(jù)預(yù)處理->數(shù)據(jù)挖掘->數(shù)據(jù)標(biāo)注->模型訓(xùn)練->仿真測(cè)試->部署發(fā)布。在這個(gè)環(huán)節(jié)中使用的工具鏈決定了整個(gè)系統(tǒng)開(kāi)發(fā)的效率。
自動(dòng)駕駛是2020至今AI基礎(chǔ)數(shù)據(jù)服務(wù)支出規(guī)模最大的細(xì)分行業(yè),同時(shí)也是最具增長(zhǎng)潛力的行業(yè),主要數(shù)據(jù)采集需求包括車(chē)內(nèi)駕駛艙以及車(chē)外道路環(huán)境感知等場(chǎng)景。數(shù)據(jù)處理包括對(duì)攝像頭數(shù)據(jù)、毫米波雷達(dá)數(shù)據(jù)、激光雷達(dá)點(diǎn)云數(shù)據(jù)進(jìn)行去噪清洗,去除地理位置、人臉、車(chē)牌等敏感信息并且統(tǒng)一格式。數(shù)據(jù)處理完成后對(duì)數(shù)據(jù)進(jìn)行標(biāo)注,標(biāo)注類(lèi)型大致分為2D、3D目標(biāo)物標(biāo)注、聯(lián)合標(biāo)注、車(chē)道線標(biāo)注和語(yǔ)義分割等。
由于具體采集規(guī)范和標(biāo)注質(zhì)檢流程異常繁瑣,對(duì)自動(dòng)駕駛車(chē)企來(lái)說(shuō)數(shù)據(jù)采集標(biāo)注的外包化和對(duì)高質(zhì)低價(jià)的追求也趨于明顯。
IDC發(fā)布的《中國(guó)人工智能基礎(chǔ)數(shù)據(jù)服務(wù)市場(chǎng)追蹤報(bào)中》中提出標(biāo)注質(zhì)量、標(biāo)注效率、知識(shí)經(jīng)驗(yàn)、數(shù)據(jù)安全、整體成本五個(gè)維度,是用戶(hù)對(duì)AI數(shù)據(jù)服務(wù)商最重要的能力要求。景聯(lián)文科技是AI基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)的頭部供應(yīng)商,也是長(zhǎng)三角地區(qū)最大的自動(dòng)駕駛數(shù)采集標(biāo)注公司,擁有10年專(zhuān)業(yè)數(shù)據(jù)采集經(jīng)驗(yàn),成立至今已為【阿里巴巴】,【華為】,【美團(tuán)】,【海康威視】等數(shù)百家AI頭部企業(yè)提供數(shù)據(jù)解決方案。
自動(dòng)駕駛場(chǎng)景中應(yīng)用較為廣泛的數(shù)據(jù)標(biāo)注類(lèi)型
在以深度學(xué)習(xí)為主的感知模型中,主流的深度學(xué)習(xí)訓(xùn)練方法還是監(jiān)督學(xué)習(xí),用這種方法訓(xùn)練,需要向模型“喂養(yǎng)”海量有“真值(Ground Truth)”的數(shù)據(jù)。模型訓(xùn)練對(duì)標(biāo)注數(shù)據(jù)的質(zhì)量要求很高,數(shù)據(jù)質(zhì)量直接決定了訓(xùn)練出來(lái)的模型精度高低,標(biāo)注質(zhì)量又和標(biāo)注成本密切相關(guān),選擇小型標(biāo)注團(tuán)隊(duì)的廉價(jià)勞動(dòng)力能否滿(mǎn)足開(kāi)發(fā)者們的需求是一個(gè)問(wèn)題,高質(zhì)量的標(biāo)注要求,必然導(dǎo)致人力成本上升,低價(jià)格則會(huì)影響標(biāo)注質(zhì)量,高質(zhì)量和低價(jià)格是一個(gè)需要開(kāi)發(fā)者平衡的矛盾。
景聯(lián)文科技位于杭州,作為行業(yè)內(nèi)具備一定規(guī)模的平臺(tái)型廠商,為了提升標(biāo)注服務(wù)的質(zhì)量/價(jià)格比,大力優(yōu)化標(biāo)注平臺(tái)實(shí)現(xiàn)Al數(shù)據(jù)的全生命周期管理和供應(yīng)鏈管理,項(xiàng)目協(xié)同,AI人機(jī)協(xié)同,自定義權(quán)限的數(shù)據(jù)處理能力,全面支持圖像、音頻等數(shù)據(jù)標(biāo)注需求,支持多類(lèi)型標(biāo)注模板,標(biāo)注結(jié)果支持多種格式在線導(dǎo)出。支持全面標(biāo)注、質(zhì)檢、驗(yàn)收和管理,開(kāi)放甲方驗(yàn)收通道,可按照甲方要求轉(zhuǎn)換格式校對(duì)數(shù)據(jù)。并研發(fā)自動(dòng)化輔助標(biāo)注功能,運(yùn)用AI技術(shù)直接對(duì)2D圖像數(shù)據(jù)進(jìn)行場(chǎng)景分割、人臉和物體識(shí)別,自動(dòng)完成標(biāo)注后再由人工進(jìn)行校隊(duì),標(biāo)注員只需要對(duì)AI標(biāo)注的數(shù)據(jù)進(jìn)行檢查調(diào)整即可提交進(jìn)入審核,數(shù)據(jù)精準(zhǔn)度可達(dá)99.99%,提高標(biāo)注效率有效降低成本。
自動(dòng)駕駛場(chǎng)景中應(yīng)用較為廣泛的數(shù)據(jù)處理標(biāo)注類(lèi)型除了2D圖像標(biāo)注,還有3D點(diǎn)云連續(xù)幀標(biāo)注和2D3D點(diǎn)云融合標(biāo)注。在傳統(tǒng)逐幀標(biāo)注模式之下,無(wú)論采用手動(dòng)復(fù)制對(duì)象的模式還是自動(dòng)復(fù)制對(duì)象的模式,標(biāo)注效率都很難有所提升,景聯(lián)文標(biāo)注平臺(tái)在依據(jù)傳統(tǒng)標(biāo)注模式優(yōu)缺點(diǎn)的基礎(chǔ)上引入大量算法輔助,研究出專(zhuān)門(mén)針對(duì)點(diǎn)云連續(xù)幀標(biāo)注的人機(jī)協(xié)同模式“自動(dòng)關(guān)鍵幀”,在點(diǎn)云自動(dòng)關(guān)鍵幀標(biāo)注模式下,用戶(hù)只要對(duì)該連續(xù)幀中“起始幀”和“結(jié)束幀”進(jìn)行標(biāo)注,平臺(tái)算法就會(huì)自動(dòng)生成并調(diào)整中間幀上同一屬性對(duì)象,無(wú)需逐幀復(fù)制。這種模型在保持?jǐn)?shù)據(jù)準(zhǔn)確率的基礎(chǔ)上,使得標(biāo)注效率提升至10倍以上。
景聯(lián)文科技使用自研3D點(diǎn)云標(biāo)注平臺(tái),完成國(guó)內(nèi)知名高校的2D3D點(diǎn)云融合標(biāo)注項(xiàng)目,標(biāo)注2D圖片21000張,合計(jì)標(biāo)注35000個(gè)障礙物,涵蓋整個(gè)小區(qū),包括停車(chē)區(qū),道路等日常活動(dòng)區(qū)域;標(biāo)注點(diǎn)云圖片共計(jì)5000幀,合計(jì)20000個(gè)點(diǎn)云框,主要模擬居民小區(qū)內(nèi)日常行車(chē)及停車(chē)環(huán)境,交付的數(shù)據(jù)合格率均達(dá)到99%。
自動(dòng)駕駛場(chǎng)景數(shù)據(jù)標(biāo)注項(xiàng)目常見(jiàn)問(wèn)題和景聯(lián)文科技解決方案
隨著產(chǎn)業(yè)鏈的專(zhuān)業(yè)化分工愈加清晰,AI產(chǎn)業(yè)對(duì)訓(xùn)練數(shù)據(jù)的拓展性需求和前瞻性需求均快速增長(zhǎng),并且隨著需求方對(duì)訓(xùn)練數(shù)據(jù)質(zhì)量的要求不斷提高,垂直場(chǎng)景的定制化訓(xùn)練數(shù)據(jù)需求成為主流,需求方市場(chǎng)對(duì)訓(xùn)練數(shù)據(jù)的要求逐漸向精細(xì)化轉(zhuǎn)型,除此之外自動(dòng)駕駛領(lǐng)域標(biāo)注項(xiàng)目還存在著其他難度。
自動(dòng)駕駛領(lǐng)域標(biāo)注項(xiàng)目數(shù)據(jù)量和單個(gè)數(shù)據(jù)文件普遍較大,對(duì)數(shù)據(jù)精度的要求更高,因此對(duì)外包數(shù)據(jù)公司的標(biāo)注團(tuán)隊(duì)規(guī)模、自動(dòng)駕駛項(xiàng)目執(zhí)行經(jīng)驗(yàn)、服務(wù)器、平臺(tái)的承載能力有著更高的要求。景聯(lián)文科技在全國(guó)擁有四個(gè)大型標(biāo)注基地,為1000+數(shù)據(jù)標(biāo)注師提供綜合標(biāo)注技能培訓(xùn),通過(guò)項(xiàng)目輪轉(zhuǎn)形式使90%以上標(biāo)注人員執(zhí)行過(guò)自動(dòng)駕駛場(chǎng)景標(biāo)注項(xiàng)目,選擇大專(zhuān)以上學(xué)歷且對(duì)自動(dòng)駕駛算法需求有一定理解能力的標(biāo)注師專(zhuān)門(mén)負(fù)責(zé)2D3D融合等高難度標(biāo)注項(xiàng)目,同時(shí)對(duì)標(biāo)注平臺(tái)服務(wù)器、企業(yè)專(zhuān)線寬帶、辦公電腦配置進(jìn)行全面升級(jí),支持對(duì)大量數(shù)據(jù)同時(shí)進(jìn)行標(biāo)注操作并保證其加載速率。
同時(shí)針對(duì)自動(dòng)駕駛標(biāo)注項(xiàng)目易出現(xiàn)需求臨時(shí)變更的情況,景聯(lián)文科技為需求方配備多次執(zhí)行過(guò)自動(dòng)駕駛標(biāo)注項(xiàng)目的項(xiàng)目經(jīng)理和商務(wù)人員對(duì)接服務(wù),支持24小時(shí)加班和值班隨時(shí)溝通可能存在的需求變更,平臺(tái)研發(fā)團(tuán)隊(duì)隨時(shí)響應(yīng)標(biāo)注工具調(diào)整需求,在項(xiàng)目初期提前部署,提前開(kāi)始,確保數(shù)據(jù)提前交付并確保標(biāo)注準(zhǔn)確率。
通過(guò)標(biāo)注平臺(tái)實(shí)現(xiàn)標(biāo)審分離,完善平臺(tái)風(fēng)險(xiǎn)管控機(jī)制,且設(shè)置了嚴(yán)格的數(shù)據(jù)隱私安全保障措施。其核心原則為數(shù)據(jù)絕不二次利用和簽訂數(shù)據(jù)采集授權(quán)協(xié)議;同時(shí)設(shè)置了數(shù)據(jù)隔離、私有化部署等安全流程和技術(shù)。
做全球AI行業(yè)客戶(hù)的數(shù)據(jù)參謀。
自動(dòng)駕駛數(shù)據(jù)采集標(biāo)注項(xiàng)目聯(lián)系我們。