隨著人工智能技術的不斷發展,從智能家居到智能駕駛,從氣象診斷到金融風控,AI的應用范圍越來越廣泛,其帶來的效益也越來越顯著。大模型的訓練需要企業提供海量的訓練數據,對安全和隱私保護要求極高,而目前大模型的數據還需要大量的人工標注。
9月21日,華為全聯接大會2023上,華為云CTO張宇昕分享了華為云AI標注云桌面為
標注行業,提供安全高效的解決方案以及應用實踐。
華為云CTO 張宇昕
以汽車智能駕駛為例,在智駕過程中,智能駕駛系統根據周邊環境信息,如其他車輛、紅綠燈、行人等數據反饋,做出具體行為決策,如剎車、變道、超車等行為。要訓練出一套合格的感知算法,讓汽車處理更多、更復雜的場景,就需要有海量、準確、高質量的道路場景數據,由專業人員對數據進行標注,將其轉化為支撐算法訓練的數據。
然而,智能駕駛標注數據包含大量的地理信息3D點云、地理信息、軌跡等,大量涉及地理要素和場所位置信息,國家法規要求嚴格管控。當前,通過大模型,車企已經可以對這些敏感數據進行智能標注,然而,至少還有10%的數據需要由標注人員進行微調和手工標注。在這整個過程中,數據安全、標注效率、標注質量,無疑是車企最為關注的3大核心要素。
在數據安全方面,智能駕駛標注的海量地理數據都是敏感數據,以往的數據標注通過瀏覽器或客戶端進行,仍存在瀏覽器及本地緩存數據導致數據泄露的風險?,F在,華為云提供安全合規的云上汽車專區,可實現數據存儲、標注,模型訓練、仿真、部署全云上完成。通過AI標注云桌面,進一步保障數據標注環節的敏感數據不落地。
數據標注作為勞動密集型產業,往往通過第三方專業標注外包完成標注任務。為了滿足數據安全要求,企業要求標注人員集中到辦公區辦公并部署隔離網絡,或者給異地的外包團隊開通企業內網專線,成本高昂。通過華為云AI標注云桌面,分散在全國各地的標注員均可接入到安全的標注環境中,進入通過標注平臺進行安全標注。針對智能駕駛點云標注這類對顯卡有要求的標注場景,還可以通過GPU云應用降低企業標注終端的成本。
在標注效率方面,3D點云、圖片、視頻等在本地加載都要緩存,20M左右的標注數據往往要等待4到5秒才能加載完成。尤其是3D點云,一旦進行拖動,部分數據還需重新加載。現在華為云上數據互通,云端實時加載,結合華為云HDP高清顯示協議毫秒級傳輸,可即時加載高清圖片和視頻,實現圖像本地顯示時延降低50%以上,讓標注員快速流暢標注。
在標注質量方面,當遇到模糊數據,如惡劣天氣采集的路況圖像,往往需要多人研判,確保數據標注精準無誤。為了降低返工率,標注員一般通過即時消息軟件與同事求助研判,有時還需要截圖來解決標注難題,不僅低效,而且存在數據安全隱患。這個問題也可以通過華為云的多用戶協同桌面解決,其協同能力可支持標注員一鍵拉起協同,由經驗豐富的同事或專家進行標注操作,快速解決數據疑點,實現準確標注。
目前,華為云AI標注云桌面已經在華為智能汽車自動駕駛數據標注中使用,實現了7個城市的2000多名標注員跨地域在云上實現安全高效標注。
面向智能家居、安防、金融、互聯網等行業,在圖片、視頻、語音等人工標注場景,AI標注云桌面也將以其安全、高效、協同的能力,助力人工智能不斷向前。