人工智能是新一輪科技革命和產業變革的重要驅動力量。麥肯錫公司的數據表明,人工智能每年能創造3.5萬億至5.8萬億美元的商業價值,使傳統行業商業價值提升60%以上。 數據作為人工智能的核心要素之一,對人工智能技術積極發展起著至關重要的作用。
從AI產業鏈的發展情況和未來發展趨勢來看,中國AI數據服務行業的市場規模正在逐步擴大。一方面,隨著算法模型、技術理論和應用場景的優化和創新,AI產業對訓練數據的拓展性需求和前瞻性需求均快速增長;另一方面,隨著行業內對訓練數據需求類型的增加以及對服務標準要求的提高,產業鏈的專業化分工將愈加清晰,行業向著專業化、規范化方向快速發展。
作為AI數據服務市場的代表廠商之一,云測數據在業務端面向智能駕駛、智慧城市、智能家居、智慧金融、新零售等眾多領域提供一站式數據處理服務,提供通用數據集、數據標注平臺&數據管理系統等生產工具,持續為計算機視覺、語音識別、自然語言處理、知識圖譜等AI主流技術領域提供高價值數據支持;在行業端也在積極推動完善AI數據服務生態發展,通過豐富成熟的數據服務與策略積累,聯合AI領域各大代表企業積極推動行業相關標準體系化的建設,為行業的高速、健康發展貢獻力量。
參編AI開發管理標準,引領能力輸出
近年來,Model/MLOps在人工智能業界廣受關注,并從模型全生命周期治理等角度助力企業中各類角色高效協作,進而賦能業務價值提升。目前Model/MLOps管理體系還處于初級發展階段,在流程規范性、過程自動化、標準一致性等方面有待提升,亟待開展Model/MLOps標準體系的編制工作。
由中國信通院云大發布的全球首個AI模型開發管理標準——《人工智能研發運營一體化(Model/MLOps)能力成熟度模型第一部分:開發管理》,填補了國內外機器學習項目開發管理標準的空白。其中,云測數據與百度、華為、京東等30余+業內知名企業共同參與了該系列標準的制定工作。該標準從需求管理、數據工程和模型開發等3個能力子域切入,包括10個能力項和28個能力子項,對機器學習開發管理過程提出了五個級別的能力要求,分別為基礎級、專業級、優秀級、卓越級和領航級。同時該標準從模型全生命周期治理等角度助力為企業中各類角色高效協作提供了指導意見,可以幫助企業提升AI研發運營效能,賦能業務價值提升,促進企業智能化轉型。
輸出智能駕駛標注規范,發揮專業價值
伴隨著智能AI時代、5G時代的到來,智能網聯汽車已成為全球汽車產業發展方向,數據作為原料,驅動著汽車智能化的進程。近年來,國內外各企業、高校及科研院所發布了眾多自動駕駛數據集,且智能網聯汽車復雜度呈指數級升高,未來針對智能網聯汽車開發及安全驗證需要基于海量場景數據進行。智能汽車場景下的場景數據標注、點云標注還存在形式各異、質量參差不齊的問題。
《智能網聯汽車場景數據圖像標注要求與方法》《智能網聯汽車激光雷達點云數據標注要求及方法》由中國智能網聯汽車產業創新聯盟提出,國汽(北京)智能網聯汽車研究院有限公司聯合行業力量編制完成。作為其中唯一一家訓練數據服務代表廠商,云測數據與中國科學院自動化研究所、中國汽車技術研究中心、北京汽車研究總院、一汽股份等業界代表力量共同起草編制。
兩項標準的發布旨在為行業提供場景數據圖像標注、數據點云標注的基本規范,并給出一套切實可行的標注方法,促進了場景數據圖像標注的標準化、提升場景數據的通用性和易用性。標準的研究和制定對我國智能網聯汽車場景數據標注的標準體系建設具有重要意義,填補了我國在智能網聯汽車場景數據標注標準的空缺,進而助力了智能網聯汽車的研發和測試,推動智能網聯汽車產業更好、更快發展。
自成立以來,云測數據一直以技術創新加速行業發展為己任,先后推出“云測數據標注平臺”、“AI數據集管理系統”等技術成果,為AI相關企業提供處理大規模感知數據的能力。未來,云測數據將繼續秉持為行業長遠發展的責任感,積極發揮實踐引領者作用,為推動AI數據服務行業高質量發展貢獻出“標準力量”。