自從2012年深度學習在圖像和語音方面產生重大突破后,人工智能便真正具備了走出實驗室步入市場的能力。時至今日,人工智能的商業化在中國得到了長足發展,在安防、金融、企服等領域紛紛落地開花,同時也真正意義上衍生出了一套完整的產業鏈。
AI產業鏈可以分為基礎層、技術層和應用層,基礎層按照算力、數據和算法再次劃分,對整體上層建筑起到支撐作用;技術層根據算法用途分為計算機視覺、智能語音、自然語言處理等,是AI最引人注目的環節;應用層則按照不同場景的需求定制開發專屬服務,是AI真正賦能行業的方式。目前人工智能商業化在算力、算法和技術方面基本達到階段性成熟,想要更加落地,解決行業具體痛點,需要大量經過標注處理的相關數據做算法訓練支撐,可以說數據決定了AI的落地程度。
據了解,目前一個新研發的計算機視覺算法需要上萬張到數十萬張不等的標注圖片訓練,新功能的開發需要近萬張圖片訓練,而定期優化算法也有上千張圖片的需求,一個用于智慧城市的算法應用,每年都有數十萬張圖片的穩定需求;語音方面,頭部公司累計應用的標注數據集已達百萬小時以上,每年需求仍以20%-30%的增速上升,不僅如此,隨著IoT設備的普及,語音交互場景越來越豐富,每年都有更多的新增場景和新需求方出現,對于標注數據的需求也是逐步增長。
回顧過去,早期的AI數據行業曾長期處于粗放的發展模式,數據粗制、混亂、復用的情況屢見不鮮;但隨著AI與各個產業結合得愈加緊密,AI商業化程度進入新的高度,行業屬性較強的垂直領域加速落地,AI數據的需求正逐漸轉向個性化、場景化和準確化,頭部數據服務供應商的技術實力、精細化管理能力、流程把控能力正在不斷提升。
針對AI數據高質交付背后的服務、技術與流程等方面內容,云測數據總經理賈宇航在公開場合表示,隨著人工智能產品的迭代,AI數據的演進過程也伴隨著自身選擇的演化,體現在數據多維化、場景多元化、樣本多樣化、內容專業化、作業精細化、作業高效化等方面,在人工智能數據市場中,數據服務商想要形成強勁的業務優勢,就要擺脫同質化競爭,保持在模式、技術、服務等方面的不斷發展。
作為人工智能數據服務領域頭部代表廠商,云測數據在早期就已關注到AI數據服務的需求缺口和潛在的應用市場,立足高質量、場景化的AI訓練數據服務,率先形成AI訓練數據的“采、標、管、存”一站式服務,實現了從“數據原料”到最后的“數據成品”全鏈條打通并通過數據產品、數據處理工具與數據服務的“三螺旋”,為智能駕駛、智慧城市、智能IOT、智慧金融等行業提供高效率、高質量、多維度、場景化的數據服務與策略,最大化發揮訓練數據的價值,為人工智能場景化落地輸送更多數據支撐。
近年來,云測數據更是站在AI數據服務發展前沿,以技術創新加速行業發展為己任,通過推出“云測數據標注平臺”、“AI數據集管理系統”等技術成果,為AI相關企業提供處理大規模感知數據的能力,通過結構創新、智能化、工程化、標準化的標注平臺產品賦能AI訓練數據行業,持續為計算機視覺、語音識別、自然語言處理、知識圖譜等AI主流技術領域提供高價值數據支持,進而推進AI產業的場景化落地。
結合市場來看,隨著AI商業化發展,AI數據服務需求步入常態化,AI數據作為新的生產要素聲名漸顯,它是人工智能長期發展的重要保障,人工智能技術研發、訓練的關鍵。相信在未來,云測數據將持續保持自主創新性,堅持與時俱進,更好的為人工智能提供高質量、場景化的數據服務。