近期,在中國人工智能產業發展聯盟和中國信息通信研究院聯合舉辦的 “AI數據治理技術沙龍”中,云測數據總經理賈宇航針對AI數據高質交付背后的服務、技術與流程等方面內容進行了相關分享,并強調隨著人工智能行業發展不斷涌現出新技術新趨勢,人工智能數據的采標服務需滿足的AI應用場景比以往明顯更加廣泛,隨著而來對數據標注精度、交付效率、知識經驗的要求越來越高,AI產業對數據的拓展性需求和前瞻性需求將快速增長。
回顧過去,早期的AI數據行業曾長期處于粗放的發展模式,數據粗制、混亂、復用的情況屢見不鮮;但隨著AI與各個產業結合得愈加緊密,AI商業化程度進入新的高度,行業屬性較強的垂直領域加速落地,AI數據的需求正逐漸轉向個性化、場景化和準確化,頭部數據服務供應商的技術實力、精細化管理能力、流程把控能力正在不斷提升。
在多元化的人工智能場景落地背景下, AI和傳統行業之間的融合、協作越來越多,孕育著大量的新興細分市場,AI行業應用場景趨于長尾和碎片化。伴隨著人工智能產品的迭代,AI數據的演進過程也伴隨著自身選擇的演化,體現在數據多維化、場景多元化、樣本多樣化、內容專業化、作業精細化、作業高效化等方面。賈宇航認為,在人工智能數據市場中,數據服務商想要形成強勁的業務優勢,就要擺脫同質化競爭,保持在模式、技術、服務等方面的不斷發展:
● 一是加強場景化數據的采集能力,換言之就是為人工智能細分場景的落地,提供更加垂直且豐富的數據,滿足其長尾場景的需求;
● 二是提升數據標注的準確性,從工具、規則、流程的開發制定,到標注人員的素質培養,不放過任何可以提升標注準確性的可能;
● 三是充分發揮“底層技術+服務能力”的力量,具備更深刻的行業領域知識、更懂場景、更懂技術、更具行業前瞻性。
賈宇航強調,人工智能時代下,數據是重要一環,推動著算法的應用。算法是一項技術,不獨立存在,需要嵌入到工程研發中,再通過市場的運營和競爭贏得相應的份額。在算法的研發中,從場景定義到算法部署,都與AI數據服務企業息息相關。
云測數據的發展策略是將產研做到全面覆蓋,率先形成AI訓練數據的“采、標、管、存”一站式服務,實現了從“數據原料”到最后的“數據成品”全鏈條打通,全方位賦能AI開發中數據引入這一環節。目前。云測數據已經建立了數據產品、數據處理工具與數據服務的“三螺旋”,為智能駕駛、智慧城市、智能IOT、智慧金融等行業提供高效率、高質量、多維度、場景化的數據服務與策略,最大化發揮訓練數據的價值。
同時,云測數據以技術創新加速行業發展為己任,通過推出“云測數據標注平臺”、“AI數據集管理系統”等技術成果,為AI相關企業提供處理大規模感知數據的能力,通過結構創新、智能化、工程化、標準化的標注平臺產品賦能AI訓練數據行業,極大地加速了人工智能相關應用的落地迭代周期,節省大量研發時間和成本,進而推進AI產業的場景化落地。
當前,不管是人工智能技術的研發以及應用領域的發展,“數據”都是一個不可或缺、位于重中之重的因素。AI數據作為新的生產要素聲名漸顯,它是人工智能長期發展的重要保障,人工智能技術研發、訓練的關鍵。這其中,云測數據正在持續引領行業,推動AI數據行業的發展。相信在未來,云測數據將持續保持自主創新性,堅持與時俱進,更好的為人工智能提供訓練數據服務,為數據要素有序發展及高效利用發揮推動作用。