數據與算法、算力堪稱人工智能行業“三駕馬車”。其中,數據從本質上決定了人工智能的落地水平。想要充分發揮人工智能技術的潛能,深度學習模型就需要海量且涵蓋圖像、視頻及語音在內等多種類型的訓練數據進行模型訓練。麥肯錫的研究報告也表明:深度學習模型對訓練數據的數據量、多樣性和更新速度方面提出較高要求。此外,人工智能技術要求算法模型根據潛在的應用場景變化而持續更新。
在前瞻性需求方面,隨著人工智能商業化進程的演進,新興 AI 應用場景如智聯網 AIoT、AI PaaS、產業互聯網等將展現出巨大的發展潛力,并逐步促進 AI 技術和算法模型的優化和創新。因此,在創新應用場景和新型算法的帶動下,具有前瞻性的訓練數據產品和高定制化的訓練數據服務需求將逐步成為主流。
云測數據總經理賈宇航結合實踐案例指出,在人工智能數據市場中,數據服務商想要形成強勁的業務優勢,就要擺脫同質化競爭,保持在模式、技術、服務等方面的不斷發展:一是加強場景化數據的采集能力,換言之就是為人工智能細分場景的落地,提供更加垂直且豐富的數據,滿足其長尾場景的需求;二是提升數據標注的準確性,從工具、規則、流程的開發制定,到標注人員的素質培養,不放過任何可以提升標注準確性的可能;三是充分發揮“底層技術+服務能力”的力量,具備更深刻的行業領域知識、更懂場景、更懂技術、更具行業前瞻性。
從細分結構來看,隨著AI技術的不斷成熟,更多的場景和行業開始嵌入使用AI技術,比如教育、法律、智能駕駛、銀行金融等,這些AI行業應用場景逐漸趨于長尾和碎片化,產生了大量細分專業化的數據需求。對于人工智能應用來說,AI數據的精準度失之毫厘則差之千里,而在人工智能應用落地的過程中,AI數據精準度的差異會愈發的明顯。
以云測數據為例,我們會發現其已經建立了數據產品、數據處理工具與數據服務的“三螺旋”,為智能駕駛、智慧城市、智能IOT、智慧金融等行業提供高效率、高質量、多維度、場景化的數據服務與策略,最大化發揮訓練數據的價值,為人工智能場景化落地輸送更多數據支撐。這種對AI數據的質量、效率、場景化方面提升的要求,才能推動數據要素有序發展及高效利用,助力企業在“百家爭鳴”的智能化浪潮中迎頭而上。
當前,以數據價值驅動的數字經濟正成為推動社會前進的主要模式,AI數據作為新的生產要素聲名漸顯,它是人工智能長期發展的重要保障、技術研發的關鍵。8月17-18日,由“科創中國”大灣區聯合體、深圳市科學技術協會指導的第四屆智能制造創新高峰論壇系列活動將在深圳福田舉辦。其中,云測數據即將在系列活動之一的新產品新技術發布會中發布行業前沿趨勢內容,為推動產業升級把脈新方向,值得期待。