近日,中國(guó)信息通信研究院發(fā)布《人工智能白皮書(2022年)》(以下簡(jiǎn)稱《白皮書》),全面回顧了2021年以來全球人工智能在政策、技術(shù)、應(yīng)用和治理等方面的最新動(dòng)向,重點(diǎn)分析了人工智能所面臨的新發(fā)展形勢(shì)及其所處的新發(fā)展階段,為各界提供參考,共同推動(dòng)人工智能持續(xù)健康發(fā)展。
《白皮書》指出,人工智能在追求極致創(chuàng)新方面不斷突破,圍繞著算法、算力和數(shù)據(jù)的技術(shù)創(chuàng)新始終是主旋律。在數(shù)據(jù)層面,隨著AI技術(shù)的發(fā)展,數(shù)據(jù)規(guī)模正在不斷提升,據(jù)IDC測(cè)算,2025年全球數(shù)據(jù)規(guī)模將達(dá)到163ZB;同時(shí),AI數(shù)據(jù)服務(wù)業(yè)進(jìn)入了深度定制化階段,根據(jù)不同場(chǎng)景和需求進(jìn)行數(shù)據(jù)定制的服務(wù),數(shù)據(jù)集需求也從通用簡(jiǎn)單場(chǎng)景向個(gè)性化場(chǎng)景過渡。
在多元化的人工智能場(chǎng)景落地背景下, AI和傳統(tǒng)行業(yè)之間的融合、協(xié)作越來越多,孕育著大量的新興細(xì)分市場(chǎng),AI行業(yè)應(yīng)用場(chǎng)景趨于長(zhǎng)尾和碎片化。伴隨著人工智能產(chǎn)品的迭代,AI數(shù)據(jù)的演進(jìn)過程也伴隨著自身選擇的演化,體現(xiàn)在數(shù)據(jù)多維化、場(chǎng)景多元化、樣本多樣化、內(nèi)容專業(yè)化、作業(yè)精細(xì)化、作業(yè)高效化等方面。
國(guó)內(nèi)領(lǐng)先AI數(shù)據(jù)服務(wù)廠商云測(cè)數(shù)據(jù)總經(jīng)理賈宇航認(rèn)為,想要充分發(fā)揮AI數(shù)據(jù)的價(jià)值,一是加強(qiáng)場(chǎng)景化數(shù)據(jù)的采集能力,換言之就是為人工智能細(xì)分場(chǎng)景的落地,提供更加垂直且豐富的數(shù)據(jù),滿足其長(zhǎng)尾場(chǎng)景的需求;二是提升數(shù)據(jù)標(biāo)注的準(zhǔn)確性,從工具、規(guī)則、流程的開發(fā)制定,到標(biāo)注人員的素質(zhì)培養(yǎng),不放過任何可以提升標(biāo)注準(zhǔn)確性的可能;三是充分發(fā)揮“底層技術(shù)+服務(wù)能力”的力量,具備更深刻的行業(yè)領(lǐng)域知識(shí)、更懂場(chǎng)景、更懂技術(shù)、更具行業(yè)前瞻性。
賈宇航強(qiáng)調(diào),人工智能時(shí)代下,數(shù)據(jù)是重要一環(huán),推動(dòng)著算法的應(yīng)用。算法是一項(xiàng)技術(shù),不獨(dú)立存在,需要嵌入到工程研發(fā)中,再通過市場(chǎng)的運(yùn)營(yíng)和競(jìng)爭(zhēng)贏得相應(yīng)的份額。在算法的研發(fā)中,從場(chǎng)景定義到算法部署,都與AI數(shù)據(jù)服務(wù)企業(yè)息息相關(guān)。
目前,云測(cè)數(shù)據(jù)已將產(chǎn)研做到全領(lǐng)域覆蓋,率先形成AI訓(xùn)練數(shù)據(jù)的“采、標(biāo)、管、存”一站式服務(wù),實(shí)現(xiàn)了從“數(shù)據(jù)原料”到最后的“數(shù)據(jù)成品”全鏈條打通,全方位賦能AI開發(fā)中數(shù)據(jù)引入這一環(huán)節(jié)。通過建立數(shù)據(jù)產(chǎn)品、數(shù)據(jù)處理工具與數(shù)據(jù)服務(wù)的“三螺旋”,為智能駕駛、智慧城市、智能家居、智慧金融等行業(yè)提供高效率、高質(zhì)量、多維度、場(chǎng)景化的數(shù)據(jù)服務(wù)與策略,最大化發(fā)揮訓(xùn)練數(shù)據(jù)的價(jià)值。
同時(shí),云測(cè)數(shù)據(jù)以技術(shù)創(chuàng)新加速行業(yè)發(fā)展為己任,通過推出“云測(cè)數(shù)據(jù)標(biāo)注平臺(tái)”、“AI數(shù)據(jù)集管理系統(tǒng)”等技術(shù)成果,為AI相關(guān)企業(yè)提供處理大規(guī)模感知數(shù)據(jù)的能力,通過結(jié)構(gòu)創(chuàng)新、智能化、工程化、標(biāo)準(zhǔn)化的標(biāo)注平臺(tái)產(chǎn)品賦能AI訓(xùn)練數(shù)據(jù)行業(yè),極大地加速了人工智能相關(guān)應(yīng)用的落地迭代周期,節(jié)省大量研發(fā)時(shí)間和成本,進(jìn)而推進(jìn)AI產(chǎn)業(yè)的場(chǎng)景化落地。
隨著算法模型、技術(shù)理論和應(yīng)用場(chǎng)景的優(yōu)化和創(chuàng)新,AI產(chǎn)業(yè)對(duì)訓(xùn)練數(shù)據(jù)的拓展性需求和前瞻性需求均快速增長(zhǎng)。行業(yè)內(nèi)對(duì)訓(xùn)練數(shù)據(jù)需求類型的增加以及對(duì)服務(wù)標(biāo)準(zhǔn)要求的提高,產(chǎn)業(yè)鏈的專業(yè)化分工將愈加清晰。AI訓(xùn)練數(shù)據(jù)作為人工智能的“老師”,成為訓(xùn)練機(jī)器的關(guān)鍵手段,專業(yè)化的訓(xùn)練數(shù)據(jù)服務(wù)提供商將扮演更加重要的角色。