9月4日,2020年中國國際服務貿易交易會在北京國家會議中心如期舉辦,據統計,有148個國家和地區的33家國際組織、74家駐華使館、110家境外商協會及機構、17158家企業機構、96635人參展參會,世界500強企業中,也有399家企業的總部或分公司參展參會。作為疫情之后的首場線下重大國際經貿活動,業界大咖們匯聚于此,共同關注疫后產業突圍的思考。
在這場大會上,值得關注的自然是科技領域。會上,黑科技林立,人工智能影像互動技術、人工智能和物聯網應用、AI巡控機器人等等悉數亮相,指向了一個共同的亮點——人工智能,而作為人工智能的三要素之一的重要產業——AI數據服務。在這場盛會上,云測數據代表行業首次對外發布最新AI數據服務成果——云測數據項目最高交付精準度達到了99.99%,遠超平均95%精準度的業內水平。云測數據憑借多年來企業服務積累的豐富經驗,先進的數據采集管理水平和自建數據采集中心的優勢,將持續為AI行業提供穩固的發展基石。
眾所周知,在AI領域,“成也數據,敗也數據”,而在大數據時代,隨著AI產品的逐漸落地,除去“大”和“多”兩個關鍵詞,“精準”成為了更重要的衡量維度,對于AI產品來說,AI數據的精準度失之毫厘則差之千里,而在AI產品落地的過程中,AI數據精準度的差異會愈發的明顯。
以貼近日常生活的AI技術為例——在購物軟件上,很多消費者會習慣于使用“拍圖識物”的功能,縮短挑選商品的路徑。更加精準的AI數據,則可以讓軟件更加迅速準確地識別圖片上的關鍵圖像,協助消費者迅速的篩選心儀的商品,避免“大海撈針”式的低效搜索。所以,無論是在助力AI產品的實際落地和應用上,還是在日常生活的點滴之中,高精準度的AI數據都承擔著相當重要的作用。
云測數據提供的,就是這樣高質量、高精準度的AI數據,為人工智能企業提供堅實的數據核心壁壘。
根據2018年智研發布的《2019-2025年中國數據標注與審核行業市場專項分析研究及投資前景預測報告》顯示,近幾年,數據標注與審核行業快速發展,2018年市場規模已達到52.55億元,而在這樣的增量市場中,大批看到了企業需求的AI數據從業者瘋狂涌入,使得整個行業出現良莠不齊的情況,這對追求用戶體驗的人工智能產品而言是致命的,“如果數據不夠純凈,就像人吃了壞掉的食物,只會產生病狀,不能起到吸收利用的作用。用到機器學習中,就會破壞AI的數據學習體系,產生大的誤差,而誤差產生后,后續的自主學習又會產生偏離,形成惡性循環。”云測數據總經理賈宇航這樣說道。
為了解決這樣的問題,云測數據做出的改變,是引領數據標注行業,從“勞動密集型產業”轉化為“技能密集型產業”。云測數據做出的積極改變,首先從AI數據的源頭開始,提升AI數據獲取的純凈度——行業首創數據場景實驗室,為各種細分場景模擬無噪的落地場景數據。
為了進一步提高標注過程中的精準度,云測數據團隊還研發出了自有的標注平臺,從圖像、文本和音頻三個維度進行數據的精準標注。而在針對一些特殊的標注時,例如自動駕駛中的3D點云標注,這套自研標注工具中先進的渲染引擎,能提升整個過程的流暢和快捷,保證準確性,同時通過降低人為因素可能導致的誤差,確保了降本提效。
在標注人員的管理上,云測數據也配備了完善的流轉機制、培訓機制、晉升機制等。為了確保在專業要求較高的領域標注人員能夠做出正確的標注判斷,云測數據還配備專門的培訓師,對每個行業細分領域的專業知識進行培訓。
以大家生活中很熟悉的AI電話客服為例,當AI客服詢問用戶是否購買某款商品時,各種用戶會給出不同回答:“我要和家人商量一下”;“我會考慮”;“我現在不方便,你一會兒再打過來”等等,背后的含義各式各樣,可能是暫不購買,暫不考慮,拒絕購買或者興趣較大。那么,數據標注就需要對這些對話背后的意圖進行標注和分類。而經過培訓,數據標注員可以迅速而精準地對句子進行泛化,以不同的描述方式重組或擴充句式、標簽等,大大提升了AI對話的準確度和客戶的滿意程度,而只有這樣的服務,才能使得AI客服的落地具有實用意義,放諸其他AI領域,道理也是相同的。
在以上各個方面的共同作用下,云測數據才得以呈現出如今最高精確率高達99.99%的高質量AI數據。
沒有AI數據,人工智能就沒有未來,是過去業內廣為流傳的真理,而現在,隨著AI技術的不斷發展,在技術平臺搭建日益完善的如今,“沒有高質量的AI數據,人工智能沒有未來”,將成為更多AI從業者的共識。畢竟,AI技術發展的瓶頸已經在逐漸打破,落地實用將成為行業的下一個挑戰。高精準度、高質量的AI數據,將助力AI 產品具備更強大的服務能力,走進千家萬戶的現實生活。
而作為服務了眾多頭部互聯網企業、科技企業和智能化轉型的傳統企業的云測數據,始終走在提升平臺技術實力、數據精準效率、數據隱私安全的路上,通過于提供更高質量的AI數據服務,為AI 產業的發展持續賦能。