近日,國家互聯網信息辦公室會同相關部門起草的《數據安全管理辦法(征求意見稿)》正式向全社會征求意見,涉及的主要內容包括數據收集、數據處理使用、數據安全監督管理三大部分,對AI和大數據行業將有深遠的影響,其中的重要環節——數據采集也必然迎來最嚴變革。
合規化是關鍵,全方位進行把控
人工智能的發展已經讓這項技術成功運用到不同場景中,這背后必然是基礎大數據的積累和支撐。其中,數據采集和標注充當的是基底角色,需要專門的人和可靠的服務來完成,而相比于后續的環節,人的參與度更高,便催生出了很多提供相關服務的公司。其中斗米的AI數據采集標注業務依托于斗米平臺的大流量和線下服務能力,已經為眾多知名公司提供了定制化服務,在行業里脫穎而出。
斗米數據服務的理念是:提供專業化的規劃、執行、管控等一站式采集項目落地解決方案,為客戶帶來性價比高,高效質優的服務。服務范疇涵蓋人臉圖像、人體圖像、商品圖片、場景圖片、語言文字、媒體內容、視頻監控、工業圖像、遙感圖像、醫療圖像、自動駕駛圖像,語音等。
無論是數據的采集還是使用,都需要合規先行。在合規的把控上,斗米用“五重”關卡為項目保駕護航。首先,在立項之初嚴格審核客戶資質。依照《中華人民共和國網絡安全法》等法律法規和《數據安全管理辦法》條例中的相關規則,對客戶資質、客戶采集需求、目的等相關信息,獲得合法授權后實施采集工作。其次,進行全方位合規把控。在獲得合法授權后,與被采集人員、數據采集執行人員分別簽訂授權書和承諾函。
而針對被采集者的個人隱私,斗米也格外重視。在收集相關數據前,不僅保證被采集方完整、合法、有效的相關數據收集、保存、使用授權,為尊重并保護被采集人員的權利,斗米還向其詳細闡述收集、保存、使用相關數據的相關規則。而針對未成年人,也設立了相關保護措施,由監護人或其他法定代理人簽署授權書,才能向采集方和需求方提供數據。同時斗米所有采集數據不緩存,不留存不做任何二次或多次轉賣等行為。為ai人工智能企業提供數據的唯一以及多樣性打下堅實基礎。
標準化和規范化實現高效高質
數據行業正成為人工智能發展的重要加速器,在這個過程中,不僅對數量有要求,數據的質量也至關重要。影響數據質量很重要的原則就是“標準化”、“規范化”,只有采集的方式標準化、規范化,才能最大限度的減少成本,提高效率。
斗米秉承對客戶負責的宗旨,從標準化入手,在客戶數量多、數據類型復雜的情況下,保證數據的數量和質量。依托于斗米的大流量(截止2018年年末,斗米平臺用戶量超7600萬)和專業的線下服務團隊(全國超過30座城市全職團隊,保障執行效果),成為有力支撐。而在質量把控上,則是分六步走,即數據清洗、整理篩查、人工審核、多重質檢、結構化提取、交付驗收。
無論是采集還是標注,在數據方面的投入的人力也是決定數據的質量的重要因素。“我們根據客戶的工作要求進行一手數據采集、定制化的數據加工方案的設計與執行服務,在人員和團隊上,通過嚴格的人員培訓考核準入機制,從項目經理到數據處理團隊,再到審核質檢機制,不斷提升團隊成員的技能,為客戶交付標準化、結構化的可用數據。”斗米AI數據采集標注業務相關負責人表示。
此外,數據的精準也是衡量數據質量的標尺。斗米通過大數據、智能搜索等技術手段,大大提高了精準度,在數據生產過程中,斗米也一直在不斷地尋求創新與突破,努力做到高效、快速的數據處理。
此外,數據的精準也是衡量數據質量的標尺。斗米通過大數據、智能搜索等技術手段,大大提高了精準度,在這個過程中,斗米也一直在不斷地尋求創新與突破,努力做到高效、快速,在需求明確下,24小時之內就能啟動,讓數據快速獲得。
隨著人工智能的快速崛起,數據服務類的公司及平臺必然迎來廣闊的前景,而隨著行業的不斷深化,合法化、規范化成為大勢所趨。以斗米為代表的服務平臺,以合規為前提,憑借標準化、規范化、專業化的優勢,為人工智能提供保障,助力行業實現飛躍!