近日,北京市經濟和信息化局舉辦了AIGC(生成式人工智能)產業鏈專精特新企業融通路演活動,并正式發布《AIGC產業鏈北京市專精特新企業圖譜》(下稱《圖譜》)。云測數據憑借豐富的高質量人工智能數據服務經驗和前沿數據平臺技術能力,入選《圖譜》數據層代表企業。
《圖譜》顯示,在AIGC產業鏈領域,北京市走在全國前列,在算力、數據、場景、投資、人才等方面優勢顯著,并有57家優質專精特新企業處在重要產業節點,包括算力層14家、數據層11家、模型層10家、應用層22家。北京市經濟和信息化局表示,入選《圖譜》的專精特新企業致力于突破算力芯片、中文數據集、深度學習框架等領域的卡點和堵點,為AIGC產業鏈強鏈、補鏈、固鏈貢獻力量,推動中國AIGC行業高質量發展。
云測數據作為人工智能產業發展的重要參與者和建設者,正在不斷用前沿技術推動AI訓練數據服務領域加速發展,自成立以來始終堅持以技術創新加速行業發展為己任,立足扎根市場的實踐積累,在保障數據隱私和安全合規的前提下,進行前瞻業務布局與前沿技術能力探索,持續為智能駕駛、智慧城市、智能家居、智慧金融等眾多領域提供高質量數據集、數據采集/數據標注服務、數據標注平臺&數據管理工具等,全方位支持文本、語音、圖像、視頻等各類型數據的處理。
當前,5G、邊緣計算等新基礎設施建設加速,自動駕駛、智慧醫療、智能制造等領域對人工智能的廣泛應用需求,大模型作為當前人工智能技術發展的關鍵方向,正在引領產業變革和產生深遠影響。與此同時,大模型也面臨訓練成本高、應用場景單一、缺乏高質量細分領域數據等難題。,海量高質量AI數據的獲取和處理能力,將直接影響一個機構在大模型技術上的競爭力。此前,云測數據已推出垂直行業大模型AI數據解決方案,為行業大模型提供從持續預訓練、任務微調、評測聯調測試到應用發布的端到端過程中的高質高效數據。
多年的人工智能數據服務經驗與技術積累,云測數據早已打造了豐富的數據樣本資源池以及多維數據采集工具和流水線作業化的數據清洗工作平臺,可以基于企業要求提供定向垂直場景的數據服務,為大模型持續訓練賦能。云測數據垂直行業大模型數據解決方案,可以為行業客戶深度定制數據采集方案,助力獲取高價值數據,在面對微調任務會根據大模型落地場景特點,提供包含QA-instruct、prompt等文本類任務項目和多模態大模型的相關能力支持。在完成微調后,云測數據通過垂直領域的人員和專家積累+評測體系和服務,幫助企業對各個垂直應用落地領域進行評估。并通過以集成數據底座為核心的數據標注平臺,將難例數據回流完成清洗標注,為更有效率的模型調優做準備。
目前,云測數據已率先形成了人工智能數據的“采、標、管、存一站式服務”,結合豐富的行業經驗、產研技術投入、管理體系等,持續為計算機視覺、語音識別、自然語言處理、知識圖譜等AI主流技術領域提供高價值數據支持。深度合作伙伴覆蓋了多個行業,包括汽車、安防、手機、家居、金融、教育、新零售、生態系統等。