2020年7月末,工信部、科技部、國家標準化管理委員會、中央網信辦、國家發展改革委等五部門聯合印發《國家新一代人工智能標準體系建設指南》(以下簡稱《指南》),《指南》旨在加強人工智能領域標準化頂層設計,推動人工智能產業技術研發和標準制定,促進產業健康可持續發展。值得關注的是,在該《指南》中,智能家居明確作為重點行業之一進行推進發展。
智能家居融合了IoT、人工智能、邊緣計算等信息技術,從開關到大家電,從門鎖到窗簾,均可實現智能化操控,動動手指,或者說一聲就可以對家庭各種設備進行操控,甚至達到“無感”化服務體驗,應用場景相對更具集中性和確定性。
在音箱、電視、門禁等常見的家庭單品背后,操作系統、感知控制、內容生態等各個層面的協同升級,將會使得消費級的產品更多樣化,也更加成熟。依托于電視、音箱、掃地機器人等常見的智能產品,未來需要不斷地對場景進行挖掘延伸,產生更多“小場景”數據并進行標注,從而去訓練算法,讓其變得更加“聰明”。
那么,智能家居到底需要什么樣的AI數據呢?云測數據扎根于AI數據服務領域,在服務眾多智能家居頭部企業的過程中,積累了豐富的數據采集和數據標注經驗,對此問題作出了解答。
一、聚焦于場景的AI數據
由于智能家居多以房屋、住宅、社區為載體,應用場景相對更具集中性和確定性,因此,智能家居更重產品更重體驗。
例如小愛音箱一類的智能音箱產品,用戶可以與之進行多輪對話,同時可以對其發出語音指令控制,從而實現點歌、查天氣等操作。在諸如此類的“小場景”下,數據的精細化、場景化程度就決定了算法有多“人性化”。而體現在產品的使用上,不僅可以避免出現語音助手答非所問的錯誤,也可以提升家庭多設備之間交互的效率。云測數據擁有充足的被采資源,并在業內首創“數據場景實驗室”模式,可最大程度還原搭建智能家居應用場景,同時擁有麥克風陣列等專業硬件設備,可提供語音、視覺類數據的場景化采集。
二、更高準確度的標注數據
在智能家居行業,人工智能主要解決的是機器在看、聽、理解方面的問題,因而語音識別與自然語言處理能力已經成為兵家必爭之地。數據標注則貫穿人工智能產品的探索期與商業落地階段,云測數據通過更加規范性的組織管理和質量控制,為人工智能迭代提供質量更高更可靠的數據服務,專注解決企業AI數據難題。通過高精準度的標注數據交付,從而為現階段AI商業化競爭提供高質量的數據支撐。在語音方面,支持ASR語音轉寫、聲紋識別標注、說話人識別、語音切割、情緒判定標注等;在自然語言處理方面,支持OCR轉寫、NLU語句泛化、文本信息抽取、實體標注、詞性標注、槽位填充等,支持全方位的標注類型。
三、更高效率的AI數據支撐
在人工智能時代,不僅是智能家居企業,各大領域的競爭越來越激勵,對于產品和服務的更新換代也有著越來越高的要求。因此,效率成為了企業發展的核心競爭優勢之一。保證生產效率這一點上,云測數據十分強調作業協同化。在AI數據生產中,云測數據設計了從創建任務、分配任務、標注流轉、到質檢/抽檢環節和最后的驗收等更完善的管理流程,每個環節有相應專業人員來把控數據標注的質量和時間節點,進行好上下游工作環節銜接,得以在保證質量的前提現下可以真正提高效率。助力智能家居企業搶占市場先機,把握核心競爭優勢。
四、更安全的AI數據保障
談及數據,必繞不開的一個話題就是數據隱私、數據安全。云測數據一直將AI數據隱私安全放在業務開展的首要地位。在保障AI數據隱私性、安全性方面,云測數據三管齊下。在數據采集之前,云測數據會與所有數據采集的用戶都簽訂數據授權協議,確保AI企業用于訓練的數據合法合規;同時,在AI數據合格交付后從不留底,堅持數據絕不復用的核心原則。此外,云測數據從內部信息系統的管護到標準化的流程作業體系都建立了確切的數據保障機制,力圖做到步步保護、層層把關。
在云測數據看來,讓智能家居企業擁有數據會成為企業核心的競爭壁壘。客戶選擇與云測數據合作,不僅是對高質量數據交付的認可,也是信任云測數據對AI數據隱私安全的掌控,從而更好的推進智能家居商業化。
綜合來看,云測數據認為,場景化、高質量、高效率、更安全的AI數據,更符合當下智能家居產業的落地應用階段。利用好上述幾點優勢,AI數據或許能成為智能家居突破瓶頸進入下一個爆發期的 “得力助手”。優質的AI數據,可以讓一切剛剛好,讓智能家居更智能,驅動人們智慧生活得以實現。