5G商用后,音視頻內容生產得到了極大繁榮,網民們的注意力也被各類短視頻、直播、音視頻社交等平臺吸引,這些UGC平臺顯然已成為了新的流量聚集地。但當流量不再是問題,UGC平臺的音視頻內容合規性問題變得日益凸顯。
音視頻內容審核的行業困境
日前,多家互聯網應用的音視頻業務被曝出涉黃、涉暴、涉政、違禁等不良內容。平臺成了間接作惡工具,面臨約談、整頓、關停等違規處理,這給企業造成了難以估量的損失。而對音視頻平臺來說,針對海量內容逐一審核絕非易事,目前主要面臨兩大行業難題:
首先,審核效率低下。平臺作為網絡服務提供者,視頻內容大部分來自于用戶上傳,當用戶達到一定基數,每天百萬甚至千萬的視頻內容,客觀上給審核帶來了極大困難。
其次,有害信息難以發現。對于嬌喘呻吟、辱罵語音識別、垃圾廣告,以及涉政、暴恐、特殊LOGO等不良內容,不僅量大而且類型不一,從中排查這些危險因素,需要較高的技術手段才能完成。
為解決行業痛點,幫助客戶從源頭發現并杜絕這類不良信息,互聯網通信云廠商融云提供的音視頻審核服務,可高效精準地自動識別違規內容,保障平臺業務的穩定運營。尤其當平臺有對消息及音視頻有雙重審核需求時,融云可幫助企業一站式審核圖、文、音、視“全”內容,有效解決多類型、海量信息難以甄別的問題。同時,也幫客戶節省了對接第三方審核公司的商務溝通成本,以及研發適配所耗用的成本,為開發者及各互聯網平臺構筑起綠色通信的護城河。
多維度音視頻審核能力,為不同業務場景提供安全保障
目前,融云提供的音視頻審核功能主要應用在 1v1、1v多通話場景,會議場景以及直播場景。融云的客戶在使用 CallLib SDK 或 RTCLib SDK 實現音視頻通話、線上會議或直播等類型應用后,可以把每個參與人的音頻、視頻數據發送至審核服務,進行內容審核。
當企業開通審核功能后,融云支持音視頻流自動審核,審核結果會通過融云的回調服務發送到開發者的應用服務器。具體來說,融云媒體服務器(RTC Server)會把收到的音視頻流轉碼成審核服務需要的格式(RTMP)來送審,不需要開發者轉碼或者截幀再去送審。在啟動審核任務后,融云會按照一定的周期或在命中攔擊事件時把審核結果回調給用戶,幫助用戶方便地解析出審核結果,開發者可以根據審核結果決策是否需要斷開直播間主播推流,比如可以踢出主播或封禁主播。
圖1:融云音視頻審核服務架構
在音頻審核功能方面,融云提供涉政語音識別、嬌喘語音識別、國歌識別、色情語音識別、辱罵語音識別、垃圾廣告識別六大審核維度?;贐i-GRU、Attention模型、NAR模型,構建混合深度神經網絡模型等多個先進手段,精準識別各類場景中涉政人物、政治事件、反動分裂、恐怖主義等百余種類型涉政音頻,精準識別聲音中含有嬌喘、呻吟、耳騷、喊麥等違規音頻,對于音頻中含有色情、低俗、污穢、語愛等涉黃內容也絕不放過。
在視頻審核功能方面,融云提供涉政視頻識別、色情視頻識別、暴恐視頻識別、廣告視頻識別、垃圾廣告識別、LOGO水印識別。尤其可以實時精準識別和攔截各類場景的手機號、微信、QQ、微博、網址、二維碼等各種變體垃圾廣告內容,并通過高精度LOGO水印檢測識別技術,支持競品LOGO檢測、涉政LOGO檢測,維護客戶品牌形象。
融云音視頻審核四大優勢:精準、靈活、全面、穩定
根據開發者的使用調查反饋,融云的音視頻審核服務最大的特點是精準,除了審核能力精準,還能迅速精準地定位問題源頭,縮短了問題排查的時間;同時,審核模式靈活,支持靈活篩選審核對象,比如對指定房間,甚至指定用戶的送審,可添加個性化的審核維度,最重要的是產品功能性能穩定,可用性99.9%,可應對高并發的使用場景。此外,支持長達半個月的測試時間,讓客戶有充分的時間熟悉、了解相關功能,讓使用無后顧之憂。
具體來說,融云音視頻審核服務具備四大技術優勢:第一,從服務架構上看,深度融合CNN、RNN、GAN、TDNN、LSTM等模型,違規識別準確率高;第二,違規態勢實時追蹤,可實時監測輿情趨勢,動態追蹤違規態勢,增量模型小時級更新,幫助產品快速迭代升級;第三,全方位識別數百種涉政暴恐圖片、數十種色情圖片、各式各樣的變體廣告圖片等違規內容,極大降低平臺監管風險;第四,超強彈性服務,全球多集群部署,可秒極彈性擴容,因此每日可承載數億級的海量音視頻審核請求。
復合的審核服務,打造一站式“全”內容審核能力
在實際應用中,融云針對圖、文、音、視的“全”內容,提供雙重審核服務,將IM即時通訊審核與音視頻審核功能疊加,構成“聯防聯控”的一站式內容審核云服務產品,結合融云反垃圾與內容安全經驗,構筑體系化、專業化的審核系統,全面保障客戶通信云業務安全運行。
圖2:融云IM 內容審核服務
融云的IM內容審核服務主要包括文本過濾、圖片過濾、音視頻文件過濾三類功能。其中,融云的文本過濾具有多語種識別能力,支持中文(簡繁體)、維語、藏語、英語、日語等。擁有毫秒級的響應速度,通過機器學習、智能算法、語義分析等多維度對數據解析,識別準確率可達 95% 以上。
融云的圖片過濾能力基于融云海量樣本庫,識別準確率達90%以上,并且支持水印,傾斜,扭曲,異體等多種變形文字的提取識別,從而提高垃圾圖片過濾的準確率。同時還可承受單日千萬級圖片數據的處理,支持數據高峰時段彈性擴容,檢測結果毫秒級返回。
融云的音視頻文件過濾能力可承載日均千萬級數據處理,檢測結果秒速返回;并支持場景化定制,多種模型組合訓練,供手機號畫像、IP畫像等多并提維度判定,識別準確率可達98%。
綜上,融云能夠精準過濾文本、圖片、音視頻消息及音視頻流中的不良信息,幫助客戶有效規避運營風險,保證內容平臺的健康安全,并且該服務提供機器審核和人工審核的雙重保障,用戶可根據自身情況同時使用,也可任選其一。
結語
由于各行各業通信云應用對綠色通信都存在迫切的需求,融云的音視頻審核專門針對在音視頻通信中,對內容有安全過濾和設防需求的客戶而設。同時,音視頻審核功能與其圖文審核功能疊加復核,可全面過濾以及精準識別所有通信形式中的內容,構成了一個審核閉環的防護體系,在解決企業對通信內容安全痛點的同時,讓業務運行省心、省力,省成本。