近日,國雙在中國廣告協會的指導下,重磅發布了《國內互聯網異常流量白皮書2020》。根據國雙Ad Dissector(互聯網廣告監測分析優化平臺)全年監測的互聯網廣告數據顯示,2020年互聯網廣告異常曝光占比29.4%,較2019年降低了2.8%。異常點擊占比降低明顯,從33.8%降低至25.7%。整體來看,2020年異常流量雖然有所下降,但形勢依然不容樂觀。
數據技術及互聯網產業的不斷發展,推動了數字廣告的高速增長,與此同時虛假流量、網絡水軍及背后的網絡黑灰產業鏈也愈發猖獗,嚴重損害了用戶、平臺、品牌等各方利益。作為中國領先的企業級大數據和人工智能解決方案提供商,國雙始終走在國內廣告反欺詐的前列,那么國雙是如何利用應用大數據、知識圖譜和人工智能等方面的技術來對抗異常流量的?面對廣告欺詐,媒體、廣告主、代理商、第三方公司又扮演了怎樣的角色呢?
對此,國雙營銷云技術總經理吳充和國雙營銷產品高級技術經理李濟景結合國雙近期發布的《國內互聯網異常流量白皮書2020》對行業現狀進行了深入分析。
1、作為國內廣告反欺詐的積極推動者,國雙已連續四年制作并發布《國內互聯網異常流量白皮書》,國雙發布《國內互聯網異常流量白皮書》的初衷是什么?為行業帶來了哪些價值?
第一,作為一家致力于利用大數據和人工智能賦能智能營銷的技術公司,國雙持續地幫助廣告主監測媒體對廣告的流量產生,幫助其科學地衡量廣告投放效果,助力客戶運用人工智能以增強廣告效果,用于尋找并確定受眾、完善有創意的信息傳遞,形成受眾特征,優化客戶既定目標。但因流量所承載的經濟價值,也滋生了流量造假的黑灰產業鏈,國雙持續發布《國內互聯網異常流量白皮書》,將行業里存在的異常流量公布出來,是提升數字廣告透明度,推動行業健康發展應盡的義務。
第二,發布四年以來,國雙的《國內互聯網異常流量白皮書》內容也在不斷完善和豐富,這得益于國雙結合大數據、人工智能的基因,不斷升級異常流量甄別技術。從最初關注硬廣產生的異常流量,到今年增加對內容營銷及KOL等存在的無效流量分析,國雙為廣告主了解互聯網流量行業現狀提供了數據依據,每年也都得到了客戶和行業伙伴的大力關注。
第三,《國內互聯網異常流量白皮書》的發布會對流量造假組織起到警示和震懾作用。
2、從國雙近日發布的《國內互聯網異常流量白皮書》來看,2020全年異常流量整體呈現明顯下降趨勢,異常流量下降的主要原因有哪些?又出現了哪些新的趨勢?
異常流量下降首先在于行業對異常流量的關注度有所提升,中國廣告協會、MMA中國等行業組織都在大力推動行業標準的制定,國雙也積極參與異常流量相關標準的制定工作,貢獻了很多黑名單,各方的共同努力有效遏制了異常流量上升的趨勢。
其次也和疫情有一定的關系。2020上半年異常流量整體呈下降趨勢,但是下半年又呈現上升的趨勢。異常流量的存在,一方面是有造假的利益驅使,另一方面是在過去相當長一段時間,移動互聯網處于紅利狀態,流量的買賣市場出現供不應求的狀態,廣告主需要越來越多的流量,但是媒體能提供的流量總池子已經達到瓶頸,這就會有一定的異常流量來堵上缺口。而2020上半年受疫情影響,很多廣告主都縮減了預算,對流量需求降低,所以異常流量也就降低了。
從GIVT(一般無效流量)和SIVT(復雜無效流量)各自的變化來看,GIVT是下降的趨勢,SIVT則處于上升的趨勢。這說明造假成本較低的這部分異常流量在下降,因為整個行業的監管會越來越嚴,標準也越來越統一,媒體都會認可GIVT的識別。但是相應的SIVT的變化是上升的,因為這部分流量造假的投入成本更高,其識別難度以及整個行業的統一認知差異會更大。
3、GIVT(一般無效流量)和SIVT(復雜無效流量)兩類異常流量在識別方式上有什么差異?
GIVT(一般無效流量)的識別比較簡單,通過中國廣告協會發布的“黑名單”對比,或者基于一定的特征規則,比如出現高頻的點擊、曝光,就能夠發現里面的異常流量。
SIVT(復雜無效流量)的識別比較復雜,它的復雜在于常規的手段已經解決不了問題,也沒有行業黑名單作為依據,甚至可能還需要人工的參與。為此,國雙采取了一種灰名單的方式,通過人工智能技術將存疑的流量識別出來,再借助人工進一步來做更準確的判斷。除了識別手段更復雜之外,行業在SIVT的認定上也會存在一些爭議,這也是為什么市面上絕大多數媒體并不認同把SIVT直接剔除來作為結算依據。
4、目前有哪些技術手段可以有效甄別異常流量?
構建數據模型。可以舉一個具體的例子,比如“手機墻“刷量現象。一般商家推出活動,目的是讓消費者參與活動,產生一些回饋。如果我們作為一個消費者正常參與,不會影響活動效果。但是會有人通過”手機墻“的方式刷量,這也是真實設備產生的流量。對于這種異常流量的過濾和識別,就需要構建數據模型發現這部分數據的規律,比如都是來自于同一個IP,或者操作時間相對集中等,通過這樣的復雜特征去識別。當然數據模型也需要持續優化,只有不斷地喂數據進去,才能更好地發現規律,再生成模型,提高識別效率和精準性。
5、在對異常流量的甄別上,最大的難點是什么?國雙的應對方案是什么?
難點主要體現在兩方面,一是整個行業在復雜異常流量識別上無法形成閉環,作為第三方可以識別出來一些復雜異常流量,但是如何評估并確診這是不是真正的復雜異常流量,需要客戶、媒體一并來處理。因為媒體對復雜異常流量有所避諱,這個閉環還無法建立起來。
其次,無論是異常流量識別,還是做更全面的分析,都需要足夠多的數據量。雖然國雙基于長年的積累,積累了大量的數據量,也占有了一定的市場規模,可以輸出一些規則。但其實數據的深度和維度還不足夠,需要整個行業一起來推動。在GIVT方面,大家已經建立起了一套行之有效的工作機制,而SIVT方面還有待進一步推進。
做復雜異常流量識別不光要依賴算法,還要依賴人工分析,知識和經驗也很重要。國雙下一步也會繼續把執行內容沉淀到相應的知識體系中,通過知識圖譜技術,構建異常流量知識庫,更好地輔助我們做復雜異常流量的識別。
6、隨著內容營銷對社會和公眾的影響不斷增大,其背后的KOL無效流量、虛假輿情等問題也日益嚴重,對于這類作弊行為,國雙具體是如何應用大數據、知識圖譜和人工智能幾個方面的技術來識別的呢?
國雙在過去相當長時間積累了很多的數據能力,另一方面,國雙本身也在幫助客戶做用戶運營和效果評估,積累了大量第一手真實數據,所以能夠科學和準確地找到評估開發/輿情方面的數據指標、計算方式。
此次國雙發布《《國內互聯網異常流量白皮書》也是結合了行業內的多維度數據,后續國雙還會繼續借助自身的人工智能和大數據技術優勢和服務客戶的能力,不斷地推出相關的內容。
此外,從造假的原因來看,硬廣主要有兩方面,一是從造假團伙的利益角度,二是流量本身供不應求。而軟廣造假可能更復雜一點,這里面有利益的因素,也有一些是因為生態不健康導致的。作為第三方,國雙能夠通過大數據和人工智能技術構建數據模型幫助廣告主發現這些問題,但是真正要根治,其實還需要包括平臺在內的行業各方共同推動。
7、打擊異常流量,守護數據真實安全,是推動行業健康發展的基礎,在保障數據真實安全方面,國雙都采取了哪些行動?
國雙一直在配合中國廣告協會、信通院、MMA等行業組織,共同推進異常流量的識別,同時也積極參與行業標準和規則的制定,比如OTT廣告評估標準、互聯網廣告標識(CAID)、行業“黑名單”等。
8、媒體、廣告主、代理商、第三方作為互聯網廣告產業鏈上的重要環節,在廣告欺詐與反欺詐中的關聯是怎樣的?作為第三方公司,又該如何保持客觀公正性?
行業各方其實對廣告反欺詐都有很大的影響,國雙作為第三方公司主要是提供異常流量識別的技術手段,幫助行業發現異常流量。但其實媒體方也會有相應的識別手段,甚至會有更有效的手段來進行異常流量的識別。廣告主起決定性作用,如果廣告主更旗幟鮮明地站在反對異常流量的位置上,同時給予足夠的力量支持這方面的工作,會帶動整個行業形成完整的反欺詐鏈條。
作為第三方公司,必須要保證自身的客觀公正性,因為第三方是這個鏈條上唯一有能力、有立場做客觀公正判斷的角色。首先,作為第三方公司,技術手段要過硬,擁有識別復雜異常流量的能力;其次也要積極參與到行業各種標準和相關事務中;最后要保證產品、公司背景的獨立性,不受外界的影響干擾。