標(biāo)簽作為當(dāng)下最普遍的數(shù)據(jù)資產(chǎn)類(lèi)型之一,對(duì)企業(yè)洞察用戶畫(huà)像、開(kāi)展精細(xì)化運(yùn)營(yíng)等具有重要的支撐作用。企業(yè)標(biāo)簽體系的建設(shè)并非一蹴而就的,需要結(jié)合業(yè)務(wù)視角進(jìn)行整體的規(guī)劃,更涉及到復(fù)雜的數(shù)據(jù)治理和數(shù)據(jù)資產(chǎn)管理等工作。
本文對(duì)個(gè)推TechDay"治數(shù)訓(xùn)練營(yíng)"第四期進(jìn)行了回顧,為大家分享企業(yè)級(jí)標(biāo)簽體系的建設(shè)方法論、搭建流程及實(shí)踐經(jīng)驗(yàn)。
課程回顧
當(dāng)前不少企業(yè)都已經(jīng)或正在投入建設(shè)自身的標(biāo)簽體系,但是由于數(shù)據(jù)未得到有效治理、缺少整體的標(biāo)簽體系規(guī)劃、未能對(duì)標(biāo)簽數(shù)據(jù)資產(chǎn)進(jìn)行持續(xù)的運(yùn)營(yíng)管理等原因,一些企業(yè)在建設(shè)標(biāo)簽體系的過(guò)程中仍然面臨標(biāo)簽數(shù)據(jù)用不起來(lái)、數(shù)據(jù)經(jīng)驗(yàn)無(wú)法沉淀等難題。
針對(duì)以上情況,個(gè)推深度梳理自身標(biāo)簽體系建設(shè)經(jīng)驗(yàn),最終總結(jié)出企業(yè)級(jí)標(biāo)簽體系建設(shè)的方法論,通過(guò)簡(jiǎn)單五步即可完成高質(zhì)量標(biāo)簽體系的構(gòu)建。
一、確定目標(biāo)
首先,我們需要根據(jù)業(yè)務(wù)需求來(lái)確定標(biāo)簽體系的建設(shè)目標(biāo)。根據(jù)標(biāo)簽的使用場(chǎng)景,標(biāo)簽體系的建設(shè)目標(biāo)可分為業(yè)務(wù)目標(biāo)和系統(tǒng)目標(biāo)兩種。
①業(yè)務(wù)目標(biāo),指的是最終給業(yè)務(wù)帶來(lái)實(shí)際收益的目標(biāo)。比如通過(guò)標(biāo)簽體系的建設(shè)和應(yīng)用,使用戶的次日留存率提升20%。
②系統(tǒng)目標(biāo),指的是使用功能和系統(tǒng)性能等方面的目標(biāo)要求。比如最終建設(shè)完成的標(biāo)簽系統(tǒng)/平臺(tái)要能夠支持可視化創(chuàng)建和管理標(biāo)簽;在性能方面,能夠在1小時(shí)內(nèi)完成千萬(wàn)級(jí)用戶的標(biāo)簽計(jì)算和目標(biāo)圈選。
二、標(biāo)簽體系設(shè)計(jì)
確定了標(biāo)簽體系建設(shè)目標(biāo)后,接下來(lái)要開(kāi)始標(biāo)簽體系的頂層設(shè)計(jì)。這其中,有以下幾個(gè)核心問(wèn)題需要關(guān)注:
1.如何確定標(biāo)簽?zāi)夸?
我們建議企業(yè)充分結(jié)合業(yè)務(wù)需求和數(shù)據(jù)資產(chǎn)情況來(lái)確定標(biāo)簽?zāi)夸?由"業(yè)務(wù)+數(shù)據(jù)"共同驅(qū)動(dòng)標(biāo)簽的生產(chǎn)。
業(yè)務(wù)驅(qū)動(dòng)比較好理解,即根據(jù)業(yè)務(wù)訴求來(lái)確定要生產(chǎn)的標(biāo)簽,比如企業(yè)為提升風(fēng)險(xiǎn)識(shí)別能力,需要?jiǎng)?chuàng)建"風(fēng)險(xiǎn)賬號(hào)"和"黑名單"等標(biāo)簽;而為了提升付費(fèi)轉(zhuǎn)化率,可以創(chuàng)建"商品偏好"和"價(jià)格敏感度"等標(biāo)簽。
數(shù)據(jù)驅(qū)動(dòng)是指基于數(shù)據(jù)資產(chǎn)情況提出標(biāo)簽需求。一般而言,業(yè)務(wù)人員更聚焦業(yè)務(wù),對(duì)于底層數(shù)據(jù)情況往往了解較少。這就需要數(shù)據(jù)開(kāi)發(fā)工程師、數(shù)據(jù)分析師等深度介入,從數(shù)據(jù)資產(chǎn)中挖掘和提煉出有價(jià)值的標(biāo)簽,比如根據(jù)場(chǎng)景偏好數(shù)據(jù),提煉出常駐地、旅游地偏好等標(biāo)簽;根據(jù)電商APP端內(nèi)數(shù)據(jù),提煉出消費(fèi)水平、消費(fèi)偏好等標(biāo)簽。
值得注意的是,企業(yè)在實(shí)際設(shè)計(jì)標(biāo)簽?zāi)夸浐蜆?biāo)簽體系的過(guò)程中,并不是僅僅依靠單純的業(yè)務(wù)驅(qū)動(dòng)或單純的數(shù)據(jù)驅(qū)動(dòng)就能實(shí)現(xiàn),而是需要業(yè)務(wù)方和數(shù)據(jù)方不斷溝通磨合,將業(yè)務(wù)需求和數(shù)據(jù)資產(chǎn)情況進(jìn)行匹配,最終完成一份標(biāo)簽?zāi)夸浀脑O(shè)計(jì)。
經(jīng)驗(yàn)總結(jié)
關(guān)于標(biāo)簽?zāi)夸浀拇_定,經(jīng)常會(huì)遇到以下兩個(gè)常見(jiàn)誤區(qū)。 誤區(qū)一:標(biāo)簽越多越好。其實(shí)業(yè)務(wù)方并不需要過(guò)多的標(biāo)簽,一般來(lái)說(shuō)20%的標(biāo)簽就能滿足業(yè)務(wù)方80%的需求。 誤區(qū)二:標(biāo)簽越高級(jí)越好。一些算法工程師或技術(shù)人員往往花費(fèi)大量的時(shí)間優(yōu)化模型,構(gòu)建復(fù)雜的模型標(biāo)簽。其實(shí),把基礎(chǔ)標(biāo)簽、規(guī)則標(biāo)簽做好,基本就能滿足業(yè)務(wù)方的絕大多數(shù)需求。
因此企業(yè)在建設(shè)標(biāo)簽體系的過(guò)程中需要考慮投入產(chǎn)出比,評(píng)估標(biāo)簽的實(shí)際應(yīng)用需求強(qiáng)度、衡量不同標(biāo)簽對(duì)業(yè)務(wù)的提升效果。
2.當(dāng)前數(shù)據(jù)基礎(chǔ)能否支撐標(biāo)簽體系構(gòu)建?
數(shù)據(jù)建設(shè)是標(biāo)簽體系的基石,企業(yè)只有打好數(shù)據(jù)基礎(chǔ),才能構(gòu)建出一套高質(zhì)量的標(biāo)簽體系。因此在進(jìn)行標(biāo)簽體系的搭建之前,企業(yè)需要對(duì)數(shù)據(jù)進(jìn)行綜合治理,提升數(shù)據(jù)的質(zhì)量和可用性。
3.如何確定標(biāo)簽規(guī)則?
根據(jù)生產(chǎn)方式的不同,標(biāo)簽可以分為事實(shí)標(biāo)簽、規(guī)則標(biāo)簽、模型標(biāo)簽等類(lèi)型。
事實(shí)標(biāo)簽的規(guī)則定義比較簡(jiǎn)單,數(shù)據(jù)分析師在理解業(yè)務(wù)數(shù)據(jù)的前提下,從業(yè)務(wù)方的原始數(shù)據(jù)中提取即可。比如從用戶注冊(cè)信息中提取用戶來(lái)源渠道、性別或者年齡階段等標(biāo)簽。
規(guī)則標(biāo)簽擁有很強(qiáng)的業(yè)務(wù)屬性,需要業(yè)務(wù)人員和數(shù)據(jù)分析師一起去分析探索,基于原始數(shù)據(jù)進(jìn)行標(biāo)簽規(guī)則的創(chuàng)建和拼接。比如要?jiǎng)?chuàng)建一個(gè)"大學(xué)生"標(biāo)簽,那就需要從各個(gè)維度對(duì)"大學(xué)生"進(jìn)行特征定義,比如年齡方面一般在18-25歲之間,線上應(yīng)用偏好方面安裝了一些大學(xué)生課程管理類(lèi)App等等。
個(gè)推每日治數(shù)平臺(tái)DIOS實(shí)現(xiàn)智能特征洞察
結(jié)合自身標(biāo)簽體系建設(shè)實(shí)踐以及服務(wù)行業(yè)客戶的經(jīng)驗(yàn),個(gè)推發(fā)現(xiàn),標(biāo)簽規(guī)則定義是企業(yè)搭建標(biāo)簽體系過(guò)程中所普遍面臨的痛點(diǎn)、難點(diǎn)。即使是專(zhuān)業(yè)的數(shù)據(jù)分析師團(tuán)隊(duì)和業(yè)務(wù)專(zhuān)家也需要先花費(fèi)大量的時(shí)間和精力去理解數(shù)據(jù)和用戶之間的關(guān)聯(lián)性,再?gòu)闹刑釤挸鰳?biāo)簽規(guī)則。
為了提升企業(yè)客戶的標(biāo)簽生產(chǎn)效率,個(gè)推打造的數(shù)據(jù)智能操作系統(tǒng)--每日治數(shù)平臺(tái)DIOS,實(shí)現(xiàn)了目標(biāo)智能特征洞察以及智能數(shù)據(jù)推薦,幫助客戶快速定位所需數(shù)據(jù)、自動(dòng)提煉標(biāo)簽規(guī)則,更加高效地進(jìn)行標(biāo)簽生產(chǎn)。
模型標(biāo)簽往往是參考已有事實(shí)數(shù)據(jù)來(lái)預(yù)測(cè)群體的偏好、特征和分類(lèi),例如根據(jù)流失用戶群的特征來(lái)預(yù)測(cè)其他用戶群的流失概率。一般在事實(shí)標(biāo)簽和規(guī)則標(biāo)簽的覆蓋量級(jí)、飽和度、準(zhǔn)確度等不足的情況下,我們就需要?jiǎng)?chuàng)建模型標(biāo)簽,來(lái)滿足相關(guān)業(yè)務(wù)需求。
個(gè)推每日治數(shù)平臺(tái)DIOS實(shí)現(xiàn)零代碼搭建機(jī)器學(xué)習(xí)模型
傳統(tǒng)的模型標(biāo)簽創(chuàng)建流程還是比較復(fù)雜的,涉及到算法開(kāi)發(fā)、模型搭建、模型調(diào)優(yōu)等復(fù)雜的工作。個(gè)推每日治數(shù)平臺(tái)DIOS將自身建模方法論"五步法"產(chǎn)品化,實(shí)現(xiàn)了零代碼建模能力,沒(méi)有編程經(jīng)驗(yàn)的業(yè)務(wù)人員也能在DIOS的可視化界面上拖拖拽拽,快速完成機(jī)器學(xué)習(xí)模型的搭建。
三、標(biāo)簽開(kāi)發(fā)
完成了整體的標(biāo)簽體系設(shè)計(jì),接下來(lái)就進(jìn)入到標(biāo)簽開(kāi)發(fā)環(huán)節(jié)。一般而言,標(biāo)簽開(kāi)發(fā)的過(guò)程可以拆解為工程開(kāi)發(fā)、工程測(cè)試、工程上線等三個(gè)階段。在工程開(kāi)發(fā)階段,研發(fā)工程師根據(jù)標(biāo)簽規(guī)則以及數(shù)據(jù)源情況進(jìn)行工程的開(kāi)發(fā);然后由測(cè)試工程師結(jié)合業(yè)務(wù)訴求及工程結(jié)果對(duì)標(biāo)簽質(zhì)量進(jìn)行測(cè)試驗(yàn)收,確保標(biāo)簽準(zhǔn)確性后最終上線。
這其中涉及到一個(gè)非常重要的問(wèn)題,即如何對(duì)新構(gòu)建的標(biāo)簽進(jìn)行準(zhǔn)確性校驗(yàn)。
常見(jiàn)的校驗(yàn)方式有三種: ①通過(guò)TGI進(jìn)行邏輯自洽性校驗(yàn)。比如新構(gòu)建了一個(gè)男性標(biāo)簽,通過(guò)TGI發(fā)現(xiàn)被打上男性標(biāo)簽的人群中有很大一部分也被打上了女性的標(biāo)簽,顯然這是一種很不合理的現(xiàn)象。(說(shuō)明:"TGI"指的是洞察人群某特征占比與對(duì)照組人群該特征占比的比值,用于比較人群間的特征差異。)
②使用第三方平臺(tái)校驗(yàn)。比如通過(guò)廣點(diǎn)通,使用第三方數(shù)據(jù)來(lái)進(jìn)行準(zhǔn)確性的校驗(yàn)。 ③進(jìn)行廣告投放。圈選不同標(biāo)簽下的目標(biāo)群體,進(jìn)行A/B測(cè)試,根據(jù)投放結(jié)果校驗(yàn)標(biāo)簽的準(zhǔn)確性。
完成了工程測(cè)試和標(biāo)簽準(zhǔn)確性校驗(yàn),就可以正式上線運(yùn)行標(biāo)簽體系。我們建議,企業(yè)可以先在實(shí)際業(yè)務(wù)場(chǎng)景中進(jìn)行小范圍的多次檢驗(yàn),再大規(guī)模進(jìn)行標(biāo)簽體系的上線,避免后期出現(xiàn)大范圍的調(diào)整和改動(dòng)。
四、標(biāo)簽全生命周期管理
作為一種重要的數(shù)據(jù)資產(chǎn),企業(yè)還需要在標(biāo)簽體系上線以后,對(duì)標(biāo)簽資產(chǎn)進(jìn)行全生命周期的精細(xì)化管理。
此外,我們還建議企業(yè)建立標(biāo)簽質(zhì)量保障體系,設(shè)立責(zé)任人制度,確保標(biāo)簽第一負(fù)責(zé)人能夠及時(shí)響應(yīng)相關(guān)事項(xiàng);梳理標(biāo)簽開(kāi)發(fā)、上線的流程和經(jīng)驗(yàn),實(shí)現(xiàn)后續(xù)標(biāo)簽的開(kāi)發(fā)、測(cè)試、上線等流程規(guī)范化和標(biāo)準(zhǔn)化;更加體系化地進(jìn)行標(biāo)簽質(zhì)量監(jiān)控,比如通過(guò)定時(shí)工程監(jiān)控標(biāo)簽計(jì)算工程、量級(jí)、飽和度等信息。
五、應(yīng)用與反饋
企業(yè)建立標(biāo)簽體系的最終目的是服務(wù)業(yè)務(wù)。常見(jiàn)的標(biāo)簽業(yè)務(wù)應(yīng)用場(chǎng)景有幾種: ①開(kāi)發(fā)數(shù)據(jù)類(lèi)產(chǎn)品。比如智能推薦系統(tǒng)正是基于標(biāo)簽大數(shù)據(jù)和算法實(shí)現(xiàn)。 ②用于目標(biāo)群體的特征洞察和圈選。比如個(gè)推基于自身數(shù)千種標(biāo)簽和億級(jí)別的特征數(shù)據(jù),幫助品牌主、APP對(duì)細(xì)分人群進(jìn)行畫(huà)像分析,并使用不同的標(biāo)簽組合,智能圈選出符合目標(biāo)特征的人群,為客戶做廣告投放、用戶觸達(dá)提供支撐。 ③精細(xì)化運(yùn)營(yíng)。完成對(duì)目標(biāo)群體的畫(huà)像洞察后,就可以進(jìn)行更加精細(xì)化的運(yùn)營(yíng)。比如品牌主可以針對(duì)不同興趣偏好的消費(fèi)者群體制定差異化的廣告素材、選擇不同的媒體平臺(tái),提升廣告投放效果。
針對(duì)在不同場(chǎng)景下的標(biāo)簽應(yīng)用結(jié)果,企業(yè)還需要做好后效的分析,科學(xué)評(píng)估標(biāo)簽的質(zhì)量、覆蓋度等,并把新產(chǎn)生的下游數(shù)據(jù)進(jìn)行入庫(kù)處理,使整個(gè)標(biāo)簽體系的全生命周期得到體系化的管控,真正實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)的持續(xù)增值。
以上是對(duì)個(gè)推TechDay"治數(shù)訓(xùn)練營(yíng)"第四期直播內(nèi)容的回顧,大家可以觀看直播回顧視頻進(jìn)一步了解標(biāo)簽體系建設(shè)的相關(guān)要點(diǎn)。
關(guān)注個(gè)推技術(shù)實(shí)踐微信公眾號(hào),后臺(tái)回復(fù)"標(biāo)簽",獲取本期直播課件~
2022年已經(jīng)接近尾聲,個(gè)推TechDay"治數(shù)訓(xùn)練營(yíng)"系列直播課(第一季)到這里也正式收官啦!大家可以關(guān)注個(gè)推技術(shù)實(shí)踐視頻號(hào),查看往期精彩課程。