導讀:圍繞人、貨、場、商4個維度構建客群矩陣,為各類業務場景的算法建模提供底層數據基礎。
作者:阿里集團 新零售技術事業群 CBU技術部
來源:華章科技
阿里巴巴一直在面向未來探索B類新電商模式,并從2019年開始重點構建“新供給、新鏈接、新營銷”三新體系。買家是三新體系的核心,缺少買家維度的數字化經營體系是不完整的。平臺場景目標群體及場景間買家差異性尚不明確,客群矩陣就是為場景中控解決這一業務痛點、提高場貨分發效能而專門設置的算法研究主題。
同時,客群矩陣也是用戶增長和算法特征的核心數據。鑒于客群矩陣如此重要且擁有諸多應用,其構建迫在眉睫。
阿里巴巴意在將客群矩陣打造成平臺的一個風向標,以便業務有目標、有層次、有差異、高效地選品和進行場景運營及商家運營,為用戶增長和算法模型優化提供動力,為數字化運營提供依據。我們主要圍繞人、貨、場、商4個維度構建,客群矩陣概況如圖1所示。
▲圖1 客群矩陣概況
客群矩陣同場景矩陣疊加,在構建場景目標用戶、衡量場景差異性的同時,也能提高場景效能,有效引導目標流量,進而為各類業務場景的算法建模提供底層數據基礎。
01 采購力
B類買家不像C類買家有明確的年齡、性別等基礎坐標維度,B類用戶多是企業或者批發商,如何刻畫B類特色的客群矩陣,這對于B類電商非常重要,也是B類電商“小二”一直在思考的問題。
既然B類用戶群體主要是企業和批發商,那么如何準確地描述客群矩陣呢?采購力就是突出的表征,采購力包含采購金額和采購頻率,從采購力可以看出用戶的經營規模和消耗能力。因此,我們將采購力作為基礎坐標維度,分層提供精準差異化服務。
采購金額主要是一定周期內用戶采購的金額。為了規避不同品類價格差異較大帶來的分層干擾,首先分類目對采購金額劃檔,然后再按照金額檔不分類目看,占比最多的金額檔就是此用戶的采購金額檔層。
采購頻率是一定周期內用戶的采購頻次。將用戶按照采購時間排序,然后計算用戶在一定時間周期內采購的頻次。將所有用戶按照高斯分布比例劃分出高、中、低檔,作為采購頻率的分層檔次。
02 生命周期
包括新裝機、新用戶、低活、中活、中高活、高活、沉睡、流失等階段,該生命周期主要是按照用戶在電商平臺的活躍度來劃分的,其中也融入了部分業務知識。例如,新裝機用戶是指剛裝機的用戶,新用戶是指成交在2單以內的用戶,低活是指一個月訪問天數在2天以內的用戶等。
從交易周期分析用戶生命周期,如圖2所示,包括新裝機激活用戶、登錄用戶、首單用戶、活躍買家(高采購力買家、潛力買家)、潛睡買家、深睡買家等階段,各個生命周期階段之間的轉換關系在圖中也有直觀呈現。精準化用戶運營根據買家生命周期階段不同而調整目標,所采取的策略也會相應調整。
▲圖2 用戶生命周期
了解了用戶生命周期,就可以有針對性地做用戶拉新、促活、留存,以提高用戶黏性:
- 對于新裝機和新用戶,主要是提高他們的用戶體驗,培養用戶的消費習慣,做留存轉化;
- 對于中低活用戶,主要是促活、留存;
- 對于中高活用戶,主要是維持用戶的習慣,加強黏性;
- 對于沉睡和流失用戶,主要是通過紅包權益等方式促活。
用戶生命周期的維護對于電商持續用戶增長發揮著至關重要的作用。
03 核心主營
CBU作為B2B電商平臺的典型代表,一直致力于服務全球億萬B類買家用戶。
用戶核實身份與主營類目(如進口母嬰店店主、精品女裝店店主、微商兼職、小超市店主等)作為B類用戶畫像最為核心的屬性之一,不僅代表著用戶的線下實體身份,還直接影響著用戶在電商平臺上的行為偏好、采購周期及對商家服務能力的訴求等,因此一直是B類電商平臺致力于深耕與運營的核心用戶畫像屬性之一。
大多數C類用戶畫像屬性可以直接基于用戶在網站上的歷史行為進行建模,但B類用戶畫像則不同。因為要核實用戶核身身份以及對主營類目有精準性的要求,一般B類電商平臺主要以用戶自填表單的形式進行用戶核實身份的確定。
這種用戶自填方式結果準確度較高,但位置隱蔽、鏈路冗長、沒有利益點的引導,不僅用戶填寫率低,而且與場景結合力不足。
為解決原表單式核身用戶操作成本高的問題,阿里巴巴CBU電商平臺通過用戶核身組件借力算法模型對用戶核身進行預測,依據置信度排序,為用戶推出Top K個選項供用戶點選。整體算法解決方案如下。
1. 數據源
1)用戶站內行為
用戶站內行為是用戶需求與偏好的第一反饋基地,是算法需要著重去挖掘的數據源。相對其他偏好類畫像屬性來說,用戶核身是一個相對穩定和長期的用戶屬性,因此在算法應用中,我們選取了用戶最近半年的站內全域行為作為底層數據。定義半年的長時間窗口選取主要有兩方面考慮:
- 一是目前網站商品豐富、優質,搜索與推薦算法日漸精進,用戶瀏覽各類商品的成本較低,所以B類用戶在網站上的注意力難以保持專注,用戶B類/C類的需求與行為混雜,數據較臟,較長的時間窗口有利于濾除干擾,捕獲用戶更為長期和穩定的需求;
- 二是用戶行為數據,特別是采購行為,相對稀疏,然而B類用戶的采購行為是反映用戶核身身份最為核心的特征之一,且用戶采購行為又具有一定的周期性,因此長期的時間窗口能夠幫助算法更加全面地認識用戶。
2)用戶站外上下游身份
不同于很多偏好類用戶畫像屬性,用戶核身身份能夠與用戶在現實中的身份產生真實的映射關系,如奶茶店店主——喜茶店主、烘焙店店主——寶島金典店主、精品女裝店店主——淘寶女裝店店主等。
因此,用戶站外上下游的身份映射關系,能夠輔助我們進一步完善用戶核身身份的預測,提高覆蓋率和準確率。
3)行業知識
鑒于用戶在網站上B類/C類行為混雜,噪聲較多,B類用戶核身偏好易受網站熱門類目與商品的干擾,因此我們也引入了大量行業知識作為指導來協助完成B類用戶核身身份的預測,并基于此沉淀下來一份核身偏好類目數據。
2. 算法方案
利用以上用戶站內行為、站外上下游身份和行業知識的數據,算法端可以通過以下幾個步驟實現用戶核身身份的預測工作,預測流程如圖3所示。
▲圖3 用戶核身預測流程圖
1)種子用戶圈選
種子用戶主要定義為站內已核身用戶及站外上下游有映射關系的核身信息的用戶。
2)行業知識指導
我們基于種子用戶最近一段時間的站內行為數據,挖掘識別顯著性特征,提供給運營同事,對種子用戶再進行一輪劃撥,把日常核心行為與行業偏好明顯不符合的用戶排除,優化種子用戶的圈選。
3)種子商品圈選
以行業偏好類目作為門檻,篩選出種子用戶在門檻下最近半年內采購過的商品作為種子商品。
4)種子商品擴展
基于團隊沉淀現有商品的I2I表,利用種子商品作為trigger觸發Key,對種子商品進行擴展,擴展種子商品的偏好分等于商品I2I相似分與trigger種子商品偏好分的乘積。
5)用戶核身預測
對于一個用戶的核身預測,我們選取其最近半年的行為數據進行建模打分。然后基于打好分的用戶行為商品計算用戶對每一個可能的核身身份的偏好置信度,并用以區分用戶的個人采購行為和B類采購行為,降低用戶的個人采購行為對預測結果的影響,加大用戶的B類采購行為的權重。
關于作者:阿里巴巴CBU技術部(1688.com),作為阿里集團新制造和新零售的重要技術生力軍,CBU技術團隊15年來一直以技術之力賦能千萬中小企業,沉淀了一系列極具B類特色的交易、支付、營銷、采購、分銷技術產品,促進B類全鏈路商業效率優化。
本文摘編自《阿里巴巴B2B電商算法實戰》,經出版商授權發布。