提到數(shù)據(jù),就必須提到各種模型。小伙伴們經(jīng)常有疑惑:從4P、SWOT、RFM到線性回歸、決策數(shù)、Kmean聚類,都有人管它們叫模型,那這些模型到底有啥區(qū)別?今天一文講清,大家看完再也不迷路哦。
一個例子,看懂二者區(qū)別
模型一詞,本身指的是“對現(xiàn)實世界的抽象”,通過少數(shù)關(guān)鍵信息,描述復(fù)雜的問題。
提煉關(guān)鍵信息的方式有2種:如果從業(yè)務(wù)角度做提煉,就是:業(yè)務(wù)模型;如果用數(shù)學、統(tǒng)計學、運籌學、機器學習方法論提煉,就是:算法模型。
舉個簡單的例子,我們常說“營銷4P模型”,這個4P其實是從業(yè)務(wù)邏輯出發(fā)的。站在業(yè)務(wù)視角,只要我做好了商品、渠道、價格、促銷,就能把貨賣出去。但是落到數(shù)據(jù)層面,就有很大區(qū)別。商品和渠道屬性很難量化,我們只能通過打標簽的方式,粗略對比不同標簽下銷售指標差異(如下圖):
圖片
商品價格/促銷與銷量的關(guān)系,容易用數(shù)據(jù)量化,因此催生出一個經(jīng)典的算法模型:價格彈性模型。首先采集不同價格下商品銷量;第二步,擬合函數(shù),總結(jié)出量價模型;第三步就可以拿模型推測漲價效果,或者求出利潤最大化的價格了(如下圖):
圖片
注意!方法都是為解決問題而設(shè)計的,兩種方法各有優(yōu)勢。
業(yè)務(wù)模型的優(yōu)勢
業(yè)務(wù)模型最大的優(yōu)勢,在于能從業(yè)務(wù)角度給出問題的解釋。
比如:
- 是不是我的策略不對?
- 是不是我的選品不行?
- 是不是我的執(zhí)行力不行?
類似“策略”、“選品”、“執(zhí)行力”這些業(yè)務(wù)上思考 ,很難直接用x、y的加減乘除關(guān)系來衡量。此時就得構(gòu)造業(yè)務(wù)分析模型,先把“策略”、“選品”等名詞量化,再用邏輯樹的方法,對問題進行拆分,構(gòu)造一個層層深入的分析邏輯,用排除法找到正確答案(如下圖)。
圖片
業(yè)務(wù)模型的第二個優(yōu)勢,在于容易觀察業(yè)務(wù)行動的效果。
比如上圖中,基于邏輯樹,業(yè)務(wù)改進了執(zhí)行動作,增加了人力投入。我們可以直接觀察:邏輯樹頂端問題,是否變好了,從而判斷分析是否真的到位(如下圖)。
圖片
業(yè)務(wù)模型的第三個優(yōu)勢,在于清晰業(yè)務(wù)主體責任。
比如都是做預(yù)測,如果直接用回歸算法或者平滑算法給出一個結(jié)論,那么業(yè)務(wù)部門就沒法看到自己行為的效果,還會迷惑地問:“那我下周加班不加班,結(jié)果一樣嗎?”“如果我搞不掂A客戶,轉(zhuǎn)而做B客戶,是不是預(yù)測會不一樣?”(如下圖)
圖片
此時如果用業(yè)務(wù)模型來預(yù)測,可以直接把整體指標按部門拆開,讓各部門填寫自己預(yù)期情況。雖然具體參數(shù)可能需要拍腦袋得出來,但是每個部門能直接看到自己需做到什么水平,從而反向激勵業(yè)務(wù)必須行動。即使沒有完成任務(wù),也能清楚看到“是誰沒完成”。從而更快速的思考對策。
算法模型的優(yōu)勢
算法模型最大的優(yōu)勢,并不是比人聰明,而是運算速度快+省事。比如經(jīng)典的互聯(lián)網(wǎng)推廣問題,各種限制條件一堆:“推廣總預(yù)算,每個渠道轉(zhuǎn)化率,每個渠道可以預(yù)約檔期數(shù)量”等等。
此時,如果用人力去安排,可能要計算半天,但熟悉運籌學的同學們都知道,這是個典型的線性規(guī)劃模型,只要能寫清楚建模假設(shè), 就很容易出結(jié)果(如下圖)。
圖片
更方便的是,如果以后有調(diào)整,比如:
1、修改總投放費用
2、渠道檔期數(shù)變化
3、渠道轉(zhuǎn)化率變化
那么只要修改模型參數(shù),就能快速出結(jié)果了,非常方便(如下圖):
圖片
算法模型的第二個優(yōu)勢,是能發(fā)現(xiàn)業(yè)務(wù)沒注意到的情況。
比如做商品分析的時候,業(yè)務(wù)上是可以手動輸出一份《商品關(guān)聯(lián)規(guī)則表》,但這個表格的規(guī)則是固定的。如果用關(guān)聯(lián)規(guī)則算法,則可以突破業(yè)務(wù)思路的限制,發(fā)現(xiàn)更多潛在關(guān)聯(lián)銷售邏輯。雖然不見得是“啤酒與尿布”這么夸張的東西,但是也對啟發(fā)業(yè)務(wù)思路很有幫助(如下圖)。
圖片
算法模型的第三個優(yōu)勢,就是處理大規(guī)模數(shù)據(jù)了。
典型的業(yè)務(wù)模型RFM,做用戶分層時,如果每個指標分3類,那么就有3*3*3=27類,在業(yè)務(wù)上已經(jīng)復(fù)雜到很難匹配對應(yīng)策略了。但是如果用協(xié)同過濾算法,完全可以做到千人千面,這也是算法模型的巨大優(yōu)勢。
之所以互聯(lián)網(wǎng)公司傾向于用算法做推薦,主要是源自互聯(lián)網(wǎng)平臺上的商品量以十億記,極難手動匹配規(guī)則。
業(yè)務(wù)與算法,如何完美配合
想要做好順暢配合,建議大家在項目啟動前,先花時間梳理好:到底要解決什么問題。而不是一上來先說:我要個模型。先捏個模型出來,再拿著錘子找釘子。
如果要解決的問題本身不清晰,比如:
1、診斷類問題:到底指標異動是因為內(nèi)部還是外部原因?
2、標準類問題:到底該怎么定義“高價值用戶”、“有效的策略”?
3、測試類問題:我有個新想法,還沒實行,不知道有沒有效果?
此時建議做業(yè)務(wù)模型,先把問題梳理清楚,把定義明確好,拿到測試數(shù)據(jù),再看進一步怎么做?
如果要解決的問題定義清晰,且有數(shù)據(jù)積累,就很適合做算法模型。特別是即使業(yè)務(wù)很努力,也很難提升效果的時候,比如用戶流失挽留,新用戶電話銷售等場景,天然響應(yīng)率低,通過模型篩選目標群體能極大提升業(yè)務(wù)效率,此時效果好。