做數據分析時,很多人只是通過數據就數論數,止于數據,并沒有讀出數據背后的業務意義。那么,我們改如何通過數據了解其深層次含義?對此,本文從錯誤的數據解讀示例、解讀的關鍵時理清業務含義等七個方面做了分析,推薦對數據分析感興趣的小伙伴閱讀。
經常有同學抱怨,在公司里,總被催著問:通過數據,你看到了什么?可實際數據就幾個曲線而已,也不知道咋解讀。也沒有人教,自己好不容易寫了幾句,又被嫌棄:“你這都是廢話,我們要深層次含義”。
咋辦?就舉個最簡單的例子,下邊是某公司一周銷量數據,你看到了什么?
01
錯誤的數據解讀示例
高了表揚低了罵。數據解讀,寫的是:周一到周五很高,周六、周日低,所以要!搞!高!……這么解讀當然會被說:你這都是廢話啊!業務又不是瞎子,看不到數字是周六日低嗎。
哪里跌了哪搞高。因為周六跌了48%,所以要搞高……這個是廢話*2和上一種說法是一個模子里刻出來的。
加減乘除算不停。平均值95.2,最大值125,最小值35……這個是廢話*3。平均95.2所以呢?最大值125所以呢?這還是在把數字復述一遍而已,沒有講出任何含義。
02
解讀的關鍵是理清業務含義
以上三種錯誤的共同點,是:就數論數,止于數據。沒有讀出數據背后的業務意義。其實數據解讀一點都不高深,我們每月每天都在用,比如:
業務部門做決策也一樣。他們想聽的是:不劃算、不喜歡、買不起。
他們更想聽的是:“今天中午預算只有人均50,在這家川菜館既管飽又好吃”,他們想聽的絕不是“2公里內共28家餐廳,平均價格63元,最高價725元,最低價13元,較上個月價格提升了10%”——這真的是一點意義都沒有。
想要得出這種判斷,需要三個條件:
了解數據代表的現實含義
了解數據大小代表的現實區別
明確判斷標準
比如大眾點評上飯店人均金額185元。它不是一個孤零零的數字,而是填肚子的成本,這是人均金額的現實含義。
成本低了可以接受,高了就吃不起,這是數據大小的現實區別。
比如我一個月餐費預算只有3000塊,意味著每天只有100塊錢,這就有了標準。那這一頓185,明天就得吃土了。這就形成了判斷:太貴了,得換個地方。
解讀企業數據也如此,不能只見數據,不見業務。同樣三點:
業務含義:數據反映的是什么業務
業績走勢:通過數據形態,解讀業務發展走勢
判斷標準:到底什么算好,什么算不好
下邊我們一個個看一下。
03
從理解業務含義開始
回到開頭的例子,“銷售業績”這個指標本身有很多含義。
直接含義:銷售隊伍的努力程度
銷售業績+成本:企業的盈利情況
銷售業績+產品:產品暢銷程度
銷售業績+用戶分層:用戶的需求
銷售業績+庫存:產品進銷存管理質量
但是注意:這里并沒有標準,因此無法判斷是好是壞。這也是為什么直接下結論:業績低了要搞高,是非常錯誤的行為。
銷售業績直觀反映的是銷售隊伍的努力程度,想知道這個數值是好是壞,我們可以直接去問“銷售隊伍的KPI達標了多少?”;也可以從業績曲線走勢來判斷。這就需要做第二步:觀察業績走勢。
04
觀察業績走勢
一個問題:“什么樣的產品會賣出這種曲線?”因為有七天的數據,所以可能代表了三種走勢:
1. 自然周期性變化
七天代表了一周,周一到周五是工作日,周六周日是休息日,所以這是一個工作日銷售多,休息日沒銷售的產品——是滴,你很自然聯想到,這可能是B2B的交易,工作日上班了才有大把生意,周日都休息了。或者是圍繞B2B的衍生生意,比如CBD的餐廳一類。
2. 生命周期性變化
有可能某個主打商品銷售到了生命周期末尾,正在退市,下一款新的馬上要上,暫時變化。注意,一般看生命周期數據,是從生命周期開始做T+N天的圖來看,不是看自然日。
3. 突發性變化
有可能剛好周六日出了問題,交易系統down機,有可能剛好促銷活動到周六日結束,有可能剛好周六日惡劣天氣。
通過對走勢的判斷,可以建立初步的標準。如果是周期性變化,那很有可能是正常波動,我們初步判做“正常”。如果是突發+下跌,那很有可能是異常且壞的波動,我們可以初步判做“問題”。有了標準,就能下判斷,只是三種假設都有可能,需要進一步驗證。
05
列出假設做驗證
想知道自己思考的對不對,就得去驗證假設。驗證假設的辦法有兩種:
第一,可以和業務部門溝通,了解實際情況。
第二,可以參考過往數據,驗證判斷,同時反向驗證業務部門是不是撒謊了。
數據驗證可以做的很復雜,但也能做的很簡單。不需要很復雜的邏輯,只要一根曲線就夠了。如下圖。
只要延長時間,靠一根業績走勢+業務表現,也可以解讀出變化的原因。如果過往一直都是有周期性波動,那拉長時間就能看出來周期規律。
實際企業經營中,也經常出現上邊三種情形,只是形態更復雜,往往是三種混合。比如B2C零售和B2B銷售是反著的:
自然周期性:周五到周日高,其他工作日低;
生命周期性:新品上市到下市有季節性規律
突發事件:大促銷(猛漲)惡劣天氣(猛跌)
在看數據的時候,往往會在業績曲線上打上標簽,比如一個日期是否節假日,是否某重點產品生命周期結束,是否突發情況。這樣,可以從看似無規律的曲線里區分出規律來。
這也是為啥很多經驗豐富的業務人員,即使沒有專門的數據分析,也能快速判斷形勢的原因。因為他們很了解業務上發生了啥事,了解過往業績曲線形態。
結合業務表現看走勢,比盲目的算同比、環比、平均數,中位數要有用得多。
06
深入細節看問題
做完上一步,只是幫大家理解了數據含義,并沒解答什么問題。如果止于上一步,就會變成業務的應聲蟲:“業績下降是因為下大暴雨了”“這是正常波動,周末肯定要跌啦”……只是單純的這么解讀,很有可能會換來一句:“我早知道了”。
實際上,往往人們都會注意到突發性急病,容易缺失的是對慢性病的觀察。比如下圖:
如果只看日數據,會感覺似乎每天波動不大,只能略微感到月頭比月尾似乎高那么一點。但是如果拉長看周數據,就會發現問題。
為什么在業績好的月份,最后一周不沖刺業績了?上月業績好+月底不沖刺+本月開局格外好,這個曲線走勢不和規律,很有可能是這就是B2B銷售中的“藏業績”行為。
這時候,做數據分析的也能對一線業務說:我早知道了。甚至還能從下個月初吐出多少單,反推出來他們每個人藏了多少業績。
這也是為啥實際企業經營中,我們不止看孤零零一個數,而是搭一個數據指標體系,還要做日報、周報、月報的原因。
日報用來關聯業務動作,反應突發問題,周報和月報用來追蹤趨勢,發現更深層次的問題。深層次的問題,再由專題分析解決。這樣就構成了數據分析體系,系統化作戰,才有威力。
當然,實際分析場景會更復雜。有可能經過數據解讀,我們得出的是:“銷售在藏單,真實業績比數據體現的更好”這種結論,但到底是不是藏了,真實的又是多少,還得成立專項,深入分析。
但無論如何,我們都比只回復一句:“要搞高!”要進步了很多,也能贏得業務的尊重。
07
解讀數據是個硬技能
有同學會說:既然讓數據分析師自己猜這么難,為什么不直接溝通業務的需求呢?是滴,理論上最佳的狀態,是業務和數據之間有定期溝通,業務陳述需求,數據反饋結論。
不過大部分企業,這個狀態不存在。大部分企業都是大家各忙各的,數據忙于爬表出數應付日常各種報表,業務忙著干活撕逼。部門之間深溝高壘,幾乎沒有溝通,越大的公司越是如此。
再加上,很多人對數據分析本身認識不清,還停留在“一個仙風鶴骨的道長掐指一算,口出出驚世憾俗之言”的印象中。共同作用,導致了文章開頭的問題。因此數據分析師不能單純指望業務把什么問題都梳理好了丟給自己,還是得有主動解讀的能力的。