到底高級的數據分析師需要啥能力?這是很多人心中的疑惑。網上流行的都是Excel,SQL,Python/ target=_blank class=infotextkey>Python,都是數據分析從0到1,那到底從1到100該弄些啥?陳老師給大家準備了一個《數據分析年底盤點》系列分享,今天,就從很少人講的“能力”開始。
首先,咱先清晰下:知識、技能、能力的區別:
1、知識,比如統計學、數學、運籌學、機器學習,知識有理論體系,可以對著書學。
2、技能,比如Excel、SQL、Python、Tableau等軟件。可以通過反復操作提升的。
3、能力,比如業務理解,溝通,邏輯思維,匯報等,這些很重要但沒有標準教程。
那想要完成從1到100的成長,數據分析師該具備哪些能力呢?
能力一:業務理解
這是脫離底層SQLboy,取數工具人的第一步。組長級以上的數據分析師,都得跟業務直接溝通項目,數據部門總監要上經營分析會,不懂業務是過不去的。一個公司的業務,有戰略、戰術、戰斗三層,數據分析師的理解,也是分三層次的(如下圖):
圖片
想要全面理解業務,可能需要在行業里待很多年。但使用價值鏈模型+財務報表,可以快速理解一個行業的主要收入、成本結構,快速建立認知,應付面試是夠了。具體的業務流程梳理,可以借助企業的SOP+業務系統的流程,快速理解。
能力二:梳理指標
因為業務流程非常靈活多變,很多時候高級的數據分析師要自己動手梳理指標(而不是背誦AARRR之流)梳理指標體系。梳理指標體系需要結合具體業務流程(即業務理解里戰斗層)。數據指標有總分式和流程式兩種基本形態(如下圖),但很多時候,業務流程本身很復雜,步驟非常多,因此需要有能力細細梳理。
圖片
能力三:設計標簽
設計標簽能力和梳理指標一樣重要,但是經常被人忽視。高級的數據分析師可不是只會把維度表里的城市、性別、年齡拖出來用,而是能很敏銳地從業務口中捕捉到“高級用戶”“長線運營”“防御性產品”這種詞語,然后試著用數據量化。
這些有業務含義的標簽,俗稱“黑話”“行話”,是衡量一個數據分析師對行業理解的重要標準。當然,能隨時設計一個新標簽,更是高能力的體現(如下圖):
圖片
能力四:溝通需求
有了指標和標簽,可以開始取數了。但未經處理的原始數據需求,經常是混亂的,比如:
“喂!給我個數,就常規那種數就行,快點!”
“給我預測下明年銷量,不用100%準,99%準就行”
“幫我算算哪個用戶不買單,我去了他就買的那種”
一個合格的數據組長、部門經理,有能力把這些混亂的表達,整理成標準化的指標+維度,并且能弄清業務看數據的目的。這是非常重要的能力!很多同學就是因為自己的領導沒這種能力,才被虐得死去活來。
圖片
一個優秀的數據部門經理,則可以從常規取數需求中,發現開發看板,開發模型的機會,從而從部門爭取更多功勞,這是更寶貴的高級能力了。
能力五:分析邏輯
所謂分析邏輯,即是如何用數據說明問題,這里有兩種典型的邏輯
1、拆分邏輯,從一個主指標出來,層層拆分,找到問題答案
2、假設邏輯,先提業務假設,再用數據驗證假設關系
一般數據分析師在自己看數據的時候,多使用拆分邏輯,從大到小找到問題點。而在和業務部門討論時,業務可能會提出分析假設,此時要剝洋蔥式驗證。分析邏輯是數據分析核心能力,如果分析能力不強,那就只能寫:“活躍低了,要搞高”這種東西。只會寫要搞高的話,基本上與高薪崗位無緣了。
圖片
能力六:設計實驗
除了利用現有數據,測試也是一個常用工具。但注意!設計實驗,是非常考驗人能力的。因為統計學的雙樣本T檢驗,只會告訴你抽樣出來的數字有沒有顯著差異,但是為啥要拿這兩組數字做對比;為啥要比這個指標;有顯著差異又說明業務上的啥問題,都得自己想明白才行。
圖片
經常有業務方在做ABtest的時候,不去思考兩個用戶群體,兩個版本有沒有可比性,不去控制一下干擾因素,搞得測試結果很難解釋。前后幾次測試不一樣,都是源于此。我們常說,一個好的實驗得基于業務,針對誰?測什么指標?控什么因素?都得想清楚,這才是推理能力的體現。
能力七:項目管理
高級的數據分析師當然需要有項目管理能力,因為數據分析工作本身就和各個業務有交集。前端埋點沒做好,業務規則不清晰,一線人員瞎操作,都會影響數據質量,影響預測的準確性,影響數據看板上線,影響模型落地。所以要有項目協調與溝通能力,推動項目實現。項目管理是所有高級崗位的通用能力。
能力八:總結匯報
匯報能力也是一項高級崗位通用能力,只不過對高級的數據分析師格外重要,因為要直面各部門老板,數據嚴謹性,總結的可科學性,推理的嚴密性要求都很高。且經常要根據老板們的意圖,隨時調整匯報方向(見風使舵),這個對個人能力要求是很高的。