一、在深演,神秘又高能的數據科學家到底是做什么的?
數據科學本質上是利用數據幫助企業更科學地做決定,這是一件非常有挑戰的事情。一方面數據科學家需要能理解企業的業務及業務痛點,另一方面還要有能力把企業面臨的問題,有效地轉化為可落地的算法問題。所以,我們的工作主要圍繞這兩個挑戰展開。
1. 與客戶愉快地溝通
我們首先得有能力和客戶愉快地溝通。一個項目往往會涉及很多部門,很多同事,而且很多情況下,大家都是初次合作,彼此都很不了解,溝通就顯得特別重要。有效地表達觀點和聆聽別人的想法是我們的日常工作,也是我們的必修課,這也是我們充分、深入了解客戶業務的基礎。
2. 把問題定義清楚,思考該怎么落地
這個環節也是數據科學項目最有意思的地方,你可以把一個具體的現實問題巧妙地轉化成監督學習的正負樣本;或者把一個現實的情況描述成一串數學公式。為了驗證你的解題思路是否正確,你還需要設計合適的指標來驗證你的猜想。
3. Just do it
為了驗證我們解體思路,接下來需要我們搭建合適的算法,讓算法run起來。這個過程,往往需要花點時間,雖然現在的機器學習算法已經非常強大了,為我們提供了非常有力的計算能力,特別是在理想數據集上,效果往往很不錯。但是我們知道,現實世界的數據往往是不完美的,這就需要嘗試設計不同的算法策略來迭代出好的結果。
4. 讓運營同學站在算法的肩膀上
算法輸出結果,是需要被精心運營的。我們經常和運營同學co-work,這也是我們非常有特色的工作之一。看著我們輸出的結果,能被運營同學安排的妥妥當當,你會確信,未來的效果值得擁有!
二、聚焦業務和場景,和客戶一起成長,讓數據科學更有力量和影響力
深演智能的數據科學家需要去到真正的業務場景摸爬滾打,我們需要面向客戶,對客戶業務負責。每一個場景的模型解決方案都要面向實際業務,能夠立竿見影地幫助客戶解決最關心的業務問題。
1、智能營銷模型的成功實踐——以某美妝品牌為例
某國際美妝品牌期望利用618年中大促喚醒高價值沉睡客戶。但由于該客戶旗下SKU眾多,大促權益較多而且用戶體量龐大,傳統的CRM運營難以支撐精細化運營,所以客戶希望通過搭建個性化、智能化產品推薦模型的方式,實現精細化運營,喚醒更多的沉睡用戶。
我們的數據科學家團隊通過模型對用戶復購的可能性進行打分,利用建模結果創建細分人群策略 :對于模型中的高分人群,根據用戶偏好匹配相應的產品和推廣文案,進行高頻觸達;對于模型中的低分人群,相比于高分人群,降低線上觸達次數,但是疊加線下服務進行觸達。
除了通過構建模型來給客戶帶來價值以外,我們還做了非常精細化的運營工作,來保證活動的最終效果。首先,我們根據模型結果在營銷系統中創建全面的618活動策略,并使用活動工具實現自動化;其次,我們有專業的運營團隊,利用A/B測試的方式獲得更多操作策略。比如:618活動期間,營銷文案的發放時間、頻率、內容、優惠方式、活動主題等不同,會產生激活效果的差異,我們的運營人員通過A/B測試的方式找出更合適客戶的精準推廣策略。
通過我們的數據科學團隊和運營團隊的共同努力,最終我們幫助客戶實現了比傳統CRM 運營方式提升40% 以上的營銷效果。
2、豬瘟等流行病相關的模型研究——以某養豬企業為例
前兩年豬瘟很嚴重,一旦豬場有一兩頭豬發生豬瘟,全場一兩千甚至上萬頭豬都會慢慢被傳染。一個豬場的管理包含諸多因素,比如豬場環境、人員消毒、飼料、室內結構、疫苗、檢測設備等。企業的痛點是不知道豬瘟發生后要優先做什么,而我們可以通過算法模擬這個過程,告訴企業最優先采取什么措施降低損失。
我們和中國頂尖的流行病專家,包括中國農業大學、復旦大學、西安交通大學專家一起合作,基于對病理學的理解、對豬場業務的理解,運用算法特長幫助他們識別可能的影響因素,搭建了一套帶有預測性質的平臺,幫助客戶去預測在豬瘟發生后豬場未來的變化以及預防措施。
我們從平臺側實現了兩大突破:一是,打破了信息壁壘,實現數據集合與共享。一些經典的優秀案例能夠在這個平臺上共享,比如某企業做了一個消毒行為,產生了很好的效果,通過這個平臺,就能將這樣好的實踐方法傳遞出去,擴大良性影響。二是,引進結合流行病動力學的傳染病模型。基于我們對優化算法的理解,研究出一個豬瘟傳染模型,通過模擬給客戶一種直觀的感覺,包括豬瘟感染時間、數量的預測,以及當下要做的應對措施等。這些可以作為輔助的決策,讓工廠能夠及時看到除經驗之外的數據算法帶來的一些洞察,幫助他們進行更加科學高效的決策。
三、加入深演,一起解鎖超有趣der未來
一個能拓展眼界的環境。我們能夠面對多元化的客戶及其豐富的業務場景,這對數據科學家來講是非常關鍵的。
閉環的數據科學能力培養。很多企業的數據科學家只負責模型搭建的工作,在深演,我們能夠“從頭到尾”地參與項目,包括業務調研、模型搭建、效果展現等各個環節,全方位地培養了我們的建模能力、咨詢能力、項目協調能力等。我們的能力變成了一條線,而不單是一個點,我們成為了一個能夠真正幫客戶解決問題的團隊。
業務發展空間大,提供了快速上升的通道。隨著公司業務的快速發展,數據科學團隊也在不斷擴充力量,團隊與個人互相成就,個人必將會隨著團隊的發展而快速發展。
伴隨著AI和技術的不斷落地,相信數據科學家也將在智能時代發揮越來越重要的作用。在深演智能,好的數據科學家應該有雙重身份:資深模型工程師+成熟業務人員,即業務專家與技術專家角色的結合,真正幫助客戶規模化落地實實在在的價值。
關注深演智能招聘官微【深演智能Talent】,了解更多招聘信息!