課程目錄:
第一講: 數據科學家的武器庫(對應圖書第1章)xa0 xa0—免費試聽
1、數據科學的基本概念xa0
2、數理統計技術
3、數據挖掘的技術與方法
4、分類模型的評估方法
第二講:Python基礎(對應圖書第2、3章)xa0 xa0—免費試聽
1、Python簡介與安裝Anaconda
2、Python基礎數據類型與表達式
3、Python原生態數據結構
4、Python控制流、函數與模塊
第三講:信用卡客戶特征分析-產品客戶畫像初步(對應圖書第4、5章)
1、使用描述性統計進行數據探索
2、制作報表與統計制圖
3、數據可視化原則與報告PPT制作
4、討論題目-化妝品銷售數據的可視化分析:內容涉及業務報告的故事構思、對比分析、趨勢分析、產品畫像、客戶畫像與可視化
第四講:二手房價格分析報告(對應圖書第6、7章)
1、統計推論——大膽假設與小心求證
2、方差分析與相關分析——影響房價的單因素探索
3、線性回歸——影響房價因素的系統性分析
4、業務分析報告的標準模板
5、討論題目-建立上市公司績效預測模型:基于企業的歷史經營信息預測未來的營收狀況。
第五講:汽車貸款信用評分卡制作(對應圖書第6、8章)
2、卡方檢驗——影響違約的單因素探索
3、邏輯回歸——建立違約預測模型
4、數據挖掘報告的標準模板
5、討論題目-信用評分卡模型:內容涉及變量篩選、WOE轉換、建立模型、模型檢驗(ROC與KS)與評分卡制作
第六講:電信客戶流失預警(對應圖書第9、10章)
1、建立決策樹——判別流失類型
2、構建神經網絡——建立分類型的流失預警模型
3、討論題目-量化選股模型:基本面與動量選股策略、制作因子指標、建立神經網絡預測模型
第七講:信用卡行為反欺詐模型(對應圖書第11、12、16、17章)
1、集成學習在反欺詐模型的適用性
2、反欺詐模型的數據特征與不平衡數據處理
3、甜點:使用抽樣調整、組合算法提升寬帶營銷預測模型的預測能力
4、討論題目-信用卡行為反欺詐模型:稀疏數據問題、神經網絡反欺詐模型的難點、深度隨機森林的優勢
第八講:慈善機構精準營銷案例(對應圖書第13章)xa0
1、特征工程需要解決的問題
2、連續變量壓縮技術
3、分類變量壓縮技術
4、討論題目-信用卡客戶流失預警模型:CRISP_DM建模流程、數據清洗、變量壓縮、模型開發與評估
第九講:銀行客戶渠道使用偏好洞察案例(對應圖書第14章)xa0 xa0
1、客戶智能與客戶畫像
2、客戶360視圖與標簽體系
3、聚類模型與客戶細分
4、聚類模型與分類模型的螺旋式發展
5、分類模型算法進階-凸優化、樸素貝葉斯、SVM、GBDT推導與分類模型評估
6、討論題目-電信客戶消費行為聚類:變量主題相關性分析、信息壓縮、分布形式轉換與客戶分群描述
第十講:推薦系統設計與銀行產品推薦(對應圖書第15章)xa0xa0
1、推薦系統設計
2、推薦算法適用性分析
3、購物籃分析與關聯規則
4、討論題目-電信公司產品捆綁銷售策略制定:產品互補性分析與購物籃在捆綁銷售中的實操