養(yǎng)成式數(shù)據(jù)科學(xué)家培養(yǎng)模式,針對(duì)入門難、頭緒亂、進(jìn)步緩慢、缺乏業(yè)界經(jīng)驗(yàn)、面試恐懼等問(wèn)題提供解決方案。
從3個(gè)維度展開,技術(shù)維度:全面講解數(shù)據(jù)分析、數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的核心技術(shù);業(yè)務(wù)維度,圍繞具體的業(yè)務(wù)生命周期展開技術(shù)知識(shí)點(diǎn)的講解;實(shí)踐維度,列舉的全部是商業(yè)案例,通過(guò)案例為數(shù)據(jù)科學(xué)從業(yè)者提供工作模板。
課程目錄:
第一講: 數(shù)據(jù)科學(xué)家的武器庫(kù)(對(duì)應(yīng)圖書第1章)
1、數(shù)據(jù)科學(xué)的基本概念
2、數(shù)理統(tǒng)計(jì)技術(shù)
3、數(shù)據(jù)挖掘的技術(shù)與方法
4、分類模型的評(píng)估方法
第二講:python基礎(chǔ)(對(duì)應(yīng)圖書第2、3章)
1、Python簡(jiǎn)介與安裝Anaconda
2、Python基礎(chǔ)數(shù)據(jù)類型與表達(dá)式
3、Python原生態(tài)數(shù)據(jù)結(jié)構(gòu)
4、Python控制流、函數(shù)與模塊
第三講:信用卡客戶特征分析-產(chǎn)品客戶畫像初步(對(duì)應(yīng)圖書第4、5章)
1、使用描述性統(tǒng)計(jì)進(jìn)行數(shù)據(jù)探索
2、制作報(bào)表與統(tǒng)計(jì)制圖
3、數(shù)據(jù)可視化原則與報(bào)告PPT制作
4、討論題目-化妝品銷售數(shù)據(jù)的可視化分析:內(nèi)容涉及業(yè)務(wù)報(bào)告的故事構(gòu)思、對(duì)比分析、趨勢(shì)分析、產(chǎn)品畫像、客戶畫像與可視化
第四講:二手房?jī)r(jià)格分析報(bào)告(對(duì)應(yīng)圖書第6、7章)
1、統(tǒng)計(jì)推論——大膽假設(shè)與小心求證
2、方差分析與相關(guān)分析——影響房?jī)r(jià)的單因素探索
3、線性回歸——影響房?jī)r(jià)因素的系統(tǒng)性分析
4、業(yè)務(wù)分析報(bào)告的標(biāo)準(zhǔn)模板
5、討論題目-建立上市公司績(jī)效預(yù)測(cè)模型:基于企業(yè)的歷史經(jīng)營(yíng)信息預(yù)測(cè)未來(lái)的營(yíng)收狀況。
第五講:汽車貸款信用評(píng)分卡制作(對(duì)應(yīng)圖書第6、8章)
2、卡方檢驗(yàn)——影響違約的單因素探索
3、邏輯回歸——建立違約預(yù)測(cè)模型
4、數(shù)據(jù)挖掘報(bào)告的標(biāo)準(zhǔn)模板
5、討論題目-信用評(píng)分卡模型:內(nèi)容涉及變量篩選、WOE轉(zhuǎn)換、建立模型、模型檢驗(yàn)(ROC與KS)與評(píng)分卡制作
第六講:電信客戶流失預(yù)警(對(duì)應(yīng)圖書第9、10章)
1、建立決策樹——判別流失類型
2、構(gòu)建神經(jīng)網(wǎng)絡(luò)——建立分類型的流失預(yù)警模型
3、討論題目-量化選股模型:基本面與動(dòng)量選股策略、制作因子指標(biāo)、建立神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型
第七講:信用卡行為反欺詐模型(對(duì)應(yīng)圖書第11、12、16、17章)
1、集成學(xué)習(xí)在反欺詐模型的適用性
2、反欺詐模型的數(shù)據(jù)特征與不平衡數(shù)據(jù)處理
3、甜點(diǎn):使用抽樣調(diào)整、組合算法提升寬帶營(yíng)銷預(yù)測(cè)模型的預(yù)測(cè)能力
4、討論題目-信用卡行為反欺詐模型:稀疏數(shù)據(jù)問(wèn)題、神經(jīng)網(wǎng)絡(luò)反欺詐模型的難點(diǎn)、深度隨機(jī)森林的優(yōu)勢(shì)
第八講:慈善機(jī)構(gòu)精準(zhǔn)營(yíng)銷案例(對(duì)應(yīng)圖書第13章)
1、特征工程需要解決的問(wèn)題
2、連續(xù)變量壓縮技術(shù)
3、分類變量壓縮技術(shù)
4、討論題目-信用卡客戶流失預(yù)警模型:CRISP_DM建模流程、數(shù)據(jù)清洗、變量壓縮、模型開發(fā)與評(píng)估
第九講:銀行客戶渠道使用偏好洞察案例(對(duì)應(yīng)圖書第14章)
1、客戶智能與客戶畫像
2、客戶360視圖與標(biāo)簽體系
3、聚類模型與客戶細(xì)分
4、聚類模型與分類模型的螺旋式發(fā)展
5、分類模型算法進(jìn)階-凸優(yōu)化、樸素貝葉斯、SVM、GBDT推導(dǎo)與分類模型評(píng)估
6、討論題目-電信客戶消費(fèi)行為聚類:變量主題相關(guān)性分析、信息壓縮、分布形式轉(zhuǎn)換與客戶分群描述
第十講:推薦系統(tǒng)設(shè)計(jì)與銀行產(chǎn)品推薦(對(duì)應(yīng)圖書第15章)
1、推薦系統(tǒng)設(shè)計(jì)
2、推薦算法適用性分析
3、購(gòu)物籃分析與關(guān)聯(lián)規(guī)則
4、討論題目-電信公司產(chǎn)品捆綁銷售策略制定:產(chǎn)品互補(bǔ)性分析與購(gòu)物籃在捆綁銷售中的實(shí)操