Python數據分析(機器學習)經典案例
2017年
適用人群
從事機器學習,數據分析,數據挖掘的同學們以及python使用者
課程概述
選擇經典案例基于真實數據集,從數據預處理開始到建立機器學習模型以及效果評估,完整的講解如何使用python及其常用庫進行數據的分析和模型的建立。對于每一個面對的挑戰,分析解決問題思路以及如何構造合適的模型并且給出合適評估方法。在每一個案例中,同學們可以快速掌握如何使用pandas進行數據的預處理和分析,使用matplotlib進行可視化的展示以及基于scikit-learn庫的機器學習模型的建立。
課程目錄
章節1:使用Python庫分析處理Kobe Bryan職業生涯數據
課時1課程簡介xa0xa003:01
課時2課程數據,代碼下載
課時3使用Anaconda搭建python環境xa0xa013:10
課時4Kobe Bryan生涯數據讀取與簡介xa0xa007:45
課時5特征數據可視化展示xa0xa011:41
課時6數據預處理xa0xa012:32
課時7使用scikit-learn建立分類模型xa0xa010:12
章節2:信用卡欺詐行為檢測
課時8數據簡介及面臨的挑戰xa0xa010:56
課時9數據不平衡問題解決方案xa0xa013:14
課時10邏輯回歸進行分類預測xa0xa015:26
課時11使用閾值來衡量預測標準xa0xa017:04
課時12使用數據生成策略xa0xa011:00
章節3:鳶尾花數據集分析
課時13數據簡介與特征課時化展示xa0xa011:10
課時14不同特征的分布規則xa0xa006:32
課時15決策樹模型參數詳解xa0xa011:07
課時16決策樹中參數的選擇xa0xa009:28
課時17將建立好決策樹可視化展示出來xa0xa008:47
章節4:泰坦尼克號獲救預測
課時18船員數據分析xa0xa006:10
課時19數據預處理xa0xa013:36
課時20使用回歸算法進行預測xa0xa014:30
課時21使用隨機森林改進模型xa0xa012:56
課時22隨機森林特征重要性分析xa0xa010:40
章節5:級聯結構的機器學習模型
課時23級聯模型原理xa0xa005:06
課時24數據預處理與熱度圖xa0xa010:25
課時25二階段輸入特征制作xa0xa006:35
課時26使用級聯模型進行預測xa0xa013:29
章節6:員工離職預測
課時27數據簡介與特征預處理xa0xa013:34
課時28員工不同屬性指標對結果的影響xa0xa015:42
課時29數據預處理xa0xa012:03
課時30構建預測模型xa0xa010:28
課時31基于聚類模型的分析xa0xa005:42
章節7:使用神經網絡進行手寫字體識別(mnist)
課時32tensorflow框架的安裝xa0xa007:09
課時33神經網絡模型概述xa0xa012:53
課時34使用tensorflow設定基本參數xa0xa009:52
課時35卷積神經網絡模型xa0xa010:49
課時36構建完整的神經網絡模型xa0xa014:32
課時37訓練神經網絡模型xa0xa012:34
章節8:主成分分析(PCA)
課時38PCA原理簡介xa0xa005:34
課時39數據預處理xa0xa008:42
課時40協方差分析xa0xa010:27
課時41使用PCA進行降維xa0xa007:46
章節9:基于NLP的股價預測
課時42數據簡介與故事背景xa0xa004:11
課時43基于詞頻的特征提取xa0xa010:25
課時44改進特征選擇方法xa0xa012:25
章節10:借貸公司數據分析
課時45數據清洗xa0xa012:08
課時46數據預處理xa0xa010:12
課時47盈利方法和模型評估xa0xa013:26
課時48預測結果xa0xa012:47