適用人群
從事機器學(xué)習(xí),數(shù)據(jù)分析,數(shù)據(jù)挖掘的同學(xué)們以及python使用者
課程概述
選擇經(jīng)典案例基于真實數(shù)據(jù)集,從數(shù)據(jù)預(yù)處理開始到建立機器學(xué)習(xí)模型以及效果評估,完整的講解如何使用python及其常用庫進行數(shù)據(jù)的分析和模型的建立。對于每一個面對的挑戰(zhàn),分析解決問題思路以及如何構(gòu)造合適的模型并且給出合適評估方法。在每一個案例中,同學(xué)們可以快速掌握如何使用pandas進行數(shù)據(jù)的預(yù)處理和分析,使用matplotlib進行可視化的展示以及基于scikit-learn庫的機器學(xué)習(xí)模型的建立
【課程內(nèi)容】
課時01.課程簡介
課時02.課程數(shù)據(jù),代碼下載
課時03.使用Anaconda搭建python環(huán)境
課時04.Kobe.Bryan生涯數(shù)據(jù)讀取與簡介
課時05.特征數(shù)據(jù)可視化展示
課時06.數(shù)據(jù)預(yù)處理
課時07.使用scikit-learn建立分類模型
課時08.數(shù)據(jù)簡介及面臨的挑戰(zhàn)
課時09.數(shù)據(jù)不平衡問題解決方案
課時10.邏輯回歸進行分類預(yù)測
課時11.使用閾值來衡量預(yù)測標(biāo)準(zhǔn)
課時12.使用數(shù)據(jù)生成策略
課時13.數(shù)據(jù)簡介與特征課時化展示
課時14.不同特征的分布規(guī)則
課時15.決策樹模型參數(shù)詳解
課時16.決策樹中參數(shù)的選擇
課時17.將建立好決策樹可視化展示出來
課時18.船員數(shù)據(jù)分析
課時19.數(shù)據(jù)預(yù)處理
課時20.使用回歸算法進行預(yù)測
課時21.使用隨機森林改進模型
課時22.隨機森林特征重要性分析
課時23.級聯(lián)模型原理
課時24.數(shù)據(jù)預(yù)處理與熱度圖
課時25.二階段輸入特征制作
課時26.使用級聯(lián)模型進行預(yù)測
課時27.數(shù)據(jù)簡介與特征預(yù)處理
課時28.員工不同屬性指標(biāo)對結(jié)果的影響
課時29.數(shù)據(jù)預(yù)處理
課時30.構(gòu)建預(yù)測模型
課時31.基于聚類模型的分析
課時32.tensorflow框架的安裝
課時33.神經(jīng)網(wǎng)絡(luò)模型概述
課時34.使用tensorflow設(shè)定基本參數(shù)
課時35.卷積神經(jīng)網(wǎng)絡(luò)模型
課時36.構(gòu)建完整的神經(jīng)網(wǎng)絡(luò)模型
課時37.訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型
課時38.PCA原理簡介
課時39.數(shù)據(jù)預(yù)處理
課時40.協(xié)方差分析
課時41.使用PCA進行降維
課時42.數(shù)據(jù)簡介與故事背景
課時43.基于詞頻的特征提取
課時44.改進特征選擇方法
課時45.數(shù)據(jù)清洗
課時46.數(shù)據(jù)預(yù)處理
課時47.盈利方法和模型評估
課時48.預(yù)測結(jié)果