python數據分析與機器學習實戰
2017年7月新課課程總時長:11小時12分鐘
適用人群
數據分析,機器學習,數據挖掘領域研究者。Python語言使用者。
課程概述
課程概述:
使用數據領域最主流語言Python及其分析與建模庫作為核心武器。對于機器學習經典算法給出完整的原理推導并基于實例進行講解,基于案例演示如何應用機器學習算法解決實際問題。
課程特色:
1.xa0 通俗易懂,快速入門
對機器學習經典算法結合數學推導進行形象解釋,實例演示。
2.xa0 Python主導,實用高效
使用數據領域最主流語言Python及其分析與建模庫作為課程核心工具。
3.xa0 案例為師,實戰護航
基于真實數據集,從零開始結合Python工具與機器學習算法完成整個案例實戰。
4.xa0 持續更新,一勞永逸
Python數據分析與機器學習課程會支持更新下去,逐步加入更多算法與案例。
課程學習路線圖:
目錄
章節1: Python科學計算庫-Numpy
xa0 課時1課程介紹(主題與大綱)10:46
xa0 課時2機器學習概述10:04
xa0 課時3使用Anaconda安裝python環境(Python新手先看這個)13:10
xa0 課時4課程數據,代碼,PPT(在參考資料界面)
xa0 課時5科學計算庫Numpy10:32
xa0 課時6Numpy基礎結構10:41
xa0 課時7Numpy矩陣基礎05:55
xa0 課時8Numpy常用函數12:02
xa0 課時9矩陣常用操作10:18
xa0 課時10不同復制操作對比10:49
章節2: python數據分析處理庫-Pandas
xa0 課時11Pandas數據讀取11:50
xa0 課時12Pandas索引與計算10:26
xa0 課時13Pandas數據預處理實例13:01
xa0 課時14Pandas常用預處理方法11:11
xa0 課時15Pandas自定義函數07:44
xa0 課時16Series結構12:29
章節3: Python數據可視化庫-Matplotlib
xa0 課時17折線圖繪制08:25
xa0 課時18子圖操作14:05
xa0 課時19條形圖與散點圖10:12
xa0 課時20柱形圖與盒圖10:17
xa0 課時21細節設置06:13
章節4: Python可視化庫Seaborn
xa0 課時22Seaborn簡介02:44
xa0 課時23整體布局風格設置07:48
xa0 課時24風格細節設置06:50
xa0 課時25調色板10:40
xa0 課時26調色板顏色設置08:18
xa0 課時27單變量分析繪圖09:38
xa0 課時28回歸分析繪圖08:53
xa0 課時29多變量分析繪圖10:36
xa0 課時30分類屬性繪圖09:40
xa0 課時31Facetgrid使用方法08:50
xa0 課時32Facetgrid繪制多變量08:30
xa0 課時33熱度圖繪制14:19
章節5: 回歸算法
xa0 課時34回歸算法綜述09:42
xa0 課時35回歸誤差原理推導13:01
xa0 課時36回歸算法如何得出最優解12:05
xa0 課時37基于公式推導完成簡易線性回歸08:40
xa0 課時38邏輯回歸與梯度下降16:59
xa0 課時39使用梯度下降求解回歸問題15:13
章節6: 決策樹
xa0 課時40決策樹算法綜述09:40
xa0 課時41決策樹熵原理13:20
xa0 課時42決策樹構造實例11:00
xa0 課時43信息增益原理05:27
xa0 課時44信息增益率的作用16:39
xa0 課時45決策樹剪枝策略12:08
xa0 課時46隨機森林模型09:15
xa0 課時47決策樹參數詳解17:49
章節7: 貝葉斯算法
xa0 課時48貝葉斯算法概述06:58
xa0 課時49貝葉斯推導實例07:38
xa0 課時50貝葉斯拼寫糾錯實例11:46
xa0 課時51垃圾郵件過濾實例14:10
xa0 課時52貝葉斯實現拼寫檢查器12:21
章節8: 支持向量機
xa0 課時53支持向量機要解決的問題12:01
xa0 課時54支持向量機目標函數10:01
xa0 課時55支持向量機目標函數求解10:05
xa0 課時56支持向量機求解實例14:18
xa0 課時57支持向量機軟間隔問題06:55
xa0 課時58支持向量核變換10:17
xa0 課時59SMO算法求解支持向量機29:29
章節9: 神經網絡
xa0 課時60初識神經網絡11:28
xa0 課時61計算機視覺所面臨的挑戰09:40
xa0 課時62K近鄰嘗試圖像分類10:01
xa0 課時63超參數的作用10:31
xa0 課時64線性分類原理09:35
xa0 課時65神經網絡-損失函數09:18
xa0 課時66神經網絡-正則化懲罰項07:19
xa0 課時67神經網絡-softmax分類器13:39
xa0 課時68神經網絡-最優化形象解讀06:47
xa0 課時69神經網絡-梯度下降細節問題11:49
xa0 課時70神經網絡-反向傳播15:17
xa0 課時71神經網絡架構10:11
xa0 課時72神經網絡實例演示10:39
xa0 課時73神經網絡過擬合解決方案15:54
xa0 課時74感受神經網絡的強大11:30
章節10: Xgboost集成算法
xa0 課時75集成算法思想05:35
xa0 課時76xgboost基本原理11:07
xa0 課時77xgboost目標函數推導12:18
xa0 課時78xgboost求解實例11:29
xa0 課時79xgboost安裝03:32
xa0 課時80xgboost實戰演示14:44
xa0 課時81Adaboost算法概述13:01
章節11: 自然語言處理詞向量模型-Word2Vec
xa0 課時82自然語言處理與深度學習11:58
xa0 課時83語言模型06:16
xa0 課時84-N-gram模型08:32
xa0 課時85詞向量09:28
xa0 課時86神經網絡模型10:03
xa0 課時87Hierarchical Softmax10:01
xa0 課時88CBOW模型實例11:21
xa0 課時89CBOW求解目標05:39
xa0 課時90梯度上升求解10:11
xa0 課時91負采樣模型07:15
章節12: K近鄰與聚類
xa0 課時92無監督聚類問題16:04
xa0 課時93聚類結果與離群點分析12:55
xa0 課時94K-means聚類案例對NBA球員進行評估14:23
xa0 課時95使用Kmeans進行圖像壓縮07:58
xa0 課時96K近鄰算法原理12:34
xa0 課時97K近鄰算法代碼實現18:44
章節13: PCA降維與SVD矩陣分解
xa0 課時98PCA基本原理10:48
xa0 課時99PCA實例08:34
xa0 課時100SVD奇異值分解原理10:08
xa0 課時101SVD推薦系統應用實例13:31
章節14: scikit-learn模型建立與評估
xa0 課時102使用python庫分析汽車油耗效率15:09
xa0 課時103使用scikit-learn庫建立回歸模型14:02
xa0 課時104使用邏輯回歸改進模型效果13:12
xa0 課時105 模型效果衡量標準20:09
xa0 課時106ROC指標與測試集的價值14:31
xa0 課時107交叉驗證15:15
xa0 課時108多類別問題15:52
章節15: Python庫分析科比生涯數據
xa0 課時109Kobe Bryan生涯數據讀取與簡介07:45
xa0 課時110特征數據可視化展示11:41
xa0 課時111數據預處理12:32
xa0 課時112使用Scikit-learn建立模型10:12
章節16: 機器學習項目實戰-泰坦尼克獲救預測
xa0 課時113船員數據分析11:02
xa0 課時114數據預處理11:39
xa0 課時115使用回歸算法進行預測12:13
xa0 課時116使用隨機森林改進模型13:25
xa0 課時117隨機森林特征重要性分析15:55
章節17: 機器學習項目實戰-交易數據異常檢測
xa0 課時118案例背景和目標08:32
xa0 課時119樣本不均衡解決方案10:18
xa0 課時120下采樣策略06:36
xa0 課時121交叉驗證13:03
xa0 課時122模型評估方法13:06
xa0 課時123正則化懲罰08:09
xa0 課時124邏輯回歸模型07:37
xa0 課時125混淆矩陣08:53
xa0 課時126邏輯回歸閾值對結果的影響10:01
xa0 課時127SMOTE樣本生成策略15:51
章節18: Python文本數據分析:新聞分類任務
xa0 課時128文本分析與關鍵詞提取12:11
xa0 課時129相似度計算11:44
xa0 課時130新聞數據與任務簡介10:20
xa0 課時131TF-IDF關鍵詞提取13:28
xa0 課時132LDA建模09:10
xa0 課時133基于貝葉斯算法進行新聞分類14:53
章節19: Python時間序列分析
xa0 課時134章節簡介01:03
xa0 課時135Pandas生成時間序列11:28
xa0 課時136Pandas數據重采樣09:22
xa0 課時137Pandas滑動窗口07:47
xa0 課時138數據平穩性與差分法11:10
xa0 課時139ARIMA模型10:34
xa0 課時140相關函數評估方法10:46
xa0 課時141建立ARIMA模型07:48
xa0 課時142參數選擇12:40
xa0 課時143股票預測案例09:57
xa0 課時144使用tsfresh庫進行分類任務12:04
xa0 課時145維基百科詞條EDA14:30
章節20: 使用Gensim庫構造中文維基百度數據詞向量模型
xa0 課時146使用Gensim庫構造詞向量06:22
xa0 課時147維基百科中文數據處理10:27
xa0 課時148Gensim構造word2vec模型08:52
xa0 課時149測試模型相似度結果07:42
章節21: 機器學習項目實戰-貸款申請最大化利潤
xa0 課時150數據清洗過濾無用特征12:08
xa0 課時151數據預處理10:12
xa0 課時152獲得最大利潤的條件與做法13:26
xa0 課時153預測結果并解決樣本不均衡問題12:47
章節22: 機器學習項目實戰-用戶流失預警
xa0 課時154數據背景介紹06:35
xa0 課時155數據預處理10:05
xa0 課時156嘗試多種分類器效果08:32
xa0 課時157結果衡量指標的意義19:50
xa0 課時158應用閾值得出結果06:26
章節23: 探索性數據分析-足球賽事數據集
xa0 課時159內容簡介02:13
xa0 課時160數據背景介紹10:30
xa0 課時161數據讀取與預處理13:09
xa0 課時162數據切分模塊14:42
xa0 課時163缺失值可視化分析13:27
xa0 課時164特征可視化展示12:23
xa0 課時165多特征之間關系分析11:21
xa0 課時166報表可視化分析10:38
xa0 課時167紅牌和膚色的關系17:16
章節24: 探索性數據分析-農糧組織數據集
xa0 課時168數據背景簡介11:05
xa0 課時169數據切片分析17:26
xa0 課時170單變量分析15:21
xa0 課時171峰度與偏度11:37
xa0 課時172數據對數變換09:43
xa0 課時173數據分析維度06:55
xa0 課時174變量關系可視化展示12:22
章節25: 機器學習項目實戰-HTTP日志聚類分析
xa0 課時175建立特征工程17:25
xa0 課時176特征數據預處理10:34
xa0 課時177應用聚類算法得出異常IP點17:59