[數據分析] Python3數據分析與挖掘建模實戰視頻教程 包含相關電子書和隨堂代碼
第1章 課程介紹
本章首先介紹本課程是什么,有什么特色,能學習到什么,內容如何安排,需要什么基礎,是否適合學習這門課程等。然后對數據分析進行概述,讓大家對數據分析的含義和作用有一個整體的認知,讓大家對自己接下來要做的事情,有一個基本的概念與了解。…
第2章 數據獲取
數據從哪里來?怎么來?這一章,我們會介紹數據獲取的一般手段。主要包括數據倉庫、抓取、資料填寫、日志、埋點、計算等手段。同時,我們也會介紹幾個常用的數據網站,供大家參考與學習。
第3章 單因子探索分析與數據可視化
有了數據,如何上手?這一章,我們會介紹探索分析的一部分—單因子探索分析和可視化的內容。我們會以基礎的統計理論知識為切入點,學習異常值分析、對比分析、結構分析、分布分析。同時,引入接下來幾章都會用到的案例-HR人力資源分析表,并用理論與可視化的方法,完成對此表的初步分析。…
第4章 多因子探索分析
上了手,然后呢?這一章,我們介紹探索分析的另一部分—多因子復合探索分析。我們同樣以基礎的統計知識為切入點,學習多因子間互相影響與配合的分析方法,如交叉分析、分組分析、相關分析、成分分析等。同時,以HR人力資源分析表為例,進行進一步的探索。…
第5章 預處理理論
數據已了解,用起來!不著急,先加工。這一章,我們會介紹特征工程的主要內容,重點會介紹數據清洗和數據特征預處理的主要內容,包括數據清洗、特征獲取、特征處理(內含對指化、歸一化、標準化等)、特征降維、特征衍生。預處理的好壞,直接影響著接下來模型的效果。…
第6章 挖掘建模
把數據用起來!這一章,我們會介紹數據挖掘與建模的主要內容。主要包含五類模型的建立與實踐,分別為:分類模型(KNN、樸素貝葉斯、決策樹、SVM、集成方法、GBDT……),回歸模型與回歸思想分類(線性回歸、邏輯斯特回歸【也叫羅吉回歸,邏輯回歸。音譯區別】、神經網絡、回歸樹),聚類模型(K-means、DBSCAN、層次聚類、…
第7章 模型評估
哪個模型好?上一章,我們學習了很多模型,一個數據集,可能用多種模型都可以進行建模,那么哪種模型好,就需要有些指標化的東西幫我們決策。這一章,我們會介紹使用混淆矩陣和相應的指標、ROC曲線與AUC值來評估分類模型;用MAE、MSE、R2來評估回歸模型;用RMS、輪廓系數來評估聚類模型。…
第8章 總結與展望
這一章,我們將回顧本課程的全部內容,并從多個角度,重新看待我們的數據分析工作。最后,我們會了解到,學習了這門課程以后,還可以在哪些方面進行發展。