課程特色:
明星講師。諸多免費課程熱力遍布全網,五星口碑爆棚;
規劃全面。涵蓋基礎知識、爬蟲采集、數據處理、可視化、數據建模,難得一見的Python體系全面數據科學課程,起步之路有高度;
精品質量。課程設計環節緊湊,循循善誘;課堂教學如行云流水,讓人受益匪淺;
講師介紹:
丘祐瑋(David Chiu) – 大數軟件(LargitData)創辦人,是一位致力于提供輿情分析服務的創業者與數據科學家,熟悉Hadoop,Spark 等大數據平臺,及擅長使用R,Python與機器學習技術進行數據分析。曾任多家上市公司顧問及擔任知名大數據應用程序競賽的評審,已編著MachineLearning With R Cookbook [Packt] 與 R Cookbook [Packt] 二書。
課程大綱:
第一章:Python與數據科學應用
1.數據科學簡介與應用
2.Python與數據科學
3.安裝Anaconda
4.使用Jupyter Notebook
5.Python 3語法快速簡介
6、Python 資料分析套件 – Pandas 簡介
7.數據科學步驟詳解
8.實戰范例 – 使用Python計算文章中的字詞頻率
第二章:數據搜集實例
1.數據型態
2.結構化vs半結構化vs非結構化資料
3.Python IO與檔案處理
4.處理CSV, Excel格式資料
5.處理JSON, XML格式資料
6.撰寫網路爬蟲搜集網路資料
7.實戰范例 – 房天下(Fang.com)屋價資料搜集
第三章:資料清理(I)
1.資料清理概論
2.簡介Pandas –使用Pandas處理資料
3.資料篩選
4.偵測遺失值
5.補齊遺失值
6.實戰范例 – 房屋資料處理
第四章:資料清理(II)
1.資料轉換
2.處理時間格式資料
3.重塑資料
4.學習正規表達式
5.實戰范例 – 新聞資料處理
第五章:資料探索與資料視覺化
1.使用Pandas產生敘述性統計
2.如何使用Pandas繪制統計圖表
3.實戰范例 – 網頁瀏覽紀錄資料分析
第六章:資料儲存實例
1.關聯式資料庫– SQLite簡介
2.將資料儲存至資料庫中
3.使用SQL Query分析結構化資料
4.實戰范例 – 匯率資訊儲存與管理
第七章:使用機器學習建立數據模型(回歸模型)
1.機器學習基礎
2.Scikit-Learn套件簡介
3.監督式學習與非監督式學習
4.回歸分析
5.回歸模型評估
6.實戰范例 – 使用回歸模型分析房屋價格
第八章:使用機器學習建立數據模型(分類模型)
1.資料分類–決策樹
2.資料分類– Logistic Regression
3.資料分類– SVM
4.資料分類–類神經網路
5.資料分類–隨機森林
6.實戰范例 – 使用分類模型預測客戶流失
第九章:使用機器學習建立數據模型(驗證模型)
1.混淆矩陣(Confusion Matrix )與其意義
2.交叉驗證(Cross Validation)
3.使用ROC評估不同分類模型
4.實戰范例 – 評估不同客戶流失分析模型
第十章:使用機器學習建立數據模型(資料分群)
1.分群方法–階層式分群
2.分群方法– Kmeans分群
3.分群方法– DBScan分群
4.分群結果評估
5.實戰范例 – 利用分群找出文章主題
第十一章:使用機器學習建立數據模型(特征篩選與降低維度)
1.特征篩選(Feature Selection)
2.特征萃取-PCA
3.特征萃取-SVD
4.實戰范例 – 使用SVD 壓縮圖檔
第十二章:使用機器學習建立數據模型(關聯與頻繁樣式分析篇)
1.關聯分析(Association Rule)
2.頻繁樣式探勘(Frequent Pattern Mining)
3.實戰范例 – 購物籃分析實例