2017年《機器學習》升級版IV,從理論到實踐
2017年3月14日開課6月份結束 價值899 資料齊全-
小象學院
課程名稱:
《機器學習》升級版 IV
主講老師:
鄒博xa0 xa0xa0 xa0小象學院獨家簽約
計算機博士,現科學院從事科研教學工作;主持國家級科研項目2個,副負責1個,國家專利2項,研究方向機器學習、數據挖掘、計算幾何,應用于股票交易與預測、醫藥圖像識別、智能畜牧等方向。擅長機器學習模型選擇、核心算法分析和代碼實現。
課程目標:
本課程特點是從數學層面推導最經典的機器學習算法,以及每種算法的示例和代碼實現(Python)、如何做算法的參數調試、以實際應用案例分析各種算法的選擇等。
開課時間:
2017年3月14日,共24次課,每次2小時
學習方式:
在線直播,共24次
每周3次(周二、四、六,晚上20:00-22:00)
直播后提供錄制回放視頻,在線反復觀看,有效期1年
升級版IV的內容特色:
xa0 xa0xa0 xa01.xa0xa0拒絕簡單的“調包”——增加3次“機器學習的角度看數學”和3次“Python數據清洗和特征提取”,提升學習深度、降低學習坡度。
xa0 xa0xa0 xa02.xa0xa0增加網絡爬蟲的原理和編寫,從獲取數據開始,重視將實踐問題轉換成實際模型的能力,分享工作中的實際案例或Kaggle案例:廣告銷量分析、環境數據異常檢測和分析、數字圖像手寫體識別、Titanic乘客存活率預測、用戶-電影推薦、真實新聞組數據主題分析、中文分詞、股票數據特征分析等。
xa0 xa0xa0 xa03.xa0xa0強化矩陣運算、概率論、數理統計的知識運用,掌握機器學習根本。
xa0 xa0xa0 xa04.xa0xa0闡述機器學習原理,提供配套源碼和數據;確保“懂推導,會實現”。
xa0 xa0xa0 xa05.xa0xa0刪去過于晦澀的公式推導,代之以直觀解釋,增強感性理解。
xa0 xa0xa0 xa06.xa0xa0重視項目實踐(如工業實踐、Kaggle等),重視落地。
xa0 xa0xa0 xa07.xa0xa0對比不同的特征選擇帶來的預測效果差異。
xa0 xa0xa0 xa08.xa0xa0思考不同算法之間的區別和聯系,提高在實際工作中選擇算法的能力。
xa0 xa0xa0 xa09.xa0xa0涉及和講解的部分Python庫有:Numpy/Scipy/matplotlib/Pandas/scikit-learn/XGBoost/libSVM/LDA/Gensim/NLTK/HMMLearn,涉及的其他“小”庫在課程的實踐環節會逐一講解。
xa0 xa0xa0 xa010.xa0xa0每個算法模塊按照“原理講解->自己動手實現->使用已有機器學習庫”的順序,切實做到“頂天立地”。
課程大綱:
第一課:機器學習的數學基礎1 – 數學分析
xa0 xa0xa0 xa01.xa0xa0機器學習的一般方法和橫向比較
xa0 xa0xa0 xa02.xa0xa0數學是有用的:以SVD為例
xa0 xa0xa0 xa03.xa0xa0機器學習的角度看數學
xa0 xa0xa0 xa04.xa0xa0復習數學分析
xa0 xa0xa0 xa05.xa0xa0直觀解釋常數e
xa0 xa0xa0 xa06.xa0xa0導數/梯度
xa0 xa0xa0 xa07.xa0xa0隨機梯度下降
xa0 xa0xa0 xa08.xa0xa0Taylor展式的落地應用
xa0 xa0xa0 xa09.xa0xa0gini系數
xa0 xa0xa0 xa010. 凸函數
xa0 xa0xa0 xa011. Jensen不等式
xa0 xa0xa0 xa012. 組合數與信息熵的關系
第二課:機器學習的數學基礎2 – 概率論與貝葉斯先驗
xa0 xa0xa0 xa01.xa0xa0概率論基礎
xa0 xa0xa0 xa02.xa0xa0古典概型
xa0 xa0xa0 xa03.xa0xa0貝葉斯公式
xa0 xa0xa0 xa04.xa0xa0先驗分布/后驗分布/共軛分布
xa0 xa0xa0 xa05.xa0xa0常見概率分布
xa0 xa0xa0 xa06.xa0xa0泊松分布和指數分布的物理意義
xa0 xa0xa0 xa07.xa0xa0協方差(矩陣)和相關系數
xa0 xa0xa0 xa08.xa0xa0獨立和不相關
xa0 xa0xa0 xa09.xa0xa0大數定律和中心極限定理的實踐意義
xa0 xa0xa0 xa010.深刻理解最大似然估計MLE和最大后驗估計MAP
xa0 xa0xa0 xa011.過擬合的數學原理與解決方案
第三課:機器學習的數學基礎3 – 矩陣和線性代數
xa0 xa0xa0 xa01.xa0xa0線性代數在數學科學中的地位
xa0 xa0xa0 xa02.xa0xa0馬爾科夫模型
xa0 xa0xa0 xa03.xa0xa0矩陣乘法的直觀表達
xa0 xa0xa0 xa04.xa0xa0狀態轉移矩陣
xa0 xa0xa0 xa05.xa0xa0矩陣和向量組
xa0 xa0xa0 xa06.xa0xa0特征向量的思考和實踐計算
xa0 xa0xa0 xa07.xa0xa0QR分解
xa0 xa0xa0 xa08.xa0xa0對稱陣、正交陣、正定陣
xa0 xa0xa0 xa09.xa0xa0數據白化及其應用
xa0 xa0xa0 xa010.向量對向量求導
xa0 xa0xa0 xa011.標量對向量求導
xa0 xa0xa0 xa012.標量對矩陣求導
第四課:Python基礎1 – Python及其數學庫
xa0 xa0xa0 xa01.xa0xa0解釋器Python2.7與IDE:Anaconda/Pycharm
xa0 xa0xa0 xa02.xa0xa0Python基礎:列表/元組/字典/類/文件
xa0 xa0xa0 xa03.xa0xa0Taylor展式的代碼實現
xa0 xa0xa0 xa04.xa0xa0numpy/scipy/matplotlib/panda的介紹和典型使用
xa0 xa0xa0 xa05.xa0xa0多元高斯分布
xa0 xa0xa0 xa06.xa0xa0泊松分布、冪律分布
xa0 xa0xa0 xa07.xa0xa0典型圖像處理
第五課:Python基礎2 – 機器學習庫
xa0 xa0xa0 xa01.xa0xa0scikit-learn的介紹和典型使用
xa0 xa0xa0 xa02.xa0xa0損失函數的繪制
xa0 xa0xa0 xa03.xa0xa0多種數學曲線
xa0 xa0xa0 xa04.xa0xa0多項式擬合
xa0 xa0xa0 xa05.xa0xa0快速傅里葉變換FFT
xa0 xa0xa0 xa06.xa0xa0奇異值分解SVD
xa0 xa0xa0 xa07.xa0xa0Soble/Prewitt/Laplacian算子與卷積網絡
xa0 xa0xa0 xa08.xa0xa0卷積與(指數)移動平均線
xa0 xa0xa0 xa09.xa0xa0股票數據分析
第六課:Python基礎3 – 數據清洗和特征選擇
xa0 xa0xa0 xa01.xa0xa0實際生產問題中算法和特征的關系
xa0 xa0xa0 xa02.xa0xa0股票數據的特征提取和應用
xa0 xa0xa0 xa03.xa0xa0一致性檢驗
xa0 xa0xa0 xa04.xa0xa0缺失數據的處理
xa0 xa0xa0 xa05.xa0xa0環境數據異常檢測和分析
xa0 xa0xa0 xa06.xa0xa0模糊數據查詢和數據校正方法、算法、應用
第七課: 回歸
xa0 xa0xa0 xa01.xa0xa0線性回歸
xa0 xa0xa0 xa02.xa0xa0Logistic/Softmax回歸
xa0 xa0xa0 xa03.xa0xa0廣義線性回歸
xa0 xa0xa0 xa04.xa0xa0L1/L2正則化
xa0 xa0xa0 xa05.xa0xa0Ridge與LASSO
xa0 xa0xa0 xa07.xa0xa0梯度下降算法:BGD與SGD
xa0 xa0xa0 xa08.xa0xa0特征選擇與過擬合
xa0 xa0xa0 xa09.xa0xa0Softmax回歸的概念源頭
xa0 xa0xa0 xa010.最大熵模型
xa0 xa0xa0 xa011.K-L散度
第八課:回歸實踐