課程簡介:
Python是一種面向?qū)ο蟆⒅弊g式計(jì)算機(jī)程序設(shè)計(jì)語言。也是一種功能強(qiáng)大而完善的通用型語言,已經(jīng)具有十多年的發(fā)展歷史,成熟且穩(wěn)定。Python 具有腳本語言中最豐富和強(qiáng)大的類庫,足以支持絕大多數(shù)日常應(yīng)用。 Python語法簡捷而清晰,具有豐富和強(qiáng)大的類庫。它常被昵稱為膠水語言,它能夠很輕松的把用其他語言制作的各種模塊(尤其是C/C++)輕松地聯(lián)結(jié)在一起。
Python作為一門開源軟件,最近幾年在數(shù)據(jù)分析的領(lǐng)域上也大有作為,從12年13.3%的使用率到15年30.3%的使用率, Python已經(jīng)逐漸成為數(shù)據(jù)分析與挖掘軟件的后起之秀。作為一門編程語言,Python對于大部分的程序員來說可能會感到更親切,而強(qiáng)大的擴(kuò)展庫支持,使得Python不僅僅在數(shù)據(jù)分析這一專業(yè)領(lǐng)域上有作為。與其他的專業(yè)統(tǒng)計(jì)軟件相比,Python在非數(shù)據(jù)分析的領(lǐng)域中也得到很好的應(yīng)用。
課程將從Python的基本使用方法開始,一步步講解,從ETL到各種數(shù)據(jù)分析方法的使用,并結(jié)合實(shí)例,讓學(xué)員能從中借鑒學(xué)習(xí)。
課程目錄:
第一部分 Python基礎(chǔ)
第一課:Python的概覽——Python的基本介紹、安裝與基本語法、變量類型與運(yùn)算符
第二課:了解Python流程控制——條件、循環(huán)語句與其他語句
第三課:常用函數(shù)——函數(shù)的定義與使用方法、主要內(nèi)置函數(shù)的介紹
第四課:NumPy基礎(chǔ)——數(shù)組的創(chuàng)建、組合與分割
第二部分 數(shù)據(jù)分析的準(zhǔn)備
第五課:了解數(shù)據(jù)——數(shù)據(jù)加載、儲存與文件格式;異常值的清理與缺失值處理
第六課:數(shù)據(jù)清洗與初步分析——數(shù)據(jù)清理、轉(zhuǎn)換、合并與重塑;數(shù)據(jù)匯總與描述統(tǒng)計(jì);
第七課:繪圖與可視化——基本繪圖命令與圖形概覽、圖形元素設(shè)定與實(shí)例:地震危機(jī)數(shù)據(jù)的可視化
第八課:數(shù)據(jù)聚合與分組處理——數(shù)據(jù)聚合、分組運(yùn)算與轉(zhuǎn)換、透視表與交叉表
第三部分 數(shù)據(jù)分析初探
第九課:假設(shè)檢驗(yàn)——常用假設(shè)檢驗(yàn)與實(shí)例分析
第十課:線性回歸——線性回歸模型、分析結(jié)果呈現(xiàn)與解讀;實(shí)例:商品價(jià)格預(yù)測
第十一課: logistic回歸——logistic回歸模型講解;實(shí)例:電信客戶流失分析
第十二課:時(shí)間序列分析——時(shí)間序列基本處理、時(shí)間序列模型構(gòu)建與結(jié)果解讀;實(shí)例:未來股票價(jià)格預(yù)測
第四部分 深入數(shù)據(jù)分析
第十三課:分類算法——knn、決策樹、貝葉斯分類器等算法介紹;實(shí)例:網(wǎng)頁注冊用戶預(yù)測
第十四課:聚類算法——k-means算法介紹;實(shí)例:通信基站聚類分析
第十五課:降維方法——主成分分析與因子分析算法介紹;實(shí)例:地區(qū)經(jīng)濟(jì)指標(biāo)評分