R是一套完整的數據處理、計算和制圖軟件系統。是一個免費的自由軟件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免費下載和使用的,
在那兒可以下載到R的安裝程序、各種外掛程序和文檔。在R的安裝程序中只包含了8個基礎模塊,其他外在模塊可以通過CRAN獲得。R既是功能強大的統計和分析軟件,
同時也是完美的數據可視化制作工具,豐富的圖形函數和外置包,幾乎無限的擴展能力,使到我們的想象空間永遠都不會達到上限
2011年統計的數據分析軟件使用率情況,R語言多項雄踞首位,是最熱門的分析利器
《數據分析、展現與R語言》課程介紹如下:
本課程糅合了之前所開的《數據分析與R語言》《R語言進階——數據展現》兩門課的精華,去除部分較為艱澀的內容,增加更具有實戰價值的知識,是過往有關課程的升級改進版。在進度上,把較難掌握的算法和建模部分與相對較為容易的數據展現部分相間,使到學習者有更多的時間去理解吸收建模知識,這也是通過過往課程得出來的經驗,有望可以達到更好的學習效果。
授課對象:
這是一門數學+IT的課程,適合已經有一定的IT基礎,但對數據分析行業尚不了解的朋友進修學習。
授課時間:
本期期課程預計2014年12月22日開課,預計課程持續15周
授課講師:
tigerfish,ITPUB創始人,中山大學海量數據與云計算研究中心主任。數據庫專家,數據分析專家,有豐富的IT領域、數學領域的知識經驗。他將帶領他的數據分析團隊完成整個授課工作。
學習收獲預期:
算法有一定的了解,有一定的使用R語言解決問題的能力,并且熟練地使用R做出精美的圖表
——————-課程目錄——————-
1 基礎數據分析知識,包括一些概率統計里的概念、術語,和基本統計量的計算方法等。2 一些常用的數據分析和數據挖掘算法,以及有關的各種領域里的實際應用案例分析
3 世界最流行的開源數據分析軟件R及其編程方法
4 數據展現,介紹R及其強大的圖表功能
第1課 R語言基礎:R簡介,變量,向量,數組,矩陣,數據框,讀寫文件,控制流
第2課 R語言基礎:R的數據可視化,各種圖表,常用統計量計算
第3課 預知未來的回歸模型:隨機變量,密度函數,一元線性回歸模型
第4課 預知未來的回歸模型:多元線性回歸模型
第5課 數據展現:基本制圖函數綜述
第6課 預知未來的回歸模型:logistic回歸,廣義線性回歸,非線性回歸
第7課 數據展現:理解關鍵制圖參數
第8課 挖掘關聯和推薦技術:MINE方法,apriori購物籃分析
第9課 數據展現:散點圖
第10課 萬事皆選擇:分類算法,線性判別法,貝葉斯分類器,決策樹,最近鄰算法
第11課 數據展現:線圖與時間序列譜圖
第12課 數據展現:柱形圖,點圖,餅圖,直方圖
第13課 萬事皆選擇:聚類算法,層次聚類法,譜系圖,k平均值法,k中心法
第14課 數據展現:箱線圖,熱力圖,等高線,地圖,轉換為圖形文件
第15課 大道至簡:降維技術,主成分分析和因子分析