課程簡介:
作為一門學科,數據挖掘對于世人來說在很大程度上是透明的。我們在大多數時間都從未注意到它的發生。但每當我們辦理商店購物卡、使用信用卡購物或在網上沖浪時,都在創建數據。這些數據以大數據集形式存儲在我們每天與之打交道的公司所擁有的功能強大的計算機上。存在于這些數據集之內的便是模式 – 表明我們的興趣、習慣和行為。數據挖掘可讓人們找到并解讀這些模式,從而幫助人們做出更明智的決策,并更好地為客戶服務。
本培訓旨在向您介紹數據挖掘方面的常見概念和做法。 主要目標讀者除了大學生之外,還有希望通過挖掘數據,使用信息系統和技術解決業務問題,但在計算機科學方面沒有正式相關背景或教育經歷的業務專家。 盡管數據挖掘融合了應用統計、邏輯、人工智能、機器學習和數據管理系統,但您不需要在這些領域具有很強的背景即可參加本次培訓,來學會使用RapidMiner。 雖然學過統計學和數據庫方面的初級大學課程將會有所幫助,但本培訓中對成功學習如何挖掘數據需要了解的概念和技術進行了解釋。
RapidMiner原名Yale,它是用于數據挖掘、機器學習、商業預測分析的開源計算環境。根據KDnuggets在2013年的一次投票顯示,從使用率來看該軟件比之R語言還要略勝一籌。因為其具備GUI特性,所以很適合于數據挖掘的初學者入門。
本課程各章節圍繞實際挖掘分析業務需求,對挖掘工作中常用的各種算法應用方式、過程都做了闡述,各章節所需試驗數據也專門打包,可供讀者下載使用。
授課對象:
本課程適合已經有一定的IT基礎,但對數據挖掘領域尚不了解的朋友進修學習。如果您具備統計學和數據庫方面的初級基礎技能會更好。課程同樣適用于數據分析師、IT系統架構設計及研發人員,通過簡單靈活的挖掘模型定制,帶領您探索發現隱藏在海量數據背后的新知識。
收獲預期:
算法有一定的了解,有一定的使用RapidMiner工具解決問題的能力,能夠熟練地使用RapidMiner提供的典型挖掘算法進行挖掘分析。
授課講師:
TEKKEN,從事IT行業十余年,有豐富的數據分析挖掘領域知識經驗。對數據清洗轉換集成、數據挖掘分析、數據可視化展現等內容有豐富的產品/項目實踐經驗。曾獨立開發完成集成了各種儀表盤、圖表、數據挖掘組件在一起的Flex儀表盤設計器。現任某數據分析挖掘公司產品總監。
——————-課程目錄——————-
《快速數據挖掘平臺RapidMiner》課程內容:
第一課:數據挖掘基本知識RapidMiner工具介紹
第二課:數據準備:導入、預處理、導出
第三課:數據挖掘模型和方法
第四課:K-Means 聚類與辨別分析
第五課:線性回歸與邏輯回歸
第六課:決策樹與神經網絡
第七課:文本挖掘
第八課:WEB挖掘
第九課:協同過濾、推薦
第十課:時間序列分析
第十一課:離群點分析
第十二課:模型評估-交叉驗證與模型優化化
第十三課:過程控制
第十四課:數據轉換與執行命令