數(shù)據(jù)在當今世界意味著金錢,隨著向基于App的世界的過渡,數(shù)據(jù)呈指數(shù)增長。今天給大家介紹6個開源數(shù)據(jù)挖掘工具,有需要的朋友可以自取,有更好用的工具也歡迎交流。
1、DataMelt
DataMelt或DMelt是數(shù)據(jù)分析和數(shù)據(jù)可視化的開源軟件,可用于數(shù)值計算、數(shù)學、統(tǒng)計、符號計算等。該平臺是Python、Ruby、Groovy等各種腳本語言的組合,還有其他JAVA軟件包。它能夠制作高質(zhì)量的矢量圖形圖像(SVG,EPS,PDF等),這些圖像可以包含在LaTeX和其他文本處理系統(tǒng)中。
2、scikit-learn
scikit-learn是Python庫,用于數(shù)據(jù)分析和數(shù)據(jù)挖掘,它建立在Matplotlib、Numpy、SciPy的基礎上,提供了降維、交叉驗證集成、參數(shù)調(diào)整的方法等。
3、Apache Mahout
Apache Mahout是分布式線性代數(shù)框架,它能夠讓使用者以更快的方式實現(xiàn)其算法,構建了一個可快速創(chuàng)建、可擴展、性能驅(qū)動的機器學習應用程序的環(huán)境。它的具體優(yōu)勢有:允許應用程序迅速分析大型數(shù)據(jù)集;支持數(shù)學表達式Scala DSL;支持多個分布式后端;適用于CPU/GPU/CUDA加速的模塊化本機求解器。
4、Knime
KNIME Analytics Platform基于Eclipse,用Java編寫,是用于承載數(shù)據(jù)科學任務的開源軟件。它是一種多語言軟件開發(fā)環(huán)境,包括一個集成開發(fā)環(huán)境(IDE)和一個可擴展的插件系統(tǒng)。Knime允許從2000多個節(jié)點中進行選擇來構建工作流程;無需編程就可使用直觀的拖放式圖形界面,創(chuàng)建可視化工作流程。
5、ELKI
ELKI用Java語言編寫,是一個開源數(shù)據(jù)挖掘軟件。它能夠研究算法,聚類分析和離群值檢測中的無監(jiān)督方法;提供數(shù)據(jù)索引結構,顯著提高性能;方便進行擴展;提供大量可高度參數(shù)化算法。
6、Rattle
Rattle用R語言編寫,是用于數(shù)據(jù)挖掘的開源GUI。它能夠顯示數(shù)據(jù)的統(tǒng)計和可視摘要;可以轉換數(shù)據(jù)建模;能以圖形方式顯示模型的性能,并對新數(shù)據(jù)集進行評分以部署到生產(chǎn)中;還提供了可觀的數(shù)據(jù)挖掘功能;通過圖形用戶界面進行的所有交互都被捕獲為R腳本,可以獨立于Rattle界面在R中輕松執(zhí)行;該工具可用于學習和發(fā)展R的技能,然后在Rattle中構建初始模型。
這6個數(shù)據(jù)挖掘工具,你收藏了嗎?如果還有什么想要了解的,或者你有其他更好用的數(shù)據(jù)挖掘工具,可以在下方評論留言和大家一起探討~