1.DataStage(收費)
IBM公司的商業軟件,很專業的ETL工具,可跨多個企業系統集成數據,能幫助企業從散布在各個系統中的復雜異構信息中獲得更多價值,但技術支持比較少,使用難度較大,尤其價格也比較昂貴,中小公司不是很建議使用,后續保障不是很ok。
2.Informatica(收費)
Informatica平臺是一套完善的技術,可支持多項復雜的企業級數據集成計劃,專業程度與Datastage旗鼓相當,價格上比Datastage便宜一點。不具有數據質量功能,需要以編程方式進行處理,沒有任何Web集成功能。Informatica與datastage一樣需要更高的學習成本。
3.DataBeam(免費)
DataBeam,新一代數據建設與分析產品,以圖形化、搭積木的方式進行數據處理與分析。相比寫代碼的傳統的數據開發模式,DataBeam的積木式拖拽開發效率更高,“零代碼”的形式也讓其非常易于上手,學習成本低,同時DataBeam也支持多種異構數據源,在一個平臺上就能完成數據輸入、清洗、統計、AI建模,可以很好的解決企業數倉開發成本高、交付周期長、維護成本高等問題。
4.Kettle(免費)
Kettle是一款國外開源的ETL工具,純JAVA編寫,可以在Window、linux、Unix上運行,中文名稱叫水壺,該項目的主程序員MATT 希望把各種數據放到一個壺里,然后以一種指定的格式流出。它允許你管理來自不同數據庫的數據,通過提供一個圖形化的用戶環境來描述你想做什么,而不是你想怎么做。Kettle中有兩種腳本文件,transformation和job,transformation完成針對數據的基礎轉換,job則完成整個工作流的控制。