區(qū)別:
1、目的不同:
數(shù)據(jù)倉庫是為了支持復(fù)雜的分析和決策,數(shù)據(jù)挖掘是為了在海量的數(shù)據(jù)里面發(fā)掘出預(yù)測性的、分析性的信息,多用來預(yù)測。
2、階段不同:
數(shù)據(jù)倉庫是數(shù)據(jù)挖掘的先期步驟,通過數(shù)據(jù)倉庫的構(gòu)建,提高了數(shù)據(jù)挖掘的效率和能力,保證了數(shù)據(jù)挖掘中的數(shù)據(jù)的寬廣性和完整性。
3、處理方式不同:
數(shù)據(jù)挖掘是基于數(shù)據(jù)倉庫和多維數(shù)據(jù)庫中的數(shù)據(jù),找到數(shù)據(jù)的潛在模式進行預(yù)測,它可以對數(shù)據(jù)進行復(fù)雜處理。大多數(shù)情況下,數(shù)據(jù)挖掘是讓數(shù)據(jù)從數(shù)據(jù)倉庫到數(shù)據(jù)挖掘數(shù)據(jù)庫中。
聯(lián)系:
1、數(shù)據(jù)倉庫是為了數(shù)據(jù)挖掘做預(yù)準(zhǔn)備,數(shù)據(jù)挖掘可建立在數(shù)據(jù)倉庫之上。
2、最終目的都為了提升企業(yè)的信息化競爭能力。
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的發(fā)展歷程:
關(guān)系數(shù)據(jù)庫是20世紀(jì)70年代初提出來,經(jīng)過數(shù)據(jù)庫專家?guī)资甑呐Γ碚摵蛯嵺`都取得了顯著成果,標(biāo)志著數(shù)據(jù)庫技術(shù)的日益成熟。
但它仍然難以實現(xiàn)對關(guān)系數(shù)據(jù)庫中數(shù)據(jù)的分析,不能很好地支持決策,因此在80年代,產(chǎn)生了數(shù)據(jù)倉庫的思想,90年代,數(shù)據(jù)倉庫的基本原理、架構(gòu)形式和使用原則都已確定。
主要技術(shù)包括對數(shù)據(jù)庫中數(shù)據(jù)訪問、網(wǎng)絡(luò)、C / S結(jié)構(gòu)和圖形界面,一些大公司已經(jīng)開始構(gòu)建數(shù)據(jù)倉庫。針對數(shù)據(jù)倉庫中迅速增長的海量數(shù)據(jù)的收集、存放,用人力已經(jīng)不能解決,那么數(shù)據(jù)倉庫中有用的知識的提取就需要數(shù)據(jù)挖掘來實現(xiàn)。
數(shù)據(jù)挖掘與統(tǒng)計學(xué)子領(lǐng)域“試探性數(shù)據(jù)分析”及人工智能子領(lǐng)域“知識發(fā)現(xiàn)”和機器學(xué)有關(guān),是一門綜合性的技術(shù)學(xué)科。