相信大數(shù)據(jù)學(xué)習(xí)者對數(shù)據(jù)倉庫和數(shù)據(jù)庫并不陌生。兩者都是通過數(shù)據(jù)庫軟件存儲數(shù)據(jù)的地方。從這個意義上說,它們似乎并沒有太大不同。但是深入分析后,我們會發(fā)現(xiàn)兩者之間在數(shù)據(jù)量和功能方面的差異是巨大的。那么到底數(shù)據(jù)庫與數(shù)據(jù)倉庫有哪些區(qū)別呢?為了更清楚地區(qū)分,接下來讓我們詳細的談?wù)劧咧g的區(qū)別。
1、概念不同
數(shù)據(jù)庫是一種邏輯概念,用來存放數(shù)據(jù)的倉庫,通過數(shù)據(jù)庫軟件來實現(xiàn)。數(shù)據(jù)庫由很多表組成,表是二維的,一張表里面有很多字段。字段一字排開,對數(shù)據(jù)就一行一行的寫入表中。數(shù)據(jù)庫的表,在于能夠用二維表現(xiàn)多維的關(guān)系。而數(shù)據(jù)倉庫是數(shù)據(jù)庫概念的升級,從數(shù)據(jù)量來說,數(shù)據(jù)倉庫要比數(shù)據(jù)庫更龐大德多。數(shù)據(jù)倉庫主要用于數(shù)據(jù)挖掘和數(shù)據(jù)分析,輔助領(lǐng)導(dǎo)做決策。
2、設(shè)計不同
數(shù)據(jù)庫設(shè)計是盡量避免冗余,一般針對某一業(yè)務(wù)應(yīng)用進行設(shè)計,比如一張簡單的User表,記錄用戶名、密碼等簡單數(shù)據(jù)即可,符合業(yè)務(wù)應(yīng)用,但是不符合分析。而數(shù)據(jù)倉庫在設(shè)計是有意引入冗余,依照分析需求,分析維度、分析指標進行設(shè)計。簡單來說,數(shù)據(jù)庫是為捕獲數(shù)據(jù)而設(shè)計,數(shù)據(jù)倉庫是為分析數(shù)據(jù)而設(shè)計。
3、應(yīng)用場景不同
以銀行業(yè)務(wù)為例。數(shù)據(jù)庫是事務(wù)系統(tǒng)的數(shù)據(jù)平臺,客戶在銀行做的每筆交易都會寫入數(shù)據(jù)庫,被記錄下來,這里可以簡單地理解為用數(shù)據(jù)庫記賬。有所區(qū)別的是,數(shù)據(jù)倉庫是分析系統(tǒng)的數(shù)據(jù)平臺,它從事務(wù)系統(tǒng)獲取數(shù)據(jù),并做匯總、加工,為決策者提供決策的依據(jù)。比如,某銀行某分行一個月發(fā)生多少交易,該分行當前存款余額是多少。如果存款又多,消費交易又多,那么該地區(qū)就有必要設(shè)立ATM了。
顯然,銀行的交易量是巨大的,通常以百萬甚至千萬次來計算。事務(wù)系統(tǒng)是實時的,這就要求時效性,客戶存一筆錢需要幾十秒是無法忍受的,這就要求數(shù)據(jù)庫只能存儲很短一段時間的數(shù)據(jù)。而分析系統(tǒng)是事后的,它要提供關(guān)注時間段內(nèi)所有的有效數(shù)據(jù)。這些數(shù)據(jù)是海量的,匯總計算起來也要慢一些,但是只要能夠提供有效的分析數(shù)據(jù)就達到目的了。
4、本質(zhì)不同
數(shù)據(jù)庫與數(shù)據(jù)倉庫的區(qū)別實際講的是OLTP與OLAP的區(qū)別。操作型處理,叫聯(lián)機事務(wù)處理OLTP,它是針對具體業(yè)務(wù)在數(shù)據(jù)庫聯(lián)機的日常操作,通常對少數(shù)記錄進行查詢、修改。用戶較為關(guān)心操作的響應(yīng)時間、數(shù)據(jù)的安全性、完整性和并發(fā)支持的用戶數(shù)等問題。傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)作為數(shù)據(jù)管理的主要手段,主要用于操作型處理。而分析型處理,叫聯(lián)機分析處理OLAP一般針對某些主題的歷史數(shù)據(jù)進行分析,支持管理決策。
5、作用不同
我們要明白,數(shù)據(jù)倉庫與數(shù)據(jù)庫雖然有所區(qū)別,但是并表代表誰就一定比誰要好,數(shù)據(jù)倉庫的出現(xiàn)并不是要取代數(shù)據(jù)庫。數(shù)據(jù)庫是面向事務(wù)的設(shè)計,數(shù)據(jù)倉庫是面向主題設(shè)計的。數(shù)據(jù)庫一般存儲業(yè)務(wù)數(shù)據(jù),數(shù)據(jù)倉庫存儲的一般是歷史數(shù)據(jù)。
總之,數(shù)據(jù)庫與數(shù)據(jù)倉庫雖然都可以存放數(shù)據(jù),但是,數(shù)據(jù)倉庫是在已經(jīng)存在大量數(shù)據(jù)庫的條件下生成的,以便進一步挖掘數(shù)據(jù)資源并做出決策需求。它絕不是所謂的“大型數(shù)據(jù)庫”。兩者互不相同,又相輔相成,缺一不可。想了解更多關(guān)于數(shù)據(jù)庫的信息,請繼續(xù)關(guān)注中培偉業(yè)。