溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

數(shù)據(jù)倉庫和數(shù)據(jù)庫有哪些區(qū)別

發(fā)布時間:2020-10-20 14:41:07 來源:億速云 閱讀:222 作者:小新 欄目:MySQL數(shù)據(jù)庫

這篇文章將為大家詳細講解有關(guān)數(shù)據(jù)倉庫和數(shù)據(jù)庫有哪些區(qū)別,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。

數(shù)據(jù)倉庫和數(shù)據(jù)庫的區(qū)別:1、數(shù)據(jù)庫存儲的是原始數(shù)據(jù),沒經(jīng)過任何加工;而數(shù)據(jù)倉庫是為了滿足數(shù)據(jù)分析需要設(shè)計的,對源數(shù)據(jù)進行了ETL過程,數(shù)據(jù)抽取工作分抽取、清洗、轉(zhuǎn)換、裝載;2、數(shù)據(jù)倉庫的數(shù)據(jù)量要比數(shù)據(jù)庫大很多。

一、數(shù)據(jù)倉庫

  1. 什么是數(shù)據(jù)倉庫?
    數(shù)據(jù)倉庫(Data Warehouse),可簡寫為DW或DWH,數(shù)據(jù)倉庫,是為了企業(yè)所有級別的決策制定計劃過程,提供所有類型數(shù)據(jù)類型的戰(zhàn)略集合。它出于分析性報告和決策支持的目的而創(chuàng)建。為需要業(yè)務(wù)智能的企業(yè) ,為需要指導(dǎo)業(yè)務(wù)流程改進、監(jiān)視時間,成本,質(zhì)量以及控制等;
  2. 數(shù)據(jù)倉庫能干什么?(舉幾個栗子)

    1. 年度銷售目標的制定,需要根據(jù)以往的歷史報表進行決策,不能隨便制定。
    2. 優(yōu)化業(yè)務(wù)流程
      例如:某電商平臺某品牌的手機,在過去5年主要的的購買人群的年齡在什么年齡段,在那個季節(jié)購買量人多,這樣就可以根據(jù)這個特點為目標人群設(shè)定他們主要的需求和動態(tài)分配產(chǎn)生的生產(chǎn)量,和倉庫的庫存。
  3. 數(shù)據(jù)倉庫的特點

    1. 數(shù)據(jù)倉庫是面向主題的。
      1. 與傳統(tǒng)的數(shù)據(jù)庫不一樣,數(shù)據(jù)倉庫是面向主題的,那什么是主題呢?首頁主題是一個較高乘次的概念,是較高層次上企業(yè)信息系統(tǒng)中的數(shù)據(jù)綜合,歸類并進行分析的對象。在邏輯意義上,他是對企業(yè)中某一個宏觀分析領(lǐng)域所涉及的分析對象。(說人話:就是用戶用數(shù)據(jù)倉庫進行決策所關(guān)心的重點方面,一個主題通常與多個操作信息型系統(tǒng)有關(guān),而操作型數(shù)據(jù)庫的數(shù)據(jù)組織面向事務(wù)處理任務(wù),各個任務(wù)之間是相互隔離的);
    2. 數(shù)據(jù)倉庫是集成的。
      1. 數(shù)據(jù)倉庫的數(shù)據(jù)是從原來的分散的數(shù)據(jù)庫數(shù)據(jù)(mysql關(guān)系型數(shù)據(jù)庫)抽取出來的。操作型數(shù)據(jù)庫與DSS(決策支持系統(tǒng))分析型數(shù)據(jù)庫差別甚大。第一,數(shù)據(jù)倉庫的每一個主題所對應(yīng)的源數(shù)據(jù)在所有的各個分散的數(shù)據(jù)庫中,有許多重復(fù)和不一樣的地方,且來源于不同的聯(lián)機系統(tǒng)的數(shù)據(jù)都和不同的應(yīng)用邏輯捆綁在一起;第二,數(shù)據(jù)倉庫中的綜合數(shù)據(jù)不能從原來有的數(shù)據(jù)庫系統(tǒng)直接得到。因此子在數(shù)據(jù)進入數(shù)據(jù)倉庫之前,必然要經(jīng)過統(tǒng)一與綜合,這一步是數(shù)據(jù)倉庫建設(shè)中最關(guān)鍵,最復(fù)雜的一步,所要挖成的工作有:
        1. 要統(tǒng)計源數(shù)據(jù)中所有矛盾之處,如字段的同名異議、異名同義、單位不統(tǒng)一,字長不統(tǒng)一等。
        2. 進行數(shù)據(jù)的綜合和計算。數(shù)據(jù)倉庫中的數(shù)據(jù)綜合工作可以在原有數(shù)據(jù)庫抽取數(shù)據(jù)時生成,但許多是在數(shù)據(jù)倉庫內(nèi)部生成的,即進入數(shù)據(jù)倉庫以后進行綜合生成的。
    3. 數(shù)據(jù)倉庫的數(shù)據(jù)是隨著時間的變化而變化的。
      1. 數(shù)據(jù)倉庫中的數(shù)據(jù)不可更新是針對應(yīng)用來說的,也就是說,數(shù)據(jù)倉庫的用戶進行分析處理是不進行數(shù)據(jù)更新操作的。但并不是說,在從數(shù)據(jù)集成輸入數(shù)據(jù)倉庫開始到最后被刪除的整個生存周期中,所有的數(shù)據(jù)倉庫數(shù)據(jù)都是永遠不變的。
      2. 數(shù)據(jù)倉庫的數(shù)據(jù)是隨著時間變化而變化的,這是數(shù)據(jù)倉庫的特征之一。這一特征主要有以下三個表現(xiàn):
        1. 數(shù)據(jù)倉庫隨著時間變化不斷增加新的數(shù)據(jù)內(nèi)容。數(shù)據(jù)倉庫系統(tǒng)必須不斷捕捉OLTP數(shù)據(jù)庫中變化的數(shù)據(jù),追加到數(shù)據(jù)倉庫當中去,也就是要不斷的生成OLTP數(shù)據(jù)庫的快照,經(jīng)統(tǒng)一集成增加到數(shù)據(jù)倉庫中去;但對于確實不在變化的數(shù)據(jù)庫快照,如果捕捉到新的變化數(shù)據(jù),則只生成一個新的數(shù)據(jù)庫快照增加進去,而不會對原有的數(shù)據(jù)庫快照進行修改。
        2. 數(shù)據(jù)庫隨著時間變化不斷刪去舊的數(shù)據(jù)內(nèi)容 。數(shù)據(jù)倉庫內(nèi)的數(shù)據(jù)也有存儲期限,一旦過了這一期限,過期數(shù)據(jù)就要被刪除。只是數(shù)據(jù)庫內(nèi)的數(shù)據(jù)時限要遠遠的長于操作型環(huán)境中的數(shù)據(jù)時限。在操作型環(huán)境中一般只保存有60~90天的數(shù)據(jù),而在數(shù)據(jù)倉庫中則要需要保存較長時限的數(shù)據(jù)(例如:5~10年),以適應(yīng)DSS進行趨勢分析的要求。
        3. 數(shù)據(jù)倉庫中包含有大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)中很多跟時間有關(guān),如數(shù)據(jù)經(jīng)常按照時間段進行綜合,或隔一定的時間片進行抽樣等等。這些數(shù)據(jù)要隨著時間的變化不斷地進行從新綜合。因此數(shù)據(jù)倉庫的數(shù)據(jù)特征都包含時間項,以標明數(shù)據(jù)的歷史時期。
    4. 數(shù)據(jù)倉庫的數(shù)據(jù)是不可修改的。
      1. 數(shù)據(jù)倉庫的數(shù)據(jù)主要提供企業(yè)決策分析之用,所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢,一般情況下并不進行修改操作。數(shù)據(jù)倉庫的數(shù)據(jù)反映的是一段相當長的時間內(nèi)歷史數(shù)據(jù)的內(nèi)容,是不同時點的數(shù)據(jù)庫快照的集合, 以及基于這些快照進行統(tǒng)計、綜合和重組的導(dǎo)出數(shù)據(jù),而不是聯(lián)機處理的數(shù)據(jù)。數(shù)據(jù)庫中進行聯(lián)機處理的書庫進過集成輸入到數(shù)據(jù)倉庫中,一旦數(shù)據(jù)倉庫存放的數(shù)據(jù)已經(jīng)超過數(shù)據(jù)倉庫的數(shù)據(jù)存儲期限,這些數(shù)據(jù)將從當前的數(shù)據(jù)倉庫中刪去。因為數(shù)據(jù)倉庫只進行數(shù)據(jù)查詢操作,所以數(shù)據(jù)倉庫當中的系統(tǒng)要比數(shù)據(jù)庫中的系統(tǒng)要簡單的多。數(shù)據(jù)庫管理系統(tǒng)中許多技術(shù)難點,如完整性保護、并發(fā)控制等等,在數(shù)據(jù)倉庫的管理中幾乎可以省去。但是由于數(shù)據(jù)倉庫的查詢數(shù)據(jù)量往往很大,所以就對數(shù)據(jù)查詢提出了更高的要求,他要求采用各種復(fù)雜的索引技術(shù);同時數(shù)據(jù)倉庫面向的是商業(yè)企業(yè)的高層管理層,他們會對數(shù)據(jù)查詢的界面友好性和數(shù)據(jù)表示提出更高的要求;

二、數(shù)據(jù)倉庫和數(shù)據(jù)庫的區(qū)別

  1. 想了解區(qū)別之前,我們需要了解三個概念,數(shù)據(jù)庫軟件、數(shù)據(jù)庫和數(shù)據(jù)倉庫是什么?
    1. 數(shù)據(jù)庫軟件:是一種軟件(并不是鏈接數(shù)據(jù)庫的圖形化客戶端)。用來實現(xiàn)數(shù)據(jù)庫邏輯過程,屬于物理層。
    2. 數(shù)據(jù)庫:是一種邏輯概念,用來存放數(shù)據(jù)的倉庫,通過數(shù)據(jù)庫軟件來實現(xiàn)。數(shù)據(jù)庫由很多表組成,表是二維的,一張表里面有很多字段。字段一字排開,對數(shù)據(jù)就一行一行的寫入表中。數(shù)據(jù)庫的表,在于能夠用二維表現(xiàn)多維的關(guān)系。如:oracle、DB2、MySQL、Sybase、MSSQL Server等。
    3. 數(shù)據(jù)倉庫:是數(shù)據(jù)庫概念的升級。從邏輯上理解,數(shù)據(jù)庫和數(shù)據(jù)倉庫沒有區(qū)別,都是通過數(shù)據(jù)庫軟件實現(xiàn)存放數(shù)據(jù)的地方,只不過從數(shù)據(jù)量來說,數(shù)據(jù)倉庫要比數(shù)據(jù)庫更龐大德多。數(shù)據(jù)倉庫主要用于數(shù)據(jù)挖掘和數(shù)據(jù)分析,輔助領(lǐng)導(dǎo)做決策;
    4. 在IT的架構(gòu)體系中,數(shù)據(jù)庫是必須存在的,必須要有地方存數(shù)據(jù)。比如現(xiàn)在的網(wǎng)購等電商。物品的存貨多少,貨品的價格,用戶的賬戶余額之類的。這些數(shù)據(jù)都是存放在后臺數(shù)據(jù)庫中?;蛘咦詈唵蔚睦斫猓覀儸F(xiàn)在的微信、微博和QQ等賬戶和密碼。在后臺數(shù)據(jù)庫必須是一個user表,字段起碼有兩個嗎,即用戶名和密碼,然后我們的數(shù)據(jù)就一行一行的存在表上面。當我們登錄的時候,我們填寫了用戶名和密碼,這些數(shù)據(jù)就會回傳到回臺去,去跟表上面的數(shù)據(jù)匹配,匹配成功了,就能登錄。匹配不成功就會報錯,這就是數(shù)據(jù)庫,數(shù)據(jù)庫在生產(chǎn)環(huán)境就是用來干活的。凡是跟業(yè)務(wù)有關(guān)應(yīng)用掛鉤的,我們都使用數(shù)據(jù)庫。
    5. 數(shù)據(jù)倉庫是BI下的其中一種技術(shù)。由于數(shù)據(jù)庫跟業(yè)務(wù)應(yīng)用掛鉤的,所以一個數(shù)據(jù)庫不可能裝下一家公司的所有數(shù)據(jù)。數(shù)據(jù)庫的表設(shè)計往往是針對某一個應(yīng)用進行設(shè)計的。比如剛剛的登錄功能,這張user表上就只有這兩個字段,沒有別的字段了。到那時這張表符合應(yīng)該,沒有問題,但是這張表不符合分析。比如我想知道在哪個時間段,用戶的量最多?哪個用戶一年購物最多?諸如此類的指標。那就要從新設(shè)計數(shù)據(jù)庫的表結(jié)構(gòu)了。對于數(shù)據(jù)分析和數(shù)據(jù)挖掘,我們引入了數(shù)據(jù)倉科概念。數(shù)據(jù)倉庫的表結(jié)構(gòu)是依照分析需求,分析維度,分析指標進行設(shè)計的。
    6. 數(shù)據(jù)庫與數(shù)據(jù)倉庫的區(qū)別實際講的是OLTP與OLAP的區(qū)別。
      1. 操作型處理,叫聯(lián)機事務(wù)處理OLTP(On-Line Transaction Processing),也可以稱面向交易的處理系統(tǒng),它是針對具體業(yè)務(wù)在數(shù)據(jù)庫聯(lián)機的日常操作,通常對少數(shù)記錄進行查詢、修改。用戶較為關(guān)心操作的響應(yīng)時間、數(shù)據(jù)的安全性、完整性和并發(fā)的支持用戶數(shù)等問題。傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)作為數(shù)據(jù)管理的主要手段,主要用于操作型處理。
      2. 分析型處理,叫聯(lián)機分析處理OLAP(On-Line Analytical Processing)一般針對某些主題歷史數(shù)據(jù)進行分析,支持管理決策。
操作型處理分析型處理
細節(jié)的綜合或者提煉的
實體-關(guān)系(E-R)模型星型模型或雪花模型
存儲瞬間數(shù)據(jù)存儲歷史數(shù)據(jù),不包含最近的數(shù)據(jù)
可更新的只讀、只追加
一次操作一個單元一次操作一個集合
性能要求高,響應(yīng)時間短性能要求寬松
面向事務(wù)面向分析
一次操作數(shù)據(jù)量小支持決策需求
數(shù)據(jù)量小數(shù)據(jù)量大
客戶訂單、庫存水平和銀行賬戶查詢客戶收益分析、市場細分

三.尾巴

1、如有錯誤歡迎大家指出,我會及時更正,有什么不懂也可以留言提問,互相交流嗎。
2、也許大家覺得這沒什么,但是我會認真對待,把它當成我的筆記、心得、這樣才能提升自己。

關(guān)于數(shù)據(jù)倉庫和數(shù)據(jù)庫有哪些區(qū)別就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學(xué)到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI