您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關(guān)云計算中星型模型和雪花模型的區(qū)別有哪些的內(nèi)容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
一、概述
在多維分析的商業(yè)智能解決方案中,根據(jù)事實表和維度表的關(guān)系,又可將常見的模型分為星型模型和雪花型模型。在設(shè)計邏輯型數(shù)據(jù)的模型的時候,就應考慮數(shù)據(jù)是按照星型模型還是雪花型模型進行組織。
當所有維表都直接連接到“ 事實表”上時,整個圖解就像星星一樣,故將該模型稱為星型模型,如圖 1 。
星型架構(gòu)是一種非正規(guī)化的結(jié)構(gòu),多維數(shù)據(jù)集的每一個維度都直接與事實表相連接,不存在漸變維度,所以數(shù)據(jù)有一定的冗余,如在地域維度表中,存在國家 A 省 B 的城市 C 以及國家 A 省 B 的城市 D 兩條記錄,那么國家 A 和省 B 的信息分別存儲了兩次,即存在冗余。
圖1. 銷售數(shù)據(jù)倉庫中的星型模型
星型模型因為數(shù)據(jù)的冗余所以很多統(tǒng)計查詢不需要做外部的連接,因此一般情況下效率比雪花型模型要高。星型結(jié)構(gòu)不用考慮很多正規(guī)化的因素,設(shè)計與實現(xiàn)都比較簡單。雪花型模型由于去除了冗余,有些統(tǒng)計就需要通過表的聯(lián)接才能產(chǎn)生,所以效率不一定有星型模型高。正規(guī)化也是一種比較復雜的過程,相應的數(shù)據(jù)庫結(jié)構(gòu)設(shè)計、數(shù)據(jù)的 ETL、以及后期的維護都要復雜一些。因此在冗余可以接受的前提下,實際運用中星型模型使用更多,也更有效率。
二、使用選擇
星形模型(Star Schema)和雪花模型(Snowflake Schema)是數(shù)據(jù)倉庫中常用到的兩種方式,而它們之間的對比要從四個角度來進行討論。
1.數(shù)據(jù)優(yōu)化
雪花模型使用的是規(guī)范化數(shù)據(jù),也就是說數(shù)據(jù)在數(shù)據(jù)庫內(nèi)部是組織好的,以便消除冗余,因此它能夠有效地減少數(shù)據(jù)量。通過引用完整性,其業(yè)務層級和維度都將存儲在數(shù)據(jù)模型之中。
▲圖1 雪花模型
相比較而言,星形模型實用的是反規(guī)范化數(shù)據(jù)。在星形模型中,維度直接指的是事實表,業(yè)務層級不會通過維度之間的參照完整性來部署。
▲圖2 星形模型
2.業(yè)務模型
主鍵是一個單獨的唯一鍵(數(shù)據(jù)屬性),為特殊數(shù)據(jù)所選擇。在上面的例子中,Advertiser_ID就將是一個主鍵。外鍵(參考屬性)僅僅是一個表中的字段,用來匹配其他維度表中的主鍵。在我們所引用的例子中,Advertiser_ID將是Account_dimension的一個外鍵。
在雪花模型中,數(shù)據(jù)模型的業(yè)務層級是由一個不同維度表主鍵-外鍵的關(guān)系來代表的。而在星形模型中,所有必要的維度表在事實表中都只擁有外鍵。
3.性能
第三個區(qū)別在于性能的不同。雪花模型在維度表、事實表之間的連接很多,因此性能方面會比較低。舉個例子,如果你想要知道Advertiser 的詳細信息,雪花模型就會請求許多信息,比如Advertiser Name、ID以及那些廣告主和客戶表的地址需要連接起來,然后再與事實表連接。
而星形模型的連接就少的多,在這個模型中,如果你需要上述信息,你只要將Advertiser的維度表和事實表連接即可。
4.ETL
雪花模型加載數(shù)據(jù)集市,因此ETL操作在設(shè)計上更加復雜,而且由于附屬模型的限制,不能并行化。
星形模型加載維度表,不需要再維度之間添加附屬模型,因此ETL就相對簡單,而且可以實現(xiàn)高度的并行化。
感謝各位的閱讀!關(guān)于“云計算中星型模型和雪花模型的區(qū)別有哪些”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。