您好,登錄后才能下訂單哦!
這篇文章給大家介紹大數(shù)據(jù)中緩慢變化維常見解決方案是什么,內(nèi)容非常詳細(xì),感興趣的小伙伴們可以參考借鑒,希望對(duì)大家能有所幫助。
緩慢變化維:
數(shù)據(jù)倉(cāng)庫(kù)的重要特點(diǎn)之一是反映歷史變化,所以如何處理維度的變化是維度設(shè)計(jì)的重要工作之一。緩慢變化維的提出是因?yàn)樵诂F(xiàn)實(shí)世界中,維度的屬性并不是靜態(tài)的,它會(huì)隨著時(shí)間的流逝發(fā)生緩慢的變化,與數(shù)據(jù)增長(zhǎng)較為快速的事實(shí)表相比,維度變化相對(duì)緩慢。
在一些情況下,保留歷史數(shù)據(jù)沒有什么分析價(jià)值,而在另一些情況下,保留歷史數(shù)據(jù)是非常重要的,在kimball理論中,有三種處理緩慢變化維的方式
采用此種方式,不保留歷史數(shù)據(jù),始終取最新數(shù)據(jù)
###變化前商品表和訂單表
商品key | 商品id | 商品標(biāo)題 | 所屬類目 | 其他維度屬性 |
1000 | item1 | titile1 | 類目1 | ... |
訂單key | 日期key | 商品key | 交易金額 | 其他事實(shí) |
9000 | 2020-04-10 | 1000 | 131.00 | ... |
###變化后商品表和訂單表
商品key | 商品id | 商品標(biāo)題 | 所屬類目 | 其他維度屬性 |
1000 | item1 | titile1 | 類目2 | ... |
訂單key | 日期key | 商品key | 交易金額 | 其他事實(shí) |
9000 | 2020-04-10 | 1000 | 131.00 | ... |
9001 | 2020-04-13 | 1000 | 52.00 | ... |
2.插入新的維度行
插人新的維度行。采用此種方式,保留歷史數(shù)據(jù),
維度值變化前的事實(shí)和過去的維度值關(guān)聯(lián),維度值變化后的事實(shí)和當(dāng)前的維度值關(guān)聯(lián)
###變化后商品表和訂單表
商品key | 商品id | 商品標(biāo)題 | 所屬類目 | 其他維度屬性 |
1000 | item1 | titile1 | 類目1 | ... |
1001 | item1 | titile1 | 類目2 | ... |
訂單key | 日期key | 商品key | 交易金額 | 其他事實(shí) |
9000 | 2020-04-10 | 1000 | 131.00 | ... |
9001 | 2020-04-13 | 1001 | 52.00 | ... |
3.添加維度列
采用第二種處理方式不能將變化前后記錄的事實(shí)歸一為變化前的維度或者歸一為變化后的維度。比如根據(jù)業(yè)務(wù)需求,需要將4月份的交易金額全部統(tǒng)計(jì)到類目2上,采用第二種處理方式無法實(shí)現(xiàn)。針對(duì)此問題,采用第三種處理方式,保留歷史數(shù)據(jù),可以使用任何一個(gè)屬性列
###變化前商品表和訂單表
商品key | 商品id | 商品標(biāo)題 | 所屬新類目 | 所屬舊類目 | 其他維度屬性 |
1000 | item1 | titile1 | 類目1 | 類目1 | ... |
訂單key | 日期key | 商品key | 交易金額 | 其他事實(shí) |
9000 | 2020-04-10 | 1000 | 131.00 | ... |
###變化后商品表和訂單表
商品key | 商品id | 商品標(biāo)題 | 所屬新類目 | 所屬舊類目 | 其他維度屬性 |
1000 | item1 | titile1 | 類目2 | 類目1 | ... |
訂單key | 日期key | 商品key | 交易金額 | 其他事實(shí) |
9000 | 2020-04-10 | 1000 | 131.00 | ... |
9001 | 2020-04-13 | 1000 | 52.00 | ... |
對(duì)于選擇哪種方式處理緩慢變化維,并沒有一個(gè)完全正確的答案,可以根據(jù)業(yè)務(wù)需求來進(jìn)行選擇。比如根據(jù)商品所屬的類目統(tǒng)計(jì)2020年4月的成交額,商品所屬的類目于 2020年4月 13 日由 類目 1變成類目2 ,假設(shè)業(yè)務(wù)需求方不關(guān)心歷史數(shù)據(jù),將所有的成交額都統(tǒng)計(jì)到最新的類目2上 ,則不需要保存歷史數(shù)據(jù):假設(shè)類目1屬于某個(gè)業(yè)務(wù)部門 ,類目2屬于另一個(gè)業(yè)務(wù)部門,不同業(yè)務(wù)部門需要統(tǒng)計(jì)各自的業(yè)績(jī),則需要保留歷史數(shù)據(jù)。
關(guān)于大數(shù)據(jù)中緩慢變化維常見解決方案是什么就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。