溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

大數(shù)據(jù)中緩慢變化維常見解決方案是什么

發(fā)布時(shí)間:2021-12-06 10:56:28 來源:億速云 閱讀:231 作者:柒染 欄目:大數(shù)據(jù)

這篇文章給大家介紹大數(shù)據(jù)中緩慢變化維常見解決方案是什么,內(nèi)容非常詳細(xì),感興趣的小伙伴們可以參考借鑒,希望對(duì)大家能有所幫助。

一.定義

緩慢變化維:

數(shù)據(jù)倉(cāng)庫(kù)的重要特點(diǎn)之一是反映歷史變化,所以如何處理維度的變化是維度設(shè)計(jì)的重要工作之一。緩慢變化維的提出是因?yàn)樵诂F(xiàn)實(shí)世界中,維度的屬性并不是靜態(tài)的,它會(huì)隨著時(shí)間的流逝發(fā)生緩慢的變化,與數(shù)據(jù)增長(zhǎng)較為快速的事實(shí)表相比,維度變化相對(duì)緩慢。

在一些情況下,保留歷史數(shù)據(jù)沒有什么分析價(jià)值,而在另一些情況下,保留歷史數(shù)據(jù)是非常重要的,在kimball理論中,有三種處理緩慢變化維的方式

二.解決方案

1.重寫緯度值

采用此種方式,不保留歷史數(shù)據(jù),始終取最新數(shù)據(jù)

                            ###變化前商品表和訂單表

商品key

商品id

商品標(biāo)題

所屬類目

其他維度屬性

1000

item1

titile1

類目1

...

訂單key

日期key

商品key

交易金額

其他事實(shí)

9000

2020-04-10

1000

131.00

...

                            ###變化后商品表和訂單表

商品key

商品id

商品標(biāo)題

所屬類目

其他維度屬性

1000

item1

titile1

類目2

...

訂單key

日期key

商品key

交易金額

其他事實(shí)

9000

2020-04-10

1000

131.00

...

9001

2020-04-13

1000

52.00

...

2.插入新的維度行

插人新的維度行。采用此種方式,保留歷史數(shù)據(jù),

維度值變化前的事實(shí)和過去的維度值關(guān)聯(lián),維度值變化后的事實(shí)和當(dāng)前的維度值關(guān)聯(lián)

                        ###變化后商品表和訂單表

商品key

商品id

商品標(biāo)題

所屬類目

其他維度屬性

1000

item1

titile1

類目1

...

1001

item1

titile1

類目2

...

訂單key

日期key

商品key

交易金額

其他事實(shí)

9000

2020-04-10

1000

131.00

...

9001

2020-04-13

1001

52.00

...

3.添加維度列

采用第二種處理方式不能將變化前后記錄的事實(shí)歸一為變化前的維度或者歸一為變化后的維度。比如根據(jù)業(yè)務(wù)需求,需要將4月份的交易金額全部統(tǒng)計(jì)到類目2上,采用第二種處理方式無法實(shí)現(xiàn)。針對(duì)此問題,采用第三種處理方式,保留歷史數(shù)據(jù),可以使用任何一個(gè)屬性列

                               ###變化前商品表和訂單表

商品key

商品id

商品標(biāo)題

所屬新類目

 所屬舊類目

其他維度屬性

1000

item1

titile1

類目1

類目1

...

訂單key

日期key

商品key

交易金額

其他事實(shí)

9000

2020-04-10

1000

131.00

...

                                 ###變化后商品表和訂單表

商品key

商品id

商品標(biāo)題

所屬新類目

 所屬舊類目

其他維度屬性

1000

item1

titile1

類目2

類目1

...

訂單key

日期key

商品key

交易金額

其他事實(shí)

9000

2020-04-10

1000

131.00

...

9001

2020-04-13

1000

52.00

...

對(duì)于選擇哪種方式處理緩慢變化維,并沒有一個(gè)完全正確的答案,可以根據(jù)業(yè)務(wù)需求來進(jìn)行選擇。比如根據(jù)商品所屬的類目統(tǒng)計(jì)2020年4月的成交額,商品所屬的類目于 2020年4月 13 日由 類目 1變成類目2 ,假設(shè)業(yè)務(wù)需求方不關(guān)心歷史數(shù)據(jù),將所有的成交額都統(tǒng)計(jì)到最新的類目2上 ,則不需要保存歷史數(shù)據(jù):假設(shè)類目1屬于某個(gè)業(yè)務(wù)部門 ,類目2屬于另一個(gè)業(yè)務(wù)部門,不同業(yè)務(wù)部門需要統(tǒng)計(jì)各自的業(yè)績(jī),則需要保留歷史數(shù)據(jù)。

關(guān)于大數(shù)據(jù)中緩慢變化維常見解決方案是什么就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI