溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

HBase存儲(chǔ)時(shí)間相關(guān)多列數(shù)據(jù)的方案有幾種

發(fā)布時(shí)間:2021-12-09 09:31:39 來(lái)源:億速云 閱讀:112 作者:小新 欄目:云計(jì)算

這篇文章將為大家詳細(xì)講解有關(guān)HBase存儲(chǔ)時(shí)間相關(guān)多列數(shù)據(jù)的方案有幾種,小編覺(jué)得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。

HBase存儲(chǔ)時(shí)間相關(guān)多列數(shù)據(jù)的兩種方案

所謂“時(shí)間相關(guān)多列數(shù)據(jù)”指的是同一個(gè)Key下具有多個(gè)屬性數(shù)據(jù),并且這些數(shù)據(jù)與時(shí)間具有相關(guān)性,多數(shù)場(chǎng)景是該Key對(duì)應(yīng)在不同時(shí)間時(shí)刻的行為數(shù)據(jù)。在實(shí)際應(yīng)用中,這類(lèi)數(shù)據(jù)很多,例如電子商務(wù)網(wǎng)站上用戶(hù)最近一段時(shí)間瀏覽的寶貝集合、訪問(wèn)的URL列表等。

使用HBase存儲(chǔ)此類(lèi)數(shù)據(jù)時(shí),有以下兩種常用的方案:

多行單列

表結(jié)構(gòu)設(shè)計(jì)

Row Key:用戶(hù)標(biāo)識(shí)ID + (Long.MAX_VALUE - timestamp)

Column Family:’cf’

Column Qualifier:’’

Value:寶貝、URL等

其中,使用(Long.MAX_VALUE – timestamp)作為Row Key的后半部分是為了便于獲取最近插入的數(shù)據(jù),一個(gè)用戶(hù)標(biāo)識(shí)ID下的數(shù)據(jù)存儲(chǔ)在多個(gè)Row Key下,每個(gè)Row Key下僅有一個(gè)Column Qualifier,表示該用戶(hù)的一次時(shí)間相關(guān)的訪問(wèn)數(shù)據(jù)(訪問(wèn)寶貝、URL等)。

查詢(xún)方式

1)查詢(xún)某個(gè)特定timestamp下的記錄,則使用用戶(hù)標(biāo)識(shí)ID + (Long.MAX_VALUE - timestamp)進(jìn)行Get查找;

2)查詢(xún)某個(gè)用戶(hù)標(biāo)識(shí)ID下所有的記錄,則通過(guò)Scan.setStartRow(uid)和Scan.setStopRow(uid+1)進(jìn)行Scan查找;

3)查詢(xún)某個(gè)用戶(hù)標(biāo)識(shí)ID下最近時(shí)間內(nèi)的N條記錄,則通過(guò)Scan.setStartRow(uid)和Scan.setStopRow(uid+1)進(jìn)行Scan查找,但是為了只獲取N條記錄,可以設(shè)置Scan.setCaching(N)優(yōu)化查詢(xún),同時(shí)做一次ResultScanner.next(N)得到結(jié)果。

單行多列

表結(jié)構(gòu)設(shè)計(jì)

Row Key:用戶(hù)標(biāo)識(shí)ID

Column Family:’cf’

Column Qualifier:(Long.MAX_VALUE - timestamp)

Value:寶貝、URL等

其中,使用(Long.MAX_VALUE – timestamp)作為Column Qualifier是為了便于獲取最近插入的數(shù)據(jù),一個(gè)用戶(hù)標(biāo)識(shí)ID下的數(shù)據(jù)存儲(chǔ)在一個(gè)Row Key下,每個(gè)Row Key下會(huì)有多個(gè)Column Qualifier,表示該用戶(hù)的所有時(shí)間相關(guān)的訪問(wèn)數(shù)據(jù)(訪問(wèn)寶貝、URL等)。

查詢(xún)方式

1)查詢(xún)某個(gè)特定timestamp下的記錄,則使用用戶(hù)標(biāo)識(shí)ID進(jìn)行Get查找,同時(shí)通過(guò)Get.addColumn(‘cf’, (Long.MAX_VALUE – timestamp))方法限定要查詢(xún)的Column Qualifier;

2)查詢(xún)某個(gè)用戶(hù)標(biāo)識(shí)ID下所有的記錄,則直接使用用戶(hù)標(biāo)識(shí)ID進(jìn)行Get查找,通過(guò)Get.addFamily(‘cf’)方法添加整個(gè)Column Family;

3)查詢(xún)某個(gè)用戶(hù)標(biāo)識(shí)ID下最近時(shí)間內(nèi)的N條記錄,則直接使用用戶(hù)標(biāo)識(shí)ID進(jìn)行Get查找,通過(guò)Get.addFamily(‘cf’)方法添加整個(gè)Column Family,通過(guò)ColumnCountGetFilter(int N)限制最多要查詢(xún)返回N條記錄。

關(guān)于“HBase存儲(chǔ)時(shí)間相關(guān)多列數(shù)據(jù)的方案有幾種”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,使各位可以學(xué)到更多知識(shí),如果覺(jué)得文章不錯(cuò),請(qǐng)把它分享出去讓更多的人看到。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI