溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

HBase中數(shù)據(jù)模型有哪些

發(fā)布時(shí)間:2021-12-09 10:19:50 來(lái)源:億速云 閱讀:243 作者:小新 欄目:云計(jì)算

小編給大家分享一下HBase中數(shù)據(jù)模型有哪些,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

HBase以表的形式存儲(chǔ)數(shù)據(jù)。表由行和列族組成。列劃分為若干個(gè)列族(row family),其邏輯視圖如下:

HBase中數(shù)據(jù)模型有哪些

下面分別說(shuō)說(shuō)幾個(gè)關(guān)鍵概念:

1)行鍵(RowKey)

-- 行鍵是字節(jié)數(shù)組, 任何字符串都可以作為行鍵;

-- 表中的行根據(jù)行鍵進(jìn)行排序,數(shù)據(jù)按照Row key的字節(jié)序(byte order)排序存儲(chǔ);

-- 所有對(duì)表的訪問(wèn)都要通過(guò)行鍵 (單個(gè)RowKey訪問(wèn),或RowKey范圍訪問(wèn),或全表掃描)

2)列族(ColumnFamily)

-- CF必須在表定義時(shí)給出

-- 每個(gè)CF可以有一個(gè)或多個(gè)列成員(ColumnQualifier),列成員不需要在表定義時(shí)給出,新的列族成員可以隨后按需、動(dòng)態(tài)加入

-- 數(shù)據(jù)按CF分開(kāi)存儲(chǔ),HBase所謂的列式存儲(chǔ)就是根據(jù)CF分開(kāi)存儲(chǔ)(每個(gè)CF對(duì)應(yīng)一個(gè)Store),這種設(shè)計(jì)非常適合于數(shù)據(jù)分析的情形

3)時(shí)間戳(TimeStamp)

-- 每個(gè)Cell可能又多個(gè)版本,它們之間用時(shí)間戳區(qū)分

4)單元格(Cell)

-- Cell 由行鍵,列族:限定符,時(shí)間戳唯一決定

-- Cell中的數(shù)據(jù)是沒(méi)有類型的,全部以字節(jié)碼形式存貯

5)區(qū)域(Region)

-- HBase自動(dòng)把表水平(按Row)劃分成多個(gè)區(qū)域(region),每個(gè)region會(huì)保存一個(gè)表里面某段連續(xù)的數(shù)據(jù);

-- 每個(gè)表一開(kāi)始只有一個(gè)region,隨著數(shù)據(jù)不斷插入表,region不斷增大,當(dāng)增大到一個(gè)閥值的時(shí)候,region就會(huì)等分會(huì)兩個(gè)新的region;

-- 當(dāng)table中的行不斷增多,就會(huì)有越來(lái)越多的region。這樣一張完整的表被保存在多個(gè)Region 上。

-- HRegion是HBase中分布式存儲(chǔ)和負(fù)載均衡的最小單元。最小單元表示不同的HRegion可以分布在不同的HRegionServer上。但一個(gè)HRegion不會(huì)拆分到多個(gè)server上。

以上是“HBase中數(shù)據(jù)模型有哪些”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI