您好,登錄后才能下訂單哦!
小編給大家分享一下HBase中數(shù)據(jù)模型有哪些,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
HBase以表的形式存儲(chǔ)數(shù)據(jù)。表由行和列族組成。列劃分為若干個(gè)列族(row family),其邏輯視圖如下:
下面分別說(shuō)說(shuō)幾個(gè)關(guān)鍵概念:
1)行鍵(RowKey)
-- 行鍵是字節(jié)數(shù)組, 任何字符串都可以作為行鍵;
-- 表中的行根據(jù)行鍵進(jìn)行排序,數(shù)據(jù)按照Row key的字節(jié)序(byte order)排序存儲(chǔ);
-- 所有對(duì)表的訪問(wèn)都要通過(guò)行鍵 (單個(gè)RowKey訪問(wèn),或RowKey范圍訪問(wèn),或全表掃描)
2)列族(ColumnFamily)
-- CF必須在表定義時(shí)給出
-- 每個(gè)CF可以有一個(gè)或多個(gè)列成員(ColumnQualifier),列成員不需要在表定義時(shí)給出,新的列族成員可以隨后按需、動(dòng)態(tài)加入
-- 數(shù)據(jù)按CF分開(kāi)存儲(chǔ),HBase所謂的列式存儲(chǔ)就是根據(jù)CF分開(kāi)存儲(chǔ)(每個(gè)CF對(duì)應(yīng)一個(gè)Store),這種設(shè)計(jì)非常適合于數(shù)據(jù)分析的情形
3)時(shí)間戳(TimeStamp)
-- 每個(gè)Cell可能又多個(gè)版本,它們之間用時(shí)間戳區(qū)分
4)單元格(Cell)
-- Cell 由行鍵,列族:限定符,時(shí)間戳唯一決定
-- Cell中的數(shù)據(jù)是沒(méi)有類型的,全部以字節(jié)碼形式存貯
5)區(qū)域(Region)
-- HBase自動(dòng)把表水平(按Row)劃分成多個(gè)區(qū)域(region),每個(gè)region會(huì)保存一個(gè)表里面某段連續(xù)的數(shù)據(jù);
-- 每個(gè)表一開(kāi)始只有一個(gè)region,隨著數(shù)據(jù)不斷插入表,region不斷增大,當(dāng)增大到一個(gè)閥值的時(shí)候,region就會(huì)等分會(huì)兩個(gè)新的region;
-- 當(dāng)table中的行不斷增多,就會(huì)有越來(lái)越多的region。這樣一張完整的表被保存在多個(gè)Region 上。
-- HRegion是HBase中分布式存儲(chǔ)和負(fù)載均衡的最小單元。最小單元表示不同的HRegion可以分布在不同的HRegionServer上。但一個(gè)HRegion不會(huì)拆分到多個(gè)server上。
以上是“HBase中數(shù)據(jù)模型有哪些”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。