溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

HBase技術(shù)選型的準(zhǔn)則是什么

發(fā)布時(shí)間:2021-12-09 10:14:26 來源:億速云 閱讀:151 作者:iii 欄目:大數(shù)據(jù)

這篇文章主要介紹“HBase技術(shù)選型的準(zhǔn)則是什么”,在日常操作中,相信很多人在HBase技術(shù)選型的準(zhǔn)則是什么問題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”HBase技術(shù)選型的準(zhǔn)則是什么”的疑惑有所幫助!接下來,請(qǐng)跟著小編一起來學(xué)習(xí)吧!

聊一聊 NoSQL

NoSQL(Not only SQL)數(shù)據(jù)庫,可以理解為區(qū)別于關(guān)系型數(shù)據(jù)庫mysql、oracle等的非關(guān)系型數(shù)據(jù)庫。聊到NoSQL不得不提著名的CAP理論,全稱 Consistency Available and Partition tolerance,即一致性、可用性與分區(qū)容錯(cuò)性,這是Eric Brewer教授提出的分布式系統(tǒng)設(shè)計(jì)理念,并給出了定論:任何分布式系統(tǒng)只能同時(shí)滿足其中二點(diǎn),無法做到三者兼顧。這可以說是NoSQL數(shù)據(jù)庫的理論基石,至今NoSQL領(lǐng)域也稱得上是百花齊放了,一直也沒有哪一款NoSQL同時(shí)兼顧著這三點(diǎn)特性。

NoSQL必須要在一致性、可用性與分區(qū)容錯(cuò)性之間做出取舍,目前而言,幾乎所有的NoSQL都是在保有分區(qū)容錯(cuò)性的基礎(chǔ)上選擇一致性或可用性,例如HBase就是犧牲了部分可用性換取了完全的一致性,與HBase類似的Cassandra則是犧牲了強(qiáng)一致性換來了可用性的保證。

NoSQL能做哪些事情、不能做哪些事情?NoSQL作為分布式系統(tǒng)的實(shí)現(xiàn),海量數(shù)據(jù)永久性存儲(chǔ)、非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)、超大規(guī)模數(shù)據(jù)高效讀寫、超強(qiáng)水平擴(kuò)展能力等這些特征讓NoSQL得到了廣泛應(yīng)用。然而,事務(wù)支持、關(guān)聯(lián)特性,甚至于SQL查詢,這些卻是NoSQL的短板,也決定了NoSQL尚且取代不了關(guān)系型數(shù)據(jù)庫。

HBase技術(shù)選型的準(zhǔn)則是什么

HBase 簡(jiǎn)單介紹

HBase(Hadoop database)是一個(gè)分布式、可擴(kuò)展、面向列的NoSQL數(shù)據(jù)庫,本質(zhì)上是一個(gè)Key-Value系統(tǒng),底層存儲(chǔ)基于HDFS,原生支持MapReduce計(jì)算框架,具有高吞吐、低延時(shí)的讀寫特點(diǎn)。

HBase 的主要特性

HBase包含很多特性,這里列舉了HBase的一些關(guān)鍵特性:

  • 強(qiáng)一致性讀寫:HBase并不是最終一致性,而是強(qiáng)一致性的系統(tǒng),這使得HBase非常適合做高速的聚合操作。

  • 自動(dòng)sharding:HBase的表在水平方向上以region為單位分布式存儲(chǔ)在各個(gè)節(jié)點(diǎn)上,當(dāng)region達(dá)到一定大小時(shí),就會(huì)自動(dòng)split重新分布數(shù)據(jù)。

  • 自動(dòng)故障轉(zhuǎn)移:這是HBase高可用的體現(xiàn),當(dāng)某一個(gè)節(jié)點(diǎn)故障下線時(shí),節(jié)點(diǎn)上的region也會(huì)下線并會(huì)自動(dòng)轉(zhuǎn)移到狀態(tài)良好的節(jié)點(diǎn)上線。

  • 面向列的存儲(chǔ):HBase是面向列的存儲(chǔ)系統(tǒng),相同特征(列族相同)的數(shù)據(jù)會(huì)被盡量放到一起,這有利于提高數(shù)據(jù)讀取的效率。

  • 無縫結(jié)合Hadoop:HBase被定義為Hadoop database,就是基于HDFS做的數(shù)據(jù)存儲(chǔ),同時(shí)原生的支持MapReduce計(jì)算引擎。

  • 非常友好的API操作:HBase提供了簡(jiǎn)單易用的Java API,并且提供了Thrift與REST的API供非Java環(huán)境使用。

  • Block Cache與Bloom Filter:查詢優(yōu)化方面HBase支持Block Cache與Bloom Filter,使得HBase能夠?qū)A繑?shù)據(jù)做高效查詢。

什么時(shí)候使用 HBase

HBase作為一款NoSQL數(shù)據(jù)庫,前面也提及了并不能解決所有問題。關(guān)于我們?cè)趯?shí)際生產(chǎn)過程中滿足哪些條件的時(shí)候可以選擇HBase作為底層存儲(chǔ),這里給出幾點(diǎn)建議:

1、數(shù)據(jù)量規(guī)模非常龐大

一般而言,單表數(shù)據(jù)量如果只有百萬級(jí)或者更少,不是非常建議使用HBase而應(yīng)該考慮關(guān)系型數(shù)據(jù)庫是否能夠滿足需求;單表數(shù)據(jù)量超過千萬或者十億百億的時(shí)候,并且伴有較高并發(fā),可以考慮使用HBase。這主要是充分利用分布式存儲(chǔ)系統(tǒng)的優(yōu)勢(shì),如果數(shù)據(jù)量比較小,單個(gè)節(jié)點(diǎn)就能有效存儲(chǔ)的話則其他節(jié)點(diǎn)的資源就會(huì)存在浪費(fèi)。

2、要求是實(shí)時(shí)的點(diǎn)查詢

HBase是一個(gè)Key-Value數(shù)據(jù)庫,默認(rèn)對(duì)Rowkey即行鍵做了索引優(yōu)化,所以即使數(shù)據(jù)量非常龐大,根據(jù)行鍵的查詢效率依然會(huì)很高,這使得HBase非常適合根據(jù)行鍵做單條記錄的查詢。值得說明的是,允許根據(jù)行鍵的一部分做范圍查詢,這里涉及到Rowkey的設(shè)計(jì)問題,不再贅言。

3、能夠容忍N(yùn)oSQL短板

前面提及了NoSQL并不能解決所有問題,HBase也是一樣,如果業(yè)務(wù)場(chǎng)景是需要事務(wù)支持、表與表的關(guān)聯(lián)查詢等,不建議使用HBase。HBase有它適合的業(yè)務(wù)場(chǎng)景,我們不能苛求它能夠幫我們解決所有問題。

4、數(shù)據(jù)分析需求并不多

雖然說HBase是一個(gè)面向列的數(shù)據(jù)庫,但它有別于真正的列式存儲(chǔ)系統(tǒng)比如Parquet、Kudu等,再加上自身存儲(chǔ)架構(gòu)的設(shè)計(jì),使得HBase并不擅長(zhǎng)做數(shù)據(jù)分析,或者說數(shù)據(jù)分析是HBase的弱項(xiàng),所以如果主要的業(yè)務(wù)需求就是為了做數(shù)據(jù)分析,比如做報(bào)表,那么不建議直接使用HBase。

如果能夠滿足上訴的幾點(diǎn),硬件條件也滿足的情況下,強(qiáng)烈建議考慮使用HBase作為底層存儲(chǔ)解決你的問題。

HBase 的使用場(chǎng)景

由于HBase豐富的特性,加上自身的海量數(shù)據(jù)存儲(chǔ)能力與超大規(guī)模并發(fā)訪問能力,使得HBase應(yīng)用非常廣泛。目前已經(jīng)在金融、交通、醫(yī)療、車聯(lián)網(wǎng)、IoT等眾多領(lǐng)域有了最佳實(shí)踐,涉及到訂單/賬單存儲(chǔ)、用戶畫像、時(shí)空/時(shí)序數(shù)據(jù)、對(duì)象存儲(chǔ)、Cube分析等各個(gè)使用場(chǎng)景。

到此,關(guān)于“HBase技術(shù)選型的準(zhǔn)則是什么”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注億速云網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)砀鄬?shí)用的文章!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI