溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

HBase讀性能優(yōu)化的方法是什么

發(fā)布時間:2021-12-09 09:54:12 來源:億速云 閱讀:107 作者:iii 欄目:大數(shù)據(jù)

本篇內(nèi)容主要講解“HBase讀性能優(yōu)化的方法是什么”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學(xué)習(xí)“HBase讀性能優(yōu)化的方法是什么”吧!

任何系統(tǒng)都會有各種各樣的問題,有些是系統(tǒng)本身設(shè)計問題,有些卻是使用姿勢問題。HBase也一樣,在真實生產(chǎn)線上大家或多或少都會遇到很多問題,有些是HBase還需要完善的,有些是我們確實對它了解太少??偨Y(jié)起來,大家遇到的主要問題無非是Full GC異常導(dǎo)致宕機問題、RIT問題、寫吞吐量太低以及讀延遲較大。

Full GC問題之前在一些文章里面已經(jīng)講過它的來龍去脈,主要的解決方案目前主要有兩方面需要注意,一方面需要查看GC日志確認是哪種Full GC,根據(jù)Full GC類型對JVM參數(shù)進行調(diào)優(yōu),另一方面需要確認是否開啟了BucketCache的offheap模式,建議使用LRUBlockCache的童鞋盡快轉(zhuǎn)移到BucketCache來。當然我們還是很期待官方2.0.0版本發(fā)布的更多offheap模塊。

RIT問題,我相信更多是因為我們對其不了解,具體原理可以戳這里,解決方案目前有兩個,優(yōu)先是使用官方提供的HBCK進行修復(fù)(HBCK本人一直想拿出來分享,但是目前案例還不多,等后面有更多案例的話再拿出來說),使用之后還是解決不了的話就需要手動修復(fù)文件或者元數(shù)據(jù)表。

而對于寫吞吐量太低以及讀延遲太大的優(yōu)化問題,筆者也和很多朋友進行過探討,這篇文章就以讀延遲優(yōu)化為核心內(nèi)容展開,具體分析HBase進行讀延遲優(yōu)化的那些套路,以及這些套路之后的具體原理。希望大家在看完之后能夠結(jié)合這些套路剖析自己的系統(tǒng)。

一般情況下,讀請求延遲較大通常存在三種場景,分別為:

1. 僅有某業(yè)務(wù)延遲較大,集群其他業(yè)務(wù)都正常

2. 整個集群所有業(yè)務(wù)都反映延遲較大

3. 某個業(yè)務(wù)起來之后集群其他部分業(yè)務(wù)延遲較大

這三種場景是表象,通常某業(yè)務(wù)反應(yīng)延遲異常,首先需要明確具體是哪種場景,然后針對性解決問題。下圖是對讀優(yōu)化思路的一點總結(jié),主要分為四個方面:客戶端優(yōu)化、服務(wù)器端優(yōu)化、列族設(shè)計優(yōu)化以及HDFS相關(guān)優(yōu)化,下面每一個小點都會按照場景分類,文章最后進行歸納總結(jié)。下面分別進行詳細講解:

HBase讀性能優(yōu)化的方法是什么

HBase客戶端優(yōu)化

和大多數(shù)系統(tǒng)一樣,客戶端作為業(yè)務(wù)讀寫的入口,姿勢使用不正確通常會導(dǎo)致本業(yè)務(wù)讀延遲較高實際上存在一些使用姿勢的推薦用法,這里一般需要關(guān)注四個問題:

1. scan緩存是否設(shè)置合理?

優(yōu)化原理:在解釋這個問題之前,首先需要解釋什么是scan緩存,通常來講一次scan會返回大量數(shù)據(jù),因此客戶端發(fā)起一次scan請求,實際并不會一次就將所有數(shù)據(jù)加載到本地,而是分成多次RPC請求進行加載,這樣設(shè)計一方面是因為大量數(shù)據(jù)請求可能會導(dǎo)致網(wǎng)絡(luò)帶寬嚴重消耗進而影響其他業(yè)務(wù),另一方面也有可能因為數(shù)據(jù)量太大導(dǎo)致本地客戶端發(fā)生OOM。在這樣的設(shè)計體系下用戶會首先加載一部分數(shù)據(jù)到本地,然后遍歷處理,再加載下一部分數(shù)據(jù)到本地處理,如此往復(fù),直至所有數(shù)據(jù)都加載完成。數(shù)據(jù)加載到本地就存放在scan緩存中,默認100條數(shù)據(jù)大小。

通常情況下,默認的scan緩存設(shè)置就可以正常工作的。但是在一些大scan(一次scan可能需要查詢幾萬甚至幾十萬行數(shù)據(jù))來說,每次請求100條數(shù)據(jù)意味著一次scan需要幾百甚至幾千次RPC請求,這種交互的代價無疑是很大的。因此可以考慮將scan緩存設(shè)置增大,比如設(shè)為500或者1000就可能更加合適。筆者之前做過一次試驗,在一次scan掃描10w+條數(shù)據(jù)量的條件下,將scan緩存從100增加到1000,可以有效降低scan請求的總體延遲,延遲基本降低了25%左右。

優(yōu)化建議:大scan場景下將scan緩存從100增大到500或者1000,用以減少RPC次數(shù)

2. get請求是否可以使用批量請求?

優(yōu)化原理:HBase分別提供了單條get以及批量get的API接口,使用批量get接口可以減少客戶端到RegionServer之間的RPC連接數(shù),提高讀取性能。另外需要注意的是,批量get請求要么成功返回所有請求數(shù)據(jù),要么拋出異常。

優(yōu)化建議:使用批量get進行讀取請求

3. 請求是否可以顯示指定列族或者列?

優(yōu)化原理:HBase是典型的列族數(shù)據(jù)庫,意味著同一列族的數(shù)據(jù)存儲在一起,不同列族的數(shù)據(jù)分開存儲在不同的目錄下。如果一個表有多個列族,只是根據(jù)Rowkey而不指定列族進行檢索的話不同列族的數(shù)據(jù)需要獨立進行檢索,性能必然會比指定列族的查詢差很多,很多情況下甚至?xí)?倍~3倍的性能損失。

優(yōu)化建議:可以指定列族或者列進行精確查找的盡量指定查找

4. 離線批量讀取請求是否設(shè)置禁止緩存?

優(yōu)化原理:通常離線批量讀取數(shù)據(jù)會進行一次性全表掃描,一方面數(shù)據(jù)量很大,另一方面請求只會執(zhí)行一次。這種場景下如果使用scan默認設(shè)置,就會將數(shù)據(jù)從HDFS加載出來之后放到緩存??上攵罅繑?shù)據(jù)進入緩存必將其他實時業(yè)務(wù)熱點數(shù)據(jù)擠出,其他業(yè)務(wù)不得不從HDFS加載,進而會造成明顯的讀延遲毛刺

優(yōu)化建議:離線批量讀取請求設(shè)置禁用緩存,scan.setBlockCache(false)

HBase服務(wù)器端優(yōu)化

一般服務(wù)端端問題一旦導(dǎo)致業(yè)務(wù)讀請求延遲較大的話,通常是集群級別的,即整個集群的業(yè)務(wù)都會反映讀延遲較大。可以從4個方面入手:

5. 讀請求是否均衡?

優(yōu)化原理:極端情況下假如所有的讀請求都落在一臺RegionServer的某幾個Region上,這一方面不能發(fā)揮整個集群的并發(fā)處理能力,另一方面勢必造成此臺RegionServer資源嚴重消耗(比如IO耗盡、handler耗盡等),落在該臺RegionServer上的其他業(yè)務(wù)會因此受到很大的波及??梢?,讀請求不均衡不僅會造成本身業(yè)務(wù)性能很差,還會嚴重影響其他業(yè)務(wù)。當然,寫請求不均衡也會造成類似的問題,可見負載不均衡是HBase的大忌。

觀察確認:觀察所有RegionServer的讀請求QPS曲線,確認是否存在讀請求不均衡現(xiàn)象

優(yōu)化建議:RowKey必須進行散列化處理(比如MD5散列),同時建表必須進行預(yù)分區(qū)處理

6. BlockCache是否設(shè)置合理?

優(yōu)化原理:BlockCache作為讀緩存,對于讀性能來說至關(guān)重要。默認情況下BlockCache和Memstore的配置相對比較均衡(各占40%),可以根據(jù)集群業(yè)務(wù)進行修正,比如讀多寫少業(yè)務(wù)可以將BlockCache占比調(diào)大。另一方面,BlockCache的策略選擇也很重要,不同策略對讀性能來說影響并不是很大,但是對GC的影響卻相當顯著,尤其BucketCache的offheap模式下GC表現(xiàn)很優(yōu)越。另外,HBase 2.0對offheap的改造(HBASE-11425)將會使HBase的讀性能得到2~4倍的提升,同時GC表現(xiàn)會更好!

觀察確認:觀察所有RegionServer的緩存未命中率、配置文件相關(guān)配置項一級GC日志,確認BlockCache是否可以優(yōu)化

優(yōu)化建議:JVM內(nèi)存配置量 < 20G,BlockCache策略選擇LRUBlockCache;否則選擇BucketCache策略的offheap模式;期待HBase 2.0的到來!

7. HFile文件是否太多?

優(yōu)化原理:HBase讀取數(shù)據(jù)通常首先會到Memstore和BlockCache中檢索(讀取最近寫入數(shù)據(jù)&熱點數(shù)據(jù)),如果查找不到就會到文件中檢索。HBase的類LSM結(jié)構(gòu)會導(dǎo)致每個store包含多數(shù)HFile文件,文件越多,檢索所需的IO次數(shù)必然越多,讀取延遲也就越高。文件數(shù)量通常取決于Compaction的執(zhí)行策略,一般和兩個配置參數(shù)有關(guān):hbase.hstore.compactionThreshold和hbase.hstore.compaction.max.size,前者表示一個store中的文件數(shù)超過多少就應(yīng)該進行合并,后者表示參數(shù)合并的文件大小最大是多少,超過此大小的文件不能參與合并。這兩個參數(shù)不能設(shè)置太’松’(前者不能設(shè)置太大,后者不能設(shè)置太?。瑢?dǎo)致Compaction合并文件的實際效果不明顯,進而很多文件得不到合并。這樣就會導(dǎo)致HFile文件數(shù)變多。

觀察確認:觀察RegionServer級別以及Region級別的storefile數(shù),確認HFile文件是否過多

優(yōu)化建議:hbase.hstore.compactionThreshold設(shè)置不能太大,默認是3個;設(shè)置需要根據(jù)Region大小確定,通??梢院唵蔚恼J為hbase.hstore.compaction.max.size = RegionSize / hbase.hstore.compactionThreshold

8. Compaction是否消耗系統(tǒng)資源過多?

優(yōu)化原理:Compaction是將小文件合并為大文件,提高后續(xù)業(yè)務(wù)隨機讀性能,但是也會帶來IO放大以及帶寬消耗問題(數(shù)據(jù)遠程讀取以及三副本寫入都會消耗系統(tǒng)帶寬)。正常配置情況下Minor Compaction并不會帶來很大的系統(tǒng)資源消耗,除非因為配置不合理導(dǎo)致Minor Compaction太過頻繁,或者Region設(shè)置太大情況下發(fā)生Major Compaction。

觀察確認:觀察系統(tǒng)IO資源以及帶寬資源使用情況,再觀察Compaction隊列長度,確認是否由于Compaction導(dǎo)致系統(tǒng)資源消耗過多

優(yōu)化建議:

(1)Minor Compaction設(shè)置:hbase.hstore.compactionThreshold設(shè)置不能太小,又不能設(shè)置太大,因此建議設(shè)置為5~6;hbase.hstore.compaction.max.size = RegionSize / hbase.hstore.compactionThreshold

(2)Major Compaction設(shè)置:大Region讀延遲敏感業(yè)務(wù)( 100G以上)通常不建議開啟自動Major Compaction,手動低峰期觸發(fā)。小Region或者延遲不敏感業(yè)務(wù)可以開啟Major Compaction,但建議限制流量;

(3)期待更多的優(yōu)秀Compaction策略,類似于stripe-compaction盡早提供穩(wěn)定服務(wù)

HBase列族設(shè)計優(yōu)化

HBase列族設(shè)計對讀性能影響也至關(guān)重要,其特點是只影響單個業(yè)務(wù),并不會對整個集群產(chǎn)生太大影響。列族設(shè)計主要從兩個方面檢查:

9. Bloomfilter是否設(shè)置?是否設(shè)置合理?

優(yōu)化原理:Bloomfilter主要用來過濾不存在待檢索RowKey或者Row-Col的HFile文件,避免無用的IO操作。它會告訴你在這個HFile文件中是否可能存在待檢索的KV,如果不存在,就可以不用消耗IO打開文件進行seek。很顯然,通過設(shè)置Bloomfilter可以提升隨機讀寫的性能。

Bloomfilter取值有兩個,row以及rowcol,需要根據(jù)業(yè)務(wù)來確定具體使用哪種。如果業(yè)務(wù)大多數(shù)隨機查詢僅僅使用row作為查詢條件,Bloomfilter一定要設(shè)置為row,否則如果大多數(shù)隨機查詢使用row+cf作為查詢條件,Bloomfilter需要設(shè)置為rowcol。如果不確定業(yè)務(wù)查詢類型,設(shè)置為row。

優(yōu)化建議:任何業(yè)務(wù)都應(yīng)該設(shè)置Bloomfilter,通常設(shè)置為row就可以,除非確認業(yè)務(wù)隨機查詢類型為row+cf,可以設(shè)置為rowcol

HDFS相關(guān)優(yōu)化

HDFS作為HBase最終數(shù)據(jù)存儲系統(tǒng),通常會使用三副本策略存儲HBase數(shù)據(jù)文件以及日志文件。從HDFS的角度望上層看,HBase即是它的客戶端,HBase通過調(diào)用它的客戶端進行數(shù)據(jù)讀寫操作,因此HDFS的相關(guān)優(yōu)化也會影響HBase的讀寫性能。這里主要關(guān)注如下三個方面:

10. Short-Circuit Local Read功能是否開啟?

優(yōu)化原理:當前HDFS讀取數(shù)據(jù)都需要經(jīng)過DataNode,客戶端會向DataNode發(fā)送讀取數(shù)據(jù)的請求,DataNode接受到請求之后從硬盤中將文件讀出來,再通過TPC發(fā)送給客戶端。Short Circuit策略允許客戶端繞過DataNode直接讀取本地數(shù)據(jù)。(具體原理參考此處)

優(yōu)化建議:開啟Short Circuit Local Read功能,具體配置戳這里

11. Hedged Read功能是否開啟?

優(yōu)化原理:HBase數(shù)據(jù)在HDFS中一般都會存儲三份,而且優(yōu)先會通過Short-Circuit Local Read功能嘗試本地讀。但是在某些特殊情況下,有可能會出現(xiàn)因為磁盤問題或者網(wǎng)絡(luò)問題引起的短時間本地讀取失敗,為了應(yīng)對這類問題,社區(qū)開發(fā)者提出了補償重試機制 – Hedged Read。該機制基本工作原理為:客戶端發(fā)起一個本地讀,一旦一段時間之后還沒有返回,客戶端將會向其他DataNode發(fā)送相同數(shù)據(jù)的請求。哪一個請求先返回,另一個就會被丟棄。 

優(yōu)化建議:開啟Hedged Read功能,具體配置參考這里

12. 數(shù)據(jù)本地率是否太低?

數(shù)據(jù)本地率:HDFS數(shù)據(jù)通常存儲三份,假如當前RegionA處于Node1上,數(shù)據(jù)a寫入的時候三副本為(Node1,Node2,Node3),數(shù)據(jù)b寫入三副本是(Node1,Node4,Node5),數(shù)據(jù)c寫入三副本(Node1,Node3,Node5),可以看出來所有數(shù)據(jù)寫入本地Node1肯定會寫一份,數(shù)據(jù)都在本地可以讀到,因此數(shù)據(jù)本地率是100%?,F(xiàn)在假設(shè)RegionA被遷移到了Node2上,只有數(shù)據(jù)a在該節(jié)點上,其他數(shù)據(jù)(b和c)讀取只能遠程跨節(jié)點讀,本地率就為33%(假設(shè)a,b和c的數(shù)據(jù)大小相同)。

優(yōu)化原理:數(shù)據(jù)本地率太低很顯然會產(chǎn)生大量的跨網(wǎng)絡(luò)IO請求,必然會導(dǎo)致讀請求延遲較高,因此提高數(shù)據(jù)本地率可以有效優(yōu)化隨機讀性能。數(shù)據(jù)本地率低的原因一般是因為Region遷移(自動balance開啟、RegionServer宕機遷移、手動遷移等),因此一方面可以通過避免Region無故遷移來保持數(shù)據(jù)本地率,另一方面如果數(shù)據(jù)本地率很低,也可以通過執(zhí)行major_compact提升數(shù)據(jù)本地率到100%。

優(yōu)化建議:避免Region無故遷移,比如關(guān)閉自動balance、RS宕機及時拉起并遷回飄走的Region等;在業(yè)務(wù)低峰期執(zhí)行major_compact提升數(shù)據(jù)本地率

HBase讀性能優(yōu)化歸納

在本文開始的時候提到讀延遲較大無非三種常見的表象,單個業(yè)務(wù)慢、集群隨機讀慢以及某個業(yè)務(wù)隨機讀之后其他業(yè)務(wù)受到影響導(dǎo)致隨機讀延遲很大。了解完常見的可能導(dǎo)致讀延遲較大的一些問題之后,我們將這些問題進行如下歸類,讀者可以在看到現(xiàn)象之后在對應(yīng)的問題列表中進行具體定位:

HBase讀性能優(yōu)化的方法是什么

HBase讀性能優(yōu)化的方法是什么

HBase讀性能優(yōu)化的方法是什么

到此,相信大家對“HBase讀性能優(yōu)化的方法是什么”有了更深的了解,不妨來實際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進入相關(guān)頻道進行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI