<b id="ywgnr"><dfn id="ywgnr"></dfn></b>

<div id="ywgnr"><progress id="ywgnr"></progress></div><samp id="ywgnr"></samp>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊(cè)×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請(qǐng)使用微信掃描上方二維碼

使用幫助

請(qǐng)求超時(shí)！

請(qǐng)點(diǎn)擊重新獲取二維碼

Kafka中的Leader選舉是什么

發(fā)布時(shí)間：2021-07-28 09:11:31 來源：億速云閱讀：302 作者：chen 欄目：大數(shù)據(jù)

本篇內(nèi)容主要講解“Kafka中的Leader選舉是什么”，感興趣的朋友不妨來看看。本文介紹的方法操作簡(jiǎn)單快捷，實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“Kafka中的Leader選舉是什么”吧!

一條消息只有被ISR中所有Follower都從Leader復(fù)制過去才會(huì)被認(rèn)為已提交。這樣就避免了部分?jǐn)?shù)據(jù)被寫進(jìn)了Leader，還沒來得及被任何Follower復(fù)制就宕機(jī)了，而造成數(shù)據(jù)丟失。而對(duì)于Producer而言，它可以選擇是否等待消息commit，這可以通過request.required.acks來設(shè)置。這種機(jī)制確保了只要ISR中有一個(gè)或者以上的follower，一條被commit的消息就不會(huì)丟失。

什么是ISR？

有一個(gè)很重要的問題是當(dāng)Leader宕機(jī)了，怎樣在Follower中選舉出新的Leader，因?yàn)镕ollower可能落后很多或者直接crash了，所以必須確保選擇最新的Follower作為新的Leader。一個(gè)基本的原則就是，如果Leader不在了，新的Leader必須擁有原來的Leader commit的所有消息。這就需要做一個(gè)折中，如果Leader在一個(gè)消息被commit前等待更多的Follower確認(rèn)，那么在它掛掉之后就有更多的Follower可以成為新的Leader，但這也會(huì)造成吞吐率的下降。

一種非常常用的選舉Leader的方式是“少數(shù)服從多數(shù)“，Kafka并不是采用這種方式。這種模式下，如果我們有2f+1個(gè)副本，那么在commit之前必須保證有f+1個(gè)replica復(fù)制完消息，同時(shí)為了保證能正確選舉出新的Leader，失敗的副本數(shù)不能超過f個(gè)。這種方式有個(gè)很大的優(yōu)勢(shì)，系統(tǒng)的延遲取決于最快的幾臺(tái)機(jī)器，也就是說比如副本數(shù)為3，那么延遲就取決于最快的那個(gè)Follower而不是最慢的那個(gè)?！吧贁?shù)服從多數(shù)”的方式也有一些劣勢(shì)，為了保證Leader選舉的正常進(jìn)行，它所能容忍的失敗的Follower數(shù)比較少，如果要容忍1個(gè)Follower掛掉，那么至少要3個(gè)以上的副本，如果要容忍2個(gè)Follower掛掉，必須要有5個(gè)以上的副本。也就是說，在生產(chǎn)環(huán)境下為了保證較高的容錯(cuò)率，必須要有大量的副本，而大量的副本又會(huì)在大數(shù)據(jù)量下導(dǎo)致性能的急劇下降。這種算法更多用在Zookeeper這種共享集群配置的系統(tǒng)中而很少在需要大量數(shù)據(jù)的系統(tǒng)中使用的原因。HDFS的HA功能也是基于“少數(shù)服從多數(shù)”的方式，但是其數(shù)據(jù)存儲(chǔ)并不是采用這樣的方式。

實(shí)際上，Leader選舉的算法非常多，比如Zookeeper的Zab、Raft以及Viewstamped Replication。而Kafka所使用的Leader選舉算法更像是微軟的PacificA算法。

Kafka在Zookeeper中為每一個(gè)Partition動(dòng)態(tài)的維護(hù)了一個(gè)ISR，這個(gè)ISR里的所有replica都跟上了Leader，只有ISR里的成員才能有被選為L(zhǎng)eader的可能（unclean.leader.election.enable=false）。在這種模式下，對(duì)于f+1個(gè)副本，一個(gè)Kafka Topic能在保證不丟失已經(jīng)commit消息的前提下容忍f個(gè)副本的失敗，在大多數(shù)使用場(chǎng)景下，這種模式是十分有利的。事實(shí)上，為了容忍f個(gè)副本的失敗，“少數(shù)服從多數(shù)”的方式和ISR在commit前需要等待的副本的數(shù)量是一樣的，但是ISR需要的總的副本的個(gè)數(shù)幾乎是“少數(shù)服從多數(shù)”的方式的一半。

上文提到，在ISR中至少有一個(gè)Follower時(shí)，Kafka可以確保已經(jīng)commit的數(shù)據(jù)不丟失，但如果某一個(gè)Partition的所有replica都掛了，就無法保證數(shù)據(jù)不丟失了。這種情況下有兩種可行的方案：

等待ISR中任意一個(gè)replica“活”過來，并且選它作為L(zhǎng)eader
選擇第一個(gè)“活”過來的replica（并不一定是在ISR中）作為L(zhǎng)eader

這就需要在可用性和一致性當(dāng)中作出一個(gè)簡(jiǎn)單的抉擇。如果一定要等待ISR中的replica“活”過來，那不可用的時(shí)間就可能會(huì)相對(duì)較長(zhǎng)。而且如果ISR中所有的replica都無法“活”過來了，或者數(shù)據(jù)丟失了，這個(gè)Partition將永遠(yuǎn)不可用。選擇第一個(gè)“活”過來的replica作為L(zhǎng)eader，而這個(gè)replica不是ISR中的replica，那即使它并不保障已經(jīng)包含了所有已commit的消息，它也會(huì)成為L(zhǎng)eader而作為Consumer的數(shù)據(jù)源。默認(rèn)情況下，Kafka采用第二種策略，即unclean.leader.election.enable=true，也可以將此參數(shù)設(shè)置為false來啟用第一種策略。

unclean.leader.election.enable這個(gè)參數(shù)對(duì)于leader的選舉、系統(tǒng)的可用性以及數(shù)據(jù)的可靠性都有至關(guān)重要的影響。下面我們來分析下幾種典型的場(chǎng)景。

Kafka中的Leader選舉是什么

如果上圖所示，假設(shè)某個(gè)Partition中的副本數(shù)為3，replica-0, replica-1, replica-2分別存放在Broker0, Broker1和Broker2中。AR=(0,1,2)，ISR=(0,1)。設(shè)置request.required.acks=-1, min.insync.replicas=2，unclean.leader.election.enable=false。這里將Broker0中的副本也稱之為Broker0起初Broker0為L(zhǎng)eader，Broker1為Follower。

當(dāng)ISR中的replica-0出現(xiàn)crash的情況時(shí)，Broker1選舉為新的Leader[ISR=(1)]，因?yàn)槭躮in.insync.replicas=2影響，write不能服務(wù)，但是read能繼續(xù)正常服務(wù)。此種情況恢復(fù)方案：

嘗試恢復(fù)(重啟)replica-0，如果能起來，系統(tǒng)正常；2. 如果replica-0不能恢復(fù)，需要將min.insync.replicas設(shè)置為1，恢復(fù)write功能。

當(dāng)ISR中的replica-0出現(xiàn)crash，緊接著replica-1也出現(xiàn)了crash, 此時(shí)[ISR=(1),leader=-1],不能對(duì)外提供服務(wù)，此種情況恢復(fù)方案：

嘗試恢復(fù)replica-0和replica-1，如果都能起來，則系統(tǒng)恢復(fù)正常；

如果replica-0起來，而replica-1不能起來，這時(shí)候仍然不能選出Leader，因?yàn)楫?dāng)設(shè)置unclean.leader.election.enable=false時(shí)，leader只能從ISR中選舉，當(dāng)ISR中所有副本都失效之后，需要ISR中最后失效的那個(gè)副本能恢復(fù)之后才能選舉Leader，即replica-0先失效，replica-1后失效，需要replica-1恢復(fù)后才能選舉Leader。保守的方案建議設(shè)置unclean.leader.election.enable=true，但是這樣會(huì)有丟失數(shù)據(jù)的情況發(fā)生，這樣可以恢復(fù)read服務(wù)。同樣需要將min.insync.replicas設(shè)置為1，恢復(fù)write功能；
replica-1恢復(fù)，replica-0不能恢復(fù)，這個(gè)情況上面遇到過，read服務(wù)可用，需要將min.insync.replicas設(shè)置為1，恢復(fù)write功能；
replica-0和replica-1都不能恢復(fù)，這種情況可以參考情形2.

當(dāng)ISR中的replica-0，replica-1同時(shí)宕機(jī)，此時(shí)[ISR=(0,1)]，不能對(duì)外提供服務(wù)，此種情況恢復(fù)方案：嘗試恢復(fù)replica-0和replica-1，當(dāng)其中任意一個(gè)副本恢復(fù)正常時(shí)，對(duì)外可以提供read服務(wù)。直到2個(gè)副本恢復(fù)正常，write功能才能恢復(fù)，或者將將min.insync.replicas設(shè)置為1。

到此，相信大家對(duì)“Kafka中的Leader選舉是什么”有了更深的了解，不妨來實(shí)際操作一番吧！這里是億速云網(wǎng)站，更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢，關(guān)注我們，繼續(xù)學(xué)習(xí)！

向AI問一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
Java實(shí)現(xiàn)生產(chǎn)者消費(fèi)者問題與讀者寫者問題的示例分析
下一篇新聞：
AngularJS如何監(jiān)聽路由變化

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動(dòng)

幫助支持

關(guān)于我們

售后咨詢

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號(hào)

手機(jī)網(wǎng)站二維碼

<thead id="leznt"><div id="leznt"><dl id="leznt"></dl></div></thead>

<ol id="leznt"></ol>