溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何理解分布式一致性Raft協(xié)議

發(fā)布時間:2022-01-15 10:40:21 來源:億速云 閱讀:158 作者:iii 欄目:云計算

這篇文章主要介紹了如何理解分布式一致性Raft協(xié)議的相關知識,內(nèi)容詳細易懂,操作簡單快捷,具有一定借鑒價值,相信大家閱讀完這篇如何理解分布式一致性Raft協(xié)議文章都會有所收獲,下面我們一起來看看吧。

什么是分布式一致性

下面舉個例子:

假如我們有一個單節(jié)點的服務節(jié)點A,這個單節(jié)點的服務只是用來存儲一個字母。同時我們還有一個客戶端向這個服務發(fā)起更新數(shù)據(jù)的請求。

對于單節(jié)點的分布式一致性來說,服務響應客戶端的更新請求即可。但是當我們有多個服務節(jié)點的情況下會怎么樣呢?

如何理解分布式一致性Raft協(xié)議  

Raft協(xié)議就是保證多個服務器節(jié)點數(shù)據(jù)一致性的協(xié)議。

接下來我們看看Raft是怎么工作的。

Raft協(xié)議中,一個服務器的節(jié)點可以是以下三種狀態(tài)中的任意一個:

  1. Follower 狀態(tài):跟隨者,被動接收數(shù)據(jù)。我們用實心圓表示。

     

     

    如何理解分布式一致性Raft協(xié)議

  2. Candidate 狀態(tài):候選人,可以被選做Leader。我們用實心圓+虛線邊框表示。

     

     

    如何理解分布式一致性Raft協(xié)議

  3. Leader 狀態(tài):領導者,處理所有客戶端交互,日志復制等,一般一次只有一個Leader. 我們用實心圓+實線邊框表示。

     

     

    如何理解分布式一致性Raft協(xié)議

Leader選舉

所有的節(jié)點都是從Follower狀態(tài)開始的。

如何理解分布式一致性Raft協(xié)議  

如果Follower在一定的時間里面沒有收到選舉請求或者Leader節(jié)點的回復,F(xiàn)ollower則會轉(zhuǎn)變?yōu)镃andidate。

如何理解分布式一致性Raft協(xié)議  

Candidate會發(fā)送選舉請求給所有的其他節(jié)點,收到選舉請求的其他節(jié)點會反饋回Candidate,當Candidate收到的所有響應數(shù)目大于n/2 時,Candidate會認為絕大多數(shù)節(jié)點已經(jīng)選我作為Leader了,這時候Candidate就會轉(zhuǎn)變?yōu)長eader。接下來所有的數(shù)據(jù)變化都會經(jīng)由Leader發(fā)起。

如何理解分布式一致性Raft協(xié)議  

日志復制流程

在Raft系統(tǒng)中,所有的數(shù)據(jù)變化都是以日志記錄的形式添加到服務節(jié)點之中。服務節(jié)點會不斷的讀取日志記錄,并將日志記錄更新到服務節(jié)點的數(shù)據(jù)中。日志記錄最開始的狀態(tài)是uncommited, 更新之后狀態(tài)則變?yōu)閏ommited.

為了實現(xiàn)所有服務節(jié)點的一致性更新,步驟如下:

  1. client 發(fā)送數(shù)據(jù)更改請求到Leader

     

     

    如何理解分布式一致性Raft協(xié)議

  2. Leader復制日志記錄到Follower節(jié)點

     

     

    如何理解分布式一致性Raft協(xié)議

  3. Leader等待大多數(shù)節(jié)點完成復制日志記錄。

  4. Leader節(jié)點commit 當前日志記錄,并更新Leader節(jié)點的數(shù)據(jù)。

     

     

    如何理解分布式一致性Raft協(xié)議

    image.png

  5. Leader通知Follower節(jié)點該日志記錄已經(jīng)commit.

  6. Follower節(jié)點commit該日志記錄。

     

     

    如何理解分布式一致性Raft協(xié)議

  7. 整個分布式系統(tǒng)實現(xiàn)了數(shù)據(jù)一致性。

term選舉周期

在Raft 協(xié)議中,有一個term的概念。term是一個選舉周期,一個term周期只會產(chǎn)生一個Leader,term連續(xù)遞增。

timeout

在Raft協(xié)議中,為了保證選舉和數(shù)據(jù)更新的順利進行,規(guī)定了兩種類型的timeout:
選舉timeout和心跳timeout。

選舉和選舉timeout

  1. 每個term開始時,會重置選舉timeout。在一個term中,F(xiàn)ollower會等待timeout的時間,如果超出這個時間還沒有得到其他節(jié)點的選舉請求,F(xiàn)ollower會主動轉(zhuǎn)變?yōu)镃andidate,并且term+1,意味著開啟了新的選舉周期。

    選舉timeout是150ms-300ms之間的一個隨機數(shù),之所以隨機產(chǎn)生timeout,是為了避免同時產(chǎn)生多個Candidate的情況。

    當Follower轉(zhuǎn)變?yōu)镃andidate之后,term加1, 然后開始新一輪的選舉。Candidate首先會將自己的Vote Count 加1,然后發(fā)送請求選舉的消息給其他節(jié)點。

     

     

    如何理解分布式一致性Raft協(xié)議

     

     

    如何理解分布式一致性Raft協(xié)議

  2. 接收節(jié)點首先會比較term的大小,如果自己的term小于Candidate的term,則更新自己的term和Candidate的term保持一致,并重置timeout。如果接收節(jié)點在這個term中還沒有做任何選舉,則會返回選舉響應消息給Candidate節(jié)點。

     

     

    如何理解分布式一致性Raft協(xié)議

  3. Candidate 節(jié)點收到大部分節(jié)點的選舉響應之后,會變成Leader 節(jié)點。

     

     

    如何理解分布式一致性Raft協(xié)議

  4. 一個選舉周期完成,接下來Leader 發(fā)送更新日志給Follower節(jié)點,進入日志更新階段。

選舉分裂

值得注意的是Candidate只有得到超出n/2個節(jié)點的選舉響應才能變?yōu)長eader節(jié)點。如果兩個Follower節(jié)點同時變成Candidate節(jié)點,則會產(chǎn)生選舉分裂的問題。
現(xiàn)在假設我們總共有4個節(jié)點,其中兩個節(jié)點同時變成Candidate節(jié)點,并向其余兩個節(jié)點發(fā)送選舉請求:

如何理解分布式一致性Raft協(xié)議  

節(jié)點B,C成為Candidate節(jié)點并行向節(jié)點A,D發(fā)送選舉請求。

如何理解分布式一致性Raft協(xié)議  


節(jié)點A,D分別響應節(jié)點B,C的請求,這時候兩個Candidate節(jié)點由于得到的Vote都是2,不滿足大于n/2的條件,則其不能轉(zhuǎn)變?yōu)長eader節(jié)點,繼續(xù)等待timeout至新的term開始并開啟新一輪的選舉,只到符合條件為止。

如何理解分布式一致性Raft協(xié)議  

日志復制和心跳timeout

當系統(tǒng)進入到日志復制階段,Leader節(jié)點會以心跳timeout的節(jié)奏向Follower節(jié)點發(fā)送日志記錄,并且需要確保所有的節(jié)點都能夠接受到完整的日志記錄。

  1. 客戶發(fā)送set 5 給Leader, 在下一個心跳timeout,Leader將set 5的日志記錄發(fā)給Follower。

     

     

    如何理解分布式一致性Raft協(xié)議

  2. Leader 收到大部分節(jié)點的ack 響應之后,commit 該日志記錄。

     

     

    如何理解分布式一致性Raft協(xié)議

  3. Leader通知Client已經(jīng)提交該日志記錄,同時通知Follower 提交該日志記錄。

     

     

關于“如何理解分布式一致性Raft協(xié)議”這篇文章的內(nèi)容就介紹到這里,感謝各位的閱讀!相信大家對“如何理解分布式一致性Raft協(xié)議”知識都有一定的了解,大家如果還想學習更多知識,歡迎關注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。

AI