溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

億級流量高并發(fā)筆記-redis哨兵的多個核心底層原理的深入解析(包含slave選舉算法)

發(fā)布時間:2020-07-28 21:21:53 來源:網(wǎng)絡(luò) 閱讀:873 作者:浪白條 欄目:編程語言

redis哨兵的多個核心底層原理的深入解析

1、sdown和odown轉(zhuǎn)換機制

sdown和odown兩種失敗狀態(tài)

sdown是主觀宕機,就一個哨兵如果自己覺得一個master宕機了,那么就是主觀宕機

odown是客觀宕機,如果quorum數(shù)量的哨兵都覺得一個master宕機了,那么就是客觀宕機

sdown達成的條件很簡單,如果一個哨兵ping一個master,超過了is-master-down-after-milliseconds指定的毫秒數(shù)之后,就主觀認為master宕機

sdown到odown轉(zhuǎn)換的條件很簡單,如果一個哨兵在指定時間內(nèi),收到了quorum指定數(shù)量的其他哨兵也認為那個master是sdown了,那么就認為是odown了,客觀認為master宕機

2、哨兵集群的自動發(fā)現(xiàn)機制

哨兵互相之間的發(fā)現(xiàn),是通過redis的pub/sub系統(tǒng)實現(xiàn)的,每個哨兵都會往sentinel:hello這個channel里發(fā)送一個消息,這時候所有其他哨兵都可以消費到這個消息,并感知到其他的哨兵的存在

每隔兩秒鐘,每個哨兵都會往自己監(jiān)控的某個master+slaves對應的sentinel:hello channel里發(fā)送一個消息,內(nèi)容是自己的host、ip和runid還有對這個master的監(jiān)控配置

每個哨兵也會去監(jiān)聽自己監(jiān)控的每個master+slaves對應的sentinel:hello channel,然后去感知到同樣在監(jiān)聽這個master+slaves的其他哨兵的存在

每個哨兵還會跟其他哨兵交換對master的監(jiān)控配置,互相進行監(jiān)控配置的同步

3、slave配置的自動糾正

哨兵會負責自動糾正slave的一些配置,比如slave如果要成為潛在的master候選人,哨兵會確保slave在復制現(xiàn)有master的數(shù)據(jù); 如果slave連接到了一個錯誤的master上,比如故障轉(zhuǎn)移之后,那么哨兵會確保它們連接到正確的master上

4、slave->master選舉算法

如果一個master被認為odown了,而且majority哨兵都允許了主備切換,那么某個哨兵就會執(zhí)行主備切換操作,此時首先要選舉一個slave來

會考慮slave的一些信息

(1)跟master斷開連接的時長
(2)slave優(yōu)先級
(3)復制offset
(4)run id

如果一個slave跟master斷開連接已經(jīng)超過了down-after-milliseconds的10倍,外加master宕機的時長,那么slave就被認為不適合選舉為master

(down-after-milliseconds * 10) + milliseconds_since_master_is_in_SDOWN_state

接下來會對slave進行排序

(1)按照slave優(yōu)先級進行排序,slave priority越低,優(yōu)先級就越高
(2)如果slave priority相同,那么看replica offset,哪個slave復制了越多的數(shù)據(jù),offset越靠后,優(yōu)先級就越高
(3)如果上面兩個條件都相同,那么選擇一個run id比較小的那個slave

5、quorum和majority

每次一個哨兵要做主備切換,首先需要quorum數(shù)量的哨兵認為odown,然后選舉出一個哨兵來做切換,這個哨兵還得得到majority哨兵的授權(quán),才能正式執(zhí)行切換

如果quorum < majority,比如5個哨兵,majority就是3,quorum設(shè)置為2,那么就3個哨兵授權(quán)就可以執(zhí)行切換

但是如果quorum >= majority,那么必須quorum數(shù)量的哨兵都授權(quán),比如5個哨兵,quorum是5,那么必須5個哨兵都同意授權(quán),才能執(zhí)行切換

6、configuration epoch

哨兵會對一套redis master+slave進行監(jiān)控,有相應的監(jiān)控的配置

執(zhí)行切換的那個哨兵,會從要切換到的新master(salve->master)那里得到一個configuration epoch,這就是一個version號,每次切換的version號都必須是唯一的

如果第一個選舉出的哨兵切換失敗了,那么其他哨兵,會等待failover-timeout時間,然后接替繼續(xù)執(zhí)行切換,此時會重新獲取一個新的configuration epoch,作為新的version號

7、configuraiton傳播

哨兵完成切換之后,會在自己本地更新生成最新的master配置,然后同步給其他的哨兵,就是通過之前說的pub/sub消息機制

這里之前的version號就很重要了,因為各種消息都是通過一個channel去發(fā)布和監(jiān)聽的,所以一個哨兵完成一次新的切換之后,新的master配置是跟著新的version號的

其他的哨兵都是根據(jù)版本號的大小來更新自己的master配置的

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI