溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Redis哨兵模式如何實(shí)現(xiàn)主從故障互切換

發(fā)布時(shí)間:2021-11-04 09:24:03 來(lái)源:億速云 閱讀:145 作者:柒染 欄目:建站服務(wù)器

本篇文章為大家展示了Redis哨兵模式如何實(shí)現(xiàn)主從故障互切換,內(nèi)容簡(jiǎn)明扼要并且容易理解,絕對(duì)能使你眼前一亮,通過(guò)這篇文章的詳細(xì)介紹希望你能有所收獲。

介紹

Redis Sentinel 是一個(gè)分布式系統(tǒng), 你可以在一個(gè)架構(gòu)中運(yùn)行多個(gè) Sentinel 進(jìn)程(progress), 這些進(jìn)程使用流言協(xié)議(gossip protocols)來(lái)接收關(guān)于主服務(wù)器是否下線的信息, 并使用投票協(xié)議(agreement protocols)來(lái)決定是否執(zhí)行自動(dòng)故障遷移, 以及選擇哪個(gè)從服務(wù)器作為新的主服務(wù)器。

雖然 Redis Sentinel 釋出為一個(gè)單獨(dú)的可執(zhí)行文件 redis-sentinel , 但實(shí)際上它只是一個(gè)運(yùn)行在特殊模式下的 Redis 服務(wù)器, 你可以在啟動(dòng)一個(gè)普通 Redis 服務(wù)器時(shí)通過(guò)給定 --sentinel 選項(xiàng)來(lái)啟動(dòng) Redis Sentinel 。

Sentinel 系統(tǒng)用于管理多個(gè) Redis 服務(wù)器(instance), 該系統(tǒng)執(zhí)行以下三個(gè)任務(wù):

  •  監(jiān)控(Monitoring): Sentinel 會(huì)不斷地檢查你的主服務(wù)器和從服務(wù)器是否運(yùn)作正常。

  •  提醒(Notification): 當(dāng)被監(jiān)控的某個(gè) Redis 服務(wù)器出現(xiàn)問(wèn)題時(shí), Sentinel 可以通過(guò) API 向管理員或者其他應(yīng)用程序發(fā)送通知。

  •  自動(dòng)故障遷移(Automatic failover): 當(dāng)一個(gè)主服務(wù)器不能正常工作時(shí), Sentinel 會(huì)開(kāi)始一次自動(dòng)故障遷移操作, 它會(huì)將失效主服務(wù)器的其中一個(gè)從服務(wù)器升級(jí)為新的主服務(wù)器, 并讓失效主服務(wù)器的其他從服務(wù)器改為復(fù)制新的主服務(wù)器; 當(dāng)客戶端試圖連接失效的主服務(wù)器時(shí), 集群也會(huì)向客戶端返回新主服務(wù)器的地址, 使得集群可以使用新主服務(wù)器代替失效服務(wù)器。

redis版本:3.0.7 

主:6379   ,sentinel:26379

從:6380   ,sentinel:26380

配置

本章主要介紹怎樣搭建自動(dòng)故障轉(zhuǎn)移的reids群集,當(dāng)主宕機(jī)了從接替主成為新的主,宕機(jī)的主啟動(dòng)后自動(dòng)變成了從,其實(shí)它和Mysql的雙主模式是一樣的互為主從;redis群集需要用到redis-sentinel程序和sentinel.conf配置文件。

主配置

 vim redis.conf

daemonize yes
pidfile /usr/local/redis-6379/run/redis.pid
port 6379tcp-backlog 128timeout 0tcp-keepalive 0loglevel notice
logfile ""databases 16save 900 1    ###savesave 300 10save 60 10000stop-writes-on-bgsave-error yes
rdbcompression yes
rdbchecksum yes
dbfilename dump.rdb   ###dbfile
dir "/usr/local/redis-6379"masterauth "123456"requirepass "123456"slave-serve-stale-data yes
slave-read-only yes
repl-diskless-sync no
repl-diskless-sync-delay 5repl-disable-tcp-nodelay no
slave-priority 100appendonly yes
appendfilename "appendonly.aof"appendfsync everysec
no-appendfsync-on-rewrite no
auto-aof-rewrite-percentage 100auto-aof-rewrite-min-size 64mb
aof-load-truncated yes
lua-time-limit 5000slowlog-log-slower-than 10000slowlog-max-len 128latency-monitor-threshold 0notify-keyspace-events ""hash-max-ziplist-entries 512hash-max-ziplist-value 64list-max-ziplist-entries 512list-max-ziplist-value 64set-max-intset-entries 512zset-max-ziplist-entries 128zset-max-ziplist-value 64hll-sparse-max-bytes 3000activerehashing yes
client-output-buffer-limit normal 0 0 0client-output-buffer-limit slave 256mb 64mb 60client-output-buffer-limit pubsub 32mb 8mb 60hz 10aof-rewrite-incremental-fsync yes

 vim sentinel.conf

 群集文件配

port 26379dir "/usr/local/redis-6379"# 守護(hù)進(jìn)程模式
daemonize yes
# 指明日志文件名
logfile "./sentinel.log"sentinel monitor mymaster 192.168.137.40 6379 1sentinel down-after-milliseconds mymaster 5000sentinel failover-timeout mymaster 18000sentinel auth-pass mymaster 123456

從配置

 vim redis.conf

daemonize yes
pidfile "/usr/local/redis-6380/run/redis.pid"port 6380tcp-backlog 128timeout 0tcp-keepalive 0loglevel notice
logfile ""databases 16save 900 1save 300 10save 60 10000stop-writes-on-bgsave-error yes
rdbcompression yes
rdbchecksum yes
dbfilename "dump.rdb"dir "/usr/local/redis-6380"masterauth "123456"requirepass "123456"slave-serve-stale-data yes
slave-read-only yes
repl-diskless-sync no
repl-diskless-sync-delay 5repl-disable-tcp-nodelay no
slave-priority 100appendonly yes
appendfilename "appendonly.aof"appendfsync everysec
no-appendfsync-on-rewrite no
auto-aof-rewrite-percentage 100auto-aof-rewrite-min-size 64mb
aof-load-truncated yes
lua-time-limit 5000slowlog-log-slower-than 10000slowlog-max-len 128latency-monitor-threshold 0notify-keyspace-events ""hash-max-ziplist-entries 512hash-max-ziplist-value 64list-max-ziplist-entries 512list-max-ziplist-value 64set-max-intset-entries 512zset-max-ziplist-entries 128zset-max-ziplist-value 64hll-sparse-max-bytes 3000activerehashing yes
client-output-buffer-limit normal 0 0 0client-output-buffer-limit slave 256mb 64mb 60client-output-buffer-limit pubsub 32mb 8mb 60hz 10aof-rewrite-incremental-fsync yes

vim sentinel.conf

#sentinel端口
port 26380#工作路徑,注意路徑不要和主重復(fù)
dir "/usr/local/redis-6380"# 守護(hù)進(jìn)程模式
daemonize yes
# 指明日志文件名
logfile "./sentinel.log"#哨兵監(jiān)控的master,主從配置一樣,
sentinel monitor mymaster 192.168.137.40 6379 1# master或slave多長(zhǎng)時(shí)間(默認(rèn)30秒)不能使用后標(biāo)記為s_down狀態(tài)。
sentinel down-after-milliseconds mymaster 5000#若sentinel在該配置值內(nèi)未能完成failover操作(即故障時(shí)master/slave自動(dòng)切換),則認(rèn)為本次failover失敗。
sentinel failover-timeout mymaster 18000#設(shè)置master和slaves驗(yàn)證密碼
sentinel auth-pass mymaster 123456

啟動(dòng)redis

主從都要啟動(dòng)

src/redis-server redis.conf

啟動(dòng)群集監(jiān)控

主從都要啟動(dòng)

src/redis-sentinel sentinel.conf --sentinel

Redis哨兵模式如何實(shí)現(xiàn)主從故障互切換

Redis哨兵模式如何實(shí)現(xiàn)主從故障互切換

啟動(dòng)報(bào)錯(cuò)處理

錯(cuò)誤1:

WARNING overcommit_memory is set to 0! Background save may fail under low memory condition. To fix this issue add 'vm.overcommit_memory = 1' to /etc/sysctl.conf and then reboot or run the command 'sysctl vm.overcommit_memory=1' for this to take effect.

兩個(gè)解決方法(overcommit_memory)1.  echo "vm.overcommit_memory=1" > /etc/sysctl.conf  或 vi /etcsysctl.conf , 然后reboot重啟機(jī)器2.  echo 1 > /proc/sys/vm/overcommit_memory  不需要啟機(jī)器就生效
overcommit_memory參數(shù)說(shuō)明:設(shè)置內(nèi)存分配策略(可選,根據(jù)服務(wù)器的實(shí)際情況進(jìn)行設(shè)置)/proc/sys/vm/overcommit_memory
可選值:0、1、2。0, 表示內(nèi)核將檢查是否有足夠的可用內(nèi)存供應(yīng)用進(jìn)程使用;如果有足夠的可用內(nèi)存,內(nèi)存申請(qǐng)?jiān)试S;否則,內(nèi)存申請(qǐng)失敗,并把錯(cuò)誤返回給應(yīng)用進(jìn)程。1, 表示內(nèi)核允許分配所有的物理內(nèi)存,而不管當(dāng)前的內(nèi)存狀態(tài)如何。2, 表示內(nèi)核允許分配超過(guò)所有物理內(nèi)存和交換空間總和的內(nèi)存

注意:redis在dump數(shù)據(jù)的時(shí)候,會(huì)fork出一個(gè)子進(jìn)程,理論上child進(jìn)程所占用的內(nèi)存和parent是一樣的,比如parent占用 的內(nèi)存為8G,這個(gè)時(shí)候也要同樣分配8G的內(nèi)存給child,如果內(nèi)存無(wú)法負(fù)擔(dān),往往會(huì)造成redis服務(wù)器的down機(jī)或者IO負(fù)載過(guò)高,效率下降。所 以這里比較優(yōu)化的內(nèi)存分配策略應(yīng)該設(shè)置為 1(表示內(nèi)核允許分配所有的物理內(nèi)存,而不管當(dāng)前的內(nèi)存狀態(tài)如何)。

這里又涉及到Overcommit和OOM。什么是Overcommit和OOM在Unix中,當(dāng)一個(gè)用戶進(jìn)程使用malloc()函數(shù)申請(qǐng)內(nèi)存時(shí),假如返回值是NULL,則這個(gè)進(jìn)程知道當(dāng)前沒(méi)有可用內(nèi)存空間,就會(huì)做相應(yīng)的處理工作。許多進(jìn)程會(huì)打印錯(cuò)誤信息并退出。

Linux使用另外一種處理方式,它對(duì)大部分申請(qǐng)內(nèi)存的請(qǐng)求都回復(fù)"yes",以便能跑更多更大的程序。因?yàn)樯暾?qǐng)內(nèi)存后,并不會(huì)馬上使用內(nèi)存。這種技術(shù)叫做Overcommit。
當(dāng)內(nèi)存不足時(shí),會(huì)發(fā)生OOM killer(OOM=out-of-memory)。它會(huì)選擇殺死一些進(jìn)程(用戶態(tài)進(jìn)程,不是內(nèi)核線程),以便釋放內(nèi)存。Overcommit的策略Linux下overcommit有三種策略(Documentation/vm/overcommit-accounting):0. 啟發(fā)式策略。合理的overcommit會(huì)被接受,不合理的overcommit會(huì)被拒絕。1. 任何overcommit都會(huì)被接受。2. 當(dāng)系統(tǒng)分配的內(nèi)存超過(guò)swap+N%*物理RAM(N%由vm.overcommit_ratio決定)時(shí),會(huì)拒絕commit。
overcommit的策略通過(guò)vm.overcommit_memory設(shè)置。
overcommit的百分比由vm.overcommit_ratio設(shè)置。

# echo 2 > /proc/sys/vm/overcommit_memory
# echo 80 > /proc/sys/vm/overcommit_ratio

當(dāng)oom-killer發(fā)生時(shí),linux會(huì)選擇殺死哪些進(jìn)程
選擇進(jìn)程的函數(shù)是oom_badness函數(shù)(在mm/oom_kill.c中),該函數(shù)會(huì)計(jì)算每個(gè)進(jìn)程的點(diǎn)數(shù)(0~1000)。
點(diǎn)數(shù)越高,這個(gè)進(jìn)程越有可能被殺死。
每個(gè)進(jìn)程的點(diǎn)數(shù)跟oom_score_adj有關(guān),而且oom_score_adj可以被設(shè)置(-1000最低,1000最高)。

錯(cuò)誤2:
WARNING: The TCP backlog setting of 511 cannot be enforced because /proc/sys/net/core/somaxconn is set to the lower value of 128.

echo 511 > /proc/sys/net/core/somaxconn

錯(cuò)誤3:

16433:X 12 Jun 14:52:37.734 * Increased maximum number of open files to 10032 (it was originally set to 1024).

新裝的linux默認(rèn)只有1024,當(dāng)負(fù)載較大時(shí),會(huì)經(jīng)常出現(xiàn)error: too many open files

ulimit -a:使用可以查看當(dāng)前系統(tǒng)的所有限制值

vim /etc/security/limits.conf

在文件的末尾加上* soft nofile 65535* hard nofile 65535執(zhí)行su或者重新關(guān)閉連接用戶再執(zhí)行ulimit -a就可以查看修改后的結(jié)果。

故障切換機(jī)制

1. 啟動(dòng)群集后,群集程序默認(rèn)會(huì)在從庫(kù)的redis文件中加入連接主的配置

# Generated by CONFIG REWRITE
slaveof 192.168.137.40 6379

2.啟動(dòng)群集之后,群集程序默認(rèn)會(huì)在主從的sentinel.conf文件中加入群集信息

主:

port 26379dir "/usr/local/redis-6379"# 守護(hù)進(jìn)程模式
daemonize yes
# 指明日志文件名
logfile "./sentinel.log"sentinel monitor mymaster 192.168.137.40 6379 1sentinel down-after-milliseconds mymaster 5000sentinel failover-timeout mymaster 18000sentinel auth-pass mymaster 123456# Generated by CONFIG REWRITE
sentinel config-epoch mymaster 0sentinel leader-epoch mymaster 1sentinel known-slave mymaster 192.168.137.40 6380sentinel known-sentinel mymaster 192.168.137.40 26380 c77c5f64aaad0137a228875e531c7127ceeb5c3f
sentinel current-epoch 1

從:

#sentinel端口
port 26380#工作路徑
dir "/usr/local/redis-6380"# 守護(hù)進(jìn)程模式
daemonize yes
# 指明日志文件名
logfile "./sentinel.log"#哨兵監(jiān)控的master,主從配置一樣,在進(jìn)行主從切換時(shí)6379會(huì)變成當(dāng)前的master端口,sentinel monitor mymaster 192.168.137.40 6379 1# master或slave多長(zhǎng)時(shí)間(默認(rèn)30秒)不能使用后標(biāo)記為s_down狀態(tài)。
sentinel down-after-milliseconds mymaster 5000#若sentinel在該配置值內(nèi)未能完成failover操作(即故障時(shí)master/slave自動(dòng)切換),則認(rèn)為本次failover失敗。
sentinel failover-timeout mymaster 18000#設(shè)置master和slaves驗(yàn)證密碼
sentinel auth-pass mymaster 123456#哨兵程序自動(dòng)添加的部分
# Generated by CONFIG REWRITE
sentinel config-epoch mymaster 0sentinel leader-epoch mymaster 1###指明了當(dāng)前群集的從庫(kù)的ip和端口,在主從切換時(shí)該值會(huì)改變sentinel known-slave mymaster 192.168.137.40 6380###除了當(dāng)前的哨兵還有哪些監(jiān)控的哨兵
sentinel known-sentinel mymaster 192.168.137.40 26379 7a88891a6147e202a53601ca16a3d438e9d55c9d
sentinel current-epoch 1

模擬主故障

[root@monitor redis-6380]# ps -ef|grep redis
root       4171      1  0 14:20 ?        00:00:15 /usr/local/redis-6379/src/redis-server *:6379                          root       4175      1  0 14:20 ?        00:00:15 /usr/local/redis-6380/src/redis-server *:6380                          root       4305      1  0 15:28 ?        00:00:05 /usr/local/redis-6379/src/redis-sentinel *:26379 [sentinel]                            
root       4306      1  0 15:28 ?        00:00:05 /usr/local/redis-6380/src/redis-sentinel *:26380 [sentinel]                            
root       4337   4144  0 15:56 pts/1    00:00:00 grep redis
[root@monitor redis-6380]# kill -9 4171[root@monitor redis-6380]# ps -ef|grep redis
root       4175      1  0 14:20 ?        00:00:15 /usr/local/redis-6380/src/redis-server *:6380                          root       4305      1  0 15:28 ?        00:00:05 /usr/local/redis-6379/src/redis-sentinel *:26379 [sentinel]                            
root       4306      1  0 15:28 ?        00:00:05 /usr/local/redis-6380/src/redis-sentinel *:26380 [sentinel]                            
root       4339   4144  0 15:56 pts/1    00:00:00 grep redis
[root@monitor redis-6380]#

Redis哨兵模式如何實(shí)現(xiàn)主從故障互切換

從哨兵配置文件中可以看到當(dāng)前的主庫(kù)的已經(jīng)發(fā)生了改變

Redis哨兵模式如何實(shí)現(xiàn)主從故障互切換

 從日志文件也可以看到當(dāng)前的主已經(jīng)從6379轉(zhuǎn)換成了6380

 redis配置文件官方說(shuō)明:h t tp s:/ /r aw.g ithubusercon tent.com/antirez/redis/3.0/redis.conf

 redis的哨兵端口26379、26380使用客戶端軟件無(wú)法連接,使用程序可以連接,客戶端軟件只能直接連接6379和6380端口。使用哨兵監(jiān)控當(dāng)主故障后會(huì)自動(dòng)切換從為主,當(dāng)主啟動(dòng)后就變成了從。有看到別人只配置單哨兵26379的這種情況,這種情況無(wú)法保證哨兵程序自身的高可用。

上述內(nèi)容就是Redis哨兵模式如何實(shí)現(xiàn)主從故障互切換,你們學(xué)到知識(shí)或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識(shí)儲(chǔ)備,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI