您好,登錄后才能下訂單哦!
這篇文章我們主要了解高可用集群概念及工作原理,以及高可用集群的邏輯架構(gòu)等。
ll 本文導航
· 什么是高可用集群?
· 高可用集群有哪些特點?
· 高可用集群的邏輯架構(gòu)
· 高可用集群的解決方案
· 高可用集群的工作模型
ll 要求
掌握高可用集群的基礎(chǔ)原理與邏輯架構(gòu)。
什么是高可用集群?
所謂高可用集群,即當前服務器出現(xiàn)故障時,可以將該服務器中的服務、資源、IP等轉(zhuǎn)移到另外一臺服務器上,從而滿足業(yè)務的持續(xù)性;這兩臺或多臺服務器構(gòu)成了服務器高可用集群。
對于客戶端來說,集群就像是一臺服務器,因為集群運行的是同一種服務,即使其中有的服務器宕機或無法通信時,也不會對業(yè)務造成影響。
高可用集群有哪些特點?
一、高可用服務
集群最大的目的和作用就是實現(xiàn)服務的高可用性,其最終目的是保證業(yè)務不會因為線路、硬件、軟件故障而導致的服務不可用。
二、度量標準(服務可用性)
由系統(tǒng)可靠性(Availability)和可維護性(maintainabilit)來度量
計算方式:HA=MTTF(平均無故障事件)/(MTTF+MTTR(平均修復事件))*100%
99% 全年服務中斷時間不超過4天
99.9% 全年服務中斷時間不超過10個小時
99.99% 全年服務中斷時間不超過1個小時
99.999% 全年服務中斷時間不超過6分鐘
三、集群節(jié)點
集群存在所有主機都稱為節(jié)點,每HA集群最低要求需有2個節(jié)點;正常來說,節(jié)點數(shù)最好為奇數(shù)。在生產(chǎn)環(huán)境中,HA集群的節(jié)點數(shù)至少為3個,可以降低發(fā)生腦裂的概率。
四、集群服務與資源
集群服務通常包括多個資源,多個資源組成某種集群服務。如mysql高可用服務,其資源包括vip、mysqld、共享存儲等。對于集群服務的管理,實際上就是對資源的管理。
五、腦裂、資源爭用、資源隔離
腦裂:因某種特殊原因造成集群分裂成兩個小集群,而這兩個小集群互相不能正常通信,此時,就會發(fā)生鬧裂(Brain Split)現(xiàn)象。
資源爭用:當一個集群中因特殊情況分裂成兩個小集群,且這兩個集群都不能通信時,這時可能會造成資源爭用的情況;分裂情況發(fā)生后,如果沒有及時的決策,那么可能會因為兩個小集群同時使用一個文件系統(tǒng),而造成后端共享存儲中文件損壞,甚至造成整個文件系統(tǒng)的崩潰。顯然,這種情況是不允許發(fā)生的。
資源隔離:主要為了解決資源爭用的問題。資源隔離分為節(jié)點級別隔離和資源級別隔離。所謂節(jié)點級別隔離指當集群發(fā)生分裂時,即發(fā)生腦裂現(xiàn)象后,通過STONITH機制將資源隔離,并通過仲裁機制將分裂的票數(shù)不足的集群退出集群。STONITH指通過硬件設(shè)備,使得退出的主機重啟或關(guān)機,或者通過交換機阻斷退出的集群向外通信和資源通信的能力。
資源隔離的解決方案:
1、當集群分裂成兩個小集群時會發(fā)生資源爭用的情況,為避免爭用后端存儲系統(tǒng)而造成災難性的系
統(tǒng)崩潰,集群系統(tǒng)引入了投票機制,只有擁有半數(shù)以上合法票數(shù)的集群才能存活,否則就推出集群
系統(tǒng)。
2、當集群為偶數(shù)時,如果分裂,兩邊可能都掌握相等的票數(shù);因此,集群系統(tǒng)不應該為偶數(shù),如果
是偶數(shù)則需要一個額外的ping節(jié)點參與投票。
3、票數(shù)不足的集群退出集群服務后,為了保證它不會爭用資源需要STONITH機制來進行資源隔離。
所以,為了防止腦裂,集群節(jié)點數(shù)一般為奇數(shù),就算集群分裂,也不可能使得兩個集群的票數(shù)相等。
高可用集群的邏輯架構(gòu)
高可用集群的解決方案
一、基于【CentOS | RHEL】5:
1、自帶: RHCS(cman+rgmanager)
2、選用第三方:corosync+pacemaker, heartbeat(v1或v2), keepalived
二、基于【CentOS | RHEL】6:
1、RHCS(cman+rgmanager)
2、corosync+rgmanager
3、cman+pacemaker
4、heartbeat v3 + pacemaker:6.4之前
5、keepalived:6.4之后
高可用集群的工作模型
A/P:兩個節(jié)點,工作于主備模型;
N-M: N>M,N個節(jié)點,M個服務,活動節(jié)點為N,備用節(jié)點為N-M;
N-N:N個節(jié)點,N個服務;
A/A:雙主模型:兩個節(jié)點都是活動的;
資源轉(zhuǎn)移的方式:
rgmanager:failover domain(故障切換域), priority(優(yōu)先級)
failover domain: 故障轉(zhuǎn)移域,設(shè)定一個資源只能在哪些主機上面轉(zhuǎn)移
priority: 設(shè)定,在一個轉(zhuǎn)移域中,哪些主機優(yōu)先被轉(zhuǎn)移資源
pacemaker:
資源黏性:如果兩個節(jié)點傾向性位置約束一致,資源對哪個節(jié)點粘性為正值,則留在哪個節(jié)點。
資源約束(3種類型):
位置約束:資源更傾向于哪個節(jié)點上;
inf: 無窮大
n: 傾向于運行在某節(jié)點
-n: 傾向于離開某節(jié)點
-inf: 負無窮
排列約束:資源運行在同一節(jié)點的傾向性;
inf: 兩者永遠在一起
-inf: 兩者永遠不再一起
順序約束:資源啟動次序及關(guān)閉次序;
例子:如何讓web service中的三個資源:vip、httpd及filesystem運行于同一節(jié)點上?
1、排列約束;說明三個在一起可能性inf
2、資源組(resource group);三個資源定義在一個組內(nèi),然后這個組決定在某一個節(jié)點上啟動
3、定義順序約束,保證啟動順序,vip–filesystem–httpd
對稱性與非對稱性:
對稱性: 默認所有節(jié)點都能轉(zhuǎn)移資源。
非對稱性; 有些節(jié)點不能轉(zhuǎn)移資源。
如果節(jié)點不再成為集群節(jié)點成員時,如何處理運行于當前節(jié)點的資源:
stoped: 直接停止服務
ignore:忽略,以前運行什么服務現(xiàn)在還運行什么。
freeze: 事先建立的連接,接續(xù)保持,不再接收新的請求。
suicide: kill掉服務。
一個資源剛配置完成時,是否啟動?
target-role: 目標角色,可以為啟動,也可以為不啟動。
資源代理類型(RA):
heartbeat legacy: 傳統(tǒng)類型
LSB: /etc/rc.d/init.d/ 下面的服務腳本
OCF:
STONITH: 專門用來實現(xiàn)資源隔離的
資源類型:
primitive, native : 主資源,只能運行于一個節(jié)點。
group: 組資源
clone: 克隆資源,所有節(jié)點都運行的資源,首先是主資源。
通常為STONITH資源, Cluster filesystem, 分布式鎖
1) 最多運行的最大數(shù)。 總clone數(shù)
2) 每一個節(jié)點上最多運行幾個。
master/slave: 主從資源內(nèi)容,只能克隆兩份,主的能讀能寫,從的不能做任何操作
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。