溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

高可用集群概念及工作原理

發(fā)布時間:2020-07-20 14:54:59 來源:網(wǎng)絡(luò) 閱讀:2819 作者:ccs_Chan 欄目:建站服務器

 這篇文章我們主要了解高可用集群概念及工作原理,以及高可用集群的邏輯架構(gòu)等。



 

 ll  本文導航 

  · 什么是高可用集群?

  · 高可用集群有哪些特點?

  · 高可用集群的邏輯架構(gòu)

  · 高可用集群的解決方案

  · 高可用集群的工作模型

  

 ll  要求 

掌握高可用集群的基礎(chǔ)原理與邏輯架構(gòu)。


  什么是高可用集群?

  所謂高可用集群,即當前服務器出現(xiàn)故障時,可以將該服務器中的服務、資源、IP等轉(zhuǎn)移到另外一臺服務器上,從而滿足業(yè)務的持續(xù)性;這兩臺或多臺服務器構(gòu)成了服務器高可用集群。

  對于客戶端來說,集群就像是一臺服務器,因為集群運行的是同一種服務,即使其中有的服務器宕機或無法通信時,也不會對業(yè)務造成影響。

 

  高可用集群有哪些特點?

一、高可用服務

  集群最大的目的和作用就是實現(xiàn)服務的高可用性,其最終目的是保證業(yè)務不會因為線路、硬件、軟件故障而導致的服務不可用。

二、度量標準(服務可用性)

  由系統(tǒng)可靠性(Availability)和可維護性(maintainabilit)來度量

  計算方式:HA=MTTF(平均無故障事件)/(MTTF+MTTR(平均修復事件))*100%

  99%    全年服務中斷時間不超過4天

  99.9%    全年服務中斷時間不超過10個小時

  99.99%    全年服務中斷時間不超過1個小時

  99.999%    全年服務中斷時間不超過6分鐘

三、集群節(jié)點  

  集群存在所有主機都稱為節(jié)點,每HA集群最低要求需有2個節(jié)點;正常來說,節(jié)點數(shù)最好為奇數(shù)。在生產(chǎn)環(huán)境中,HA集群的節(jié)點數(shù)至少為3個,可以降低發(fā)生腦裂的概率。

四、集群服務與資源

  集群服務通常包括多個資源,多個資源組成某種集群服務。如mysql高可用服務,其資源包括vip、mysqld、共享存儲等。對于集群服務的管理,實際上就是對資源的管理。

五、腦裂、資源爭用、資源隔離

 腦裂:因某種特殊原因造成集群分裂成兩個小集群,而這兩個小集群互相不能正常通信,此時,就會發(fā)生鬧裂(Brain Split)現(xiàn)象。

  資源爭用:當一個集群中因特殊情況分裂成兩個小集群,且這兩個集群都不能通信時,這時可能會造成資源爭用的情況;分裂情況發(fā)生后,如果沒有及時的決策,那么可能會因為兩個小集群同時使用一個文件系統(tǒng),而造成后端共享存儲中文件損壞,甚至造成整個文件系統(tǒng)的崩潰。顯然,這種情況是不允許發(fā)生的。

  資源隔離:主要為了解決資源爭用的問題。資源隔離分為節(jié)點級別隔離和資源級別隔離。所謂節(jié)點級別隔離指當集群發(fā)生分裂時,即發(fā)生腦裂現(xiàn)象后,通過STONITH機制將資源隔離,并通過仲裁機制將分裂的票數(shù)不足的集群退出集群。STONITH指通過硬件設(shè)備,使得退出的主機重啟或關(guān)機,或者通過交換機阻斷退出的集群向外通信和資源通信的能力。

    資源隔離的解決方案:

    1、當集群分裂成兩個小集群時會發(fā)生資源爭用的情況,為避免爭用后端存儲系統(tǒng)而造成災難性的系

    統(tǒng)崩潰,集群系統(tǒng)引入了投票機制,只有擁有半數(shù)以上合法票數(shù)的集群才能存活,否則就推出集群

    系統(tǒng)。

    2、當集群為偶數(shù)時,如果分裂,兩邊可能都掌握相等的票數(shù);因此,集群系統(tǒng)不應該為偶數(shù),如果

    是偶數(shù)則需要一個額外的ping節(jié)點參與投票。

    3、票數(shù)不足的集群退出集群服務后,為了保證它不會爭用資源需要STONITH機制來進行資源隔離。

    所以,為了防止腦裂,集群節(jié)點數(shù)一般為奇數(shù),就算集群分裂,也不可能使得兩個集群的票數(shù)相等。

高可用集群概念及工作原理  


  高可用集群的邏輯架構(gòu) 

高可用集群概念及工作原理


  高可用集群的解決方案 

一、基于【CentOS | RHEL】5:

  1、自帶: RHCS(cman+rgmanager)

  2、選用第三方:corosync+pacemaker, heartbeat(v1或v2), keepalived


二、基于【CentOS | RHEL】6:

  1、RHCS(cman+rgmanager)

  2、corosync+rgmanager

  3、cman+pacemaker

  4、heartbeat v3 + pacemaker:6.4之前

  5、keepalived:6.4之后


  高可用集群的工作模型 

  A/P:兩個節(jié)點,工作于主備模型;

  N-M: N>M,N個節(jié)點,M個服務,活動節(jié)點為N,備用節(jié)點為N-M;

  N-N:N個節(jié)點,N個服務;

  A/A:雙主模型:兩個節(jié)點都是活動的;


資源轉(zhuǎn)移的方式:

rgmanager:failover domain(故障切換域), priority(優(yōu)先級)

failover domain: 故障轉(zhuǎn)移域,設(shè)定一個資源只能在哪些主機上面轉(zhuǎn)移 

priority: 設(shè)定,在一個轉(zhuǎn)移域中,哪些主機優(yōu)先被轉(zhuǎn)移資源


pacemaker: 

資源黏性:如果兩個節(jié)點傾向性位置約束一致,資源對哪個節(jié)點粘性為正值,則留在哪個節(jié)點。 

資源約束(3種類型):

位置約束:資源更傾向于哪個節(jié)點上;

inf: 無窮大

n: 傾向于運行在某節(jié)點

-n: 傾向于離開某節(jié)點

-inf: 負無窮

排列約束:資源運行在同一節(jié)點的傾向性;

inf: 兩者永遠在一起 

-inf: 兩者永遠不再一起

順序約束:資源啟動次序及關(guān)閉次序;


例子:如何讓web service中的三個資源:vip、httpd及filesystem運行于同一節(jié)點上?

1、排列約束;說明三個在一起可能性inf

2、資源組(resource group);三個資源定義在一個組內(nèi),然后這個組決定在某一個節(jié)點上啟動

3、定義順序約束,保證啟動順序,vip–filesystem–httpd 


對稱性與非對稱性:

對稱性: 默認所有節(jié)點都能轉(zhuǎn)移資源。

非對稱性; 有些節(jié)點不能轉(zhuǎn)移資源。


如果節(jié)點不再成為集群節(jié)點成員時,如何處理運行于當前節(jié)點的資源:

stoped: 直接停止服務

ignore:忽略,以前運行什么服務現(xiàn)在還運行什么。 

freeze: 事先建立的連接,接續(xù)保持,不再接收新的請求。

suicide: kill掉服務。 


一個資源剛配置完成時,是否啟動?

target-role: 目標角色,可以為啟動,也可以為不啟動。


資源代理類型(RA):

heartbeat legacy: 傳統(tǒng)類型

LSB: /etc/rc.d/init.d/ 下面的服務腳本

OCF: 

STONITH: 專門用來實現(xiàn)資源隔離的


資源類型: 

primitive, native : 主資源,只能運行于一個節(jié)點。

group: 組資源

clone: 克隆資源,所有節(jié)點都運行的資源,首先是主資源。

通常為STONITH資源, Cluster filesystem, 分布式鎖

1) 最多運行的最大數(shù)。 總clone數(shù)

2) 每一個節(jié)點上最多運行幾個。 

master/slave: 主從資源內(nèi)容,只能克隆兩份,主的能讀能寫,從的不能做任何操作





向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI