溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Windows Server中故障轉(zhuǎn)移群集的實現(xiàn)機制是怎么樣的

發(fā)布時間:2021-11-02 10:46:18 來源:億速云 閱讀:420 作者:柒染 欄目:系統(tǒng)運維

Windows Server中故障轉(zhuǎn)移群集的實現(xiàn)機制是怎么樣的,相信很多沒有經(jīng)驗的人對此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個問題。

    Windows服務器故障轉(zhuǎn)移集群(Windows Server Failover Cluster,簡稱WSFC)使用仲裁投票(Quorum Voting)決定集群的健康狀況,或使故障自動轉(zhuǎn)移,或使集群離線。當集群中的節(jié)點發(fā)生故障時,會由其他節(jié)點接手繼續(xù)提供服務,不過,當節(jié)點之間通信出現(xiàn)問題,或大多數(shù)節(jié)點發(fā)生故障時,集群就會停止服務。可是集群可以容忍多少個結(jié)點發(fā)生故障呢?這要由仲裁配置(Quorum Configuration)決定,仲裁配置使用多數(shù)(Majority)原則,只要集群中健康運行的節(jié)點數(shù)量達到仲裁規(guī)定的數(shù)量(多數(shù)結(jié)點投贊成票),集群就會繼續(xù)提供服務,否則集群就停止提供服務。在停止提供服務期間,正常節(jié)點持續(xù)監(jiān)控故障節(jié)點是否恢復正常,一旦正常節(jié)點的數(shù)量恢復到仲裁規(guī)定的數(shù)量,集群就恢復正常,繼續(xù)提供服務。仲裁投票默認是啟用的(Cluster Manged Voting:Enable)。

一、仲裁模式

    仲裁模式是在WSFC 集群級別配置的,規(guī)定仲裁投票的方法,默認情況下,故障轉(zhuǎn)移集群管理器會基于集群節(jié)點的數(shù)量,自動推薦一個仲裁模式。仲裁配置影響集群的可用性,在集群中,重組的集群節(jié)點必須在線,否則集群將由于仲裁不足而必須停止服務。

1、術語解釋

仲裁(Quorum):法定數(shù)量,預先規(guī)定具有投票權的節(jié)點或見證(Witness)的數(shù)量;

仲裁投票(Quorum Voting):法定數(shù)量的節(jié)點和見證進行投票,如果多數(shù)投贊成票,那么判斷集群處于健康狀態(tài);

投票節(jié)點(Voting Node):在集群中,擁有投票權的節(jié)點稱作投票節(jié)點,如果投票節(jié)點投贊成票,代表該節(jié)點認為集群是健康的;但是,單個節(jié)點不能決定集群整體的健康狀態(tài)。

投票見證(Voting Witness):除了投票節(jié)點能夠進行投票之外,共享的 File 和 Disk 也能投票,稱作投票見證,共享的File 投票見證,稱作文件共享見證(File Share Witness);共享的Disk 投票見證,稱作硬盤見證(Disk Witness);

仲裁節(jié)點集合(Quorum Node Set):擁有投票的結(jié)點和Witness統(tǒng)稱仲裁節(jié)點集合;由仲裁節(jié)點集合的投票結(jié)果決定集群整體的健康狀態(tài)。

2、仲裁模式

    仲裁模式多數(shù)原則是指所有投票節(jié)點進行投票,如果贊成票占比在50%以上,那么WSFC認為集群處于健康狀態(tài),執(zhí)行故障轉(zhuǎn)移,繼續(xù)提供服務,否則,WSFC認為集群出現(xiàn)嚴重故障,WSFC使集群離線,停止提供服務。根據(jù)仲裁節(jié)點集合的組成類型,將仲裁模式分為以下四種類型:

  • 節(jié)點多數(shù)(Node Majority):在集群中,投票結(jié)點都是集群的節(jié)點服務器,如果一半以上的投票節(jié)點(Voting Node)投贊成票,那么WSFC判定集群是健康的;

  • 節(jié)點和文件共享多數(shù)(Node and File Share Majority):和Node Majority模式相似,除了將遠程文件共享配置為一個投票見證(Voting Witness)之外,該共享文件稱作仲裁文件,或見證文件。使用仲裁文件,遠程文件擁有投票權,如果其他結(jié)點能夠連接到該共享文件,那么認為該文件投一個贊成票。如果投票節(jié)點和文件共享投的贊成票占一半以上,那么WSFC判定集群是健康的。作為一個最佳實踐,文件共享見證(File Share Witness)不要存儲在集群中的任何一個結(jié)點服務器上,并且設置任何一個結(jié)點服務器都有權限訪問。 

  • 節(jié)點和硬盤多數(shù)(Node and Disk Majority):和Node Majority模式相似,除了將共享硬盤配置為一個投票見證(Voting Witness)之外,該共享硬盤稱作仲裁硬盤,或見證硬盤。仲裁硬盤需要共享存儲,集群中各個節(jié)點都需要掛載同一個共享硬盤。

  • 只硬盤(Disk Only):沒有多數(shù),僅僅把一個共享的硬盤作為唯一見證,集群中的任何一個節(jié)點能夠訪問該共享硬盤,這意味著,一旦仲裁硬盤脫機,集群就會停止提供服務。

    常見的仲裁模式是節(jié)點多數(shù)(Node Majority) 和 節(jié)點和文件共享多數(shù)(Node and File Share Majority),如果集群節(jié)點數(shù)量是奇數(shù),那么使用節(jié)點多數(shù)仲裁模式;如果集群結(jié)點數(shù)量是偶數(shù),那么使用節(jié)點和文件共享多數(shù)仲裁模式,該模式需要配置一個共享文件夾,集群中的各個節(jié)點都有權限訪問該共享文件夾,并且該共享文件夾不能創(chuàng)建是集群的節(jié)點上。

二,仲裁配置(Quorum Configuration)

打開故障轉(zhuǎn)移管理器(Failover Cluster Manager),右擊集群結(jié)點,在上下文菜單中點擊“More Actions”,在擴展菜單中選擇“Configure Cluster Quorum Settings”,打開仲裁配置向?qū)В╓izard),為該集群配置仲裁

Windows Server中故障轉(zhuǎn)移群集的實現(xiàn)機制是怎么樣的

Step1,打開仲裁配置向?qū)?strong>(Wizard),開始配置仲裁

Windows Server中故障轉(zhuǎn)移群集的實現(xiàn)機制是怎么樣的

step2,選擇仲裁配置選項

仲裁配置共有三個選項:

  • 使用默認的仲裁配置:該選項將仲裁配置選項的選擇權交由集群系統(tǒng);

  • 仲裁見證:該選項將集群中添加仲裁見證,由集群決定其他仲裁管理選項;

  • 高級仲裁配置:由用戶控制仲裁配置的所有選項

Windows Server中故障轉(zhuǎn)移群集的實現(xiàn)機制是怎么樣的

本例選擇高級仲裁配置(Advanced quorum configuration),自主控制仲裁的所有配置選項

Step3,選擇投票設置(Voting)

    默認情況下,集群中的每一個結(jié)點都是投票節(jié)點,通過顯式的移除節(jié)點的投票權,用戶可以調(diào)整投票仲裁的設置,本例選擇默認選項:All Nodes,這意味著,集群中的所有節(jié)點都擁有投票權。

Windows Server中故障轉(zhuǎn)移群集的實現(xiàn)機制是怎么樣的

Step4,選擇仲裁見證(Quorum Witness)

    在集群中,能夠添加兩類仲裁見證:文件共享見證(File Share Witness)和硬盤見證(Disk Witness),硬盤見證是指增加一個共享的硬盤作為一個仲裁投票節(jié)點,文件共享見證是指增加一個文件共享作為一個仲裁投票節(jié)點,如果集群中的其他節(jié)點能夠訪問該節(jié)點,那么認為該節(jié)點

Windows Server中故障轉(zhuǎn)移群集的實現(xiàn)機制是怎么樣的

Step5,選擇文件共享路徑

Windows Server中故障轉(zhuǎn)移群集的實現(xiàn)機制是怎么樣的

三,投票仲裁

    默認情況下,故障轉(zhuǎn)移集群中的每一個節(jié)點都是集群仲裁節(jié)點,每一個節(jié)點都擁有投票權,如果一個節(jié)點投贊成票,那么代表該節(jié)點認為集群是健康的,但是,單個節(jié)點不能決定集群整體的健康狀態(tài),而是由集群中的所有仲裁節(jié)點的投票結(jié)果來決定。

    在任何時刻,從每一個的節(jié)點的角度來看,其他節(jié)點可能處于離線狀態(tài),或正在進行故障轉(zhuǎn)移,或由于網(wǎng)絡連接失敗而處于不響應狀態(tài),仲裁投票的關鍵在于確定所有投票節(jié)點的真實狀態(tài)。除了“Disk Only”仲裁模式之外,其他仲裁模式都依賴于投票節(jié)點之間周期性的心跳信號通信,一旦某個節(jié)點因為網(wǎng)絡通信故障,系統(tǒng)宕機,硬件損壞,機房停電等異常而無法回應心跳信號,那么剩余的節(jié)點就認為該節(jié)點出現(xiàn)異常,把該節(jié)點從當前集群排除。WSFC統(tǒng)計所有投票節(jié)點的仲裁結(jié)果,決定集群的健康狀態(tài)。

    如果集群的節(jié)點位于不同的子網(wǎng)(Subnet)中,當一個結(jié)點在子網(wǎng)1中被認為是故障節(jié)點時,實際上,該節(jié)點可能是由于網(wǎng)絡通信故障而不能被子網(wǎng)1的節(jié)點感知,但是該節(jié)點在子網(wǎng)2中是在線的,健康的。如果投票結(jié)點在不同的子網(wǎng)中能夠建立多個投票仲裁,那么將產(chǎn)生腦裂場景。在該場景中,位于不同仲裁的節(jié)點有不同的表現(xiàn),使仲裁產(chǎn)生沖突,WSFC不能正確的執(zhí)行故障轉(zhuǎn)移,可能產(chǎn)生數(shù)據(jù)不同步。腦裂場景只可能在系統(tǒng)管理員手動執(zhí)行強制仲裁(Forced Quorum)操作時發(fā)生。

四,健康檢測和仲裁投票

    WSFC在集群的節(jié)點之間進行健康檢測和仲裁投票,每一個節(jié)點通過周期性地發(fā)送心跳信號,檢測其他其他節(jié)點的健康狀態(tài),并和其他節(jié)點共享健康數(shù)據(jù),無法響應心跳信號的節(jié)點被認為處于異常狀態(tài),集群的所有健康節(jié)點都會很快知道該節(jié)點出現(xiàn)故障。仲裁節(jié)點集合是投票節(jié)點和見證節(jié)點(Witness)結(jié)合,仲裁結(jié)果由多數(shù)(Majority)結(jié)點決定,集群整體的健康狀態(tài)是由周期性的仲裁投票的結(jié)果決定的,WSFC根據(jù)仲裁投票的結(jié)果,執(zhí)行自動故障轉(zhuǎn)移或者使集群離線:如果仲裁節(jié)點集合(Quorum Node Set)的投票結(jié)果表明大多數(shù)節(jié)點是健康的,那么集群將進行故障轉(zhuǎn)移,繼續(xù)提供服務;如果投票結(jié)果是少數(shù)節(jié)點,那么集群將處于離線狀態(tài)。

看完上述內(nèi)容,你們掌握Windows Server中故障轉(zhuǎn)移群集的實現(xiàn)機制是怎么樣的的方法了嗎?如果還想學到更多技能或想了解更多相關內(nèi)容,歡迎關注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。

AI