<ol id="fzofs"><delect id="fzofs"><sup id="fzofs"></sup></delect></ol>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

WSFC2016 故障域站點感知

發(fā)布時間：2020-07-30 00:19:31 來源：網(wǎng)絡閱讀：4140 作者：老收藏家欄目：建站服務器

很高興和大家介紹另外一項WSFC2016的酷炫技術，即故障域功能

與之類似的技術有CloudStack，Openastack等

以CloudStack為例，在CloudStack中，針對于資源架構，我們可以手動來定義架構模型，從最上層Region，Zone，Pod，Cluster，再到最底層的Host，通過規(guī)劃這樣一套架構模型，我們可以在云管理軟件上面定義出云資源池底層的架構，實現(xiàn)既能夠對于用戶屏蔽技術細節(jié)，也能夠讓云管理軟件按照架構模型運轉

其中最上層，最大的架構為 Region，也就是地域了，例如，我們在使用阿里云，Azure，AWS的時候創(chuàng)建虛擬機，都只需要選擇一個區(qū)域就好了，對應到后臺就是這個概念，Region的概念是地域，不同Region，則應該意味著不同地域，如果說用戶把兩臺虛擬機部署在兩個不同的Region，那么它們同時出現(xiàn)故障的幾率會很低

其次是Zone，CloudStack中，Zone主要是指數(shù)據(jù)中心，我們說一個Zone，就是說一個數(shù)據(jù)中心，一個數(shù)據(jù)中心里面可能有多個Pod，即機架，不同機架可能使用不同的網(wǎng)絡架構設施，一個機架上面有可能有多個Cluster，一個Cluster上面又可能有多個Host，同一個Zone內共用一個二級存儲。

定義這樣的架構后，對于用戶來說，用戶不需要知道太多，它們只需要知道，我們要部署到離我們訪問地方比較近的Region，如果我的不同虛擬機放在不同Region，會被放置在不同的，很遠的地方，不會同時發(fā)生故障，這樣就夠了

一些云平臺例如Azure，可以讓用戶選擇不同的可用性集，對應的概念，就是這里的機架，如果選擇虛擬機在不同的可用性集，意味著虛擬機會被放置在不同的Pod，微軟也叫做Rack，如果部署了可用性集后Azure才可以保證SLA在99.95%

一套云管理系統(tǒng)，對于資源管理員來說，管理員主要關注的是持續(xù)保證租戶資源的SLA，置備多種高可用方案，災備方案，等等，這里我們主要討論的是高可用方案，在高可用方案里面，通常在云計算業(yè)內，人們會談到故障域

什么是故障域呢，例如，我一個節(jié)點壞了，上面虛擬機可以漂到其它節(jié)點，這時候節(jié)點是一個故障域，單個節(jié)點故障了，我們部署了群集系統(tǒng)，會故障轉移，并不會影響SLA

默認情況下大多數(shù)云管理平臺的failover級別都是Cluster內的節(jié)點級別，理想情況下，老王認為，所有已定義的Region，zone，pod，Cluster都是應該可以感知的，例如，如果群集里面一個節(jié)點壞了，我可以把虛擬機先遷移到Cluster內其它節(jié)點，如果不行，再遷移到同Pod上面其它群集，如果不行再遷移到Zone里面的不同Pod，如果不行再遷移到不同Zone，甚至最后整個Zone癱瘓，還可以轉移到其它Region恢復運行，如果真的可以做到這樣就太強大了，真正實現(xiàn)了云計算持續(xù)可用的目的

不過在現(xiàn)實情況下，根據(jù)老王的觀察，我們軟件的定義的這些Region，zone，pod，Cluster，一部分是用來看的，一部分是用來用的，假設Region，zone，pod這些東西沒有和云資源故障系統(tǒng)達成感應，那么是不會有老王上面說的效果的，可能最多就是，我們可以集中針對同一個Pod里面的Cluster或Host進行policy設置，可以讓一個Zone中心里面的所有Pod，Cluster使用相同的共享二級存儲，或者通過報告集中輸出下報告之類的。

實務上通常一些云計算廠商會實現(xiàn)Region級別，Pod級別，Cluster級別的故障域感知，例如Cluster失效，會恢復到其它Region繼續(xù)運行，或是Cluster維護，由Pod上面其它Cluster暫時負責服務。

這里老王說了這么多，是希望把故障域這樣的一個概念帶給大家，這個概念是相通的，不光在微軟WSFC 2016會有，在Cloudstack，Openstack等其它云平臺管理軟件中也會有，老王認為這項功能在云平臺管理，或者大型數(shù)據(jù)中心，大型托管數(shù)據(jù)中心里面會很常見，是項規(guī)范管理的好功能。

這項技術把它叫做軟件定義故障域也好，故障域也好，舉個例子

比如我們知道，租戶的虛擬機在HV01節(jié)點，Cluster01上面運行，Cluster 01在Pod01上面，Pod01在Zone01，Zone01在Region北京運行，之前是在腦子里知道，現(xiàn)在我們可以通過軟件定義在管理系統(tǒng)中

如果HV01節(jié)點Host級別壞了，由于Cluster自動實現(xiàn)主機級別故障域，節(jié)點會轉移到其它節(jié)點上面運行，注意，只要是通過可以正常進行故障轉移的系統(tǒng)構成的cluster，那么默認物理上就已經(jīng)實現(xiàn)為了主機故障域

如果Cluster壞了呢，那么Cluster就是一個故障域，Cluster上面會有很多臺虛擬機，也會隨之跟著停機，如果沒有置備跨Cluster的轉移機制，這里就會產生宕機時間。

如果Pod級別壞了，那么Pod就是一個故障域，Pod上面會有很多Cluster，Cluster里面又會有很多應用，所有全部停機。

如果Zone級別壞了，那么整個Zone就是一個故障域

如果Region級別壞了，那么整個Region就是一個故障域

大家可以看出，越大的級別壞了，影響到的越多，所以對于架構人員來說，如果你作為一個云提供商或者大型托管數(shù)據(jù)中心提供商，那么首先您應該針對于每個故障域級別強化可靠性，盡量做好災難恢復機制，什么級別的故障域出現(xiàn)故障，需要如何恢復處理，其次，應該想辦法實現(xiàn)用戶云資源的跨故障域轉移，例如當前在Cluster運作，如果Cluster壞了，能否轉移到其它Pod，或其它Zone繼續(xù)運行，實現(xiàn)后建議用戶在不同的可感應故障域上面部署資源。

故障域級別，通常這種東西，是管理員心里有數(shù)，或者寫在合同上面的東西，我們通過一些云平臺軟件或管理軟件，無非就是實現(xiàn)故障域，在電腦界面上面可見，可出集中管理，出報表，出架構視圖

但是更重要的，我們是要實現(xiàn)故障域的感知，確保用戶選擇到不同故障域的相同資源不會同時出現(xiàn)故障，確保故障域發(fā)生可以跨故障域感知，讓用戶虛擬機正常情況在同Region下面的群集節(jié)點運行，如果同Region出現(xiàn)故障，可以直接讓虛擬機跨Region遷移繼續(xù)運行，因此故障域的定義大體會有以下功能

1.實現(xiàn)軟件層面的故障域架構，便于記錄查看，便于與物理架構對應

2.實現(xiàn)云管理策略按照故障域架構分配策略

2.實現(xiàn)故障域感知，確保用戶選擇到不同故障域的相同資源不會同時出現(xiàn)故障

3.實現(xiàn)跨故障域感知，在發(fā)生故障時能夠讓資源跨不同級別故障域進行轉移

4.通過故障域功能，可以提高同一故障域內，存儲，網(wǎng)絡，計算資源的粘性性能，確保同一故障域內的存儲和計算資源可以很快的工作。

要實現(xiàn)故障域，主要工作應該分為兩步，1.邏輯定義 2.具體實現(xiàn)

邏輯定義，即是我們先定義出來，故障域數(shù)據(jù)，先在軟件層面創(chuàng)建出來，讓后把資源加進來，這樣看起來我們有了故障域了，但其實只是看著好看，如果云平臺支持，可以做一些報表或策略控制

具體實現(xiàn)，既真正實現(xiàn)故障域的功能，讓用戶不同作用域的資源不會同時宕機，讓低級別故障域不可用，用戶資源還可以跨故障域遷移到更高的級別，具體實現(xiàn)這個步驟呢，一部分我們可以依賴于技術手段，如果技術手段不到位，我們也可以依賴于手動，或者說，人腦把

定義了故障域不是說了幾個字那么簡單，管理員做維護的時候，是要心里有數(shù)的，例如，不能同一時間對所有故障域做維護吧，一定要先維護好一個故障域，再維護另外一個，如果技術手段不行，不能做到跨故障域級別故障轉移，那么真的一個故障域級別壞了，管理員是需要手動把用戶資源弄走再到另外故障域恢復的。

所以說故障域，不光是軟件上面的定義和技術實現(xiàn)，更多的也是要求管理員維護的時候有故障域這樣的一個思路，如果用戶資源在不同故障域，我應該怎么維護，不同的故障域級別壞了，我應該關注那些內容，參照什么流程恢復，如何跨故障域級別恢復，等等，軟件技術層面實現(xiàn)之后，更多的是維護流程

Ok，上面看了很多通用性的概念，下面我們就來看下微軟WSFC 2016在故障域上面交出的答卷把

在WSFC 2016中微軟針對于故障域，開通了個四個級別，分別是Site，Rack，Chassis，Node，其中Node是群集安裝后默認就有，站點，機架，機箱，我們可以自行創(chuàng)建，自行構建它們之間的嵌套級別，并且針對于每個故障域級別都可以做詳細的說明，便于查看，讓我很感到驚喜的是WSFC 2016中的故障域并不只是說說而已，而是真的WSFC本身就可以幫助我們實現(xiàn)故障域感知的功能，目前老王觀察看到 Site，Rack，Chassis這三種故障域級別都有各自生效的場景

例如，同一個Site上面的Node，默認情況會在Site內執(zhí)行故障轉移，如果Site所有群集節(jié)點不可用，再轉移至不同Site，隨之又有很多Site故障域級別的粘合性優(yōu)化，可以配置群集級別的首選Site，應用級別的首選Site，同一個Site虛擬機會使用同一個Site的存儲，如果存儲移動到其它Site，則虛擬機也跟著移動，等等，本文后面我也將主要介紹WSFC 2016 Site級別的故障域感知。

還有一種場景，即Storage Direct Spaces，這項技術相信很多關注微軟技術的朋友已經(jīng)測過了，類似于VSAN，可以將每個節(jié)點肚子里面存儲貢獻出來形成一個存儲池，再基于這個存儲池構建存儲空間，CSV，SOFS，最終交付給應用，在SDS的場景下，當我們寫入數(shù)據(jù)給SDS存儲空間，數(shù)據(jù)是會被撒在不同節(jié)點的，配置了雙向鏡像，三向鏡像，雙重校驗的等容錯技術后，數(shù)據(jù)會被撒多份，屆時在容錯技術容許的情況下，可以允許指定的節(jié)點數(shù)壞掉，然后新加節(jié)點恢復，或磁盤壞掉，新加磁盤恢復，所以，默認情況下SDS就已經(jīng)有了磁盤級別故障域，節(jié)點級別故障域

我們也可以把SDS技術和WSFC 2016故障域新功能結合起來，在開啟SDS功能前，我們針對于節(jié)點構建Rack或Chassis級別的故障域，屆時SDS執(zhí)行容錯時，將按照拓撲進行操作，例如會保證數(shù)據(jù)始終灑在不同Rack或不同chassis節(jié)點上面，這樣即便是一個Rack或一個chassis故障，也不會影響SDS，注意，如果希望實現(xiàn)這項功能，建議最好在SDS開啟之前就規(guī)劃好故障域級別，否則SDS建好之后在規(guī)劃，需要重新移除節(jié)點，再加入到故障域。

WSFC2016 故障域站點感知

WSFC 2016故障域群集配置命令：

Get-ClusterFaultDomain：獲取群集故障域架構，可以從群集級別，或任意故障域級別

Set-ClusterFaultDomain：移動資源所屬故障域，配置故障域相關參數(shù)

New-ClusterFaultDomain：創(chuàng)建群集故障域，可以選擇Site，Rack，Chassis級別的故障域

Remove-ClusterFaultDomain：刪除故障域

實驗示例：

#創(chuàng)建北京站點和上海站點

New-ClusterFaultDomain -Type Site -Name "Beijing" -Description "Primary Site"

New-ClusterFaultDomain -Type Site -Name "Shanghai" -Description "Secondary Site"

WSFC2016 故障域站點感知

WSFC2016 故障域站點感知

#創(chuàng)建北京站點數(shù)據(jù)中心Rack和上海站點數(shù)據(jù)中心Rack

New-ClusterFaultDomain -Type Rack -Name "Rack Beijing1" -Location "Fumadasha 17, Room 501"

New-ClusterFaultDomain -Type Rack -Name "Rack Shanghai1" -Location "TaiDidash 14, Room 203"

WSFC2016 故障域站點感知

WSFC2016 故障域站點感知

#創(chuàng)建北京Rack上面的兩個機箱，上海Rack上面的兩個機箱

New-ClusterFaultDomain -Type Chassis -Name "Chassis 01"-Location "Rack Beijing01 Ontop"

New-ClusterFaultDomain -Type Chassis -Name "Chassis 02"-Location "Rack Beijing01 Under"

New-ClusterFaultDomain -Type Chassis -Name "Chassis 03"-Location "Rack Shanghai01 Ontop"

New-ClusterFaultDomain -Type Chassis -Name "Chassis 04"-Location "Rack Shanghai01 Under"

WSFC2016 故障域站點感知

WSFC2016 故障域站點感知

需要注意，這里每個故障域Name都將是唯一的

#添加服務器進入機箱

Set-ClusterFaultDomain -Name "HV01" -Parent "Chassis 01"

Set-ClusterFaultDomain -Name "HV02" -Parent "Chassis 02"

Set-ClusterFaultDomain -Name "HV03" -Parent "Chassis 03"

Set-ClusterFaultDomain -Name "HV04" -Parent "Chassis 04"

WSFC2016 故障域站點感知

WSFC2016 故障域站點感知

#構建機箱機架站點依賴關系

Set-ClusterFaultDomain -Name "Chassis 01" -Parent "Rack Beijing1"

Set-ClusterFaultDomain -Name "Chassis 02" -Parent "Rack Beijing1"

Set-ClusterFaultDomain -Name "Chassis 03" -Parent "Rack Shanghai1"

Set-ClusterFaultDomain -Name "Chassis 04" -Parent "Rack Shanghai1"

Set-ClusterFaultDomain -Name "Rack Beijing1" -Parent "Beijing"

Set-ClusterFaultDomain -Name "Rack Shanghai1" -Parent "Shanghai"

WSFC2016 故障域站點感知

#獲取故障域拓撲

Get-ClusterFaultDomain

WSFC2016 故障域站點感知

#獲取故障域完整信息

Get-ClusterFaultDomain | ft name,type,parentname,childrennames,Location,description -autosize

WSFC2016 故障域站點感知

還可以把，在這里大家可以看到，老王之前定義的所有故障域，以及嵌套關系，還有位置信息和說明信息，這兩個也是新屬性，主要用于對故障域做標注使用，便于排錯或者查找，可以看到，從城市級別，到數(shù)據(jù)中心大廈級別，到屋子級別，機架級別，甚至定義到機架上面機箱的位置。您也可以在站點Location的位置輸入城市+數(shù)據(jù)中心信息，Location和description信息也可以后期Set去改，這里有很多種玩法，大家可以自己去發(fā)掘，關鍵是準確，有意義，明了即可。

#獲取單一故障域拓撲

WSFC2016 故障域站點感知

#獲取某一級別故障域拓撲

WSFC2016 故障域站點感知

#刪除故障域

如果要刪除一個故障域，要求下面沒有子資源，例如我們要刪除Chassis 01，但是下面有HV01節(jié)點，我們就需要先移除HV01出去

#移除要被刪除故障域下面資源

Set-ClusterFaultDomain -Name "HV01" -Parent ""

WSFC2016 故障域站點感知

#刪除故障域

WSFC2016 故障域站點感知

除了可以使用Poweshell配置群集故障域，還可以導出xml進行配置，編輯完成后再導入xml

#導出故障域架構xml

Get-ClusterFaultDomain | Out-File <Path>

WSFC2016 故障域站點感知

使用工具完成XML后，需要使用以下命令再把XML上傳回去生效

$xml = Get-Content <Path> | Out-String

Set-ClusterFaultDomainXML -XML $xml

以上，老王簡單為大家介紹了下WSFC2016中新增的故障域功能，以及配置辦法，但是到目前為止我們只是邏輯創(chuàng)建出了故障域，可以看到，可以和物理對應，但是有沒有生效呢，還沒有，因為故障域的生效，取決于云管理平臺，或WSFC能感應到什么程度

在常規(guī)設計中，故障域通常是在云平臺管理系統(tǒng)中定義的，故障域會運作在云基礎架構的整體架構上，而WSFC則是反其道而行之，在群集的級別上面定義Site，Rack，Chassis，這樣不論是Site，Rack，Chassis都需要在群集的框架內運行，這也是微軟的架構和其它廠商不同之處。

其中老王認為，對于故障域站點感知，WSFC做的還算不錯，我們定義了站點故障域，把節(jié)點放入站點故障域下面后能夠實現(xiàn)

站點感知：設置好了站點后，我們可以讓群集節(jié)點每次故障轉移或維護模式，都先在站點內進行角色轉移，如果本站點無正常節(jié)點可轉移，再轉移至其它站點，在以前的版本中是沒有這項技術的，以前版本中如果我們希望實現(xiàn)類似的需求，是通過設置應用的首選所有者來實現(xiàn)，2016則把站點感知帶到群集中

存儲站點感知：群集中的虛擬機，將會follow同站點內的CSV，假設CSV遷移到其它站點，一分鐘后，虛擬機發(fā)現(xiàn)，CSV遷移到其它站點，那么虛擬機也會實時遷移過去，配置站點感知后，會確認首選站點始終直接訪問存儲，如果存儲移動，則虛擬機也跟隨移動。

群集組站點感知：我們也可以配置應用的站點感知，例如設置SQL實例1的首選站點為beijing，SQL實例2的首選站點為shanghai，這樣可以實現(xiàn)一種多主運行應用的場景，讓SQL1故障轉移首先在beijing站點內，SQL2故障轉移首先在shanghai站點內。

首選站點：配置了站點感知之后，我們首先要選擇出首選站點，首選站點可以確保，當群集出現(xiàn)50/50投票時，動態(tài)仲裁始終去掉非首選站點的投票，讓首選站點運作，沒錯，這替代LowerQuorumPriorityNodeID，在群集冷啟動時，虛擬機也會優(yōu)先在首選站點啟動

它們的優(yōu)先級順序如下

存儲站點感知>群集組站點感知>首選站點感知

除了這些信息外，站點感知功能隨之增加了新的跨站點心跳檢測機制，我們將在下一篇博客中進行介紹

OK，下面開始實驗驗證

清空所有故障域配置

WSFC2016 故障域站點感知

實驗環(huán)境

WSFC2016 故障域站點感知

WSFC2016 故障域站點感知

WSFC2016 故障域站點感知

群集當前基于CSV跑了一臺虛擬機，兩個dtc，都運作在北京站點HV01

WSFC2016 故障域站點感知

故障域配置如下

WSFC2016 故障域站點感知

WSFC2016 故障域站點感知

實現(xiàn)驗證站點感知，在未配置首選所有者情況下，三個群集應用運作于HV01，歸屬于同一站點故障域beijing

手動停止節(jié)點HV01群集服務，應用自動首先遷移至同站點內HV02

WSFC2016 故障域站點感知

WSFC2016 故障域站點感知

打開clusterlog查看

WSFC2016 故障域站點感知

WSFC2016 故障域站點感知

WSFC2016 故障域站點感知

這里我們雖然成功了，但是也有一定幾率的情況下，我們達不到這樣的效果，在2016中，當我們構建了站點故障域后，群集再次進行故障轉移時，傳統(tǒng)群集角色會直接在本站點內向嘗試進行故障轉移，而基于CSV的虛擬機則并不一定，原因是CSV是可以漂移的，可能現(xiàn)在CSV主控制點在HV04，但是虛擬機在HV01，這也是可以跑的

如果CSV的主控節(jié)點和虛擬機就在同一個節(jié)點，那么當節(jié)點宕機時，有可能CSV會去其它站點，假設CSV去了其它站點的節(jié)點，那么虛擬機也會跟著follow過去

如果CSV的主控節(jié)點和HV01不在一個Site，那么當HV01故障轉移時，虛擬機會follow CSV所在的site，CSV在哪，虛擬機就去哪，確保虛擬機可以獲得最好的性能，而忽略站點內感知的功能，因此存儲感知的優(yōu)先級也最高

如果虛擬機當前是開機狀態(tài)，則每個一分鐘會檢測，我和CSV是否在同一個Site，如果不在同一個Site，我要實時遷移過去，如果虛擬機時關機狀態(tài)則不會檢測，但是故障轉移或維護時，會先去找CSV所在站點，在群集日志中可以看到

WSFC2016 故障域站點感知

接下來就要進入另外的一項技術，即首選站點功能，首選站點配置級別，可以是在群集級別，存儲級別，群集組級別，這里我們首先要配置的就是存儲級別，我們手動來規(guī)定確保CSV和站點的粘性，例如CSV01 始終follow 北京站點，CSV02始終follow上海站點

這樣北京站點的虛擬機始終就找北京站點的CSV01，CSV01也始終會在北京站點，虛擬機故障轉移或維護也始終會先在北京站點，因為CSV已經(jīng)被固定，如果CSV出現(xiàn)維護操作或失敗操作也可以第一時間回到北京站點，配置在同一個站點的CSV會在節(jié)點內執(zhí)行負載分布

#獲取CSV的群集組名稱

Get-ClusterSharedVolume | Get-ClusterGroup

WSFC2016 故障域站點感知

CSV也是群集組 Really？ WSFC2016 故障域站點感知

#基于獲取到的CSV群集組名稱，配置到首選站點

（Get-ClusterGroup -name CSVClusterGroupName）.PreferredSite =“beijing”

WSFC2016 故障域站點感知

OK，現(xiàn)在我們就可以放心了，虛擬機會始終follow CSV，CSV也始終follow 本地站點，這樣確保了虛擬機發(fā)生故障，在本地站點有可用節(jié)點，一定會先遷移到本地站點。

下面我們再配置群集級別的首選站點，配置群集級別首選站點的目的無非是發(fā)生50 50分時讓群集始終確保首選站點可以獲勝。

#查看群集當前節(jié)點投票與見證投票

WSFC2016 故障域站點感知

直接禁用仲裁磁盤，模擬群集仲裁失效，50 50分成情況下，動態(tài)仲裁自動選擇一個節(jié)點去掉投票數(shù)

WSFC2016 故障域站點感知

可以看到默認情況下，群集自動去掉了上海站點的投票

WSFC2016 故障域站點感知

我們如果手動指定首選站點，例如，我們手動指定上海為首選站點，那么當下次再發(fā)生五五分成的時候，動態(tài)仲裁將始終去掉北京站點節(jié)點的投票

WSFC2016 故障域站點感知

ClusterLog

存儲見證在的時候完整投票數(shù)

WSFC2016 故障域站點感知

見證失效的臨時投票數(shù)，隨后立刻會被動態(tài)仲裁隨機去掉投票

WSFC2016 故障域站點感知

默認下動態(tài)仲裁去掉HV03投票

WSFC2016 故障域站點感知

手動修改后去掉HV01投票

WSFC2016 故障域站點感知

以上為首選站點在群集級別配置后的效果之一，看起來2012R2 LowerQuorumPriorityNodeID并沒太大差別

#配置群集級別首選站點回到北京

(Get-Cluster).PreferredSite = Beijing

WSFC2016 故障域站點感知

看過了存儲級別的站點感知，以及首選站點替代LowerQuorumPriorityNodeID的新功能，最后我們來看下主菜，即應用程序的多主站點感知

在看應用程序多主站點感知，老王還是想為大家看下群集級別站點感知的效果，當前我們已經(jīng)配置了存儲站點感知，因此可以發(fā)揮出完整的效果

時間節(jié)點1

所有應用和虛擬機運行于北京站點HV01

WSFC2016 故障域站點感知

手動停止HV01群集服務，CSV遷移同站點其它節(jié)點，所有角色遷移同站點內其它節(jié)點

WSFC2016 故障域站點感知

WSFC2016 故障域站點感知

再次停止HV02群集服務，失去整個Beijing站點，所有應用跨站點故障域遷移到Shanghai

WSFC2016 故障域站點感知

WSFC2016 故障域站點感知

至此就是故障域站點感知的效果了，對于了解故障域概念，但是不了解微軟WSFC的人來說，這可能很炫，應用感知到故障域，并且優(yōu)先在故障域內轉移，同一站點故障域內虛擬機可以獲得存儲最好的性能，如果同級別站點故障域不可用，可以跨故障域轉移至新故障域站點繼續(xù)運行，看起來很不錯，但是內行看門道，其實呢，只不過是包上來一層新的概念，我們通過原來的首選所有者技術也可以實現(xiàn)類似的效果，只不過通過新的方式配置，看起來更加專業(yè)些，便于故障域概念的落地。

相對于站點感知功能，老王更看重的是另一大塊，即首選站點感知，首先站點感知里面包括群集級別，存儲級別，群集組級別，其中老王更看重存儲級別的首選站點感知，可以和站點感知功能融合，確保同站點內虛擬機始終訪問同站點的存儲，讓CSV存儲和虛擬機始終在同一個站點，同站點始終獲取最好的性能，這是以前版本沒有的

梳理下WSFC 2016針對于故障域新增的新功能

1.故障域定義：全新，支持站點感知，SDS感知

2.站點感知：代替首選所有者

3.首選站點感知：替代LowerQuorumPriorityNodeID

4.應用多主首選站點感知：代替首選所有者

5.CSV存儲首選站點感知：存儲follow站點，VMfollow存儲

6.新增跨站點心跳檢測參數(shù)

故障域和站點感知支持WSFC傳統(tǒng)同域部署，工作組部署與同林多域部署

作為微軟本地端產品首次嘗試引入故障域屬性，老王認為微軟做的已經(jīng)還可以，期望未來可以不斷完善，在老王看來，故障域其實可以更上一個級別，例如我們可以在SCVMM的級別定義故障域，從站點，數(shù)據(jù)中心，機架，機箱，群集，Host，這樣從上向下做的話也許會更好，因為現(xiàn)階段從下向上定義，畢竟群集的規(guī)模受限，如果是在VMM級別，則我們不必受限于單個群集的規(guī)模，甚至可以針對站點，或機架，機箱，數(shù)據(jù)中心，配置不同的故障轉移策略，網(wǎng)絡策略，存儲策略，那樣就更好了，希望這項功能能夠得到不斷的完善，越來越多的本地端產品，或群集上層應用可以更好的和故障域協(xié)同。

最后，應用多主首選站點感知，我們可以配置在群集組的級別，配置不同的群集組選擇不同的首選站點，這樣不同的群集組就都會在各自的首選站點中先執(zhí)行故障轉移，如果首選站點無可用節(jié)點，再轉移至其它站點，這樣在一定程度上，可以減少跨站點轉移的成本，確保每個站點的資源都得到合理的利用，不會本站點還有節(jié)點就轉移到跨站點，一定程度上可以減少宕機時間，提高應用運行的時間。

#配置多主站點感知

對于devtestdtc首選站點為beijing

對于MikeWang首選站點為beijing

(Get-ClusterGroup -Name devtestdtc).PreferredSite = Beijing

(Get-ClusterGroup -Name MikeWang).PreferredSite = Beijing

WSFC2016 故障域站點感知

對于devtest1dtc首選站點為shanghai

(Get-ClusterGroup -Name devtestdtc1).PreferredSite = Shanghai

WSFC2016 故障域站點感知

當前devtestdtc Mikewang在HV01運行，devtestdtc1在HV04運行

WSFC2016 故障域站點感知

停機HV01，devtestdtc Mikewang轉移至北京同站點HV02

WSFC2016 故障域站點感知

停機HV04，devtestdtc轉移至上海同站點HV03

WSFC2016 故障域站點感知

針對于站點感知或應用多主首選站點感知，建議配置應用的故障回復屬性，這樣當檢測到首選站點，或本地站點可用時，會回到原來站點運行

WSFC2016 故障域站點感知

向AI問一下細節(jié)

推薦閱讀：

免責聲明：本站發(fā)布的內容（圖片、視頻和文字）以原創(chuàng)、轉載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權請聯(lián)系站長郵箱：is@yisu.com進行舉報，并提供相關證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
MonkenRunner通過HierarchyViewer定位控件的方法和建議(Appium/UIAutomator/Robotium姊妹篇)
下一篇新聞：
PHP二維關聯(lián)數(shù)組的遍歷方式

猜你喜歡

AI
助
手

產品服務

地區(qū)劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網(wǎng)站二維碼

<strike id="vgpub"></strike>