您好,登錄后才能下訂單哦!
任何一項(xiàng)IT系統(tǒng)都需要備份恢復(fù)的機(jī)制,WSFC也不例外,對于WSFC,我們主要需要關(guān)注三塊內(nèi)容
群集CNO VCO的備份恢復(fù)
群集數(shù)據(jù)磁盤,CSV內(nèi)容的備份恢復(fù)
群集數(shù)據(jù)庫的備份恢復(fù)
群集 CNO VCO的備份恢復(fù),其實(shí)就是活動目錄數(shù)據(jù)的備份恢復(fù)了,正常情況下,2008R2之后開啟活動目錄回收站功能,即便計(jì)算機(jī)誤刪除,也可以恢復(fù)出來,之后再在群集管理器修復(fù)名稱即可,這在前面文章已經(jīng)講過,2012開始可以直接通過AD管理中心恢復(fù)。且我們可以通過防刪,備份等方案規(guī)避,CNO,VCO一旦誤刪,會導(dǎo)致群集無法訪問,無法進(jìn)行群集身份驗(yàn)證
群集數(shù)據(jù)磁盤,CSV內(nèi)容,這點(diǎn)我們可以通過DPM,或是其它工具,例如,我們?nèi)绻谌杭疌SV上面跑了很多虛擬機(jī),那么是需要定期對群集上面的虛擬機(jī)做備份的,這時候如果備份工具支援,我們可以從CSV級別去備份上面所有的虛擬機(jī)內(nèi)容,防止群集共享數(shù)據(jù)丟失
群集數(shù)據(jù)庫的備份恢復(fù),我們今天主要將涉及這個方面,之前,我們說過,群集數(shù)據(jù)庫是群集配置運(yùn)行的核心,它儲存著WSFC群集所有的配置情況,會實(shí)時的在各個節(jié)點(diǎn)之間及見證磁盤同步,一旦發(fā)生故障轉(zhuǎn)移,節(jié)點(diǎn)會參照群集數(shù)據(jù)庫進(jìn)行故障回復(fù)
群集數(shù)據(jù)庫儲存在節(jié)點(diǎn)注冊表及見證磁盤,我們備份時,使用windows server backup,DPM備份系統(tǒng)狀態(tài),即可備份群集數(shù)據(jù)庫,群集數(shù)據(jù)庫儲存在系統(tǒng)狀態(tài)中。
群集數(shù)據(jù)庫的備份恢復(fù)主要分為兩種,一種是授權(quán)模式恢復(fù),一種是非授權(quán)模式恢復(fù),很有意思,有點(diǎn)像AD的數(shù)據(jù)庫恢復(fù)一樣
授權(quán)模式恢復(fù)
什么場景下會使用到授權(quán)模式恢復(fù),例如,之前群集運(yùn)行最正常的情況下,你執(zhí)行了一次備份,忽然有一天因?yàn)椴恍⌒牟僮鳎獕牧艘恍┤杭渲?,整個群集開始不正常工作,這時候,您可以使用授權(quán)恢復(fù),選擇與一個節(jié)點(diǎn)進(jìn)行恢復(fù),在該節(jié)點(diǎn)上執(zhí)行授權(quán)恢復(fù),首先停止群集服務(wù),恢復(fù)群集數(shù)據(jù)庫配置,再啟動群集節(jié)點(diǎn),請注意,實(shí)質(zhì)上這里,執(zhí)行授權(quán)恢復(fù)的時候,所有群集節(jié)點(diǎn)的群集服務(wù)都會被停止!授權(quán)恢復(fù)后只要被恢復(fù)節(jié)點(diǎn)會優(yōu)先啟動,因?yàn)槭跈?quán)恢復(fù),要把群集數(shù)據(jù)庫配置回滾到之前的paxos標(biāo)記,回滾之后需要將被授權(quán)恢復(fù)節(jié)點(diǎn)的群集數(shù)據(jù)庫提升為黃金副本,之后,再手動啟動其它群集節(jié)點(diǎn)的群集服務(wù),其它群集節(jié)點(diǎn)會從擁有黃金副本的節(jié)點(diǎn)同步群集數(shù)據(jù)庫配置,群集恢復(fù)正常。
可以看到,授權(quán)模式恢復(fù)的關(guān)鍵點(diǎn)在于
1.機(jī)器可以不關(guān)機(jī)在線恢復(fù) ,恢復(fù)后不需要重啟
2.WSFC和Windows Server backup感知,執(zhí)行群集授權(quán)模式恢復(fù)
基本上授權(quán)模式恢復(fù)的場景很明確,回滾群集配置,并提升回滾節(jié)點(diǎn)群集數(shù)據(jù)庫為黃金副本。
這里需要注意的一點(diǎn)是,由于群集數(shù)據(jù)庫的paxos標(biāo)記會實(shí)時變化,因此,執(zhí)行群集數(shù)據(jù)庫授權(quán)恢復(fù)時,一定一定不要一起啟動所有群集節(jié)點(diǎn)的群集服務(wù),一旦你不小心在其它節(jié)點(diǎn)改了配置,這次群集授權(quán)恢復(fù)就失敗了,因?yàn)楸恍薷墓?jié)點(diǎn)的paxos標(biāo)記為最新,恢復(fù)節(jié)點(diǎn)還是會去和它同步群集數(shù)據(jù)庫
非授權(quán)恢復(fù)呢
相信大家已經(jīng)猜到了,非授權(quán)恢復(fù),和授權(quán)恢復(fù)類似,但是并不會有提升群集節(jié)點(diǎn)數(shù)據(jù)庫為黃金副本這個過程
非授權(quán)恢復(fù)和授權(quán)恢復(fù)最大的不同是非授權(quán)恢復(fù)需要重啟機(jī)器來完成,且恢復(fù)時間會較長
實(shí)質(zhì)上當(dāng)我們執(zhí)行非授權(quán)恢復(fù)時,是相當(dāng)于對于節(jié)點(diǎn)執(zhí)行一個完整的裸機(jī)恢復(fù)
非授權(quán)恢復(fù),老王認(rèn)為主要適用于以下兩種場景
單個群集節(jié)點(diǎn)出現(xiàn)問題,經(jīng)常藍(lán)屏崩潰,不穩(wěn)定,現(xiàn)在不想繼續(xù)用了,希望重裝,這時候可以直接格式化節(jié)點(diǎn),插入系統(tǒng)光盤,裸機(jī)恢復(fù)節(jié)點(diǎn),裸機(jī)恢復(fù)后,群集節(jié)點(diǎn)數(shù)據(jù)庫paxos標(biāo)記為舊的標(biāo)記,并不會提升為黃金副本,被非授權(quán)恢復(fù)的單個節(jié)點(diǎn),會和其它擁有最新paxos標(biāo)記的群集節(jié)點(diǎn)同步數(shù)據(jù)庫。
整個群集出現(xiàn)問題,群集出現(xiàn)問題,任何一個節(jié)點(diǎn)都不能用了,但之前有裸機(jī)備份,這時候可以直接新裝一臺機(jī)器,插入系統(tǒng)光盤,裸機(jī)恢復(fù)到該節(jié)點(diǎn),讓群集先單點(diǎn)復(fù)活,之后等待有資源準(zhǔn)備就緒后再加入到群集。
總結(jié)一下
授權(quán)恢復(fù)主要是用于恢復(fù)群集配置,并同步到其它所有節(jié)點(diǎn)
非授權(quán)恢復(fù)主要用于恢復(fù)節(jié)點(diǎn)或群集可以正常使用,被恢復(fù)的節(jié)點(diǎn)將會和其它可用節(jié)點(diǎn)同步群集數(shù)據(jù)庫
目前老王來看能夠支持微軟群集數(shù)據(jù)庫授權(quán)恢復(fù)的只有Windows Server backup,DPM,其中主要以Windows Server backup為主,Windows Server backup可以看到群集執(zhí)行授權(quán)恢復(fù)的過程
對于非授權(quán)恢復(fù),無非是裸機(jī)備份,裸機(jī)恢復(fù),maybe除了微軟的Windows Server backup,DPM,一些其它第三方的備份工具也可以使用
另外老王建議,備份群集數(shù)據(jù)庫配置和備份群集數(shù)據(jù)分開執(zhí)行,備份群集數(shù)據(jù)庫就只是備份群集數(shù)據(jù)庫配置,恢復(fù)時候我也只恢復(fù)群集數(shù)據(jù)庫相關(guān)的內(nèi)容,對于群集數(shù)據(jù)磁盤和CSV內(nèi)容,建議單獨(dú)執(zhí)行備份,不要和群集數(shù)據(jù)庫的備份恢復(fù)放在一起。
接下來我們分別實(shí)戰(zhàn)群集數(shù)據(jù)庫授權(quán)恢復(fù)和非授權(quán)恢復(fù)
授權(quán)恢復(fù),場景介紹
DC01&iscsi
lan:10.0.0.2 255.0.0.0
iscsi:30.0.0.2 255.0.0.0
HV01
MGMET:10.0.0.9 255.0.0.0 DNS 10.0.0.2
ISCSI:30.0.0.9 255.0.0.0
CLUS:18.0.0.9 255.0.0.0
HV02
MGMET:10.0.0.10 255.0.0.0 DNS 10.0.0.2
ISCSI:30.0.0.10 255.0.0.0
CLUS:18.0.0.10 255.0.0.0
當(dāng)前群集正常運(yùn)行,群集名稱fscluster,群集文件服務(wù)應(yīng)用fileshare
當(dāng)前群集正常運(yùn)行,我們已經(jīng)執(zhí)行過一次裸機(jī)備份
授權(quán)恢復(fù)操作流程如下
檢索確認(rèn)備份信息
通過wbadmin命令執(zhí)行群集信息恢復(fù)
wbadmin和wsfc整合,停止所有節(jié)點(diǎn)群集服務(wù)
恢復(fù)群集數(shù)據(jù)庫為之前備份
啟動被恢復(fù)節(jié)點(diǎn)群集服務(wù),提升群集數(shù)據(jù)庫為黃金副本
手動啟動其它群集節(jié)點(diǎn)群集服務(wù)
破壞群集,刪除文件服務(wù)器內(nèi)容
1.檢查群集節(jié)點(diǎn)備份記錄
wbadmin get versions
檢查備份詳細(xì)信息
wbadmin get items -version:10/24/2017-02:17
可以看到,雖然我們只是備份了裸機(jī),但是windows server backup,感知到我們有群集,自動幫助我們備份群集,在2003時代只保存在系統(tǒng)狀態(tài),2008時×××始已經(jīng)單獨(dú)獨(dú)立成應(yīng)用程序!
2.在線通過wbadmin執(zhí)行群集數(shù)據(jù)庫授權(quán)恢復(fù)
wbadmin start recovery -itemtype:app -items:cluster -version:10/24/2017-02:17
正如我們所講
準(zhǔn)備好了輸入Y,群集開始執(zhí)行停止群集節(jié)點(diǎn)群集服務(wù) - 恢復(fù)數(shù)據(jù)庫 - 重新啟動恢復(fù)節(jié)點(diǎn)群集服務(wù)
恢復(fù)完成后提示如下
可以看到,備份恢復(fù)過程,首先會停止所有節(jié)點(diǎn)群集服務(wù),之后會先啟動被恢復(fù)節(jié)點(diǎn)的群集服務(wù),以提升為黃金副本
手動啟動HV02節(jié)點(diǎn)群集服務(wù)
群集配置恢復(fù)如初,授權(quán)恢復(fù)完成
查看clusterlog 授權(quán)恢復(fù)過程
開始執(zhí)行群集數(shù)據(jù)庫還原
恢復(fù)paxos標(biāo)記,提升paxos標(biāo)記為黃金副本
群集恢復(fù)過程停止群集所有節(jié)點(diǎn)群集服務(wù),但會稍后會自動啟動被恢復(fù)節(jié)點(diǎn),并提升paxos標(biāo)記為最優(yōu),其它節(jié)點(diǎn)再加入時,必須要求與被恢復(fù)節(jié)點(diǎn)同步群集數(shù)據(jù)庫內(nèi)容,才可以正常加入群集
接下來我們再執(zhí)行非授權(quán)恢復(fù)
環(huán)境同授權(quán)恢復(fù)一樣,這里我們模擬群集完全崩潰,兩個節(jié)點(diǎn)都不能使用,我們新建一個配置完全相同的HV03,之后把群集內(nèi)容恢復(fù)到該節(jié)點(diǎn)
由于我們會通過網(wǎng)絡(luò)進(jìn)行恢復(fù),因此需要HV03這個新節(jié)點(diǎn)可以接入網(wǎng)絡(luò),以訪問備份文件夾,可臨時架設(shè)個DHCP服務(wù)器
當(dāng)前HV01 HV02節(jié)點(diǎn)已關(guān)機(jī),無法再開機(jī)
按照同樣配置新建HV03虛擬機(jī),插入2016光盤,選擇修復(fù)計(jì)算機(jī)
疑難解答
系統(tǒng)映像恢復(fù)
進(jìn)去之后,如果你的新機(jī)器正常加入到了環(huán)境,正常聯(lián)系到DHCP獲取到地址,這里可以通過輸入網(wǎng)絡(luò)路徑,憑據(jù),訪問到備份共享文件夾。
國際慣例,下一步下一步
如采用新硬件服務(wù)器,此處需載入驅(qū)動程序
泡杯茶等著好了
恢復(fù)完成后重啟,進(jìn)入開機(jī)界面
群集節(jié)點(diǎn)網(wǎng)卡已經(jīng)恢復(fù)到HV01的的狀態(tài),一些時候會出現(xiàn)部分網(wǎng)卡未正?;謴?fù),如發(fā)現(xiàn)未正?;謴?fù),重新輸入即可。
存儲得到正常連接,在2008R2時代,如果執(zhí)行非授權(quán)恢復(fù),一些時候會碰見存儲要重新連接的情況,2012,2016這得到了優(yōu)化,大部分情況下存儲狀態(tài)都會保持正常
打開群集管理器發(fā)現(xiàn)群集也已經(jīng)正常恢復(fù),當(dāng)前只有新HV01節(jié)點(diǎn)可用
稍后可以再重做其它節(jié)點(diǎn)添加進(jìn)來
至此我們完成了在群集完全崩潰的情況下,利用已有的裸機(jī)備份重新恢復(fù)起群集。
除了我們這種形式的恢復(fù)
還有一種非授權(quán)恢復(fù)場景
即當(dāng)前節(jié)點(diǎn)存活,那么我就可以在存活節(jié)點(diǎn)上面通過執(zhí)行命令
wbadmin start systemstaterecovery -version:
來恢復(fù)單個崩潰節(jié)點(diǎn),該恢復(fù)過程只是系統(tǒng)狀態(tài)恢復(fù),并不會執(zhí)行數(shù)據(jù)庫副本paxos標(biāo)記提升操作,執(zhí)行完成后重啟,節(jié)點(diǎn)會和其它現(xiàn)有節(jié)點(diǎn)同步最新的群集數(shù)據(jù)庫內(nèi)容。
之所以老王選擇演示群集完全崩潰的場景
是因?yàn)槔贤跤X得這種場景下非授權(quán)恢復(fù)才發(fā)揮出最重要的意義
如果說因?yàn)橐粋€節(jié)點(diǎn)的崩潰,而花力氣去執(zhí)行非授權(quán)恢復(fù),我不如直接新build一個節(jié)點(diǎn)加入群集
對于群集的備份恢復(fù)
老王建議是一體化來做
開啟活動目錄回收站功能,CNO/VCO誤刪后,活動目錄恢復(fù),群集修復(fù),如果群集所有信息都被刪除,應(yīng)最優(yōu)先恢復(fù)CNO/VCO
針對群集節(jié)點(diǎn)執(zhí)行裸機(jī)備份,用于非授權(quán)恢復(fù)崩潰的的節(jié)點(diǎn)/群集,授權(quán)恢復(fù)群集數(shù)據(jù)庫配置。
針對群集數(shù)據(jù)磁盤,CSV,選擇能和群集感知的備份工具進(jìn)行備份恢復(fù),如果群集所有信息都被刪除,應(yīng)先恢復(fù)CNO/VCO,群集數(shù)據(jù)庫配置,最后恢復(fù)群集數(shù)據(jù)磁盤。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。