溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

如何進(jìn)行vsan的容量設(shè)備故障和緩存設(shè)備故障分析

發(fā)布時(shí)間:2021-12-30 11:39:24 來(lái)源:億速云 閱讀:156 作者:柒染 欄目:云計(jì)算

如何進(jìn)行vsan的容量設(shè)備故障和緩存設(shè)備故障分析,很多新手對(duì)此不是很清楚,為了幫助大家解決這個(gè)難題,下面小編將為大家詳細(xì)講解,有這方面需求的人可以來(lái)學(xué)習(xí)下,希望你能有所收獲。

容量設(shè)備故障解析:
磁盤(pán)故障可能是任何存儲(chǔ)環(huán)境中最常見(jiàn)的故障了,vsan也不例外。磁盤(pán)組是vSAN的管理結(jié)構(gòu),其中包括一個(gè)緩存設(shè)備和一個(gè)或多個(gè)容量設(shè)備,其容量設(shè)備的磁盤(pán)多為SATA盤(pán)。一臺(tái)主機(jī)可以為VSAN提供最多 5 個(gè)磁盤(pán)組:每個(gè)磁盤(pán)組需要 1 個(gè) SDD 以及最少 1 個(gè)、最多 6 個(gè)HDD。每個(gè)主機(jī)的最多 HDD 數(shù)為 5 x 6 = 30。每個(gè)主機(jī)的最多 SSD 數(shù)為 5 x 1 = 5。
在日常運(yùn)維中,一般采用精簡(jiǎn)配置,虛擬機(jī)的虛擬磁盤(pán)僅占用實(shí)際數(shù)據(jù)的使用空間,大量地節(jié)省了成本。但是,在無(wú)人監(jiān)控、空間快速增長(zhǎng)的情況下,可能會(huì)發(fā)生存儲(chǔ)空間超額分配,引發(fā)業(yè)務(wù)應(yīng)用性能下降,甚至無(wú)法工作。

那么VSAN如何處理容量磁盤(pán)故障呢?如果故障發(fā)生時(shí),正好在磁盤(pán)上有一個(gè)讀或?qū)懙牟僮鲿?huì)發(fā)生什么呢?下面解析下vsan的容量設(shè)備故障。
如何進(jìn)行vsan的容量設(shè)備故障和緩存設(shè)備故障分析
如圖,比如exsi-03上的一個(gè)容量存儲(chǔ)組件返回一個(gè)讀錯(cuò)誤,那么VSAN就會(huì)去檢查是否存在副本組件,如果有則從那個(gè)副本上讀取。默認(rèn)情況下,每個(gè)對(duì)象被創(chuàng)建時(shí)都配置成FTT為1,這意味著每個(gè)對(duì)象總有2個(gè)完全一樣的副本組件可用。故障發(fā)生在讀取時(shí),有2種不同的情況,第一種情況可以修復(fù),第二種情況則無(wú)法修復(fù)。當(dāng)問(wèn)題是可以修復(fù)的時(shí)候,I/O錯(cuò)誤會(huì)被匯報(bào)給對(duì)象的屬主,對(duì)象的屬主則會(huì)發(fā)起組件重構(gòu)。當(dāng)組件重構(gòu)完成時(shí),故障組件會(huì)被刪除。然而,如果因?yàn)槟撤N原因,沒(méi)有副本組件存在時(shí),VSAN就會(huì)報(bào)告這個(gè)虛擬機(jī)出現(xiàn)了I/O錯(cuò)誤。
如果是返回一個(gè)寫(xiě)錯(cuò)誤,也會(huì)傳送到對(duì)象屬主,組件會(huì)被標(biāo)注為“已降級(jí)”并會(huì)在VSAN群集中另外的磁盤(pán)上觸發(fā)組件重構(gòu)。當(dāng)組件重構(gòu)完成時(shí),群集目錄會(huì)被更新。注意,閃存設(shè)備(它沒(méi)有出錯(cuò))會(huì)繼續(xù)用緩存來(lái)提供讀取服務(wù)。
最初的vsan版本中,在某一個(gè)組件或多個(gè)組件因故障而處以重建過(guò)程中時(shí),vsphere web客戶(hù)端并沒(méi)有顯示有多少數(shù)據(jù)需要同步。但從vsan6.0起,vsphere web客戶(hù)端提供了在故障發(fā)生時(shí)監(jiān)控?cái)?shù)據(jù)同步狀況的功能,比如它會(huì)顯示正在重新同步的組件數(shù)量、重新同步的剩余字節(jié)數(shù)以及完成重新同步所需要的時(shí)間。
注:當(dāng)磁盤(pán)容量全滿(mǎn)時(shí),vSAN會(huì)暫停寫(xiě)數(shù)據(jù)并為寫(xiě)請(qǐng)求申請(qǐng)新的磁盤(pán)空間,如果未及時(shí)添加新的磁盤(pán),則vsan寫(xiě)操作會(huì)出現(xiàn)錯(cuò)誤,引發(fā)虛擬機(jī)I/O錯(cuò)誤。

緩存設(shè)備故障解析:
如果緩存設(shè)備SSD不可訪(fǎng)問(wèn)會(huì)發(fā)生什么情況?當(dāng)緩存設(shè)備不可訪(fǎng)問(wèn)時(shí),同一個(gè)磁盤(pán)組中那個(gè)緩存設(shè)備支持的所有容量設(shè)備都會(huì)無(wú)法被訪(fǎng)問(wèn)。緩存設(shè)備故障等同于緩存設(shè)備背后的所有容量設(shè)備故障。從本質(zhì)上說(shuō),當(dāng)一個(gè)緩存設(shè)備故障時(shí),整個(gè)磁盤(pán)組被認(rèn)為是“已降級(jí)的”。如果VSAN群集中有多余的容量,它就會(huì)試圖在另一臺(tái)主機(jī)或磁盤(pán)上重新配置存儲(chǔ)對(duì)象。因此,從架構(gòu)決策角度看,根據(jù)使用的主機(jī)類(lèi)型不同,創(chuàng)建多個(gè)小的磁盤(pán)組可能會(huì)比單個(gè)大磁盤(pán)組好,因?yàn)橐粋€(gè)磁盤(pán)組可以被視為一個(gè)故障域。
注:VSAN采用電梯算法周期性地將緩存層內(nèi)寫(xiě)緩存中的數(shù)據(jù)按照地址順序“沖刷”進(jìn)磁盤(pán)中,這是一個(gè)能進(jìn)行自我調(diào)整的算法,它決定了SSD回寫(xiě)到磁盤(pán)的頻率。當(dāng)exsi-01虛擬機(jī)中的應(yīng)用程序發(fā)起一個(gè)寫(xiě)操作時(shí),對(duì)象屬主會(huì)克隆這個(gè)寫(xiě)操作。并發(fā)的寫(xiě)請(qǐng)求通過(guò)萬(wàn)兆網(wǎng)絡(luò)發(fā)往exsi-02和exsi-03上的寫(xiě)緩存,當(dāng)數(shù)據(jù)寫(xiě)入緩存時(shí),寫(xiě)就被確認(rèn)了,此時(shí)SSD上的準(zhǔn)備操作就完成了。屬主等待所有2臺(tái)主機(jī)的ACK信號(hào)后完成I/O。稍后這個(gè)寫(xiě)入會(huì)作為批量處理的一部分最終回寫(xiě)到磁盤(pán)上。各主機(jī)的回寫(xiě)操作都是相互獨(dú)立的,也就是說(shuō),exsi-02和exsi-03上的回寫(xiě)操作時(shí)間可能是不同的。這是因?yàn)椴煌鳈C(jī)的情況不同,比如緩存空間填滿(mǎn)的速度、剩余空間的大小以及數(shù)據(jù)將存放在磁盤(pán)的什么地方都可能是不同的。

補(bǔ)充:
容量大小設(shè)置準(zhǔn)則
1、至少留有 30% 的未使用空間,以防止 vSAN 重新平衡存儲(chǔ)負(fù)載。只要單個(gè)容量設(shè)備上的消耗達(dá)到 80% 或以上,vSAN 就會(huì)重新平衡群集中的組件。重新平衡操作可能會(huì)影響應(yīng)用程序的性能。要避免這些問(wèn)題,存儲(chǔ)消耗應(yīng)低于 70%。

2、規(guī)劃額外容量,用于處理潛在故障或替換容量設(shè)備、磁盤(pán)組和主機(jī)。當(dāng)某個(gè)容量設(shè)備無(wú)法訪(fǎng)問(wèn)時(shí),vSAN 會(huì)在群集中的其他設(shè)備中恢復(fù)組件。當(dāng)閃存緩存設(shè)備出現(xiàn)故障或移除時(shí),vSAN 會(huì)從整個(gè)磁盤(pán)組中恢復(fù)組件。

3、預(yù)留額外容量以確保 vSAN 在出現(xiàn)主機(jī)故障或主機(jī)進(jìn)入維護(hù)模式時(shí)恢復(fù)組件。例如,置備具有足夠容量的主機(jī),以便留有足夠的可用容量供可在主機(jī)出現(xiàn)故障或維護(hù)期間成功進(jìn)行重新構(gòu)建組件。存在三個(gè)以上的主機(jī)時(shí)這非常重要,這樣您才有足夠的可用容量來(lái)重新構(gòu)建故障的組件。如果主機(jī)出現(xiàn)故障,將在其他主機(jī)的可用存儲(chǔ)上進(jìn)行重新構(gòu)建,這樣可以允許再次出現(xiàn)故障。但是,在三主機(jī)群集中,如果將允許的故障數(shù)主要級(jí)別設(shè)置為 1,則 vSAN 不會(huì)執(zhí)行重新構(gòu)建操作,因?yàn)樵谝粋€(gè)主機(jī)出現(xiàn)故障后,群集中只剩下兩個(gè)主機(jī)。要允許故障后重新構(gòu)建,至少必須有三個(gè)主機(jī)。

4、提供足夠的臨時(shí)存儲(chǔ)空間,以便在 vSAN 虛擬機(jī)存儲(chǔ)策略中進(jìn)行更改。動(dòng)態(tài)更改虛擬機(jī)存儲(chǔ)策略時(shí),vSAN 可能會(huì)為組成對(duì)象的副本創(chuàng)建一個(gè)布局。當(dāng) vSAN 實(shí)例化這些副本并將其與原始副本進(jìn)行同步時(shí),群集必須臨時(shí)提供額外空間。

5、如果規(guī)劃使用軟件校驗(yàn)和或去重和壓縮等高級(jí)功能,請(qǐng)保留額外的空間以處理操作開(kāi)銷(xiāo)。

問(wèn)題補(bǔ)充:
SSD 擁堵問(wèn)題引發(fā)VSAN夯住。這時(shí)特定磁盤(pán)組的寫(xiě)入 IO 的活動(dòng)工作集顯著大于該磁盤(pán)組緩存層的大小時(shí),通常會(huì)引發(fā) SSD 擁堵,繼而引發(fā)VSAN群集夯住。在混合和全閃存 vSAN 群集中,數(shù)據(jù)首先寫(xiě)入到寫(xiě)入緩存(也稱(chēng)為寫(xiě)入緩沖區(qū))。一個(gè)稱(chēng)為降級(jí)轉(zhuǎn)儲(chǔ)的進(jìn)程會(huì)將數(shù)據(jù)從寫(xiě)入緩沖區(qū)移至容量磁盤(pán)。寫(xiě)入緩存承受較高的寫(xiě)入速率,從而確保寫(xiě)入性能不受容量磁盤(pán)的限制。不過(guò),如果以非常快的速率填充寫(xiě)入緩存,降級(jí)轉(zhuǎn)儲(chǔ)進(jìn)程可能跟不上到達(dá) IO 的速率。在這種情況下,會(huì)引發(fā) SSD 擁堵,需要指示 vSAN DOM 客戶(hù)端層將 IO 減速到 vSAN 磁盤(pán)組可以處理的速率。

補(bǔ)救措施:要避免 SSD 擁堵,請(qǐng)調(diào)整所用的虛擬機(jī)磁盤(pán)的大小。為達(dá)到最佳效果,我們建議虛擬機(jī)磁盤(pán)(活動(dòng)工作集)的大小不超過(guò)所有磁盤(pán)組寫(xiě)入緩存累計(jì)大小的 40%。請(qǐng)注意,對(duì)于混合 vSAN 群集,寫(xiě)入緩存的大小為緩存層磁盤(pán)大小的 30%。在全閃存群集中,寫(xiě)入緩存的大小是緩存層磁盤(pán)的大小,但不應(yīng)超過(guò) 600 GB。如果超限大量寫(xiě)入,容易引起VSAN群集夯住,容量層磁盤(pán)也將會(huì)無(wú)法被訪(fǎng)問(wèn)。

看完上述內(nèi)容是否對(duì)您有幫助呢?如果還想對(duì)相關(guān)知識(shí)有進(jìn)一步的了解或閱讀更多相關(guān)文章,請(qǐng)關(guān)注億速云行業(yè)資訊頻道,感謝您對(duì)億速云的支持。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI