溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

服務(wù)器硬盤掉了兩塊的解決過程

發(fā)布時間:2020-08-07 11:03:42 來源:ITPUB博客 閱讀:241 作者:北亞數(shù)據(jù)恢復(fù) 欄目:服務(wù)器

一.服務(wù)器數(shù)據(jù)恢復(fù)故障描述

需要進(jìn)行數(shù)據(jù)恢復(fù)的服務(wù)器共10個磁盤柜,每個磁盤柜滿配24塊硬盤。其9個存儲柜用作數(shù)據(jù)存儲使用,另外1個存儲柜用作元數(shù)據(jù)存儲使用。元數(shù)據(jù)存儲里一共24塊146G硬盤,其中設(shè)置了9組RAID 1陣列,1組4盤位RAID 10陣列,4個熱備硬盤。
數(shù)據(jù)存儲中,每6塊硬盤設(shè)置一組RAID 5陣列,共36組RAID,這36組RAID陣列中,又分為2個存儲系統(tǒng)。其中1個存儲系統(tǒng)中,一組RAID由于2塊硬盤先后故障離線,導(dǎo)致RAID陣列失效,整個存儲系統(tǒng)癱瘓,無法使用。
存儲及文件系統(tǒng)架構(gòu)大致如下圖一:
服務(wù)器硬盤掉了兩塊的解決過程

注:Meta_LUN(元數(shù)據(jù)卷)    Data_LUN(用戶數(shù)據(jù)卷)

二.磁盤備份

為避免服務(wù)器數(shù)據(jù)恢復(fù)過程中由于誤操作對原始磁盤造成二次破壞, 先使用WinHex軟件對客戶的存儲環(huán)境進(jìn)行備份。
備份過程如下圖二所示:
服務(wù)器硬盤掉了兩塊的解決過程

對故障RAID中的6塊成員盤進(jìn)行編號標(biāo)記,將硬盤從存儲柜中拔出,接入到準(zhǔn)備好的備份平臺上,對6塊硬盤進(jìn)行備份。
對其余沒有出現(xiàn)故障的RAID陣列,進(jìn)行存儲層面的備份。使用光纖線纜將備份平臺和存儲設(shè)備連接,進(jìn)入昆騰存儲設(shè)備管理界面配置備份平臺和存儲設(shè)備可以正常通信,使用WinHex軟件對RAID中的LUN進(jìn)行鏡像備份。
在備份過程中發(fā)現(xiàn)故障RAID中的1塊故障硬盤存在大量的壞道區(qū)域,在備份的過程出現(xiàn)故障,無法繼續(xù)備份。對故障硬盤進(jìn)行開盤更換固件,并使用PC3000工具進(jìn)行修復(fù)后,硬盤可以繼續(xù)備份,但壞道仍然存在。圖三:

服務(wù)器硬盤掉了兩塊的解決過程

部分鏡像文件

三.數(shù)據(jù)分析

先對故障的RAID陣列進(jìn)行分析,獲取到相關(guān)的RAID信息,使用WinHex軟件對RAID陣列進(jìn)行虛擬重組,并將RAID中的LUN恢復(fù)成鏡像文件。在分析過程中發(fā)現(xiàn),損壞較嚴(yán)重的硬盤為后離線硬盤,由于此硬盤存在大量壞道,可能對恢復(fù)結(jié)果產(chǎn)生影響。
登陸昆騰存儲設(shè)備的管理界面,獲取到StorNext文件系統(tǒng)中卷相關(guān)的一些基本信息,如下圖四:

服務(wù)器硬盤掉了兩塊的解決過程

繼續(xù)對StorNext文件系統(tǒng)中的Meta卷和Data卷進(jìn)行分析,客戶的StorNext文件系統(tǒng)中,包含2個Data卷,完整的Data卷都是由多組RAID中的LUN組成的,對這些LUN進(jìn)行分析,得到LUN之間組合的算法規(guī)律,虛擬重組出完整的Data卷。
圖五:

服務(wù)器硬盤掉了兩塊的解決過程

分析Meta卷,對Meta卷中的節(jié)點信息和目錄項信息,以及Meta卷和Data之間的對應(yīng)關(guān)系進(jìn)行分析,針對一個Meta卷管理多個Data卷的情況,研究得到Meta卷到Data卷的索引算法。文件節(jié)點如下圖六:

服務(wù)器硬盤掉了兩塊的解決過程

目錄塊如下圖七:

服務(wù)器硬盤掉了兩塊的解決過程

四.數(shù)據(jù)恢復(fù)

通過分析研究我們已經(jīng)獲取到了恢復(fù)工作所需信息,開始編寫程序,掃描Meta卷中的節(jié)點信息和目錄項信息,同時對目錄項和節(jié)點進(jìn)行解析,獲取完整的文件系統(tǒng)目錄結(jié)構(gòu),解析節(jié)點中的指針信息,將這些信息記錄在數(shù)據(jù)庫中。
文件信息如下圖八:

服務(wù)器硬盤掉了兩塊的解決過程

編寫文件提取程序,讀取數(shù)據(jù)庫,根據(jù)解析出的信息以及兩個Data卷之間的聚合算法對數(shù)據(jù)進(jìn)行提取。

五.恢復(fù)結(jié)果

對生成出的數(shù)據(jù)進(jìn)行隨機(jī)抽樣檢測,數(shù)據(jù)沒有問題。將客戶所需文件提取到本地,確認(rèn)提取完成后,到客戶線程進(jìn)行數(shù)據(jù)移交。數(shù)據(jù)移交完成,客戶對數(shù)據(jù)恢復(fù)結(jié)果表示滿意。雖然故障硬盤存在有壞道的情況,但萬幸主要數(shù)據(jù)沒有遭到破壞,數(shù)據(jù)恢復(fù)工作圓滿完成。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI