溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

兩組raid5兩塊盤掉線數(shù)據(jù)恢復(fù)成功案例-有方案

發(fā)布時(shí)間:2020-06-28 17:15:15 來源:網(wǎng)絡(luò) 閱讀:957 作者:宋國建 欄目:建站服務(wù)器

磁盤陣列兩塊硬盤離線數(shù)據(jù)恢復(fù)案例一:

····客戶使用Dell 2850服務(wù)器組建了raid5磁盤陣列,陣列中包含有6塊硬盤(SCSI硬盤,單盤容量300G),服務(wù)器操作系統(tǒng)為linux Redhat4;文件系統(tǒng)為ext3文件系統(tǒng)。在使用過程中服務(wù)器癱瘓,管理員對(duì)陣列檢查后發(fā)現(xiàn)有兩塊硬盤離線,對(duì)其中一塊硬盤進(jìn)行了強(qiáng)制上線操作,但操作系統(tǒng)啟動(dòng)異常。管理員此時(shí)意識(shí)到事情的嚴(yán)重程度,馬上對(duì)服務(wù)器進(jìn)行關(guān)機(jī),然后聯(lián)系到數(shù)據(jù)恢復(fù)中心進(jìn)行數(shù)據(jù)恢復(fù)。
····數(shù)據(jù)恢復(fù)中心初檢結(jié)論:
····在服務(wù)器數(shù)據(jù)恢復(fù)工作中,raid5兩塊硬盤離線的情況十分常見,由于raid5磁盤陣列支持一塊硬盤離線時(shí)的榮譽(yù)保護(hù),一旦多塊硬盤處于離線狀態(tài),服務(wù)器便處于癱瘓狀態(tài),且不會(huì)自動(dòng)上線。由于raid控制器具有一定的面感性,多數(shù)硬盤掉線緊緊是因?yàn)殡娫床▌?dòng)、控制器bug等隨機(jī)原因?qū)е?,所以掉線盤可能沒有嚴(yán)重的物理故障。本案例就是如此。但是此時(shí)管理員進(jìn)行強(qiáng)制上線操作風(fēng)險(xiǎn)性是很大的,一旦上線錯(cuò)誤就會(huì)導(dǎo)致控制器對(duì)數(shù)據(jù)產(chǎn)生一些不可逆的損壞,當(dāng)管理員進(jìn)入操作系統(tǒng)后因?yàn)槲募到y(tǒng)不一致進(jìn)行修復(fù),服務(wù)器中所有硬盤數(shù)據(jù)不一致,數(shù)據(jù)恢復(fù)難度非常大。
····服務(wù)器數(shù)據(jù)恢復(fù)過程:
····首先對(duì)服務(wù)器中所有硬盤進(jìn)行完整備份,在備份過程中發(fā)現(xiàn)多塊硬盤已經(jīng)存在壞道但沒有下線,原因是raid沒有讀到硬盤壞道。備份完成后分析原服務(wù)器的raid組成結(jié)構(gòu)然后虛擬出raid環(huán)境對(duì)raid結(jié)構(gòu)畸形驗(yàn)證,把服務(wù)器后期破壞的結(jié)構(gòu)進(jìn)行人工修正,將修正后的數(shù)據(jù)導(dǎo)出到一臺(tái)中間存儲(chǔ)上臨時(shí)存放。數(shù)據(jù)恢復(fù)的最后一步使用完好的硬盤在服務(wù)器上搭建新的raid5磁盤陣列,將恢復(fù)出的數(shù)據(jù)遷移到新raid中即可。檢驗(yàn)恢復(fù)出來的數(shù)據(jù)一切正常,數(shù)據(jù)成功恢復(fù)。
····服務(wù)器數(shù)據(jù)恢復(fù)結(jié)論:
····一旦raid5磁盤陣列出現(xiàn)多塊硬盤離線、服務(wù)器癱瘓的情況切記不要盲目進(jìn)行強(qiáng)制上線操作,如果有足夠的備用空間,可將源硬盤全部鏡像。有兩種方法(WINDOWS2003或DOS下,其他操作系統(tǒng)有風(fēng)險(xiǎn)):

  1. 可用相同或大于源盤容量的硬盤做為目標(biāo)盤,將源盤全部扇區(qū)方式CLONE到目標(biāo)盤。將所有盤做同樣操作。
    1.可將每塊源盤完全以扇區(qū)方式輸出文件到某大容量存儲(chǔ)空間(如大容量硬盤、NAS、SAN、DAS等)
    ·

    磁盤陣列兩塊硬盤離線數(shù)據(jù)恢復(fù)案例二:

    ····HP LH6000的故障如下: 一塊硬盤紅燈閃亮,機(jī)器還在正常運(yùn)行,但沒有多久,系統(tǒng)就不能正常運(yùn)行,這時(shí)才發(fā)現(xiàn)另一塊硬盤的紅燈也在閃亮。
    ····磁盤陣列數(shù)據(jù)恢復(fù)過程:
    1.啟動(dòng)服務(wù)器,自檢至陣列時(shí)按Ctrl+M進(jìn)入NetRaid管理程序。查看陣列信息,發(fā)現(xiàn)硬盤狀態(tài)為Failed,運(yùn)用修改配置將一硬盤強(qiáng)行設(shè)置成OnLine。重新啟動(dòng)服務(wù)器,在進(jìn)入系統(tǒng)前的硬件自檢時(shí)無效,啟動(dòng)失敗。
    2.啟動(dòng)服務(wù)器,自檢至陣列時(shí)按Ctrl+M進(jìn)入NetRaid管理程序。選擇磁盤陣列,將原來OnLine掛起來的硬盤手工Fail掉,然后再把另一塊Failed的硬盤手工設(shè)置成OnLine,重新啟動(dòng)服務(wù)器就可以進(jìn)入系統(tǒng)了。
    3.查看系統(tǒng)及數(shù)據(jù)庫都運(yùn)行正常后,再進(jìn)陣列配置工具把Failed的硬盤手工設(shè)置成Rebuild,100%完成重建后再重啟服務(wù)器,所有的陣列及系統(tǒng)都恢復(fù)原狀了。

····筆者所在單位另一臺(tái)運(yùn)行ERP系統(tǒng)的服務(wù)器(HP ProLiant 文明用語370),由4塊146GB熱插拔硬盤通過RAID卡(Smart array陣列卡)配置成一臺(tái)具有RAID 5級(jí)的磁盤陣列。其中一塊硬盤在運(yùn)行過程中突然出現(xiàn)故障。服務(wù)器RAID 5自動(dòng)啟用熱備份硬盤(Hot Spare),對(duì)損壞硬盤進(jìn)行邏輯替代。整個(gè)硬盤的數(shù)據(jù)訪問任務(wù)仍然完整地運(yùn)行在原來的讀寫進(jìn)程序列中,應(yīng)用程序和數(shù)據(jù)庫沒有發(fā)生影響。
····通過HP自帶的ACU工具查看硬盤狀態(tài)進(jìn)行檢查,發(fā)現(xiàn)紅燈示警的硬盤處于脫機(jī)狀態(tài)。如果HP ProLiant服務(wù)器中的Raid 5有兩塊硬盤出現(xiàn)亮紅燈時(shí),表明系統(tǒng)已經(jīng)崩潰,數(shù)據(jù)庫也就不能訪問,但系統(tǒng)不會(huì)自動(dòng)關(guān)機(jī)。當(dāng)?shù)诙K硬盤亮紅燈后,用常規(guī)的手段是不能恢復(fù)數(shù)據(jù)的,只有付費(fèi)找專業(yè)的第三方數(shù)據(jù)恢復(fù)公司恢復(fù)數(shù)據(jù)。
····因此,對(duì)惠普老型號(hào)HP LH6000系列服務(wù)器來說,陣列的設(shè)計(jì)方面與現(xiàn)在HP ProLiant系列服務(wù)器的陣列有很多不同。就操作方法看,HP LH6000服務(wù)器的陣列操作方法有很多可選項(xiàng),包括陣列失敗后可以重新刪除陣列并重建等,初始化也是手工選擇的。但是HP ProLiant系列服務(wù)器陣列的初始化是在配置陣列后自動(dòng)在后臺(tái)執(zhí)行的,所以ProLiant系列服務(wù)器在陣列出錯(cuò)后是不能重配陣列的。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI