溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

如何進(jìn)行IBM DS4300存儲(chǔ)災(zāi)難恢復(fù)的問題解析

發(fā)布時(shí)間:2021-12-30 16:20:16 來源:億速云 閱讀:124 作者:柒染 欄目:云計(jì)算

今天就跟大家聊聊有關(guān)如何進(jìn)行IBM DS4300存儲(chǔ)災(zāi)難恢復(fù)的問題解析,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。

公司的一個(gè)IBM DS4300的老存儲(chǔ)在十一前突然壞了,陣列掛載的數(shù)據(jù)出現(xiàn)丟失,比較嚴(yán)重,解決過程如下,特此記錄。

硬件環(huán)境是:IBM DS4300存儲(chǔ),分了2個(gè)array,每個(gè)array都做raid5,并且各有一塊熱備盤。每個(gè)array都劃分了2個(gè)邏輯盤,其中array2的一塊380G的邏輯盤給了小型機(jī)雙機(jī)系統(tǒng)做共享盤,雙機(jī)上是AIX+ORACLE10G。雙控(A控突然壞了,B控卻不能接管A控的LUN,致使一部分重要數(shù)據(jù)無法尋到)。經(jīng)過Server Raid管理軟件分析陣列日志信息,發(fā)現(xiàn)2號(hào)盤在11年8月份就出現(xiàn)異常,不參與RAID工作,1號(hào)盤在近期才出現(xiàn)錯(cuò)誤。經(jīng)過對(duì)1、2號(hào)盤進(jìn)行檢測(cè)和鏡像,發(fā)現(xiàn)2號(hào)盤有少量壞道,1號(hào)盤能正常讀取。

恢復(fù):

經(jīng)過對(duì)1號(hào)盤和2號(hào)盤進(jìn)行檢測(cè)和鏡像以后,我們嘗試把1號(hào)盤留在DS4300陣列上,把2號(hào)盤拔出來,然后在Server Raid管理軟件中嘗試各種辦法使1號(hào)盤狀態(tài)變成ONLINE狀態(tài),最后終于把1號(hào)盤變成ONLINE,于是嘗試在AIX下查看相關(guān)VG信息,發(fā)現(xiàn)VG信息已經(jīng)被破壞。數(shù)據(jù)恢復(fù)陷入下一步困境,經(jīng)過對(duì)比1號(hào)盤和2號(hào)盤的頭部信息,發(fā)現(xiàn)2號(hào)盤的頭部有相關(guān)VG信息,于是把2號(hào)盤VG信息Copy到1號(hào)盤相應(yīng)位置,再次在AIX下查看VG信息、LV信息,這次VG信息完好,文件系統(tǒng)mount順利,嘗試啟動(dòng)oracle服務(wù),發(fā)現(xiàn)oracle啟動(dòng)不了,報(bào)redo1.log文件錯(cuò)誤,最后經(jīng)過幾番努力,oracle終于能起來了,趕緊exp出oracle中的數(shù)據(jù)。到此數(shù)據(jù)恢復(fù)成功!

經(jīng)驗(yàn)總結(jié):

DS4300上更換硬盤特別要注意,最好更換型號(hào)和固件版本跟原來一樣的硬盤,本案例原2號(hào)盤壞過,如果需要替換原2號(hào)盤,那么新盤的型號(hào)和固件版本都需要跟原來的硬盤一樣,否則新?lián)Q的硬盤在DS4300上運(yùn)行時(shí)會(huì)不穩(wěn)定,并容易出現(xiàn)掉線的現(xiàn)象。DS4300對(duì)硬盤固件版本匹配要求比較高,更換硬盤千萬要注意固件版本匹配問題。

還有LVM信息是本恢復(fù)的關(guān)鍵,1號(hào)盤LVM信息被破壞,我從2號(hào)盤看到良好的LVM信息,COPY到1號(hào)盤的相應(yīng)位置,才能使整個(gè)恢復(fù)得以順利進(jìn)行。

另問題:

一個(gè)ds43000,分了2個(gè)array,每個(gè)array都做raid5,并且各有一塊熱備盤。每個(gè)array都劃分了2個(gè)邏輯盤,現(xiàn)在array2的一塊硬盤閃黃燈了,目前還能運(yùn)行。在aix下查errpt也是報(bào)hdisk3出錯(cuò)。問:1、熱備盤這時(shí)是自動(dòng)頂上了,還是要手動(dòng)配置?2、可以在線直接換這塊壞的盤嗎?3、換的盤這時(shí)是做熱備好,還是把原來的熱備盤繼續(xù)做熱備?我覺得磁盤陣列的可靠性也不太高啊,老是壞,不是電池壞,就是硬盤壞,讓人提心吊膽的。

此例中由于RAID本身并沒有損壞,不需要對(duì)每個(gè)物理硬盤進(jìn)行單獨(dú)鏡像,只需要把報(bào)錯(cuò)的那個(gè)磁盤所在的LUN鏡像出來就行。鏡像的方法有兩種:一種是在linux下用dd 命令把lun鏡像到別的存儲(chǔ)空間上,另一種是把要恢復(fù)的LUN切換到Windows上,然后通過Winhex工具對(duì)硬盤進(jìn)行鏡像。鏡像完成以后,數(shù)據(jù)恢復(fù)的重點(diǎn)就是分析XFS文件系統(tǒng)結(jié)構(gòu),把數(shù)據(jù)提取數(shù)來。

可以通過達(dá)思 D-Recovery For XFS數(shù)據(jù)恢復(fù)軟件,對(duì)每個(gè)鏡像出來的LUN進(jìn)行掃描,收集XFS文件系統(tǒng)信息(superblock,inode,目錄、文件名等),最終把數(shù)據(jù)完全提 取出來。當(dāng)然,如果數(shù)據(jù)破壞不嚴(yán)重,可以把分區(qū)表或者superblock信息還原到出問題之前的狀態(tài),然后掛回Linux環(huán)境,就能直接正常mount 文件系統(tǒng)。數(shù)據(jù)恢復(fù)最后結(jié)果是:出問題的LUN通過更改分區(qū)表或者superblock就能正常mount,還有一個(gè)LUN需要D-Recovery For XFS工具導(dǎo)出數(shù)據(jù),最后實(shí)現(xiàn)非常完美的恢復(fù)。

補(bǔ)充:
 RAID10架構(gòu):比如10塊146GB光纖接口硬盤,每?jī)蓧K盤做成RAID1,一共5組RAID1,然后這5組RAID1又配置成一個(gè)RAID0,這就是所謂的混合型RAID10架構(gòu). DS4300陣列掛接在IBM小型機(jī)上,劃分成AIX JFS2文件系統(tǒng)。這種RAID架構(gòu)貌似很安全,但還是會(huì)出問題。
 在這種架構(gòu)上,如果這5組RAID1中只要壞掉一組,整個(gè)陣列就不能正常訪問,在AIX上mount不上。

補(bǔ)充:

更換損壞的控制器

DS4300雙控制器,發(fā)現(xiàn)A控?zé)o法online,且主機(jī)接口無光,網(wǎng)卡燈也不亮,于是在沒有控制器備件的情況下就先關(guān)主機(jī)、存儲(chǔ),更換了電池,保證B控恢復(fù)正常,但是A控還是不行。
現(xiàn)在新控制器準(zhǔn)備好了(但是微碼版本未知),準(zhǔn)備再次進(jìn)行更換,思路如下

存儲(chǔ)情況:
DS4300基本型號(hào),雙控(A控已壞),沒有EXP
Firmware version: 06.12.03.00
NVSRAM version: N1722F600R912V05
硬盤微碼:JFQ3

操作的大概步驟:
1、異地備份數(shù)據(jù)
2、收集ASD
3、停數(shù)據(jù)庫,關(guān)主機(jī)、存儲(chǔ)
4、更換A控及電池
5、開存儲(chǔ),主機(jī)暫時(shí)不開
6、同時(shí)連接兩個(gè)控制器,在沒有IO讀寫的情況下,升級(jí)硬盤微碼JFQ3到JFQ8
7、確認(rèn)新控制器微碼版本,如果為06.12.03.00,則A、B控一樣,不用升級(jí);
如果高于06.12,升級(jí)控制器微碼和A控一樣
8、開主機(jī),再次收集ASD

問題:
1、之前沒有升級(jí)過控制器微碼,現(xiàn)在在IBM網(wǎng)站上找到了DS4300基本型號(hào)的微碼下載,但是06的只有這兩種嗎?而且6.60.22.00的版本還無法下載。


微碼不一樣也應(yīng)該沒有關(guān)系,你只要保證你剩的那個(gè)老的控制器沒壞就行,把新的插上,應(yīng)該會(huì)自動(dòng)同步,另外一定不能關(guān)機(jī)更換,反正做之前先做備份吧,有的也建議后換的控制器版本不要比已有的版本高,但是你這種情況磁盤的微碼也比較危險(xiǎn),我覺得情況還是挺復(fù)雜的,做之前多征求意見吧。
如果你的磁盤微碼還太低JFQ3,這種微碼還可能引起在線插拔控制器磁盤報(bào)警。
可以探討一下下面的步驟:(前提做好數(shù)據(jù)備份和陣列信息的備份)
1、用單控制器試著升級(jí)磁盤微碼到JFQ8;
2、更換控制器
2.1:如果新控制器微碼比原來的微碼低,那就在線直接更換,原來的高微碼應(yīng)該會(huì)自動(dòng)同步到新?lián)Q的控制器上。
2.2:如果新控制微碼比原來的微碼高,那么試著升級(jí)原來控制器的微碼,使原來控制微碼高于新控制,再在線更換控制器。升級(jí)微碼前將event  log東西保存后將其清空。
3、更換電池

看完上述內(nèi)容,你們對(duì)如何進(jìn)行IBM DS4300存儲(chǔ)災(zāi)難恢復(fù)的問題解析有進(jìn)一步的了解嗎?如果還想了解更多知識(shí)或者相關(guān)內(nèi)容,請(qǐng)關(guān)注億速云行業(yè)資訊頻道,感謝大家的支持。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

ibm
AI