曾維浩
【摘 要】本文針對RAID5磁盤陣列常出現(xiàn)的硬盤信息損壞、數(shù)據(jù)同步異常的現(xiàn)象,對重建陣列的必要性和方法進行了分析,并以思科4OC48E/POS-LR-SC服務器為例詳細說明了在磁盤陣列損壞的情況下如何實現(xiàn)陣列重建。
【關(guān)鍵詞】RAID;LSI RAID BIOS;磁盤陣列;重建
【Abstract】In this paper, Cisco 4OC48E / POS-LR-SC server was as an example to analysis how to repair the RAID5 disk array when the information had been damaged ,or the data had been disordered. at the same time,elaborated the technology of how to rbuild the information of Disk array.
【Key words】RAID;LSI RAID BIOS;Disk Array;Rebuild
0 引言
RAID5因其“空間利用率高、讀寫速度快、安全性和性價比高、不需要專門的校驗碼磁盤,可實現(xiàn)數(shù)據(jù)吞吐負載均衡”等優(yōu)點,在服務器磁盤陣列中被廣泛應用。在實際應用中,由于硬盤的自然損壞、瞬間斷電、誤拔插等原因,均會導致磁盤陣列錯誤,從而導致磁盤數(shù)據(jù)無法正常同步,致使RAID5的校驗功能不能正常發(fā)揮作用。發(fā)生這種情況時,RAID卡會自動監(jiān)測該磁盤存在的錯誤并主動將磁盤的狀態(tài)標識為不可用狀態(tài)“Failed”。此時系統(tǒng)雖然仍可使用,但對應的硬盤指示燈表現(xiàn)為有規(guī)律的閃爍黃燈,或是LCD面板提示“Driver Failed”。一旦出現(xiàn)這樣的警示,則說明該服務器的磁盤陣列中存在故障磁盤,陣列的安全冗余機制遭到破壞,需要盡快修復錯誤,保障數(shù)據(jù)安全。
1 重建磁盤陣列方法
下面以“思科4OC48E/POS-LR-SC”服務器為例說明如何利用LSI RAID BIOS進行RAID5的磁盤陣列修復。在進行磁盤陣列修復之前,必須斷開該服務器的服務,確保在操作期間服務器不與外界產(chǎn)生數(shù)據(jù)交互,并確保對數(shù)據(jù)進行了有效備份。當完成上述操作后,可按以下步驟進行磁盤陣列修復工作。
1.1 進入LSI RAID BIOS
重啟服務器,當服務器進入自檢程序時,按下組合鍵CTRL+M進入LSI RAID BIOS操作界面(圖1)。
1.2 記錄Raid信息
為避免誤操作,在進行磁盤陣列修復前,需要確定Raid信息并作記錄,具體操作方法如下:進入“LSI RAID BIOS”界面后,選擇“Objects”選項,然后再選擇“Logical Drive”,再根據(jù)服務器的實際情況選擇邏輯驅(qū)動器[1],本例中選擇“Logical Drive 0”,再依次選擇“View/Update Parameters”選項。此時,服務器的Raid信息就展現(xiàn)如下(圖2),從圖中我們可確認本機的磁盤陣列類型為Raid5,其狀態(tài)State為DEGRADED(降級狀態(tài))。
1.3 獲取硬盤信息
確定了服務器存在狀態(tài)為DEGRADED的硬盤后,接下來需要通過掃描獲取硬盤的信息,為磁盤陣列的修復做好準備,具體操作如下:在圖2界面按ESC鍵進入Management Menu菜單,選擇Objects-Physical Driver并回車,系統(tǒng)開始掃描磁盤陣列信息(圖3)
掃描完成后,系統(tǒng)自動羅列出服務器的磁盤陣列信息,“ONLINE”表示對應的硬盤運行正常,無需修復; FAILED表示該硬盤的數(shù)據(jù)與其他硬盤不同步,需要對其進行REBUILD操作,從而實現(xiàn)磁盤陣列的修復(圖4)。
在進行修復之前如需進一步了解硬盤狀態(tài),可將光標移至硬盤上按F2獲取硬盤信息。
1.4 磁盤陣列重建
將光標移到標有“FAILED”的硬盤上按回車鍵,在彈出的菜單中選擇“REBUILD”,然后選擇“YES”回車確認,系統(tǒng)進入修復操作(圖5)。
磁盤陣列重建過程即是以服務器Raid信息、硬盤數(shù)據(jù)及數(shù)據(jù)校驗規(guī)則為依據(jù),對故障硬盤進行數(shù)據(jù)重新計算和Raid規(guī)則還原的過程,Rebuild過程中會進行頻繁的數(shù)據(jù)運算和讀寫操作,因此所需時間較長[2]。在進行數(shù)據(jù)重建過程中應確保電源穩(wěn)定,并禁止對系統(tǒng)進行操作,直至Rebuild完成。
1.5 磁盤陣列重建后的驗證
Rebuild進行完成后,可按照步驟2重新獲取Raid信息,如果Logical Driver狀態(tài)從“DEGRADED”變?yōu)榱恕癘PTIMAL”,且硬盤的狀態(tài)已由“FAILED”變?yōu)椤癘NLIN”,則表示該磁盤陣列已經(jīng)成功修復(圖6)。
至此,受損的磁盤陣列得到成功修復,重啟服務器即可正常進入系統(tǒng),且硬盤狀態(tài)指示燈和LCD面板的錯誤提示均已消失,系統(tǒng)恢復正常。
2 結(jié)論
本文以“思科4OC48E/POS-LR-SC”為服務器為例,詳細闡述了因硬盤故障導致磁盤陣列錯誤的情況下,如何利用LSI RAID BIOS實現(xiàn)磁盤陣列重建的過程和重建結(jié)果的驗證方法,為廣大的服務器維護工作者提供了一套切實可行的磁盤陣列修復方案,在實際應用中具有一定的指導和參考價值。
【參考文獻】
[1]汪中夏.[RAID數(shù)據(jù)恢復技術(shù)揭秘].清華大學出版社,2010年12月.
[2]韓立凡.[服務器配置].機械工業(yè)出版社,2015年9月.
[責任編輯:張濤]endprint