王 偉
(浙能鎮(zhèn)海發(fā)電有限責任公司,浙江 鎮(zhèn)海 315208)
浙江浙能鎮(zhèn)海發(fā)電有限責任公司現有企業(yè)資產管理系統(tǒng)(EAM)、財務管理系統(tǒng)(FMIS)和廠級實時監(jiān)控系統(tǒng)(SIS)。原有1套備份系統(tǒng)軟件,由于投入運行時間較長,且需要編寫腳本備份策略,維護也不方便。
隨著EAM和FMIS系統(tǒng)的上線,采用Oracle邏輯備份的方式需人工干預,操作更不便。EAM報表及附件的拷貝、SQL Server數據庫備份都是人工操作,備份的方式多,工作量大,因此有必要對現有的各個備份方式進行整合。通過市場調研,最終選擇了CommVault備份軟件。
建立備份系統(tǒng)應從實際情況出發(fā),長遠規(guī)劃。備份方式的選擇與現有的硬件環(huán)境有關,備份介質的選擇與備份恢復時間快慢要求等因素有關,而備份策略選擇的合理性直接與備份系統(tǒng)運行可靠性和維護性有關,因此備份方式、備份介質選擇和備份策略的制定是非常重要的。
CommVault備份軟件支持2種備份方式:Lan(局域網)備份方式和Lan-Free(非局域網)備份方式。
Lan備份方式是通過網絡傳輸到介質服務器連接的備份設備上實現備份。優(yōu)點是節(jié)省投資、磁帶庫共享、集中備份管理;缺點是網絡傳輸壓力大。
Lan-Free備份方式是建立在存儲區(qū)域網(SAN)的基礎上的。它采用一種全新的體系結構,將磁帶庫和磁盤陣列各自作為獨立的光纖結點,多臺主機共享磁帶庫備份時,數據流不經過網絡而直接從磁盤陣列傳到磁帶庫內,不占用網絡帶寬。優(yōu)點是數據備份統(tǒng)一管理、備份速度快、網絡傳輸壓力小、磁帶庫資源共享;缺點是投資高。
Lan-Free備份系統(tǒng)的建設需要具有SAN存儲環(huán)境,目前該公司現有小型SAN環(huán)境,但是并不是所有的應用系統(tǒng)、數據庫存儲都在SAN環(huán)境中。結合實際情況選擇了Lan備份方式,為減輕網絡壓力,夜間進行備份,可有效降低備份對系統(tǒng)應用的影響。
CommVault備份系統(tǒng)支持磁盤備份、磁帶備份和先備份到磁盤再到磁帶等多種方式。
磁帶備份的優(yōu)點是保留時間長、存儲容量大、價格低廉;缺點是磨損快,與磁盤和光盤相比容易出錯,且需要定期清洗驅動器。
磁盤備份的優(yōu)點是備份和還原速度快,易于配置和維護;缺點是價格相對較高。
結合磁盤和磁帶的特點,把數據備份分為2類,對于重要的數據如EAM、FMIS等應用數據采取先備份到磁盤,再做計劃任務備份到磁帶的方式;對于數據量很大的系統(tǒng),采用直接備份到磁帶的方式。
備份策略的制定是備份系統(tǒng)建設的重要部分,直接關系到備份系統(tǒng)建設的有效性、合理性、易維護性,結合實踐總結了以下備份策略制定的原則:
(1)根據業(yè)務需要確認備份介質保存周期。
(2)備份的最終目的是為了進行數據恢復,在選擇備份方式時,要在業(yè)務系統(tǒng)性能需求許可的情況下,最大程度地降低數據恢復時的復雜程度。
(3)對于相關業(yè)務系統(tǒng)的數據,為保證數據一致性,盡量安排在同一天進行備份。
(4)對于數據量較小的備份任務,或較為關鍵的業(yè)務,則建議每天進行一次全備份,以降低恢復時的復雜程度。
(5)根據各業(yè)務系統(tǒng)對備份的需求,以及系統(tǒng)的忙閑程度,為每個備份任務劃定可以進行數據備份的時段。盡量使備份數量在一周內的每天平均分布,可以采用大小數據量相搭配,或關鍵業(yè)務與非關鍵業(yè)務相搭配等方式進行。
(6)在每次業(yè)務數據做大調整后應立即做一次全備份。
整個備份系統(tǒng)相關硬件由服務器、磁盤陣列和磁帶庫各1臺組成。服務器安裝2塊磁盤做Raid 1,磁盤陣列做Raid 5+Hot Spare,磁帶庫采用雙驅動器。服務器采用微軟Windows 2003操作系統(tǒng)。網絡拓撲結構如圖1所示。
圖1 網絡拓撲結構圖
在執(zhí)行備份軟件安裝前,管理員必須對所有數據做1次手工備份,Oracle已經設置成歸檔模式(Archive Mode)。
在做了備份后,在備份服務器上安裝Commvault的服務器端。然后分別安裝Windows Oracle模塊、Windows SQL模塊、Windows Notes模塊、Aix Oracle等模塊。
對于EAM,FMIS,OA系統(tǒng)等關鍵的系統(tǒng),周日做1次全備份,周一到周六做增量備份,在磁盤上保留14天,另外輔助拷貝1份到磁帶上,保留周期30天。其他系統(tǒng)的備份數據周六做1次全備份,周日到周五做增量備份,在磁盤上保留7天,另外輔助拷貝1份到磁帶上,保留30天。對于EAM、FMIS等核心系統(tǒng),備份數據每個月做出庫管理,出庫的磁帶打上標簽送檔案歸檔保存。
備份系統(tǒng)安裝完成,對所有的備份數據都做1次全備份。選取Windows Oracle模塊做恢復測試,準備1臺備用的Windows機器,安裝Oracle和CommVault備份模塊,把數據恢復到該備用機上,客戶端連接到該機器訪問Oracle數據,測試成功。
發(fā)生這種情況時,可以在CommVault控制臺的作業(yè)控制器里找到失敗的任務,通過屬性找出相關的失敗信息和建議,查看RMAN日志,根據RMAN日志的報錯信息處理。另外也可以根據失敗任務的百分比來大致判斷問題所在:
(1)備份到0%時失敗,表示問題發(fā)生在備份之前,這時應該考慮數據庫是否運行,在Comm-Vault控制臺上查看數據庫實例的屬性,確認數據庫狀態(tài)是 Mounted、Open或者是Unknown狀態(tài)。
(2)備份到5%時失敗,表示客戶端已和Comm-Serve控制臺連接上,RMAN的腳本已生成但是可能RMAN在備份數據庫時已發(fā)生錯誤,此時應檢查RMAN腳本是否正確生成,并檢查RMAN錯誤信息,或在客戶端上檢查RMAN日志。
(3)備份到85%時失敗,表示數據庫備份已經完成,問題可能出在備份歸檔日志階段,常見的問題是歸檔日志不是由RMAN自動刪除,而是手動刪除,這樣可以用以下方法解決:
$rman nocatalog
$rman>connect target/
$rman>change archivelog all crosscheck;
備份任務在0%的時候提示網絡錯誤,無法連接到客戶端機器,但是備份服務器和客戶端之間通過IP地址能正常Ping通。因為CommVault備份是通過機器名解析來通信的,出現這種情況的原因,有可能是通過機器名解析時出錯而無法獲得對應的IP地址,另外也有可能是客戶端CommVault進程服務出錯造成。解決辦法是在備份服務器和客戶端服務器的HOST文件里加入機器名和IP地址的解析,重啟客戶端CommVault服務。
Windows文件備份的時候,提示有大量文件備份失敗。這種情況有可能是待備份的文件是Windows系統(tǒng)已經打開的文件,而Windows系統(tǒng)已經打開的文件是無法直接備份的,需要使用Windows系統(tǒng)VSS(卷影復制服務)快照功能進行備份。解決辦法是選擇客戶端File System模塊下的Default屬性,在常規(guī)選項里,確認使用VSS選項是否選中。確認系統(tǒng)的Volume Shadow Copy服務處于手動或自動啟用狀態(tài)。
備份系統(tǒng)建設不能只顧眼前的需求,應該為以后可能的系統(tǒng)和應用增加一些硬件和軟件上的余量。備份系統(tǒng)建設要盡量體現適用性、穩(wěn)定性、易維護等特點。
建立備份系統(tǒng)后,更多的工作是檢查系統(tǒng)運行是否正常、備份日志是否有異常現象等。備份系統(tǒng)有效運行一定要有相關的規(guī)則制度來保證,要建立介質管理制度,把備份系統(tǒng)的檢查內容加入到日常巡檢制度中。要重視備份系統(tǒng)的培訓工作,首先要安排專人對備份系統(tǒng)進行全面的學習,有條件的話要增設恢復服務器,以便能進行恢復測試和臨時邏輯錯誤的恢復。
[1]韓德志,謝長生,李懷陽.存儲備份技術探析[J].計算機應用研究,2004,21(6)∶1-4.
[2]顧啟超,劉曉潔,李濤,等.一種多點容災系統(tǒng)的設計與實現[J].計算機應用研究,2008,25(8)∶2427-2429.
[3]李付亮.電力二次系統(tǒng)存儲備份方案分析[J].繼電器,2006,34(19)∶42-45.
[4]單德華,楊紅艷,孫鴻雁.大型數據存儲與管理系統(tǒng)設計與實現[J].制造業(yè)自動化,2010,32(2)∶40-42.
[5]李毅明,侯開虎,余開朝.淺談企業(yè)信息系統(tǒng)的數據備份和恢復[J].中國管理信息化,2008,11(8)∶83-86.