王 偉
(浙能鎮(zhèn)海發(fā)電有限責任公司,浙江 鎮(zhèn)海 315208)
浙江浙能鎮(zhèn)海發(fā)電有限責任公司現(xiàn)有企業(yè)資產(chǎn)管理系統(tǒng)(EAM)、財務(wù)管理系統(tǒng)(FMIS)和廠級實時監(jiān)控系統(tǒng)(SIS)。原有1套備份系統(tǒng)軟件,由于投入運行時間較長,且需要編寫腳本備份策略,維護也不方便。
隨著EAM和FMIS系統(tǒng)的上線,采用Oracle邏輯備份的方式需人工干預(yù),操作更不便。EAM報表及附件的拷貝、SQL Server數(shù)據(jù)庫備份都是人工操作,備份的方式多,工作量大,因此有必要對現(xiàn)有的各個備份方式進行整合。通過市場調(diào)研,最終選擇了CommVault備份軟件。
建立備份系統(tǒng)應(yīng)從實際情況出發(fā),長遠規(guī)劃。備份方式的選擇與現(xiàn)有的硬件環(huán)境有關(guān),備份介質(zhì)的選擇與備份恢復(fù)時間快慢要求等因素有關(guān),而備份策略選擇的合理性直接與備份系統(tǒng)運行可靠性和維護性有關(guān),因此備份方式、備份介質(zhì)選擇和備份策略的制定是非常重要的。
CommVault備份軟件支持2種備份方式:Lan(局域網(wǎng))備份方式和Lan-Free(非局域網(wǎng))備份方式。
Lan備份方式是通過網(wǎng)絡(luò)傳輸?shù)浇橘|(zhì)服務(wù)器連接的備份設(shè)備上實現(xiàn)備份。優(yōu)點是節(jié)省投資、磁帶庫共享、集中備份管理;缺點是網(wǎng)絡(luò)傳輸壓力大。
Lan-Free備份方式是建立在存儲區(qū)域網(wǎng)(SAN)的基礎(chǔ)上的。它采用一種全新的體系結(jié)構(gòu),將磁帶庫和磁盤陣列各自作為獨立的光纖結(jié)點,多臺主機共享磁帶庫備份時,數(shù)據(jù)流不經(jīng)過網(wǎng)絡(luò)而直接從磁盤陣列傳到磁帶庫內(nèi),不占用網(wǎng)絡(luò)帶寬。優(yōu)點是數(shù)據(jù)備份統(tǒng)一管理、備份速度快、網(wǎng)絡(luò)傳輸壓力小、磁帶庫資源共享;缺點是投資高。
Lan-Free備份系統(tǒng)的建設(shè)需要具有SAN存儲環(huán)境,目前該公司現(xiàn)有小型SAN環(huán)境,但是并不是所有的應(yīng)用系統(tǒng)、數(shù)據(jù)庫存儲都在SAN環(huán)境中。結(jié)合實際情況選擇了Lan備份方式,為減輕網(wǎng)絡(luò)壓力,夜間進行備份,可有效降低備份對系統(tǒng)應(yīng)用的影響。
CommVault備份系統(tǒng)支持磁盤備份、磁帶備份和先備份到磁盤再到磁帶等多種方式。
磁帶備份的優(yōu)點是保留時間長、存儲容量大、價格低廉;缺點是磨損快,與磁盤和光盤相比容易出錯,且需要定期清洗驅(qū)動器。
磁盤備份的優(yōu)點是備份和還原速度快,易于配置和維護;缺點是價格相對較高。
結(jié)合磁盤和磁帶的特點,把數(shù)據(jù)備份分為2類,對于重要的數(shù)據(jù)如EAM、FMIS等應(yīng)用數(shù)據(jù)采取先備份到磁盤,再做計劃任務(wù)備份到磁帶的方式;對于數(shù)據(jù)量很大的系統(tǒng),采用直接備份到磁帶的方式。
備份策略的制定是備份系統(tǒng)建設(shè)的重要部分,直接關(guān)系到備份系統(tǒng)建設(shè)的有效性、合理性、易維護性,結(jié)合實踐總結(jié)了以下備份策略制定的原則:
(1)根據(jù)業(yè)務(wù)需要確認備份介質(zhì)保存周期。
(2)備份的最終目的是為了進行數(shù)據(jù)恢復(fù),在選擇備份方式時,要在業(yè)務(wù)系統(tǒng)性能需求許可的情況下,最大程度地降低數(shù)據(jù)恢復(fù)時的復(fù)雜程度。
(3)對于相關(guān)業(yè)務(wù)系統(tǒng)的數(shù)據(jù),為保證數(shù)據(jù)一致性,盡量安排在同一天進行備份。
(4)對于數(shù)據(jù)量較小的備份任務(wù),或較為關(guān)鍵的業(yè)務(wù),則建議每天進行一次全備份,以降低恢復(fù)時的復(fù)雜程度。
(5)根據(jù)各業(yè)務(wù)系統(tǒng)對備份的需求,以及系統(tǒng)的忙閑程度,為每個備份任務(wù)劃定可以進行數(shù)據(jù)備份的時段。盡量使備份數(shù)量在一周內(nèi)的每天平均分布,可以采用大小數(shù)據(jù)量相搭配,或關(guān)鍵業(yè)務(wù)與非關(guān)鍵業(yè)務(wù)相搭配等方式進行。
(6)在每次業(yè)務(wù)數(shù)據(jù)做大調(diào)整后應(yīng)立即做一次全備份。
整個備份系統(tǒng)相關(guān)硬件由服務(wù)器、磁盤陣列和磁帶庫各1臺組成。服務(wù)器安裝2塊磁盤做Raid 1,磁盤陣列做Raid 5+Hot Spare,磁帶庫采用雙驅(qū)動器。服務(wù)器采用微軟Windows 2003操作系統(tǒng)。網(wǎng)絡(luò)拓撲結(jié)構(gòu)如圖1所示。
圖1 網(wǎng)絡(luò)拓撲結(jié)構(gòu)圖
在執(zhí)行備份軟件安裝前,管理員必須對所有數(shù)據(jù)做1次手工備份,Oracle已經(jīng)設(shè)置成歸檔模式(Archive Mode)。
在做了備份后,在備份服務(wù)器上安裝Commvault的服務(wù)器端。然后分別安裝Windows Oracle模塊、Windows SQL模塊、Windows Notes模塊、Aix Oracle等模塊。
對于EAM,F(xiàn)MIS,OA系統(tǒng)等關(guān)鍵的系統(tǒng),周日做1次全備份,周一到周六做增量備份,在磁盤上保留14天,另外輔助拷貝1份到磁帶上,保留周期30天。其他系統(tǒng)的備份數(shù)據(jù)周六做1次全備份,周日到周五做增量備份,在磁盤上保留7天,另外輔助拷貝1份到磁帶上,保留30天。對于EAM、FMIS等核心系統(tǒng),備份數(shù)據(jù)每個月做出庫管理,出庫的磁帶打上標簽送檔案歸檔保存。
備份系統(tǒng)安裝完成,對所有的備份數(shù)據(jù)都做1次全備份。選取Windows Oracle模塊做恢復(fù)測試,準備1臺備用的Windows機器,安裝Oracle和CommVault備份模塊,把數(shù)據(jù)恢復(fù)到該備用機上,客戶端連接到該機器訪問Oracle數(shù)據(jù),測試成功。
發(fā)生這種情況時,可以在CommVault控制臺的作業(yè)控制器里找到失敗的任務(wù),通過屬性找出相關(guān)的失敗信息和建議,查看RMAN日志,根據(jù)RMAN日志的報錯信息處理。另外也可以根據(jù)失敗任務(wù)的百分比來大致判斷問題所在:
(1)備份到0%時失敗,表示問題發(fā)生在備份之前,這時應(yīng)該考慮數(shù)據(jù)庫是否運行,在Comm-Vault控制臺上查看數(shù)據(jù)庫實例的屬性,確認數(shù)據(jù)庫狀態(tài)是 Mounted、Open或者是Unknown狀態(tài)。
(2)備份到5%時失敗,表示客戶端已和Comm-Serve控制臺連接上,RMAN的腳本已生成但是可能RMAN在備份數(shù)據(jù)庫時已發(fā)生錯誤,此時應(yīng)檢查RMAN腳本是否正確生成,并檢查RMAN錯誤信息,或在客戶端上檢查RMAN日志。
(3)備份到85%時失敗,表示數(shù)據(jù)庫備份已經(jīng)完成,問題可能出在備份歸檔日志階段,常見的問題是歸檔日志不是由RMAN自動刪除,而是手動刪除,這樣可以用以下方法解決:
$rman nocatalog
$rman>connect target/
$rman>change archivelog all crosscheck;
備份任務(wù)在0%的時候提示網(wǎng)絡(luò)錯誤,無法連接到客戶端機器,但是備份服務(wù)器和客戶端之間通過IP地址能正常Ping通。因為CommVault備份是通過機器名解析來通信的,出現(xiàn)這種情況的原因,有可能是通過機器名解析時出錯而無法獲得對應(yīng)的IP地址,另外也有可能是客戶端CommVault進程服務(wù)出錯造成。解決辦法是在備份服務(wù)器和客戶端服務(wù)器的HOST文件里加入機器名和IP地址的解析,重啟客戶端CommVault服務(wù)。
Windows文件備份的時候,提示有大量文件備份失敗。這種情況有可能是待備份的文件是Windows系統(tǒng)已經(jīng)打開的文件,而Windows系統(tǒng)已經(jīng)打開的文件是無法直接備份的,需要使用Windows系統(tǒng)VSS(卷影復(fù)制服務(wù))快照功能進行備份。解決辦法是選擇客戶端File System模塊下的Default屬性,在常規(guī)選項里,確認使用VSS選項是否選中。確認系統(tǒng)的Volume Shadow Copy服務(wù)處于手動或自動啟用狀態(tài)。
備份系統(tǒng)建設(shè)不能只顧眼前的需求,應(yīng)該為以后可能的系統(tǒng)和應(yīng)用增加一些硬件和軟件上的余量。備份系統(tǒng)建設(shè)要盡量體現(xiàn)適用性、穩(wěn)定性、易維護等特點。
建立備份系統(tǒng)后,更多的工作是檢查系統(tǒng)運行是否正常、備份日志是否有異常現(xiàn)象等。備份系統(tǒng)有效運行一定要有相關(guān)的規(guī)則制度來保證,要建立介質(zhì)管理制度,把備份系統(tǒng)的檢查內(nèi)容加入到日常巡檢制度中。要重視備份系統(tǒng)的培訓(xùn)工作,首先要安排專人對備份系統(tǒng)進行全面的學習,有條件的話要增設(shè)恢復(fù)服務(wù)器,以便能進行恢復(fù)測試和臨時邏輯錯誤的恢復(fù)。
[1]韓德志,謝長生,李懷陽.存儲備份技術(shù)探析[J].計算機應(yīng)用研究,2004,21(6)∶1-4.
[2]顧啟超,劉曉潔,李濤,等.一種多點容災(zāi)系統(tǒng)的設(shè)計與實現(xiàn)[J].計算機應(yīng)用研究,2008,25(8)∶2427-2429.
[3]李付亮.電力二次系統(tǒng)存儲備份方案分析[J].繼電器,2006,34(19)∶42-45.
[4]單德華,楊紅艷,孫鴻雁.大型數(shù)據(jù)存儲與管理系統(tǒng)設(shè)計與實現(xiàn)[J].制造業(yè)自動化,2010,32(2)∶40-42.
[5]李毅明,侯開虎,余開朝.淺談企業(yè)信息系統(tǒng)的數(shù)據(jù)備份和恢復(fù)[J].中國管理信息化,2008,11(8)∶83-86.