付瓊芳 孔志文
摘 要 沙角A電廠經(jīng)過多年的信息化建設,目前在線運行的應用服務器,實現(xiàn)了核心業(yè)務系統(tǒng)的信息化管理。本文介紹電廠核心業(yè)務快速恢復平臺擴容。實現(xiàn)系統(tǒng)業(yè)務數(shù)據(jù)在本地的安全、高效、方便地存儲、備份和管理,達到數(shù)據(jù)實時備份,軟錯誤、病毒侵害、數(shù)據(jù)丟失的快速恢復,存儲故障容災,計算機系統(tǒng)失效備援等全面保護,保證各核心業(yè)務應用系統(tǒng)不間斷運行。
關鍵詞 快速恢復 數(shù)據(jù) 備份 容災 全面保護
中圖分類號:TP393?文獻標識碼:ADOI:10.16400/j.cnki.kjdkx.2015.02.077
Application of Enterprise Core Business Rapid
Recovery Platform in Power Plant
FU Qiongfang, KONG Zhiwen
(Shajiao A Power Station of Guangdong Yudean Group Co., Ltd, Dongguan, Guangdong 523936)
Abstract Shajiao A power plant after years of information technology, currently running online application server, and information management core business systems. This article describes the rapid recovery of the plant's core business platform expansion. Implementation system in the local business data safe, efficient, easy to store, backup and management to achieve real-time data backup, soft errors, viruses, data loss rapid recovery, disaster recovery storage failures, computer systems and other comprehensive failover protection, ensure that all core business applications to run uninterrupted.
Key words rapid recovery; data; backup; disaster recovery; full protection
1 企業(yè)核心業(yè)務快速恢復平臺擴容的實施背景
隨著信息技術的不斷發(fā)展,近年來在世界范圍內掀起了興建網(wǎng)絡環(huán)境、傳播數(shù)據(jù)信息的熱潮。隨著計算機存儲信息量的不斷增長,數(shù)據(jù)集中存儲、數(shù)據(jù)備份和災難恢復就成為引人關注的話題。
沙角A 電廠目前已經(jīng)有30多臺關鍵的應用服務器采用DSP 智能數(shù)據(jù)保護系統(tǒng)保護數(shù)據(jù)。其中包括OA、財務、MIS、人力資源等應用服務器系統(tǒng)做數(shù)據(jù)及系統(tǒng)備份以及相應的容災處理,與單位的生成、管理等應用息息相關,存儲著重要的數(shù)據(jù)。以上各系統(tǒng)在日常的業(yè)務處理中均起到至關重要的作用,一旦系統(tǒng)癱瘓將對日常管理工作,以及正常的活動產(chǎn)生比較嚴重的影響,如果數(shù)據(jù)丟失更是不可挽回的災難。
2 我廠核心業(yè)務快速恢復平臺的主要做法
2.1 平臺簡介
沙角A電廠經(jīng)過多年的信息化建設,目前在線運行的業(yè)務系統(tǒng)包括Q4維修管理系統(tǒng)、燃料管理系統(tǒng)、運行管理系統(tǒng)、全面預算管理系統(tǒng)、辦公自動化系統(tǒng)(OA)、資產(chǎn)管理系統(tǒng)(EAM)、廠級監(jiān)控信息系統(tǒng)(SIS)以及企業(yè)門戶網(wǎng)站(EIP)等,這些業(yè)務系統(tǒng)為我廠提高辦公生產(chǎn)效率,提高管理水平奠定了堅實的基礎。
目前,沙角A電廠的應用服務器大約60多臺,業(yè)務數(shù)據(jù)作為應用系統(tǒng)的關鍵資產(chǎn),如何安全、高效、方便地存儲、備份和管理這些業(yè)務數(shù)據(jù)就顯得至關重要。目前我廠采用容災平臺是2010年投入使用的DataZmart公司的DSP1160智能數(shù)據(jù)保護系統(tǒng)來實現(xiàn)安全、高效地存儲備份和管理業(yè)務數(shù)據(jù),保證核心業(yè)務應用不間斷運行。
通過2年多來的運行,該系統(tǒng)在多次系統(tǒng)出現(xiàn)故障甚至宕機的時候,起到非常關鍵的作用,確保沙角A電廠關鍵的信息系統(tǒng)的持續(xù)運行。隨著電廠信息系統(tǒng)數(shù)據(jù)不斷增加和對數(shù)據(jù)更高層次的保護需要,目前該設備在容量上已經(jīng)不能滿足需求,需要進一步擴容;同時還需在遠端(生活區(qū))也部署一套DSP設備,實現(xiàn)遠程(異地)災備。一旦本地信息系統(tǒng)出現(xiàn)災難,在遠端(生活區(qū))還保持有一份災備的數(shù)據(jù),并能通過容災系統(tǒng)實現(xiàn)接管服務,確保核心業(yè)務不間斷運行。所以我廠的核心業(yè)務快速恢復平臺分為兩期實施。
在第一期實施中,我們采用的一套專用的千兆備份網(wǎng)絡,針對包括EIP服務器、發(fā)電市場數(shù)據(jù)管理系統(tǒng)、GIS信息系統(tǒng)、EIP、Q4的WEB發(fā)布系統(tǒng)、煤場管理系統(tǒng)、工程立項物資采購系統(tǒng)、巡點檢管理系統(tǒng)、輸變電綜合統(tǒng)計系統(tǒng)、域服務器、運行管理系統(tǒng)、運行管理WEB等十幾個系統(tǒng)進行保護。在第二期遠程災備的實施的時候,我們考慮到Q4及SIS系統(tǒng)需要備份,把新采購的DSP 設備放置的本地,新的DSP設備除了支持iSCSI連接之外,也支持FC連接。具備更高的性能。第一期的DSP設備通過擴展一個存儲,遷移到遠程信息中心(生活區(qū))作為遠程災備復制中心。
目前這關鍵的17套系統(tǒng)在本地通過專用的備份網(wǎng)絡,采用磁盤和分區(qū)的方式先異步鏡像到DSP設備,并設置快照(備份副本)的策略,定期生成備份副本。
災備系統(tǒng)的日常演練、數(shù)據(jù)恢復、災難恢復、業(yè)務接管均需要通過這些數(shù)據(jù)存儲資源來完成。比如日常演練,我們通常需要在存儲資源的基礎上創(chuàng)建一份“臨時的快照資源”,然后指派到ESXi上,在ESXi上創(chuàng)建新的虛擬主機,磁盤指向指派的快照,通過Converter軟件配置,就可以在ESXi上啟用該業(yè)務服務器。當系統(tǒng)出現(xiàn)真正的災難的時候,我們可以把存儲資源直接指派到ESXi上。通過上述演練的方式接管應用。整個過程實際只需要10分鐘左右就可以完成。
另外新一期的遠程災備項目是通過復制這些存儲資源來實現(xiàn)的,DSP遠程災備的方式就是通過把在本地信息中心的這些存儲資源通過定期的方式復制到遠程(生活區(qū))的DSP災備設備上。這樣,在生活區(qū)也保留了一份一樣的數(shù)據(jù)副本。另外我們也針對生活區(qū)的災備副本設立了創(chuàng)建快照的模式,以防止在生產(chǎn)中心這邊誤刪除數(shù)據(jù)的時候,災備中心有保留歷史副本以備恢復。
2.2 系統(tǒng)拓撲圖(圖1)
圖1
3 企業(yè)核心業(yè)務快速恢復平臺的實施效果及亮點
通過第一期和第二期的災備項目的實施,達到以下的效果:
3.1 服務器的全方位保護
(1)在線即時保護服務器系統(tǒng)與數(shù)據(jù),不需停止服務,無備份窗口。(2)高效率的快照提供以分鐘為單位的快速回復,降低資料損失。(3)透過快照代理程序與系統(tǒng)和數(shù)據(jù)庫溝通,保證數(shù)據(jù)庫的一致性與完整性。(4)任何形式的災難皆可在短時間內迅速還原。
3.2 立即可用無需等待
(1)1分鐘檢視和驗證備份,不需等待數(shù)據(jù)回存。(2)5分鐘恢復故障業(yè)務系統(tǒng)/硬盤,不需等待系統(tǒng)重裝與數(shù)據(jù)回存。(3)10分鐘恢復故障服務器/儲存系統(tǒng)。
3.3輕松實現(xiàn)異地災備
(1)遠端復制具備廣域網(wǎng)路優(yōu)化技術,能降低重復數(shù)據(jù)區(qū)塊,節(jié)省帶寬。(2)傳輸過程支持壓縮和加密,增加效能和安全性,節(jié)省設備成本。(3)延伸本地端快速恢復經(jīng)驗,遠程災備中心亦可迅速恢復服務;(4)可隨時執(zhí)行異地災備演練,本地端服務器不需停機。
3.4 相對傳統(tǒng)的數(shù)據(jù)備份和保護方式,災備系統(tǒng)具有顯著的優(yōu)點
具體優(yōu)點如圖2所示:
4 總結
企業(yè)核心業(yè)務快速恢復平臺保障我廠信息系統(tǒng)安全穩(wěn)定運行,在系統(tǒng)出現(xiàn)異常的情況下進行數(shù)據(jù)的快速恢復,選用Datazmart的DSP AiO和DSP MD1120各1套,以最新的高性能存儲系統(tǒng)為硬件平臺,既實現(xiàn)本地DSP的系統(tǒng)擴容,又實現(xiàn)遠程容災。針對硬盤故障、系統(tǒng)崩潰實現(xiàn)系統(tǒng)和數(shù)據(jù)的快速恢復,在軟件故障、病毒攻擊以及誤操作等引起的數(shù)據(jù)丟失時快速恢復數(shù)據(jù),實現(xiàn)在服務器宕機時提供不間斷的服務。實現(xiàn)系統(tǒng)業(yè)務數(shù)據(jù)在本地的安全、高效、方便地存儲、備份和管理,達到數(shù)據(jù)實時備份,軟錯誤、病毒侵害、數(shù)據(jù)丟失的快速恢復,存儲故障容災,計算機系統(tǒng)失效備援等全面保護,保證各核心業(yè)務應用系統(tǒng)不間斷運行。
圖2
參考文獻
[1] 李暉,熊志強.HIS系統(tǒng)數(shù)據(jù)備份的策略[J].中國數(shù)字醫(yī)學,2011(7).
[2] 王德軍,王麗娜.容災系統(tǒng)研究[J].計算機工程,2005(6).
[3] 瞿志偉,謝康林,陳琰.磁盤備份系統(tǒng)的快速數(shù)據(jù)恢復方法[J].計算機工程,2005(9).