李曉東
內(nèi)蒙古自治區(qū)廣播電視傳輸發(fā)射中心包頭廣播發(fā)射中心臺 內(nèi)蒙古 包頭市 014010
數(shù)據(jù)的災(zāi)難風險主要有區(qū)域性的自然災(zāi)害、人為事故、設(shè)備故障、網(wǎng)絡(luò)或通信故障以及災(zāi)難性的應(yīng)用系統(tǒng)錯誤等。發(fā)生數(shù)據(jù)災(zāi)難事件的概率通常情況都很小,而災(zāi)備系統(tǒng)的建設(shè),通常需要花費大量的人力、物力和財力。然而,數(shù)據(jù)災(zāi)難事件一旦發(fā)生,普遍帶來非常嚴重的影響,所以數(shù)據(jù)的容災(zāi)保護不斷引起相關(guān)技術(shù)人員和管理人員的普遍重視。
數(shù)據(jù)容災(zāi)系統(tǒng),對于IT系統(tǒng)而言,就是當計算機系統(tǒng)在遭受自然災(zāi)難以及人為災(zāi)難時,容災(zāi)系統(tǒng)將保證用戶數(shù)據(jù)的安全性(數(shù)據(jù)容災(zāi))。
例如,數(shù)據(jù)中心有很多重要業(yè)務(wù)系統(tǒng)數(shù)據(jù)面臨著數(shù)據(jù)丟失損壞的風險,病毒、攻擊、誤操作和硬件故障等因素,導致數(shù)據(jù)丟失、損壞和業(yè)務(wù),需要對本地重要業(yè)務(wù)系統(tǒng)的數(shù)據(jù),包括數(shù)據(jù)庫、文件、操作系統(tǒng)和虛擬機和應(yīng)用需要進行有效本地在線的數(shù)據(jù)庫實時保護、數(shù)據(jù)庫容災(zāi)保護和其他業(yè)務(wù)系統(tǒng)的接管和演練。
國際通用的容災(zāi)系統(tǒng)的評審標準SHARE 78(7個層次、8個原則)。
0級:無異地備份,僅在本地進行備份,沒有在異地備份數(shù)據(jù),未制定災(zāi)難恢復(fù)計劃。
1級:本地備份,異地保存的冷備份。
2級:熱備份站點備份。
3級:在線數(shù)據(jù)恢復(fù)。
4級:定時數(shù)據(jù)備份。
5級:實時數(shù)據(jù)備份。
6級:零數(shù)據(jù)丟失。
(1)備份/恢復(fù)的范圍。
(2)災(zāi)難恢復(fù)計劃的狀態(tài)。
(3)應(yīng)用地點與備份地點之間的距離。
(4)應(yīng)用地點與備份地點如何連接。
(5)數(shù)據(jù)是怎樣在兩個地點之間傳送的。
(6)允許有多少條數(shù)據(jù)丟失。
(7)怎樣保證備份地點數(shù)據(jù)的更新。
(8)備份地點可以開始備份工作的能力。
我國對網(wǎng)絡(luò)安全和數(shù)據(jù)保護的重要性具有充分認識,對于網(wǎng)絡(luò)安全、數(shù)據(jù)災(zāi)備等制定了相關(guān)法規(guī),并從2019年陸續(xù)實施,災(zāi)備法規(guī)遵從:
《信息安全技術(shù)網(wǎng)絡(luò)安全等級保護基本要求》2.0版本,該標準2019年12月1日正式實施,并納入了《中華人民共和國網(wǎng)絡(luò)安全法》,把監(jiān)管對象從體制內(nèi)拓展到全社會。在等保2.0中,對不同等級所需達到的數(shù)據(jù)保護和容災(zāi)備份的技術(shù)要求和管理要求有明確定義。
《信息安全技術(shù)災(zāi)難恢復(fù)服務(wù)要求》(GB/T 36957-2018)于2019年7月正式下發(fā)。該標準從災(zāi)難恢復(fù)服務(wù)資源配置、災(zāi)難恢復(fù)服務(wù)過程和災(zāi)難恢復(fù)服務(wù)項目管理三個方面規(guī)定了災(zāi)難恢復(fù)服務(wù)的詳細要求。其中對災(zāi)難恢復(fù)系統(tǒng)的資源配置要求應(yīng)包括但不限于數(shù)據(jù)備份系統(tǒng)、備用數(shù)據(jù)處理系統(tǒng)、備用網(wǎng)絡(luò)系統(tǒng)、災(zāi)難恢復(fù)服務(wù)工具等。
此標準針對災(zāi)難恢復(fù)的能力要素、服務(wù)過程、能力級別及災(zāi)難恢復(fù)能力評估能力方面制定了詳細的標準。
電力行業(yè)的企業(yè)數(shù)據(jù)災(zāi)備通常是做整個服務(wù)體系的災(zāi)難恢復(fù)系統(tǒng),而不是單一的某系統(tǒng)或者某個業(yè)務(wù)網(wǎng)。電力行業(yè)的企業(yè),數(shù)據(jù)的災(zāi)難風險通常具有復(fù)雜性、有限性、關(guān)聯(lián)性和連續(xù)性四個特點。在進行電力行業(yè)數(shù)據(jù)災(zāi)備系統(tǒng)設(shè)計時通常圍繞這四個特點,進行企業(yè)的需求分析,進而決定設(shè)計方案。
4.1.1 整體方案設(shè)計思路
相對于金融、IT、信息等行業(yè)最佳恢復(fù)時間和合理成本之間的關(guān)系,電力行業(yè)對實時數(shù)據(jù)恢復(fù)要求不高,但對重要數(shù)據(jù)的恢復(fù)要求非常高。所以此次設(shè)計的總體思路:總部數(shù)據(jù)做集中備份管理、分廠數(shù)據(jù)在本地備份后將重要數(shù)據(jù)上傳到總部做容災(zāi),總部可以選某一個分廠做災(zāi)備中心,總部和分廠可以使用統(tǒng)一災(zāi)備管理平臺統(tǒng)一進行管理,實現(xiàn)總部和分廠數(shù)據(jù)互備,并對被保護的數(shù)據(jù)提供容災(zāi)演練功能,自動將最新備份數(shù)據(jù)恢復(fù)到演練環(huán)境,有效驗證備份的有效和精準性。核心備份域采用三層構(gòu)架,本項目中涉及到的4個備份系統(tǒng)各自獨立,具備管理主服務(wù)器和介質(zhì)服務(wù)器,容災(zāi)系統(tǒng)各自同時作為主服務(wù)器和介質(zhì)服務(wù)器。
4.1.2 系統(tǒng)實現(xiàn)功能
(1)對重要業(yè)務(wù)系統(tǒng)的數(shù)據(jù)庫Oracle、SQL Server、MySQL據(jù)庫進行全量、增量及日志的在線數(shù)據(jù)保護,可實現(xiàn)秒級的任意時間點恢復(fù)。
(2)對Oracle Rac數(shù)據(jù)庫基于redo日志變化實時捕獲,實現(xiàn)數(shù)據(jù)庫實時保護
(3)對Oracle Rac數(shù)據(jù)庫進行合成備份,實時數(shù)據(jù)庫的快速掛載恢復(fù)和演練恢復(fù)
(4)對Oracle Rac數(shù)據(jù)庫進行數(shù)據(jù)庫復(fù)制,將數(shù)據(jù)實時復(fù)制到同步接管服務(wù)器,防止數(shù)據(jù)庫故障后的快速接管。
(5)對海量小文件進行多通道快速的全量、增量備份設(shè)置,大大提高海量小文件的備份速度。
(6)對重要應(yīng)用的VMWare的虛擬機進行全量、增量的虛機級保護,實現(xiàn)虛機故障后的業(yè)務(wù)快速恢復(fù)。
(7)通過備份容災(zāi)平臺演練功能,可對數(shù)據(jù)庫自動定時恢復(fù)到演練環(huán)境,進行周期性的容災(zāi)演練
(8)通過應(yīng)急接管系統(tǒng),實現(xiàn)重要業(yè)務(wù)系統(tǒng)的應(yīng)用一體化(系統(tǒng)+應(yīng)用+數(shù)據(jù))的快速容災(zāi)接管。
圖1 網(wǎng)絡(luò)拓撲圖
4.2.1 總部本地數(shù)據(jù)中心
(1)鼎甲迪備系統(tǒng)(軟件或者備份一體機):需要配置數(shù)據(jù)庫復(fù)制模塊、存儲池復(fù)制模塊、連續(xù)日志保護模塊,實現(xiàn)數(shù)據(jù)庫(ORACLE、SQLServer)復(fù) 制、數(shù)據(jù)級容災(zāi)、數(shù)據(jù)實時備份。
(2)Infosemper副本管理系統(tǒng)(CDM一體機):實現(xiàn)文件、數(shù) 據(jù) 庫(ORACLE、SQLserver、MySQL)、虛 擬 化(VMware)、Hadoop(HDFS)的快速備份和即時恢復(fù)。
(3)DRO應(yīng)用容災(zāi)系統(tǒng):實現(xiàn)應(yīng)用軟件(APP)的系統(tǒng)接管和快速恢復(fù)。
(4)Info archiver歸檔:實現(xiàn)文件類(如圖片等格式文件)的離線存放和快速查閱。
(5)IMP備份統(tǒng)一管理平臺:對災(zāi)備策略、作業(yè)、資源、設(shè)備的統(tǒng)一監(jiān)管
4.2.2 分廠災(zāi)備中心
(1)迪備系統(tǒng)(備份一體機):將總部本地數(shù)據(jù)中心的數(shù)據(jù)復(fù)制到分廠災(zāi)備中心。
(2)Infosemper副本管理系統(tǒng)(CDM一體機):實現(xiàn)文件、數(shù) 據(jù)庫(ORACLE、SQLserver、MySQL)、虛 擬 化(VMware)、Hadoop(HDFS)的快速備份和即時恢復(fù)。
(3)DRO應(yīng)用容災(zāi)系統(tǒng):實現(xiàn)應(yīng)用軟件(APP)的系統(tǒng)接管和快速恢復(fù)。
4.3.1 分廠數(shù)據(jù)中心
迪備系統(tǒng)(備份一體機):需要配置數(shù)據(jù)庫復(fù)制模塊、存儲池復(fù)制模塊、連續(xù)日志保護模塊,實現(xiàn)數(shù)據(jù)庫(ORACLE、SQLServer)復(fù) 制、數(shù) 據(jù) 級 容災(zāi)、數(shù)據(jù)實時備份。
4.3.2 總部容災(zāi)中心
迪備系統(tǒng)(備份一體機):將分廠本地數(shù)據(jù)中心的數(shù)據(jù)復(fù)制到總部災(zāi)備中心。
通過以上總部/分廠數(shù)據(jù)容災(zāi)方案設(shè)計和實際部署,實現(xiàn)了終端桌面層、數(shù)據(jù)庫及應(yīng)用層、操作系統(tǒng)層、虛擬平臺層、硬件層的數(shù)據(jù)應(yīng)用保護。
隨著信息技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)和計算機已經(jīng)成為民眾生活中不可或缺的一部分,數(shù)據(jù)的容災(zāi)保護已經(jīng)成為IT風險管理中越來越重要的一環(huán)。做好數(shù)據(jù)保護、做好數(shù)據(jù)災(zāi)備已經(jīng)成為業(yè)界的普遍共識。未來,數(shù)據(jù)容災(zāi)的應(yīng)用會更加廣泛,具有完全自主知識產(chǎn)權(quán)的數(shù)據(jù)容災(zāi)設(shè)備,更為普通大眾所周知,并為各行業(yè)的數(shù)據(jù)資產(chǎn)提供更有力的安全防護。