周琦
[摘 要] 企業(yè)信息系統(tǒng)是企業(yè)運營的基礎(chǔ)平臺,數(shù)據(jù)則是關(guān)系到企業(yè)自身利益的核心資源,業(yè)務(wù)連續(xù)性和數(shù)據(jù)可用性是關(guān)系到企業(yè)生存的重大問題。文章從集團公司企業(yè)信息系統(tǒng)災(zāi)備中心建設(shè)背景出發(fā),結(jié)合災(zāi)備中心建設(shè)的必要性、災(zāi)備體系特點,提出了三種建設(shè)方案,并對每種方案進行了簡要說明。
[關(guān)鍵詞] 災(zāi)備中心;云災(zāi)備;建設(shè)方案
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 23. 024
[中圖分類號] TP393.07 [文獻標識碼] A [文章編號] 1673 - 0194(2018)23- 0056- 04
1 背景和必要性
1.1 背 景
隨著信息化上升為國家戰(zhàn)略,國家對信息安全防護越來越重視,對信息系統(tǒng)的災(zāi)難恢復(fù)中心(以下簡稱“災(zāi)備中心”)建設(shè)也給予了高度重視。2007年6月,國家制定并發(fā)布了關(guān)于災(zāi)備中心建設(shè)的第一個國家標準《信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范》(GB/T 20988-2007),2013年,又發(fā)布了具有指導(dǎo)性的《災(zāi)難恢復(fù)中心建設(shè)與運維管理規(guī)范》(GB/T 30285-2013),對災(zāi)備中心建設(shè)與運維管理制定了具體規(guī)范?!缎畔⑾到y(tǒng)災(zāi)難恢復(fù)規(guī)范》對災(zāi)難恢復(fù)能力從低到高共劃分了六個級別,如表1所示。
近些年來,隨著中央企業(yè)信息化水平不斷提升,許多領(lǐng)先企業(yè)如中國石油、中國石化、國家電網(wǎng)以及電信運營商等,都已經(jīng)完成了信息系統(tǒng)異地災(zāi)備中心的建設(shè)。
為了提高信息系統(tǒng)的運行穩(wěn)定性、可靠性、安全性,為業(yè)務(wù)的開展提供安全可靠保障,集團公司計劃對現(xiàn)有信息系統(tǒng)及數(shù)據(jù)資源建設(shè)部署災(zāi)備系統(tǒng),實現(xiàn)相關(guān)數(shù)據(jù)資源和應(yīng)用系統(tǒng)的容災(zāi)備份及災(zāi)難恢復(fù)。
1.2 必要性
數(shù)據(jù)中心里設(shè)備價格昂貴,一旦發(fā)生不可預(yù)知的災(zāi)難,諸如斷電、設(shè)備損壞、機柜坍塌、線纜損耗、數(shù)據(jù)丟失、信息泄露等問題,將帶來極其嚴重的后果,其中設(shè)備及材料等有形的損失可以彌補,而寶貴的數(shù)據(jù)丟失和業(yè)務(wù)的長期中斷造成的損失則是無法估量的,而容災(zāi)備份作為防止數(shù)據(jù)災(zāi)難的最后防線,就顯得尤其重要,因此說容災(zāi)備份,刻不容緩。
容災(zāi)備份是通過特定的機制和技術(shù)手段,對現(xiàn)有系統(tǒng)進行保護,在各種災(zāi)難損害發(fā)生后,能夠最大限度地保護信息系統(tǒng)業(yè)務(wù)數(shù)據(jù),提供正常的應(yīng)用服務(wù)。
2 災(zāi)備體系
2.1 容災(zāi)和備份
容災(zāi)和備份是災(zāi)備系統(tǒng)的主要概念,但兩者是有區(qū)別的。備份是指為防止信息系統(tǒng)出現(xiàn)操作失誤或系統(tǒng)故障導(dǎo)致數(shù)據(jù)丟失而將全部或部分數(shù)據(jù)集合,從應(yīng)用系統(tǒng)現(xiàn)有存儲介質(zhì)復(fù)制到其他的存儲介質(zhì)進行保管。容災(zāi)是指在相隔較遠的兩地,建立兩套或多套功能相同的信息系統(tǒng),互相之間可以進行健康狀態(tài)監(jiān)視和功能切換,當一處系統(tǒng)因意外(如火災(zāi)、地震等)停止工作時,另一處系統(tǒng)可以承擔起相應(yīng)的服務(wù)功能,使得該系統(tǒng)可以繼續(xù)正常工作[2]。
備份與容災(zāi)所關(guān)注的對象有所不同,備份主要關(guān)心數(shù)據(jù)的安全,容災(zāi)在數(shù)據(jù)安全的基礎(chǔ)上更加關(guān)心業(yè)務(wù)應(yīng)用的安全,可以把備份稱作“數(shù)據(jù)保護”,而容災(zāi)稱作“業(yè)務(wù)應(yīng)用保護”。備份更多表現(xiàn)為通過備份軟件使用磁帶機或者磁帶庫將數(shù)據(jù)進行拷貝,也有磁盤或者光盤作為存儲介質(zhì),備份系統(tǒng)具有性能低、成本低的特點;容災(zāi)是信息系統(tǒng)高可用技術(shù)的一個組成部分,容災(zāi)系統(tǒng)更加強調(diào)處理外界環(huán)境對系統(tǒng)的影響,特別是災(zāi)難性事件對整個數(shù)據(jù)中心的影響,提供站點級別的系統(tǒng)恢復(fù)功能,容災(zāi)系統(tǒng)具有性能高、成本高的特點。
容災(zāi)與備份的緊密聯(lián)系體現(xiàn)在兩方面。
2.1.1 數(shù)據(jù)備份是數(shù)據(jù)容災(zāi)的基礎(chǔ)
數(shù)據(jù)備份是數(shù)據(jù)可用的最后一道防線,其目的是為了信息系統(tǒng)崩潰時能夠快速恢復(fù)數(shù)據(jù)。雖然它也算一種簡化的容災(zāi)方案,但其能力非常有限,因為傳統(tǒng)的備份主要是采用數(shù)據(jù)內(nèi)置或外置的磁帶進行冷備份,備份磁帶同時也在機房中統(tǒng)一處理,一旦整個機房出現(xiàn)不可抗力所致的災(zāi)難時,這些備份數(shù)據(jù)也可能隨之被毀滅,所存儲的備份數(shù)據(jù)就無法起到應(yīng)有的容災(zāi)功能[3]。
2.1.2 容災(zāi)不是簡單備份
真正的數(shù)據(jù)容災(zāi)就是要避免傳統(tǒng)冷備份的先天不足,不僅僅實現(xiàn)備份介質(zhì)的異地存放,而是通過建立一個和本地應(yīng)用系統(tǒng)對稱的異地災(zāi)備系統(tǒng),能在本地災(zāi)難發(fā)生時,全面、及時地恢復(fù)應(yīng)用數(shù)據(jù),可以按照建設(shè)等級的不同,實現(xiàn)恢復(fù)時間從幾天到小時級到分鐘級、秒級或0數(shù)據(jù)丟失等。進而可以將對信息系統(tǒng)的保護,從基礎(chǔ)的數(shù)據(jù)保護提升到應(yīng)用、網(wǎng)絡(luò)、業(yè)務(wù)等全方位的災(zāi)難恢復(fù),在距離較近時還可以實現(xiàn)業(yè)務(wù)訪問的實時雙活、多活切換等。
2.2 容災(zāi)體系級別
容災(zāi)備份主要針對數(shù)據(jù)和應(yīng)用兩大類,根據(jù)提供基本的數(shù)據(jù)保護和提供不間斷的應(yīng)用服務(wù)來區(qū)分。一般情況下容災(zāi)體系可以分成數(shù)據(jù)級容災(zāi)、應(yīng)用級容災(zāi)和業(yè)務(wù)級容災(zāi)三個級別。
2.2.1 數(shù)據(jù)級容災(zāi)
數(shù)據(jù)級容災(zāi)是指通過建立一個異地數(shù)據(jù)系統(tǒng),作為本地數(shù)據(jù)的遠程備份,能夠保證業(yè)務(wù)數(shù)據(jù)的完整性、可靠性和最終一致性。
數(shù)據(jù)級容災(zāi)的關(guān)注點在于數(shù)據(jù)本身,當本地由于意外導(dǎo)致系統(tǒng)停止工作時,確保原有的數(shù)據(jù)不會丟失或者遭到破壞,不過,在數(shù)據(jù)級容災(zāi)這個級別上,當本地發(fā)生災(zāi)難時,因相應(yīng)的信息系統(tǒng)自身沒有備份,用戶的服務(wù)請求在災(zāi)難中可能會中斷,單純的數(shù)據(jù)容災(zāi)無法保證業(yè)務(wù)持續(xù)性。
在數(shù)據(jù)級容災(zāi)方式下,所建立的異地災(zāi)備中心可以簡單地把它理解成一個遠程的數(shù)據(jù)備份中心。數(shù)據(jù)級容災(zāi)的恢復(fù)時間比較長,但是其建設(shè)費用比較低,而且構(gòu)建實施和運行維護也相對簡單。
2.2.2 應(yīng)用級容災(zāi)
應(yīng)用級容災(zāi)是在數(shù)據(jù)級容災(zāi)基礎(chǔ)上的升級,通過在備份站點構(gòu)建一套相同或縮小比例的應(yīng)用系統(tǒng),在本地系統(tǒng)由于意外而停止工作時,可以及時啟用備用應(yīng)用系統(tǒng),保證關(guān)鍵應(yīng)用在允許的時間范圍內(nèi)恢復(fù)運行,盡可能地減少因災(zāi)難帶來的損失。應(yīng)用級容災(zāi)一般在生產(chǎn)中心和異地災(zāi)備中心之間采用同步或異步的數(shù)據(jù)傳輸,但災(zāi)備中心也需要具有和生產(chǎn)中心類似的外部廣域網(wǎng)資源,應(yīng)用級容災(zāi)需要通過更多的軟硬件來實現(xiàn),可以使多種應(yīng)用在災(zāi)難發(fā)生時進行快速切換,確保業(yè)務(wù)的連續(xù)性。
2.2.3 業(yè)務(wù)級容災(zāi)
業(yè)務(wù)級容災(zāi)是在數(shù)據(jù)級容災(zāi)和應(yīng)用級容災(zāi)基礎(chǔ)之上的一個更高級別的容災(zāi),是應(yīng)用級容災(zāi)的最高標準,它是指在生產(chǎn)中心和災(zāi)備中心對業(yè)務(wù)請求可以同時提供服務(wù)的一種容災(zāi)方式,在某一方災(zāi)難發(fā)生時,另一方可以保證所有的業(yè)務(wù)都是正常運行并可訪問的,對于用戶來講是感受不到災(zāi)難影響,因此既能實現(xiàn)業(yè)務(wù)服務(wù)冗余分擔,又能夠確保業(yè)務(wù)持續(xù)可用。
實現(xiàn)業(yè)務(wù)級容災(zāi),不僅需要確保兩地數(shù)據(jù)一致,還需要在數(shù)據(jù)管理層面、應(yīng)用程序?qū)用妗⒃L問通道層面都能夠平滑切換,數(shù)據(jù)中心之間的距離也有較大限制。甚至主備中心最好具備對稱的基礎(chǔ)設(shè)施,以便一旦原有的辦公場所遭到破壞,在備份場所也能正常的開展業(yè)務(wù)。
3 建設(shè)方案
按照國家關(guān)于災(zāi)備系統(tǒng)能力的六級標準,結(jié)合集團公司的實際情況,將現(xiàn)有信息系統(tǒng)按數(shù)據(jù)重要性和應(yīng)用時效性進行分類。如表2所示。
針對不同的信息系統(tǒng),可以采取不同的災(zāi)備方案,以達到不同的災(zāi)備級別。綜合考慮集團公司災(zāi)備中心建設(shè)可以采取以下三種方案。
方案1:數(shù)據(jù)級災(zāi)備中心,四+五級標準,完全自建機房
數(shù)據(jù)級災(zāi)備中心,重要信息系統(tǒng)達到五級標準,總體達到四級標準。如果集團公司數(shù)據(jù)中心出現(xiàn)重大災(zāi)難性損失,可以達到重要信息系統(tǒng)數(shù)據(jù)基本不丟失(當天數(shù)據(jù)可恢復(fù))、一般信息系統(tǒng)數(shù)據(jù)少量丟失(上周數(shù)據(jù)可恢復(fù))的目標。災(zāi)備中心機房按照主數(shù)據(jù)中心的50%規(guī)模建設(shè),充分考慮未來5~10年的擴展性,與集團公司主數(shù)據(jù)中心設(shè)計能力相匹配。在主中心暫停服務(wù)期間,災(zāi)備中心能夠提供部分重要信息系統(tǒng)的數(shù)據(jù)查詢服務(wù)。
方案2:數(shù)據(jù)級災(zāi)備中心,四+五級標準,自建機房+“云災(zāi)備”混合模式
災(zāi)備能力與方案1相同,區(qū)別在于互聯(lián)網(wǎng)系統(tǒng)采用“云災(zāi)備”模式,即災(zāi)備中心機房按照主數(shù)據(jù)中心的30%規(guī)模建設(shè),互聯(lián)網(wǎng)系統(tǒng)則采用“云災(zāi)備”系統(tǒng)租用模式。在主中心暫停服務(wù)期間,災(zāi)備中心能夠提供部分重要信息系統(tǒng)的數(shù)據(jù)查詢服務(wù)。
方案3:數(shù)據(jù)級災(zāi)備中心,二級標準,不新建災(zāi)備機房
對現(xiàn)有數(shù)據(jù)備份方案補充完善,以較少的投資達到二級標準。主數(shù)據(jù)中心每周進行一次完全數(shù)據(jù)備份。對現(xiàn)有機房進行適當改造,提供獨立封閉區(qū)域,存放備份數(shù)據(jù)。
三類方案的簡要對比如表3所示。
3.1 完全自建機房設(shè)計方案(方案1)
3.1.1 設(shè)計目標
遵循科學(xué)先進、實用高效、安全可靠、節(jié)能環(huán)保的設(shè)計理念,按照國家關(guān)于災(zāi)備系統(tǒng)能力的六級標準,結(jié)合集團公司的實際情況,將集團公司的信息系統(tǒng)按數(shù)據(jù)重要性和應(yīng)用時效性進行分類,重要信息系統(tǒng)達到五級標準,總體達到四級標準。如果集團公司數(shù)據(jù)中心出現(xiàn)重大災(zāi)難性損失,可以達到重要信息系統(tǒng)數(shù)據(jù)基本不丟失(當天數(shù)據(jù)可恢復(fù))、一般信息系統(tǒng)數(shù)據(jù)少量丟失(上周數(shù)據(jù)可恢復(fù))的目標。災(zāi)備中心建設(shè)要充分考慮可擴展性,并與集團公司主數(shù)據(jù)中心設(shè)計能力相匹配。在主中心暫停服務(wù)期間,災(zāi)備中心能夠提供基本的應(yīng)用系統(tǒng)服務(wù)和數(shù)據(jù)查詢工作。
3.1.2 災(zāi)備中心機房
災(zāi)備中心機房達到《電子信息系統(tǒng)機房設(shè)計規(guī)范》(GB 50174-2008)B級要求,保持7×24小時運行,設(shè)計能力達到集團公司主數(shù)據(jù)中心機房設(shè)計能力的50%。
機房建設(shè)包括裝飾裝修工程、UPS及配電系統(tǒng)工程、UPS設(shè)備、空調(diào)及新風(fēng)、機房空調(diào)設(shè)備、消防排煙系統(tǒng)工程、綜合布線系統(tǒng)、門禁系統(tǒng)、視頻監(jiān)控系統(tǒng)、動力環(huán)境監(jiān)控系統(tǒng)、大屏系統(tǒng)、KVM系統(tǒng)、火災(zāi)自動報警系統(tǒng)、氣體滅火系統(tǒng)工程、屏蔽機房工程、電力增容擴容、消防監(jiān)控系統(tǒng)改造等工程。
3.1.3 災(zāi)備信息系統(tǒng)
按照數(shù)據(jù)重要性和應(yīng)用時效性分類,集團公司現(xiàn)有需要實時備份的重要信息系統(tǒng)的災(zāi)備系統(tǒng)在數(shù)據(jù)方面達到國家5級標準,即實時數(shù)據(jù)遠程傳輸備份,其他信息系統(tǒng)可以采用每周備份的方式。
目前遠程數(shù)據(jù)復(fù)制有如下幾種實現(xiàn)方式:
(1)基于數(shù)據(jù)庫的復(fù)制技術(shù)。這種復(fù)制技術(shù)按方式可分為實時復(fù)制、定時復(fù)制和存儲轉(zhuǎn)發(fā)復(fù)制。該技術(shù)要求主機同構(gòu),存儲可異構(gòu),數(shù)據(jù)庫系統(tǒng)不同對于同構(gòu)性要求也有所不同。
(2)基于主機的遠程數(shù)據(jù)復(fù)制技術(shù)。這種方式主要是基于應(yīng)用系統(tǒng)、卷管理器或者備份軟件實現(xiàn),存儲系統(tǒng)可以異構(gòu),但主機的操作系統(tǒng)一般同構(gòu)?;谥鳈C的遠程復(fù)制對主機性能有較大影響。
(3)基于智能存儲的遠程數(shù)據(jù)復(fù)制技術(shù)。這種方式的優(yōu)勢在于數(shù)據(jù)復(fù)制軟件運行在存儲系統(tǒng)內(nèi),操作控制比較簡單,且能夠?qū)崿F(xiàn)很高的容災(zāi)恢復(fù)目標RTO和數(shù)據(jù)恢復(fù)時間點目標RPO。但對備份中心的存儲系統(tǒng)有嚴格的兼容性要求,一般需要來自同一個廠家的存儲系統(tǒng),這樣對備份中心存儲設(shè)備的選型帶來了限制。
(4)基于光纖交換機存儲虛擬化的遠程數(shù)據(jù)復(fù)制技術(shù)。這種方式需要光纖交換機和存儲系統(tǒng)協(xié)調(diào)一致,設(shè)備選擇余地小,成本高,管理復(fù)雜。
綜合系統(tǒng)效能等因素,互聯(lián)網(wǎng)的實時災(zāi)備系統(tǒng)可采用基于智能存儲的遠程數(shù)據(jù)復(fù)制技術(shù)方案。
3.2 自建機房+“云災(zāi)備”設(shè)計方案(方案2)
3.2.1 災(zāi)備中心機房
災(zāi)備中心機房達到《電子信息系統(tǒng)機房設(shè)計規(guī)范》(GB 50174-2008)B級要求,保持7×24小時運行,設(shè)計能力達到集團公司主數(shù)據(jù)中心機房設(shè)計能力的30%。互聯(lián)網(wǎng)區(qū)域則采用“云災(zāi)備”模式,租用公有云服務(wù)設(shè)備完成,從而減少了對自建機房的要求。
3.2.2 災(zāi)備信息系統(tǒng)
災(zāi)備信息系統(tǒng)由自建系統(tǒng)和災(zāi)備云兩部分組成。
自建系統(tǒng)主要采用基于智能存儲的遠程數(shù)據(jù)復(fù)制技術(shù)方案。基于互聯(lián)網(wǎng)的信息系統(tǒng)則采用租用“云計機”和“云存儲”設(shè)備,達到數(shù)據(jù)級災(zāi)備國家五級標準,即實時數(shù)據(jù)遠程傳輸備份。其他信息系統(tǒng)可以采用每周備份的方式。
從整體虛擬化架構(gòu)布局等因素考慮,云災(zāi)備中心將采用VMware或Hyper-V;集團公司本地機房與云災(zāi)備中心之間的網(wǎng)絡(luò)暢通,保障數(shù)據(jù)的傳輸。
3.2.3 信息安全防護
云平臺建立專門的安全保障體系,實現(xiàn)從接入層、傳輸層、數(shù)據(jù)存儲層、應(yīng)用層、運維層的全方位信息安全保障,目前云平臺國家信息安全已滿足國家信息安全等保三級標準??商峁┝髁壳逑?、服務(wù)器安全衛(wèi)士、云堡壘機、云WAF、漏洞掃描、滲透測試等服務(wù),對云主機本身、系統(tǒng)漏洞、WEB應(yīng)用等提供不同層面的安全服務(wù)。
3.3 改造現(xiàn)有機房方案(方案3)
適當改造現(xiàn)有機房。
4 結(jié) 語
三種災(zāi)備中心的建設(shè)方案各具特點,但綜合集團公司各方面的因素,個人認為自建機房+“云災(zāi)備”的方案更適合企業(yè)未來發(fā)展的要求。
主要參考文獻
[1]國家質(zhì)量監(jiān)督檢驗檢疫總局.GB/T 20988-2007 信息安全技術(shù)信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范[S].2007.
[2]王詠霖,朱滿彪.新時代互聯(lián)網(wǎng)的應(yīng)用和發(fā)展研究[J].通訊世界,2017(10):61-62.
[3]熊海清.網(wǎng)絡(luò)環(huán)境下企業(yè)數(shù)據(jù)備份與容災(zāi)問題的探討[J].鋁加工,2010(2):47-52.