韋宇星
(廣西壯族自治區(qū)信息中心,廣西 南寧 530000)
壯美廣西·政務云于2019年3月基本建成,建設有互聯(lián)網(wǎng)區(qū)和公用網(wǎng)絡區(qū)的獨立云平臺。政務云在規(guī)劃建設之初,僅規(guī)劃建設本地備份系統(tǒng),實現(xiàn)對政務云上的數(shù)據(jù)本地備份,主要向自治區(qū)級政務部門提供統(tǒng)一的IAAS層政務云資源服務,隨著廣西政務數(shù)據(jù)資源管理與改革的推進,現(xiàn)已承載800多個系統(tǒng)。壯美廣西·政務云是廣西政務服務開展的重要基礎設施,為保證政務云上信息系統(tǒng)的數(shù)據(jù)可靠,提供多種更安全的數(shù)據(jù)保護模式,因此開展壯美廣西·政務云災備體系的擴展建設十分必要。
較常見的容災模式可分為同城容災、異地容災、兩地三中心、雙活中心等模式。同城災難備份和異地災難備份各有所長,為達到最理想的防災效果,數(shù)據(jù)中心應考慮采用同城和異地各建立一個災難備份中心的方式[1]。綜合考慮容災模式的成熟度、建設成本等因素,結合自治區(qū)級各政務部門提出的具體需求,壯美廣西·政務云災備體系架構在原有本地災備的基礎上,構建“兩地三中心”模式,建設同城雙中心和異地災備中心。
壯美廣西·政務云構建的“兩地三中心”模式,RPO/RTO指標應至少達到以下要求。
1.2.1 同城數(shù)據(jù)備份與恢復
普通業(yè)務(等保備案3級系統(tǒng)),同城數(shù)據(jù)級全備份與恢復,RPO<60 s;重要業(yè)務(等保備案3級系統(tǒng)),同城數(shù)據(jù)級持續(xù)備份與恢復,RPO<10 s[2]。
1.2.2 同城應用切換及發(fā)布
重要業(yè)務(等保備案3級系統(tǒng)),同城基于軟件備份的系統(tǒng)恢復與發(fā)布服務,RPO<60 s;關鍵業(yè)務(等保備案5級系統(tǒng)),同城應用級應急接管與發(fā)布服務,RPO<10 s。
1.2.3 異地數(shù)據(jù)備份與恢復
全部業(yè)務,同城災備數(shù)據(jù)異地備份與數(shù)據(jù)恢復,RPO≤30 min;生產(chǎn)中心本地備份數(shù)據(jù)異地備份與數(shù)據(jù)恢復,RPO≤24 h。
經(jīng)過統(tǒng)籌考慮,“兩地三中心”的災備服務內(nèi)容包括數(shù)據(jù)備份服務和關鍵應用系統(tǒng)接管服務設計,服務如下。
1.3.1 同城數(shù)據(jù)級全備份與恢復服務
對生產(chǎn)中心主機(含虛擬機和物理機,不包含實施應急接管服務和重要數(shù)據(jù)庫系統(tǒng)實時備份與恢復服務的主機)基于備份軟件進行準實時同步備份,實現(xiàn)每臺備份主機在同城災備中心有一份準實時克隆備份數(shù)據(jù)。
1.3.2 同城數(shù)據(jù)磁盤陣列級異步復制備份
對生產(chǎn)中心所有存儲在政務云集中式存儲系統(tǒng)上的數(shù)據(jù)進行磁盤陣列級異步復制備份,實現(xiàn)政務云集中式存儲系統(tǒng)上的數(shù)據(jù)在同城災備中心有一份克隆備份數(shù)據(jù)。
1.3.3 同城數(shù)據(jù)級持續(xù)備份與恢復
在同城數(shù)據(jù)級全備份與恢復的基礎上,可選擇部分主機中的重要目錄文件或數(shù)據(jù)庫進行持續(xù)數(shù)據(jù)保護,保留多份備份數(shù)據(jù),并可恢復7天內(nèi)任一時間點數(shù)據(jù)[3]。
1.3.4 同城應用級應急接管
對部分重要信息系統(tǒng)進行應急接管服務,應急接管服務實現(xiàn)生產(chǎn)中心的應用快速切換至同城災備中心運行。
1.3.5 同城重要數(shù)據(jù)庫系統(tǒng)實時備份與恢復
對部分重要應用的數(shù)據(jù)庫系統(tǒng)進行實時備份服務,服務支持數(shù)據(jù)庫系統(tǒng)的快速恢復及啟動運行。
1.3.6 同城應用級應急運行
在同城數(shù)據(jù)級全備份與恢復、同城數(shù)據(jù)級持續(xù)備份與恢復、同城應用級應急接管和同城重要數(shù)據(jù)庫系統(tǒng)實時備份與恢復的基礎上,可實現(xiàn)部分應用手動切換到同城災備中心運行,并向政務外網(wǎng)或互聯(lián)網(wǎng)提供服務。
1.3.7 同城災備數(shù)據(jù)異地備份與恢復
將同城災備中心的所有數(shù)據(jù),包括同城數(shù)據(jù)級全備份與恢復服務、同城數(shù)據(jù)級持續(xù)備份與恢復服務、同城應用級應急接管服務和同城重要數(shù)據(jù)庫系統(tǒng)實時備份與恢復服務產(chǎn)生的數(shù)據(jù)遠程復制到異地災備中心保存,當發(fā)生災難時可將相關數(shù)據(jù)恢復到同城災備中心或生產(chǎn)中心。
壯美廣西·政務云生產(chǎn)中心位于南寧良慶區(qū),同城災備中心在考慮機房條件和距離的情況下,機房選擇在南寧市高新區(qū),距離生產(chǎn)中心直線16 km;異地災備中心機房選擇在來賓市運營商機房,距離生產(chǎn)中心162 km。
如圖1所示,在南寧同城容災中心的組網(wǎng)上,網(wǎng)絡區(qū)域化分為互聯(lián)網(wǎng)區(qū)、公用網(wǎng)絡區(qū)、安全管理區(qū)。在互聯(lián)網(wǎng)區(qū)、公用網(wǎng)絡區(qū)各自搭建同城災備云平臺,互聯(lián)網(wǎng)區(qū)云平臺負責生產(chǎn)中心互聯(lián)網(wǎng)區(qū)域業(yè)務的災備,公用網(wǎng)絡區(qū)域負責生產(chǎn)中心公用網(wǎng)絡區(qū)域業(yè)務的災備。安全管理區(qū)域承載本次項目所有的管理流量以及整個災備中心的網(wǎng)絡安全保障。在同城災備中心部署獨立的互聯(lián)網(wǎng)出口,可以實現(xiàn)互聯(lián)網(wǎng)區(qū)應用系統(tǒng)的切換發(fā)布;來賓異地備份中心僅做數(shù)據(jù)級災備,利用備份軟件實現(xiàn)操作系統(tǒng)層面數(shù)據(jù)存儲備份,不再建設云平臺。具體同城與異地災備的網(wǎng)絡互連設計如下:
圖1 網(wǎng)絡架構
(1)互聯(lián)網(wǎng)區(qū)域與公用網(wǎng)絡區(qū)物理上隔離,通過部署跨區(qū)域的數(shù)據(jù)交換系統(tǒng)實現(xiàn)受控的數(shù)據(jù)訪問和網(wǎng)絡互通。
(2)同城災備中心互聯(lián)網(wǎng)交換機與生產(chǎn)中心互聯(lián)網(wǎng)核心路由器之間通過2*10GE專線三層互連,實現(xiàn)信息系統(tǒng)應急接管后的業(yè)務發(fā)布訪問;公共網(wǎng)絡區(qū)與互聯(lián)網(wǎng)區(qū)域一致。
(3)災備中心互聯(lián)網(wǎng)接入交換機與生產(chǎn)中心互聯(lián)網(wǎng)核心交換機之間通過4*10GE專線互連,其中兩根接云廠商A核心交換機,兩根接云廠商B核心交換機,每兩根通過鏈路聚合的模式捆綁為一個邏輯接口,并在邏輯接口下配置trunk模式放通相關VLAN,生產(chǎn)中心接口也做相關配置,實現(xiàn)二層互通,打通災備中心與生產(chǎn)中心云平臺資源網(wǎng)絡,滿足備份數(shù)據(jù)流;公共網(wǎng)絡區(qū)與互聯(lián)網(wǎng)區(qū)域一致。
(4)災備中心所有區(qū)域的網(wǎng)絡、安全等設備均實現(xiàn)冗余部署,保證網(wǎng)絡可靠性。
針對容災項目實施,網(wǎng)絡設計為同城災備中心與生產(chǎn)中心網(wǎng)絡3層互通,保證同城災備云平臺上備份軟件控制機與所需安裝備份軟件包的虛擬機網(wǎng)絡互通。
2.2.1 同城數(shù)據(jù)級全備份服務網(wǎng)絡架構
數(shù)據(jù)級全備份涉及生產(chǎn)中心上所有信息系統(tǒng),用20對1的方式進行數(shù)據(jù)實時同步,網(wǎng)絡采用三層互通的方式。
(1)備份軟件通過備份控制機進行策略下發(fā),控制機分別與生產(chǎn)中心、災備中心虛擬機網(wǎng)絡可達。
(2)備份軟件數(shù)據(jù)同步工作是通過生產(chǎn)中心業(yè)務IP與同城災備中心對應災備機的數(shù)據(jù)復制IP可達實現(xiàn)。目前20個生產(chǎn)虛擬機數(shù)據(jù)同步至1臺災備中心的備份虛擬機內(nèi)。
2.2.2 同城生產(chǎn)中心持續(xù)數(shù)據(jù)保護服務網(wǎng)絡架構
基于數(shù)據(jù)級全備份服務架構的網(wǎng)絡架構,可實現(xiàn)持續(xù)數(shù)據(jù)保護服務。
(1)災備中心承載災備數(shù)據(jù)的虛擬機與災備中心連續(xù)保護機器網(wǎng)絡可達,實現(xiàn)關鍵業(yè)務數(shù)據(jù)的連續(xù)保護,20個災備虛擬機數(shù)據(jù)同步至1臺連續(xù)保護虛擬機內(nèi)。
2.2.3 異地數(shù)據(jù)級全備份服務網(wǎng)絡架構
異地數(shù)據(jù)級全備份涉及全網(wǎng)所有業(yè)務系統(tǒng),采用20對1的方式進行數(shù)據(jù)定時同步,網(wǎng)絡采用三層互通的方式。
(1)異地備份軟件通過異地控制機進行策略下發(fā),控制機與同城災備中心的備份虛擬機、異地備份虛擬機網(wǎng)絡可達。
(2)備份軟件數(shù)據(jù)根據(jù)帶寬完成對同城災備虛擬機在來賓異地的數(shù)據(jù)同步,實現(xiàn)20對1的備份。
2.3.1 同城數(shù)據(jù)級備份實施
采用多對一數(shù)據(jù)集中備份方式。生產(chǎn)中心4 000臺虛擬機,比例為20∶1,則在同城災備中心云平臺上開通200臺實時備份虛擬機。在生產(chǎn)中心的虛擬機、同城災備中心的實時備份虛擬機上安裝備份軟件,在災備控制機上啟動實時備份規(guī)則,全服務器備份任務首先會將源端系統(tǒng)所有數(shù)據(jù)(包括文件系統(tǒng)、用戶數(shù)據(jù)目錄)一次性同步到備份虛擬機上。
2.3.2 同城數(shù)據(jù)級持續(xù)備份實施
采用多對一數(shù)據(jù)集中備份方式。同城災備中心的200臺實時備份主機中獲取數(shù)據(jù)(原主機為≥1 000臺),按照20∶1的比例,開通10臺同城容災中心持續(xù)備份虛擬機,屬于一種級聯(lián)備份,啟動備份軟件的CDP功能,實現(xiàn)7天的數(shù)據(jù)持續(xù)性保護。
2.3.3 同城重要數(shù)據(jù)庫系統(tǒng)備份實施
同時采用一對一、多對一數(shù)據(jù)集中備份方式。未來將根據(jù)調(diào)研云租戶的具體結果,混合采用復制和備份技術開展備份。選擇采用備份軟件的解析數(shù)據(jù)庫在線日志的實時復制技術或基于文件系統(tǒng)實施復制的高可用技術。
2.3.4 同城應用級應急接管實施
采用一對一備份形式。生產(chǎn)中心虛擬機與同城災備中心的虛擬機一一對應,使用備份軟件的復制規(guī)則,將生產(chǎn)虛擬機直接復制至備份虛擬機,并且啟用應用高可用功能。
2.3.5 同城災備數(shù)據(jù)的異地備份實施
采用多對一的數(shù)據(jù)集中備份方式。備份同城災備中心的所有數(shù)據(jù),包括200臺實時備份主機,50個數(shù)據(jù)庫的災備主機,50個應用(200個虛擬機),利用來賓異地中心的物理服務器開展備份。
一是構建異構解耦容災云平臺。具備云平臺無關性,實現(xiàn)生產(chǎn)中心和災備中心之間使用異構云平臺進行的統(tǒng)一災備,避免了品牌鎖定,增加整個政務云的數(shù)據(jù)可靠性,打造國內(nèi)電子政務領域首例異構云容災方案。二是應用字節(jié)級復制技術。基于異構政務云的場景,采用業(yè)界領先的字節(jié)級復制技術,以傳統(tǒng)容災20%的資源實現(xiàn)政務云上信息系統(tǒng)的數(shù)據(jù)業(yè)務容災。三是提供全?;臑膫浞?。提供從網(wǎng)絡、存儲、數(shù)據(jù)庫、虛擬化到應用的全棧容災技術,提供多樣化的容災服務,實現(xiàn)低成本、高可靠、高安全、滿足電子政務外網(wǎng)業(yè)務運行的主要場景災備。
本次項目災備體系建設,實現(xiàn)對壯美廣西·政務云生產(chǎn)中心進行同城災備及異地備份,實現(xiàn)生產(chǎn)中心每臺備份主機在同城災備中心有一份準實時克隆備份數(shù)據(jù),并且可支持部分核心業(yè)務系統(tǒng)在同城災備中心同時進行恢復數(shù)據(jù)和啟動應用,滿足RPO小于30 s,RTO小于30 min的要求。