黃楠
摘要:該文在調(diào)研災(zāi)備系統(tǒng)背景及原理的基礎(chǔ)上,闡述了交行卡中心虛擬機(jī)及網(wǎng)絡(luò)現(xiàn)狀,分析了目前交行卡中心虛擬機(jī)災(zāi)備系統(tǒng)設(shè)計(jì)當(dāng)中的相關(guān)難點(diǎn)問題并針對交行卡中心虛擬災(zāi)備系統(tǒng)的建立提出了在數(shù)據(jù)復(fù)制方案以及網(wǎng)絡(luò)切換方案選擇上的對策方案。
關(guān)鍵詞:災(zāi)備系統(tǒng);交行卡中心;數(shù)據(jù)復(fù)制;網(wǎng)絡(luò)切換方案;對策
中圖分類號:TP393? ? ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2021)14-0240-03
1 緒論
1.1 研究背景
災(zāi)備系統(tǒng)是保證企業(yè)業(yè)務(wù)正常運(yùn)轉(zhuǎn),為企業(yè)和用戶提供優(yōu)質(zhì)服務(wù)的重要組成部分。電子計(jì)算機(jī)技術(shù)的發(fā)展為更多的企業(yè)帶來業(yè)務(wù)上的發(fā)展機(jī)遇,但受限于機(jī)器設(shè)備的落后,在很大程度上影響了工作的正常運(yùn)行,常常出現(xiàn)企業(yè)相關(guān)系統(tǒng)癱瘓的現(xiàn)象,一些企業(yè)的業(yè)務(wù)無法正常開展而使得企業(yè)遭受了巨大的損失。目前交行卡中心有A、B、C、D四級災(zāi)備系統(tǒng),其中A級災(zāi)備系統(tǒng)與B級災(zāi)備系統(tǒng)在災(zāi)備管理要求上一致,但是A級災(zāi)備系統(tǒng)要求在實(shí)施之前必須先按照B級和C級的管理要求實(shí)施災(zāi)備管理,在此基礎(chǔ)上為A級災(zāi)備系統(tǒng)的實(shí)施提供數(shù)據(jù)、應(yīng)用的技術(shù)信息支持。
1.2 災(zāi)備系統(tǒng)原理
多個(gè)虛擬機(jī)如果要在一臺物理服務(wù)器上實(shí)現(xiàn)同時(shí)運(yùn)行需要依托虛擬化技術(shù)為基礎(chǔ)的云平臺,依托虛擬化云平臺可以實(shí)現(xiàn)硬件設(shè)備與軟件系統(tǒng)之間的強(qiáng)耦合,同時(shí)帶來了封裝、分區(qū)及隔離等多方好處。災(zāi)備系統(tǒng)很重要的一點(diǎn)就是虛擬機(jī)備份的問題,備份主要涉及虛擬存儲、虛擬機(jī)系統(tǒng)狀態(tài)等兩個(gè)方面的內(nèi)容,而內(nèi)存、虛擬磁盤及其他配置信息組成了虛擬機(jī)存儲。
2 交行卡中心虛擬機(jī)及網(wǎng)絡(luò)現(xiàn)狀
目前,交行卡中心已經(jīng)建立的虛擬機(jī)災(zāi)備系統(tǒng)當(dāng)中,包括兩個(gè)重要組成部分,虛擬機(jī)應(yīng)用部分以及相應(yīng)的網(wǎng)絡(luò)架構(gòu)設(shè)置部分。通常情況下,災(zāi)備系統(tǒng)當(dāng)中,虛擬機(jī)實(shí)際上是作為信息備份、數(shù)據(jù)存儲的應(yīng)用操作點(diǎn),各地區(qū)之間的網(wǎng)絡(luò)架構(gòu)通過各個(gè)點(diǎn)位連接在一起,使得虛擬機(jī)各個(gè)點(diǎn)位有效結(jié)合在一起,成為一套有機(jī)統(tǒng)一的災(zāi)備系統(tǒng)。本文主要對交行卡中心虛擬機(jī)應(yīng)用現(xiàn)狀以及網(wǎng)絡(luò)架構(gòu)現(xiàn)狀兩個(gè)方面進(jìn)行分析。
2.2 交行卡中心虛擬機(jī)現(xiàn)狀
虛擬機(jī)作為計(jì)算機(jī)平臺與用戶終端之間創(chuàng)建的一種聯(lián)系紐帶,可以讓用戶帶來操作軟件,也可以模擬硬件設(shè)備的實(shí)現(xiàn)。
目前,交行卡中心的災(zāi)備系統(tǒng)使用的都是VMware虛擬機(jī)和SRM系統(tǒng)。該系統(tǒng)的總體架構(gòu)共分為4層:第一層為數(shù)據(jù)存儲層,所有虛擬機(jī)都存放在數(shù)據(jù)存儲層中。第二層為物理機(jī)層,是所有虛擬機(jī)載體。第三層為虛擬機(jī)層,每臺虛擬機(jī)為一個(gè)單獨(dú)的業(yè)務(wù)系統(tǒng)。第四層為虛擬映射設(shè)備層,包括虛擬映射串口、虛擬映射USB等。
2.2 網(wǎng)絡(luò)現(xiàn)狀
交行卡中心主體網(wǎng)絡(luò)結(jié)構(gòu)分為兩個(gè)部分,辦公測試網(wǎng)絡(luò)區(qū)域和生產(chǎn)網(wǎng)絡(luò)區(qū)域,兩個(gè)網(wǎng)絡(luò)區(qū)域依靠管理網(wǎng)絡(luò)、虛擬機(jī)交互網(wǎng)絡(luò)和VMotion網(wǎng)絡(luò)三部分來實(shí)現(xiàn)區(qū)域之間信息數(shù)據(jù)的交互傳遞。管理網(wǎng)絡(luò)主要是為了方便部門管理人員對兩個(gè)子網(wǎng)絡(luò)進(jìn)行信息數(shù)據(jù)的查詢與監(jiān)管;虛擬機(jī)網(wǎng)絡(luò)和VMotion網(wǎng)絡(luò)則是實(shí)現(xiàn)異地的信息備份與復(fù)原。交行卡中心生產(chǎn)網(wǎng)絡(luò)區(qū)域的結(jié)構(gòu)設(shè)置與XX企業(yè)生產(chǎn)區(qū)域核心機(jī)房的地理位置設(shè)置相類似。在交行卡中心辦公測試網(wǎng)絡(luò)區(qū)域之中,設(shè)置了辦公VCenter區(qū)域網(wǎng)絡(luò)以及測試PaaS VCenter兩個(gè)子網(wǎng)絡(luò)區(qū)域,而在交行卡中心生產(chǎn)網(wǎng)絡(luò)區(qū)域之中設(shè)置了生產(chǎn)VCenter、生產(chǎn)金京PaaS VCenter和生產(chǎn)富特PaaS VCenter三個(gè)子網(wǎng)絡(luò)區(qū)域。
3 災(zāi)備方案流程及設(shè)計(jì)難點(diǎn)
3.1 設(shè)計(jì)方案流程
交行卡中心在建立整體災(zāi)備方案之前,首先要明確構(gòu)建災(zāi)備系統(tǒng)的目標(biāo)與原則;其次需要建立完善的災(zāi)備中心,需要包含同城災(zāi)備中心與異地災(zāi)備中心;接著建立起重要業(yè)務(wù)恢復(fù)災(zāi)備等級;最后建立災(zāi)備系統(tǒng)的IT基礎(chǔ)架構(gòu)。在建立網(wǎng)絡(luò)IT基礎(chǔ)架構(gòu)方面,主要包含了三項(xiàng)內(nèi)容:(1)建立良好的存儲系統(tǒng);(2)建立性能完善網(wǎng)絡(luò)整體結(jié)構(gòu);(3)建立良好的數(shù)據(jù)庫系統(tǒng)。
3.2 設(shè)計(jì)難點(diǎn)
(1)同城、異地災(zāi)備中心的網(wǎng)絡(luò)切換
在交行卡中心災(zāi)備系統(tǒng)的建立過程中,由于不同的機(jī)房之間的網(wǎng)絡(luò)IP地址不同,因此要解決同城、異地災(zāi)備情況下進(jìn)行合適的網(wǎng)絡(luò)切換的問題。在進(jìn)行網(wǎng)絡(luò)切換時(shí),往往需要考慮的因素包含了從網(wǎng)絡(luò)層、存儲層、主機(jī)系統(tǒng)層三個(gè)層次的網(wǎng)絡(luò)切換問題。當(dāng)選擇不同的災(zāi)備方案時(shí),具體的網(wǎng)絡(luò)切換需求也有所不同,也就是說當(dāng)生產(chǎn)中心出現(xiàn)災(zāi)難時(shí),選擇同城災(zāi)備與選擇異地災(zāi)備時(shí),會產(chǎn)生不同的網(wǎng)絡(luò)切換方案。
(2)不同機(jī)房的虛擬機(jī)之間的數(shù)據(jù)復(fù)制
在交行卡中心災(zāi)備系統(tǒng)正常使用的過程之中,不同的虛擬機(jī)之間的數(shù)據(jù)需要進(jìn)行復(fù)制,此復(fù)制過程關(guān)系到各個(gè)站點(diǎn)機(jī)房(生產(chǎn)中心、同城災(zāi)備中心、異地災(zāi)備中心)之間的數(shù)據(jù)信息能否正常且高效地傳遞,因?yàn)?,良好穩(wěn)定的數(shù)據(jù)復(fù)制傳輸才可以有效保證虛擬機(jī)災(zāi)備系統(tǒng)的正常運(yùn)行,交行卡中心現(xiàn)有的災(zāi)備系統(tǒng)中,虛擬機(jī)之間的位置關(guān)系、網(wǎng)絡(luò)架構(gòu)較為復(fù)雜,因此就需要設(shè)計(jì)出完善的虛擬機(jī)數(shù)據(jù)復(fù)制過程。
4 虛擬機(jī)災(zāi)備系統(tǒng)建立對策
4.1 數(shù)據(jù)復(fù)制方案的設(shè)計(jì)與實(shí)施
4.1.1 通過存儲進(jìn)行復(fù)制
通過綜合考慮,我們選擇了通過存儲來實(shí)現(xiàn)進(jìn)一步復(fù)制的方案,將所有需要災(zāi)備管理的虛擬機(jī)所在的LUN通過存儲復(fù)制到災(zāi)備端。正常工況下,災(zāi)備端虛擬機(jī)的LUN呈現(xiàn)只讀的模式,會通過腳本的方式把所有虛擬機(jī)清單建立;非正常工況下,例如處于災(zāi)備演練狀態(tài)或者主站點(diǎn)出現(xiàn)災(zāi)難而需要進(jìn)行災(zāi)備管理的時(shí)候就需要通過腳本啟動虛擬機(jī)。
(1)方案拓?fù)?/p>
(2)災(zāi)備流程
災(zāi)備流程主要針對非正常工況下需要進(jìn)行災(zāi)備管理的狀態(tài),虛擬機(jī)會實(shí)現(xiàn)從主機(jī)房切換到災(zāi)備機(jī)房,通過存儲復(fù)制方式,由腳本把虛擬災(zāi)備機(jī)房掛載到災(zāi)備的VCenter的清單中,然后開啟虛擬機(jī),再通過腳本的方式配置IP地址、網(wǎng)關(guān)和DNS,然后進(jìn)行應(yīng)用驗(yàn)證其是否正常,最后進(jìn)行業(yè)務(wù)驗(yàn)證。
(3)優(yōu)缺點(diǎn)分析
優(yōu)點(diǎn)是成本低,部署方便;缺點(diǎn)是恢復(fù)復(fù)雜,腳本套腳本,容易出錯(cuò),耗時(shí)長,RTO沒有保障。
4.1.2 通過SRM進(jìn)行復(fù)制
交行卡中心虛擬機(jī)系統(tǒng)設(shè)計(jì)通過SRM進(jìn)行VR復(fù)制,通過SRM進(jìn)行調(diào)度恢復(fù),在部署SRM服務(wù)器和vCenter、ESXi和VR版本實(shí)現(xiàn)兼容的前提下當(dāng)遇到需要進(jìn)行災(zāi)備管理的情況時(shí),故障主站點(diǎn)如果要實(shí)現(xiàn)切換到同城災(zāi)備站點(diǎn),只需要一個(gè)按鈕,就可以按事先的設(shè)置方案進(jìn)行切換,無須人工和腳本干預(yù),IP地址和DNS都會按事先的設(shè)置方案自動配置。
4.1.3 方案選擇
根據(jù)前期的調(diào)研和對比,我們使用SRM站點(diǎn)恢復(fù)管理軟件的方式來做虛擬機(jī)同城災(zāi)備,因?yàn)樾枰獮?zāi)備的虛擬機(jī)有400多臺,后期可能因?yàn)橄到y(tǒng)的調(diào)整,需要做災(zāi)備的虛擬機(jī)會越來越多,怎么在滿足監(jiān)管要求的同時(shí),做到滿足業(yè)務(wù)的實(shí)際需求,做到操作便利都是需要進(jìn)行考慮的問題。
4.2 網(wǎng)絡(luò)切換方案選擇
4.2.1 同城災(zāi)備網(wǎng)絡(luò)切換
同城災(zāi)備實(shí)施全網(wǎng)切換的時(shí)候需要考慮網(wǎng)絡(luò)層、存儲層以及主機(jī)系統(tǒng)層三個(gè)方面的切換。
網(wǎng)絡(luò)層:網(wǎng)絡(luò)層的主要作用是當(dāng)生產(chǎn)中心網(wǎng)絡(luò)完全不可用的時(shí)候來實(shí)現(xiàn)所有分行的切換和連接。
存儲層:儲存層作為災(zāi)備中心儲存數(shù)據(jù)的一層,當(dāng)主機(jī)的存儲設(shè)備被控制或者同步數(shù)據(jù)復(fù)制鏈路被斷開后來進(jìn)行自動切換。當(dāng)同步數(shù)據(jù)復(fù)制鏈路恢復(fù)后,儲存層中更新的數(shù)據(jù)會自動復(fù)制回生產(chǎn)中心的存儲設(shè)備中。
主機(jī)系統(tǒng)層:同城災(zāi)備系統(tǒng)使用的是DNS機(jī)制,因此,主機(jī)系統(tǒng)層的應(yīng)用訪問可以平滑的在生產(chǎn)中心和同城災(zāi)備中心間遷移,無須進(jìn)行切換。
4.2.2 異地災(zāi)備網(wǎng)絡(luò)切換
網(wǎng)絡(luò)層:當(dāng)出現(xiàn)同城災(zāi)備中心及生產(chǎn)中心網(wǎng)絡(luò)斷開而無法服務(wù)時(shí),所有的網(wǎng)點(diǎn)切換、分行及外聯(lián)都由異地災(zāi)備中心的網(wǎng)絡(luò)層進(jìn)行連接。
存儲層:異地災(zāi)備中心的主機(jī)持續(xù)進(jìn)行遠(yuǎn)程復(fù)制(CRR)災(zāi)難恢復(fù)模式的時(shí)候,可對異地災(zāi)備中心的存儲數(shù)據(jù)進(jìn)行訪問。當(dāng)停止對異地災(zāi)備中心存儲的訪問的時(shí)候,再將全系統(tǒng)的同步數(shù)據(jù)復(fù)制關(guān)系進(jìn)行重新恢復(fù),來實(shí)現(xiàn)對更新的數(shù)據(jù)進(jìn)行回切。等數(shù)據(jù)同步完成后通過對全系統(tǒng)的數(shù)據(jù)復(fù)制關(guān)系進(jìn)行反轉(zhuǎn),最后恢復(fù)到原生產(chǎn)模式。
主機(jī)系統(tǒng)層:異地災(zāi)備的實(shí)現(xiàn)通過采用DNS訪問方案,對原有應(yīng)用服務(wù)的訪問方式的IP地址進(jìn)行修改實(shí)現(xiàn)。
4.2.3 DNS方案設(shè)計(jì)
本次DNS為硬件設(shè)備,DNS切換總體方案采用緩存遞歸和權(quán)威分離的架構(gòu),可以實(shí)現(xiàn)流量精細(xì)化的控制、區(qū)域之間的邊界安全策略、滿足客戶端和服務(wù)端快速查詢的需求以及分離DMZ區(qū)用于權(quán)威域名資產(chǎn)安全的管理。
本次部署的設(shè)備總計(jì)8臺,數(shù)據(jù)中心劃分為生產(chǎn)區(qū)、辦公區(qū)、測試區(qū)。每臺DNS設(shè)備生產(chǎn)端口均雙上聯(lián)交換,綁定模式為動態(tài)鏈路聚合,實(shí)現(xiàn)鏈路冗余。采用與負(fù)載均衡設(shè)備聯(lián)動方式進(jìn)行部署,所有的DNS由SLB提供VS訪問入口,所有的服務(wù)端DNS主指向本區(qū)域SLB VS地址,備指向異地中心相同區(qū)域的SLB VS地址。
5 結(jié)束語
在災(zāi)備方案設(shè)計(jì)當(dāng)中會牽扯到各種各樣的虛擬化內(nèi)容,包括機(jī)房的建設(shè)、網(wǎng)絡(luò)方案的設(shè)計(jì)選擇、DNS方案的設(shè)計(jì)選擇、存儲方案的設(shè)計(jì)選擇等,這些內(nèi)容都需要虛擬化的災(zāi)備和恢復(fù)方案。筆者在本次同城災(zāi)備的研究之中從前期的準(zhǔn)備到方案調(diào)研、IP地址的變換、使用DNS方式等過程都經(jīng)過了反復(fù)的論證最終得出適合交行卡中心的方案。在關(guān)于虛擬機(jī)災(zāi)備方案的選擇之上,筆者以數(shù)據(jù)信息的復(fù)制與恢復(fù)、災(zāi)備系統(tǒng)各模塊之間的關(guān)系、建立保護(hù)組等作為重點(diǎn)研究內(nèi)容,在確定好最終網(wǎng)絡(luò)方案后對其進(jìn)一步做了實(shí)現(xiàn)。確保交行卡中心的虛擬機(jī)災(zāi)備系統(tǒng)的建設(shè)能夠滿足監(jiān)管和實(shí)際業(yè)務(wù)的要求,當(dāng)主機(jī)房發(fā)生故障時(shí),可以快速切換到災(zāi)備機(jī)房,為交行卡中心的同城災(zāi)備系統(tǒng)的信息化、數(shù)字化、現(xiàn)代化建設(shè),打下了良好的基礎(chǔ)。
參考文獻(xiàn):
[1] 閆瑾,宮思明,姚丹,等.信息系統(tǒng)容災(zāi)備份技術(shù)探討[J].信息與電腦(理論版),2020,32(12):46-48.
[2] 韓瑩利.數(shù)據(jù)同城災(zāi)備系統(tǒng)的建設(shè)思考[J].數(shù)字技術(shù)與應(yīng)用,2019,37(12):232,234.
【通聯(lián)編輯:代影】