信息系統(tǒng)實施容災(zāi)備份建設(shè),主要技術(shù)可分為四個部分:通信鏈路備份與切換、路由設(shè)備及協(xié)議備份與切換、內(nèi)網(wǎng)核心交換虛擬化和應(yīng)用平臺應(yīng)急備份與恢復(fù)。
此外,為提升終端設(shè)備和存儲設(shè)備的穩(wěn)定性,可視物理環(huán)境和保障需要,增加終端備份和存儲備份手段。
為保證系統(tǒng)整體容災(zāi)備份能力,采用“整體模型、分系統(tǒng)構(gòu)建、整體實現(xiàn)”由總—分—總的分析方法。在完成模型設(shè)計后,將信息系統(tǒng)從硬件配置、通信線路、網(wǎng)絡(luò)協(xié)議、路由協(xié)議等多個方面,劃分為通信鏈路、網(wǎng)際路由、內(nèi)網(wǎng)互聯(lián)和應(yīng)用平臺應(yīng)急恢復(fù)四個分系統(tǒng),應(yīng)用Packet Tracer和GNS3仿真器,或依據(jù)測試目標(biāo)和內(nèi)容搭建相應(yīng)的網(wǎng)絡(luò)環(huán)境,對其分別進行模擬和測試分析。
如圖1所示,通信鏈路分系統(tǒng)采取雙鏈路互為備份的機制,配置動態(tài)路由協(xié)議接口優(yōu)先級,實現(xiàn)鏈路優(yōu)化選擇和自動切換,達到對通信鏈路備份保護的目的。
信息系統(tǒng)通信鏈路主要有光纜網(wǎng)和衛(wèi)星資源網(wǎng)電路,通常固定開設(shè)階段以光纜網(wǎng)為主用,衛(wèi)星資源網(wǎng)為備用信道,機動或短停階段以衛(wèi)星資源網(wǎng)為主用,固定光纜網(wǎng)為備用信道。
衡量通信鏈路質(zhì)量指標(biāo)主要是網(wǎng)絡(luò)時延大小,在不計算數(shù)據(jù)報文排隊處理時間的前提下,網(wǎng)絡(luò)時延T主要由傳輸時延TS和傳播時延TB組成。
其中,傳輸時延是所有數(shù)據(jù)在鏈路上傳輸?shù)臅r間,由數(shù)據(jù)分組長度L和傳輸速率R決定,即TS=L/R;傳播時延是數(shù)據(jù)在鏈路物理媒體上傳播的時間,由傳播距離S和傳播速率C決定,即TB=S/C。因此,網(wǎng)絡(luò)時延≈傳輸時延+傳播時延,即T≈TS+TB= L/R+ S/C。
以icmp報文為例(PING報文長度設(shè)定1500字節(jié),要考慮發(fā)送和接收雙向),在光纜網(wǎng)鏈路傳輸時,2Mbps速率,通信距離200Km,傳播時延為微秒級,網(wǎng)絡(luò)時延以傳輸時延為主,T≈2TS=2*L/R=2*1500*8/2000000=12ms;在衛(wèi)星資源網(wǎng)傳輸時,網(wǎng)絡(luò)時延以傳播時延為主,T≈2TB=2*S/C=2*2*35800/(3*105)=477ms(以地球同步衛(wèi)星通信計算)。
可見,固定光纜網(wǎng)鏈路網(wǎng)絡(luò)時延較小,衛(wèi)星資源網(wǎng)鏈路時延較大,根據(jù)業(yè)務(wù)和通信要求,選擇適當(dāng)?shù)耐ㄐ沛溌贰?/p>
圖1 信息系統(tǒng)通信鏈路模擬圖
網(wǎng)際路由分系統(tǒng)是信息系統(tǒng)與外部通信的主要環(huán)節(jié),對其實施的保護主要包括路由設(shè)備熱備份、路由參數(shù)同步、虛擬路由技術(shù)及外聯(lián)接口切換等。
如圖2所示,信息系統(tǒng)外部鏈接由邊界路由器1和邊界路由器2實現(xiàn),分別與上聯(lián)節(jié)點路由器建立各兩條冗余通信鏈路,采用動態(tài)路由協(xié)議OSPF進行路由同步和調(diào)整,1臺邊界路由器故障終端,另一臺仍能保持網(wǎng)絡(luò)正常通信,邊界路由器1和邊界路由器2運行VRRP協(xié)議,對內(nèi)部網(wǎng)絡(luò)虛擬為一臺路由設(shè)備,提高內(nèi)網(wǎng)出聯(lián)的冗余備份能力。
(1)鏈路自動切換。
模擬上聯(lián)節(jié)點和邊界路由器1之間光纜網(wǎng)和衛(wèi)星資源網(wǎng)鏈路自動調(diào)整,前面已分析過固定光纜網(wǎng)時延小,應(yīng)是優(yōu)先選擇的鏈路,如何做到路由設(shè)備優(yōu)選固定光纜網(wǎng)鏈路。分析路由選擇策略,那條鏈路優(yōu)選主要決定于兩個因素:
首先是接口優(yōu)先級,優(yōu)先級高的接口優(yōu)先被選用。
再次是開銷COST,這個值等于參考帶寬/接口帶寬,一般參考帶寬為100Mbps,接口帶寬越大COST值越小,被選擇的可能性越大。
實際工作中,衛(wèi)星鏈路接口帶寬可能會比較大(實際傳輸速率低,但接口可能使用10M網(wǎng)口),在接口默認(rèn)優(yōu)先級一樣的情況下,往往會選擇衛(wèi)星鏈路為主用路由。
因此,想優(yōu)先選擇光纜網(wǎng)鏈路,應(yīng)在光纜網(wǎng)鏈路接口上配置OSPF優(yōu)先級高于衛(wèi)星鏈路。
如圖3所示,S0/3/0接口連接光纜網(wǎng)鏈路,F(xiàn)0/1接口連接衛(wèi)星資源網(wǎng)鏈路,優(yōu)先級改變后路由變化結(jié)果,衛(wèi)星鏈路接口優(yōu)先級變?yōu)?00,優(yōu)先使用S0/3/0接口,設(shè)備重啟后路由發(fā)生了相應(yīng)變化,此時光纜網(wǎng)為主用鏈路。
(2)路由設(shè)備備份。
從模擬路由設(shè)備互聯(lián)圖6看出,信息系統(tǒng)采用兩臺邊界路由器對上鏈接,配置OSPF協(xié)議,能根據(jù)鏈路狀態(tài)實時調(diào)整路由信息,當(dāng)一臺路由設(shè)備故障時,另一臺能保持網(wǎng)絡(luò)正常通聯(lián),從而實現(xiàn)路由設(shè)備及路由數(shù)據(jù)備份。
(3)虛擬路由技術(shù)。
為了保證我們網(wǎng)絡(luò)的穩(wěn)定性和可靠性,或用一條出口鏈路接兩臺路由器做熱備份路由,當(dāng)主路由器功能出現(xiàn)故障時,應(yīng)用VRRP(虛擬路由器冗余協(xié)議, RFC2338)由另外一個路由器來接管相應(yīng)的工作。
通過設(shè)置虛擬路由器為缺省路由器,用戶在路由器發(fā)生故障時可以繼續(xù)通信。
如圖4所示,利用同一個以太網(wǎng)中的兩臺路由器R1、R2設(shè)置一臺虛擬路由器。
在實際運行中,兩臺路由器中的任一臺成為主路由器,該主路由器模擬虛擬路由器。備份路由器監(jiān)控主由器狀態(tài)。一旦主路由器出現(xiàn)故障影響網(wǎng)絡(luò)運行,備份路由器立即進入主路由器狀態(tài)以模擬虛擬路由器。IP地址被分配給虛擬路由器。指定虛擬路由器IP地址為缺省路由器的服務(wù)器將不會覺察主路由器的切換而繼續(xù)進行正常通信。VRRP具體配置過程:
圖2 信息系統(tǒng)路由設(shè)備互聯(lián)
圖3 優(yōu)先級改變后路由變化結(jié)果圖
圖4 VRRP配置結(jié)構(gòu)圖
進行R1路由器配置,首先創(chuàng)建VRRP組1,虛擬網(wǎng)關(guān)為192.168.100.1
[R1-Vlan-interface10]vrrp vrid 1 virtual-ip 192.168.100.1
其次,設(shè)置VRRP組優(yōu)先級為120,缺省為100
[R1-Vlaninterface10]vrrp vrid 1 priority 120
然后,設(shè)置為搶占模式
[R1-Vlaninterface10]vrrp vrid 1 preempt-mode
最后,設(shè)置監(jiān)控端口為為interface vlan 20,如果端口Down掉優(yōu)先級降低30
[R1-Vlaninterface10]vrrp vrid 1 track Vlan-interface 20 reduced 30
下 面 進 行R2路由器配置,首先創(chuàng)建VRRP組1,虛擬網(wǎng)關(guān)為192.168.100.1
[R2-Vlan-interface10]vrrp vrid 1 virtual-ip 192.168.100.1
其次,設(shè)置為搶占模式
[R2-Vlan-interface10]vrrp vrid 1 preempt-mode
內(nèi)網(wǎng)互聯(lián)分系統(tǒng)是要素節(jié)點是核心交換設(shè)備,對其保護就是通過采用虛擬交換技術(shù),實現(xiàn)把兩臺核心交換設(shè)備虛擬成一臺,使用聚合端口進行連接,能夠有效利用冗余鏈路的同時提升系統(tǒng)的轉(zhuǎn)發(fā)能力。
模擬測試虛擬交換技術(shù),要根據(jù)核心交換設(shè)備類型,選用相應(yīng)廠家的專用協(xié)議,這里以銳捷交換設(shè)備采用VSU協(xié)議為例進行測試。內(nèi)網(wǎng)互聯(lián)采用虛擬交換技術(shù)結(jié)構(gòu)圖如圖5所示。
下面按照網(wǎng)絡(luò)鏈接結(jié)構(gòu)圖,選用兩臺S7808交換機為核心交換機,三臺華為S2700為接入交換機構(gòu)建模擬網(wǎng)絡(luò),核心交換設(shè)備VSU基本配置如下:
首先,配置核心交換機1
Switch1(config)#switch virtual domain 1
Switch1(config-vsdomain)# switch 1
Switch1(configvs-domain)# switch 1 priority 200
//默認(rèn)優(yōu)先級為100,配置為較高的優(yōu)先級,VSU建立成功后將會成為管理主機。
Switch1(config-vsdomain)# exit
Switch1(config)# vslaggregateport 1
圖5 內(nèi)網(wǎng)互聯(lián)采用虛擬交換技術(shù)結(jié)構(gòu)圖
//VSL鏈路至少需要2條,一條鏈路可靠性較低,當(dāng)出現(xiàn)鏈路震蕩時,VSU會非常不穩(wěn)定。
Switch1(configvsl-ap-1)# portmember interface TenGigabitEthernet 2/1
//配 置 VSL鏈 路,VSU主備核心之間的心跳鏈路和流量通道
Switch1(configvsl-ap-1)# portmember interface TenGigabitEthernet 2/2
Switch1(config-vslap-1)# exit
其次配置核心交換機2
Switch2(config)#switch virtual domain 1//domaind id 必須和第一臺一致
Switch2(configvs-domain)# switch 2//第二臺設(shè)備必須更改ID為2
Switch2(configvs-domain)# switch 2 priority 150
Switch2(config-vsdomain)# exit
Switch2(config)#vsl-aggregateport 1
//VSL鏈路至少需要2條,一條鏈路可靠性較低,當(dāng)出現(xiàn)鏈路震蕩時,VSU會非常不穩(wěn)定。
Switch2(configvsl-ap-1)# portmember interface TenGigabitEthernet 2/1
//配 置VSL鏈 路,VSU主備核心之間的心跳鏈路和流量通道
Switch2(configvsl-ap-1)# portmember interface TenGigabitEthernet 2/2
Switch2(config-vslap-1)# exit
完成配置后,轉(zhuǎn)換交換機工作在VSU模式,確認(rèn)VSU建立成功,展開功能測試,VSU主機的引擎Primary燈綠色常亮,VSU從機的Primary燈滅,可用來判斷主從機關(guān)系。對主機進行斷電和關(guān)閉端口測試,從機能在2秒以內(nèi)接替主機工作,網(wǎng)絡(luò)保持正常運行。
Switch1# show switch virtual檢查主備是否符合預(yù)期,如圖6所示。
應(yīng)用平臺應(yīng)急恢復(fù)分系統(tǒng)是對應(yīng)用系統(tǒng)、數(shù)據(jù)庫及中間件、操作系統(tǒng)進行保護的機制,采用多業(yè)務(wù)應(yīng)急系統(tǒng)(CDAP)技術(shù),為應(yīng)用平臺提供應(yīng)急保障與維護支持,通過部署一臺CDAP設(shè)備,可隨機應(yīng)急不少于6臺故障X86服務(wù)器, 5-10分鐘完全接管原機,系統(tǒng)和數(shù)據(jù)保持完全一致。配置結(jié)構(gòu)圖如圖7所示。
CDAP實現(xiàn)虛擬化映像的實時備份,不需要暫停系統(tǒng)IO讀寫。備份格式與虛擬機VMDK兼容,備份后立即可以使用,且與VM快照格式完全一致,實現(xiàn)虛擬機映像多版本自動管理,能夠?qū)崿F(xiàn)映像卷內(nèi)單個數(shù)據(jù)文件的恢復(fù)。能夠?qū)⑾到y(tǒng)和數(shù)據(jù)一次性完整備份成虛擬磁盤格式,及將主機接近實時備份成虛擬磁盤VMDK文件。最短時間間隔為10秒,即RPO為10秒左右。
為了對應(yīng)用性能影響最小,實時備份調(diào)整在5分鐘左右,滿足對數(shù)據(jù)容災(zāi)指標(biāo)要求備份主機系統(tǒng)上安裝虛擬化插件,當(dāng)本地主機出現(xiàn)邏輯或設(shè)備物理故障后,調(diào)用備份虛擬系統(tǒng)進行應(yīng)急接管。
實時備份虛擬磁盤文件將會產(chǎn)生多時間點快照,快照策略設(shè)定在30分鐘一份快照,從而大大減少邏輯錯誤發(fā)生概率,快照采用自動合并策略,實現(xiàn)30天內(nèi)稀疏不同邏輯恢復(fù)點。
圖6 檢查設(shè)備是否符合預(yù)期
圖7 多業(yè)務(wù)應(yīng)急系統(tǒng)配置結(jié)構(gòu)圖
通過以上仿真模擬,以及實際操作測試驗證,在不改變現(xiàn)有硬件配置的基礎(chǔ)上,適當(dāng)選用或增加新的軟系統(tǒng),能夠大幅度提高信息系統(tǒng)運行的穩(wěn)定性和可靠性。
就4個要素分析論證得出:
一是通信鏈路采用光纜網(wǎng)為主衛(wèi)星資源網(wǎng)補充的模式,可實現(xiàn)系統(tǒng)上下節(jié)點路由器間雙鏈路互聯(lián)備份,在物理層面上提高主通信鏈路可靠性。
二是路由設(shè)備選用動態(tài)路由協(xié)議,并配置相應(yīng)路由策略,當(dāng)出現(xiàn)網(wǎng)絡(luò)故障時,能自動調(diào)整路由狀態(tài),實現(xiàn)了鏈路接口自動切換和路由設(shè)備互為備份,提高了路由設(shè)備穩(wěn)定性。
三是采用VSU等虛擬交換技術(shù),實現(xiàn)了多臺(2臺)核心交換設(shè)備虛擬備份,達到了保護內(nèi)部網(wǎng)絡(luò)互聯(lián)的要求,提高了核心交換設(shè)備工作穩(wěn)定性。
四是應(yīng)用平臺應(yīng)急恢復(fù)系統(tǒng)可實現(xiàn)系統(tǒng)和服務(wù)應(yīng)急備份接管,解決了應(yīng)用系統(tǒng)因硬件故障恢復(fù)慢、數(shù)據(jù)易丟失等問題,提供應(yīng)用系統(tǒng)持續(xù)性及安全性。