燕 霞
摘要:本文介紹了—種安全、高效的財政綜合容災(zāi)系統(tǒng)的構(gòu)建方法,通過運用創(chuàng)新的技術(shù)手段,用虛擬機技術(shù)與新型集群軟件技術(shù)相結(jié)合的辦法,實現(xiàn)數(shù)據(jù)級、應(yīng)用級和網(wǎng)絡(luò)級的容災(zāi),可保障財政業(yè)務(wù)的連續(xù)性和數(shù)據(jù)的安全性。
關(guān)鍵詞:容災(zāi)備份;虛擬機;中間件;集群聯(lián)動
1建設(shè)背景
隨著財政體制改革的不斷推進和科學、精細化管理的不斷深入,財政業(yè)務(wù)信息化的覆蓋面越來越大,業(yè)務(wù)系統(tǒng)對IT系統(tǒng)的依賴性越來越高。對于掌握著社會經(jīng)濟命脈的財政信息系統(tǒng)而言,如何安全、高效地管理好業(yè)務(wù)數(shù)據(jù),確保信息資源的安全和完整,已經(jīng)成為擺在我們面前需要迫切解決的問題。為了保障業(yè)務(wù)的連續(xù)性和數(shù)據(jù)的安全性,既要預防災(zāi)難的發(fā)生,又要關(guān)注災(zāi)難發(fā)生后的快速恢復手段,必須建立一套行之有效的數(shù)據(jù)存儲及災(zāi)難恢復系統(tǒng)。
2原有信息系統(tǒng)概況
財政的業(yè)務(wù)系統(tǒng)平臺和數(shù)據(jù)庫平臺種類繁多。目前主要有預算執(zhí)行、非稅收入、契稅征管、會計信息管理、部門預算、辦公自動化等二十余個業(yè)務(wù)系統(tǒng)。原有信息系統(tǒng)存在的問題主要有:
(1)業(yè)務(wù)系統(tǒng)數(shù)據(jù)大都分散存儲、分散備份,存在管理困難、效率低、安全性低等問題。
(2)原有信息系統(tǒng)的單點故障等隱患日益凸顯,一旦機房發(fā)生火災(zāi)等災(zāi)害。將會造成系統(tǒng)癱瘓、數(shù)據(jù)丟失。
(3)數(shù)據(jù)存儲采用DAS模式,數(shù)據(jù)備份和恢復需占用主機資源。
為保證業(yè)務(wù)系統(tǒng)的穩(wěn)定運行和基礎(chǔ)數(shù)據(jù)的安全,我們結(jié)合本地實際情況,在對現(xiàn)有業(yè)務(wù)系統(tǒng)和數(shù)據(jù)重新規(guī)劃、整合后,利用可靠的容災(zāi)技術(shù),建立異地容災(zāi)備份中心,保證在災(zāi)難發(fā)生時可由災(zāi)備中心接管業(yè)務(wù)正常運行。
3建設(shè)目標
在對所有業(yè)務(wù)系統(tǒng)進行詳細分析和統(tǒng)一規(guī)劃后,我們根據(jù)業(yè)務(wù)的重要性分別設(shè)定了相應(yīng)的容災(zāi)目標。生產(chǎn)中心一旦發(fā)生故障,對核心業(yè)務(wù)系統(tǒng),要求應(yīng)用能自動切換到備份中心;對重要業(yè)務(wù)系統(tǒng)。要求應(yīng)用在15~30分鐘內(nèi)恢復;對其他業(yè)務(wù)系統(tǒng),要求應(yīng)用在12小時內(nèi)恢復。整體目標是實現(xiàn)數(shù)據(jù)級、應(yīng)用級和網(wǎng)絡(luò)級的容災(zāi)。
(1)數(shù)據(jù)級容災(zāi):對所有業(yè)務(wù)系統(tǒng)的數(shù)據(jù)進行在線和離線備份,其中對核心應(yīng)用的數(shù)據(jù)進行實時同步鏡像保存,以保證數(shù)據(jù)一致性。
(2)應(yīng)用級容災(zāi):對重要的業(yè)務(wù)系統(tǒng),在災(zāi)備中心建立一套完整的與生產(chǎn)系統(tǒng)相當?shù)膫浞輵?yīng)用系統(tǒng)。災(zāi)難發(fā)生時災(zāi)備系統(tǒng)能迅速接管業(yè)務(wù)。
(3)網(wǎng)絡(luò)級容災(zāi):對重要業(yè)務(wù)系統(tǒng)連入相關(guān)單位的網(wǎng)絡(luò),通過不同運營商的線路分別接入生產(chǎn)中心和災(zāi)備中心機房。生產(chǎn)中心的數(shù)據(jù)鏈路發(fā)生故障后,能立即啟用災(zāi)備中心的鏈路,將訪問核心業(yè)務(wù)系統(tǒng)的網(wǎng)絡(luò)流量正確地導向災(zāi)備中心。
4容災(zāi)系統(tǒng)架構(gòu)關(guān)鍵技術(shù)
根據(jù)項目的建設(shè)目標,我們對不同層次應(yīng)用的容災(zāi)備份要求,采用不同的災(zāi)備技術(shù)來實現(xiàn)。
4.1數(shù)據(jù)級容災(zāi)的實現(xiàn)
數(shù)據(jù)容災(zāi)必須兼顧離線數(shù)據(jù)保護和在線數(shù)據(jù)保護兩個方面。
(1)離線數(shù)據(jù)保護:采用NetVault離線備份技術(shù),將所有業(yè)務(wù)數(shù)據(jù)備份到虛擬帶庫和磁帶介質(zhì)上以便歸檔保存。
(2)在線數(shù)據(jù)保護:
對核心業(yè)務(wù)系統(tǒng),我們采用VERITAS Storage Foundtion的鏡像技術(shù)來保證零數(shù)據(jù)損失;對重要業(yè)務(wù)系統(tǒng),采用Veritas Replication Exec將生產(chǎn)中心的數(shù)據(jù)實時復制到災(zāi)備中心的備份服務(wù)器上;對其他業(yè)務(wù)系統(tǒng)(Windows),采用Symantec BESR可保證在數(shù)據(jù)、應(yīng)用或硬件發(fā)生故障的時候,快速(1-2個小時內(nèi))恢復系統(tǒng)和數(shù)據(jù)。
4.2應(yīng)用級容災(zāi)的實現(xiàn)
由于財政業(yè)務(wù)系統(tǒng)多樣、復雜,一些業(yè)務(wù)系統(tǒng)采用了三層架構(gòu)。除了數(shù)據(jù)庫服務(wù)器外還存在中間層應(yīng)用服務(wù)器。這些服務(wù)器應(yīng)用平臺各異,且存在相互依存關(guān)系。為了真正實現(xiàn)這些業(yè)務(wù)的連續(xù)可用性,不僅要實現(xiàn)數(shù)據(jù)庫主機的自動切換,還必須考慮中間件服務(wù)器與數(shù)據(jù)庫之間的聯(lián)動災(zāi)備。
針對核心業(yè)務(wù)和重要業(yè)務(wù)的主機系統(tǒng),我們采用Veritas Cluster Server技術(shù)構(gòu)建高可靠的集群系統(tǒng),能夠在軟硬件發(fā)生故障時進行數(shù)據(jù)庫自動切換,從而保證業(yè)務(wù)的連續(xù)可用。
對中間件服務(wù)器,一方面要構(gòu)建中間件服務(wù)器的集群,同時還要實現(xiàn)異構(gòu)系統(tǒng)集群之間的聯(lián)動容災(zāi)控制。我們創(chuàng)新地運用虛擬機技術(shù)及定制組件,解決了硬件加密技術(shù)限制、多災(zāi)備集群聯(lián)動、虛擬主機狀態(tài)測定等多方面難題,實現(xiàn)了異構(gòu)復雜環(huán)境下的業(yè)務(wù)系統(tǒng)應(yīng)用級容災(zāi),達到了財政業(yè)務(wù)系統(tǒng)不間斷運行的目的。
4.3網(wǎng)絡(luò)級容災(zāi)的實現(xiàn)
對核心業(yè)務(wù)有關(guān)單位(如各銀行)與財政之間的鏈路,我們在災(zāi)備中心配置了相當數(shù)量和性能的網(wǎng)絡(luò)設(shè)備,將不同運營商(電信和廣電)的線路分別接入生產(chǎn)和災(zāi)備中心。做到設(shè)備和線路的高度冗余。一旦生產(chǎn)中心癱瘓或主通信線路被破壞。可自動啟用災(zāi)備中心的通信線路。從而保證核心應(yīng)用的連續(xù)運行。
5結(jié)束語
由于財政信息系統(tǒng)結(jié)構(gòu)復雜,業(yè)務(wù)系統(tǒng)繁多,在災(zāi)備系統(tǒng)建設(shè)中我們創(chuàng)新地運用虛擬中間件服務(wù)器技術(shù),在復雜環(huán)境下實現(xiàn)多層次應(yīng)用架構(gòu)下的多集群聯(lián)動容災(zāi)機制,以最經(jīng)濟、最有效的方式構(gòu)建了財政全方位的整體容災(zāi),達到了零停機時間、零數(shù)據(jù)丟失等容災(zāi)目標。該系統(tǒng)進入試運行階段以來,經(jīng)歷了多次災(zāi)難性測試和停電的考驗,在很大程度上保障了財政業(yè)務(wù)系統(tǒng)的高效穩(wěn)定性,取得了良好的經(jīng)濟和社會效益。該項目順利通過了專家驗收和科學技術(shù)成果鑒定,在財政、稅務(wù)、銀行、電信等領(lǐng)域都具有廣闊的應(yīng)用前景。