徐益強(qiáng)
基于異構(gòu)系統(tǒng)的容災(zāi)研究
徐益強(qiáng)
隨著環(huán)境保護(hù)信息化的不斷深化,信息系統(tǒng)的重要性日趨突出。本文針對(duì)現(xiàn)有系統(tǒng)容災(zāi)需求,選擇了基于存儲(chǔ)的陣列復(fù)制型容災(zāi)系統(tǒng),通過容災(zāi)系統(tǒng)的建設(shè),將大大提升環(huán)保業(yè)務(wù)系統(tǒng)的安全性。
江蘇省環(huán)保廳通過建設(shè)江蘇省生態(tài)環(huán)境監(jiān)控系統(tǒng),建成了一系列環(huán)境保護(hù)業(yè)務(wù)系統(tǒng)和相關(guān)數(shù)據(jù)庫(kù),在基礎(chǔ)設(shè)施和應(yīng)用開發(fā)上打下了較好的基礎(chǔ)。在數(shù)據(jù)保護(hù)方面,僅采用集群服務(wù)和虛擬化的技術(shù),當(dāng)硬件服務(wù)器出現(xiàn)故障時(shí),實(shí)現(xiàn)虛擬機(jī)的漂移,在很大程度上避免了硬件設(shè)備的單點(diǎn)故障,提高了業(yè)務(wù)系統(tǒng)的可用性。在數(shù)據(jù)備份方面,僅采用了本地機(jī)房備份的方式,一旦出現(xiàn)數(shù)據(jù)丟失或損壞,需要通過人工方式進(jìn)行數(shù)據(jù)恢復(fù)。
隨著信息化的不斷發(fā)展,業(yè)務(wù)需求對(duì)信息系統(tǒng)的高可用性要求越來越高,要求業(yè)務(wù)系統(tǒng)可以在發(fā)生災(zāi)難時(shí)快速恢復(fù),將損失降到最低點(diǎn),容災(zāi)系統(tǒng)的建設(shè)變得十分迫切。
容災(zāi)的概念
容災(zāi)是一個(gè)范疇比較廣泛的概念,對(duì)于IT而言,容災(zāi)就是要提供一個(gè)確保業(yè)務(wù)系統(tǒng)不中斷運(yùn)行的環(huán)境。在實(shí)際容災(zāi)系統(tǒng)建設(shè)過程中,就是要在不同的地方,建設(shè)一套或多套應(yīng)用系統(tǒng),能夠提供業(yè)務(wù)應(yīng)用獨(dú)立的運(yùn)行,并且?guī)讉€(gè)應(yīng)用系統(tǒng)之間能相互在線切換,一旦某一個(gè)地方的應(yīng)用系統(tǒng)遭到破壞無法繼續(xù)運(yùn)行,整個(gè)應(yīng)用系統(tǒng)可以切換到另一個(gè)地點(diǎn)繼續(xù)運(yùn)行。
容災(zāi)的主要目的是,當(dāng)自然或人為的原因?qū)е律a(chǎn)系統(tǒng)發(fā)生災(zāi)難時(shí),能夠盡可能地保證業(yè)務(wù)的連續(xù)性。
容災(zāi)的主要技術(shù)
容災(zāi)技術(shù)主要包括基于主機(jī)層的是軟件復(fù)制、基于SAN網(wǎng)絡(luò)層虛擬化網(wǎng)關(guān)的復(fù)制、基于存儲(chǔ)層的陣列復(fù)制。
基于主機(jī)層的是軟件復(fù)制主要是對(duì)數(shù)據(jù)庫(kù)進(jìn)行復(fù)制,通常采用數(shù)據(jù)庫(kù)支持的日志復(fù)制功能,按照本地?cái)?shù)據(jù)庫(kù)的操作日志,實(shí)現(xiàn)遠(yuǎn)程數(shù)據(jù)庫(kù)的一致;基于SAN網(wǎng)絡(luò)層虛擬化網(wǎng)關(guān)的復(fù)制,通常是通過SAN網(wǎng)絡(luò)層構(gòu)建虛擬存儲(chǔ)網(wǎng)關(guān)來實(shí)現(xiàn)數(shù)據(jù)的復(fù)制;基于存儲(chǔ)層的陣列復(fù)制,通常是直接在本地存儲(chǔ)和遠(yuǎn)端存儲(chǔ)之間通信,保持存儲(chǔ)陣列數(shù)據(jù)一致,以達(dá)到數(shù)據(jù)復(fù)制的目的。
同城災(zāi)備中心需整合現(xiàn)有軟硬件資源,建設(shè)災(zāi)備平臺(tái)。充分發(fā)揮虛擬化技術(shù)、滿足按需使用、動(dòng)態(tài)擴(kuò)展的特性,為省環(huán)保廳提供數(shù)據(jù)備份和災(zāi)后恢復(fù)服務(wù),實(shí)現(xiàn)軟硬件集中部署、統(tǒng)建共用,避免重復(fù)投資。
圖1 容災(zāi)備份技術(shù)示意圖
圖2 容災(zāi)備份系統(tǒng)示意圖
災(zāi)備需求
充分利用現(xiàn)有機(jī)房設(shè)備及技術(shù),擴(kuò)充計(jì)算及存儲(chǔ)資源,通過對(duì)環(huán)境信息資源的整合共享,實(shí)現(xiàn)對(duì)異構(gòu)資源的統(tǒng)一管理,建設(shè)同城災(zāi)備中心,構(gòu)建滿足各業(yè)務(wù)處室使用需求的災(zāi)備中心,為其提供高可用性的硬件架構(gòu)、軟件平臺(tái)及技術(shù)支持,為全省環(huán)境監(jiān)控、環(huán)境監(jiān)測(cè)、環(huán)境監(jiān)管和環(huán)境決策提供數(shù)據(jù)安全備份和災(zāi)后恢復(fù)支撐,避免因中心機(jī)房軟硬件故障或不可預(yù)見的災(zāi)難造成業(yè)務(wù)長(zhǎng)時(shí)間中斷或數(shù)據(jù)丟失。容災(zāi)備份系統(tǒng)盡量不影響上層主機(jī)性能,在保證原有系統(tǒng)高性能運(yùn)轉(zhuǎn)的同時(shí)可實(shí)現(xiàn)容災(zāi)備份。
技術(shù)選型
針對(duì)省環(huán)保廳本地?cái)?shù)據(jù)中心的現(xiàn)狀,業(yè)務(wù)系統(tǒng)的數(shù)據(jù)庫(kù)系統(tǒng)大多為SQL Server,且分布在多套異構(gòu)的存儲(chǔ)陣列上,按照本項(xiàng)目的備份容災(zāi)要求,除了對(duì)數(shù)據(jù)庫(kù)系統(tǒng)進(jìn)行容災(zāi),還必須對(duì)關(guān)鍵業(yè)務(wù)系統(tǒng)的web服務(wù)器進(jìn)行容災(zāi)。因此,在容災(zāi)備份的系統(tǒng)架構(gòu)上,應(yīng)用層的數(shù)據(jù)庫(kù)容災(zāi)軟件對(duì)本項(xiàng)目的適用性不強(qiáng),而使用直接對(duì)存儲(chǔ)陣列底層數(shù)據(jù)進(jìn)行直接復(fù)制的陣列遠(yuǎn)程復(fù)制技術(shù),直接對(duì)存儲(chǔ)陣列同步,對(duì)上層web應(yīng)用或數(shù)據(jù)庫(kù)應(yīng)用沒有任何限制。
基于存儲(chǔ)層的陣列復(fù)制型容災(zāi)系統(tǒng)搭建
本地?cái)?shù)據(jù)中心部署高端存儲(chǔ),將現(xiàn)有環(huán)境中不同品牌存儲(chǔ)資源進(jìn)行統(tǒng)一管理,并部署一臺(tái)服務(wù)器安裝災(zāi)備管理系統(tǒng),在需要保護(hù)的每臺(tái)生產(chǎn)服務(wù)器上安裝代理軟件。
同城災(zāi)備中心部署同品牌備份存儲(chǔ),并部署刀片服務(wù)器,本地?cái)?shù)據(jù)中心故障時(shí),用于承載生產(chǎn)業(yè)務(wù),每臺(tái)備用服務(wù)器上部署代理軟件。
本地?cái)?shù)據(jù)中心的存儲(chǔ)與災(zāi)備中心的存儲(chǔ)均配置陣列遠(yuǎn)程復(fù)制功能和虛擬快照功能,用于實(shí)現(xiàn)存儲(chǔ)層的數(shù)據(jù)復(fù)制功能。陣列復(fù)制為陣列層復(fù)制技術(shù),不需要在主機(jī)上安裝鏡像軟件,不影響上層主機(jī)性能,在保證原有系統(tǒng)高性能運(yùn)轉(zhuǎn)的同時(shí)可實(shí)現(xiàn)災(zāi)備。
本地?cái)?shù)據(jù)中心與災(zāi)備中心之間的數(shù)據(jù)傳輸鏈路,采用FC鏈路或是IP鏈路。
災(zāi)備管理系統(tǒng)作用:對(duì)主機(jī)和陣列集中管理。提供容災(zāi)業(yè)務(wù)管理圖形化操作界面,進(jìn)行容災(zāi)業(yè)務(wù)的日常管理;提供容災(zāi)業(yè)務(wù)流程控制、容災(zāi)策略調(diào)度、容災(zāi)資源、容災(zāi)業(yè)務(wù)配置等管理;提供業(yè)務(wù)狀態(tài)監(jiān)控及完善的告警機(jī)制。
代理軟件作用:提供主機(jī)、應(yīng)用的發(fā)現(xiàn)及應(yīng)用數(shù)據(jù)一致性的保證和應(yīng)用的恢復(fù)。
本地?cái)?shù)據(jù)中心和災(zāi)備數(shù)據(jù)中心之間的數(shù)據(jù)同步通過陣列遠(yuǎn)程復(fù)制來實(shí)現(xiàn),根據(jù)同步的方式,可分為異步方式和同步方式兩種。同步復(fù)制對(duì)本地?cái)?shù)據(jù)中心和災(zāi)備數(shù)據(jù)中心之間鏈路要求較高,最好為裸光纖,能最大性能保證傳輸鏈路的帶寬。
通過陣列遠(yuǎn)程復(fù)制,實(shí)現(xiàn)主備數(shù)據(jù)中心之間的數(shù)據(jù)一致,一旦本地?cái)?shù)據(jù)中心遭到破壞,災(zāi)備數(shù)據(jù)中心會(huì)在完成前一次數(shù)據(jù)同步后立刻啟動(dòng),代替原數(shù)據(jù)庫(kù)運(yùn)行。當(dāng)本地?cái)?shù)據(jù)中心修復(fù)完畢,具備運(yùn)行條件式,災(zāi)備數(shù)據(jù)中心會(huì)與本地?cái)?shù)據(jù)中心進(jìn)行一次同步,將最新的數(shù)據(jù)同步至本地?cái)?shù)據(jù)中心,然后本地?cái)?shù)據(jù)中心恢復(fù)運(yùn)行,災(zāi)備數(shù)據(jù)中心繼續(xù)進(jìn)入數(shù)據(jù)同步階段。
同城容災(zāi)系統(tǒng)建設(shè)實(shí)現(xiàn)了重要業(yè)務(wù)的應(yīng)用級(jí)容災(zāi),提高了應(yīng)用系統(tǒng)應(yīng)對(duì)重大災(zāi)難和事故的能力,整體提升了系統(tǒng)穩(wěn)定性和數(shù)據(jù)安全性。
徐益強(qiáng)
江蘇省生態(tài)環(huán)境監(jiān)控中心
10.3969/j.issn.1001-8972.2016.09.019