許辰宏
摘要 在數(shù)據(jù)對企業(yè)越來越重要的時代,怎樣利用容災(zāi)和備份兩種方式對數(shù)據(jù)進行保護,以實現(xiàn)數(shù)據(jù)的可靠性,完整性和高可用性。
【關(guān)鍵詞】容災(zāi) 備份 數(shù)據(jù)中心
1 容災(zāi)與備份的比較
1.1 容災(zāi)
容災(zāi)通常指在距離相隔較遠的兩地(一個是提供正常業(yè)務(wù)運行的數(shù)據(jù)中心,另一個為隨時接管部分或全部服務(wù)的災(zāi)備中心),建立功能相同的信息系統(tǒng),系統(tǒng)之間可進行狀態(tài)監(jiān)控和功能切換。當(dāng)某個或多個系統(tǒng)因災(zāi)難而停止運行時,可將其全部功能切換到另一地點,使該系統(tǒng)能夠正常運行。容災(zāi)系統(tǒng)著重于處理外界環(huán)境對信息系統(tǒng)的影響,特別災(zāi)難性事件對企業(yè)數(shù)據(jù)中心的影響,它提供節(jié)點級別的系統(tǒng)恢復(fù)功能。
1.2 備份
數(shù)據(jù)是現(xiàn)代企業(yè)的核心,備份是為了防止信息系統(tǒng)出現(xiàn)數(shù)據(jù)丟失,而將系統(tǒng)中的全部或部分?jǐn)?shù)據(jù)從系統(tǒng)主機的硬盤或磁陣中復(fù)制到其它的存儲介質(zhì)的過程。傳統(tǒng)的數(shù)據(jù)備份主要是采用設(shè)備配置的磁帶機進行備份,這種方式備份速度慢,不適合現(xiàn)代企業(yè)大數(shù)據(jù)吞吐的要求,而且最重要的是這種方式恢復(fù)時間很長,一旦對海量數(shù)據(jù)進行恢復(fù),那耗費的時間成本非常巨大。
由上可知,備份與容災(zāi)所關(guān)注的對象是不同的。備份側(cè)重于數(shù)據(jù)的安全,容災(zāi)關(guān)注系統(tǒng)業(yè)務(wù)應(yīng)用的安全。如果將備份稱為“數(shù)據(jù)保護”,那容災(zāi)則是“業(yè)務(wù)應(yīng)用保護”,備份僅僅是容災(zāi)的一部分。特別是在當(dāng)前以信息技術(shù)為依托的企業(yè),數(shù)據(jù)量呈幾何級數(shù)增長。一旦災(zāi)難發(fā)生時,僅有備份方式進行業(yè)務(wù)恢復(fù),那將導(dǎo)致極長的業(yè)務(wù)中斷時間,給企業(yè)帶來無法估量的損失。
目前支撐業(yè)務(wù)運行的各信息系統(tǒng)數(shù)據(jù)量日益增多,已從GB級別發(fā)展到TB級別。因此傳統(tǒng)的備份方式無法滿足對應(yīng)災(zāi)難性事件的要求,而采用容災(zāi)方式可將因災(zāi)難性事件產(chǎn)生的業(yè)務(wù)中斷時間縮短在幾小時,幾分鐘之內(nèi)。甚至可以在用戶無感知的情況下,實現(xiàn)容災(zāi)節(jié)點間的快速切換。
2 容災(zāi)等級劃分
數(shù)據(jù)中心的容災(zāi)的建設(shè),可分為三個不同的層級:數(shù)據(jù)級容災(zāi),應(yīng)用級容災(zāi),業(yè)務(wù)級容災(zāi)。
(1)數(shù)據(jù)級容災(zāi)是最基礎(chǔ)形式,簡單講就是數(shù)據(jù)備份,主要通過備份軟件和存儲設(shè)備來實現(xiàn)數(shù)據(jù)在不同地點的備份。備份數(shù)據(jù)一般有多份,最常見的模式是本地存放一份,同城備份中心存放一份,異地災(zāi)備中心再存放一份,在災(zāi)難發(fā)生時,可以保證不丟失數(shù)據(jù),但不能保證業(yè)務(wù)的連續(xù)性。另外數(shù)據(jù)的恢復(fù)也需要一定的時間。
(2)應(yīng)用級容災(zāi)以數(shù)據(jù)保護為基礎(chǔ),其目的是實現(xiàn)整體恢復(fù),一般在同城備份中心有一套和主中心鏡像的應(yīng)用系統(tǒng)。當(dāng)主數(shù)據(jù)中心發(fā)生災(zāi)難時,可以實現(xiàn)迅速切換,讓用戶發(fā)出的服務(wù)請求可以繼續(xù)運行。
(3)業(yè)務(wù)級容災(zāi)的目的是實現(xiàn)企業(yè)所有業(yè)務(wù)的恢復(fù),即在發(fā)生意外或災(zāi)難事件,造成關(guān)鍵業(yè)務(wù)停頓時,通過業(yè)務(wù)級容災(zāi)的相關(guān)恢復(fù)策略和流程,恢復(fù)、簡化、改變關(guān)鍵業(yè)務(wù)的執(zhí)行流程,使得企業(yè)關(guān)鍵業(yè)務(wù)能夠在要求的時間內(nèi)迅速恢復(fù)運營,使得企業(yè)客戶的業(yè)務(wù)要求受到的影響微乎其微。業(yè)務(wù)級容災(zāi)已成為國際上對于災(zāi)難恢復(fù)的研究重點。
3 總體分析與評估
從容災(zāi)建設(shè)的技術(shù)層面分析,衡量容災(zāi)系統(tǒng)的主要指標(biāo)有兩個,分別是RPO和RTO。
(1) RPO (Recovery Poinr Object)…反映數(shù)據(jù)恢復(fù)完整性指標(biāo),代表了當(dāng)災(zāi)難發(fā)生時允許丟失的數(shù)據(jù)量。數(shù)據(jù)量越大,一般損失也越大。不過關(guān)鍵數(shù)據(jù)的損失和非關(guān)鍵數(shù)據(jù)的損失是有差別的。
(2) PTO (Recovery Time Object)一反映業(yè)務(wù)恢復(fù)及時性指標(biāo),代表了系統(tǒng)恢復(fù)的時間。系統(tǒng)恢復(fù)的時間越長,一般損失也越大。對于關(guān)鍵系統(tǒng)和非關(guān)鍵系統(tǒng),即使是相同的恢復(fù)時間,影響也是不同的。
從成本上看,如果系統(tǒng)需要保證更高的業(yè)務(wù)連續(xù)性,也就是需要保證災(zāi)難發(fā)生時,丟失數(shù)據(jù)最少,而且恢復(fù)的時間最短。雖然這需要更高的成本,但是,其帶來的好處是災(zāi)難發(fā)生時,損失也最小。如果沒有容災(zāi)中心,當(dāng)災(zāi)難發(fā)生時,將丟失大量的生產(chǎn)數(shù)據(jù),或者需要很長的時間進行業(yè)務(wù)恢復(fù),那么企業(yè)將承受極大的損失??蓪⑷轂?zāi)實施成本與災(zāi)難發(fā)生后可能帶來的業(yè)務(wù)中斷損失組成一個圖,恢復(fù)成本越高,那么恢復(fù)的時間就應(yīng)該少,企業(yè)的損失也應(yīng)該越小;反之,如果恢復(fù)成本越低,那么需要恢復(fù)的時間就越長,帶來的損失可能就大到不可估計。
在這樣的情況下,可以綜合考量恢復(fù)成本和業(yè)務(wù)中斷損失兩個因素,選擇一個合理區(qū)間作為標(biāo)準(zhǔn),使恢復(fù)時間和損失都控制在一定范圍內(nèi)。因此必須對中國商飛公司現(xiàn)有信息系統(tǒng)的特點、業(yè)務(wù)關(guān)鍵性、數(shù)據(jù)量、訪問頻度進行綜合分析。以評估恢復(fù)成本與業(yè)務(wù)中斷損失的范圍值。
4 容災(zāi)中心的地點選擇
容災(zāi)系統(tǒng)建設(shè)的一個重要部分就是確定主數(shù)據(jù)中心與災(zāi)備中心之間的距離和地點。通常來說,在同城的兩個中心的距離不宜太遠,這樣無論是切換的速度,數(shù)據(jù)備份和恢復(fù)的速度都會比較快,而在異地建設(shè)的災(zāi)備中心,就要從防止“災(zāi)難”角度考慮,比如火災(zāi),地震,惡意破壞,甚至是戰(zhàn)爭的角度,考慮異地災(zāi)備中心的選址,從目前己實施的容災(zāi)系統(tǒng)建設(shè),和業(yè)界提供的產(chǎn)品和技術(shù)來看,根據(jù)容災(zāi)距離的遠近,主要有兩種建設(shè)模式。
(1)幾十公里或一百公里以內(nèi),主要是同城范圍的容災(zāi)距離。也稱為“同城災(zāi)備”。
(2)幾百上千公里距離,主要是不同城市之間的遠程容災(zāi)。也稱為“遠程災(zāi)備”或“異地災(zāi)備”。
目前很多企業(yè)綜合“同城災(zāi)備”和“遠程/異地災(zāi)備”的特點,在災(zāi)備系統(tǒng)建設(shè)上采用“兩地三中心”的模式。
參考文獻
[1]劉煥淋,陳勇,通信網(wǎng)圖論及應(yīng)用[M].北京:人民郵電出版社,2010.
[2]徐偉強,汪亞明,俞成海等.移動Ad Hoc網(wǎng)絡(luò)的跨層優(yōu)化擁塞控制[J].軟件學(xué)報,2010.