備份是一個(gè)老生常談的話題,但真正能做好的企業(yè)并不多。對(duì)于一個(gè)分布式企業(yè)生產(chǎn)數(shù)據(jù)管理系統(tǒng)來(lái)說(shuō),其備份與應(yīng)急系統(tǒng)的建立能夠完善備份與應(yīng)急方案機(jī)制,增強(qiáng)系統(tǒng)應(yīng)對(duì)各種風(fēng)險(xiǎn)的能力,確保其安全、穩(wěn)定、高效地運(yùn)行。
為了確保企業(yè)生產(chǎn)數(shù)據(jù)管理系統(tǒng)中數(shù)據(jù)的完整性和安全性,以及應(yīng)用的不間斷穩(wěn)定性,我們針對(duì)系統(tǒng)的應(yīng)急和備份特點(diǎn),對(duì)現(xiàn)有市場(chǎng)中的備份產(chǎn)品進(jìn)行了分析、調(diào)研、測(cè)試和研究,并針對(duì)如何在確保數(shù)據(jù)安全的基礎(chǔ)上提高業(yè)務(wù)連續(xù)運(yùn)行能力,降低企業(yè)運(yùn)營(yíng)風(fēng)險(xiǎn),提出了一套備份與應(yīng)急解決方案。
流行的備份技術(shù)
目前,國(guó)內(nèi)外流行的備份技術(shù)包括磁盤(pán)鏡像技術(shù)、網(wǎng)絡(luò)盤(pán)存儲(chǔ)鏡像技術(shù)、雙機(jī)熱備技術(shù)、集群運(yùn)行技術(shù)、數(shù)據(jù)后備+增量數(shù)據(jù)備份技術(shù)等。
磁盤(pán)鏡像技術(shù)簡(jiǎn)單實(shí)用,備份效率高,但不能解決除磁盤(pán)外的服務(wù)器故障問(wèn)題,也不能解決操作系統(tǒng)中病毒,或者人為數(shù)據(jù)破壞等問(wèn)題。
網(wǎng)絡(luò)盤(pán)存儲(chǔ)鏡像技術(shù)采用網(wǎng)絡(luò)數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)復(fù)制、iSCSI及網(wǎng)絡(luò)啟動(dòng)等多項(xiàng)技術(shù),為應(yīng)用系統(tǒng)提供從系統(tǒng)到數(shù)據(jù)全方位的保護(hù)和快速恢復(fù)。它的優(yōu)點(diǎn)是按物理存儲(chǔ)塊進(jìn)行讀寫(xiě),可以備份任何系統(tǒng)、軟件、程序(包括基于各種方法加密的內(nèi)容)。
雙機(jī)熱備是常用的災(zāi)備方法,一般分為兩種:一種是基于共享的存儲(chǔ)設(shè)備方式,另一種是沒(méi)有共享的存儲(chǔ)設(shè)備方式,常稱為純軟件方式。但因?yàn)樗且环N共享的邏輯備份復(fù)制,所以,部分加密軟件雖可做備份,但無(wú)法恢復(fù)運(yùn)行,門(mén)戶管理軟件TWS就是這樣的系統(tǒng)。
集群運(yùn)行技術(shù)主要用來(lái)做系統(tǒng)負(fù)載均衡運(yùn)行,但也可以作為系統(tǒng)備份技術(shù),是一種實(shí)時(shí)災(zāi)備系統(tǒng)。但這種技術(shù)需要有應(yīng)用軟件的支持才能部署運(yùn)行,所以,實(shí)際實(shí)施中會(huì)有一定的限制。
數(shù)據(jù)后備+增量數(shù)據(jù)備份與雙機(jī)熱備的純軟件方式類(lèi)似,但它不是一個(gè)同步運(yùn)行的系統(tǒng)。
我們的企業(yè)生產(chǎn)數(shù)據(jù)管理系統(tǒng)是一套實(shí)時(shí)的系統(tǒng),我們對(duì)其系統(tǒng)面臨的各種風(fēng)險(xiǎn)因素做了全面分析,明確了備份與應(yīng)急恢復(fù)的要求,對(duì)以上應(yīng)急和數(shù)據(jù)備份技術(shù)進(jìn)行了有針對(duì)性的全面調(diào)研,并在此基礎(chǔ)上提出了備份與應(yīng)急系
統(tǒng)的總體技術(shù)解決方案
如何選擇方案
我們的企業(yè)生產(chǎn)數(shù)據(jù)管理系統(tǒng)采用集中+分布的體系架構(gòu),服務(wù)器涉及幾十臺(tái)Windows服務(wù)器和十幾臺(tái)Sun Solaris數(shù)據(jù)庫(kù)服務(wù)器,存儲(chǔ)采用SAN架構(gòu)方式,網(wǎng)絡(luò)使用企業(yè)內(nèi)部網(wǎng),其應(yīng)用主要是專(zhuān)用的應(yīng)用軟件,運(yùn)行在Windows平臺(tái)上,后臺(tái)數(shù)據(jù)管理是Oracle數(shù)據(jù)庫(kù)。應(yīng)急恢復(fù)與生產(chǎn)數(shù)據(jù)備份的目標(biāo)是實(shí)現(xiàn)應(yīng)用系統(tǒng)的7×24小時(shí)穩(wěn)定運(yùn)行、生產(chǎn)數(shù)據(jù)在任何情況下都不能丟失,系統(tǒng)出現(xiàn)故障時(shí)能夠以本地和遠(yuǎn)程異地兩種方式快速恢復(fù)。根據(jù)服務(wù)器上運(yùn)行的軟件,我們分為以下兩種情況進(jìn)行討論。
1. 應(yīng)用服務(wù)器的應(yīng)急恢復(fù)
應(yīng)用服務(wù)器要實(shí)現(xiàn)7×24小時(shí)穩(wěn)定運(yùn)行,當(dāng)應(yīng)用服務(wù)器(包括操作系統(tǒng)和應(yīng)用環(huán)境)受病毒攻擊或其他因素干擾而無(wú)法運(yùn)行或出現(xiàn)主機(jī)癱瘓等災(zāi)難時(shí),能夠在本地和遠(yuǎn)程異地啟動(dòng)應(yīng)急服務(wù)器系統(tǒng)接管災(zāi)難服務(wù)器。經(jīng)過(guò)充分的調(diào)研,我們發(fā)現(xiàn),“網(wǎng)絡(luò)盤(pán)存儲(chǔ)鏡像”是目前市場(chǎng)上比較先進(jìn)的應(yīng)急和備份技術(shù),能夠有效地滿足其系統(tǒng)應(yīng)用服務(wù)器應(yīng)急恢復(fù)的要求。其工作原理是在主應(yīng)用服務(wù)器和應(yīng)急應(yīng)用服務(wù)器的存儲(chǔ)盤(pán)之間通過(guò)網(wǎng)絡(luò)進(jìn)行實(shí)時(shí)增量鏡像復(fù)制,并進(jìn)行多版本快照保存,但當(dāng)某個(gè)油田應(yīng)用服務(wù)器發(fā)生災(zāi)難時(shí),通過(guò)網(wǎng)絡(luò)恢復(fù)在本地或異地的應(yīng)急服務(wù)器上保存的某個(gè)版本的鏡像備份,實(shí)現(xiàn)本地或遠(yuǎn)程應(yīng)用服務(wù)器的接管。由于“網(wǎng)絡(luò)盤(pán)存儲(chǔ)鏡像”通常都保存多版本快照,因此,可以有效地防止病毒。
2. 數(shù)據(jù)庫(kù)服務(wù)器的備份與恢復(fù)
對(duì)數(shù)據(jù)庫(kù)服務(wù)器的備份與恢復(fù),目前市場(chǎng)上的商業(yè)產(chǎn)品通常有兩種技術(shù)實(shí)現(xiàn)方式:一種方式是使用數(shù)據(jù)庫(kù)準(zhǔn)同步技術(shù),在邏輯層實(shí)現(xiàn)生產(chǎn)數(shù)據(jù)庫(kù)和備份數(shù)據(jù)庫(kù)之間的準(zhǔn)同步而達(dá)到備份的目的;另一種方式是通過(guò)網(wǎng)絡(luò)盤(pán)存儲(chǔ)鏡像技術(shù),在生產(chǎn)數(shù)據(jù)庫(kù)和備份數(shù)據(jù)庫(kù)之間實(shí)現(xiàn)物理層的復(fù)制與恢復(fù)。當(dāng)本地生產(chǎn)數(shù)據(jù)服務(wù)器發(fā)生故障時(shí),由本地或總部異地的數(shù)據(jù)庫(kù)備份系統(tǒng)替代原主服務(wù)器快速恢復(fù)生產(chǎn)數(shù)據(jù)應(yīng)用。對(duì)于這兩種方式,我們進(jìn)行了實(shí)際測(cè)試和性能對(duì)比,以及用戶的可操作和維護(hù)性,最終我們選擇使用數(shù)據(jù)庫(kù)準(zhǔn)同步技術(shù)實(shí)現(xiàn)數(shù)據(jù)庫(kù)服務(wù)器的備份與恢復(fù)。
實(shí)現(xiàn)哪些功能
備份與應(yīng)急恢復(fù)與其他任何保險(xiǎn)策略一樣,當(dāng)沒(méi)有災(zāi)難出現(xiàn)時(shí),我們根本無(wú)法意識(shí)到備份與應(yīng)急恢復(fù)系統(tǒng)所起到的作用,無(wú)法回收備份與應(yīng)急恢復(fù)系統(tǒng)建設(shè)所需的大量投資。但從系統(tǒng)安全性角度考慮,我們又必須為關(guān)鍵的業(yè)務(wù)支撐系統(tǒng)建設(shè)最有效的備份與應(yīng)急恢復(fù)解決方案。為此,備份與應(yīng)急系統(tǒng)在實(shí)現(xiàn)中提供以下功能:
1. 應(yīng)用服務(wù)器的應(yīng)急恢復(fù)(Windows平臺(tái))
#8226;操作系統(tǒng)與應(yīng)用環(huán)境在線實(shí)時(shí)復(fù)制與恢復(fù)。包括在線實(shí)時(shí)增量復(fù)制/恢復(fù)操作系統(tǒng)和應(yīng)用環(huán)境和數(shù)據(jù);按用戶指定的應(yīng)用和數(shù)據(jù)目錄進(jìn)行復(fù)制和恢復(fù);支持多版本快速回滾啟動(dòng)恢復(fù)。
#8226;操作系統(tǒng)與應(yīng)用環(huán)境的本地應(yīng)急恢復(fù)。在本地主機(jī)存儲(chǔ)發(fā)生損壞或因任何其他(如病毒)軟件原因發(fā)生故障時(shí),應(yīng)急系統(tǒng)上能網(wǎng)絡(luò)啟動(dòng)操作系統(tǒng)和應(yīng)用環(huán)境,以快速恢復(fù)業(yè)務(wù)運(yùn)營(yíng);實(shí)現(xiàn)多版本快速回滾啟動(dòng),以消除可能的病毒故障。
#8226;操作系統(tǒng)與應(yīng)用環(huán)境的異地應(yīng)急恢復(fù)。將本地應(yīng)急系統(tǒng)的系統(tǒng)、環(huán)境和數(shù)據(jù)遠(yuǎn)程同步到異地應(yīng)急系統(tǒng)中心;支持?jǐn)?shù)據(jù)加密后傳輸,保證異地操作的數(shù)據(jù)安全;在本地主機(jī)發(fā)生故障時(shí),需要異地應(yīng)急系統(tǒng)的備用主機(jī)能從異地應(yīng)急系統(tǒng)上啟動(dòng)操作系統(tǒng)和應(yīng)用,以快速恢復(fù)業(yè)務(wù)運(yùn)營(yíng)。
2. 數(shù)據(jù)庫(kù)服務(wù)器的備份與恢復(fù)(Solaris平臺(tái))
#8226;Oracle數(shù)據(jù)庫(kù)在線實(shí)時(shí)備份與恢復(fù)。能夠?qū)ιa(chǎn)數(shù)據(jù)庫(kù)(Oracle)進(jìn)行在線實(shí)時(shí)的增量備份和恢復(fù);備份系統(tǒng)對(duì)生產(chǎn)系統(tǒng)和數(shù)據(jù)庫(kù)無(wú)干擾,即不需要安裝非原廠家的Agent軟件,或者安裝的軟件對(duì)生產(chǎn)系統(tǒng)無(wú)負(fù)面影響。
#8226;Oracle數(shù)據(jù)庫(kù)的本地應(yīng)急恢復(fù)。在本地主機(jī)存儲(chǔ)發(fā)生損壞或因任何其他軟件原因發(fā)生故障時(shí),能立即從應(yīng)急系統(tǒng)上啟動(dòng)Oracle數(shù)據(jù)庫(kù),以快速恢復(fù)業(yè)務(wù)運(yùn)營(yíng);保持備份數(shù)據(jù)和源數(shù)據(jù)的一致性和完整性,并能立即可用;支持不同 Solaris操作系統(tǒng)版本上的數(shù)據(jù)庫(kù)(即Solaris 8 上的數(shù)據(jù)庫(kù)和 Solaris 9上的數(shù)據(jù)庫(kù))之間的備份與恢復(fù)。
#8226;Oracle數(shù)據(jù)庫(kù)的異地應(yīng)急恢復(fù)。將本地應(yīng)急系統(tǒng)的Oracle數(shù)據(jù)同步到異地應(yīng)急系統(tǒng)中心;支持?jǐn)?shù)據(jù)加密傳輸,保障數(shù)據(jù)安全;在本地主機(jī)發(fā)生故障時(shí),需要異地應(yīng)急系統(tǒng)的備用主機(jī)能從異地應(yīng)急系統(tǒng)上啟動(dòng)Oracle數(shù)據(jù)庫(kù),以快速恢復(fù)業(yè)務(wù)運(yùn)營(yíng)。
備份與應(yīng)急恢復(fù)系統(tǒng)的實(shí)現(xiàn),將大大提高企業(yè)生產(chǎn)數(shù)據(jù)管理系統(tǒng)應(yīng)用服務(wù)器和數(shù)據(jù)庫(kù)服務(wù)器的災(zāi)備能力,能夠及時(shí)、準(zhǔn)確地實(shí)時(shí)動(dòng)態(tài)備份和恢復(fù),保證其系統(tǒng)的數(shù)據(jù)安全和業(yè)務(wù)的連續(xù)性。