摘 要:自從電腦開始在商業(yè)中應(yīng)用,災(zāi)難恢復(fù)計(jì)劃就是一個(gè)備受眾人關(guān)注的問題,現(xiàn)在它依然因?yàn)榭植酪u擊和自然災(zāi)害的發(fā)生而顯得非常重要。因?yàn)樵诂F(xiàn)在的很多企業(yè)中,信息系統(tǒng)是至關(guān)重要的,一旦它出現(xiàn)問題將影響到企業(yè)的生存和獲利。為了應(yīng)付由于自然或其他原因的災(zāi)難對(duì)網(wǎng)絡(luò)操作中心或部分網(wǎng)絡(luò)造成的破壞,公司必須制定災(zāi)難恢復(fù)計(jì)劃。具有中心計(jì)算能力的公司還應(yīng)該考慮到災(zāi)難對(duì)于計(jì)算中心的影響,而且在近年來,另一種災(zāi)難應(yīng)該列入規(guī)劃——提供服務(wù)的通信公司或電話公司發(fā)生故障的情況。接下來,我們就討論一下災(zāi)難恢復(fù)計(jì)劃的有關(guān)背景知識(shí),為什么要做災(zāi)難恢復(fù)計(jì)劃,以及如何做災(zāi)難恢復(fù)計(jì)劃。
關(guān)鍵詞:災(zāi)難恢復(fù)計(jì)劃;故障;測(cè)試;網(wǎng)絡(luò)
中圖分類號(hào):TP309
1 災(zāi)難恢復(fù)計(jì)劃有關(guān)背景知識(shí)
我們看一下災(zāi)難發(fā)生對(duì)我們及世界所造成的影響:
1989年8月,美國(guó)紐約的一個(gè)大型電話公司NYNEX的工人罷工了幾個(gè)星期,顧客們無法安裝新的通信設(shè)備,維修電話所持續(xù)的時(shí)間超過了平時(shí)。震驚世界的911恐怖事件到現(xiàn)在已經(jīng)過去很多年了。在這次事件之后,大家對(duì)于能否在災(zāi)難發(fā)生之后快速恢復(fù)正常的工作變得關(guān)注起來。2008年伊始,一場(chǎng)罕見的暴雨雪襲擊了中國(guó)華南大部份地區(qū)。與此同時(shí),大范圍的雪災(zāi)大停電也讓CIO措手不及,突如其來的災(zāi)難給依賴IT系統(tǒng)運(yùn)行的企業(yè)帶來毀滅性打擊。
很顯然,類似的情況將來還會(huì)發(fā)生。當(dāng)災(zāi)難襲擊信息系統(tǒng)及通信公司時(shí),企業(yè)應(yīng)該制定應(yīng)急措施保護(hù)自己。管理人員的職責(zé)是要采取適當(dāng)?shù)臑?zāi)難恢復(fù)計(jì)劃,恢復(fù)網(wǎng)絡(luò)的功能。公司能否制定出行之有效的災(zāi)難恢復(fù)計(jì)劃并且讓公司在災(zāi)難發(fā)生之后可以持續(xù)的進(jìn)行服務(wù)工作變得尤為重要。
災(zāi)難恢復(fù)計(jì)劃是系統(tǒng)出現(xiàn)故障時(shí)應(yīng)對(duì)計(jì)劃的一部分,在我們看來,災(zāi)難是一種難以迅速修補(bǔ)的長(zhǎng)期的故障,火災(zāi)、洪水、風(fēng)暴和地震等就是如此。不可能馬上修復(fù),網(wǎng)絡(luò)或網(wǎng)絡(luò)中的一些重要部分將變得不可用。在本文中,如果沒有特別的標(biāo)明,我們所說的災(zāi)難指的是IT災(zāi)難。
2 災(zāi)難恢復(fù)計(jì)劃要考慮的因素
災(zāi)難恢復(fù)計(jì)劃要考慮的因素:在災(zāi)難中應(yīng)該維護(hù)何種程度的服務(wù)?企業(yè)內(nèi)部應(yīng)該如何通信?應(yīng)該在何處設(shè)立服務(wù)臺(tái)和指揮中心?這些策略和步驟是否能夠適當(dāng)、專業(yè)接入用戶的電話并提供及時(shí)的信息?計(jì)算機(jī)和數(shù)據(jù)是否有效地進(jìn)行了備份?在撤退時(shí)會(huì)發(fā)生什么情況?恢復(fù)的順序是怎樣的?各部門恢復(fù)運(yùn)行的順序如何?災(zāi)難恢復(fù)計(jì)劃的過程是否經(jīng)過定期測(cè)試?
3 如何恢復(fù)發(fā)生災(zāi)難的數(shù)據(jù)
做好災(zāi)難恢復(fù)準(zhǔn)備的公司能夠更好地維持運(yùn)營(yíng)、保住客戶并避免長(zhǎng)期損害。要在緊要關(guān)頭進(jìn)行災(zāi)難恢復(fù),必須具備三個(gè)條件:人員、數(shù)據(jù)(包括數(shù)據(jù)處理所需的硬件和軟件)和轉(zhuǎn)移位置。其恢復(fù)策略有:
聯(lián)系相關(guān)人員。每個(gè)公司都需要有一種方法來迅速召集相關(guān)人員到災(zāi)難恢復(fù)現(xiàn)場(chǎng)。無需電話線或移動(dòng)服務(wù)設(shè)備的通信方法,如衛(wèi)星電話就是一個(gè)很好的選擇。這種方法可以為不直接參與數(shù)據(jù)恢復(fù)的員工提供一條熱線,使之能夠獲得最新信息,而您則可以集中精力完成手頭的任務(wù)。
對(duì)服務(wù)器組進(jìn)行備份并建立備用站點(diǎn),發(fā)生故障時(shí),可以將通信線路切換到備用的站點(diǎn)上。在這種情況下,向廠商迅速購(gòu)買新的服務(wù)器是可能的,大部分商家宣稱他們會(huì)用“從生產(chǎn)線中出來的下一臺(tái)計(jì)算機(jī)”來替代被損壞的計(jì)算機(jī)。將網(wǎng)絡(luò)切換到新的站點(diǎn),如果這經(jīng)過預(yù)先計(jì)劃,可能比較容易實(shí)現(xiàn)。如果公司已制定好災(zāi)難恢復(fù)規(guī)劃,可以要求通信公司開發(fā)相應(yīng)的技術(shù)和設(shè)備,讓網(wǎng)絡(luò)可以切換到備用站點(diǎn)上。
有時(shí)候可以與其他企業(yè)簽訂相互幫助約定。發(fā)生災(zāi)難時(shí),企業(yè)之間要相互支持。發(fā)生災(zāi)難時(shí),企業(yè)之間應(yīng)該相互備份數(shù)據(jù)。一些企業(yè)只使用計(jì)算機(jī)中心來執(zhí)行批處理作業(yè),通過互助合同比較容易得到備份,另一些企業(yè)可能利用廣闊的網(wǎng)絡(luò)進(jìn)行在線處理,備份可能更困難一些。通過適當(dāng)?shù)囊?guī)劃,可以在公司之間鋪設(shè)一些額外的線路,至少可以提供一些后備的傳輸能力。如果兩個(gè)公司在物理位置上很接近,還要考慮到災(zāi)難會(huì)同時(shí)襲擊兩者的情況。
不管為何種災(zāi)難恢復(fù)制定的計(jì)劃,都要明確災(zāi)難的不同種類。位于紐約的Corning鎮(zhèn)的Corning公司制定了一個(gè)發(fā)生火災(zāi)時(shí)詳細(xì)的恢復(fù)計(jì)劃。但在1972年,Corning鎮(zhèn)遭受大洪水襲擊,Corning公司的網(wǎng)絡(luò)和計(jì)算機(jī)中心都淹沒在水中。盡管預(yù)先為火災(zāi)制訂的一些程序是適當(dāng)?shù)模珵榛馂?zāi)制定的很多計(jì)劃根本不適用于水災(zāi)。
制定合適的應(yīng)災(zāi)文檔。合適的應(yīng)災(zāi)文檔是恢復(fù)工作中最重要的第一步,保證支持關(guān)鍵系統(tǒng)的文檔記錄得到更新,讓專人負(fù)責(zé)記錄并保證記錄得以妥善進(jìn)行。
容災(zāi)系統(tǒng)。IT容災(zāi)系統(tǒng),顧名思義就是對(duì)可能被災(zāi)難破壞的數(shù)據(jù)、數(shù)據(jù)處理系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)、基礎(chǔ)設(shè)施及運(yùn)行管理能力備份的過程。不過,容災(zāi)備份并非災(zāi)難恢復(fù)的全部,它更重要的內(nèi)涵是恢復(fù)企業(yè)的業(yè)務(wù)。一般災(zāi)難可分為突發(fā)性和漸進(jìn)性兩大類,企業(yè)需要考慮要預(yù)防哪些災(zāi)難,這些災(zāi)難會(huì)使業(yè)務(wù)中斷多久等。災(zāi)難備份系統(tǒng)的目標(biāo)是要在災(zāi)難發(fā)生時(shí)保證數(shù)據(jù)的完整性、一致性和可靠性。不同類型災(zāi)難的保護(hù)方法是不一樣的:對(duì)于漸進(jìn)性災(zāi)難,應(yīng)用數(shù)據(jù)復(fù)制加數(shù)據(jù)備份組合技術(shù);而對(duì)于突發(fā)性災(zāi)難,在業(yè)務(wù)不能停頓的情況下需要復(fù)制技術(shù)來保護(hù)。
4 推行災(zāi)難恢復(fù)計(jì)劃的困難
事實(shí)上,目前許多企業(yè)并沒有意識(shí)到IT災(zāi)難的潛伏危害性,未雨綢繆在他們的口中變成空談,救火的英雄遠(yuǎn)比預(yù)防火災(zāi)的人更奪目。推行IT災(zāi)難恢復(fù)計(jì)劃困難重重,主要是存在這幾方面的誤區(qū):
災(zāi)難本身具有小概率、高風(fēng)險(xiǎn)的特性。很多企業(yè)生產(chǎn)任務(wù)都忙不過來,災(zāi)難也不是一定要發(fā)生的,三五年都可能不出事故,許多公司高層對(duì)IT災(zāi)難的態(tài)度是漠不關(guān)心。IT災(zāi)難恢復(fù)具有高投入、低效率的特性。災(zāi)備系統(tǒng)的投入并不是小錢,在不出事故的情況下是看不出IT災(zāi)難恢復(fù)計(jì)劃的效益,從而導(dǎo)致企業(yè)缺乏動(dòng)力。同災(zāi)難恢復(fù)的影響相比,開發(fā)災(zāi)難恢復(fù)計(jì)劃的成本就可能變得很低了——只需簡(jiǎn)單收集整理一些重要信息,如雇員和經(jīng)銷商聯(lián)系清單、IT設(shè)備列表、現(xiàn)有的網(wǎng)絡(luò)圖示以及應(yīng)用程序手冊(cè)等,就是朝正確方向邁進(jìn)。建設(shè)易、維持難。從以往的經(jīng)驗(yàn)來看,一些災(zāi)備系統(tǒng)在建立的時(shí)候,積極性相當(dāng)高,但建了幾年后人才都走光了。因此,在沒有災(zāi)難的時(shí)候這個(gè)系統(tǒng)除了演練、檢測(cè)、維修外基本不能干些什么,久而久之IT災(zāi)難恢復(fù)計(jì)劃就變成束之高閣了。
5 測(cè)試災(zāi)難恢復(fù)計(jì)劃
災(zāi)難恢復(fù)計(jì)劃要經(jīng)過測(cè)試,計(jì)劃中很難考慮到真正發(fā)生災(zāi)難時(shí)的所有問題。盡管測(cè)試并不能完全模擬真實(shí)的災(zāi)難,但可以發(fā)現(xiàn)計(jì)劃中的一些弱點(diǎn),測(cè)試災(zāi)難計(jì)劃可以采用一些特別的方法。災(zāi)難恢復(fù)系統(tǒng)只在災(zāi)難發(fā)生時(shí)才會(huì)考慮啟用,在企業(yè)日常運(yùn)營(yíng)中并不投入使用。因此,即使有問題不能使用也不會(huì)立即暴露出來,正是這個(gè)原因,測(cè)試才顯得特別重要。
6 結(jié)束語(yǔ)
古語(yǔ)云:“人無遠(yuǎn)慮,必有近憂”。既然災(zāi)難不可避免,只有平時(shí)多制定幾套對(duì)付各種可能出現(xiàn)的災(zāi)難恢復(fù)策略,當(dāng)災(zāi)難來臨時(shí)才能鎮(zhèn)定從容。隨著越來越依賴于網(wǎng)絡(luò),公司應(yīng)該經(jīng)常估算一下如果沒有了網(wǎng)絡(luò)機(jī)器系統(tǒng)支撐,可以支持多長(zhǎng)時(shí)間。讓用戶參與災(zāi)難故障影響的評(píng)估,可以建立相應(yīng)的案例,管理人員可以據(jù)此決定要花費(fèi)多少時(shí)間和金錢來制定和維護(hù)災(zāi)難恢復(fù)程序。
參考文獻(xiàn):
[1]Stanford H.Rowe and Marsha L.Schuh.Computer Networking[J].Pearson Education,2005.
[2]http://cio.ctocio.com.cn/eits/130/8071130.shtml
作者簡(jiǎn)介:劉燕美(1986-),女,河南原陽(yáng)人,助教,碩士,研究方向:計(jì)算機(jī)應(yīng)用、遠(yuǎn)程教育。
作者單位:鄭州航空工業(yè)管理學(xué)院,鄭州 450015
基金項(xiàng)目:鄭州航空工業(yè)管理學(xué)院教育科學(xué)研究基金項(xiàng)目(項(xiàng)目編號(hào):zhjy14-44)。