起容災(zāi),無(wú)論是IT管理員,還是
行業(yè)專家,各有各的說(shuō)法。紛繁復(fù)雜的技術(shù)和理念,爭(zhēng)奇斗妍的方案和產(chǎn)品,讓人猶如霧里看花般,難辨優(yōu)劣。對(duì)于需要容災(zāi)的用戶而言,首先要搞清楚的,就是到底容災(zāi)是什么?容災(zāi)解決什么問(wèn)題,具有什么價(jià)值,如何去選擇解決方案?而這,也是我們這個(gè)系列文章的出發(fā)點(diǎn),看清容災(zāi),看清方案、成本和價(jià)值,讓選擇更加從容,方案更加專業(yè)。
中國(guó)用戶容災(zāi)現(xiàn)狀
在本刊第七期“容災(zāi)的前世今生”一文里,我們探討了什么是容災(zāi),容災(zāi)的發(fā)展史。通過(guò)對(duì)容災(zāi)發(fā)展史的縱觀,可以看到,整個(gè)容災(zāi)技術(shù)是根據(jù)不同的需求,由各種不同的技術(shù)結(jié)合發(fā)展而來(lái)的,最后統(tǒng)一歸納成一體化的形態(tài)。容災(zāi)要解決兩個(gè)問(wèn)題,一是數(shù)據(jù)不丟失;二個(gè)應(yīng)用不間斷。
經(jīng)市場(chǎng)調(diào)查表明,中國(guó)有70%的數(shù)據(jù)容災(zāi)用戶需求量,面臨著最基本的備份方案的困擾,比如備份時(shí)間過(guò)長(zhǎng),數(shù)據(jù)恢復(fù)不成功等,其中有80%的應(yīng)用容災(zāi)用戶需求量。但市場(chǎng)上提供的產(chǎn)品絕大部分都是有備份沒(méi)應(yīng)用容災(zāi),或者有應(yīng)用容災(zāi)而沒(méi)備份,真正能夠同時(shí)解決備份和應(yīng)用容災(zāi)需求的一體化應(yīng)用產(chǎn)品可遇而不可求。一直以來(lái),傳統(tǒng)容災(zāi)都是屬于高高在上的奢侈品,能夠用得起的用戶很少,在這么龐大的需求量里有90%的用戶因?yàn)槌杀静豢煽?,而用不起傳統(tǒng)容災(zāi)。比如幾年以前購(gòu)買的服務(wù)器和備份軟件,因?yàn)橄到y(tǒng)更新?lián)Q代,發(fā)現(xiàn)原有的技術(shù)方案已經(jīng)不能滿足實(shí)際需求;又或者是當(dāng)年的業(yè)務(wù)系統(tǒng)數(shù)據(jù)量小、負(fù)載低,用腳本備份就可以滿足需求,現(xiàn)在幾套系統(tǒng)并用,且全部實(shí)現(xiàn)無(wú)紙化,則顯得容災(zāi)系統(tǒng)不能有效地跟上整個(gè)業(yè)務(wù)系統(tǒng)的建設(shè)步伐。
在這樣一個(gè)災(zāi)難無(wú)處不在的IT環(huán)境里,用戶面臨著不知道如何選擇容災(zāi)的困境,要么就是只有備份,沒(méi)有選擇容災(zāi),要么就是想用容災(zāi),但是買不起,這就是中國(guó)用戶的容災(zāi)現(xiàn)狀。
容災(zāi)建設(shè)三要素
想用容災(zāi),卻難以普及,為什么?
IT管理員決心要打造一套無(wú)懈可擊的容災(zāi)系統(tǒng),但市面上容災(zāi)方案那么多,技術(shù)點(diǎn)那么多,而機(jī)房原來(lái)的投資又不想浪費(fèi),怎么辦?
我們先來(lái)看一下容災(zāi)系統(tǒng)建設(shè)需要考慮的必備三要素:價(jià)值、成本和方案。首先,容災(zāi)能創(chuàng)造什么樣的價(jià)值?IT系統(tǒng)建設(shè)有它自有不可違背的規(guī)律,企業(yè)組織架構(gòu)建設(shè)有它必須遵循的規(guī)則,容災(zāi)能夠?yàn)镮T系統(tǒng)建設(shè)和組織架構(gòu)建設(shè)帶來(lái)哪些價(jià)值,是需要考慮的最本質(zhì)的要素之一;其次,容災(zāi)需要投入多少成本,初始成本是多少,機(jī)會(huì)成本是多少,維護(hù)成本又是多少;最后,我們要選擇什么樣的方案才是真正的容災(zāi)方案,有效果的容災(zāi)系統(tǒng)應(yīng)該是在性能、管理、技術(shù)指標(biāo)RPO/RTO/DRO之間都能取得最佳平衡點(diǎn)。
能創(chuàng)造什么價(jià)值
(一)IT建設(shè)什么階段需要容災(zāi)
當(dāng)IT建設(shè)系統(tǒng)能創(chuàng)造價(jià)值的時(shí)候,容災(zāi)的價(jià)值就會(huì)相應(yīng)的凸顯出來(lái)。
萬(wàn)事萬(wàn)物都有其基本發(fā)展規(guī)律,IT信息化建設(shè)也不例外。從最初的基礎(chǔ)建設(shè)階段,包括PC、服務(wù)器、網(wǎng)絡(luò)等部署,到隨后的應(yīng)用建設(shè)階段,包括OA、網(wǎng)站、CRM、ERP、專用的業(yè)務(wù)系統(tǒng)等應(yīng)用,已經(jīng)成功跨入了運(yùn)維有效性建設(shè)階段,包括安全類、加速類、增強(qiáng)類系統(tǒng)、數(shù)據(jù)保護(hù)類等應(yīng)用。在這個(gè)階段,需要大量的安全防護(hù)類產(chǎn)品和解決方案來(lái)保證復(fù)雜應(yīng)用系統(tǒng)的運(yùn)維有效性,同時(shí)也因?yàn)楦黝惒豢煽咕芰σ馔馐录念l發(fā),側(cè)面印證了IT運(yùn)維有效性建設(shè)的多維度必要性。對(duì)于這個(gè)階段的用戶來(lái)說(shuō),容災(zāi)系統(tǒng)的建設(shè)已經(jīng)成為了一個(gè)必選項(xiàng),而不是可選項(xiàng)。
從這里,我們可以看出為什么容災(zāi)難普及的原因之一。即在信息落后的區(qū)域,對(duì)于沒(méi)有進(jìn)入IT運(yùn)維有效性建設(shè)階段的用戶來(lái)說(shuō),就沒(méi)有考慮容災(zāi)系統(tǒng)建設(shè)對(duì)業(yè)務(wù)價(jià)值的必要;但是在信息比較發(fā)達(dá)的區(qū)域,他們更多的需要考慮容災(zāi)系統(tǒng)建設(shè)對(duì)于公司組織機(jī)構(gòu)的價(jià)值在哪里。
(二)容災(zāi)對(duì)組織機(jī)構(gòu)有何幫助
容災(zāi)系統(tǒng)建設(shè)對(duì)組織機(jī)構(gòu)的價(jià)值體現(xiàn)在哪里?
在信息化比較發(fā)達(dá)的區(qū)域,IT建設(shè)項(xiàng)目審批時(shí)會(huì)遇到“申請(qǐng)預(yù)算”這項(xiàng)工作。對(duì)于信息主管來(lái)說(shuō),要想部署容災(zāi)方案,就得說(shuō)服管理決策團(tuán)隊(duì)、財(cái)務(wù)部門。上了容災(zāi),對(duì)整個(gè)組織機(jī)構(gòu)有什么幫助?在這個(gè)說(shuō)服過(guò)程中,需要有數(shù)據(jù)和管理方面的支撐。首先,部署了容災(zāi)系統(tǒng)后,能保證數(shù)據(jù)不丟失和應(yīng)用不間斷。其次,它還可以幫助企業(yè)建立管理職責(zé),防范風(fēng)險(xiǎn)和事故等。相反,假設(shè)沒(méi)有容災(zāi)系統(tǒng),一旦發(fā)生災(zāi)難,也許沒(méi)有明確的部門來(lái)承擔(dān)責(zé)任。至于如何承擔(dān),怎么考核,都會(huì)因?yàn)檫@個(gè)容災(zāi)系統(tǒng)的建立發(fā)生很大的變化。
如果現(xiàn)有的容災(zāi)只是提供一個(gè)RTO、RPO值的保證,而沒(méi)有提供事先控制、事中跟蹤和事后分析的機(jī)制,就沒(méi)辦法跟企業(yè)的管理目標(biāo)結(jié)合起來(lái)。這點(diǎn)類似我們的職能體系。如何把職能體系納入到考核體系里,如何把考核數(shù)據(jù)從考核系統(tǒng)中拿出來(lái)對(duì)職能體系進(jìn)行評(píng)估,這也是容災(zāi)系統(tǒng)需要改善的地方。目前,還沒(méi)有這樣的容災(zāi)方案是可以證明與組織機(jī)構(gòu)的管理目標(biāo)有結(jié)合價(jià)值的。
所以,真正的容災(zāi)方案不僅僅是需要服務(wù)于IT系統(tǒng)的建設(shè),還需要服務(wù)于整個(gè)企業(yè)的管理,這也正是它對(duì)組織管理的價(jià)值所在。而現(xiàn)在能做到兼而顧之的容災(zāi)方案寥寥無(wú)幾,這也是容災(zāi)為何難普及的原因之一。
要花多少成本
(一)什么是傳統(tǒng)4S方案
容災(zāi)方案一直都是以4S的方式來(lái)實(shí)現(xiàn),即首先購(gòu)買服務(wù)器(Server),接著安裝好操作系統(tǒng)(OS)和備份容災(zāi)軟件(Backup Software),最后,如果還有其他的大數(shù)據(jù)量的存儲(chǔ)需求,還需要另外購(gòu)買存儲(chǔ)硬件(Storage)來(lái)滿足數(shù)據(jù)存儲(chǔ)需求。這樣一種Server + OS + Software + Storage的傳統(tǒng)4S方案,無(wú)論從初始成本的投入來(lái)看,還是從后期的維護(hù)成本甚至機(jī)會(huì)成本來(lái)說(shuō),都是非常巨大的投入。對(duì)于廣大用戶來(lái)說(shuō),實(shí)在是一件門檻太高難以企及的事情。
(二)花什么樣的成本上容災(zāi)
從傳統(tǒng)4S方案初始成本的投入情況看,每個(gè)環(huán)節(jié)和流程都需要單獨(dú)的購(gòu)買產(chǎn)品組合成一個(gè)整體的方案來(lái)解決問(wèn)題。比如傳統(tǒng)的雙機(jī)高可用方案,至少需要2個(gè)廠商的產(chǎn)品才能保證應(yīng)用不間斷,即一家服務(wù)器廠商再加一家雙機(jī)軟件廠商;如果還需要保證數(shù)據(jù)不丟失,就得另外再部署VTL方案需要的備份軟件加虛擬帶庫(kù),這樣至少需要3個(gè)廠商;增加磁盤鏡像方案,還得另外再購(gòu)買其他廠商的產(chǎn)品;異地容災(zāi)還得買其他廠商的產(chǎn)品等等,最終造成容災(zāi)系統(tǒng)的建設(shè)需要一筆筆不斷投入的初始成本。
對(duì)于維護(hù)成本來(lái)說(shuō),因?yàn)橐粋€(gè)個(gè)環(huán)節(jié)流程的單獨(dú)產(chǎn)品和系統(tǒng)配置,整體的維護(hù)成本投入也很高, 試想一下,一套容災(zāi)系統(tǒng)的構(gòu)建需要至少向2個(gè)廠商購(gòu)買,在部署后的維護(hù)過(guò)程中,如果萬(wàn)一哪個(gè)環(huán)節(jié)出了問(wèn)題,需要向幾個(gè)廠商同時(shí)咨詢和交流,這樣無(wú)論是維護(hù)還是管理都需要多重成本的投入,對(duì)于用戶來(lái)說(shuō),是一件冗繁而且投入大的工作。
而在容災(zāi)方案系統(tǒng)建設(shè)的另外一個(gè)角度來(lái)看,機(jī)會(huì)成本也是衡量的重要指標(biāo)之一。所謂機(jī)會(huì)成本,就是我們避免了某一個(gè)事故發(fā)生,產(chǎn)生了多少成本。比如,傳統(tǒng)的雙機(jī)高可用方案只能單純的保障應(yīng)用不間斷,不能保證數(shù)據(jù)不丟失,那么如果因?yàn)橐馔馐录G失數(shù)據(jù)所帶來(lái)的損失,就是傳統(tǒng)雙機(jī)高可用方案的機(jī)會(huì)成本損失。又比如,VTL備份方案雖然有了備份操作,但是因?yàn)榧夹g(shù)漏洞,備份窗口間的數(shù)據(jù)的丟失機(jī)率很大。還有,通過(guò)磁盤鏡像來(lái)實(shí)現(xiàn)對(duì)數(shù)據(jù)的保護(hù),本地的數(shù)據(jù)無(wú)憂了,但是政府又出了需要防自然災(zāi)害的政策要求等。
從這里我們可以看出,對(duì)于傳統(tǒng)4S方案來(lái)說(shuō),容災(zāi)系統(tǒng)建設(shè)成本投入的不可控風(fēng)險(xiǎn)是非常大的。到底需要花什么樣的成本上容災(zāi),沒(méi)有一個(gè)可系統(tǒng)規(guī)劃的流程和可系統(tǒng)衡量的參考。
選擇什么方案
(一)明確什么樣的容災(zāi)需求
面臨各種類型的容災(zāi)方案,到底該選哪個(gè)好呢?我們先來(lái)看一下容災(zāi)方案建設(shè)首先有哪些具體的需求類別。
針對(duì)生產(chǎn)系統(tǒng)的應(yīng)用系統(tǒng)和存儲(chǔ)系統(tǒng)部分,需要保證它們的高可用、高性能和高可靠,比較有效的辦法,就是通過(guò)集群和RAID技術(shù)來(lái)保證。若需要針對(duì)關(guān)鍵服務(wù)器的數(shù)據(jù)和應(yīng)用系統(tǒng)提供保障,則可以通過(guò)復(fù)制和備份技術(shù)來(lái)保證應(yīng)用系統(tǒng)的可用度和數(shù)據(jù)的安全性。倘若還需要針對(duì)關(guān)鍵應(yīng)用服務(wù)器實(shí)現(xiàn)應(yīng)用不間斷的實(shí)時(shí)保護(hù)效果,則需要再針對(duì)它進(jìn)行異地的容災(zāi)系統(tǒng)建設(shè),保證應(yīng)用不間斷。
面對(duì)這些五花八門的需求,到底要怎樣做,做到什么樣的程度才能保證數(shù)據(jù)和應(yīng)用的安全?這是我們?cè)谶M(jìn)行容災(zāi)方案選擇時(shí)需首要考慮的關(guān)鍵點(diǎn)之一。
(二)選擇什么樣的技術(shù)指標(biāo)
在明確了容災(zāi)方案的具體需求后,再來(lái)看看容災(zāi)方案的建設(shè)又有哪些關(guān)鍵技術(shù)指標(biāo)是需要權(quán)衡的。
在前面的篇章里我們已經(jīng)了解到,針對(duì)非關(guān)鍵系統(tǒng)和關(guān)鍵系統(tǒng),共有兩個(gè)指標(biāo),即非關(guān)鍵系統(tǒng)需要保障的是數(shù)據(jù)不丟失,關(guān)鍵系統(tǒng)需要保障的是數(shù)據(jù)不丟失加應(yīng)用不間斷。其對(duì)應(yīng)到容災(zāi)方案就是:對(duì)于非關(guān)鍵系統(tǒng)數(shù)據(jù),容災(zāi)方案就可以滿足需求;對(duì)于關(guān)鍵系統(tǒng)則需要應(yīng)用容災(zāi)方案來(lái)滿足需求。數(shù)據(jù)容災(zāi)方案只需要評(píng)估兩個(gè)技術(shù)指標(biāo)即可:RPO和RTO。因?yàn)檫@兩個(gè)指標(biāo)值能夠最直觀和客觀地反應(yīng)出備份窗口和恢復(fù)數(shù)據(jù)量的大小。而對(duì)于應(yīng)用容災(zāi)方案來(lái)說(shuō),僅靠這兩個(gè)指標(biāo)是不能精確定位出容災(zāi)服務(wù)器的性能需求的,需要DRO,即容災(zāi)性能指標(biāo)。以容災(zāi)備用系統(tǒng)與生產(chǎn)系統(tǒng)的性能比例,來(lái)評(píng)估容災(zāi)服務(wù)器的配置情況。因此,從數(shù)據(jù)容災(zāi)到應(yīng)用容災(zāi),需要完整地滿足這三個(gè)技術(shù)指標(biāo),才是真正意義上的滿足。
除了這三個(gè)指標(biāo),還有非常關(guān)鍵的一點(diǎn),就是整個(gè)規(guī)范流程的建立和落實(shí)。從最開(kāi)始用戶環(huán)境的分析評(píng)估到容災(zāi)目標(biāo)設(shè)計(jì),再到項(xiàng)目實(shí)施驗(yàn)證和維護(hù)管理,每個(gè)環(huán)節(jié)必不可少,而且均需要有非??b密的技術(shù)實(shí)施細(xì)節(jié)保證。由此可見(jiàn),容災(zāi)系統(tǒng)的建設(shè)不是一蹴而就的事,從事前到事中到事后,均有配套的嚴(yán)密的流程控制來(lái)支撐容災(zāi)目標(biāo)的實(shí)現(xiàn)。
面對(duì)這么多的技術(shù)指標(biāo),我們期盼有一套容災(zāi)系統(tǒng)能針對(duì)不同應(yīng)用滿足不同的技術(shù)指標(biāo),這樣才能讓傳統(tǒng)復(fù)雜的容災(zāi)方案能夠得到最廣泛的普及。
(三)什么樣的管理和性能才好
多少年來(lái),容災(zāi)系統(tǒng)一直不變的追求是管理和性能。那么,到底什么樣的管理和性能才是最好的呢?
對(duì)于管理來(lái)說(shuō),首先它需要滿足的基本剛性需求,是能同時(shí)管理數(shù)據(jù)容災(zāi)和應(yīng)用容災(zāi),還可在本地容災(zāi)和異地容災(zāi)間自然延伸。其次,容災(zāi)管理還有它需要滿足的高級(jí)需求,即能否管理不同技術(shù)指標(biāo)的方案,能否管理不同應(yīng)用的系統(tǒng)環(huán)境,能否對(duì)方案進(jìn)行事先控制,能否對(duì)方案進(jìn)行事中跟蹤,能否對(duì)方案進(jìn)行事后分析。對(duì)于性能來(lái)說(shuō),能否對(duì)系統(tǒng)主機(jī)的性能影響更小,能否以更短的時(shí)間完成恢復(fù),能否以更短的時(shí)間完成切換,能否使用更少的存儲(chǔ)空間。這些都是需要考慮到的性能要素。
但是,縱觀市面上的如此多的產(chǎn)品和解決方案,似乎還沒(méi)有遇到滿足這些管理和性能需求的集成方案。
傳統(tǒng)方案為何難以普及
一般來(lái)說(shuō),企業(yè)在最初只有數(shù)據(jù)定時(shí)備份需求,所選擇的方案是普通備份軟件加普通存儲(chǔ)設(shè)備, 應(yīng)用系統(tǒng)故障后在幾小時(shí)間內(nèi)恢復(fù)出數(shù)據(jù)即可,幾小時(shí)的數(shù)據(jù)丟失不會(huì)有任何影響。但隨著企業(yè)飛速發(fā)展,需要保護(hù)的數(shù)據(jù)量越來(lái)越大,備份時(shí)間越來(lái)越長(zhǎng),數(shù)據(jù)丟失容忍度從幾個(gè)小時(shí)降低到1個(gè)小時(shí),這時(shí)的原有數(shù)據(jù)備份方案就無(wú)法支撐變化。當(dāng)IT部門提出升級(jí)原有方案時(shí),發(fā)現(xiàn)原有方案?jìng)浞蒈浖δ苁艿较拗疲瑹o(wú)法提供更高級(jí)功能,如果方案升級(jí)必須采購(gòu)新的備份軟件產(chǎn)品,增加企業(yè)經(jīng)濟(jì)成本以及管理員的學(xué)習(xí)成本,可以說(shuō)整體投入入不敷出。
面對(duì)目前高速膨脹的文件和郵件數(shù)據(jù)量,以及日益復(fù)雜的應(yīng)用系統(tǒng),傳統(tǒng)容災(zāi)方案均是通過(guò)擁有各種技術(shù)的不同產(chǎn)品來(lái)實(shí)現(xiàn)各個(gè)層次的保護(hù)。比如:針對(duì)數(shù)據(jù)不丟失,會(huì)有備份產(chǎn)品、快照產(chǎn)品;針對(duì)應(yīng)用不間斷,會(huì)有CDP產(chǎn)品、雙機(jī)產(chǎn)品;針對(duì)海量數(shù)據(jù),會(huì)有存儲(chǔ)產(chǎn)品。各種不同特性解決不同問(wèn)題的產(chǎn)品進(jìn)行方案組合,但這樣不斷組合后,方案就會(huì)面臨以下幾個(gè)難點(diǎn):
首先,它是不能覆蓋需求層次的。因?yàn)榭倳?huì)面臨著另外一種需求難以滿足的困境,因而需要不斷的添加新的需求應(yīng)用;其次,技術(shù)目標(biāo)難以取舍。因?yàn)閺淖铋_(kāi)始的需求滿足就是零散脫節(jié)的,所以在技術(shù)目標(biāo)環(huán)節(jié),也是處于魚與熊掌難以兼得的現(xiàn)狀;還有,無(wú)法更好的管理。因?yàn)榻M合方案本身的局限性,所以必然面臨著同一套系統(tǒng)中不同產(chǎn)品的管理問(wèn)題,又因?yàn)椴煌a(chǎn)品有其自有的特性,所以各種單獨(dú)的問(wèn)題或者因組合而產(chǎn)生的問(wèn)題都會(huì)讓整體方案的管理面臨困境;最后,缺少性能支撐。雖然從磁帶到磁盤,再?gòu)拇疟P到一體化,每次飛躍都帶來(lái)了階段性的性能跨越,卻并沒(méi)有真正將每次的跨越統(tǒng)一集成起來(lái)產(chǎn)品和方案,所以導(dǎo)致傳統(tǒng)容災(zāi)方案一直以來(lái)缺少核心的性能支撐,不能滿足日益增長(zhǎng)的性能需求。
萬(wàn)變不離其宗。通過(guò)以上的分析,傳統(tǒng)容災(zāi)為何難以普及的原因已經(jīng)非常清晰??梢钥吹剑?yàn)閭鹘y(tǒng)容災(zāi)方案從價(jià)值到成本到方案的各種局限性,導(dǎo)致其讓人一直覺(jué)得高高在上。是不是能夠有一體化的產(chǎn)品和解決方案能夠打破這種仰望的局面和現(xiàn)狀,讓容災(zāi)能夠全面普及,讓用不起容災(zāi)的人能夠用得起容災(zāi),讓用容災(zāi)的人能夠更好地用容災(zāi)?請(qǐng)繼續(xù)關(guān)注本系列報(bào)道。
(作者單位:上海愛(ài)數(shù)軟件有限公司)