◆王曉翠
基于云原生重構(gòu)高校災(zāi)備系統(tǒng)的探索與實(shí)踐
◆王曉翠
(北京第二外國語學(xué)院 北京 100024)
隨著信息安全問題的日益突出,高校信息中心面臨著各種威脅。建設(shè)一套完整的災(zāi)備系統(tǒng)以保證系統(tǒng)的穩(wěn)定性、業(yè)務(wù)的連接性和數(shù)據(jù)可用性已成為高校信息化建設(shè)面臨的重要問題。但建設(shè)災(zāi)備數(shù)據(jù)中心需要投入大量的資金和人力資源,目前多數(shù)高校不具備建設(shè)災(zāi)備中心的條件。本文通過對幾種基于云的災(zāi)備方式進(jìn)行比較研究,發(fā)現(xiàn)云原生方案備份速度快,可靠性高,費(fèi)用較低且對技術(shù)人員要求不高,可作為高校信息系統(tǒng)異地容災(zāi)備份的一種新選擇。
容災(zāi)備份;云災(zāi)備;云原生
隨著信息化進(jìn)程的推進(jìn),高校信息化建設(shè)的范圍越來越廣泛,涉及教學(xué)、科研、管理等多個(gè)方面,如學(xué)工系統(tǒng)、財(cái)務(wù)系統(tǒng)、選課系統(tǒng)、資產(chǎn)管理系統(tǒng)、圖書館自動(dòng)化系統(tǒng)等。高度信息化為高校師生教、學(xué)、研、管等各方面帶來了便利,但信息化程度越高所產(chǎn)生的數(shù)據(jù)量也呈爆發(fā)式增長,高校所有業(yè)務(wù)的核心就是信息數(shù)據(jù),隨著信息安全問題的日益突出,學(xué)校的各類核心數(shù)據(jù)都受到各種威脅,自然災(zāi)害、人為故障、系統(tǒng)自身缺陷、惡意竊取和攻擊,這些都在無時(shí)無刻影響著我們的數(shù)據(jù)安全[1]。但鑒于對災(zāi)備系統(tǒng)的認(rèn)識不足以及建設(shè)與管理成本的限制,高校對災(zāi)備體系都沒有足夠的重視。等保2.0時(shí)代的到來對高校災(zāi)備體系提出了新要求。《中華人民共和國網(wǎng)絡(luò)安全法》第二十一條、三十四條明確規(guī)定關(guān)鍵信息基礎(chǔ)設(shè)施的運(yùn)營者應(yīng)當(dāng)履行對重要系統(tǒng)和數(shù)據(jù)庫進(jìn)行容災(zāi)備份的保護(hù)義務(wù),并在其他條文中規(guī)定了相應(yīng)的處罰細(xì)則。如何保證系統(tǒng)穩(wěn)定性、業(yè)務(wù)連續(xù)性和數(shù)據(jù)可用性已經(jīng)成為高校信息化建設(shè)必須考慮的重要問題。
傳統(tǒng)災(zāi)備方案是由用戶自行購買存儲(chǔ)設(shè)備,在本地或異地建設(shè)災(zāi)備中心,由組織內(nèi)部的技術(shù)人員進(jìn)行維護(hù)。但往往企業(yè)自建的數(shù)據(jù)中心由于缺乏整體規(guī)劃、技術(shù)人員水平有限、沒有定制相應(yīng)的恢復(fù)方案或不具備恢復(fù)演練的條件等原因沒有達(dá)到預(yù)期的效果。隨著云計(jì)算和大數(shù)據(jù)技術(shù)的發(fā)展,云平臺以其獨(dú)特的優(yōu)勢被越來越多的企業(yè)所接受和使用。云計(jì)算的使用,可以大幅度減少用戶的 IT 資源與人力成本的投入,同時(shí)獲得更加彈性和強(qiáng)大的計(jì)算能力,可快速便捷拓展業(yè)務(wù)[2]。由于云平臺的靈活性,災(zāi)備也衍生了新的概念——云災(zāi)備。本文將通過對當(dāng)前常用云災(zāi)備的幾種方案進(jìn)行比較,探索利用云原生方案重構(gòu)高校信息中心災(zāi)備機(jī)制。
云災(zāi)備是指災(zāi)備業(yè)務(wù)的云端實(shí)現(xiàn)形式,與傳統(tǒng)的組織在本地或異地災(zāi)備模式不同,云災(zāi)備是一種全新的災(zāi)備服務(wù)模式,它將災(zāi)備看作是一種服務(wù),由客戶付費(fèi)使用,由災(zāi)備服務(wù)提供商提供產(chǎn)品的服務(wù)模式。采用這種模式,客戶可以利用服務(wù)提供商的優(yōu)勢技術(shù)資源、豐富的災(zāi)備項(xiàng)目經(jīng)驗(yàn)和成熟的運(yùn)維管理流程,快速實(shí)現(xiàn)用戶的災(zāi)備目標(biāo),降低客戶的運(yùn)維成本和工作強(qiáng)度,同時(shí)也降低災(zāi)備系統(tǒng)的總體擁有成本[2]。云災(zāi)備主要包括傳統(tǒng)物理主機(jī)、虛擬機(jī)等 IT 系統(tǒng)往云端災(zāi)備,以及云與云之間的災(zāi)備等。云災(zāi)備包括了傳統(tǒng)的數(shù)據(jù)存儲(chǔ)和定時(shí)復(fù)制,以及數(shù)據(jù)的實(shí)時(shí)傳輸、系統(tǒng)遷移、應(yīng)用切換,保證災(zāi)備端應(yīng)急接管業(yè)務(wù)應(yīng)用等范疇[2]。
云災(zāi)備結(jié)合云平臺的計(jì)算、存儲(chǔ)和帶寬等諸多優(yōu)勢,相比本地災(zāi)備具備了多方面的優(yōu)勢:
(1)減少基礎(chǔ)設(shè)施,降低IT成本
傳統(tǒng)災(zāi)備系統(tǒng)需要用戶購買大量存儲(chǔ)設(shè)備,自建數(shù)據(jù)中心,通過RAID 方式來實(shí)現(xiàn)數(shù)據(jù)冗余和數(shù)據(jù)恢復(fù)。云存儲(chǔ)系統(tǒng)則主要采用大量廉價(jià)的普通主機(jī),基于網(wǎng)絡(luò)利用分布式協(xié)同軟件,將數(shù)據(jù)分散存儲(chǔ)于若干通用存儲(chǔ)服務(wù)器上,并通過副本或編碼方法進(jìn)行綜合管理,向用戶提供可靠的統(tǒng)一的邏輯存儲(chǔ)空間。利用云存儲(chǔ)系統(tǒng),用戶可直接借助云平臺供應(yīng)商提供的計(jì)算和存儲(chǔ)平臺,或者直接采用云災(zāi)備DRaaS(災(zāi)難恢復(fù)即服務(wù))應(yīng)用服務(wù),可以免去購置大量存儲(chǔ)設(shè)備自建數(shù)據(jù)中心所帶來的硬件購買及維護(hù)成本。采用更為經(jīng)濟(jì)、更具彈性的云存儲(chǔ)進(jìn)行備份,實(shí)現(xiàn)了對資源的精細(xì)化管理,進(jìn)而減少大部分的災(zāi)備支出,同時(shí)也可以節(jié)省更多人力資源,企業(yè)可以將解放出來的備份維護(hù)人員投入到其他的更重要的工作中去。
(2)按需擴(kuò)容、按使用付費(fèi)
傳統(tǒng)的災(zāi)備方案需要建立與生產(chǎn)中心架構(gòu)完全對應(yīng)的災(zāi)備中心,而云災(zāi)備可以采用云基礎(chǔ)設(shè)施,或者災(zāi)備即服務(wù)的模式,允許用戶自由選定重要的系統(tǒng)和數(shù)據(jù)。因?yàn)榈讓蛹軜?gòu)被其他采用同樣云計(jì)算解決方案的公司所共有,共同分擔(dān)成本,所以用戶只需為實(shí)際所使用的資源付費(fèi),從而大大減少了資源的開支與浪費(fèi),并提升了效率[2]。
(3)高度靈活性
云災(zāi)備具有高可用、高安全、易擴(kuò)展、無限擴(kuò)容等特點(diǎn),使得業(yè)務(wù)需求更容易評估,用戶可以更準(zhǔn)確預(yù)估哪個(gè)系統(tǒng)、甚至哪個(gè)子系統(tǒng)確實(shí)需要維護(hù)。也可以更細(xì)粒度地選擇關(guān)鍵的數(shù)據(jù)來優(yōu)化自身的備份計(jì)劃,而不是整個(gè)地完全備份,更精確地設(shè)置RPO,即能容忍的最大數(shù)據(jù)丟失量。云中建立的高可用、高容錯(cuò)架構(gòu)可以提升恢復(fù)時(shí)間和恢復(fù)點(diǎn)目標(biāo),基于公有云平臺或者開源的私有云技術(shù)也可以簡便、快速、靈活地構(gòu)建災(zāi)備節(jié)點(diǎn)并將數(shù)據(jù)遷移或者復(fù)制到云端,提升災(zāi)難恢復(fù)的速度。
(4)快速迭代的復(fù)制與恢復(fù)技術(shù)
云災(zāi)備使用戶可以預(yù)先準(zhǔn)確估計(jì)恢復(fù)的時(shí)間,確保停機(jī)時(shí)間在一個(gè)可接受的合理范圍內(nèi),從而可以制定一個(gè)準(zhǔn)確的、可交付的SLA 協(xié)議,并可以遠(yuǎn)程使用云計(jì)算和云存儲(chǔ)資源[2]。
在具體的實(shí)際場景應(yīng)用中,按照不同的對云的利用方式,云災(zāi)備方案包括混合云方案、云托管及云原生方案。
本地部署方案是將災(zāi)備方案中的服務(wù)器、災(zāi)備軟件、備份存儲(chǔ)設(shè)備等部署在本地?cái)?shù)據(jù)中心,災(zāi)備系統(tǒng)全部由組織內(nèi)部技術(shù)人員維護(hù)的數(shù)據(jù)保護(hù)方案,在很多企業(yè)得到廣泛的應(yīng)用。數(shù)據(jù)中心按兩地三中心定義可劃分為本地生產(chǎn)數(shù)據(jù)中心、同城雙活數(shù)據(jù)中心、異地?cái)?shù)據(jù)中心??紤]到建設(shè)成本和管理成本,目前高校多使用本地生產(chǎn)數(shù)據(jù)中心和同城雙活數(shù)據(jù)中心兩種災(zāi)備模式。多數(shù)不具備建立異地中心的條件。本地部署優(yōu)點(diǎn)是整個(gè)系統(tǒng)部署在組織內(nèi)部,可控性程度高;缺點(diǎn)是硬件軟件成本高、維護(hù)工作量大、上線時(shí)間長、擴(kuò)展性差。
混合云方案與本地部署數(shù)據(jù)保護(hù)方案相比,服務(wù)器、災(zāi)備軟件和備份存儲(chǔ)都相同,只是長期歸檔數(shù)據(jù)保存到云上。混合云方案用云端存儲(chǔ)替代了傳統(tǒng)的磁帶設(shè)備,相比傳統(tǒng)本地部署方案投入有所降低。混合云方案的優(yōu)點(diǎn)是相比本地部署,備份存儲(chǔ)介質(zhì)投入有所減少;缺點(diǎn)仍和本地部署方案相似,硬件軟件成本高、維護(hù)工作量大、上線時(shí)間長、擴(kuò)展性差。
云托管是從云計(jì)算提供商處采購計(jì)算資源以托管數(shù)據(jù)、服務(wù)的解決方案,是一種基礎(chǔ)架構(gòu)即服務(wù)(IaaS)云交付模型,是按需提供并托管在云計(jì)算基礎(chǔ)設(shè)施之上。相對混合云,云上托管有更好的可靠性,但是云上托管方案并沒有針對云環(huán)境進(jìn)行豐富的優(yōu)化,對云的經(jīng)濟(jì)性的價(jià)值利用有限,而且云上托管方案仍然需要IT團(tuán)隊(duì)花費(fèi)較多的精力進(jìn)行維護(hù)。
CNCF(云原生計(jì)算基金會(huì))對云原生這樣定義:云原生技術(shù)有利于各組織在公有云、私有云和混合云等新型動(dòng)態(tài)環(huán)境中,構(gòu)建和運(yùn)行可彈性擴(kuò)展的應(yīng)用[3]。確切的說云原生其實(shí)是一套指導(dǎo)進(jìn)行軟件架構(gòu)設(shè)計(jì)的思想。云原生最大的價(jià)值是認(rèn)為未來的軟件從誕生起就長在云上[4]。云原生方案是數(shù)據(jù)保護(hù)的SaaS服務(wù)。它充分利用了云的特性,在性能和可用性方面做了大量優(yōu)化。它提供了備份和恢復(fù)流程的集中管理,擴(kuò)展性好。相比混合云和云上托管有更好的投入產(chǎn)出。云原生方案無需客戶部署任何軟硬件,30分鐘即可開始備份與恢復(fù)任務(wù)。
本文對四種災(zāi)備方案從可靠性、可用性等九個(gè)方面進(jìn)行比較,如表1所示。
表1 災(zāi)備方案比較
云原生災(zāi)備系統(tǒng)相比其他部署方案有以下優(yōu)勢:
(1)較低的資源成本。利用云原生災(zāi)備方案,無須購買服務(wù)器、災(zāi)備軟件、備份存儲(chǔ)等設(shè)備,而改為按備份使用量計(jì)費(fèi),降低了災(zāi)備方案的投入成本。
(2)降低管理成本。傳統(tǒng)的本地部署方案中管理人員需要接受培訓(xùn)、維護(hù)災(zāi)備方案中的硬件、軟件,管理難度高,云原生方案只需管理人員設(shè)定備份計(jì)劃即可,方案維護(hù)有云災(zāi)備服務(wù)商負(fù)責(zé)。
(3)異地分支機(jī)構(gòu)統(tǒng)一管理。對于異地?cái)?shù)據(jù)保護(hù)及災(zāi)難恢復(fù)的場景,一套方案、一個(gè)管理控制臺,一套全局視圖。
(4)減少企業(yè)業(yè)務(wù)中斷時(shí)間?;谠贫说膹椥?、資源編排服務(wù)等能力,可一鍵在云上自動(dòng)化快速恢復(fù)企業(yè)業(yè)務(wù),無須專業(yè)知識,無須干預(yù)。
無限擴(kuò)展性。云端資源的無限擴(kuò)展性,讓企業(yè)無須提前規(guī)劃購買多少資源,按需購買,隨買隨用。
利用云原生方案實(shí)施的災(zāi)備服務(wù)項(xiàng)目,核心信息系統(tǒng)數(shù)據(jù)安全和業(yè)務(wù)連續(xù)性得到了全面提升,實(shí)現(xiàn)了重要業(yè)務(wù)系統(tǒng)等本地高效的數(shù)據(jù)及應(yīng)用的容災(zāi)容錯(cuò)。經(jīng)測試,業(yè)務(wù)系統(tǒng)本地恢復(fù)RTO(恢復(fù)時(shí)間目標(biāo))<1 0分鐘,RPO(恢復(fù)點(diǎn)目標(biāo))≈0;云端恢復(fù)RTO<30分鐘,RPO<5分鐘??梢悦黠@看出云原生的優(yōu)勢,它具有高度可靠性和可用性,上線時(shí)間短,花費(fèi)低且對帶寬要求不高。
云原生的優(yōu)點(diǎn)是災(zāi)備費(fèi)用低、性能好、無限擴(kuò)展、管理簡單,但實(shí)際落地卻非常復(fù)雜,涉及許多新技術(shù),以及新的思維方式。目前的云原生應(yīng)用并非完美無缺,很明顯的三個(gè)問題在于第一、云原生沒有統(tǒng)一標(biāo)準(zhǔn)可循,用戶需根據(jù)自己的實(shí)際需求,找到最適合自己的云原生解決方案[5];第二、云原生剛剛起步,缺少相關(guān)標(biāo)準(zhǔn)與支持;第三、云原生的核心是應(yīng)用生來在就云上,要想云原生應(yīng)用快速落地,就需要大量專業(yè)的人才,特別是既懂業(yè)務(wù)又懂技術(shù)的專業(yè)人才。
隨著信息化的不斷推進(jìn),高校各個(gè)業(yè)務(wù)對信息系統(tǒng)的依賴性不斷增強(qiáng),信息系統(tǒng)的連續(xù)性和可靠性需求越發(fā)迫切?;诠性频脑茷?zāi)備模式將容災(zāi)管理轉(zhuǎn)變?yōu)橐环N服務(wù),用戶根據(jù)使用量按需付費(fèi),極大地節(jié)省了系統(tǒng)投資,降低了管理難度,同時(shí)便于業(yè)務(wù)的彈性擴(kuò)展,是企業(yè)信息系統(tǒng)災(zāi)備建設(shè)的可靠選擇。CNCF(云原生計(jì)算基金會(huì))的調(diào)查數(shù)據(jù)顯示云原生技術(shù)有三大優(yōu)勢,即更快的部署、更高的可擴(kuò)展性和更好的可移植性。CNCF 2018年報(bào)數(shù)據(jù)顯示,云原生技術(shù)在生產(chǎn)系統(tǒng)中的應(yīng)用數(shù)量翻了一番,正評估和準(zhǔn)備使用云原生技術(shù)的企業(yè)用戶數(shù)量增長了3倍以上[3]。云原生應(yīng)用已是大勢所趨。盡管云原生還有很多技術(shù)需要專業(yè)人員進(jìn)一步開拓,但無論如何,云原生時(shí)代已經(jīng)到來,不管你用或是不用,云原生就在那里,誰受益誰舉步維艱,一目了然;不管你現(xiàn)在用或是未來用,云原生在持續(xù)進(jìn)化之中,只有適合自己的才是最好的[3]。
[1]孔琳俊. 高校信息化環(huán)境下災(zāi)備體系建設(shè)的研究與應(yīng)用[J]. 軟件,2013,34(3):94-97.
[2]英方研究院,災(zāi)備技術(shù)國家工程實(shí)驗(yàn)室,災(zāi)備技術(shù)產(chǎn)業(yè)聯(lián)盟. 2019中國災(zāi)備行業(yè)白皮書[R].上海:上海英方軟件股份有限公司,2019.
[3]人人都愛云原生[N].中國信息化周報(bào),2019-07-15 (008).
[4]林琳. 為什么說2019年是云原生的關(guān)鍵節(jié)點(diǎn)[J]. 計(jì)算機(jī)與網(wǎng)絡(luò),2019,45(19):38-40.
[5]蘇堅(jiān). 基于云原生計(jì)算的5G網(wǎng)絡(luò)演進(jìn)策略[J]. 電信科學(xué),2018,34(6):147-152.