黃嘉偉
隨著我國自我創(chuàng)新技術(shù)的不斷發(fā)展,電子政務(wù)系統(tǒng)已率先開始將應(yīng)用遷移至擁有自己核心技術(shù)的信創(chuàng)云上。當(dāng)前信創(chuàng)云正處于云架構(gòu)不斷完善、云組件逐步豐富的過程。如何在信創(chuàng)云不斷變革發(fā)展的過程中,為信創(chuàng)云上的應(yīng)用系統(tǒng)建立保障有效的災(zāi)備體系已成為業(yè)界關(guān)注的問題。針對上述情況并基于信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范-GBT20988-2007和相關(guān)標(biāo)準(zhǔn),對信創(chuàng)云災(zāi)備體系建設(shè)所需的關(guān)鍵要素進(jìn)行了重新定義,并對關(guān)鍵要素進(jìn)行了建設(shè)分析。
信創(chuàng)云災(zāi)備建設(shè)能否成功實(shí)施,在應(yīng)急情況發(fā)生時(shí)能否真正起到恢復(fù)業(yè)務(wù)應(yīng)用系統(tǒng)、確保業(yè)務(wù)連續(xù)性的作用,關(guān)鍵點(diǎn)是要明確信創(chuàng)云災(zāi)備建設(shè)的一些基本要素。例如:有沒有安全的、能抵抗生產(chǎn)環(huán)境物理資源突發(fā)故障的保護(hù),有沒有考慮為生產(chǎn)業(yè)務(wù)系統(tǒng)和數(shù)據(jù)存儲(chǔ)系統(tǒng)配備容錯(cuò)機(jī)制,有沒有應(yīng)急情況下對資源系統(tǒng)的動(dòng)態(tài)控制機(jī)制,有沒有制定一套完善的應(yīng)急決策預(yù)案和處置流程等。
如上這些因素是信創(chuàng)云災(zāi)備體系建設(shè)必不可少的組成部分,直接影響信創(chuàng)云災(zāi)備建設(shè)的成功與否。為了確保災(zāi)難體系的有效性,并且能夠在成本可預(yù)期的范圍內(nèi)落地實(shí)現(xiàn),需要對這些關(guān)鍵需求制定規(guī)則和標(biāo)準(zhǔn),做到有依據(jù)、有衡量。當(dāng)用戶提出云上應(yīng)用保護(hù)的不同需求時(shí),可提供滿足需要災(zāi)難保護(hù)等級(jí)。
結(jié)合信創(chuàng)云系統(tǒng)的體系框架,并總結(jié)具體實(shí)施的成功建設(shè)經(jīng)驗(yàn),把信息系統(tǒng)災(zāi)難恢復(fù)建設(shè)的關(guān)鍵要素分成4個(gè)層面和1個(gè)預(yù)案。4個(gè)層面分別是:信創(chuàng)容災(zāi)資源層、信創(chuàng)容災(zāi)數(shù)據(jù)層、信創(chuàng)容災(zāi)系統(tǒng)層、信創(chuàng)容災(zāi)控制層。1個(gè)預(yù)案就是:應(yīng)急決策組織預(yù)案。
信創(chuàng)容災(zāi)資源層
信創(chuàng)容災(zāi)資源層是提供滿足信創(chuàng)云備份容災(zāi)所需的基礎(chǔ)資源。容災(zāi)資源層按照功能作用可以劃分為3類:
①以存放數(shù)據(jù)為目標(biāo)的存儲(chǔ)型云資源池;
②提供數(shù)據(jù)處理為主計(jì)算型云資源池;
③以及實(shí)現(xiàn)容災(zāi)備份功能的網(wǎng)絡(luò)資源。
其中計(jì)算和數(shù)據(jù)存儲(chǔ)可以合并兼顧,組成綜合云資源池。當(dāng)前,信創(chuàng)容災(zāi)資源層在基礎(chǔ)硬軟件層面已實(shí)現(xiàn)了自主研發(fā),不存在惡意后門風(fēng)險(xiǎn)。而且后續(xù)改進(jìn)升級(jí)或修補(bǔ)漏洞中,不受制于國外技術(shù)壁壘。信創(chuàng)容災(zāi)資源層很重要的一個(gè)作用就是從基礎(chǔ)資源層面對各種國產(chǎn)化設(shè)備聚合協(xié)調(diào)。
信創(chuàng)容災(zāi)數(shù)據(jù)層
信創(chuàng)容災(zāi)數(shù)據(jù)層主要功能是實(shí)現(xiàn)對應(yīng)用數(shù)據(jù)的備份。容災(zāi)數(shù)據(jù)層提供對云業(yè)務(wù)全方位數(shù)據(jù)保障能力,從數(shù)據(jù)層面保護(hù)用戶系統(tǒng)和業(yè)務(wù)的安全。數(shù)據(jù)層向上支撐系統(tǒng)層,支撐集群容災(zāi)和業(yè)務(wù)的切換實(shí)現(xiàn);向下對接資源層,確保數(shù)據(jù)備份的完整、零損失。同時(shí),在數(shù)據(jù)的傳輸流轉(zhuǎn)過程中,增加了遷移加密、傳輸加密等功能,有效地保護(hù)了用戶數(shù)據(jù)和業(yè)務(wù)的安全。
容災(zāi)數(shù)據(jù)層對結(jié)構(gòu)化數(shù)據(jù)的支撐對象主要包括:國內(nèi)外主流數(shù)據(jù)庫和開源數(shù)據(jù)庫。目前國內(nèi)自主的主流數(shù)據(jù)庫有達(dá)夢、金倉、南大通用、神通等,主流的開源數(shù)據(jù)庫有MySQL,MongoDB,PostgreSQL等。
當(dāng)生產(chǎn)端和備份目標(biāo)端采用不同廠商數(shù)據(jù)庫產(chǎn)品時(shí),適配調(diào)優(yōu)是必不可少的首要環(huán)節(jié)??偨Y(jié)在多個(gè)項(xiàng)目中的經(jīng)驗(yàn)并結(jié)合信創(chuàng)產(chǎn)品適配調(diào)優(yōu)一般規(guī)律,建議按照“組合適配+壓力適配+深度調(diào)優(yōu)”的過程開展適配調(diào)優(yōu)工作。
容災(zāi)數(shù)據(jù)層對非結(jié)構(gòu)化數(shù)據(jù)的支撐建議采用分布式架構(gòu),這樣可以不受到節(jié)點(diǎn)規(guī)模限制。對于海量小文件的備份和恢復(fù),可采用重復(fù)數(shù)據(jù)刪除算法、多通道并行備份等技術(shù),確保海量小文件的高效備份和迅速反向恢復(fù),解決了傳統(tǒng)備份技術(shù)上的難題。
信創(chuàng)容災(zāi)系統(tǒng)層
信創(chuàng)容災(zāi)系統(tǒng)層通常建議采用松耦合架構(gòu),實(shí)現(xiàn)生產(chǎn)應(yīng)用系統(tǒng)與災(zāi)備系統(tǒng)之間的消息傳遞、狀態(tài)判斷、決策處置等功能。當(dāng)前信創(chuàng)技術(shù)還處于高速成長變化過程中,對生產(chǎn)與災(zāi)備系統(tǒng)的狀態(tài)判斷和決策處置環(huán)節(jié),建議采用有人工干預(yù)的半自動(dòng)或半智能決策方式。
依據(jù)響應(yīng)時(shí)效和物理距離2個(gè)維度,系統(tǒng)層可實(shí)現(xiàn)3種模式的容災(zāi):
①在同一資源池內(nèi)的高可用容災(zāi);
②在同城距離范圍內(nèi)的雙活同城災(zāi)備;
③遠(yuǎn)程異地距離范圍的異地災(zāi)備。
同城災(zāi)備在物理距離上通常定義為生產(chǎn)環(huán)境與災(zāi)備環(huán)境在100 km范圍內(nèi),2點(diǎn)間數(shù)據(jù)傳送在50 ms內(nèi)。遠(yuǎn)程異地災(zāi)備是為了防范區(qū)域性的自然災(zāi)難,通常建議大于300 km。
高可用:容災(zāi)系統(tǒng)部署在同一資源池內(nèi)的另外一個(gè)資源宿主機(jī)上,當(dāng)業(yè)務(wù)系統(tǒng)所在的資源宿主機(jī)發(fā)生故障時(shí),將業(yè)務(wù)切換到該容災(zāi)宿主機(jī)上。
雙活/同城災(zāi)備:將容災(zāi)系統(tǒng)部署在距離相近的另外一個(gè)資源池中,當(dāng)業(yè)務(wù)系統(tǒng)發(fā)生故障時(shí),將業(yè)務(wù)切換到容災(zāi)系統(tǒng)上。此形式下,業(yè)務(wù)系統(tǒng)和容災(zāi)系統(tǒng)部署在不同的資源池中,可靠性更高。相比高可用模式,存在網(wǎng)絡(luò)切換時(shí)延和數(shù)據(jù)同步方面的性能差距。
異地災(zāi)備:提供跨區(qū)域的災(zāi)備保障能力,能有效地應(yīng)對超大規(guī)模地域級(jí)別災(zāi)害,提高數(shù)據(jù)的可靠性和業(yè)務(wù)的連續(xù)性。遠(yuǎn)程異地災(zāi)備的數(shù)據(jù)響應(yīng)時(shí)延較長,數(shù)據(jù)復(fù)制或同步的方式通常選擇異步模式。
信創(chuàng)容災(zāi)控制層
容災(zāi)控制層作為整個(gè)災(zāi)備體系的控制中心,實(shí)時(shí)對災(zāi)備資源監(jiān)控進(jìn)行配置變更和告警處理。提供多租戶災(zāi)備資源管理、資源監(jiān)控與計(jì)費(fèi)、災(zāi)備策略配置管理、災(zāi)備作業(yè)管理、統(tǒng)計(jì)和報(bào)表管理、綜合運(yùn)維監(jiān)控與告警等功能模塊,為用戶提供統(tǒng)一的身份認(rèn)證、工作流審批管理功能,實(shí)現(xiàn)云管功能與災(zāi)備業(yè)務(wù)流程的對接,實(shí)現(xiàn)標(biāo)準(zhǔn)化、可視化、流程化的災(zāi)備服務(wù)要求。
在災(zāi)備體系的運(yùn)轉(zhuǎn)中,災(zāi)備環(huán)境與生產(chǎn)環(huán)境的基準(zhǔn)核對是非常重要的一項(xiàng)日常工作。容災(zāi)控制層需要提供對生產(chǎn)與災(zāi)備環(huán)境配置的比對功能,同時(shí)為確??芍螛I(yè)務(wù)的動(dòng)態(tài)變化,需要具有對基線管理的靈活擴(kuò)展功能??梢噪S時(shí)將當(dāng)前生產(chǎn)實(shí)際環(huán)境、應(yīng)用配置等內(nèi)容與災(zāi)備環(huán)境進(jìn)行比對,實(shí)現(xiàn)生產(chǎn)與災(zāi)備配置的一致性管理。
應(yīng)急決策組織預(yù)案
應(yīng)急決策組織預(yù)案是指當(dāng)災(zāi)難發(fā)生時(shí),為確保業(yè)務(wù)系統(tǒng)能夠持續(xù)運(yùn)行,業(yè)務(wù)相關(guān)人員能夠合理應(yīng)對災(zāi)難,支撐整個(gè)業(yè)務(wù)恢復(fù)工作中所需的人員、任務(wù)、行動(dòng)、和資源調(diào)度的文件(文案)。應(yīng)急決策組織預(yù)案在編制的過程中要注意到以下4個(gè)方面:
①預(yù)案應(yīng)具有針對性,針對可能發(fā)生事故,為迅速、有序地開展應(yīng)急行動(dòng)而預(yù)先制定的行動(dòng)方案,因此預(yù)案應(yīng)結(jié)合災(zāi)難導(dǎo)致的結(jié)果來分析。比如,針對可能發(fā)生的各類事故,在編制預(yù)案計(jì)劃階段就需要對經(jīng)營活動(dòng)中可能發(fā)生的事故進(jìn)行分析和羅列,在此基礎(chǔ)上編制預(yù)案,這樣才能保證預(yù)案的廣范圍覆蓋性。也可以從生產(chǎn)經(jīng)營的薄弱環(huán)節(jié)來考慮,分析當(dāng)前存在的應(yīng)急能力缺陷或不足等方面來編制預(yù)案。
②應(yīng)急是一項(xiàng)科學(xué)性很強(qiáng)的工作,編制預(yù)案需要以科學(xué)的態(tài)度,在全面調(diào)查研究的基礎(chǔ)上,采用領(lǐng)導(dǎo)和專家結(jié)合的方式,開展科學(xué)分析和論證,制定出決策程序和處置方案,保證應(yīng)急手段先進(jìn),具有科學(xué)性。
③預(yù)案應(yīng)具有實(shí)用性和可操作性。當(dāng)發(fā)生重大事故災(zāi)害時(shí),組織可以按照應(yīng)急預(yù)案的規(guī)定,迅速、有序地開展應(yīng)急行動(dòng),降低事故損失。
④完整性,包括功能的完整、應(yīng)急過程的完整和適用范圍的完整。功能的完整是指預(yù)案中應(yīng)說明有關(guān)部門應(yīng)履行的應(yīng)急準(zhǔn)備、應(yīng)急響應(yīng)職能和災(zāi)后恢復(fù)職能,以及為確保執(zhí)行預(yù)案應(yīng)履行的的支持性職能。應(yīng)急過程完整指預(yù)案應(yīng)包括應(yīng)急管理工作中的預(yù)防、準(zhǔn)備、響應(yīng)、恢復(fù)4個(gè)階段。適用范圍完整是指要闡明預(yù)案的使用范圍,即針對不同災(zāi)難階段可能使用預(yù)案的適用范圍進(jìn)行清晰定義。
實(shí)踐中,可通過應(yīng)急測試和演練等手段,暴露預(yù)案編制中的盲點(diǎn),持續(xù)對應(yīng)急決策組織預(yù)案進(jìn)行完善。
通過上述5個(gè)關(guān)鍵要素的組合,可滿足信創(chuàng)客戶對數(shù)據(jù)級(jí)災(zāi)備、應(yīng)用級(jí)災(zāi)備、業(yè)務(wù)級(jí)災(zāi)備的不同訴求。通過使用災(zāi)備資源,配置自身業(yè)務(wù)系統(tǒng)所需的災(zāi)備策略,組織模擬災(zāi)備演練以及應(yīng)急開展業(yè)務(wù)恢復(fù)。基于上述要素組合建設(shè)的信創(chuàng)云災(zāi)備方案,已成功為全國多個(gè)省、市電子政務(wù)云平臺(tái)提供容災(zāi)備份服務(wù)。通過這些實(shí)踐的應(yīng)用,進(jìn)一步推動(dòng)業(yè)界對信創(chuàng)云災(zāi)備體系的理解和對其流程與技術(shù)架構(gòu)的進(jìn)一步豐富。