摘" 要" 為貫徹實(shí)施《教育部等七部門關(guān)于加強(qiáng)教育系統(tǒng)數(shù)據(jù)安全工作的通知》等文件精神,保護(hù)教師的數(shù)據(jù)資產(chǎn),完善教育云建設(shè),瑞安市教育局著眼于未來五年規(guī)劃,定制可線性擴(kuò)容的、基于CDM技術(shù)的數(shù)據(jù)管理解決方案,力求在數(shù)據(jù)方面做到高可靠的保障。
關(guān)鍵詞" 教育信息化;教育數(shù)據(jù);CDM技術(shù);CDM系統(tǒng);云桌面系統(tǒng)
中圖分類號:G527(255)" " 文獻(xiàn)標(biāo)識碼:B
文章編號:1671-489X(2022)23-0045-04
0" 引言
教育信息化是教育現(xiàn)代化的基本內(nèi)涵和顯著特征,是教育現(xiàn)代化的有力支撐,是促進(jìn)教育公平、提高教育質(zhì)量、推動教育改革的有力抓手和有效手段。隨著我國教育信息化建設(shè)的不斷推進(jìn),數(shù)據(jù)對于信息化的重要性日益凸顯,“數(shù)據(jù)是寶貴的資產(chǎn)”這一概念在教育領(lǐng)域被廣泛提及,教育數(shù)據(jù)已成為我國大數(shù)據(jù)的重要組成部分。教育數(shù)據(jù)可以為教育決策提供科學(xué)依據(jù),為教學(xué)改革創(chuàng)新、教育高質(zhì)量發(fā)展提供強(qiáng)大動力。由于教育數(shù)據(jù)涉及個人、學(xué)校、課程、資源等諸多方面,一旦發(fā)生風(fēng)險事件,不僅會影響教育領(lǐng)域,還有可能外溢到其他領(lǐng)域,造成經(jīng)濟(jì)、安全等方面的損失。
為保障數(shù)據(jù)安全,規(guī)范數(shù)據(jù)收集、存儲、傳輸?shù)葦?shù)據(jù)活動,《教育部等七部門關(guān)于加強(qiáng)教育系統(tǒng)數(shù)據(jù)安全工作的通知》將數(shù)據(jù)安全治理列為推進(jìn)教育信息化戰(zhàn)略發(fā)展的重要工作之一,保障教育數(shù)據(jù)安全成為辦好人民滿意的教育的必答題。2021年6月,《中華人民共和國數(shù)據(jù)安全法》(以下簡稱《數(shù)據(jù)安全法》)的出臺,將數(shù)據(jù)安全問題上升至國家安全層面,數(shù)據(jù)安全也不再只針對業(yè)務(wù)連續(xù)性要求高、數(shù)據(jù)安全性要求高的單位,而是只要具備數(shù)據(jù)中心的單位,都必須按要求落實(shí)政策。
2018年,為推動數(shù)字化改革和信息化建設(shè),實(shí)現(xiàn)信息資源共享、數(shù)據(jù)安全、教師移動辦公,實(shí)現(xiàn)教育資產(chǎn)利用最大化、提升教育終端運(yùn)維效率和提升教育終端安全,瑞安市教育局(以下簡稱“市教育局”)開始在全市范圍內(nèi)部署教師云桌面。截至2022年初,教師云桌面已經(jīng)部署四期,使用教師4 000人,儲存了超過50 T的非結(jié)構(gòu)化數(shù)據(jù)(不含數(shù)個關(guān)鍵業(yè)務(wù)數(shù)據(jù)庫的數(shù)據(jù)量)。教師云桌面的飛速擴(kuò)展加速了瑞安市教育系統(tǒng)后臺數(shù)據(jù)量的增長,經(jīng)研究測算,瑞安市教育系統(tǒng)未來五年內(nèi)的數(shù)據(jù)規(guī)??赡芙咏黀B級別,海量數(shù)據(jù)的安全問題引起市教育局對于數(shù)據(jù)安全保護(hù)的重視。
2022年,為保護(hù)教師的數(shù)據(jù)資產(chǎn),完善教育云建設(shè),同時為滿足基于云桌面的海量數(shù)據(jù)和基于數(shù)據(jù)庫的結(jié)構(gòu)化數(shù)據(jù)備份需求,市教育局圍繞《數(shù)據(jù)安全法》,著眼于未來五年規(guī)劃,定制可線性擴(kuò)容的、基于CDM技術(shù)的數(shù)據(jù)管理解決方案,力求在數(shù)據(jù)方面做到高可靠的保障。
1" CDM技術(shù)及原理
拷貝數(shù)據(jù)管理(CDM,Copy Data Management)技術(shù)是2012年興起的一種創(chuàng)新型數(shù)據(jù)備份再利用技術(shù),2016年正式被Gartner公司接納為存儲備份領(lǐng)域的新興技術(shù)路線。2019年,Gartner將PBBA備份專用一體機(jī)設(shè)備更名為Bamp;R備份及恢復(fù)一體化設(shè)備,國際CDM廠商(Rubrik等)正式進(jìn)入Bamp;R魔力象限,標(biāo)志著CDM技術(shù)替代陳舊的傳統(tǒng)備份技術(shù)的現(xiàn)代化進(jìn)程在國際范圍開始。CDM技術(shù)可以在備份恢復(fù)和開發(fā)測試環(huán)境的快速搭建這兩種場景中提供非常高效的解決方案。與傳統(tǒng)備份技術(shù)相似,CDM技術(shù)采取定時與生產(chǎn)系統(tǒng)I/O交互的方式,通過自動化、定時、按策略從生產(chǎn)系統(tǒng)獲取具備應(yīng)用一致性的副本數(shù)據(jù),作業(yè)類型包括增量合成備份、全量增量備份以及歸檔長期保存。
CDM技術(shù)與傳統(tǒng)備份技術(shù)最大的不同在于其核心技術(shù)是原始數(shù)據(jù)格式備份,即備份數(shù)據(jù)可以直接掛載給目標(biāo)服務(wù)器實(shí)現(xiàn)分鐘級恢復(fù),且與數(shù)據(jù)量的大小無關(guān)。因其備份數(shù)據(jù)是原始數(shù)據(jù)格式,存放在磁盤上,可以根據(jù)新的增量數(shù)據(jù)和已有的全備數(shù)據(jù)在備份系統(tǒng)內(nèi)合成新的全量備份,從而實(shí)現(xiàn)永遠(yuǎn)增量備份。此外,CDM技術(shù)還可以將原格式黃金副本以空間折疊一致性算法存儲于本地塊存儲,無須恢復(fù)拷貝,可直接掛載使用,讓快速穿梭于不同時間的副本數(shù)據(jù)空間成為可能。
作為一種新型備份技術(shù),CDM技術(shù)可以應(yīng)對包括邏輯錯、人為錯等大概率小事故在內(nèi)的各種宕機(jī)場景,其增量備份、增量合成功能可以極大地降低備份窗口及備份時系統(tǒng)資源的消耗。同時,CDM技術(shù)還可以實(shí)現(xiàn)分鐘級的恢復(fù)時間,滿足業(yè)務(wù)對恢復(fù)的時間要求。此外,CDM技術(shù)的即時掛載等技術(shù)可以對備份的副本實(shí)現(xiàn)分鐘級拉起,提供給開發(fā)測試環(huán)境、數(shù)據(jù)報表輸出等非生產(chǎn)環(huán)境使用,將備份的數(shù)據(jù)利用起來。
2" 瑞安市CDM系統(tǒng)解決方案主要特性
瑞安市CDM系統(tǒng)解決方案(以下簡稱“CDM系統(tǒng)”)采用B/S、C/S的混合架構(gòu)。其中,管理控制臺采用B/S架構(gòu),便于管理員進(jìn)行系統(tǒng)運(yùn)維管理;備份采用C/S架構(gòu),利于進(jìn)行備份數(shù)據(jù)傳輸。CDM系統(tǒng)支持主流文件系統(tǒng)、數(shù)據(jù)庫、虛擬化系統(tǒng)等原始數(shù)據(jù)格式備份,與傳統(tǒng)的數(shù)據(jù)保護(hù)技術(shù)相比,在快速備份、快速恢復(fù)、數(shù)據(jù)利用等方面有其獨(dú)到之處。
2.1" 快速備份
傳統(tǒng)的備份方案需要每周或每月執(zhí)行一次完全備份且備份時間較長,若在備份過程中出現(xiàn)故障,就會對數(shù)據(jù)的完整性和安全性造成重大影響。CDM系統(tǒng)的永久增量備份功能,除首次進(jìn)行全量備份外,每次只需要備份增量的數(shù)據(jù)即可,將整體備份效率提升90%,且每個增量時間點(diǎn)均為完整副本,即便出現(xiàn)任意增量時間點(diǎn)損壞,也不會影響其他時間點(diǎn)的恢復(fù)。
2.2" 快速恢復(fù)
當(dāng)數(shù)據(jù)庫發(fā)生災(zāi)難時,傳統(tǒng)的數(shù)據(jù)庫需要耗費(fèi)較長的時間才能恢復(fù),且設(shè)備資源占用較多,帶寬占用較高。CDM系統(tǒng)的即時掛載恢復(fù)技術(shù),可以實(shí)現(xiàn)分鐘級數(shù)據(jù)恢復(fù),即使數(shù)據(jù)量在10 TB以上,其恢復(fù)時間目標(biāo)(RTO)也會小于30分鐘。
2.3" 數(shù)據(jù)利用
傳統(tǒng)的備份方案所備份的數(shù)據(jù)僅能用來進(jìn)行災(zāi)難時的恢復(fù),但災(zāi)難的發(fā)生是一種小概率事件,所備份的數(shù)據(jù)在災(zāi)難發(fā)生前既占用存儲資源又毫無利用價值。與之相比,CDM系統(tǒng)不僅可以提供數(shù)據(jù)保護(hù),還可以通過副本數(shù)據(jù)管理功能生成多份虛擬的可讀寫的副本數(shù)據(jù),用以開發(fā)測試、查詢分析、災(zāi)備演練等,大大提升數(shù)據(jù)價值。此外,基于角色的權(quán)限管控還可以避免數(shù)據(jù)泄漏或?yàn)E用風(fēng)險。
3" 瑞安市CDM系統(tǒng)解決方案的應(yīng)用
3.1" 云桌面?zhèn)€人數(shù)據(jù)的保護(hù)
教師辦公云桌面系統(tǒng)是整個瑞安市教育系統(tǒng)內(nèi)數(shù)據(jù)量最為龐大、數(shù)據(jù)格式最復(fù)雜的應(yīng)用,儲存著非常關(guān)鍵的業(yè)務(wù)數(shù)據(jù)。CDM系統(tǒng)能夠安全快捷地對云桌面系統(tǒng)中的文件服務(wù)器的個人數(shù)據(jù)和教師個人數(shù)據(jù)進(jìn)行備份,并做到快速恢復(fù)被損壞的數(shù)據(jù)。
3.1.1 文件服務(wù)器的個人數(shù)據(jù)備份
教育云桌面系統(tǒng)中最龐大的數(shù)據(jù)量是文件服務(wù)器的個人數(shù)據(jù),平均每天增長量在30~50 GB,目前數(shù)據(jù)總量已經(jīng)超過50 T。在建設(shè)海量數(shù)據(jù)管理系統(tǒng)時,市教育局出于技術(shù)、性價比等方面的考慮,選擇SATA硬盤作為數(shù)據(jù)管理系統(tǒng)的硬盤。這種硬盤的優(yōu)勢在于數(shù)據(jù)量不斷增長時,能夠以最優(yōu)的價格進(jìn)行擴(kuò)容,但其弊端是數(shù)據(jù)備份的速度很慢。具體來說,在進(jìn)行全量備份時,雖然SATA硬盤高峰傳輸速率理論上能達(dá)到150 MB/s,但根據(jù)實(shí)際情況以基于最高速度的80%來算,其傳輸速率僅能達(dá)到120 MB/s,一天僅能備份10 T左右的數(shù)據(jù)量,全部備份完成需要五天;且在數(shù)據(jù)備份過程中,整個瑞安市教育系統(tǒng)的業(yè)務(wù)會受到一定影響,教師云桌面的I/O速率會下降,因此,全備操作只能選擇在假期進(jìn)行。在全量備份完成后,若選擇使用傳統(tǒng)的備份軟件,則需要進(jìn)行短則每周一次、長則半月或者每月一次的周期性全備。但由于每次進(jìn)行全備必然會影響到教育系統(tǒng)的正常辦公,因此,傳統(tǒng)的備份軟件(含CDP產(chǎn)品)在業(yè)務(wù)連續(xù)性有要求的應(yīng)用場景下不能進(jìn)行海量數(shù)據(jù)的備份。而CDM系統(tǒng)可以實(shí)現(xiàn)首次全備,永久增量備份,完美地解決上述問題;而且每個增量備份的數(shù)據(jù)副本在后端自動合成為完全副本,方便進(jìn)行數(shù)據(jù)恢復(fù)。
3.1.2" 教師個人數(shù)據(jù)備份
教師云桌面數(shù)量的不斷擴(kuò)容,導(dǎo)致教師個人數(shù)據(jù)的增量也在不斷增加。為減少增備工作對教育系統(tǒng)正常工作的影響,市教育局將每天的增備工作設(shè)置在次日0—6點(diǎn)進(jìn)行,但隨著系統(tǒng)數(shù)據(jù)量的不斷增加,這種采用傳統(tǒng)備份軟件進(jìn)行增備的時間也在不斷增加,如何縮短增備時間成為瑞安市亟待解決的問題。之所以會出現(xiàn)這種問題,是因?yàn)閭鹘y(tǒng)備份軟件在數(shù)據(jù)抽取的過程中需要進(jìn)行格式轉(zhuǎn)換,雖然數(shù)據(jù)的安全性得到保障,但備份時間會隨著數(shù)據(jù)的增多而增加。CDM系統(tǒng)采用有別于傳統(tǒng)備份技術(shù)的原始數(shù)據(jù)格式捕獲技術(shù),在數(shù)據(jù)抽取過程中不用進(jìn)行格式轉(zhuǎn)換,與傳統(tǒng)備份軟件相比大大縮短備份所需的時間。此外,從數(shù)據(jù)安全的角度來看,CDM系統(tǒng)的備份數(shù)據(jù)是虛擬數(shù)據(jù),對勒索病毒免疫、不可見;同時,備份數(shù)據(jù)虛擬化可以提高備份存儲的安全性、機(jī)密性與完整性,避免副本數(shù)據(jù)被非法拷貝或篡改。
3.1.3" 數(shù)據(jù)恢復(fù)
市教育局云桌面的應(yīng)用,讓教師能夠隨時隨地地調(diào)用課(文)件,但這也讓教師養(yǎng)成臨時性打開課(文)件的習(xí)慣,而不會像使用個人電腦時提前查看課(文)件是否存在或有效。因此,當(dāng)課(文)件被誤刪除或者因病毒原因無法使用時,就需要系統(tǒng)快速恢復(fù)這個可能是幾個月前或更早的數(shù)據(jù),就導(dǎo)致需要時間跨度很長的備份周期以滿足需求。CDM系統(tǒng)采用即時掛載恢復(fù)技術(shù),不用進(jìn)行數(shù)據(jù)傳輸,當(dāng)數(shù)據(jù)落地在系統(tǒng)中,數(shù)據(jù)量大小不會影響恢復(fù)效率。當(dāng)教師需要恢復(fù)的課件數(shù)量比較多或文件數(shù)據(jù)量較大時,通過即時掛載恢復(fù)技術(shù)能夠?qū)崿F(xiàn)秒級讀取丟失數(shù)據(jù),解決問題之后再通過數(shù)據(jù)恢復(fù)方式,將丟失數(shù)據(jù)拷貝回教師的云桌面?zhèn)€人數(shù)據(jù)盤中。此外,由于CDM系統(tǒng)基于首次全備技術(shù),因此,在首次部署CDM產(chǎn)品后產(chǎn)生的所有數(shù)據(jù)變化量都可以進(jìn)行回滾,能夠找到更久以前丟失或損毀的數(shù)據(jù)。
3.2" 云桌面虛擬機(jī)的集中數(shù)據(jù)保護(hù)
經(jīng)過幾年的發(fā)展,瑞安市教育云桌面系統(tǒng)已經(jīng)擁有4 000點(diǎn)云桌面,其龐大的虛擬機(jī)數(shù)量,直接導(dǎo)致原有備份軟件出現(xiàn)備份時間窗口不足、大量備份同時進(jìn)行時業(yè)務(wù)卡頓等問題,已經(jīng)無法滿足現(xiàn)有需求。究其原因,是因?yàn)樵袀浞菹到y(tǒng)采用的是“周期性全備+增量備份”模式,在大量虛擬機(jī)進(jìn)行全備時會占用大量業(yè)務(wù)主機(jī)I/O資源,就會出現(xiàn)業(yè)務(wù)卡頓等現(xiàn)象;且大量的數(shù)據(jù)通過網(wǎng)絡(luò)傳輸也會造成網(wǎng)絡(luò)堵塞,而這些需要備份的數(shù)據(jù)中有很多是重復(fù)的數(shù)據(jù),如云桌面系統(tǒng)內(nèi)部就有多個虛擬機(jī)模板的操作系統(tǒng)數(shù)據(jù)是一致的。
3.2.1" 減少備份數(shù)據(jù)量
通過副本管理技術(shù),CDM系統(tǒng)將云桌面數(shù)據(jù)中心內(nèi)部多份相同的備份數(shù)據(jù)縮減成一份,減少存儲容量的開銷,提升存儲利用率,降低總擁有成本(TCO)。此外,通過虛擬化系統(tǒng)的變化塊追蹤(BCT)技術(shù),CDM系統(tǒng)可以實(shí)現(xiàn)虛擬機(jī)的永久增量備份,不再需要進(jìn)行周期性全備,能夠大大減少備份的數(shù)據(jù)量及數(shù)據(jù)在網(wǎng)絡(luò)上的傳輸量。這種“初始全量+以后永久增量”的數(shù)據(jù)備份方式,極大地節(jié)省了備份時的帶寬占用,避免因數(shù)據(jù)備份造成對生產(chǎn)系統(tǒng)的影響。
3.2.2" 數(shù)據(jù)備份和恢復(fù)更加便捷
采用CDM系統(tǒng)后,市教育局所有的云桌面虛擬機(jī)都可以在非工作時間完成備份。這是由于CDM系統(tǒng)在進(jìn)行云桌面數(shù)據(jù)備份時能夠直接將數(shù)據(jù)流流至后端存儲的網(wǎng)絡(luò)邏輯單元號(LUN),而不是寫入文件,因此,備份速度非???。此外,基于CDM系統(tǒng)虛擬副本的特性,在進(jìn)行數(shù)據(jù)恢復(fù)時無須進(jìn)行虛擬機(jī)恢復(fù),可以直接通過虛擬機(jī)克隆技術(shù)創(chuàng)建一份虛擬的可讀寫的副本數(shù)據(jù),直接掛載給業(yè)務(wù)系統(tǒng)使用,實(shí)現(xiàn)秒級別數(shù)據(jù)恢復(fù)。
3.2.3" 其他關(guān)鍵數(shù)據(jù)庫的集中數(shù)據(jù)保護(hù)
市教育局?jǐn)?shù)據(jù)中心運(yùn)行著瑞安市教育系統(tǒng)最核心的業(yè)務(wù),每個業(yè)務(wù)都由相應(yīng)的Oracle、SQL、MySQL、達(dá)夢等數(shù)據(jù)庫和云桌面系統(tǒng)的多個后臺架構(gòu)數(shù)據(jù)庫來支撐運(yùn)行,這些數(shù)據(jù)庫中均儲存著大量重要的數(shù)據(jù)。在應(yīng)用CDM系統(tǒng)解決方案之前,市教育局沒有統(tǒng)一的備份系統(tǒng)對數(shù)據(jù)庫進(jìn)行安全備份,通常是由廠商在實(shí)施過程中通過簡單的備份腳本進(jìn)行本地備份,但是這種方式生成的備份數(shù)據(jù)很難驗(yàn)證是否可用,原因如下:
1)驗(yàn)證一次備份的有效性需要專業(yè)的數(shù)據(jù)管理員(DBA)和恢復(fù)環(huán)境(與生產(chǎn)系統(tǒng)一樣的數(shù)據(jù)庫環(huán)境并安裝操作系統(tǒng)、數(shù)據(jù)庫等);
2)將各類數(shù)據(jù)庫導(dǎo)入恢復(fù)環(huán)境進(jìn)行驗(yàn)證的過程會涉及大量專業(yè)命令的輸入,若其中一個環(huán)節(jié)出現(xiàn)問題,就會導(dǎo)致整個數(shù)據(jù)恢復(fù)過程失?。?/p>
3)驗(yàn)證恢復(fù)的各類數(shù)據(jù)庫是否能夠成功使用,還需要聯(lián)系與之對應(yīng)的維護(hù)人員。
此外,若將原有的全備數(shù)據(jù)導(dǎo)入,再根據(jù)時間附加不等的差量或增量數(shù)據(jù),整個過程往往需要一天或更長時間,很難滿足快速修復(fù)的時效性要求。
CDM系統(tǒng)采用的全圖形化操作讓系統(tǒng)管理員在不具備大量專業(yè)知識和技術(shù)的情況下能夠順利完成多套數(shù)據(jù)庫系統(tǒng)的集中備份和管理工作。此外,CDM系統(tǒng)備份的數(shù)據(jù)是原始數(shù)據(jù)格式,在進(jìn)行數(shù)據(jù)庫恢復(fù)時,只需要通過圖形直接掛載至恢復(fù)主機(jī),就能自動完成所有環(huán)境的構(gòu)建工作,直至數(shù)據(jù)庫可用,用時短且易用性非常好。CDM系統(tǒng)建設(shè)使用后,可以完美解決之前數(shù)據(jù)庫備份恢復(fù)中遇到的問題,修復(fù)多次數(shù)據(jù)邏輯錯誤。
4" 結(jié)束語
自2022年CDM系統(tǒng)上線以來,瑞安市教育系統(tǒng)的海量數(shù)據(jù)和關(guān)鍵業(yè)務(wù)的結(jié)構(gòu)化數(shù)據(jù)得到有效保護(hù),幫助4 000名教師實(shí)現(xiàn)個人數(shù)據(jù)的安全保護(hù)。同時,CDM系統(tǒng)針對市教育局關(guān)鍵業(yè)務(wù)數(shù)據(jù)庫做了容災(zāi)備份,提升了平臺數(shù)據(jù)的可靠性,降低了勒索病毒、數(shù)據(jù)誤刪除、硬件損壞導(dǎo)致數(shù)據(jù)丟失等潛在因素的威脅。下一步,瑞安市將繼續(xù)對新增的業(yè)務(wù)數(shù)據(jù)做好數(shù)據(jù)保護(hù)工作,打造統(tǒng)一的教育第二數(shù)據(jù)平臺,形成生產(chǎn)平臺和第二數(shù)據(jù)平臺雙平臺運(yùn)行,其中生產(chǎn)平臺只供正常業(yè)務(wù)操作使用,而第二數(shù)據(jù)平臺基于CDM系統(tǒng)的快速備份、永久增量及虛擬副本功能,將服務(wù)于數(shù)據(jù)備份恢復(fù)、容災(zāi)、數(shù)據(jù)合規(guī)檢查、數(shù)據(jù)查詢等創(chuàng)新型業(yè)務(wù)。
參考文獻(xiàn)
[1] 林岳鑫.基于CDM技術(shù)的IT系統(tǒng)數(shù)據(jù)保護(hù)實(shí)踐[J].移動通信,2017,41(4):39-44.
作者:蘇立昆,瑞安市教育局,助理研究員(325299)。