摘要:2025年2月1日,檔案領(lǐng)域?qū)iT規(guī)范備份工作的第一部行業(yè)標(biāo)準(zhǔn)《檔案數(shù)字資源備份實(shí)施規(guī)范》(DA/T 99—2024)(以下簡(jiǎn)稱《規(guī)范》)正式實(shí)施。本文從編制起草的專業(yè)視角出發(fā),對(duì)《規(guī)范》出臺(tái)的意義進(jìn)行解讀,結(jié)合備份工作原則,總結(jié)了《規(guī)范》在規(guī)劃、管理、技術(shù)、安全等方面的備份工作要求;并在此基礎(chǔ)上挖掘《規(guī)范》的理論深度,解析其概念框架和工作形式,強(qiáng)調(diào)了《規(guī)范》的業(yè)務(wù)屬性和立足托管、面向管護(hù)、走向容災(zāi)的工作定位;最后提出了包含備份形式與流程、備份對(duì)象與形式兩組關(guān)系,以及備份載體和備份系統(tǒng)功能兩個(gè)側(cè)重點(diǎn)的備份策略,以促進(jìn)《規(guī)范》的宣傳貫徹與應(yīng)用。
關(guān)鍵詞:《檔案數(shù)字資源備份實(shí)施規(guī)范》 檔案數(shù)字資源備份 安全
Abstract: On February 1, 2025, the first indus? try standard for specialized backup work in the ar? chival field, the Implementation Specification for Digital Archival Resources Backup(DA/T 99-2024, hereinafter referred to as the \"Standard\"), was officially implemented. From the perspective of the drafting and compilation process, this arti? cle interprets the significance of its issuance. It summarizes the backup requirements in areas such as planning, management, technology, and security, in line with the principles of backup work. Based on this, the article explores its theo? retical depth, analyzing its conceptual framework and operational form, while emphasizing its busi? ness attributes and its work orientation, focusing on the hosting level, maintenance management level, and moving towards disaster recovery lev? el. Finally, the article proposes a backup strategy that includes two sets of relationships which are backup methods and processes, and backup tar? gets and formats, along with two key aspects which are backup carriers and backup system functions, to promote the dissemination and appli? cation of the standard.
Keywords:Implementation Specification for Digital Archival Resources Backup; Digital archi? val resources backup; Safety
檔案資源作為文明傳承的基因圖譜,其價(jià)值維度遠(yuǎn)超普通數(shù)據(jù)范疇。當(dāng)前人類社會(huì)已進(jìn)入ZB級(jí)數(shù)據(jù)存儲(chǔ)時(shí)代,國(guó)際數(shù)據(jù)公司(IDC)預(yù)測(cè)全球數(shù)據(jù)量在2028年將達(dá)到近400ZB的規(guī)模。[1]國(guó)家檔案局《2023年度全國(guó)檔案主管部門和檔案館基本情況摘要》顯示,我國(guó)館藏電子檔案總量已達(dá)2289.6TB。[2]面對(duì)海量的檔案數(shù)字資源,備份已從技術(shù)保障工作躍升為檔案資源體系和安全體系的戰(zhàn)略內(nèi)容。面對(duì)數(shù)字洪流的沖擊,構(gòu)建科學(xué)的備份戰(zhàn)略體系不僅關(guān)乎技術(shù)層面的數(shù)據(jù)安全,更體現(xiàn)出對(duì)歷史負(fù)責(zé)、對(duì)檔案事業(yè)負(fù)責(zé)的使命擔(dān)當(dāng)。在此背景下,《檔案數(shù)字資源備份實(shí)施規(guī)范》(DA/T 99—2024)(以下簡(jiǎn)稱《規(guī)范》)作為檔案領(lǐng)域?qū)iT規(guī)范備份工作的第一部行業(yè)標(biāo)準(zhǔn),其出臺(tái)正逢其時(shí)?!兑?guī)范》由中國(guó)人民大學(xué)檔案學(xué)院、國(guó)家檔案局檔案科學(xué)技術(shù)研究所、光典信息發(fā)展有限公司共同參與起草,立足于檔案數(shù)字資源備份研究和業(yè)務(wù)實(shí)踐,提出了檔案數(shù)字資源備份工作管理策略,并從細(xì)節(jié)上規(guī)定了備份流程、備份對(duì)象、載體選擇、備份數(shù)量、備份周期等業(yè)務(wù)要求,提出檔案數(shù)字資源備份工作系列備份管理策略?!兑?guī)范》的制定和實(shí)施,將有效規(guī)范我國(guó)檔案數(shù)字資源備份工作,使檔案數(shù)字資源備份有章可循,提升檔案數(shù)字資源安全管理水平。
《規(guī)范》主體章節(jié)涵蓋范圍、引用文件、術(shù)語(yǔ)定義及備份實(shí)施框架。其中第4章確立了檔案數(shù)字資源備份工作的目標(biāo)和安全性、系統(tǒng)性等七項(xiàng)備份原則,第5章規(guī)范了組織機(jī)構(gòu)、策略制定及全流程管理要求,第6~8章分別細(xì)化在線、離線及異地備份的業(yè)務(wù)流程,并提供了備份工作標(biāo)準(zhǔn)化表單模板,支撐全流程可追溯管理。
(一)《規(guī)范》是備份工作宏觀指導(dǎo)政策的操作性轉(zhuǎn)化
我國(guó)高度重視檔案?jìng)浞莨ぷ?,在法律法?guī)和各類政策規(guī)劃中都有相應(yīng)規(guī)定,不僅實(shí)現(xiàn)了對(duì)檔案?jìng)浞莨ぷ鞯暮暧^指導(dǎo),更為其規(guī)范化發(fā)展提供了堅(jiān)實(shí)的制度保障?!吨腥A人民共和國(guó)檔案法》從維護(hù)檔案實(shí)體安全和信息安全兩個(gè)維度貫徹落實(shí)總體國(guó)家安全觀,[3]規(guī)定“檔案館可以對(duì)重要電子檔案進(jìn)行異地備份保管”,從法律層面明確了異地備份的重要性,為檔案安全管理提供了強(qiáng)制性規(guī)范和權(quán)威性依據(jù)。《中華人民共和國(guó)檔案法實(shí)施條例》第四十一條要求“檔案館對(duì)重要電子檔案進(jìn)行異地備份保管”,對(duì)備份載體選擇、備份數(shù)據(jù)檢測(cè)、異地備份選址及災(zāi)難備份系統(tǒng)建設(shè)等進(jìn)行了細(xì)化,增強(qiáng)了檔案館應(yīng)對(duì)突發(fā)事件的能力?!丁笆奈濉比珖?guó)檔案事業(yè)發(fā)展規(guī)劃》將國(guó)家電子檔案戰(zhàn)略備份中心建設(shè)項(xiàng)目列為檔案信息化強(qiáng)基工程之一,提出“扎實(shí)做好檔案數(shù)字資源備份工作,完善備份機(jī)制”的目標(biāo),要求實(shí)現(xiàn)“館(室)藏全部檔案數(shù)字資源完整備份,重要電子檔案異地異質(zhì)備份”,以切實(shí)保障檔案數(shù)字資源安全?!峨娮訖n案管理辦法》(以下簡(jiǎn)稱《辦法》)要求對(duì)電子檔案及其管理信息系統(tǒng)等進(jìn)行完整備份?!兑?guī)范》的出臺(tái)是上述宏觀性政策指導(dǎo)的操作性轉(zhuǎn)化,使其更具可執(zhí)行性,為實(shí)踐部門提供統(tǒng)一的規(guī)范和技術(shù)指引。
(二)《規(guī)范》是夯實(shí)檔案數(shù)字資源管理的關(guān)鍵抓手
檔案數(shù)字資源備份以“有備無(wú)患”為宗旨,通過(guò)構(gòu)建多維冗余架構(gòu)實(shí)現(xiàn)檔案安全的持續(xù)性保障與風(fēng)險(xiǎn)化解,有效夯實(shí)資源安全底座,成為資源災(zāi)難發(fā)生時(shí)的系統(tǒng)化應(yīng)急方式。檔案數(shù)字資源全生命周期的各個(gè)環(huán)節(jié)均面臨各種難以預(yù)料的風(fēng)險(xiǎn),IBM發(fā)布的2024年《數(shù)據(jù)泄露成本報(bào)告》(Cost of a Data Breach Report)中指出,2024年全球數(shù)據(jù)泄露的平均成本高達(dá)488萬(wàn)美元,比2023年增加了10%,網(wǎng)絡(luò)攻擊的復(fù)雜性和頻率也在逐年上升。[4]備份工作的目的是當(dāng)檔案數(shù)字資源遭受各類安全風(fēng)險(xiǎn)引發(fā)資源損壞時(shí),能夠根據(jù)不同需求對(duì)數(shù)據(jù)進(jìn)行替換、更新、恢復(fù)與保全,甚至對(duì)系統(tǒng)本身進(jìn)行恢復(fù),保障數(shù)據(jù)安全與業(yè)務(wù)連續(xù)。備份是長(zhǎng)期保存工作的核心內(nèi)容,可結(jié)合鑒定、認(rèn)證,能有效支撐檔案保全,例如《規(guī)范》指出在備份數(shù)據(jù)傳輸過(guò)程中“通過(guò)可靠技術(shù)手段進(jìn)行數(shù)據(jù)完整性檢測(cè),并核對(duì)備份對(duì)象與備份數(shù)據(jù)的一致性”,要求對(duì)備份數(shù)據(jù)及其載體進(jìn)行周期性檢測(cè),“保證備份數(shù)據(jù)可獲取、可呈現(xiàn)、可恢復(fù)”。同時(shí),有效的備份工作還能為單套制的推進(jìn)奠定安全基礎(chǔ),在一定程度上能夠起到減輕安全顧慮,增強(qiáng)單套制管理信心的效果。
(三)《規(guī)范》為具體備份業(yè)務(wù)提供了系統(tǒng)化的操作指引
備份工作涵蓋宏觀的統(tǒng)籌規(guī)劃、中觀的理念原則、微觀的操作實(shí)施等多層因素,涉及數(shù)字存儲(chǔ)、檔案保護(hù)、保密管理、信息系統(tǒng)管理、災(zāi)難恢復(fù)、長(zhǎng)期保存等多個(gè)領(lǐng)域,不同的專業(yè)領(lǐng)域都出臺(tái)了相關(guān)的標(biāo)準(zhǔn)規(guī)范,呈現(xiàn)復(fù)雜性和多樣性的特征(見(jiàn)表1)。總體來(lái)說(shuō)包括通用和專用兩類標(biāo)準(zhǔn),通用標(biāo)準(zhǔn)提出了基本的備份框架及備份實(shí)施的基本要求,例如《備份技術(shù)應(yīng)用要求》(GB/T 36092—2018)規(guī)定了備份技術(shù)和數(shù)據(jù)備份應(yīng)用要求;專用標(biāo)準(zhǔn)則針對(duì)特定行業(yè)或應(yīng)用領(lǐng)域制定了更加細(xì)化和專業(yè)的備份要求。在本《規(guī)范》發(fā)布之前缺少以檔案數(shù)字資源為備份對(duì)象的、全面反映檔案管理要求的針對(duì)性標(biāo)準(zhǔn)?!峨娮游募w檔與電子檔案管理規(guī)范》(GB/T 18894—2016)、《電子檔案管理系統(tǒng)通用功能要求》(GB/T 39784—2021)、《檔案信息系統(tǒng)運(yùn)行維護(hù)規(guī)范》(DA/T 56—2014)等標(biāo)準(zhǔn)中,零散規(guī)定了個(gè)別備份要求,但內(nèi)容稀疏不成體系。由于專門標(biāo)準(zhǔn)的缺位,使得地方層面的電子文件備份中心建設(shè)缺乏必要的可操作性指導(dǎo),[5]實(shí)踐中各地備份工作進(jìn)展不一,在備份范圍、存儲(chǔ)載體、存儲(chǔ)格式等方面缺少可遵循的固定準(zhǔn)則。[6]
在此背景下,《規(guī)范》結(jié)合電子文件與電子檔案管理、數(shù)據(jù)備份與恢復(fù)、檔案管理系統(tǒng)建設(shè)等內(nèi)容,提出了檔案數(shù)字資源備份實(shí)施相關(guān)要求,標(biāo)志著我國(guó)檔案數(shù)字資源備份工作建設(shè)逐漸邁入系統(tǒng)化、標(biāo)準(zhǔn)化、精細(xì)化新階段?!兑?guī)范》通過(guò)分層架構(gòu)設(shè)計(jì),構(gòu)建了覆蓋備份策略、執(zhí)行、驗(yàn)證的閉環(huán)管理體系,在第3章界定核心術(shù)語(yǔ)、第4~5章闡明目標(biāo)原則及管理框架的基礎(chǔ)上,第6~8章詳細(xì)規(guī)定了“在線備份”“離線備份”“異地備份”的業(yè)務(wù)實(shí)施流程,涉及數(shù)據(jù)組織、傳輸加密、載體管理(含制作檢測(cè)、存儲(chǔ)維護(hù)、定期校驗(yàn))、容災(zāi)恢復(fù)等全周期管控節(jié)點(diǎn)。其中在線備份強(qiáng)調(diào)實(shí)時(shí)環(huán)境監(jiān)測(cè),離線備份側(cè)重載體物理防護(hù),異地備份著重于地理隔離機(jī)制。附錄A還提供了檔案數(shù)字資源備份工作常用的資料性參考表單??傊?,《規(guī)范》為檔案數(shù)字資源備份工作提供了系統(tǒng)化的操作指導(dǎo),納入了嚴(yán)格的流程管控和質(zhì)量監(jiān)督,有助于實(shí)現(xiàn)科學(xué)、有序的資源保護(hù)。
《規(guī)范》在編制過(guò)程中對(duì)多家省級(jí)檔案館、檔案?jìng)浞菁夹g(shù)服務(wù)公司、檔案?jìng)浞葺d體生產(chǎn)廠家等進(jìn)行了專項(xiàng)調(diào)研,總結(jié)提出了安全性、系統(tǒng)性、及時(shí)性、通用性、經(jīng)濟(jì)性、一致性及可恢復(fù)性的檔案數(shù)字資源備份原則,形成了在規(guī)劃、管理、技術(shù)、安全等方面的工作要求。
(一)規(guī)劃:形成涵蓋多要素的備份規(guī)劃
備份不僅是技術(shù)任務(wù),更是戰(zhàn)略性工程,具有主體多元性和內(nèi)容廣泛性的特點(diǎn),[7]因此需要跨部門的密切協(xié)作和事前規(guī)劃。為此,《規(guī)范》4.2.2條款提出了備份工作的系統(tǒng)性原則,強(qiáng)調(diào)統(tǒng)籌規(guī)劃,提出“通過(guò)建設(shè)本地和異地備份場(chǎng)所,綜合采用多種備份手段,制定備份工作制度,加強(qiáng)備份工作各環(huán)節(jié)的管理,構(gòu)建全方位、多層次的備份體系?!痹谙到y(tǒng)性原則的指導(dǎo)下,《規(guī)范》闡明了組織人員、制度建設(shè)、環(huán)境條件等核心要素,為備份工作的有序、高效推進(jìn)以及整體管理水平與風(fēng)險(xiǎn)防控能力的提升提供了有力支撐。備份策略部分的條款要求“應(yīng)對(duì)檔案數(shù)字資源備份工作進(jìn)行總體規(guī)劃,制定備份策略,包括備份對(duì)象、備份方式、備份周期,形成備份評(píng)估方案、備份實(shí)施方案、備份數(shù)據(jù)檢測(cè)方案、備份數(shù)據(jù)恢復(fù)方案等。”其中“評(píng)估、實(shí)施、檢測(cè)、恢復(fù)”四位一體的方案體系,實(shí)質(zhì)是構(gòu)建PDCA質(zhì)量環(huán)的技術(shù)實(shí)現(xiàn)路徑。在備份方式上,《規(guī)范》也通過(guò)采用“本地-異地”“在線-離線”在內(nèi)的復(fù)合備份拓?fù)洌ㄟ^(guò)空間冗余,形成符合容錯(cuò)理論的分布式備份資源架構(gòu)。
(二)管理:構(gòu)建完備的備份管理體系
備份工作管理體系涵蓋了工作機(jī)制、機(jī)構(gòu)人員配置、制度建設(shè)等?!兑?guī)范》5.1.1條款指出應(yīng)建立職責(zé)明確、保障有力的工作機(jī)制,對(duì)檔案數(shù)字資源備份工作進(jìn)行統(tǒng)一規(guī)劃、統(tǒng)籌實(shí)施、規(guī)范管理、安全保障、技術(shù)支撐、監(jiān)督檢查等。對(duì)于有條件的單位還建議設(shè)立檔案數(shù)字資源備份工作組織,確保備份工作順利開(kāi)展。5.1.2條款進(jìn)一步細(xì)化了相應(yīng)人員及其職責(zé),包括管理人員、技術(shù)人員和操作人員等不同角色。在制度建設(shè)上,《規(guī)范》倡導(dǎo)以整體管理制度(5.3.1)為頂層框架,統(tǒng)一指引備份工作的基本方向和目標(biāo),具體包括形成責(zé)任制度(5.3.2)、工作制度(5.3.3)和安全制度(5.3.4)。責(zé)任制度通過(guò)細(xì)化責(zé)任體系,明確各相關(guān)部門與崗位的具體分工與操作流程,確保備份任務(wù)有序推進(jìn);工作制度通過(guò)制定針對(duì)備份時(shí)機(jī)、場(chǎng)所、載體和對(duì)象篩選與檢測(cè)維護(hù)等環(huán)節(jié)的操作性制度,實(shí)現(xiàn)對(duì)備份過(guò)程的全流程把控;安全制度通過(guò)對(duì)備份全流程中安全風(fēng)險(xiǎn)的防范,保障備份數(shù)據(jù)在形成、傳輸和保存中的安全性。通過(guò)分層式、全流程的制度設(shè)計(jì),《規(guī)范》有效降低了備份工作各個(gè)環(huán)節(jié)的潛在風(fēng)險(xiǎn),為備份工作提供了清晰的執(zhí)行路徑與管理依據(jù)。
(三)技術(shù):兼顧專業(yè)與穩(wěn)定的技術(shù)路線
《規(guī)范》倡導(dǎo)兼顧專業(yè)性與穩(wěn)定性的技術(shù)路線,保障檔案數(shù)字資源備份工作行穩(wěn)致遠(yuǎn)。備份工作具有較高的專業(yè)性,無(wú)論是備份數(shù)據(jù)組織、備份載體選定和維護(hù),還是備份數(shù)據(jù)的檢測(cè)、遷移與更新都包含豐富的技術(shù)細(xì)節(jié),需要專業(yè)知識(shí)支撐。備份技術(shù)本身并非《規(guī)范》關(guān)注的核心內(nèi)容,但技術(shù)選型和管理的思路及要求在多個(gè)原則內(nèi)容中均有體現(xiàn)。《規(guī)范》提出的通用性原則要求對(duì)開(kāi)展備份工作選用的技術(shù)、設(shè)備、載體等進(jìn)行評(píng)估,確保其具有應(yīng)用普遍性、使用持續(xù)性和技術(shù)非壟斷性,這就要求檔案數(shù)字資源備份的技術(shù)環(huán)境要兼具專業(yè)性與穩(wěn)定性,這在當(dāng)前備份介質(zhì)和備份設(shè)備不斷推陳出新的情形下尤為重要。在備份數(shù)據(jù)管理上,《規(guī)范》提出的一致性原則要求保證備份對(duì)象與備份數(shù)據(jù)以及多套備份數(shù)據(jù)在檔號(hào)、信息內(nèi)容、數(shù)據(jù)格式、數(shù)據(jù)組織結(jié)構(gòu)等要素上的一致性,使分布在本地和異地、多種介質(zhì)之間的多套備份數(shù)據(jù)保持一致,以有效應(yīng)對(duì)分散性帶來(lái)的挑戰(zhàn),這也要求在檔案數(shù)字備份技術(shù)方面保持相當(dāng)?shù)膶I(yè)性與穩(wěn)定性。
(四)安全:搭建備份工作安全框架
備份對(duì)象、備份場(chǎng)所、備份工作過(guò)程各環(huán)節(jié)都存在安全風(fēng)險(xiǎn),需要較為完備的安全管理框架來(lái)應(yīng)對(duì)。備份作為冗余技術(shù),其存在是為了在原始數(shù)據(jù)丟失或損壞時(shí)進(jìn)行恢復(fù),但如果沒(méi)有得到足夠的保護(hù),備份數(shù)據(jù)本身就可能成為攻擊對(duì)象,因而客觀上存在悖論性風(fēng)險(xiǎn),需要構(gòu)建系統(tǒng)性安全框架?!兑?guī)范》全文中“安全”一詞總計(jì)出現(xiàn)27次,所提出的安全性原則(4.2.1)要求備份安全框架需覆蓋數(shù)據(jù)本體、存儲(chǔ)載體、傳輸通道、管理流程四部分內(nèi)容,形成了“風(fēng)險(xiǎn)識(shí)別-控制-監(jiān)測(cè)”的閉環(huán)防護(hù)體系。在制度層面,《規(guī)范》涉及的安全管理內(nèi)容涵蓋了計(jì)劃制定、環(huán)境維護(hù)、人員培訓(xùn)、風(fēng)險(xiǎn)監(jiān)控及應(yīng)急與災(zāi)難恢復(fù)方案等關(guān)鍵內(nèi)容,將安全防護(hù)和應(yīng)急響應(yīng)深度融入備份工作流程。在環(huán)境層面,《規(guī)范》構(gòu)建了包含場(chǎng)所、系統(tǒng)和載體等軟硬件條件的備份環(huán)境,規(guī)定備份場(chǎng)所的選擇應(yīng)考慮地理、交通、氣候等多方面因素,確保異地備份場(chǎng)所不受同一災(zāi)害影響,從而避免災(zāi)難對(duì)備份數(shù)據(jù)的集中性損害。
《規(guī)范》中的很多條款并非簡(jiǎn)單的操作規(guī)定,本質(zhì)上是相關(guān)理論思考與當(dāng)前實(shí)際結(jié)合形成的共識(shí)?!兑?guī)范》在對(duì)備份工作現(xiàn)狀進(jìn)行歸納的基礎(chǔ)上,也將備份對(duì)象內(nèi)涵、備份形式研究、備份工作定位等認(rèn)識(shí)體現(xiàn)在概念、原則和管理細(xì)節(jié)的表達(dá)中。
(一)備份概念內(nèi)涵研究
《規(guī)范》術(shù)語(yǔ)部分從“靜”與“動(dòng)”兩個(gè)角度建立起檔案數(shù)字資源備份的概念框架,基本涵蓋了檔案數(shù)字資源備份工作相關(guān)的關(guān)鍵概念?!办o態(tài)”術(shù)語(yǔ)主要用于《規(guī)范》涉及的各類備份對(duì)象,“動(dòng)態(tài)”術(shù)語(yǔ)主要對(duì)在線備份、離線備份等處于變化中的備份形式進(jìn)行界定。
1.檔案數(shù)字資源。檔案數(shù)字資源概念存在狹義和廣義兩種理解,狹義的檔案數(shù)字資源包含電子檔案、傳統(tǒng)載體檔案數(shù)字化成果與元數(shù)據(jù)和目錄數(shù)據(jù),可大致理解為原生電子檔案、數(shù)字化成果與檔案標(biāo)注數(shù)據(jù)三部分資源類型。廣義概念在狹義概念基礎(chǔ)上進(jìn)行了擴(kuò)展,如5.4.3條款提出的“檔案管理信息系統(tǒng)及其配置數(shù)據(jù)、日志數(shù)據(jù)”等,和以檔案編研成果(如專題數(shù)據(jù)庫(kù))為代表的衍生數(shù)據(jù),都屬于在備份范圍中可以自由裁量的資源對(duì)象,體現(xiàn)了“檔案數(shù)字資源”概念的彈性。
2.備份對(duì)象與備份數(shù)據(jù)。《數(shù)據(jù)備份與恢復(fù)產(chǎn)品技術(shù)要求與測(cè)試評(píng)價(jià)方法》(GB/T 29765-2021)規(guī)定,備份對(duì)象是需要進(jìn)行備份的檔案數(shù)字資源集合;備份數(shù)據(jù)是為防止數(shù)據(jù)丟失,存儲(chǔ)在其他非易失性存儲(chǔ)載體或獨(dú)立系統(tǒng)上某一時(shí)間點(diǎn)的備份對(duì)象??梢钥吹絺浞輰?duì)象與備份數(shù)據(jù)之間是“一對(duì)多”的關(guān)系,備份對(duì)象是備份數(shù)據(jù)所依據(jù)的“主體”,而備份數(shù)據(jù)則是備份對(duì)象的一個(gè)“實(shí)例”。
3.完整數(shù)據(jù)與重要數(shù)據(jù)。在備份數(shù)據(jù)范圍方面,《規(guī)范》與《辦法》中均存在關(guān)于完整性的表述,《規(guī)范》的5.5.2款指出“應(yīng)形成至少2套完整的備份數(shù)據(jù),其中至少1套是離線備份數(shù)據(jù)?!薄掇k法》第26條提出“對(duì)電子檔案、電子檔案管理信息系統(tǒng)等進(jìn)行完整備份”。其中,《規(guī)范》的“完整數(shù)據(jù)”對(duì)應(yīng)狹義的檔案數(shù)字資源,《辦法》中的完整備份涵蓋數(shù)據(jù)備份與系統(tǒng)備份,進(jìn)而推斷其所謂“完整數(shù)據(jù)”對(duì)應(yīng)廣義的檔案數(shù)字資源(如系統(tǒng)、系統(tǒng)配置、系統(tǒng)日志等)。在備份數(shù)據(jù)分級(jí)分類規(guī)范缺失的情況下,重要數(shù)據(jù)的界定同樣具有較大彈性,《辦法》27條和《規(guī)范》5.5.3款均提出對(duì)重要電子檔案或檔案數(shù)字資源進(jìn)行異地備份的要求。
(二)備份工作形式研究
備份形式存在多種劃分方法,按數(shù)據(jù)可用性和訪問(wèn)速度劃分,可分為在線備份、近線備份、離線備份;按備份數(shù)據(jù)量劃分,可分為完全備份、差分備份、增量備份;按存儲(chǔ)位置劃分,可分為本地備份和異地備份;按存儲(chǔ)載體可劃分為磁、光、電、膠四種備份形式。《規(guī)范》選擇了檔案行業(yè)使用最為頻繁的在線、離線、異地備份作為業(yè)務(wù)表達(dá),未對(duì)近線備份進(jìn)行單獨(dú)描述,原因在于近線備份在備份流程、系統(tǒng)連接性、設(shè)備環(huán)境等方面與在線備份差異不大,且邊界較為模糊,因此將其統(tǒng)一到“在線備份”形式中進(jìn)行要求。此外,《規(guī)范》還明確了對(duì)異質(zhì)備份方式的理解,目前業(yè)界對(duì)于異質(zhì)備份主要有兩種認(rèn)識(shí),廣義界定是指多種介質(zhì)之間的轉(zhuǎn)換,狹義界定特指介質(zhì)從數(shù)字態(tài)向模擬態(tài)轉(zhuǎn)換,[8]《規(guī)范》中異質(zhì)備份采用了廣義定義方式,即“將備份數(shù)據(jù)轉(zhuǎn)換保存到其他形式載體的備份方式或過(guò)程”。
(三)備份工作定位研究
在閱讀與理解《規(guī)范》時(shí),需要確立工作定位思維。這是因?yàn)閭浞莨ぷ鳑Q策是一項(xiàng)多變量決策行為,涉及數(shù)據(jù)組織、技術(shù)選型、業(yè)務(wù)管理、長(zhǎng)期保存等多維度內(nèi)容,具有明顯跨領(lǐng)域特征。定位思維可以幫助實(shí)踐部門更全面地理解與應(yīng)用《規(guī)范》。
1.《規(guī)范》具有鮮明的業(yè)務(wù)指導(dǎo)屬性。檔案數(shù)字資源備份工作需要綜合考慮多方因素,在《規(guī)范》層面至少應(yīng)從業(yè)務(wù)、技術(shù)、數(shù)據(jù)及系統(tǒng)角度多管齊下。其中業(yè)務(wù)規(guī)范重點(diǎn)要解決備份工作的業(yè)務(wù)流程與操作問(wèn)題;技術(shù)規(guī)范重點(diǎn)關(guān)注備份工作中所涉及的載體選型、備份環(huán)境搭建、備份數(shù)據(jù)封裝、備份載體檢測(cè)與維護(hù)等問(wèn)題;數(shù)據(jù)規(guī)范側(cè)重關(guān)注備份對(duì)象分級(jí)分類問(wèn)題,包括備份數(shù)據(jù)具體組織形式及其與備份對(duì)象一致性等問(wèn)題;系統(tǒng)規(guī)范則是在備份規(guī)模達(dá)到一定程度后必須面臨的問(wèn)題,需要對(duì)備份系統(tǒng)的建設(shè)進(jìn)行指導(dǎo),包括備份系統(tǒng)基本軟硬件條件、功能架構(gòu)等內(nèi)容。本《規(guī)范》總體定位在業(yè)務(wù)范疇,旨在指導(dǎo)備份工作如何科學(xué)規(guī)范地開(kāi)展,具有較強(qiáng)的操作性,但也兼有部分技術(shù)、數(shù)據(jù)規(guī)范要求,如在備份數(shù)據(jù)組織部分涉及了數(shù)據(jù)規(guī)范要求,在備份策略中提出了備份載體選型建議,在備份環(huán)境等部分提出了備份系統(tǒng)功能要求。
2《.規(guī)范》立足托管、面向管護(hù)、走向容災(zāi)。備份目的決定了備份模式的選擇,根據(jù)目標(biāo)層次的差異,檔案數(shù)字資源備份工作可劃分為托管級(jí)、管護(hù)級(jí)、容災(zāi)級(jí)備份三種模式。托管級(jí)備份以載體安全為核心,主要是對(duì)備份數(shù)據(jù)的存儲(chǔ)載體進(jìn)行維護(hù)管理,功能包括載體檢測(cè)、載體更新、載體轉(zhuǎn)換、載體管理等。管護(hù)級(jí)備份以數(shù)據(jù)安全可信為核心,是在托管級(jí)基礎(chǔ)上,對(duì)備份數(shù)據(jù)具有一定處置功能的備份模式,功能包括數(shù)據(jù)檢測(cè)、格式轉(zhuǎn)換、數(shù)據(jù)憑證效力保全[9]等。容災(zāi)級(jí)備份以業(yè)務(wù)連續(xù)為核心,是以保障災(zāi)難事件發(fā)生期間檔案系統(tǒng)業(yè)務(wù)連續(xù)性為目的的備份模式,涉及對(duì)重要檔案系統(tǒng)應(yīng)用環(huán)境和基礎(chǔ)設(shè)施的備份與恢復(fù)功能。目標(biāo)級(jí)別定位直接影響備份數(shù)據(jù)范圍的確定和備份策略的選擇與組配,例如“檔案數(shù)字資源”廣義與狹義理解的選擇、備份系統(tǒng)功能確定等都與目標(biāo)級(jí)別定位有關(guān)。
備份模式的選擇與檔案信息化的發(fā)展進(jìn)程緊密相關(guān),[10]《規(guī)范》所確定的檔案數(shù)字資源備份的目標(biāo)是“及時(shí)完成檔案數(shù)字資源的備份工作,實(shí)現(xiàn)檔案數(shù)字資源備份數(shù)據(jù)的完整性、一致性、可恢復(fù)性,保證檔案數(shù)字資源的安全”,反映出立足托管、面向管護(hù)、走向容災(zāi)的目標(biāo)定位?,F(xiàn)階段檔案數(shù)字資源備份工作應(yīng)以托管級(jí)為基礎(chǔ),通過(guò)載體安全管理實(shí)現(xiàn)完整性、一致性和安全性的目標(biāo),其后應(yīng)逐步實(shí)現(xiàn)管護(hù)級(jí)功能;備份工作最終應(yīng)走向容災(zāi)級(jí),在災(zāi)難威脅情況下保證檔案系統(tǒng)業(yè)務(wù)連續(xù)。
《規(guī)范》的備份策略主要通過(guò)備份形式與流程、備份對(duì)象與形式兩組關(guān)系,以及備份載體和備份系統(tǒng)功能兩個(gè)側(cè)重點(diǎn)來(lái)體現(xiàn)。由于現(xiàn)階段備份數(shù)據(jù)、技術(shù)和系統(tǒng)方面的專門性規(guī)范缺失,所以備份策略所關(guān)注的要素相互關(guān)系與側(cè)重點(diǎn)零散體現(xiàn)在《規(guī)范》的各條款中。
(一)“備份形式-備份流程”業(yè)務(wù)框架
《規(guī)范》以備份形式為經(jīng),流程為緯,加以約束,形成了“備份形式-備份流程”的業(yè)務(wù)框架?!兑?guī)范》第6~8章就以此框架描述了在線備份、離線備份、異地備份三種形式的完整備份流程,包括備份數(shù)據(jù)組織、傳輸、保存、檢測(cè)、維護(hù)和恢復(fù)等(見(jiàn)圖1)。(1)數(shù)據(jù)組織。該環(huán)節(jié)核心任務(wù)是在遵從檔案數(shù)字資源既有邏輯體系的基礎(chǔ)上準(zhǔn)備備份對(duì)象,因不同備份形式所處的環(huán)境差異,在線備份建議通過(guò)自動(dòng)化系統(tǒng)完成數(shù)據(jù)組織,離線和異地備份需要結(jié)合載體形式組織甚至依賴人工處理。(2)數(shù)據(jù)制作。該環(huán)節(jié)任務(wù)是確保數(shù)據(jù)被有效備份并存儲(chǔ)到合適的載體上,且符合相關(guān)技術(shù)要求。在線備份采用即時(shí)數(shù)據(jù)寫(xiě)入方式,離線備份則依賴物理載體制作,異地備份要求根據(jù)數(shù)據(jù)傳輸方式(在線或離線)進(jìn)行適配。(3)數(shù)據(jù)傳輸與運(yùn)輸。在線備份多依賴本地系統(tǒng)或網(wǎng)絡(luò)實(shí)時(shí)傳輸,離線與異地備份形式則涉及物理運(yùn)輸,需采取專用容器或?qū)S迷O(shè)備保護(hù)數(shù)據(jù)。(4)數(shù)據(jù)檢測(cè)。該環(huán)節(jié)要求定期進(jìn)行備份載體和備份數(shù)據(jù)檢測(cè),檢測(cè)備份對(duì)象與備份數(shù)據(jù)、多套備份數(shù)據(jù)之間是否保持一致,保證備份數(shù)據(jù)可獲取、可呈現(xiàn)、可恢復(fù)。檢測(cè)過(guò)程均建議周期性進(jìn)行,并保存檢測(cè)結(jié)果。(5)數(shù)據(jù)保存維護(hù)。確保備份載體與備份數(shù)據(jù)日常保存與維護(hù)管理。在線備份形式強(qiáng)調(diào)維護(hù)在線備份環(huán)境的整體安全,并在特定情形下進(jìn)行數(shù)據(jù)遷移;離線和異地備份強(qiáng)調(diào)按照既有載體保護(hù)標(biāo)準(zhǔn)進(jìn)行載體保管工作。(6)數(shù)據(jù)恢復(fù)。該環(huán)節(jié)要求制定備份恢復(fù)計(jì)劃,檢查和測(cè)試備份載體的有效性,并定期開(kāi)展恢復(fù)演練工作。
(二)“備份對(duì)象-備份形式”組配關(guān)系
備份對(duì)象與備份形式的關(guān)系是《規(guī)范》在表達(dá)備份策略時(shí)重點(diǎn)關(guān)注的一對(duì)關(guān)系。目前尚無(wú)成熟的可以直接應(yīng)用的數(shù)據(jù)規(guī)范來(lái)精確描述備份對(duì)象的組織形式,因而立足在業(yè)務(wù)規(guī)范層面的《規(guī)范》多使用實(shí)際工作中形成的慣用表達(dá)來(lái)描述備份對(duì)象,如“完整數(shù)據(jù)”“重要數(shù)據(jù)”等,這些慣用表達(dá)與“檔案數(shù)字資源”本身具有的廣義與狹義理解交叉在一起,使得這對(duì)關(guān)系的理解較為模糊,暫未形成備份對(duì)象與形式之間較為明確的組配關(guān)系。
目前業(yè)界對(duì)于備份對(duì)象與不同備份形式的組配關(guān)系并無(wú)一定之規(guī)?!兑?guī)范》結(jié)合了《辦法》中對(duì)電子檔案?jìng)浞菪问胶彤愘|(zhì)異地備份的要求,經(jīng)過(guò)多方調(diào)研與仔細(xì)斟酌,形成了“5.5.1應(yīng)綜合使用在線備份、離線備份、異地備份、異質(zhì)備份等多種方式進(jìn)行檔案數(shù)字資源備份”“5.5.2應(yīng)形成至少2套完整的備份數(shù)據(jù),其中至少1套是離線備份數(shù)據(jù)”“5.5.3對(duì)重要檔案數(shù)字資源應(yīng)進(jìn)行異地備份,在5.5.2的基礎(chǔ)上再形成至少1套異地備份數(shù)據(jù)”等規(guī)定。這些規(guī)定滿足了《辦法》中“一用兩備”所提的最少三套完整數(shù)據(jù)的要求,并規(guī)定對(duì)重要檔案數(shù)字資源進(jìn)行異地異質(zhì)備份,從而在安全與成本之間達(dá)到了較好的平衡,也給實(shí)踐部門在具體備份形式選擇上留下了因地制宜的空間。
(三)備份載體選型
在前序研究中,筆者通過(guò)對(duì)備份載體選型涉及的載體、管理、對(duì)象三大維度重要影響因素的梳理和識(shí)別,發(fā)現(xiàn)載體本身客觀性能、備份主體管理需求及備份對(duì)象特征都會(huì)對(duì)備份載體選型產(chǎn)生影響,很難提出具有普適性的最佳方案,只能根據(jù)備份主體實(shí)際需求和現(xiàn)實(shí)條件具體地形成備份載體選型方案。[11]因此,《規(guī)范》也沒(méi)有固定備份形式與載體之間的組配關(guān)系,而是將備份載體選型作為“組織與管理”中獨(dú)立一節(jié),提出“宜綜合備份形式、備份數(shù)據(jù)的規(guī)模和重要性等因素來(lái)選擇合適的備份載體。”在具體備份載體選擇上,由于備份載體技術(shù)持續(xù)不斷地迭代和更新,備份載體的選型具有顯著的動(dòng)態(tài)特征。因此,備份機(jī)構(gòu)在選型時(shí)需要根據(jù)容量、IOPS和吞吐量等技術(shù)指標(biāo)進(jìn)行靈活調(diào)整,以適應(yīng)不斷變化的需求和技術(shù)發(fā)展。《規(guī)范》不僅僅限于“磁光電膠”介質(zhì)類型,考慮到當(dāng)前備份設(shè)備與技術(shù)發(fā)展現(xiàn)狀,鼓勵(lì)載體、設(shè)備與技術(shù)路線的多元化,因此增加了可選載體和設(shè)備的選擇范圍,為此提供了相對(duì)成熟的備份設(shè)備設(shè)施,包括但不限于磁盤(pán)陣列、光盤(pán)庫(kù)、磁帶庫(kù)、備份一體機(jī)、磁光電混合存儲(chǔ)等設(shè)備類型。
(四)備份系統(tǒng)功能
《規(guī)范》對(duì)于備份系統(tǒng)功能的規(guī)定是在支持備份流程順利進(jìn)行的同時(shí),落實(shí)備份的總體原則,保障檔案數(shù)字資源備份的完整性、一致性和可恢復(fù)性?!兑?guī)范》5.2.6條款建議備份機(jī)構(gòu)通過(guò)相應(yīng)系統(tǒng)作為備份工作的重要抓手,參照GB/T 39784—2021中7.1的規(guī)定,建設(shè)“能滿足檔案數(shù)字資源備份管理要求的備份管理系統(tǒng)”,或者完善既有檔案管理系統(tǒng)中的數(shù)據(jù)備份功能,使之具備備份策略配置和維護(hù)、檔案數(shù)字資源備份恢復(fù)、備份數(shù)據(jù)和備份載體管理、多套備份數(shù)據(jù)協(xié)同管理、備份數(shù)據(jù)狀態(tài)查看、備份數(shù)據(jù)檢測(cè)預(yù)警、備份人員權(quán)限管理、備份操作任務(wù)提醒、備份管理過(guò)程記錄、備份數(shù)據(jù)和備份載體處置等功能。其中在線備份形式對(duì)系統(tǒng)的功能要求更高,如要求建設(shè)功能完善的在線備份技術(shù)環(huán)境,建議系統(tǒng)支持預(yù)先配置并可根據(jù)配置自動(dòng)完成在線備份數(shù)據(jù)組織等。
*本文系國(guó)家社會(huì)科學(xué)基金項(xiàng)目“數(shù)據(jù)態(tài)環(huán)境下檔案管理模式創(chuàng)新研究”(項(xiàng)目編號(hào):23BTQ108)階段性研究成果。
注釋及參考文獻(xiàn):
[1]IDC.全球市場(chǎng)洞察IDCDataSphere最新趨勢(shì)預(yù)測(cè)[EB/OL].(2024-10-18)[2024-12-20].https://www.idc.com/getdoc.jsp?con? tainerId=prCHC52667624.
[2]國(guó)家檔案局.2023年度全國(guó)檔案主管部門和檔案館基本情況摘要(二)[EB/OL].(2024-09-20)[2024-12-20].https://www.saac.gov. cn/daj/zhdt/202409/a277f8b3bfe942ca88d3b7bcf6ddf120.shtml.
[3]王英瑋,楊千.總體國(guó)家安全觀視角下《中華人民共和國(guó)檔案法》的安全理念[J].檔案學(xué)研究, 2020(6):78-85.
[4]IBM.2024年數(shù)據(jù)泄露成本報(bào)告[EB/OL].(2024-07-31)[2024-12-20].https://www.ibm.com/ cn-zh/reports/data-breach.
[5]梁磊,王建文,王順.國(guó)家綜合檔案館電子文件備份中心建設(shè)研究[J].北京檔案,2016(7):31-32.
[6]陳淑華.我國(guó)檔案異地備份制度發(fā)展脈絡(luò)、主要問(wèn)題與建構(gòu)策略研究[J].檔案與建設(shè),2019(7):27-31.
[7]沈朋,趙躍.我國(guó)數(shù)字檔案?jìng)浞菅芯窟M(jìn)展[J].中國(guó)檔案,2016(10):68-69.
[8]陶水龍.檔案數(shù)字資源云備份策略的分析與研究[J].檔案學(xué)通訊,2012(4):12-16.
[9]余亞榮,吳振宇.從數(shù)據(jù)備份走向數(shù)據(jù)保全:基于憑證效力維護(hù)視角的電子檔案保管[J].檔案管理,2022(1):18-19.
[10]許桂清.電子檔案異地異質(zhì)備份現(xiàn)狀及應(yīng)對(duì)[J].檔案學(xué)研究,2018(1):82-88.
[11]安新宇,錢毅.綜合檔案館檔案數(shù)字資源備份介質(zhì)選型研究[J].北京檔案,2023(3):12-16.
作者單位:1.中國(guó)人民大學(xué)信息資源管理學(xué)院
2.中國(guó)人民大學(xué)電子文件管理研究中心
3.多模態(tài)檔案保護(hù)與開(kāi)發(fā)國(guó)家檔案局重點(diǎn)實(shí)驗(yàn)室