王玉 許曉彤
摘 要:文章基于對英國數(shù)據(jù)治理工作宏觀背景的分析,聚焦法規(guī)制度與實踐樣例兩個方面,認為英國數(shù)據(jù)收集內(nèi)容豐富、方式靈活,數(shù)據(jù)組織與存儲要求明確、標準規(guī)范,數(shù)據(jù)安全設施、人員與存儲并重,數(shù)據(jù)利用范圍廣泛、形式多樣。我國應當強化檔案數(shù)據(jù)法規(guī)制度建設、推動多元主體協(xié)同聯(lián)動、積極運用檔案數(shù)據(jù)治理新技術,協(xié)力提升我國檔案數(shù)據(jù)治理能力。
關鍵詞:檔案數(shù)據(jù);數(shù)據(jù)治理;檔案數(shù)據(jù)治理
分類號:G279.1
The Present Situation and Enlightenment of Archival Data Governance in the UK
Wang Yu1,2, Xu Xiaotong3
( 1.School of Information Management, Wuhan University, Wuhan, Hubei 430072; 2.National Demonstration Center for Experimental Library and Information Science Education, Wuhan University, Wuhan, Hubei 430072; 3. School of History and Culture, Shandong University, Jinan, Shandong 250100 )
Abstract: Based on the analysis of the macro background of data governance in the UK, the article focuses on two aspects: laws and regulations and practical examples. It believes that data collection in the UK is rich in content, flexible in methods, clear in data organization and storage requirements, standardized in regulations, with equal emphasis on data security facilities, personnel, and storage. The scope of data utilization is wide and diverse in forms. We should strengthen the development of regulations and systems for archival data, promote collaboration among multiple entities, actively utilize new technologies for archival data governance, and work together to enhance China’s archival data governance capabilities.
Keywords: Archival Data; Data Governance; Archival Data Governance
“檔案數(shù)據(jù)”是近年來出現(xiàn)的新概念,是指數(shù)據(jù)化的檔案信息及具備檔案性質(zhì)的數(shù)據(jù)記錄。[1]從其外延上看,檔案數(shù)據(jù)是廣義的數(shù)據(jù)集合,既包括檔案機構(gòu)中數(shù)據(jù)態(tài)的檔案資源,也包括具備長期保存價值,但暫時尚未被納入檔案機構(gòu)保管的數(shù)據(jù)(如社科領域現(xiàn)有研究匯集成的歷史數(shù)據(jù)集[2])。當前,檔案數(shù)據(jù)在安全、質(zhì)量、開放利用等方面仍面臨困境,數(shù)據(jù)孤島、數(shù)據(jù)壁壘、數(shù)據(jù)異構(gòu)等問題普遍存在,如何將檔案數(shù)據(jù)治理融入國家治理體系建設,為數(shù)字政府、數(shù)字經(jīng)濟與數(shù)字社會建設提供高質(zhì)量的可信檔案數(shù)據(jù),成為檔案界研究的焦點。
我國對檔案數(shù)據(jù)治理的研究始于2018年,關注問題涉及檔案數(shù)據(jù)治理的概念與內(nèi)涵[3]、動因[4]、主體[5]、策略[6]等,整體形成了我國檔案數(shù)據(jù)治理體系的理論框架,但尚缺乏對國外相關現(xiàn)狀的系統(tǒng)性、針對性梳理。本文聚焦英國檔案數(shù)據(jù)治理工作,梳理其在檔案數(shù)據(jù)治理制度、實踐方面的典型探索,最后結(jié)合我國國情提出可供借鑒的啟示與策略。
1 宏觀背景:國家數(shù)據(jù)治理法規(guī)制度體系日趨完備
英國目前雖未頒布專門的檔案數(shù)據(jù)治理法律法規(guī),但在整體數(shù)據(jù)治理層面已形成“時空擴展,縱橫延伸”的法規(guī)制度體系——以《信息自由法》(Freedom of Information Act)《自由保護法》(Protection of Freedom)《數(shù)據(jù)保護法》(Data Protection Act,2018年更新,以下簡稱DPA 2018)《通用數(shù)據(jù)保護條例》(The General Data Protection Regulation,以下簡稱GDPR)等為核心,涵蓋個人數(shù)據(jù)保護、數(shù)據(jù)開放利用、電子政務管理與服務、網(wǎng)絡與數(shù)據(jù)安全、數(shù)據(jù)基礎設施建設五大領域。2020年9月,英國數(shù)字、文化、媒體和體育部發(fā)布《國家數(shù)據(jù)戰(zhàn)略》(UK National Data Strategy,以下簡稱NDS)。NDS是英國近期一項極為重要的大數(shù)據(jù)國家戰(zhàn)略,它致力于發(fā)展英國數(shù)據(jù)經(jīng)濟,確保公眾信任數(shù)據(jù),為支持英國發(fā)展世界領先的數(shù)據(jù)經(jīng)濟構(gòu)建了明確的政府行動框架。[7]2022年7月18日,英國下議院最新提交的《數(shù)據(jù)保護和數(shù)字信息法案》(Data Protection and Digital Information Bill),旨在促進數(shù)據(jù)驅(qū)動創(chuàng)新,鼓勵合理使用個人數(shù)據(jù)以保護公眾利益。[8]整體而言,英國數(shù)據(jù)治理制度體系既包括具有強制約束力的法律法規(guī),又包括宏觀層面的國家戰(zhàn)略、操作性強的指南,以及白皮書等“非正式文件”,類型多樣,覆蓋面極廣,且隨著技術的發(fā)展不斷更新。
英國的檔案數(shù)據(jù)治理工作在國家數(shù)據(jù)治理的宏觀背景下推行。GDPR首次明確提出“為公共利益存檔”的概念,出于公共利益保存或公布含有個人數(shù)據(jù)的檔案可以免受部分GDPR所列規(guī)則的管轄;DPA 2018同樣指出,為了社會的長期利益,允許檔案館永久保存符合公共利益的個人數(shù)據(jù),但須采取適當保護措施避免對數(shù)據(jù)主體造成威脅。兩部法規(guī)均強調(diào)檔案數(shù)據(jù)治理的重要性,為備受關注的個人檔案數(shù)據(jù)處理提供一定責任豁免,并將其納入立法框架,為檔案館出于公共利益處理個人檔案數(shù)據(jù)提供了立法支持,拓寬了檔案數(shù)據(jù)治理的發(fā)展空間,檔案工作者在數(shù)據(jù)治理工作中更有可為。
2 法規(guī)制度:檔案數(shù)據(jù)治理有序嵌入國家數(shù)據(jù)治理
國家檔案館等機構(gòu)緊隨國家數(shù)據(jù)治理發(fā)展趨勢,陸續(xù)頒布檔案數(shù)據(jù)治理規(guī)范性文件,推動英國檔案數(shù)據(jù)治理有計劃地融入國家數(shù)據(jù)治理戰(zhàn)略體系。
2.1 《個人數(shù)據(jù)存檔指南》
2018年,英國國家檔案館發(fā)布《個人數(shù)據(jù)存檔指南》(Guide to Archiving Personal Data)[9](以下簡稱《指南》),為出于公共利益的個人數(shù)據(jù)存檔提供了指導?!吨改稀纷裱璆DPR對“個人信息”的寬泛定義,即“可直接或間接識別自然人(數(shù)據(jù)主體)的所有信息”,并將業(yè)務或法律存證排除在“為公共利益存檔”范圍之外,以避免規(guī)制范圍的無限擴大。
《指南》主要包括三方面內(nèi)容:明確了個人數(shù)據(jù)保護與存檔之間的關系,它指出個人數(shù)據(jù)保護不能妨礙存檔工作的正常進行,確立了“保護”與“存檔”并重的法律地位;建立了基于公共利益的個人數(shù)據(jù)權利豁免規(guī)則,為了社會公眾的長期利益,檔案館有權永久保存確有價值的個人數(shù)據(jù);對數(shù)據(jù)處理“知情—同意”的限制性規(guī)定,出于公共利益的存檔行為無須獲得數(shù)據(jù)主體同意,但應保留數(shù)據(jù)主體“權利束”中的部分權利,如訪問權、可攜權、更正權等,最大限度減少對個人權利的干預。出于公共利益存檔的主要任務在于確保檔案所載社會記憶的完整與真實,便于日后查考,在這種環(huán)境下,“被遺忘權”并不適用。但這一限制并非絕對,是否刪除數(shù)據(jù)需要檔案部門結(jié)合個案情況綜合考量個人利益與社會公共利益,在損益成比例的情況下做出自由裁量。此外,檔案部門還可以通過設置封閉期、增加訪問限制等手段實現(xiàn)記憶完整性與個人隱私保護的平衡。
《指南》還確立了三個個人數(shù)據(jù)存檔的基本原則??陀^性原則,存檔后的個人數(shù)據(jù)不再更新,固化存檔截止時的既有事實。人本性原則,數(shù)據(jù)主體在世時,檔案數(shù)據(jù)管理過程中應當側(cè)重于對個人隱私的保護;一旦數(shù)據(jù)主體去世,相關個人檔案數(shù)據(jù)失去賴以依存的利益主體,其作為一種公共資源可能面臨公開。透明度原則,檔案數(shù)據(jù)控制者在處理個人數(shù)據(jù)時,必須向數(shù)據(jù)主體公開,將數(shù)據(jù)主體作為個人檔案數(shù)據(jù)處理合規(guī)性監(jiān)督的重要力量。
2.2 《數(shù)據(jù)保護與個人信息》
2019年,英國國家檔案館發(fā)布更新后的《數(shù)據(jù)保護與個人信息》(Data Protection and Personal Information)[10],該文件明確了個人數(shù)據(jù)存檔免于GDPR與DPA 2018各項規(guī)定要求的兩項前提:一是數(shù)據(jù)處理行為不是為了支持某項個人決定,而是為了滿足公共利益;二是個人數(shù)據(jù)的長期保存不會給數(shù)據(jù)主體帶來負面影響。如果兩項前提都適用,那么檔案館可以永久保存?zhèn)€人數(shù)據(jù),避免個人數(shù)據(jù)存檔行為過度受到數(shù)據(jù)保護原則的掣肘,在立法層面確立了“公共利益”的具體裁量基準。而對于此類包含個人數(shù)據(jù)的檔案,國家檔案館也會將具體情況登記在移交給信息專員的隱私聲明中,標明移交至檔案館的文件中含有個人數(shù)據(jù)。作為隱私監(jiān)管者與個人數(shù)據(jù)保護的獨立官員,信息專員依法對檔案館處理個人數(shù)據(jù)的行為進行監(jiān)督。
此外,文件還指出了檔案封閉的常見原因是包含了依然在世者的個人信息。然而,無法判斷數(shù)據(jù)主體是否在世是檔案館處理個人數(shù)據(jù)時的常見困難?;诖?,英國國家文件與檔案咨詢委員會將人的生命假定為100年,用其減去檔案中數(shù)據(jù)主體已知或推測的年齡,即為相應個人檔案數(shù)據(jù)的封閉期。這一規(guī)則簡稱為“生命周期”(Life Cycling)原則,不僅適用于傳統(tǒng)載體檔案的開放利用,同樣也適用于檔案數(shù)據(jù)的開放利用。英國還采用“滾動十年”(Rolling 10 Years)原則,定期對這些封閉狀態(tài)的檔案數(shù)據(jù)展開評估,及時解除利用限制。此外,個人數(shù)據(jù)主體生命周期內(nèi)的全部個人數(shù)據(jù)并非都應封閉保存,特定的信息及其上下文內(nèi)容可能在封閉期之前被允許訪問。
2.3 《從檔案中提取數(shù)據(jù):最佳實踐指南》
2021年,英國地理空間委員會出于科研工作需要,與內(nèi)閣辦公室共同發(fā)布《從檔案中提取數(shù)據(jù):最佳實踐指南》(Extracting Data from Archives: Best Practice Guide)[11],用以指導識別檔案中的地理空間數(shù)據(jù)。該指南面向所有使用檔案并希望從檔案中提取地理空間數(shù)據(jù),尤其是首次嘗試數(shù)據(jù)采集的人員,指導其在檔案數(shù)據(jù)管理任意階段識別并處理檔案中的位置數(shù)據(jù)。該指南所使用數(shù)據(jù)的主要來源是Geo6合作機構(gòu),包括英國地質(zhì)調(diào)查局、煤炭管理局、軍械測量局、土地注冊處、英國水文局與英國評估辦公室機構(gòu)所擁有的地理空間數(shù)據(jù)。指南總結(jié)了從檔案中提取位置數(shù)據(jù)時需要注意的要素,包括成本和資金、數(shù)據(jù)領域?qū)I(yè)知識、檔案與待提取數(shù)據(jù)的價值、提取過程中的數(shù)據(jù)質(zhì)量保證與控制、提取后的數(shù)據(jù)質(zhì)量、數(shù)據(jù)可用性、數(shù)據(jù)標準共7項。此外,該指南還提供了從檔案中提取數(shù)據(jù)的最佳實踐框架,將數(shù)據(jù)提取項目分為6個步驟,包括識別用戶需求、檔案審查、掃描或數(shù)據(jù)轉(zhuǎn)錄、數(shù)據(jù)提取、數(shù)據(jù)存儲和數(shù)據(jù)交付,各階段之間的反饋主要靠專家輸入實現(xiàn)。
3 實踐樣例:英國數(shù)據(jù)檔案館的檔案數(shù)據(jù)治理探索
英國數(shù)據(jù)檔案館(UK Data Archive)1967年成立于埃塞克斯大學。作為具有世界影響力的國家級數(shù)據(jù)檔案館,英國數(shù)據(jù)檔案館保存著來自英國國家統(tǒng)計局、國家社會研究中心、內(nèi)政部、衛(wèi)生部等諸多機構(gòu)的調(diào)查數(shù)據(jù),是英國最大的社會科學與人口研究數(shù)據(jù)集合地。該機構(gòu)所保存的數(shù)據(jù)目前尚未為檔案機構(gòu)所保管,但具備長期保存價值,屬于本文“檔案數(shù)據(jù)”的討論范圍。自20世紀70年代起,英國國家統(tǒng)計局開始向英國數(shù)據(jù)檔案館存放政府調(diào)查數(shù)據(jù)。2005年起,英國數(shù)據(jù)檔案館成為英國國家檔案館的指定數(shù)據(jù)存放地,并于2012年成為英國政府數(shù)據(jù)服務的主要合作伙伴。當前,英國數(shù)據(jù)檔案館已成為英國國家數(shù)據(jù)資源極為重要的可信存儲庫,極大地拓展了檔案數(shù)據(jù)治理的領域與行為,并獲得CoreTrustSeal國際數(shù)據(jù)知識庫認證。作為數(shù)據(jù)管理的有力倡導者,英國數(shù)據(jù)檔案館在數(shù)據(jù)收集、數(shù)據(jù)組織與存儲、數(shù)據(jù)安全、數(shù)據(jù)利用等關鍵環(huán)節(jié)與方面開展了不同角度的探索,積累了較為豐富的經(jīng)驗。因此,本文以英國數(shù)據(jù)檔案館為樣例,管窺英國數(shù)據(jù)治理實踐工作的特點。
3.1 數(shù)據(jù)收集內(nèi)容豐富、方式靈活
英國數(shù)據(jù)檔案館廣泛收集以社會與經(jīng)濟數(shù)據(jù)為主的數(shù)據(jù)檔案,其數(shù)據(jù)收集工作具有四方面特點。第一,數(shù)據(jù)來源廣泛。英國數(shù)據(jù)檔案館不限制數(shù)據(jù)來源,無論是小型組織的科研數(shù)據(jù),還是政府部門和公共機構(gòu)的大規(guī)模數(shù)據(jù)集,均可存儲在英國數(shù)據(jù)檔案館中,成為開放或受保護的數(shù)據(jù)。第二,數(shù)據(jù)內(nèi)容與形式多樣。數(shù)據(jù)檔案館代表英國數(shù)據(jù)服務(UK Data Service)對全國研究數(shù)據(jù)進行收集整理,除社會、經(jīng)濟與人文數(shù)據(jù)外,其還整合了埃塞克斯的定性數(shù)據(jù)部門和專業(yè)的歷史數(shù)據(jù)服務中心,館藏數(shù)據(jù)不僅涉及英國社會生活的諸多領域,而且可能反映了某些國際問題,數(shù)據(jù)種類也涵蓋文本型、圖片型或混合方法等多種形式。第三,數(shù)據(jù)收集方式多樣。初次提供數(shù)據(jù)的主體,可通過免費注冊的在線賬戶提供數(shù)據(jù),并對其進行簡短說明。英國數(shù)據(jù)檔案館對數(shù)據(jù)進行評估后,決定是否接收數(shù)據(jù)及存儲地點。對于經(jīng)常提供數(shù)據(jù)的主體,如政府部門、公共機構(gòu)或大型研究機構(gòu),英國數(shù)據(jù)檔案館將安排專業(yè)處理團隊對其進行策展,將其數(shù)據(jù)納入策劃的精選數(shù)據(jù)存儲庫,并為數(shù)據(jù)利用提供線索指引。對于可共享數(shù)據(jù)的提供方,尤其是ESRC的被資助者,英國數(shù)據(jù)檔案館建議將其研究數(shù)據(jù)自行存入英國數(shù)據(jù)服務的在線可共享數(shù)據(jù)存儲庫ReShare中。第四,數(shù)據(jù)獲取以合作為主。英國數(shù)據(jù)檔案館擴展了面向數(shù)據(jù)的合作項目,如農(nóng)村地區(qū)數(shù)據(jù)庫等。此外,英國數(shù)據(jù)檔案館與英國政府建立了長期合作關系,還同世界銀行、國際貨幣基金組織、國際能源署等重要機構(gòu)開展合作,確保用戶能夠及時獲取這些重要的、可公開的社會與經(jīng)濟數(shù)據(jù)資源。
3.2 數(shù)據(jù)組織與存儲要求明確、標準規(guī)范
在檔案數(shù)據(jù)組織方面,英國數(shù)據(jù)檔案館積極建立數(shù)據(jù)詞典、編纂主題詞表進行數(shù)據(jù)組織。英國數(shù)據(jù)檔案館為所有存檔過的SPSS格式數(shù)據(jù)文件建立數(shù)據(jù)詞典[12],并編纂人文與社會科學電子主題詞表,該詞表涵蓋了4000多個核心社科概念,能夠?qū)崿F(xiàn)數(shù)據(jù)集的快速索引。在檔案數(shù)據(jù)存儲方面,英國數(shù)據(jù)檔案館發(fā)布了專門的《保存政策》(Preservation policy)以規(guī)范數(shù)據(jù)存儲行為。[13]英國數(shù)據(jù)檔案館通過數(shù)據(jù)校驗實現(xiàn)數(shù)據(jù)的編輯、清理、驗證等。當決定對某份數(shù)據(jù)建立專門的數(shù)據(jù)集時,數(shù)據(jù)檔案館將開展數(shù)據(jù)質(zhì)量控制檢驗,對變量個數(shù)、文檔格式、數(shù)據(jù)下載格式等進行檢查。數(shù)據(jù)質(zhì)量控制檢驗將數(shù)據(jù)分為A*、A、B、C四類標準,不同層次的數(shù)據(jù)在數(shù)據(jù)集維度、元數(shù)據(jù)、數(shù)據(jù)有效性、數(shù)據(jù)讀取等方面的要求從嚴到松,并制定《英國數(shù)據(jù)檔案館數(shù)據(jù)處理標準》(UK Data Archive Data Processing Standards)加以規(guī)范。此外,英國數(shù)據(jù)檔案館遵循系列標準以規(guī)范對館藏元數(shù)據(jù)的描述,如《數(shù)據(jù)文檔倡議》(The Data Documentation Initiative)。該標準是專為經(jīng)濟與社會科學數(shù)據(jù)而設計的元數(shù)據(jù)標準,用以記錄和研究數(shù)據(jù)生命周期從概念化、收集、處理到最終存檔各個階段的表現(xiàn)狀態(tài)。
3.3 數(shù)據(jù)安全設施、人員與存儲并重
作為受信任的數(shù)字存儲庫,英國數(shù)據(jù)檔案館的使命是提供對館藏數(shù)字資源的可靠、長期訪問。2010年6月,英國數(shù)據(jù)檔案館通過國際信息安全管理體系標準ISO/IEC 27001評審,這標志著其已建立起涵蓋隱私保護、數(shù)據(jù)處理、人員管理等領域的數(shù)據(jù)安全管理體系。
英國數(shù)據(jù)檔案館從基礎設施、人員與存儲三方面維護數(shù)據(jù)安全。在基礎設施安全方面,英國數(shù)據(jù)檔案館配備了諸多安防系統(tǒng),服務器機房的門禁系統(tǒng)能夠?qū)崿F(xiàn)實時報警,并與埃塞克斯大學保衛(wèi)處直接對接,所有機房的計算機均由密碼系統(tǒng)鎖定,嚴防未經(jīng)授權的訪問。在人員安全方面,對于檔案館員工,英國數(shù)據(jù)檔案館要求所有訪問檔案館網(wǎng)絡的員工簽署保密協(xié)議,有權訪問敏感檔案數(shù)據(jù)的員工還需接受蘇格蘭政府執(zhí)行機構(gòu)披露蘇格蘭(Disclosure Scotland)的審查;對于外部訪問者,英國數(shù)據(jù)檔案館要求訪問數(shù)據(jù)須經(jīng)過數(shù)據(jù)擁有者的授權同意,允許利用者對數(shù)據(jù)進行安全訪問與遠程分析,但不得修改、下載或帶走數(shù)據(jù),以降低檔案數(shù)據(jù)的失效、失密風險。在存儲安全方面,英國數(shù)據(jù)檔案館對訪問披露的安全數(shù)據(jù)有著嚴格的規(guī)定,所有受限的數(shù)字化文件必須加密,文件名需包含“RESRICTED”以便于識別,并存儲在指定驅(qū)動器中的“RESRICTED”目錄中,以維護館藏檔案數(shù)據(jù)的安全。
3.4 數(shù)據(jù)利用范圍廣泛、形式多樣
英國數(shù)據(jù)檔案館采用多種形式,為世界范圍內(nèi)用戶提供數(shù)據(jù)訪問利用。首先,自2012年起,英國數(shù)據(jù)檔案館開始為所有館藏數(shù)據(jù)啟動DataCite數(shù)字對象標識符(DOI)集中注冊管理技術作為數(shù)據(jù)引用方法,極大拓寬了數(shù)據(jù)的可共享范圍。借助互聯(lián)網(wǎng)傳播方式,英國數(shù)據(jù)檔案館當前已擁有超過2.3萬名注冊用戶。英國數(shù)據(jù)檔案館還擁有8900余個數(shù)據(jù)集,各國的科學研究者、政府部門人員等數(shù)據(jù)用戶均可從中獲取數(shù)據(jù),支持科研發(fā)展與政府決策。其次,英國數(shù)據(jù)檔案館的檢索方式較為便捷,用戶可以通過數(shù)據(jù)日期、主題、數(shù)據(jù)類型、使用權、國家等要素檢索,快速定位所需數(shù)據(jù)。最后,英國數(shù)據(jù)檔案館還致力于指導數(shù)據(jù)利用者提高數(shù)據(jù)訪問分析能力,通過編制用戶指南、開展網(wǎng)絡研討會、提供面對面定制化培訓服務等,幫助利用者更高效地開展研究工作。當前,英國數(shù)據(jù)檔案館的培訓課程已走出國門,拓展至美國、中國、印度、吉爾吉斯斯坦等國家,極大地擴展了檔案數(shù)據(jù)訪問利用的地域范圍。
4 啟示建議:協(xié)力提升我國檔案數(shù)據(jù)治理能力
英國檔案數(shù)據(jù)治理工作產(chǎn)生于國家大數(shù)據(jù)戰(zhàn)略布局對檔案資源數(shù)據(jù)態(tài)轉(zhuǎn)型的客觀需求,檔案數(shù)據(jù)治理體系正向以基礎法規(guī)制度為標尺、以個人檔案數(shù)據(jù)保護為特色的方向發(fā)展,并圍繞數(shù)據(jù)收集、數(shù)據(jù)組織與存儲、數(shù)據(jù)安全、數(shù)據(jù)利用開展實踐探索,從制度與實踐兩個層面著力提升檔案數(shù)據(jù)治理能力。不可否認的是,英國檔案數(shù)據(jù)治理體系建設還須不斷完善,法律法規(guī)建設尚未健全,實踐工作還未大規(guī)模覆蓋至已移交至檔案機構(gòu)的、具備檔案屬性的數(shù)據(jù)。但英國檔案數(shù)據(jù)治理工作在制度體系建設、協(xié)同意識強化與新興技術運用等方面的經(jīng)驗,仍對我們具有借鑒意義。截至 2021 年底,我國各級國家檔案館共計館藏電子檔案 1629.9 TB。[14]海量原生數(shù)字檔案要求檔案界重視檔案數(shù)據(jù)治理,發(fā)揮檔案數(shù)據(jù)價值,助力國家治理體系與治理能力現(xiàn)代化。受多方面因素影響,我國檔案數(shù)據(jù)治理仍普遍面臨數(shù)據(jù)質(zhì)量參差不齊、數(shù)據(jù)價值挖掘不足、檔案數(shù)據(jù)安全風險等困境[15],數(shù)據(jù)涌現(xiàn)與治理滯后、海量數(shù)據(jù)與價值實現(xiàn)之間的矛盾廣泛存在。因此,本文基于英國檔案數(shù)據(jù)治理探索過程中在制度構(gòu)建、意識培養(yǎng)、技術運用三方面的現(xiàn)有經(jīng)驗,結(jié)合我國實際情況,探討檔案數(shù)據(jù)治理的可行之策,以期對構(gòu)建有中國特色的檔案數(shù)據(jù)治理體系,強化檔案數(shù)據(jù)治理能力提供參考。
4.1 強化檔案數(shù)據(jù)法規(guī)制度建設,融入國家數(shù)據(jù)治理頂層設計
檔案數(shù)據(jù)法規(guī)制度建設為檔案數(shù)據(jù)治理工作提供了基礎保障。一方面,檔案數(shù)據(jù)治理應以國家數(shù)據(jù)治理法律規(guī)范為框架,構(gòu)建自上而下的檔案數(shù)據(jù)治理頂層設計,推動檔案事業(yè)可持續(xù)發(fā)展。英國政府較早意識到檔案數(shù)據(jù)治理的重要性,2018年發(fā)布的GDPR與DPA 2018首次將出于公共利益進行的個人數(shù)據(jù)歸檔行為納入管理范疇,為檔案館長期保存?zhèn)€人檔案數(shù)據(jù)提供了立法支持。同年,英國國家檔案館迅速作出反應,發(fā)布《指南》以響應國家戰(zhàn)略布局,并于2019年發(fā)布《數(shù)據(jù)保護與個人信息》,推動檔案數(shù)據(jù)治理相關法規(guī)制度不斷融入國家數(shù)據(jù)治理頂層設計。另一方面,檔案部門應主動對接國家大數(shù)據(jù)戰(zhàn)略,積極參與國家數(shù)據(jù)治理規(guī)則制定,找準自身在數(shù)據(jù)時代的價值與定位。英國國家檔案館早于2011年便參與了國家“信息基礎設施(NII)計劃”,負責指導政府部門定義并發(fā)布各自的公共任務聲明;2015年,英國國家檔案館又與司法部聯(lián)合修訂了《公共部門信息再利用條例》(The Reuse of Public Sector Information Regulations),明確公民擁有獲取公共部門掌握的信息(除例外信息)的權利,公共部門應以開放的、機器可讀格式提供信息及其元數(shù)據(jù)。這表明在英國國家數(shù)據(jù)治理體系構(gòu)建中,英國國家檔案館始終占有一席之地,履行其記錄與管理政府信息的基本職責。
我國的數(shù)據(jù)治理制度建設正處于快速推進階段,檔案機構(gòu)卻尚未在數(shù)據(jù)治理制度建設中發(fā)揮應有作用。2016年起,我國陸續(xù)頒布了《網(wǎng)絡安全法》《數(shù)據(jù)保護法》《個人信息保護法》等,圍繞數(shù)據(jù)治理建立起一系列工作機制,如數(shù)據(jù)出境安全評估機制、個人數(shù)據(jù)處理“告知同意”機制等,初步構(gòu)建起國家數(shù)據(jù)治理制度體系,有效回應數(shù)據(jù)治理中的各類問題。然而,參與數(shù)據(jù)治理頂層設計的主體中鮮見檔案部門的身影[16],如2015年建立起的“促進大數(shù)據(jù)發(fā)展部際聯(lián)席會議”中,檔案部門并未列席;2023年新組建的國家數(shù)據(jù)局也未見檔案部門參與,針對檔案數(shù)據(jù)治理的頂層制度規(guī)劃也尚未成型?;诖耍瑱n案部門應主動參與國家數(shù)據(jù)治理的整體部署與具體工作,同時積極制定全國性檔案數(shù)據(jù)治理頂層規(guī)劃,并將其融入國家數(shù)據(jù)治理的總體發(fā)展浪潮中,與國家數(shù)據(jù)治理工作同頻共振?;诋斍罢畔①Y源開放與共享、個人數(shù)據(jù)保護、數(shù)據(jù)安全維護等重點領域?qū)?shù)據(jù)治理的迫切需求,檔案部門可優(yōu)先開展上述領域檔案數(shù)據(jù)治理的探索,強化相關制度的制定與貫徹,形成覆蓋全面、權責明晰、監(jiān)督有力的檔案數(shù)據(jù)治理制度體系。檔案部門也應重視檔案管理基礎環(huán)節(jié)的數(shù)據(jù)化轉(zhuǎn)型,加強檔案數(shù)據(jù)安全管理、質(zhì)量控制等制度推進,從傳統(tǒng)粗放式的管理向更細顆粒度的數(shù)據(jù)化治理轉(zhuǎn)型,提供更高質(zhì)量的原生檔案數(shù)據(jù)并推進檔案數(shù)據(jù)流動,切實提升檔案數(shù)據(jù)治理效能。
4.2 推動多元主體協(xié)同聯(lián)動,探索檔案數(shù)據(jù)“多元共治”模式
多元共治是社會治理現(xiàn)代化的表征,多元主體協(xié)同也是數(shù)據(jù)治理工作的前提。英國檔案數(shù)據(jù)治理秉承多元共治理念,強調(diào)檔案部門要與政府、社會、公眾等多主體合作互動。在制度層面,英國檔案數(shù)據(jù)治理制度體系的構(gòu)建主體并非僅有國家檔案館,以英國內(nèi)閣辦公室、英國地理空間委員會等為代表的非檔案機構(gòu)也紛紛立足各自領域,發(fā)布檔案數(shù)據(jù)治理標準或指南等規(guī)范性文件。在實踐層面,英國數(shù)據(jù)檔案館作為國家數(shù)據(jù)資源的可信存儲庫,與國家統(tǒng)計局、國家社會研究中心、內(nèi)政部、衛(wèi)生部等開展合作,積極面向不同機構(gòu)廣泛收集以社會與經(jīng)濟數(shù)據(jù)為主的檔案數(shù)據(jù),并將公眾納入檔案數(shù)據(jù)的重要來源,以實現(xiàn)社會范疇內(nèi)的數(shù)據(jù)共享。此外,英國數(shù)據(jù)檔案館主動開展面向公眾的檔案數(shù)據(jù)能力培訓,實現(xiàn)檔案館與公眾之間的良性互動,強化多元主體數(shù)據(jù)治理意識與能力,構(gòu)建起以檔案館為主導、多元主體協(xié)同治理的良好格局。
我國新修訂《中華人民共和國檔案法》指出,“國家鼓勵社會力量參與和支持檔案事業(yè)的發(fā)展”,這為多元主體協(xié)同參與檔案數(shù)據(jù)治理提供了遵循。我國的檔案數(shù)據(jù)治理體系建設,同樣應著力強化檔案部門與政府、社會力量的協(xié)同合作,激發(fā)社會參與熱情,形成多元主體共同參與的檔案數(shù)據(jù)治理協(xié)同機制,共同“辦好一件事”。具體而言,檔案館可與圖書館、博物館、美術館等文化遺產(chǎn)機構(gòu)合作,共謀檔案文化數(shù)據(jù)的治理;可與大數(shù)據(jù)局、民政局、財政局等政府部門合作,共商檔案數(shù)據(jù)惠民。如山東省檔案館與省民政廳、大數(shù)據(jù)局尋求合作,共同發(fā)文督辦省內(nèi)婚姻登記歷史檔案數(shù)據(jù)補錄,為促進婚姻登記數(shù)據(jù)共享提供強有力的檔案數(shù)據(jù)支撐[17],為其他地區(qū)檔案數(shù)據(jù)多元共治提供了有益借鑒。
4.3 積極運用檔案數(shù)據(jù)治理新技術,釋放檔案數(shù)據(jù)紅利
檔案數(shù)據(jù)治理離不開新興技術的運用??v觀英國檔案數(shù)據(jù)治理已有經(jīng)驗,新興技術的運用貫穿始終。在制度層面,《從檔案中提取數(shù)據(jù):最佳實踐指南》指出要運用大數(shù)據(jù)技術實現(xiàn)數(shù)據(jù)的自動提??;在實踐層面,英國國家檔案館發(fā)布了專門的檔案數(shù)據(jù)保護工具包,通過結(jié)構(gòu)化決策法協(xié)助檔案管理者處理針對館藏個人數(shù)據(jù)的訪問請求;英國數(shù)據(jù)檔案館同樣開發(fā)了QAMyData、OpenRefine、sdcMicro、AxCrypt、ZendTo、Nesstar等一系列工具,分別用于數(shù)據(jù)質(zhì)量評估、數(shù)據(jù)清洗、風險監(jiān)測、數(shù)據(jù)加密、數(shù)據(jù)傳輸、數(shù)據(jù)共享等檔案數(shù)據(jù)處理活動。
聚焦國內(nèi),在我國數(shù)字檔案管理工作“數(shù)字化存量大量累積,電子化增量海量增長”的現(xiàn)狀之下,需理順傳統(tǒng)檔案管理技術與數(shù)據(jù)治理所需大數(shù)據(jù)技術的共存與迭代關系。一方面,檔案部門應對其所掌握的檔案數(shù)據(jù)進行國家或省級層面的集中統(tǒng)一治理,打通“數(shù)據(jù)孤島”,為檔案數(shù)據(jù)開發(fā)利用、價值挖掘奠定基礎;另一方面,主動加強與業(yè)務部門和數(shù)據(jù)管理部門的對接,融入業(yè)務前端,在數(shù)據(jù)治理中堅持“檔案視角”,嵌入檔案要求,實現(xiàn)檔案數(shù)據(jù)的全流程監(jiān)管,確保檔案數(shù)據(jù)應歸盡歸。此外,檔案部門應積極開展大數(shù)據(jù)相關技術研發(fā),實現(xiàn)數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)鑒定、數(shù)據(jù)存檔、數(shù)據(jù)服務等關鍵業(yè)務環(huán)節(jié)的自動化、高速化與針對性,在提升檔案數(shù)據(jù)管理質(zhì)量的同時提高檔案數(shù)據(jù)服務效能。
5 結(jié) 語
黨的十九屆五中全會明確提出,要加強數(shù)字社會、數(shù)字政府建設?!丁笆奈濉比珖鴻n案事業(yè)發(fā)展規(guī)劃》同樣強調(diào)了檔案治理的重要性,要求全面推進檔案治理體系建設,切實提高檔案治理能力與水平[18]。檔案數(shù)據(jù)治理是國家治理體系的重要組成部分,總結(jié)并合理借鑒英國檔案數(shù)據(jù)治理現(xiàn)有經(jīng)驗,從制度、模式、技術三方著手,提出基于我國國情的檔案數(shù)據(jù)治理發(fā)展建議,有助于規(guī)范檔案數(shù)據(jù)治理行為,構(gòu)建有效的檔案數(shù)據(jù)治理體系,提升檔案數(shù)據(jù)服務水平,推進國家治理體系與治理能力現(xiàn)代化穩(wěn)步前進。
*本文系國家社科基金一般項目“國家大數(shù)據(jù)戰(zhàn)略背景下檔案數(shù)據(jù)治理體系構(gòu)建研究”(項目編號:19BTQ097)階段性研究成果。
注釋與參考文獻
[1]金波,添志鵬.檔案數(shù)據(jù)內(nèi)涵與特征探析[J].檔案學通訊,2020(3):4-11.
[2]趙躍,石酈冰,孫寒晗.“檔案數(shù)據(jù)”一詞的使用語境與學科內(nèi)涵探析[J].檔案學研究,2021(3):24-32.
[3]金波,楊鵬.大數(shù)據(jù)時代檔案數(shù)據(jù)治理研究[J].檔案學研究,2020(4):29-37.
[4]于英香.從數(shù)據(jù)與信息關系演化看檔案數(shù)據(jù)概念的發(fā)展[J].情報雜志,2018(11):154-159.
[5]何玉顏.檔案部門參與政府大數(shù)據(jù)治理的路徑研究[J].浙江檔案, 2018(8):23-25.
[6]常大偉,潘娜.檔案數(shù)據(jù)治理能力的結(jié)構(gòu)體系與建設路徑[J].浙江檔案,2020(2):27-29.
[7]department for digital, Culture, Media & Sport. national data Strategy[EB/OL].[2023-03-21].https:// www.gov.uk/government/publications/uk-national-datastrategy/national-data-strategy.
[8]uK Parliament. The data Protection and digital Information Bill[EB/OL].[2023-03-21].extension://bfd ogplmndidlpjfhoijckpakkdjkkil/pdf/viewer.html file=https%3A% 2F%2Fpublications.parliament.uk%2Fpa%2Fbills%2Fcbill%2F58-03%2F0143%2F220143.pdf.
[9]The national Archives. Guide to archiving personal data[EB/OL].[2023-03-22].extension://bfdogplmndidl pjfhoijckpakkdjkkil/pdf/viewer.html file=https%3A%2F%2Fcdn. nationalarchives.gov.uk%2Fdocuments%2Finformationmanagement%2Fguide-to-archiving-personal-data.pdf.
[10]The national Archives.data Protection and Personal Information[EB/OL].[2023-03-22]. extension://bfdogplmndidlpjfhoijckpakkdjkkil/pdf/viewer. html file=https%3A%2F%2Fcdn.nationalarchives.gov. uk%2Fdocuments%2Finformation-management%2Fdataprotection-and-personal-information.pdf.
[11]Gov.uK.Extracting data from Archives: Best Practice Guide [EB/OL].[2023-03-22].https://www.gov.uk/ government/publications/extracting-data-from-archives-bestpractice-guide/extracting-data-from-archives-best-practice-guide.
[12]海嘯.英國數(shù)據(jù)檔案館的發(fā)展現(xiàn)狀及其借鑒[J].山東檔案,2019(6):19-22.
[13]uK data Archive. Preservation policy[EB/OL].[2023-03-23].extension://bfdogplmndidlpjfhoijckpakkdjk kil/pdf/viewer.html file=https%3A%2F%2Fdam.data-archive. ac.uk%2Fcontrolled%2Fcd062-preservationpolicy.pdf.
[14] 2021年度全國檔案主管部門和檔案館基本情況摘要(二)[EB/OL].[2023-03-23].https://www.saac.gov.cn/daj/ zhdt/202208/b9e2f459b5b1452d8ae83d7f78f51769.shtml.
[15]岳林恒.大數(shù)據(jù)時代下檔案數(shù)據(jù)治理的困境與對策探析[J].檔案天地,2023(5):18-23.
[16]徐擁軍,張臻,任瓊輝.國家大數(shù)據(jù)戰(zhàn)略背景下檔案部門與數(shù)據(jù)管理部門的職能關系[J].圖書情報工作,2019(18):5-13.
[17]濟南市民政局.發(fā)力檔案信息數(shù)字化 促進數(shù)據(jù)共享惠民生[EB/OL].[2023-03-23].http://jnmz.jinan.gov.cn/ art/2021/9/7/art_8396_4766389.html.
[18]中辦國辦印發(fā)《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》[EB/OL].[2023-03-23].https://www.saac.gov.cn/daj/yaow/202106/899650c1b1ec4c0e9ad3c2ca7310eca4.shtml.