周文泓
摘要:立足開放數(shù)據(jù)背景探索文檔管理發(fā)展旨在明確檔案領(lǐng)域數(shù)字轉(zhuǎn)型方向與策略。本文以理論構(gòu)建法基于開放數(shù)據(jù)內(nèi)涵,明確對(duì)文檔管理的主要影響點(diǎn),并通過(guò)梳理相應(yīng)的文檔管理研究與實(shí)踐明晰尚需完善之處。由此,本文提出開放數(shù)據(jù)背景下的文檔管理應(yīng)當(dāng)拓展對(duì)數(shù)據(jù)的管理、建設(shè)參與協(xié)作并行的主體機(jī)制、基于開放數(shù)據(jù)本質(zhì)優(yōu)化文檔管理模式、為適應(yīng)開放數(shù)據(jù)的文檔管理提供保障措施。
關(guān)鍵詞:開放數(shù)據(jù)文件管理檔案管理檔案利用
Abstract: Study on archives management in the background of open data aims to identify direc? tions and strategies of digital transformation of ar? chives field. The paper took the method of theory building to understand effects open data have on records management. With analysis of research and practice progress of records management for open data, some disadvantages were discovered. Thus, the paper proposed that records manage? ment adapting to open data should expand manage? ment of data, establish more participation and col? laboration mechanism, optimize records manage? ment based on essence of open data, and take measures to support records management adapt? ing to open data.
Keywords: open data; archives managements; records management; archives access
引言
當(dāng)前,開放數(shù)據(jù)已成為我國(guó)政府基于政務(wù)信息資源提升國(guó)家治理能力的關(guān)鍵行動(dòng),無(wú)論是信息資源的維護(hù)還是相應(yīng)管理工作的開展無(wú)一不與文件、檔案部門的工作密切關(guān)聯(lián)。這在檔案領(lǐng)域有了一定程度的實(shí)踐,例如英國(guó)國(guó)家檔案館在公共部門信息開放中強(qiáng)調(diào)要將數(shù)據(jù)納入,也有專門的數(shù)據(jù)庫(kù)檔案專題;美國(guó)國(guó)家檔案與文件署也將開放數(shù)據(jù)作為其開放政府計(jì)劃中的重點(diǎn)任務(wù)。
研究領(lǐng)域亦有一定成果。一方面,圍繞政府信息公開和大數(shù)據(jù)的相關(guān)研究為將文檔管理與開放數(shù)據(jù)關(guān)聯(lián)奠定了基礎(chǔ),例如倡導(dǎo)在大數(shù)據(jù)背景下文檔管理應(yīng)有的新型管理思維[1],信息公開方面的研究也為在開放政府框架下優(yōu)化檔案機(jī)構(gòu)工作提供建議[2]。另一方面,也有部分研究直指開放數(shù)據(jù)背景下的文檔管理。這類研究主要從兩大層面提出檔案領(lǐng)域應(yīng)當(dāng)充分參與開放數(shù)據(jù)的項(xiàng)目與行動(dòng):一是指出數(shù)據(jù)應(yīng)當(dāng)納入文檔管理的范疇。[3]二是提出文檔管理的理論與方法可為開放數(shù)據(jù)提供有效指導(dǎo),這既包括在開放數(shù)據(jù)過(guò)程中幫助構(gòu)建真實(shí)可靠、高價(jià)值的數(shù)據(jù)資源體系[4],也涉及檔案部門積極將檔案進(jìn)行數(shù)據(jù)挖掘以參與開放數(shù)據(jù)行動(dòng)[5]。這一部分的研究未成系統(tǒng),但也顯示了開放數(shù)據(jù)背景下探索文檔管理的必要性與空間,有待進(jìn)一步明確開放數(shù)據(jù)是什么、與文檔管理的相互關(guān)系、如何在開放數(shù)據(jù)的框架下開展文檔工作等。
因而,本文將基于開放數(shù)據(jù)的內(nèi)涵梳理開放數(shù)據(jù)與文檔管理的相互關(guān)系,應(yīng)用文獻(xiàn)調(diào)研與案例研究呈現(xiàn)開放數(shù)據(jù)框架下的文檔管理行動(dòng)進(jìn)展,最后立足當(dāng)前開放數(shù)據(jù)提出的挑戰(zhàn)來(lái)探討文檔管理發(fā)展方向。
一、開放數(shù)據(jù)對(duì)文檔管理的影響
(一)開放數(shù)據(jù)內(nèi)容概覽
開放數(shù)據(jù)是開放政府的組成,它不僅是開放政府的行動(dòng)構(gòu)件,也秉承了開放政府透明、參與、協(xié)作的理念。[6]隨著理論研究與實(shí)踐的深入,開放數(shù)據(jù)頗具規(guī)模,從概念層到行動(dòng)層都形成相對(duì)統(tǒng)一的認(rèn)識(shí)與實(shí)踐,主要體現(xiàn)為:
1.以數(shù)據(jù)為核心,即開放數(shù)據(jù)要共享和利用的是一手的原始記錄,這就將其同信息公開區(qū)分開來(lái)。從數(shù)據(jù)屬性來(lái)看,其內(nèi)容、形式、背景都與信息有一定區(qū)別,也在是否加工與解讀上與信息形成差異。
2.開放擁有雙層含義,既是屬性也是行動(dòng)。一方面是指數(shù)據(jù)要具有開放的特征,從內(nèi)容到形式保證數(shù)據(jù)能夠在合法合規(guī)框架內(nèi)得到最大的共享與利用。例如,依據(jù)開放政府工作組的提議,開放數(shù)據(jù)應(yīng)當(dāng)具備八項(xiàng)特征才能稱之為開放:完整、一手、及時(shí)、可獲取、可機(jī)讀、非歧視性、非私有、免于授權(quán)。另一方面則指開放行動(dòng),開放不僅要共享數(shù)據(jù),而且要實(shí)現(xiàn)數(shù)據(jù)的開發(fā)與利用。[7]
3.開放數(shù)據(jù)已形成相對(duì)一致的行動(dòng)框架:第一,制度建設(shè),包括國(guó)家戰(zhàn)略、行動(dòng)計(jì)劃、管理規(guī)范等從頂層設(shè)計(jì)到具體規(guī)范對(duì)開放數(shù)據(jù)予以規(guī)劃、協(xié)調(diào)和指導(dǎo)。第二,組織架構(gòu)優(yōu)化,例如設(shè)置數(shù)據(jù)管理機(jī)構(gòu)以統(tǒng)籌與落實(shí)開放數(shù)據(jù)行動(dòng)。第三,數(shù)據(jù)平臺(tái)建設(shè),以作為共享與開發(fā)數(shù)據(jù)資源的入口以及互動(dòng)交流平臺(tái)。
(二)開放數(shù)據(jù)對(duì)文檔管理的影響要點(diǎn)
開放數(shù)據(jù)由此影響著文檔管理的發(fā)展變化,這些影響點(diǎn)也成為文檔管理在開放數(shù)據(jù)背景下的探索方向。
一方面,隨著數(shù)據(jù)成為業(yè)務(wù)活動(dòng)形成與利用的重要形式的記錄,那么在全程管理框架下,同樣處于信息管理領(lǐng)域,開放數(shù)據(jù)既可能拓展文檔管理范疇并促進(jìn)其優(yōu)化發(fā)展,也可能給予弱化文檔管理的話語(yǔ)權(quán)。由此,需要考慮:(1)隨著數(shù)據(jù)成為業(yè)務(wù)活動(dòng)中重要形式的記錄,文檔管理是否需要將數(shù)據(jù)作為更重要的那部分記錄進(jìn)行管理,如何升級(jí)對(duì)檔案的認(rèn)知與界定,這些數(shù)據(jù)的形成、采集、整合、鑒定、開發(fā)、利用如何同現(xiàn)有的文檔管理的流程如捕獲、歸檔、鑒定等相融合,文檔管理如何促進(jìn)數(shù)據(jù)資源的建設(shè)以及開放,文檔管理方法是否也會(huì)受到數(shù)據(jù)管理的影響發(fā)生變化以及如何變化;(2)隨著開放數(shù)據(jù)的深入,各地紛紛成立數(shù)據(jù)或數(shù)據(jù)管理部門,機(jī)構(gòu)內(nèi)也在建立數(shù)據(jù)中心。在這種背景下,檔案機(jī)構(gòu)與數(shù)據(jù)機(jī)構(gòu)能否建立更好的協(xié)作以及競(jìng)爭(zhēng)關(guān)系,檔案機(jī)構(gòu)是否會(huì)獲得數(shù)據(jù)歸檔管理的權(quán)力,如若可以,那么和數(shù)據(jù)機(jī)構(gòu)如何協(xié)同,如若不能,檔案機(jī)構(gòu)是否面臨危機(jī)以及如何解決?例如,2016年2月 18日浙江省的《浙江省促進(jìn)大數(shù)據(jù)發(fā)展實(shí)施計(jì)劃》,其示范工程之一由檔案局牽頭,提出加強(qiáng)大數(shù)據(jù)歸檔管理,制定大數(shù)據(jù)歸檔范圍、標(biāo)準(zhǔn),建立統(tǒng)一歸檔平臺(tái),促進(jìn)大數(shù)據(jù)證據(jù)保全、長(zhǎng)期保存和再利用,這需要檔案部門探索如何升級(jí)優(yōu)化相應(yīng)的歸檔框架、機(jī)制與方法。
另一方面,檔案機(jī)構(gòu)也是需要開放數(shù)據(jù)的主體,如何開放數(shù)據(jù)也是促進(jìn)其業(yè)務(wù)工作的重要方面。那么,在開放數(shù)據(jù)背景下:(1)檔案機(jī)構(gòu)如何以數(shù)據(jù)形式提供檔案利用,是僅針對(duì)檔案資源中本身就以數(shù)據(jù)形式存在的那部分記錄還是要將檔案進(jìn)行數(shù)據(jù)化處理以提供更加豐富的數(shù)據(jù)資源;(2)檔案工作中會(huì)形成哪些數(shù)據(jù),檔案機(jī)構(gòu)的開放數(shù)據(jù)包括這些數(shù)據(jù)的共享嗎,開放數(shù)據(jù)平臺(tái)與檔案信息資源平臺(tái)是什么關(guān)系;(3)隨著要求以數(shù)據(jù)形式來(lái)開放信息資源,那么是否在檔案資源的建設(shè)中會(huì)要求在接收之前就盡量以數(shù)據(jù)形式形成?前文所提的浙江省檔案局也提出加強(qiáng)數(shù)字檔案館(室)建設(shè),推進(jìn)檔案數(shù)據(jù)聚合,構(gòu)建查閱利用檔案數(shù)據(jù)服務(wù)平臺(tái),完善檔案數(shù)據(jù)共享開放標(biāo)準(zhǔn)。
二、開放數(shù)據(jù)驅(qū)動(dòng)下的檔案研究與實(shí)踐
上述的那些問(wèn)題在檔案領(lǐng)域已有一定程度的探索,這在理論與實(shí)踐層面均有成果。
(一)理論研究進(jìn)展
理論層面已有研究提出,開放數(shù)據(jù)優(yōu)化有賴于數(shù)據(jù)資源的質(zhì)量,亦要檔案機(jī)構(gòu)作為開放主體參與開放數(shù)據(jù)行動(dòng)。在開放數(shù)據(jù)資源的構(gòu)建上,文檔管理理論與方法可以幫助從管理原則、流程、架構(gòu)、規(guī)范等方面提升數(shù)據(jù)質(zhì)量,這需要文檔管理充分參與到開放數(shù)據(jù)的全生命周期。國(guó)外學(xué)者認(rèn)為盡管開放數(shù)據(jù)的政策中更多地使用信息和數(shù)據(jù)這樣的提法,但這些信息與數(shù)據(jù)理當(dāng)納入文檔管理的框架。[8]數(shù)據(jù)應(yīng)用層面,可通過(guò)文檔控制的方法提供高質(zhì)量和可信任的數(shù)據(jù),例如基于ISO15489標(biāo)準(zhǔn)等以文檔管理的要求提供數(shù)據(jù)的位置、背景和歷史等信息來(lái)提升數(shù)據(jù)質(zhì)量。[9]再如,開放數(shù)據(jù)將促進(jìn)數(shù)據(jù)資源的增長(zhǎng),這些資源的保存與處置提出諸多管理挑戰(zhàn)如保管期限的設(shè)定,文檔的有機(jī)聯(lián)系以及可靠性、準(zhǔn)確性、真實(shí)性要求都可為數(shù)據(jù)保管期限表的制定提供借鑒:不會(huì)保存所有數(shù)據(jù);期限的設(shè)定要依賴對(duì)業(yè)務(wù)流程的分析,可推薦使用《ISO/TR 26,122:信息與記錄——文檔的工作流程分析》[10]。
同時(shí),檔案機(jī)構(gòu)成為開放數(shù)據(jù)的主體也得到倡導(dǎo),這開放政府框架下開展檔案工作的延伸[11]。研究提出,由檔案館、圖書館等公共事業(yè)單位搜集、整理和保管的信息也是重要的一部分,這些單位要積極開放數(shù)據(jù)[12]。一方面,基于開放數(shù)據(jù)、大數(shù)據(jù)、數(shù)字人文提出檔案信息資源的開發(fā)與利用的策略,數(shù)據(jù)形式的資源構(gòu)建與管理方法得到提倡。另一方面,聚焦當(dāng)前檔案機(jī)構(gòu)的開放數(shù)據(jù)實(shí)踐,從制度建立、平臺(tái)建設(shè)、數(shù)據(jù)資源構(gòu)建等方面解析美國(guó)、英國(guó)、新西蘭等國(guó)的開放數(shù)據(jù)案例,從而相應(yīng)優(yōu)化策略[13]。
總的來(lái)說(shuō),目前的理論探索有一定成果,但如何基于開放數(shù)據(jù)要求做好數(shù)據(jù)的檔案化管理有待頂層設(shè)計(jì)、組織架構(gòu)、系統(tǒng)開發(fā)、流程再造等更多方面的明確與設(shè)計(jì)。升級(jí)優(yōu)化檔案開放利用工作的研究也尚需形成相對(duì)全面系統(tǒng)的實(shí)施方案。
(二)實(shí)踐探索的成效
實(shí)踐層面,多個(gè)國(guó)家的檔案機(jī)構(gòu)都在探索開放數(shù)據(jù)的最佳實(shí)踐。以NARA為例,其聯(lián)邦公報(bào)辦公室致力于形成和公開高品質(zhì)的元數(shù)據(jù),為了最終用戶能賦予其新的用途。在和政府出版局的合作中,發(fā)行了聯(lián)邦法規(guī)的電子代碼的XML版本。在和總務(wù)管理局的合作中,聯(lián)邦注冊(cè)登記局將得到機(jī)構(gòu)組織目錄,因此他們可以創(chuàng)建和發(fā)布與美國(guó)聯(lián)邦政府一致的機(jī)讀原格式數(shù)據(jù)。
在我國(guó),北京、浙江、貴州、深圳、青島、武漢、濟(jì)南、哈爾濱、佛山、東莞都在各地的開放數(shù)據(jù)平臺(tái)上線了相關(guān)數(shù)據(jù),或是關(guān)于檔案機(jī)構(gòu)本身的數(shù)據(jù)如館藏地址、三公經(jīng)費(fèi)一類的數(shù)據(jù)集,或是以數(shù)據(jù)形式共享一些檔案資源如館藏目錄,涵蓋公共服務(wù)、機(jī)構(gòu)團(tuán)體、教育科技、社保就業(yè)、企業(yè)登記監(jiān)管、社會(huì)發(fā)展、資質(zhì)認(rèn)定等主題。
然而,當(dāng)前各檔案機(jī)構(gòu)的開放數(shù)據(jù)并不成熟。一方面,開放數(shù)據(jù)行動(dòng)并不全面:(1)制度建設(shè)不完善,未形成立足文檔管理的開放數(shù)據(jù)的頂層設(shè)計(jì)、行動(dòng)規(guī)劃、具體方案、規(guī)范指南等。(2)檔案館藏中數(shù)據(jù)形式的記錄沒(méi)有全面的共享,這很大程度上受限于數(shù)字化工作,11個(gè)地方只開放了75個(gè)數(shù)據(jù)集。例如,北京市檔案局在目前北京市整體的開放數(shù)據(jù)中只提供了關(guān)于北京市國(guó)家綜合檔案館的數(shù)據(jù)集,這并沒(méi)有做到以開放數(shù)據(jù)的形式共享檔案信息資源。(3)開放數(shù)據(jù)沒(méi)有在檔案平臺(tái)建設(shè)中凸顯,未提供方便的入口獲取開放數(shù)據(jù)。另一方面,開放數(shù)據(jù)的成效有限,體現(xiàn)為沒(méi)有得到用戶足夠的關(guān)注和利用。例如,11個(gè)地方的75個(gè)數(shù)據(jù)集截止2018年4月15日只有2052次的下載量。
三、開放數(shù)據(jù)背景下文檔管理的適應(yīng)性策略
目前,文檔管理與開放數(shù)據(jù)的結(jié)合較為有限,從上述的分析與總結(jié)來(lái)看,還需在如下方面深入探索以更好適應(yīng)開放數(shù)據(jù)這一大趨勢(shì):
第一,拓展對(duì)數(shù)據(jù)的管理。開放數(shù)據(jù)呈現(xiàn)的是數(shù)據(jù)在社會(huì)發(fā)展過(guò)程中發(fā)揮著越來(lái)越大的作用,在互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等技術(shù)推動(dòng)下持續(xù)增長(zhǎng)的數(shù)據(jù)正從數(shù)量和價(jià)值上成為越來(lái)越重要的記錄,數(shù)據(jù)亟待可信管理。這意味著文檔管理需要將數(shù)據(jù)作為重要對(duì)象,一方面,拓展對(duì)數(shù)據(jù)的檔案化管理范圍,從業(yè)務(wù)價(jià)值以及未來(lái)的研究?jī)r(jià)值等多方面考察當(dāng)前數(shù)據(jù)資源從背景、形式與內(nèi)容,擴(kuò)大對(duì)數(shù)據(jù)的歸檔管理范圍。另一方面,在全程管理框架下及時(shí)參與數(shù)據(jù)管理,將文檔管理的要求嵌入于數(shù)據(jù)的形成、采集、處理、整合等全流程中。
第二,建設(shè)參與協(xié)作并行的主體機(jī)制。隨著數(shù)據(jù)科學(xué)逐漸成為一門學(xué)科,實(shí)踐中數(shù)據(jù)機(jī)構(gòu)與部門紛紛設(shè)立,文檔管理如何同數(shù)據(jù)管理形成良好的協(xié)作與競(jìng)爭(zhēng)關(guān)系需要多方面的探索,開放數(shù)據(jù)是重要方向。文檔管理在開放數(shù)據(jù)中應(yīng)當(dāng)明晰同數(shù)據(jù)管理的界限,明確理論與方法上的交集以及差異,從而在實(shí)踐中明晰二者在組織架構(gòu)中的權(quán)責(zé)與相互關(guān)系。例如,數(shù)據(jù)部門可主要支持現(xiàn)行數(shù)據(jù)的采集和挖掘,檔案部門可提供價(jià)值判定標(biāo)準(zhǔn)、方法以及保管方面的支持以積極參與開放數(shù)據(jù)資源的建設(shè)工作,甚至可在數(shù)據(jù)質(zhì)量的管控上起一定的主要作用。此外,在信息資源平臺(tái)建設(shè)上,開放數(shù)據(jù)平臺(tái)與檔案信息資源平臺(tái)可相互補(bǔ)充。
第三,基于開放數(shù)據(jù)本質(zhì)優(yōu)化文檔管理模式。開放數(shù)據(jù)是共享與利用的統(tǒng)一,它以多元特征的數(shù)據(jù)資源為基礎(chǔ)。對(duì)文檔管理而言,不僅是通過(guò)參與數(shù)據(jù)治理來(lái)促進(jìn)開放數(shù)據(jù)工作,亦可通過(guò)開放數(shù)據(jù)在管理、技術(shù)、文化等方面的要求來(lái)實(shí)現(xiàn)文檔管理的優(yōu)化升級(jí)。例如,以完整、一手、及時(shí)、可獲取、可機(jī)讀、非歧視性、非私有、免于授權(quán)為要求的開放數(shù)據(jù)將促進(jìn)文檔管理在保障數(shù)據(jù)真實(shí)性、完整性、安全性、有用性上進(jìn)行更多研究,以利用為目的的開放數(shù)據(jù)是促進(jìn)文檔管理如何在更加開放的框架下進(jìn)行流程再造,及時(shí)參與數(shù)據(jù)的檔案化管理更是為檔案資源建設(shè)提供了數(shù)據(jù)化的基礎(chǔ)以促進(jìn)資源的豐富化和深度的價(jià)值挖掘。
第四,為適應(yīng)于開放數(shù)據(jù)的文檔管理提供保障措施。從我國(guó)國(guó)家層面的戰(zhàn)略來(lái)看,開放數(shù)據(jù)已在局館長(zhǎng)會(huì)議等報(bào)告中得到倡導(dǎo),成為國(guó)家檔案局科技項(xiàng)目2018選題之一。從制度層面來(lái)看,在這樣的趨勢(shì)下,除戰(zhàn)略引導(dǎo),還需從政策到規(guī)范指南的保駕護(hù)航,從而可幫助檔案工作人員明確文檔管理在開放數(shù)據(jù)背景下文檔管理工作需要調(diào)整之處,更能明晰如何在實(shí)際工作中如何參與開放數(shù)據(jù)工作。例如,數(shù)據(jù)歸檔指南的制定或是檔案機(jī)構(gòu)開放數(shù)據(jù)目錄清單的確認(rèn)都是需要落實(shí)于制度中。同時(shí),技術(shù)層面的保障亦是必要,這需要從平臺(tái)建設(shè)、系統(tǒng)開發(fā)、輔助工具設(shè)計(jì)上基于已有的文檔管理系統(tǒng)針對(duì)開放數(shù)據(jù)的要求進(jìn)行一定調(diào)整與優(yōu)化。
1本文在全程管理理念之下將文件、檔案進(jìn)行整體論述,為方便表述,統(tǒng)稱文檔.
參考文獻(xiàn):
[1]宋淑琴.大數(shù)據(jù)視野下檔案管理思維方式的轉(zhuǎn)變[J].檔案學(xué)研究,2015(3):36-39.
[2]張斌,黃建軍.政府信息公開背景下公共檔案館建設(shè)芻議[J].檔案學(xué)研究2010(6):36-39.
[3] Erik Borglund;Tove Engvall,“Open data?: Data, information, document or record?”,Records Management Journal,24(2),2014,163 -180.
[4] Lluís Esteve Casellas Serra, "The mapping, selecting and opening of data: The records management contri- bution to the Open Data project in Girona City Council", Records Management Journal, Vol. 24(2),2014,87-98.
[5] [13]李孟秋.開放數(shù)據(jù)環(huán)境下英國(guó)、美國(guó)、新西蘭數(shù)字檔案資源再利用的特點(diǎn)及其啟示[J]. 2017(8): 36-38.
[6]駱毅,王國(guó)華.“開放政府”理論與實(shí)踐對(duì)中國(guó)的啟示——基于社會(huì)協(xié)同治理機(jī)制創(chuàng)新的研究視角[J].江漢學(xué)術(shù),2016(2):113-122.
[7] [8]艾伯特J.梅杰(李倩譯).開放政府:連接“知情”與“建言”[J].國(guó)際行政科學(xué)評(píng)論,2012(3)10-27.
[9]Victoria Louise;Lemieux Brianna;Gormly Lyse Rowledge,“Meeting Big Data challenges with visual analytics”,Records Management Journal,24(2),2014,122–141.
[10] John McDonald;Valerie Léveillé,“Whither the retention schedule in the era of big data and open data?”,Records Management Journal,24(2),2014,99–121.
[11]喻玲.開放政府背景下的檔案開放[J].檔案與建設(shè),2016(5):12-16.
[12]鄭磊.開放政府?dāng)?shù)據(jù)研究:概念辨析、關(guān)鍵因素及其互動(dòng)關(guān)系[J].中國(guó)行政管理,2015(11):13-18.
作者單位:四川大學(xué)公共管理學(xué)院