摘 要:信息技術(shù)的發(fā)展推動了檔案工作模式的轉(zhuǎn)變。檔案數(shù)據(jù)信息呈爆發(fā)式增長,傳統(tǒng)的檔案數(shù)據(jù)信息管理模式已經(jīng)不能適應(yīng)當(dāng)前檔案管理需求。本文引用數(shù)據(jù)治理理念,從高校檔案數(shù)據(jù)信息管理的困境出發(fā),提出構(gòu)建以檔案館為主導(dǎo)的檔案數(shù)據(jù)治理制度框架,協(xié)同多主體分權(quán)限數(shù)據(jù)管理的機(jī)制,以智能提取、在線編研、知識資源共享、智慧利用檔案數(shù)據(jù)平臺的檔案數(shù)據(jù)整合資源庫等策略,最大效度發(fā)揮檔案數(shù)據(jù)資源的價(jià)值。
關(guān)鍵詞:檔案;數(shù)據(jù)治理;數(shù)據(jù)管理;檔案數(shù)據(jù)資源
基金項(xiàng)目:2023年安徽省高等學(xué)校檔案工作協(xié)會基金研究一般項(xiàng)目(2023YB007)
伴隨信息技術(shù)的發(fā)展與廣泛應(yīng)用,檔案工作的模式正在經(jīng)歷一個(gè)從接收保管紙質(zhì)檔案到接收保管電子檔案,從管理檔案實(shí)體信息到管理檔案數(shù)據(jù)信息的轉(zhuǎn)變期。檔案數(shù)據(jù)信息呈現(xiàn)爆發(fā)式增長、海量式集聚,信息量的劇增給檔案工作帶來了挑戰(zhàn)。在浩如煙海的數(shù)據(jù)信息中,如何高效高質(zhì)量地提取、利用數(shù)據(jù)信息,成為當(dāng)前檔案工作急需解決的一大難題。在信息社會,數(shù)據(jù)的核心地位和價(jià)值將日益凸顯,應(yīng)轉(zhuǎn)變當(dāng)前檔案數(shù)據(jù)管理模式,從檔案數(shù)據(jù)的提取走向數(shù)據(jù)的治理。
1 檔案數(shù)據(jù)治理的概念
2017年,國家發(fā)布《信息技術(shù)大數(shù)據(jù)術(shù)語》(GB/T35295-2017),將數(shù)據(jù)治理定義為對數(shù)據(jù)進(jìn)行處置、格式化和規(guī)范化的過程。同年,我國的數(shù)據(jù)治理模型也應(yīng)運(yùn)而生——《信息技術(shù)服務(wù)治理》(GB/T34960)。該治理模型從頂層設(shè)計(jì)、數(shù)據(jù)治理環(huán)境、數(shù)據(jù)治理域、數(shù)據(jù)治理過程四部分進(jìn)行了闡述,為組織在實(shí)現(xiàn)數(shù)據(jù)價(jià)值的過程中做到運(yùn)營合規(guī)和風(fēng)險(xiǎn)可控提供了方法和思路[1]。檔案數(shù)據(jù)治理是指檔案部門、社會組織和公眾等多元主體合作,對檔案數(shù)據(jù)生成、采集、加工、存儲、利用等整個(gè)生命周期進(jìn)行的全程管理。檔案數(shù)據(jù)治理的出現(xiàn)并非偶然,而是在信息技術(shù)發(fā)展、數(shù)據(jù)價(jià)值凸顯和檔案治理理念普及等背景下發(fā)展而來[2]。高校檔案數(shù)據(jù)治理是高校檔案部門、信息中心和其他部門等基于一定的規(guī)則,共同對檔案數(shù)據(jù)的全生命歷程(生成、管理、儲存、利用)整個(gè)周期進(jìn)行科學(xué)、規(guī)范的全程管理,促進(jìn)高校檔案事業(yè)的發(fā)展。
檔案數(shù)據(jù)治理主要是對不同生命周期的檔案數(shù)據(jù)進(jìn)行質(zhì)量管控、組織管理、開發(fā)利用等活動,需要從技術(shù)、制度等方面構(gòu)建相應(yīng)的保障體系,以提高檔案數(shù)據(jù)治理能力和水平。檔案治理內(nèi)容更加廣泛,涉及與檔案相關(guān)的一切事物[3]。檔案數(shù)據(jù)治理能力的提升,有利于更好地開發(fā)檔案數(shù)據(jù)資源,減少各部門不必要重復(fù)性的所耗費(fèi)的人力、物力和財(cái)力,提高檔案利用的效率,符合時(shí)代對檔案事業(yè)發(fā)展的需求,也契合國家治理現(xiàn)代化的整體要求。
2 高校檔案數(shù)據(jù)提取的局限
2.1 以“人工方式”分類為主的數(shù)據(jù)整理
當(dāng)前高校檔案部門對檔案數(shù)據(jù)的提取是建立在傳統(tǒng)檔案工作模式上,先對紙質(zhì)檔案進(jìn)行人工分類、整理,再進(jìn)行數(shù)字化加工和利用。這種以人工分類組織數(shù)據(jù)的方式,效率低下,忽略了數(shù)據(jù)內(nèi)容之間的關(guān)聯(lián)性?,F(xiàn)有高校使用的檔案管理軟件,一般只對檔案數(shù)據(jù)信息只能進(jìn)行簡單的羅列與基礎(chǔ)的統(tǒng)計(jì)分析,數(shù)據(jù)庫的設(shè)計(jì)依賴于檔案人員的經(jīng)驗(yàn),具有一定的不確定性和不科學(xué)性。這種傳統(tǒng)的數(shù)據(jù)管理無法滿足智能、智慧化檔案管理的要求,在一定程度上還會阻礙對海量數(shù)字化檔案數(shù)據(jù)進(jìn)行快速、準(zhǔn)確的分類、查找,也不能對檔案信息資源進(jìn)行充分有效利用,進(jìn)而產(chǎn)生了一些低價(jià)值檔案、死檔案的情況,這些問題是高校檔案管理領(lǐng)域所面臨的一項(xiàng)重大挑戰(zhàn)。
2.2 以“單一“部門為主的數(shù)據(jù)管理
大數(shù)據(jù)時(shí)代,高校檔案數(shù)據(jù)來源主要是學(xué)??蒲?、電子政務(wù)、教務(wù)、人事、學(xué)生管理等各類系統(tǒng)產(chǎn)生的信息資源。各部門按照歸檔范圍,將歸檔的文件材料主要以紙質(zhì)和電子兩種載體移交給檔案部門。檔案部門對這些“辦理完畢”的數(shù)據(jù)進(jìn)行管理。這種管理是“單一”性管理,在單一職能部門管理下的數(shù)據(jù)與檔案管理軟件、電子文件中心的匹配性不高,在一定程度上造成信息數(shù)據(jù)的丟失或者資源的浪費(fèi)。傳統(tǒng)的“單一”部門為主的數(shù)據(jù)管理模式,還容易造成數(shù)據(jù)孤島,不利于檔案信息的提供利用。
2.3 重量不重質(zhì)的數(shù)據(jù)信息的重復(fù)提取
近些年來,信息化、網(wǎng)絡(luò)化辦公的普及,使得各種應(yīng)用系統(tǒng)應(yīng)運(yùn)而生。以高校為例,各類應(yīng)用系統(tǒng)高達(dá)20個(gè),檔案數(shù)據(jù)來自于不同的管理系統(tǒng),每個(gè)系統(tǒng)數(shù)據(jù)基礎(chǔ)標(biāo)準(zhǔn)、安全技術(shù)標(biāo)準(zhǔn)、運(yùn)行平臺標(biāo)準(zhǔn)等是不一致的,獲取的歸檔數(shù)據(jù)準(zhǔn)確性和完整性不高,數(shù)據(jù)的關(guān)聯(lián)性也不強(qiáng)。為了確保電子數(shù)據(jù)信息的完整性,數(shù)據(jù)中也包括大量非結(jié)構(gòu)及半結(jié)構(gòu)數(shù)據(jù),其中有大量重復(fù)性數(shù)據(jù)和垃圾數(shù)據(jù),占據(jù)太多數(shù)據(jù)存儲空間,導(dǎo)致檔案存儲空間不足,系統(tǒng)運(yùn)行速度慢,從而影響數(shù)據(jù)資源整體的質(zhì)量性、整體性、可用性和安全性。這與2009年發(fā)布的《電子文件管理暫行辦法》(中辦、國辦廳字〔2009〕39號)所強(qiáng)調(diào)的對檔案數(shù)據(jù)的“真實(shí)性、完整性、可用性和安全性”要求不符,導(dǎo)致檔案數(shù)據(jù)利用速度緩慢,利用率不高,影響檔案工作效率。
2.4 低配置的檔案系統(tǒng)不能承載高效的檔案利用
對比國家檔案局2006年發(fā)布的8號令《機(jī)關(guān)文件材料歸檔范圍和文書檔案保管期限規(guī)定》和2011年發(fā)布的9號令《各級各類檔案館收集檔案范圍的規(guī)定》,不難發(fā)現(xiàn),國家越來越重視檔案資源體系的擴(kuò)充,要求各級各類檔案部門做到應(yīng)收盡收,檔案部門庫存量不斷攀升,尤其是電子文件和音視頻文件。以安徽師范大學(xué)檔案館為例,校檔案館每年呈遞增趨勢,與2020年相比,2021年歸檔量增加了1萬卷件。校檔案部門一般都處于“邊緣”位置,在資金投入上,與其他部門相比,不會作為優(yōu)先支持的部門。很多高校檔案管理系統(tǒng)只能提供簡單的目錄檢索和全文檢索,不能提供高配置的檔案編研和個(gè)性化的網(wǎng)上檔案查詢、展覽。尤其是面對不斷攀升的檔案數(shù)據(jù),低配置的檔案系統(tǒng)無法滿足高效精準(zhǔn)的檔案利用,導(dǎo)致很多檔案數(shù)據(jù)成為“死數(shù)據(jù)”,甚至在一定程度上延緩、阻礙檔案利用、編研等工作,反而在一定程度上增添了檔案工作人員的工作負(fù)擔(dān)。
3 檔案數(shù)據(jù)治理效力的提升策略
3.1 構(gòu)建以檔案館為主導(dǎo)的檔案數(shù)據(jù)治理制度框架
2014年,中共中央辦公廳、國務(wù)院辦公廳印發(fā)《關(guān)于加強(qiáng)和改進(jìn)新形勢下檔案工作的意見》,明確提出“要科學(xué)整合檔案信息資源。建立以檔案行政管理部門為主導(dǎo)、各行業(yè)主管部門密切配合、檔案館(室)集中統(tǒng)一管理的檔案資源管理架構(gòu)”。在大數(shù)據(jù)時(shí)代,要求數(shù)據(jù)全量儲存與檔案鑒定的有用性儲存之間的沖突如何破、非數(shù)據(jù)化的格式文件如何實(shí)現(xiàn)檔案數(shù)據(jù)治理、電子文件的法律效應(yīng)等問題,都是需要行業(yè)制度和技術(shù)規(guī)范來解決。檔案數(shù)據(jù)治理工作需加強(qiáng)前期規(guī)劃,做好頂層設(shè)計(jì)、分步實(shí)施的規(guī)劃。其中制度是數(shù)據(jù)治理工作的基礎(chǔ),科學(xué)、規(guī)范、合理的制度建設(shè)有利于保證數(shù)據(jù)治理工作順利推進(jìn)。
檔案數(shù)據(jù)治理工作是一個(gè)以制度為基礎(chǔ)的框架,它包含數(shù)據(jù)的決策權(quán)和職責(zé)的分配,還包含檔案數(shù)據(jù)要素特點(diǎn)。其他數(shù)據(jù)應(yīng)用系統(tǒng)在設(shè)計(jì)之初,需要考慮檔案本身要素特點(diǎn),不同領(lǐng)域的應(yīng)用系統(tǒng),其要素特點(diǎn)有所不同。就高校而言,包含十幾個(gè)類別的檔案分類,如文書類則需要文號、時(shí)間、單位、正文等要素,科技類則需要項(xiàng)目名稱、類別、主持人等要素,聲像類則需要時(shí)間、地點(diǎn)、人物、事由、背景、拍攝者六要素。如何將數(shù)據(jù)庫中的數(shù)據(jù)自動提取到檔案數(shù)據(jù)庫,進(jìn)行高效治理,這就需要檔案部門根據(jù)國家、地方和高校檔案特點(diǎn),考慮數(shù)據(jù)與數(shù)據(jù)之間的關(guān)聯(lián)性、連續(xù)性,融合數(shù)據(jù)對象、技術(shù)、理念、環(huán)境等要素,編制數(shù)據(jù)管理的規(guī)則、技術(shù)要求和相關(guān)制度,讓數(shù)據(jù)進(jìn)入到制度的規(guī)范中,形成一條科學(xué)有序的治理程序。
3.2 構(gòu)建以檔案館為主,協(xié)同多主體分權(quán)限數(shù)據(jù)管理的機(jī)制
檔案數(shù)據(jù)治理包括數(shù)據(jù)的產(chǎn)生與采集、分類與整理、歸類與傳輸、開發(fā)與利用、數(shù)據(jù)的清理等五個(gè)程序。在單純的檔案數(shù)據(jù)治理過程中,數(shù)據(jù)治理主體至少需具備這五個(gè)程序相應(yīng)的能力[4]。數(shù)據(jù)治理是高層次的管理,需要多部門來管理。高校應(yīng)該設(shè)立檔案數(shù)據(jù)治理小組,以檔案館為主,協(xié)同學(xué)校其他部門為輔,信息中心做好數(shù)據(jù)內(nèi)部技術(shù)把控的,分工明確的組織體系。
高校信息中心需要把控各應(yīng)用系統(tǒng)在基礎(chǔ)數(shù)據(jù)標(biāo)準(zhǔn)、安全技術(shù)標(biāo)準(zhǔn)、運(yùn)行平臺標(biāo)準(zhǔn)、安全管理標(biāo)準(zhǔn)等方面的部署和要求,保持一致性,有利于檔案部門的采集。各應(yīng)用系統(tǒng)的主管部門需要考慮檔案數(shù)據(jù)要求,完善信息的完整性,有利于檔案應(yīng)用系統(tǒng)進(jìn)行直接提取。檔案部門需要分配好各應(yīng)用系統(tǒng)的權(quán)限,檔案系統(tǒng)對各應(yīng)用系統(tǒng)中的數(shù)據(jù)進(jìn)行層層篩選、提取、儲存,在檔案利用環(huán)節(jié)以區(qū)塊鏈技術(shù)對各部門進(jìn)行訪問權(quán)限分配、數(shù)據(jù)開放管理等,方便校內(nèi)各部門利用,提高辦公效率。
3.3 構(gòu)建以智能提取的在線電子檔案數(shù)據(jù)編研體系
眾所周知,高校檔案部門目前依據(jù)的是國家教育委員會1994年實(shí)施的《高等教育檔案實(shí)體分類法》《高等學(xué)校檔案工作規(guī)范》,保證了館藏檔案的完整性、檔案內(nèi)容的系統(tǒng)性和檔案分類的統(tǒng)一性,促進(jìn)了高校檔案事業(yè)的發(fā)展。伴隨信息化時(shí)代辦公方式和載體的巨大變化,產(chǎn)生的愈來愈多的電子文件、媒體信息等,原生數(shù)據(jù)、衍生數(shù)據(jù)大量存在,如何將《電子文件歸檔與管理規(guī)范(修訂)》與《高等教育檔案實(shí)體分類法》有效結(jié)合,不在數(shù)據(jù)庫中多次重復(fù)出現(xiàn),是值得我們探討的問題。館藏檔案和電子文件的劇增,雖然豐富了檔案編研的基礎(chǔ)數(shù)據(jù),但檔案數(shù)據(jù)的不聯(lián)系、不完整,重復(fù)等情況,又給檔案編研帶來挑戰(zhàn),僅靠傳統(tǒng)的人工方式去搜索、歸類,從浩如煙海的大數(shù)據(jù)中尋找所需的信息將耗費(fèi)更多的時(shí)間和精力,大大降低檔案編研的進(jìn)度。
對檔案數(shù)據(jù)進(jìn)行治理,可以有效提升檔案編研的能力。以基礎(chǔ)數(shù)據(jù)為基礎(chǔ),通過全文搜索、人臉?biāo)阉鳌⒁詧D搜圖等,提取所需檔案關(guān)鍵信息,對搜索的檔案信息進(jìn)行在線分類,自動生成參考素材,在線電子編研檔案數(shù)據(jù),大幅度提升檔案編研進(jìn)度。同時(shí)可以滿足共性檔案與個(gè)性檔案的需求,在基礎(chǔ)檔案基礎(chǔ)上,增加個(gè)性化、專題化檔案數(shù)據(jù)庫,創(chuàng)建名師檔案、口述校史、紅色檔案、主體圖片檔案等,既豐富檔案的資源,又拓寬檔案利用的途徑和平臺,真正為學(xué)校做到?jīng)Q策參考、憑證依據(jù)、育人平臺等方面的服務(wù)功能,實(shí)現(xiàn)檔案數(shù)據(jù)治理的最終目標(biāo)。
3.4 構(gòu)建以知識資源共享的檔案數(shù)據(jù)整合資源庫
檔案數(shù)據(jù)治理的終結(jié)目標(biāo)就是實(shí)現(xiàn)檔案資源的共享利用和檔案數(shù)據(jù)的增值。高校檔案部門保管的大量科研、教學(xué)、社會服務(wù)等方面檔案數(shù)據(jù),如果不能合理重組和融合,就會變成只進(jìn)不出的“數(shù)據(jù)垃圾填埋場”。
檔案是賦能知識社會的底層數(shù)據(jù),檔案是治理知識社會的智能工具,檔案本身也可以作為治理工具[5]。把握檔案數(shù)據(jù)的保密與開放,加快檔案數(shù)字化進(jìn)程,利用人工智能技術(shù),將各類具有開放權(quán)限的檔案資源按需整合,適時(shí)對廣大師生提供開放利用,這樣不僅使檔案資源流動起來。讓廣大師生利用開放的檔案資源進(jìn)行研究和挖掘,會衍生出更多的檔案編研作品和文化產(chǎn)品,提升高校校園文化建設(shè),豐富高校文化資源。
3.5 構(gòu)建以便捷服務(wù)為主的智慧利用檔案數(shù)據(jù)平臺
近些年來,人們的檔案利用意識不斷提升,檔案利用需求越來越多,高校檔案大多為師生、校友提供學(xué)歷學(xué)位成績翻譯、畢業(yè)生成績打印、學(xué)籍檔案補(bǔ)辦、人事檔案查閱利用、研究生論文查詢、各類文件及財(cái)務(wù)憑證查詢等服務(wù)。檔案利用率居高不下,安徽師范大學(xué)檔案館基本每周接待查檔量高達(dá)110人次,查檔量居高不下,高校檔案部門人員一直緊缺,檔案利用工作占據(jù)了檔案工作人員的大部分精力。疫情環(huán)境中,檔案數(shù)據(jù)的智慧利用越來越迫切,很多檔案部門都提供遠(yuǎn)程檔案利用服務(wù)平臺,避免用檔人員無法現(xiàn)場辦理業(yè)務(wù),這種遠(yuǎn)程利用也是處于比較低端的利用,有時(shí)還需要郵政快遞作為輔助,從而延遲了檔案利用的時(shí)效,增加了檔案利用的成本。
國家檔案局原局長楊冬權(quán)針對檔案數(shù)據(jù)化的問題這樣回答:“檔案數(shù)據(jù)化就意味著我想利用檔案了,不要求我自己去查詢,而是資料能夠自動推送過來?!蓖ㄟ^數(shù)據(jù)治理技術(shù)建立智慧利用檔案數(shù)據(jù)平臺,查檔者可以通過虹膜識別技術(shù)對人臉進(jìn)行識別,在線核對查檔者身份信息,填寫檔案利用需求的關(guān)鍵信息,系統(tǒng)自動根據(jù)輸入的關(guān)鍵信息在檔案數(shù)據(jù)利用系統(tǒng)自動檢索,檔案工作人員根據(jù)檢索信息,鎖定最終信息,以PDF格式,蓋上檔案部門檔案利用專用電子簽章,在線發(fā)給檔案利用者;同時(shí)高校應(yīng)考慮檔案載體、檔案個(gè)性化內(nèi)容和用戶個(gè)性化需求的變化等因素,對檔案數(shù)據(jù)挖掘、統(tǒng)計(jì)、匯總、關(guān)聯(lián),以適應(yīng)檔案編研、數(shù)據(jù)分析等其他個(gè)性化需求的用戶,讓檔案數(shù)據(jù)流動起來,充分發(fā)揮它的利用價(jià)值,提升檔案服務(wù)的質(zhì)量。
參考文獻(xiàn)
[1][2]姚恒.大數(shù)據(jù)環(huán)境下的高校檔案數(shù)據(jù)治理路徑研究[J].辦公室業(yè)務(wù),2010(10):124.
[3]趙躍,孫寒晗.“數(shù)據(jù)”范式演進(jìn)中的檔案數(shù)據(jù)治理多維解析[J].檔案管理,2021(5):108.
[4]王樹嫻.高校檔案數(shù)據(jù)治理能力提升路徑探究[J].蘭臺內(nèi)外,2021(1):74.
[5]譚必勇,邵亞偉,李躍.譚必勇老師談檔案數(shù)據(jù)治理與電子證據(jù)——2020年“國際檔案周學(xué)者談”第五期.中國檔案研究,2021(6):10.
[6]張玉昭.新冠疫情防控背景下檔案數(shù)據(jù)治理效能提升策略研究[J].山東檔案,2021(3).
作者簡介:杜勇(1981— ),研究生學(xué)歷,安徽師范大學(xué)檔案館副研究館員,研究方向?yàn)闄n案管理。