楊冬梅,郭曉翠
?
數(shù)字化轉(zhuǎn)型背景下圖書(shū)館檔案管理的問(wèn)題與對(duì)策
楊冬梅1,郭曉翠2
(1.西安電子科技大學(xué) 網(wǎng)絡(luò)與繼續(xù)教育學(xué)院,陜西 西安 710071;2.中國(guó)農(nóng)業(yè)銀行審計(jì)局 西安分局,陜西 西安 710004)
檔案的數(shù)字化提高了檔案收集、保存、管理與應(yīng)用的效率。本文分析了檔案數(shù)字化工作中的主要工作內(nèi)容以及數(shù)字化檔案管理的主要流程,針對(duì)其中的財(cái)務(wù)檔案報(bào)表數(shù)據(jù)結(jié)構(gòu)化問(wèn)題和不同業(yè)務(wù)信息系統(tǒng)原生檔案的自動(dòng)歸檔問(wèn)題,從檔案管理者方面進(jìn)行分析,并給出了對(duì)應(yīng)的要求與解決對(duì)策,為檔案數(shù)字化工作提供了借鑒與參考。
數(shù)字化檔案;數(shù)據(jù)結(jié)構(gòu)化;自動(dòng)歸檔
隨著信息技術(shù)與網(wǎng)絡(luò)大數(shù)據(jù)應(yīng)用的發(fā)展與普及,檔案作為人們?cè)诟黜?xiàng)社會(huì)活動(dòng)中直接形成的具有保存價(jià)值的原始數(shù)據(jù),檔案數(shù)字化以及數(shù)字化檔案收集、保存、管理與應(yīng)用越來(lái)越受到重視,檔案數(shù)字化工作以建設(shè)檔案共性數(shù)據(jù)庫(kù)為核心,開(kāi)發(fā)符合功能要求的綜合檔案管理系統(tǒng),制定一系列標(biāo)準(zhǔn)規(guī)范,使各級(jí)檔案館成為檔案信息資源的來(lái)源和基礎(chǔ),最終實(shí)現(xiàn)對(duì)數(shù)字檔案信息資源的網(wǎng)絡(luò)化管理以及分層次多渠道提供檔案信息資源利用和共享服務(wù)[1]。
檔案數(shù)字化及其管理系統(tǒng)建設(shè)的目標(biāo)包括實(shí)現(xiàn)檔案數(shù)據(jù)快速采集、實(shí)現(xiàn)海量數(shù)據(jù)的存儲(chǔ)、實(shí)現(xiàn)檔案信息的系統(tǒng)管理、實(shí)現(xiàn)檔案信息的共享和實(shí)現(xiàn)數(shù)字檔案信息的安全保護(hù)[2]。
根據(jù)不同單位自身特點(diǎn)和數(shù)字化檔案建設(shè)要求,檔案數(shù)字化與管理系統(tǒng)建設(shè)的工作內(nèi)容包括六個(gè)方面,即:基礎(chǔ)設(shè)施建設(shè)、檔案資源數(shù)字化、綜合管理應(yīng)用系統(tǒng)開(kāi)發(fā)、檔案規(guī)范標(biāo)準(zhǔn)建設(shè)、人才隊(duì)伍建設(shè)以及檔案的安全保障體系建設(shè),如圖一所示。在這些工作中,管理系統(tǒng)的建設(shè)是檔案信息化的工作抓手,也是各項(xiàng)工作的紐帶[3-4]。
數(shù)字檔案館的基礎(chǔ)設(shè)施建設(shè)包含系統(tǒng)軟件的建設(shè)、硬件設(shè)施的建設(shè)還有網(wǎng)絡(luò)環(huán)境的建設(shè)。其中,硬件設(shè)施包括服務(wù)器、終端、存儲(chǔ)還有數(shù)字化的設(shè)備。系統(tǒng)軟件包括操作系統(tǒng)和數(shù)據(jù)庫(kù)系統(tǒng)。
建設(shè)數(shù)字檔案館的核心工作是信息資源庫(kù)的建設(shè)。依據(jù)統(tǒng)一標(biāo)準(zhǔn)優(yōu)先創(chuàng)建館藏檔案的文件級(jí)目錄的數(shù)據(jù)庫(kù),逐漸再對(duì)以傳統(tǒng)為基礎(chǔ)的檔案做數(shù)字化加工,以實(shí)現(xiàn)不同的信息平臺(tái)所產(chǎn)生的文件的管理與接收,建立多個(gè)種類數(shù)字化的檔案資源庫(kù)。
各單位根據(jù)檔案管理業(yè)務(wù)流程開(kāi)發(fā)和應(yīng)用具有“收、管、存、用”等基本功能的檔案管理系統(tǒng),在管理平臺(tái)未統(tǒng)一的前提下,管理系統(tǒng)應(yīng)包含數(shù)字檔案資源采集模塊、數(shù)字檔案資源庫(kù)管理模塊、數(shù)字檔案資源共享利用模塊三個(gè)子系統(tǒng)的建設(shè)。
數(shù)字化檔案管理系統(tǒng)的主要業(yè)務(wù)流程包括現(xiàn)行的文件管理、預(yù)立案卷的管理、檔案的管理和借閱的管理四個(gè)部分。現(xiàn)行文件管理主要完成檔案原始材料的收集、提交與組織,為預(yù)立案卷準(zhǔn)備文件,包括文件編輯、原文編輯、文件分揀、文件所有者權(quán)限以及打印管理等主功能。預(yù)立案卷管理對(duì)現(xiàn)行文件進(jìn)行自動(dòng)或者手動(dòng)組卷,生成預(yù)立案卷,主要完成現(xiàn)行文件組卷、案卷編輯、案卷文件等主要功能。檔案管理實(shí)現(xiàn)檔案庫(kù)的管理功能,主要完成案卷管理、文件編輯、移交申請(qǐng)審批、銷毀申請(qǐng)審批、檔案刪除與還原、檔案更改等主功能。借閱管理實(shí)現(xiàn)檔案的在線查詢與借閱過(guò)程的控制,主要完成檔案借閱申請(qǐng)、借閱審批、借閱發(fā)放、歸還、借閱方式維護(hù)等主功能[5]。
圖1:檔案數(shù)字化與數(shù)字化檔案管理系統(tǒng)建設(shè)工作的內(nèi)容
根據(jù)國(guó)家標(biāo)準(zhǔn)和通用規(guī)范,制定和完善一系列的標(biāo)準(zhǔn)規(guī)范,規(guī)范數(shù)字檔案建設(shè)內(nèi)容,形成完善的標(biāo)準(zhǔn)規(guī)范體系。標(biāo)準(zhǔn)規(guī)范按照內(nèi)容的劃分分為三類,即技術(shù)性、業(yè)務(wù)性以及管理性標(biāo)準(zhǔn)規(guī)范。
安全保障體系的建設(shè)是數(shù)字檔案建設(shè)的基礎(chǔ)性工作,數(shù)字檔案的安全包括數(shù)字檔案數(shù)據(jù)和信息系統(tǒng)安全以及網(wǎng)絡(luò)平臺(tái)的安全。運(yùn)用可靠的技術(shù)措施和完善的管理制度,建立數(shù)字檔案館安全運(yùn)行保障體系,保證數(shù)字檔案信息的可靠可用、不泄密、不被非法篡改,保持系統(tǒng)軟硬件的穩(wěn)定性、可靠性、可控性[6-7]。
財(cái)務(wù)報(bào)表是財(cái)務(wù)檔案中的主要內(nèi)容,一般數(shù)字化方法為利用掃描識(shí)別軟件工具將財(cái)務(wù)報(bào)表檔案掃描,然后再識(shí)別表頭中的文字和表中的數(shù)字,而表頭與數(shù)字之間的結(jié)構(gòu)關(guān)系就丟失了,由此致使對(duì)財(cái)務(wù)報(bào)表的數(shù)據(jù)進(jìn)行結(jié)構(gòu)化的查詢、統(tǒng)計(jì)時(shí),無(wú)法進(jìn)行或者無(wú)法得到準(zhǔn)確的查詢結(jié)果和統(tǒng)計(jì)結(jié)果。
為使數(shù)字化后財(cái)務(wù)檔案報(bào)表數(shù)據(jù)可以進(jìn)行準(zhǔn)確的查詢與統(tǒng)計(jì),需對(duì)分散的報(bào)表數(shù)據(jù)進(jìn)行結(jié)構(gòu)化還原,即還原出報(bào)表數(shù)據(jù)中原始的對(duì)應(yīng)關(guān)系[8]。目前大多采用人工后期校對(duì)加工的方法進(jìn)行處理,這種方法效率低,也由于人的因素難免產(chǎn)生新的差錯(cuò),為了避免這類因素的影響,多采用雙層圖文結(jié)構(gòu)彌補(bǔ)此方法的缺陷。所謂的雙層圖文結(jié)構(gòu),即在識(shí)別數(shù)據(jù)的上層再覆蓋一層原始掃描圖片,這樣在查看瀏覽時(shí)可以看到原始財(cái)務(wù)報(bào)表。但是該方法仍然解決不了結(jié)構(gòu)化查詢與精確統(tǒng)計(jì)的問(wèn)題。為了解決財(cái)務(wù)檔案報(bào)表數(shù)據(jù)結(jié)構(gòu)化問(wèn)題,通過(guò)對(duì)掃描識(shí)別系統(tǒng)的原理分析,建議采用財(cái)務(wù)報(bào)表數(shù)據(jù)詞典與報(bào)表數(shù)據(jù)幾何位置自動(dòng)匹配的方法,恢復(fù)財(cái)務(wù)報(bào)表數(shù)據(jù)結(jié)構(gòu)化信息。該方法首先根據(jù)財(cái)務(wù)報(bào)表數(shù)據(jù)在掃描圖片中的位置信息,判斷數(shù)據(jù)之間關(guān)系,再對(duì)文本進(jìn)行語(yǔ)義分析,得出報(bào)表的表頭文本,最后將報(bào)表數(shù)據(jù)歸類到位置一致的表頭下,從而完成報(bào)表數(shù)據(jù)的結(jié)構(gòu)化[9-10]。
財(cái)務(wù)檔案報(bào)表數(shù)據(jù)結(jié)構(gòu)化處理基本流程包括紙質(zhì)檔案的掃描、掃描圖片的校正、文本與數(shù)據(jù)識(shí)別、結(jié)構(gòu)化信息計(jì)算等,最后輸出為結(jié)構(gòu)化的報(bào)表數(shù)據(jù)。
隨著單位各類業(yè)務(wù)信息系統(tǒng)的應(yīng)用,這些信息系統(tǒng)產(chǎn)生大量的數(shù)字化檔案,這類檔案在生成之初即是數(shù)字化的,所以成為原生數(shù)字化檔案,通過(guò)檔案管理系統(tǒng)與業(yè)務(wù)信息系統(tǒng)之間的接口可以實(shí)現(xiàn)原生數(shù)字化檔案的自動(dòng)歸檔。目前此類接口主要有以下三種方式,即:
(一)通過(guò)應(yīng)用服務(wù)程序?qū)崿F(xiàn)接口,這種方法又分為推送和讀取兩種方式;
(二)數(shù)字化檔案管理系統(tǒng)直接讀取業(yè)務(wù)系統(tǒng)的數(shù)據(jù)庫(kù),或者讀取中間交換文件實(shí)現(xiàn);
(三)通過(guò)數(shù)據(jù)庫(kù)管理系統(tǒng)的功能實(shí)現(xiàn)數(shù)據(jù)庫(kù)之間數(shù)據(jù)的直接交換,這種方法又分為存儲(chǔ)過(guò)程和觸發(fā)器兩種方式。
第一種方法的優(yōu)點(diǎn)是數(shù)據(jù)安全性高,缺點(diǎn)是對(duì)原有系統(tǒng)要進(jìn)行接口設(shè)計(jì)與開(kāi)發(fā),增加原有系統(tǒng)的工作量。第二種方法的優(yōu)點(diǎn)是可由一方完成,比如檔案管理系統(tǒng)的開(kāi)發(fā)方可以完成與其他各個(gè)信息系統(tǒng)的接口設(shè)計(jì),缺點(diǎn)是需要對(duì)要接入的信息系統(tǒng)充分分析,要進(jìn)行數(shù)據(jù)的安全性測(cè)試,以提高數(shù)據(jù)的安全性。第三種方法的優(yōu)點(diǎn)是效率高,可實(shí)現(xiàn)檔案文件的自動(dòng)生成,缺點(diǎn)是對(duì)原有信息系統(tǒng)的數(shù)據(jù)庫(kù)有一定影響,需要利用空閑時(shí)間運(yùn)行。
具體采用哪一種方式自動(dòng)將原生數(shù)字化檔案歸檔,需要根據(jù)不同業(yè)務(wù)信息化系統(tǒng)特點(diǎn)具體分析,如果某一單位信息化建設(shè)水平較高,對(duì)不同信息化系統(tǒng)掌握充分,建議采用第二種或者第三種接口方式,實(shí)現(xiàn)檔案管理系統(tǒng)與其他信息系統(tǒng)的接口。如果數(shù)字化檔案管理系統(tǒng)已經(jīng)建成,而某些業(yè)務(wù)信息化系統(tǒng)還未建成,即可按照第一種方式,要求后建的業(yè)務(wù)系統(tǒng)提供與檔案管理系統(tǒng)之間的應(yīng)用服務(wù)接口。表一所示為某單位業(yè)務(wù)信息系統(tǒng)原生檔案的自動(dòng)歸檔方式。
表1:不同業(yè)務(wù)信息系統(tǒng)原生檔案的歸檔方式
檔案的數(shù)字化工作設(shè)計(jì)各個(gè)業(yè)務(wù)部門的工作,開(kāi)展此項(xiàng)工作之前不僅要從應(yīng)用技術(shù)方面,而且更要重視從管理模式與流程方面進(jìn)行完善的設(shè)計(jì)。本文僅僅分析了檔案數(shù)字化工作中的主要工作內(nèi)容以及數(shù)字化檔案管理的主要流程,針對(duì)其中的財(cái)務(wù)檔案報(bào)表數(shù)據(jù)結(jié)構(gòu)化問(wèn)題和不同業(yè)務(wù)信息系統(tǒng)原生檔案的自動(dòng)歸檔問(wèn)題,從檔案管理者方面進(jìn)行分析,并給出了對(duì)應(yīng)的要求與解決對(duì)策,僅供檔案數(shù)字化工作參考。
[1] 葉文玲.高校檔案數(shù)字化管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].蘭臺(tái)世界,2018(7):45-47.
[2] 梁惠卿.檔案數(shù)字化、數(shù)字化檔案和數(shù)字檔案概念辨析[J].檔案管理,2013(1):38-40.
[3] 呂和順.信息化發(fā)展給檔案工作帶來(lái)的挑戰(zhàn)與機(jī)遇——在國(guó)際檔案理事會(huì)東亞地區(qū)分會(huì)2014年研討會(huì)上的報(bào)告[J].北京檔案,2015(1):5-7.
[4] 史建俠.對(duì)檔案數(shù)字化管理工作的幾點(diǎn)認(rèn)識(shí)[J].黑龍江檔案,2014(3):165-166.
[5] 梁兵.淺析檔案數(shù)字化與數(shù)字化檔案[J].貴州檔案,2003(4):23-24.
[6] 蘇桃.高校數(shù)字化檔案系統(tǒng)安全性的思考[J].才智,2016(11):241-242.
[7] 周亞萍.高校數(shù)字化檔案系統(tǒng)安全性問(wèn)題探討[J].科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2011(15):145-146.
[8] 李霄霄.基于OCR的字符識(shí)別的研究與實(shí)現(xiàn)[J].科技視界,2017(14):98,119.
[9] 李道奇.OCR字符處理軟件在文檔處理中的應(yīng)用[J].交通與計(jì)算機(jī),1997(3):33-34.
[10] 秦旭光,徐愛(ài)功.圖像幾何校正在OCR文字識(shí)別中的應(yīng)用[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào),2006(S2):64-66.
The Key problems and countermeasures of archives digitalization and management under the background of digital transformation
YANG DONGMEI1, GUO XIAOCUI2
The digitization of archives improves the efficiency of collection, preservation, management and application of archives. This paper analyzes the main work content of the digitalization of archives and the main process of digital archive management. Aiming at the problems of data structure of financial archives and automatic archiving of original archives in different business information systems, the paper analyzes the problems from the archives manager's point of view, and gives the corresponding requirements and solutions, which provides reference for the digitalization of archives.
Digitalize archive; Data structuring; Auto-archivin
G278.6
A
1008-472X(2018)04-0024-04
2018-09-15
楊冬梅(1964-),女,河南開(kāi)封人,西安電子科技大學(xué)網(wǎng)絡(luò)與繼續(xù)教育學(xué)院工程師,研究方向:數(shù)字化檔案管理;
郭曉翠(1979),女,北京人,中國(guó)農(nóng)業(yè)銀行審計(jì)局,研究方向:金融審計(jì)。
本文推薦專家:
張喜民,陜西國(guó)際商貿(mào)學(xué)院,教授,研究方向:系統(tǒng)工程。
孫改玲,兵器工業(yè)第二零三研究所,高級(jí)工程師,研究方向:數(shù)字檔案館建設(shè)。