方草地
摘要:隨著我國檔案事業(yè)的飛速發(fā)展,紙質(zhì)檔案難以滿足日常利用和保管需求。而檔案結(jié)合現(xiàn)代化技術(shù)進(jìn)行數(shù)字化處理后,能進(jìn)行異地查看、異地保管等,也更有利于檔案的保護(hù)和利用。本文對紙質(zhì)檔案數(shù)字化流程和要求進(jìn)行了簡單的介紹,希望對檔案工作者有所啟發(fā)幫助。
關(guān)鍵詞:檔案;檔案數(shù)字化;數(shù)字化流程
1組織與管理的確定
在《紙質(zhì)檔案數(shù)字化規(guī)范》DAT 31-2017中,明確提出一、應(yīng)建立紙質(zhì)檔案數(shù)字化工作組織,對數(shù)字化工作進(jìn)行統(tǒng)籌規(guī)劃、組織實施、協(xié)調(diào)管理、安全保障、技術(shù)保障、監(jiān)督檢查、成果驗收等,確保數(shù)字化工作的順利開展。二、應(yīng)配備具有相應(yīng)能力的工作人員,包括熟悉檔案業(yè)務(wù)并具有較高的調(diào)查研究水平和良好的組織領(lǐng)導(dǎo)能力的管理人員。三、基礎(chǔ)設(shè)施(一)配備專用加工場地,并進(jìn)行合理布局,形成檔案存放、數(shù)字化前處理、檔案著錄、檔案掃描、圖像處理、質(zhì)量檢查等工作區(qū)域。(二)、加工場地的選擇及溫濕度等環(huán)境的控制有利于檔案實體的保護(hù)。場地內(nèi)應(yīng)配備可覆蓋全部場地的防火、防水、防有害生物、防盜報警、視頻監(jiān)控等安全管理的設(shè)施設(shè)備。(三)合理規(guī)劃、配備和管理紙質(zhì)檔案數(shù)字化設(shè)施設(shè)備,確保設(shè)施設(shè)備安全、先進(jìn),能夠滿足數(shù)字化工作的需要。四、工作方案(一)在充分調(diào)研的基礎(chǔ)上,制定科學(xué)合理的工作方案,確保紙質(zhì)檔案數(shù)字化工作達(dá)到預(yù)期目標(biāo)。(二)紙質(zhì)檔案數(shù)字化工作方案應(yīng)包括數(shù)字化對象、工作目標(biāo)、工作內(nèi)容、成本核算、數(shù)字化技術(shù)方法和主要技術(shù)指標(biāo)、驗收依據(jù)、人員安排、責(zé)任分工、進(jìn)度安排、安全管理措施等內(nèi)容。數(shù)字化對象的確定應(yīng)綜合考慮檔案的珍貴程度、開放程度、利用率、亟待搶救程度、數(shù)字化資金情況等因素。
只有做好前期工作的組織與管理,配備相應(yīng)的人員和設(shè)施設(shè)備,制定符合要求的辦法,才能對工作流程進(jìn)行控制,才能對數(shù)字化質(zhì)量進(jìn)行把關(guān)。組織與管理的確定,人員設(shè)備和場地的選擇,直接關(guān)系到檔案數(shù)字化工作的全過程,相關(guān)人員需要提高認(rèn)識,編制對應(yīng)的工作規(guī)劃和方案,才能滿足數(shù)字化工作的要求。
2數(shù)字化前處理
在進(jìn)行數(shù)字化前,還要做相應(yīng)的數(shù)字化處理工作,以便于數(shù)字化工作的開展。其中有:確定掃描頁、編制頁號、目錄數(shù)據(jù)準(zhǔn)備、拆除裝訂、技術(shù)修復(fù)等內(nèi)容,另外還需注意每一步工作都需要嚴(yán)格按照工作要求、崗位制度要求來進(jìn)行。員工崗前需要進(jìn)行專業(yè)培訓(xùn)和保密培訓(xùn),并且需要簽訂保密協(xié)議等,入場工作人員不能攜帶手機(jī)、硬盤、相機(jī)等,禁止私自拷貝、上傳工作圖片。
3目錄數(shù)據(jù)庫建立
目錄數(shù)據(jù)庫的建立主要有:目錄數(shù)據(jù)庫數(shù)據(jù)規(guī)則、數(shù)據(jù)庫選擇、數(shù)據(jù)庫結(jié)構(gòu)的設(shè)計、錄入數(shù)據(jù)庫。內(nèi)容重點為數(shù)據(jù)庫的選擇上數(shù)據(jù)字段長度、字段類型、字段內(nèi)容要求等,在紙質(zhì)檔案目錄準(zhǔn)備與目錄數(shù)據(jù)庫建立工作中均應(yīng)嚴(yán)格遵守,避免后續(xù)掛接對應(yīng)不上。數(shù)據(jù)庫除特殊要求以外也應(yīng)考慮轉(zhuǎn)換為通用數(shù)據(jù)格式,以便于數(shù)據(jù)交換和利用。在結(jié)構(gòu)上還要注意保持檔案的內(nèi)在聯(lián)系,有利于管理和利用。
4檔案的掃描
4.1掃描設(shè)備
檔案掃描應(yīng)根據(jù)紙質(zhì)檔案原件實際情況、數(shù)字化目的、數(shù)字化規(guī)模、計算機(jī)網(wǎng)絡(luò)和存儲條件等選擇相應(yīng)的掃描設(shè)備,在設(shè)備的選擇上要注意對檔案實體的保護(hù),盡量采用對檔案實體破壞性小的掃描設(shè)備進(jìn)行數(shù)字化。對于超出所使用掃描儀掃描尺寸的檔案可采用更大幅面掃描儀進(jìn)行掃描(如工程圖紙),也可以采用小幅面掃描儀分幅掃描后進(jìn)行圖像拼接的方式處理,如果采用拼接方式處理的,需要留有足夠的重疊區(qū)域,采用軟件拼接的,重疊部分不應(yīng)小于三分之一。
4.2色彩模式
為最大限度保留檔案原件信息,便于多種方式的利用,宜全部采用彩色模式進(jìn)行掃描。如果頁面為黑白兩色,并且字跡清晰、不帶插圖的檔案,也可采用黑白二值模式進(jìn)行掃描。如果頁面為黑白兩色,但字跡清晰度差或帶有插圖的檔案,也可采用灰度模式掃描。
4.3掃描分辨率
綜合考慮數(shù)字圖像后期利用方式等因素的前提下選擇掃描的分辨率,通常要求掃描分辨率不小于200dpi;一般的屏幕閱讀,采用黑白二值、灰度、彩色幾種模式對資料進(jìn)行掃描時,其分辨率選擇300dpi;需要進(jìn)行OCR漢字識別的資料,選擇分辨率為300dpi;特殊情況下,如文字偏小、過于密集、清晰度較差等,可適當(dāng)提高分辨率。
4.4存儲格式
紙質(zhì)檔案數(shù)字圖像長期保存格式為TIFF、JPEG或JPEG2000等通用格式,也可從網(wǎng)絡(luò)瀏覽速度、易操作性、存儲空間占用等方面進(jìn)行綜合考慮,將圖像轉(zhuǎn)換為PDF或雙層PDF等其他格式。需要注意的是,采用OCR識別的需要存儲為雙層PDF,同一批檔案應(yīng)采用相同的存儲格式。
4.5圖像的命名和處理
圖像命名方式的選擇應(yīng)確保圖像命名的唯一性,應(yīng)以檔號為基礎(chǔ)進(jìn)行命名,另外還需考慮是單頁存儲或者是多頁存儲,選擇對應(yīng)的方式命名。
圖像在處理時,要考慮圖像的實際情況,選擇圖像拼接、旋轉(zhuǎn)及糾偏、裁邊、去污等操作工序進(jìn)行處理,以保證圖像的質(zhì)量。并且,處理完的圖像應(yīng)進(jìn)行質(zhì)量檢查,發(fā)現(xiàn)不符合質(zhì)量要求的,要及時重掃并重新處理檢查。
5數(shù)據(jù)掛接與驗收移交
在完成掃描工作后應(yīng)借助相關(guān)軟件對數(shù)據(jù)庫中的目錄數(shù)據(jù)與其對應(yīng)的紙質(zhì)檔案數(shù)字圖像進(jìn)行掛接,以實現(xiàn)目錄數(shù)據(jù)與數(shù)字圖像的關(guān)聯(lián)。掛接完成后,應(yīng)逐條對掛接結(jié)果進(jìn)行檢查,包括目錄數(shù)據(jù)與紙質(zhì)檔案數(shù)字圖像對應(yīng)的準(zhǔn)確性、已掛接數(shù)字圖像與實際掃描數(shù)量的一致性、數(shù)字圖像是否能正常打開等,發(fā)現(xiàn)錯誤及時進(jìn)行糾正。
檔案部門應(yīng)成立專門的驗收組對數(shù)字化成果進(jìn)行驗收,采用計算機(jī)自動檢驗與人工抽查的標(biāo)準(zhǔn)進(jìn)行檢驗。采用計算機(jī)自動檢驗的,需要合格率為100%,不能采用計算機(jī)檢驗的,人工檢驗率不得小于5%,其中數(shù)據(jù)庫與圖像的對應(yīng)上,合格率為100%,其他內(nèi)容合格率為95%。
6結(jié)束語
通過本文我們知道了檔案數(shù)字化工作的流程和要求,在2021年1月1日實施的《中華人民共和國檔案法》中,特別提到各級人民政府應(yīng)當(dāng)將檔案信息化納入信息化發(fā)展規(guī)劃,保障電子檔案、傳統(tǒng)載體檔案數(shù)字化成果等檔案數(shù)字資源的安全保存和有效利用。檔案館和機(jī)關(guān)、團(tuán)體、企業(yè)事業(yè)單位以及其他組織應(yīng)當(dāng)加強檔案信息化建設(shè),并采取措施保障檔案信息安全。所以作為檔案工作者,提高對數(shù)字化工作的認(rèn)識是必不可少的,希望本文對相關(guān)工作人員在檔案數(shù)字化工作中有所幫助。
參考規(guī)范
[1]《中華人民共和國檔案法》
[2]《中華人民共和國保守國家秘密法》
[3]《紙質(zhì)檔案數(shù)字化規(guī)范》DAT 31-2017