■劉 婷
數(shù)字化,是指將任何連續(xù)變化的輸入如圖畫的線條或聲音信號轉化為一串分離的單元,在計算機中用0 和1 表示[1]。紙質檔案數(shù)字化是指采用掃描儀或數(shù)碼相機等設備對紙質檔案進行數(shù)字化加工,將其轉化為存儲在光盤、磁帶、磁盤、移動硬盤等載體上并能被計算機識別的數(shù)字圖像和數(shù)字文本,并按照紙質檔案的內在聯(lián)系,建立目錄數(shù)據與數(shù)字圖像和文本的關聯(lián)關系的處理過程。
檔案數(shù)字化是為建立檔案信息全文資源庫做準備的,即為數(shù)字檔案館建設打基礎的一項工作。目前,大多數(shù)館藏檔案載體仍然是紙質為主,存在占用空間大,保管成本高,檔案實體易磨損、易霉變,而且查詢效率低,利用不便捷,難以滿足用戶對信息資源的需求。
檔案數(shù)字化就可以解決傳統(tǒng)管理模式存在的這些問題,讓沉寂在庫房的檔案亮起來,價值得以最大化,具體有如下優(yōu)勢。
1.有利于實現(xiàn)檔案信息共享
紙質檔案通常以一份存在,不可以同時兩人共享,而數(shù)字檔案則可以實現(xiàn)異地遠程利用,不再受“孤本”的限制,可以多人在線查閱,實現(xiàn)檔案信息資源共享,將檔案增值。
2.有利于檔案方便快捷地提供利用
用戶可以不用去庫房借閱檔案,以零跑腿的方式即可在線查閱到所需資料,減少了時間成本,大大提高了工作效率[2]。
3.有利于保護檔案原件
檔案的原始記錄性、憑證性和唯一性決定了檔案是真實記錄歷史的重要載體,因此,保護檔案原件是檔案工作的重要內容之一。檔案數(shù)字化后,檔案利用從紙質原件轉移到數(shù)字副本,原件利用率會大大減少,從而得到了更有效的保護。
4.有利于檔案信息資源的開發(fā)利用
進入檔案信息管理系統(tǒng)可以了解檔案各個年代,各個階段的歷史全貌,通過網絡終端隨時查閱、整合、編輯豐富的檔案資源,為檔案人員開展編研工作提供方便,為用戶了解企業(yè)發(fā)展的情況,以及產品設計的過程等專業(yè)需求提供途徑。
庫藏檔案的數(shù)字化,必須遵守國家檔案公開和保密的法律規(guī)定以及其他相關規(guī)定,必須符合企業(yè)各層級檔案和保密相關規(guī)定與要求。同時檔案數(shù)字化的開展應以國家、行業(yè)、企業(yè)的相關標準為基礎。
項目實施過程中應謹守“保密”紅線,嚴格按照保密工作要求開展檔案數(shù)字化加工和電子文件工作,加強管理和制度保障,對檔案人員及外包單位進行保密培訓,強化保密意識,重點考查外包單位保密資質、確保全程監(jiān)控等。為保障項目實施效果的質量,編寫實施方案及一批項目實施過程中需要使用的規(guī)范性工作文件,明確填寫要求,最終作為驗收備查資料一并留存。
數(shù)字化對象的鑒選以價值性、利用率為原則,即優(yōu)先對屬于歸檔范圍且永久或長期保存、對企業(yè)科研生產活動利用價值更高的檔案進行數(shù)字化,為用戶提供更加方便、快捷、多元的使用方式和途徑。
在進行檔案數(shù)字化工作時,必須梳理出流程框架,明確具體操作方法,做到心中有數(shù),開展起來才能得心應手,下面從項目調研策劃階段、合同簽訂階段、實施階段三方面進行介紹。
檔案管理人員對行業(yè)內多家單位的數(shù)字化工作進行調研,掌握多家外包單位的掃描狀態(tài),選擇最優(yōu)保密資質的數(shù)字化加工公司。從掃描效果、經費、進度、交接、人員、場地、保密七方面對外包單位加工情況進行比較分析。
例如了解用戶對數(shù)據檔案PDF 的單雙層需求,雙層PDF 的優(yōu)勢在于可以對電子檔案的內容復制、粘貼,也可以搜索關鍵詞進行全文檢索。根據圖紙的清晰度確定掃描的分辨率,一般情況下300DPI 即可,對于清晰度低的文件或大幅面的藍圖需要掃描分辨率600DPI。獲取外包單位的具體報價情況,及人員配備和軟硬件設備是否到位,根據本企業(yè)的預算及進度需求選擇加工單位。承包給外包單位掃描,單位內均需設專人負責此項工作,包括與外包單位的溝通協(xié)調、合同簽訂、整理出庫、數(shù)據導入、質量控制、瀚海掛接、目錄與實體核對、組卷上架等相關工作。根據企業(yè)內的條件選擇場地,確定將檔案送出去掃描還是請外包人員進駐現(xiàn)場掃描,并全程跟蹤監(jiān)控。外包單位必須具有完備的業(yè)務資質、保密資質和履約能力。掃描后的數(shù)據如何儲存內網,一般分兩種方式,一種是通過光盤傳輸返回,再將光盤里的數(shù)據檔案導入內網,另一種是外包公司派人自帶設備直接入駐企業(yè)內,組建局域網進行數(shù)字化加工,通過部門硬盤導入內網。
與外包單位商談價格、進度、交接等方面的內容后,制定外包方篩選方案,通過單一來源采購、邀標、談判、公開招標等方式選擇合適的承包方。簽訂書面合同,形成正式的委托與被委托的法律關系,合同條款內容應符合單位合同管理的相關要求。簽訂合同后,在企業(yè)內完成合同審批表、涉密檔案數(shù)字化保密協(xié)議書流程。
開展檔案數(shù)字化工作時,首先完成掃描對象、載體形式、數(shù)量等統(tǒng)計工作,確定數(shù)字化范圍,結合企業(yè)檔案的密級性、保管期限、價值性,進行出庫前處理,最終真正實現(xiàn)所有庫藏檔案的數(shù)字化。
1.電子文件轉換掛接
對既有紙質檔案又電子版本的情況,將系統(tǒng)中的電子版下載掛接。下載轉換前,需要先確認每份文件的技術狀態(tài)和版本,若只有一個版本,后續(xù)也未曾更改,則可直接下載、轉換;若存在多個版本,則需要找相關人員進行版本確認,確保下載的版本屬于該歸檔階段所需版本。對于已經在檔案管理系統(tǒng)或網盤存有的非PDF 格式的檔案,需要信息化手段進行轉化和掛接。
2.紙質檔案出庫
對于紙質檔案出庫必須由專人負責并成立檔案數(shù)字化小組開展項目的實施,負責出庫管理,具體有以下四方面的操作步驟。
(1)檔案管理系統(tǒng)中將數(shù)字化加工范圍各門類的目錄導出,并按照檔案出入庫登記表進行整理,作為與外包單位的移交憑證,在后續(xù)工作量統(tǒng)計、檔案實體狀況檢查、檔案歸還等工作中都將以此為重要參考文件。
(2)開展紙質檔案調取、清點、登記等前期準備工作。統(tǒng)計并檢查出庫檔案的密級、紙張幅面、頁碼順序、頁數(shù)、頁面質量等,確認無誤后在計算機上補充填寫。
(3)開啟檔案出入庫登記表的審批流程,經相關部門負責人批準后,與檔案數(shù)字化實施人員共同清點無誤后,辦理出庫交接。
(4)為確保檔案的安全性,需要雙人將出庫的紙質檔案運到數(shù)字化加工場所,按照登記表與外包單位核對、簽字、移交。
3.目錄數(shù)據庫建設
目錄數(shù)據庫建設與數(shù)字化前檔案整理登記工作同步開展,按照DA/T18《檔案著錄規(guī)則》的要求,完善各門類檔案著錄項[3]。在檔案出庫登記階段,每一份目錄數(shù)據都需兩人交叉互查,采用互查方式對目錄數(shù)據的質量進行檢查,確保著錄項目的完整性、著錄內容的規(guī)范性和準確性等,發(fā)現(xiàn)不合格的數(shù)據應及時修改并加以標注。
4.實物與目錄數(shù)據一一核對
檔案數(shù)字化前處理工作,首先逐份逐頁梳理歸檔資料,將紙質檔案實體與檔案管理系統(tǒng)的目錄數(shù)據庫一一核對,保障在庫檔案的系統(tǒng)性、準確性、完整性,并進行目錄數(shù)據更改,確保每份檔案的檔號、題名、密級、份數(shù)、頁數(shù)保持一致,如發(fā)現(xiàn)有冗余檔案進行剔出,鑒定銷毀,如有光盤,將其整理存放光盤柜,最終進行系統(tǒng)梳理。
項目實施階段開展的工作相互配合、互相補充、共同推進,實現(xiàn)庫藏檔案的全部數(shù)字化、電子文件歸檔的科學規(guī)范化,建立檔案全文信息資源庫。
5.返回檔案核對入庫上架
外包單位將掃描后的數(shù)據以卷為單位,每份以檔號命名進行打包傳輸,并填寫紙質檔案數(shù)字化成果移交清單移交。雙人負責將送到外包單位的紙質檔案與檔案出入庫登記表核對無誤后運回檔案庫房,按原庫位規(guī)劃整理上架,并將返回的數(shù)據導入網盤備份。及時完成數(shù)據與紙質檔案逐份逐頁核對,有問題及時反饋。
6.檔案數(shù)據瀚海掛接
成立驗收小組,借助批量掛接軟件進行檔案管理系統(tǒng)中的目錄數(shù)據與對應數(shù)字圖像的掛接,以實現(xiàn)目錄數(shù)據與數(shù)字圖像的關聯(lián)[4]。逐條對掛接結果進行檢查,包含目錄數(shù)據與圖像對應的準確性、已掛接數(shù)字圖像與檔案實體和實際掃描數(shù)量的一致性、數(shù)字圖像是否能正常打開等,發(fā)現(xiàn)錯誤及時糾正。
數(shù)字化加工的基本流程、各流程責任者及每個環(huán)節(jié)的主要工作內容如上圖。
紙質檔案數(shù)字化基本流程圖
7.成果驗收
檔案數(shù)字化成果質量達到驗收指標要求,予以驗收“通過”。驗收未通過應視情況進行返工或修改后,重新進行驗收。驗收完成后須經驗收組成員簽字。驗收“通過”的結論,必須經相關領導審核、簽字后方有效。驗收結論應與其他數(shù)字化工作文件一并歸檔留存。
返回的電子檔案需要質量審查,數(shù)字圖像不完整、圖像歪斜、清晰度差或失真度較大導致無法識別時,應重新掃描;對于漏掃、重掃、多掃等情況,應及時改正;圖像的排列順序與檔案原件不一致時,應及時調整;對圖像拼接、旋轉及糾偏、裁邊、去污等處理情況進行檢查,不符合圖像質量要求的,重新進行數(shù)字化加工,重新進行圖像處理,無誤后,再與檔案管理系統(tǒng)目錄一一對應進行核對掛接[5]。
信息技術的飛速發(fā)展,海量數(shù)據的不斷產生,傳統(tǒng)的檔案管理模式已不能滿足大數(shù)據時代的需求。通過近些年的工作探索與實踐,紙質檔案數(shù)字化流程逐漸成熟,在企業(yè)發(fā)展中的應用日漸廣泛,形成一種以“智慧檔案館”為目標,“精細化流程、信息化管理”為手段的管理模式,也為建立檔案信息資源庫、用戶提供利用、檔案編研儲備資源,建設數(shù)字檔案館做準備。