■劉 婷
數(shù)字化,是指將任何連續(xù)變化的輸入如圖畫的線條或聲音信號(hào)轉(zhuǎn)化為一串分離的單元,在計(jì)算機(jī)中用0 和1 表示[1]。紙質(zhì)檔案數(shù)字化是指采用掃描儀或數(shù)碼相機(jī)等設(shè)備對(duì)紙質(zhì)檔案進(jìn)行數(shù)字化加工,將其轉(zhuǎn)化為存儲(chǔ)在光盤、磁帶、磁盤、移動(dòng)硬盤等載體上并能被計(jì)算機(jī)識(shí)別的數(shù)字圖像和數(shù)字文本,并按照紙質(zhì)檔案的內(nèi)在聯(lián)系,建立目錄數(shù)據(jù)與數(shù)字圖像和文本的關(guān)聯(lián)關(guān)系的處理過程。
檔案數(shù)字化是為建立檔案信息全文資源庫做準(zhǔn)備的,即為數(shù)字檔案館建設(shè)打基礎(chǔ)的一項(xiàng)工作。目前,大多數(shù)館藏檔案載體仍然是紙質(zhì)為主,存在占用空間大,保管成本高,檔案實(shí)體易磨損、易霉變,而且查詢效率低,利用不便捷,難以滿足用戶對(duì)信息資源的需求。
檔案數(shù)字化就可以解決傳統(tǒng)管理模式存在的這些問題,讓沉寂在庫房的檔案亮起來,價(jià)值得以最大化,具體有如下優(yōu)勢(shì)。
1.有利于實(shí)現(xiàn)檔案信息共享
紙質(zhì)檔案通常以一份存在,不可以同時(shí)兩人共享,而數(shù)字檔案則可以實(shí)現(xiàn)異地遠(yuǎn)程利用,不再受“孤本”的限制,可以多人在線查閱,實(shí)現(xiàn)檔案信息資源共享,將檔案增值。
2.有利于檔案方便快捷地提供利用
用戶可以不用去庫房借閱檔案,以零跑腿的方式即可在線查閱到所需資料,減少了時(shí)間成本,大大提高了工作效率[2]。
3.有利于保護(hù)檔案原件
檔案的原始記錄性、憑證性和唯一性決定了檔案是真實(shí)記錄歷史的重要載體,因此,保護(hù)檔案原件是檔案工作的重要內(nèi)容之一。檔案數(shù)字化后,檔案利用從紙質(zhì)原件轉(zhuǎn)移到數(shù)字副本,原件利用率會(huì)大大減少,從而得到了更有效的保護(hù)。
4.有利于檔案信息資源的開發(fā)利用
進(jìn)入檔案信息管理系統(tǒng)可以了解檔案各個(gè)年代,各個(gè)階段的歷史全貌,通過網(wǎng)絡(luò)終端隨時(shí)查閱、整合、編輯豐富的檔案資源,為檔案人員開展編研工作提供方便,為用戶了解企業(yè)發(fā)展的情況,以及產(chǎn)品設(shè)計(jì)的過程等專業(yè)需求提供途徑。
庫藏檔案的數(shù)字化,必須遵守國家檔案公開和保密的法律規(guī)定以及其他相關(guān)規(guī)定,必須符合企業(yè)各層級(jí)檔案和保密相關(guān)規(guī)定與要求。同時(shí)檔案數(shù)字化的開展應(yīng)以國家、行業(yè)、企業(yè)的相關(guān)標(biāo)準(zhǔn)為基礎(chǔ)。
項(xiàng)目實(shí)施過程中應(yīng)謹(jǐn)守“保密”紅線,嚴(yán)格按照保密工作要求開展檔案數(shù)字化加工和電子文件工作,加強(qiáng)管理和制度保障,對(duì)檔案人員及外包單位進(jìn)行保密培訓(xùn),強(qiáng)化保密意識(shí),重點(diǎn)考查外包單位保密資質(zhì)、確保全程監(jiān)控等。為保障項(xiàng)目實(shí)施效果的質(zhì)量,編寫實(shí)施方案及一批項(xiàng)目實(shí)施過程中需要使用的規(guī)范性工作文件,明確填寫要求,最終作為驗(yàn)收備查資料一并留存。
數(shù)字化對(duì)象的鑒選以價(jià)值性、利用率為原則,即優(yōu)先對(duì)屬于歸檔范圍且永久或長期保存、對(duì)企業(yè)科研生產(chǎn)活動(dòng)利用價(jià)值更高的檔案進(jìn)行數(shù)字化,為用戶提供更加方便、快捷、多元的使用方式和途徑。
在進(jìn)行檔案數(shù)字化工作時(shí),必須梳理出流程框架,明確具體操作方法,做到心中有數(shù),開展起來才能得心應(yīng)手,下面從項(xiàng)目調(diào)研策劃階段、合同簽訂階段、實(shí)施階段三方面進(jìn)行介紹。
檔案管理人員對(duì)行業(yè)內(nèi)多家單位的數(shù)字化工作進(jìn)行調(diào)研,掌握多家外包單位的掃描狀態(tài),選擇最優(yōu)保密資質(zhì)的數(shù)字化加工公司。從掃描效果、經(jīng)費(fèi)、進(jìn)度、交接、人員、場地、保密七方面對(duì)外包單位加工情況進(jìn)行比較分析。
例如了解用戶對(duì)數(shù)據(jù)檔案PDF 的單雙層需求,雙層PDF 的優(yōu)勢(shì)在于可以對(duì)電子檔案的內(nèi)容復(fù)制、粘貼,也可以搜索關(guān)鍵詞進(jìn)行全文檢索。根據(jù)圖紙的清晰度確定掃描的分辨率,一般情況下300DPI 即可,對(duì)于清晰度低的文件或大幅面的藍(lán)圖需要掃描分辨率600DPI。獲取外包單位的具體報(bào)價(jià)情況,及人員配備和軟硬件設(shè)備是否到位,根據(jù)本企業(yè)的預(yù)算及進(jìn)度需求選擇加工單位。承包給外包單位掃描,單位內(nèi)均需設(shè)專人負(fù)責(zé)此項(xiàng)工作,包括與外包單位的溝通協(xié)調(diào)、合同簽訂、整理出庫、數(shù)據(jù)導(dǎo)入、質(zhì)量控制、瀚海掛接、目錄與實(shí)體核對(duì)、組卷上架等相關(guān)工作。根據(jù)企業(yè)內(nèi)的條件選擇場地,確定將檔案送出去掃描還是請(qǐng)外包人員進(jìn)駐現(xiàn)場掃描,并全程跟蹤監(jiān)控。外包單位必須具有完備的業(yè)務(wù)資質(zhì)、保密資質(zhì)和履約能力。掃描后的數(shù)據(jù)如何儲(chǔ)存內(nèi)網(wǎng),一般分兩種方式,一種是通過光盤傳輸返回,再將光盤里的數(shù)據(jù)檔案導(dǎo)入內(nèi)網(wǎng),另一種是外包公司派人自帶設(shè)備直接入駐企業(yè)內(nèi),組建局域網(wǎng)進(jìn)行數(shù)字化加工,通過部門硬盤導(dǎo)入內(nèi)網(wǎng)。
與外包單位商談價(jià)格、進(jìn)度、交接等方面的內(nèi)容后,制定外包方篩選方案,通過單一來源采購、邀標(biāo)、談判、公開招標(biāo)等方式選擇合適的承包方。簽訂書面合同,形成正式的委托與被委托的法律關(guān)系,合同條款內(nèi)容應(yīng)符合單位合同管理的相關(guān)要求。簽訂合同后,在企業(yè)內(nèi)完成合同審批表、涉密檔案數(shù)字化保密協(xié)議書流程。
開展檔案數(shù)字化工作時(shí),首先完成掃描對(duì)象、載體形式、數(shù)量等統(tǒng)計(jì)工作,確定數(shù)字化范圍,結(jié)合企業(yè)檔案的密級(jí)性、保管期限、價(jià)值性,進(jìn)行出庫前處理,最終真正實(shí)現(xiàn)所有庫藏檔案的數(shù)字化。
1.電子文件轉(zhuǎn)換掛接
對(duì)既有紙質(zhì)檔案又電子版本的情況,將系統(tǒng)中的電子版下載掛接。下載轉(zhuǎn)換前,需要先確認(rèn)每份文件的技術(shù)狀態(tài)和版本,若只有一個(gè)版本,后續(xù)也未曾更改,則可直接下載、轉(zhuǎn)換;若存在多個(gè)版本,則需要找相關(guān)人員進(jìn)行版本確認(rèn),確保下載的版本屬于該歸檔階段所需版本。對(duì)于已經(jīng)在檔案管理系統(tǒng)或網(wǎng)盤存有的非PDF 格式的檔案,需要信息化手段進(jìn)行轉(zhuǎn)化和掛接。
2.紙質(zhì)檔案出庫
對(duì)于紙質(zhì)檔案出庫必須由專人負(fù)責(zé)并成立檔案數(shù)字化小組開展項(xiàng)目的實(shí)施,負(fù)責(zé)出庫管理,具體有以下四方面的操作步驟。
(1)檔案管理系統(tǒng)中將數(shù)字化加工范圍各門類的目錄導(dǎo)出,并按照檔案出入庫登記表進(jìn)行整理,作為與外包單位的移交憑證,在后續(xù)工作量統(tǒng)計(jì)、檔案實(shí)體狀況檢查、檔案歸還等工作中都將以此為重要參考文件。
(2)開展紙質(zhì)檔案調(diào)取、清點(diǎn)、登記等前期準(zhǔn)備工作。統(tǒng)計(jì)并檢查出庫檔案的密級(jí)、紙張幅面、頁碼順序、頁數(shù)、頁面質(zhì)量等,確認(rèn)無誤后在計(jì)算機(jī)上補(bǔ)充填寫。
(3)開啟檔案出入庫登記表的審批流程,經(jīng)相關(guān)部門負(fù)責(zé)人批準(zhǔn)后,與檔案數(shù)字化實(shí)施人員共同清點(diǎn)無誤后,辦理出庫交接。
(4)為確保檔案的安全性,需要雙人將出庫的紙質(zhì)檔案運(yùn)到數(shù)字化加工場所,按照登記表與外包單位核對(duì)、簽字、移交。
3.目錄數(shù)據(jù)庫建設(shè)
目錄數(shù)據(jù)庫建設(shè)與數(shù)字化前檔案整理登記工作同步開展,按照DA/T18《檔案著錄規(guī)則》的要求,完善各門類檔案著錄項(xiàng)[3]。在檔案出庫登記階段,每一份目錄數(shù)據(jù)都需兩人交叉互查,采用互查方式對(duì)目錄數(shù)據(jù)的質(zhì)量進(jìn)行檢查,確保著錄項(xiàng)目的完整性、著錄內(nèi)容的規(guī)范性和準(zhǔn)確性等,發(fā)現(xiàn)不合格的數(shù)據(jù)應(yīng)及時(shí)修改并加以標(biāo)注。
4.實(shí)物與目錄數(shù)據(jù)一一核對(duì)
檔案數(shù)字化前處理工作,首先逐份逐頁梳理歸檔資料,將紙質(zhì)檔案實(shí)體與檔案管理系統(tǒng)的目錄數(shù)據(jù)庫一一核對(duì),保障在庫檔案的系統(tǒng)性、準(zhǔn)確性、完整性,并進(jìn)行目錄數(shù)據(jù)更改,確保每份檔案的檔號(hào)、題名、密級(jí)、份數(shù)、頁數(shù)保持一致,如發(fā)現(xiàn)有冗余檔案進(jìn)行剔出,鑒定銷毀,如有光盤,將其整理存放光盤柜,最終進(jìn)行系統(tǒng)梳理。
項(xiàng)目實(shí)施階段開展的工作相互配合、互相補(bǔ)充、共同推進(jìn),實(shí)現(xiàn)庫藏檔案的全部數(shù)字化、電子文件歸檔的科學(xué)規(guī)范化,建立檔案全文信息資源庫。
5.返回檔案核對(duì)入庫上架
外包單位將掃描后的數(shù)據(jù)以卷為單位,每份以檔號(hào)命名進(jìn)行打包傳輸,并填寫紙質(zhì)檔案數(shù)字化成果移交清單移交。雙人負(fù)責(zé)將送到外包單位的紙質(zhì)檔案與檔案出入庫登記表核對(duì)無誤后運(yùn)回檔案庫房,按原庫位規(guī)劃整理上架,并將返回的數(shù)據(jù)導(dǎo)入網(wǎng)盤備份。及時(shí)完成數(shù)據(jù)與紙質(zhì)檔案逐份逐頁核對(duì),有問題及時(shí)反饋。
6.檔案數(shù)據(jù)瀚海掛接
成立驗(yàn)收小組,借助批量掛接軟件進(jìn)行檔案管理系統(tǒng)中的目錄數(shù)據(jù)與對(duì)應(yīng)數(shù)字圖像的掛接,以實(shí)現(xiàn)目錄數(shù)據(jù)與數(shù)字圖像的關(guān)聯(lián)[4]。逐條對(duì)掛接結(jié)果進(jìn)行檢查,包含目錄數(shù)據(jù)與圖像對(duì)應(yīng)的準(zhǔn)確性、已掛接數(shù)字圖像與檔案實(shí)體和實(shí)際掃描數(shù)量的一致性、數(shù)字圖像是否能正常打開等,發(fā)現(xiàn)錯(cuò)誤及時(shí)糾正。
數(shù)字化加工的基本流程、各流程責(zé)任者及每個(gè)環(huán)節(jié)的主要工作內(nèi)容如上圖。
紙質(zhì)檔案數(shù)字化基本流程圖
7.成果驗(yàn)收
檔案數(shù)字化成果質(zhì)量達(dá)到驗(yàn)收指標(biāo)要求,予以驗(yàn)收“通過”。驗(yàn)收未通過應(yīng)視情況進(jìn)行返工或修改后,重新進(jìn)行驗(yàn)收。驗(yàn)收完成后須經(jīng)驗(yàn)收組成員簽字。驗(yàn)收“通過”的結(jié)論,必須經(jīng)相關(guān)領(lǐng)導(dǎo)審核、簽字后方有效。驗(yàn)收結(jié)論應(yīng)與其他數(shù)字化工作文件一并歸檔留存。
返回的電子檔案需要質(zhì)量審查,數(shù)字圖像不完整、圖像歪斜、清晰度差或失真度較大導(dǎo)致無法識(shí)別時(shí),應(yīng)重新掃描;對(duì)于漏掃、重掃、多掃等情況,應(yīng)及時(shí)改正;圖像的排列順序與檔案原件不一致時(shí),應(yīng)及時(shí)調(diào)整;對(duì)圖像拼接、旋轉(zhuǎn)及糾偏、裁邊、去污等處理情況進(jìn)行檢查,不符合圖像質(zhì)量要求的,重新進(jìn)行數(shù)字化加工,重新進(jìn)行圖像處理,無誤后,再與檔案管理系統(tǒng)目錄一一對(duì)應(yīng)進(jìn)行核對(duì)掛接[5]。
信息技術(shù)的飛速發(fā)展,海量數(shù)據(jù)的不斷產(chǎn)生,傳統(tǒng)的檔案管理模式已不能滿足大數(shù)據(jù)時(shí)代的需求。通過近些年的工作探索與實(shí)踐,紙質(zhì)檔案數(shù)字化流程逐漸成熟,在企業(yè)發(fā)展中的應(yīng)用日漸廣泛,形成一種以“智慧檔案館”為目標(biāo),“精細(xì)化流程、信息化管理”為手段的管理模式,也為建立檔案信息資源庫、用戶提供利用、檔案編研儲(chǔ)備資源,建設(shè)數(shù)字檔案館做準(zhǔn)備。