□張子敏
河北省水利廳機(jī)關(guān)文書檔案數(shù)字化處理流程
□張子敏
根據(jù)河北省水利廳檔案數(shù)字化工作現(xiàn)狀,對(duì)文書檔案數(shù)字化處理流程進(jìn)行了梳理,此文介紹了紙質(zhì)檔案經(jīng)過掃描、圖像優(yōu)化、質(zhì)量檢查、圖像掛接、數(shù)據(jù)存儲(chǔ)備份等數(shù)字化處理技術(shù)方法,轉(zhuǎn)換成數(shù)字方式的過程,通過文書檔案數(shù)字化處理為檔案信息化建設(shè)提供基礎(chǔ)。
文書檔案;數(shù)字化;流程
河北省水利廳檔案室室藏檔案上萬卷(件),2001年以來以件為單位的紙質(zhì)檔案就達(dá)25048件,另還存有科技檔案、基建檔案、會(huì)計(jì)檔案、照片檔案、聲像檔案等。室藏的文書檔案是水利工作運(yùn)行中不可缺少的寶貴財(cái)富,長(zhǎng)期以來,大量的紙質(zhì)文書檔案在水利工作中發(fā)揮了重要作用,但由于紙質(zhì)檔案存在查閱不便、調(diào)卷緩慢、原件易損等問題,這些紙質(zhì)檔案的保存和利用已遠(yuǎn)遠(yuǎn)不能適應(yīng)和滿足水利事業(yè)發(fā)展新形勢(shì)的需要,加之河北省公布的《河北省機(jī)關(guān)檔案工作目標(biāo)管理認(rèn)定標(biāo)準(zhǔn)》中明確將檔案數(shù)字化建設(shè)納入認(rèn)定標(biāo)準(zhǔn)中,檔案數(shù)字化日益成為檔案信息化建設(shè)的一個(gè)重要組成部分,河北省水利廳開展紙質(zhì)文書檔案數(shù)字化建設(shè)已勢(shì)在必行。
將紙質(zhì)檔案轉(zhuǎn)換成計(jì)算機(jī)可識(shí)別的數(shù)字格式通常有兩種方法,一是對(duì)紙質(zhì)檔案掃描并以圖像方式存儲(chǔ)。二是利用已有的縮微膠片影像進(jìn)行數(shù)字化轉(zhuǎn)換或者直接用數(shù)碼相機(jī)進(jìn)行拍攝。在操作過程中,考慮到對(duì)紙質(zhì)檔案進(jìn)行直接掃描的方式比較經(jīng)濟(jì)和快捷,因此,河北省水利廳決定采取通過掃描儀掃描的方法將紙質(zhì)文書檔案變成電子圖像文件直接存儲(chǔ),再配合正在使用的河北科怡綜合檔案管理軟件信息數(shù)據(jù)庫(kù),實(shí)現(xiàn)電子檔案的快速檢索利用。
根據(jù)計(jì)算機(jī)設(shè)備更新周期短,新技術(shù)、新設(shè)備不斷出現(xiàn)的現(xiàn)實(shí),以及目前我廳紙質(zhì)文書檔案數(shù)字化的數(shù)量,對(duì)于檔案數(shù)據(jù)存儲(chǔ)設(shè)備的購(gòu)置,河北省水利廳決定采取“適度超前、現(xiàn)實(shí)夠用、可以擴(kuò)充、不追求一步到位”的原則,將檔案數(shù)據(jù)直接存儲(chǔ)到現(xiàn)有檔案服務(wù)器硬盤中,另購(gòu)置大容量移動(dòng)硬盤以滿足數(shù)據(jù)備份的需要,達(dá)到數(shù)字化過程的投入最小化,完成效果的最大化。
文書檔案數(shù)字化處理主要是對(duì)河北省水利廳2001~2014年以件為單位具有永久保存價(jià)值的紙質(zhì)檔案約7795件進(jìn)行圖像掃描及處理,按行業(yè)技術(shù)規(guī)范化流程進(jìn)行檔案整理、檔案掃描、圖像處理、圖像存儲(chǔ)、目錄建庫(kù)、數(shù)據(jù)掛接、數(shù)據(jù)驗(yàn)收、數(shù)據(jù)備份等工作。出于保密和經(jīng)費(fèi)方面的考慮,河北省水利廳放棄了外包給社會(huì)上的公司進(jìn)行數(shù)字化處理工作的選擇,由廳檔案員負(fù)責(zé)該項(xiàng)工作,規(guī)定對(duì)涉密件不進(jìn)行全文掃描錄入。
2.1 檔案整理過程
一是拆分與裝訂。對(duì)于影響掃描工作進(jìn)行的檔案,要拆除裝訂物,粘連在一起的多份檔案,需在不損壞檔案載體信息量的前提下,細(xì)心分開,如實(shí)在無法分開則不分,操作中不得對(duì)檔案原件有任何損壞。掃描完成后要重新裝訂,注意保持檔案的原版原貌,排序不變、卷皮不換,按檔案原有線孔裝訂,做到安全、準(zhǔn)確、無遺漏。
二是修補(bǔ)。檔案如有破損需進(jìn)行修補(bǔ),修補(bǔ)方法包括托核、加寬、加邊等;折皺不平的原件應(yīng)進(jìn)行壓平或熨平等處理后再進(jìn)行掃描。
三是區(qū)分掃描件和非掃描件。無關(guān)和重份的文件要剔除,有正式件的文件可以不掃描原稿。
四是整理登記。填寫紙質(zhì)檔案數(shù)字化加工過程登記表單,記錄檔案整理后的件號(hào)、年度、題名、頁(yè)數(shù)等信息。
2.2 檔案掃描掛接過程
一是圖像掃描。檔案掃描須采用專業(yè)掃描儀,以黑白二值模式為主,對(duì)頁(yè)面中有紅頭、印章或插有圖片的檔案可采用彩色模式掃描,分辨率不低于100dpi,如文字偏小、密集可適當(dāng)提高分辨率。
二是圖像優(yōu)化。經(jīng)掃描后形成的電子圖像,按要求須進(jìn)行后期優(yōu)化,對(duì)掃描過程中產(chǎn)生的黑邊、黑點(diǎn)、黑框等應(yīng)進(jìn)行去污;圖像出現(xiàn)偏斜應(yīng)進(jìn)行糾偏;以彩色模式掃描的圖像應(yīng)進(jìn)行裁邊處理,去除多余白邊,保證圖像質(zhì)量。
三是圖像格式。采用黑白二值模式掃描的圖像文件,一般采用TIFF格式存儲(chǔ),采用灰度和彩色模式掃描的文件,一般采用JPEG格式存儲(chǔ)。
四是數(shù)據(jù)檢查。對(duì)每天完成的數(shù)據(jù)進(jìn)行檢查,保證圖像文件與卷內(nèi)文件一致正確,圖像文件名與檔案目錄數(shù)據(jù)庫(kù)中該文的檔號(hào)一致準(zhǔn)確,清晰度和格式符合要求。
五是數(shù)據(jù)掛接。檔案數(shù)字化轉(zhuǎn)換過程中形成的目錄數(shù)據(jù)庫(kù)與圖像數(shù)據(jù)庫(kù)及時(shí)加載到檔案數(shù)據(jù)服務(wù)器端,通過科怡檔案軟件實(shí)現(xiàn)目錄數(shù)據(jù)對(duì)相關(guān)聯(lián)的圖像數(shù)據(jù)的自動(dòng)搜索,實(shí)現(xiàn)檔案目錄和檔案原文的同時(shí)查閱。
2.3 檔案數(shù)據(jù)備份過程
對(duì)于經(jīng)過檔案整理、掃描、圖像優(yōu)化、數(shù)據(jù)檢查后形成的最終數(shù)據(jù),進(jìn)行存儲(chǔ)備份,存儲(chǔ)載體的選擇采用兩種方式,一是服務(wù)器的自動(dòng)備份。二是下載保存到另外一臺(tái)電腦或移動(dòng)硬盤中。
河北省水利廳通過紙質(zhì)文書檔案數(shù)字化加工處理,初步實(shí)現(xiàn)了文書檔案信息化,檔案管理的自動(dòng)化,為工作人員方便快捷地進(jìn)行檔案的網(wǎng)上查詢、檢索提供了數(shù)據(jù)支持,為廳機(jī)關(guān)檔案工作目標(biāo)管理認(rèn)定任務(wù)的完成提供了堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。文書檔案數(shù)字化的實(shí)現(xiàn)一定程度上提高了廳機(jī)關(guān)檔案管理水平,提高了文書檔案在水利業(yè)務(wù)和科研工作中的利用效率,最大化發(fā)揮了文書檔案的使用價(jià)值。□
2016-02-15
張子敏,女,漢族,河北省水利廳,檔案員。