賴蘇平(新疆油田采油一廠信息檔案管理站,新疆 克拉瑪依 834000)
檔案數(shù)字化掃描存在問題與對策
賴蘇平(新疆油田采油一廠信息檔案管理站,新疆 克拉瑪依 834000)
本文通過新疆油田采油一廠近兩年開展的檔案數(shù)字化掃描工作中出現(xiàn)的問題,提出具有一定應(yīng)用價(jià)值的檔案數(shù)字化掃描對策,為“十三五”其他兄弟單位開展數(shù)字化工作提供可行性建議,以提高檔案數(shù)字化掃描工作的質(zhì)量。
檔案數(shù)字化;掃描;問題;對策
新疆油田采油一廠是新中國發(fā)現(xiàn)的第一個大油田——克拉瑪依大油田的發(fā)源地,于1960年建廠,建廠55年來,形成兩萬多卷珍貴的紙質(zhì)檔案。按照中國石油天然氣集團(tuán)公司(后文簡稱“集團(tuán)公司”)“十三五”期間建設(shè)數(shù)字檔案館(室)要求,為加快庫藏檔案數(shù)字化建設(shè),2014-2016年,采油一廠投入60萬元用于油氣勘探開發(fā)類、建設(shè)項(xiàng)目類、管理類三大項(xiàng)共計(jì)100萬余頁的檔案全文數(shù)字化掃描工作。通過為期三年的數(shù)字化掃描工作,采油一廠檔案數(shù)字化超額實(shí)現(xiàn)91%(中石油要求80%)的目標(biāo)。
本文通過采油一廠在為期三年的檔案數(shù)字化掃描工作中出現(xiàn)的問題,提出可行性解決方案,為各兄弟單位在數(shù)字化掃描工作提供建議,以進(jìn)一步提高檔案數(shù)字化掃描工作質(zhì)量。
筆者通過全程參與北京佳訊天則有限責(zé)任公司承包采油一廠的檔案數(shù)字化掃描項(xiàng)目,發(fā)現(xiàn)數(shù)字化掃描中存在著諸多亟待解決的問題,這些問題主要表現(xiàn)在以下幾個方面:
(1)硬件設(shè)施配備不全 硬件設(shè)施是檔案數(shù)字化建設(shè)過程中不可或缺的基本條件,由于乙方同時在多家單位開展掃描工作,導(dǎo)致設(shè)備設(shè)施配備不全,如工程圖紙掃描儀配備不齊全,存在一些紙張較大的檔案圖紙,如地質(zhì)、基建檔案的大幅圖、表等,掃描設(shè)備不能滿足本廠實(shí)際檔案的尺寸要求,導(dǎo)致掃描的大幅圖表或殘缺不全,或圖像為空白,或通過多次掃描經(jīng)過多張圖像拼接而失真。
(2)紙質(zhì)檔案掃描過程欠規(guī)范 乙方因同時承擔(dān)多家單位的檔案數(shù)字化掃描工作,為加快工作進(jìn)度,乙方要求兩名工作人員日完成至少5000條的數(shù)據(jù)掛接數(shù)量,而合同規(guī)定“日均完成檔案數(shù)字化2000條”,導(dǎo)致為追求速度而忽視質(zhì)量,主要表現(xiàn)在以下幾個方面:首先,造成多掃、重復(fù)掃和漏掃現(xiàn)象。由于追求速度,掃描人員對無須列入數(shù)字化處理的對象,如圖表中的空白表格、人為夾入文檔中與文檔無關(guān)的紙張進(jìn)行了掃描;對基建檔案主副本同一文檔或同一紙張進(jìn)行重復(fù)掃描;由于人為標(biāo)注頁碼錯誤,如跳頁標(biāo)碼,導(dǎo)致漏掃。其次,造成對原件的損害問題。采油一廠勘探開發(fā)類檔案最早產(chǎn)生于二十世紀(jì)五十年代,部分勘探開發(fā)圖紙檔案由脆弱的透明玻璃紙人工繪制組卷而成,在掃描前標(biāo)注頁碼、拆卷、翻頁時,稍有不慎就會對原件造成損害。如工作人員對折疊多層的圖紙?jiān)诜摃r不小心,動作幅度較大,都容易對檔案原件造成損傷。
(3)后期管理不力 承攬采油一廠掃描工作的北京佳訊天則公司總部設(shè)在北京,數(shù)字化工作人員均在本克拉瑪依招聘,新聘用人員有的甚至剛從學(xué)校畢業(yè)的大中專畢業(yè)生,沒有任何工作經(jīng)驗(yàn)。這些數(shù)字化檔案工作人員在思想上沒有意識到檔案后期管理工作的重要性,以為完成前期掃描工作便可,在技術(shù)上對裝訂工作不專業(yè),缺乏相關(guān)培訓(xùn),導(dǎo)致掃描后的檔案經(jīng)重新裝訂后,出現(xiàn)裝訂不齊,紙張破損、甚至圖紙打不開的現(xiàn)象。
(1)基礎(chǔ)設(shè)施配備齊全 掃描設(shè)備配備的是否齊全以及性能的高低是提高檔案數(shù)字化掃描質(zhì)量的前提。硬件方面,為滿足數(shù)字化掃描工作要求,乙方配備聯(lián)想電腦5臺,服務(wù)器1臺,聯(lián)想掃描儀1臺,A3平板掃描儀1臺,使之適應(yīng)系統(tǒng)中大量數(shù)據(jù)的快速處理。
軟件方面,擁有一套檔案數(shù)字化加工軟件,支持高速掃描儀、普通平板掃描儀和大幅面工程圖紙掃描儀,具備對影像優(yōu)化處理、加蓋水印、自動糾偏、糾斜,生產(chǎn)多頁TIFF和PDF文件等功能,在技術(shù)上符合檔案信息化建設(shè)的基本要求。同時將檔案數(shù)字化成果上傳至集團(tuán)公司檔案管理系統(tǒng),從而為檔案數(shù)字化成果的有效利用提供途徑。
(2)加強(qiáng)過程管理 根據(jù)檔案數(shù)字化加工的基本環(huán)節(jié),甲乙雙方負(fù)責(zé)人勤溝通,嚴(yán)管理,各司其職,根據(jù)集團(tuán)公司《檔案數(shù)字化工作流程圖》要求,嚴(yán)把各個節(jié)點(diǎn)質(zhì)量關(guān)。尤其在掃描工作開展之前,檔案室負(fù)責(zé)人專門對掃描人員進(jìn)行檔案整理、標(biāo)注頁碼以及檔案裝訂等相關(guān)培訓(xùn)工作;在紙質(zhì)檔案上做標(biāo)記時,要求使用鉛筆,在紙張的右下角進(jìn)行標(biāo)記,筆記不能過重,字體工整,不能過大,以免傷害紙張;拆裝檔案時,尤其是“手風(fēng)琴”式折疊的大幅圖紙時,要求小心翻動,不能用力過度,以保護(hù)脆弱紙張。
(3)加強(qiáng)后期管理 保證質(zhì)量 后期管理中,圖像質(zhì)檢是一項(xiàng)至關(guān)重要的工作。甲乙雙方需要制定檔案數(shù)字化后的二?;蛉Y|(zhì)檢規(guī)定,校對工作根據(jù)加工進(jìn)度按階段進(jìn)行,杜絕在最后階段集中突擊校驗(yàn)。
首先,數(shù)字化工作人員(乙方)要對照原件,檢查掃描文件的清晰度,與原件無關(guān)的內(nèi)容、斑點(diǎn)、墨汁等是否清除;是否進(jìn)行糾錯及糾偏處理。其次,檔案工作人員(甲方)對掃描件圖像進(jìn)行逐卷逐頁校對,確保掃描件與原件完整一致。尤其基建檔案,要按照案卷目錄對卷內(nèi)件進(jìn)行逐件核對,特別要注意卷內(nèi)件頁數(shù)與目錄、原件相符。最后,根據(jù)要求裝訂復(fù)原檔案,基建、勘探開發(fā)類檔案圖紙多,復(fù)原時注意圖紙正反、恢復(fù)手風(fēng)琴式折疊,遇到破損紙質(zhì),及時修復(fù),逐卷逐頁檢查裝訂質(zhì)量。
總之,采油一廠檔案形成的歷史沿革時間較長,紙質(zhì)為載體的紙張質(zhì)地種類較多,所形成的檔案文件紙張和字體復(fù)雜多樣,不同時期的紙張質(zhì)量不一,因此,在開展檔案掃描工作中,嚴(yán)格執(zhí)行統(tǒng)一的技術(shù)與標(biāo)準(zhǔn),要保證圖像的清晰可讀,最終滿足在集團(tuán)公司檔案管理系統(tǒng)上實(shí)現(xiàn)檔案資源共享的需求。
[1]陳素萍.數(shù)字化質(zhì)量的規(guī)范處理[J].中國檔案,2007,(2).
[2]鄭鷗.關(guān)于全文檔案數(shù)字化工作的思考[J].中國檔案,2007,(2).