韓向斌,何祖華
(南京中醫(yī)藥大學(xué) 檔案館,南京 210023)
檔案數(shù)字化建設(shè)的思考和建議
韓向斌,何祖華
(南京中醫(yī)藥大學(xué) 檔案館,南京 210023)
本文針對(duì)檔案數(shù)字化的前期準(zhǔn)備、過(guò)程實(shí)施和后期數(shù)字化數(shù)據(jù)及存儲(chǔ)設(shè)備的檢驗(yàn)3個(gè)環(huán)節(jié),根據(jù)工作經(jīng)驗(yàn)對(duì)出現(xiàn)的問(wèn)題進(jìn)行了整理,并提出了具體的操作方案,從法律規(guī)范約束、環(huán)境安全控制、數(shù)字化內(nèi)容質(zhì)量把關(guān)3個(gè)方面來(lái)規(guī)避風(fēng)險(xiǎn),保證檔案的安全和數(shù)字化工作的順利進(jìn)行。
數(shù)字化;安全;檔案;數(shù)字檔案
隨著信息時(shí)代的發(fā)展,信息查詢速度和數(shù)量不斷提高,檔案信息工作不斷深入和推進(jìn),為使館藏檔案得到更好的利用,檔案部門迎來(lái)了館藏檔案數(shù)字化的浪潮。傳統(tǒng)的紙質(zhì)檔案在檢索和查閱上都較為復(fù)雜,保存效果也較差,不利于檔案的開發(fā)利用,數(shù)字檔案存儲(chǔ)空間小、利用便捷,所以將紙質(zhì)檔案數(shù)字化成為檔案工作的主流趨勢(shì),為了節(jié)約人力、物力資源,控制成本,數(shù)字化外包走上舞臺(tái)。南京中醫(yī)藥大學(xué)檔案館也加入了數(shù)字化的大軍,根據(jù)幾年來(lái)的數(shù)字化工作經(jīng)驗(yàn),對(duì)工作中存在的問(wèn)題做了總結(jié)和思考。
1.1進(jìn)行市場(chǎng)調(diào)研,做好標(biāo)書
通常招投標(biāo)部門會(huì)根據(jù)標(biāo)書要求結(jié)合競(jìng)標(biāo)價(jià)格來(lái)確定中標(biāo)方,所以要得到滿意的競(jìng)標(biāo)商,首先要做好前期的調(diào)研和考察。對(duì)已經(jīng)完成數(shù)字化和正在進(jìn)行數(shù)字化的單位走訪,了解數(shù)字化服務(wù)公司的情況和數(shù)字化部門對(duì)該工作的意見,實(shí)地體會(huì)數(shù)字化現(xiàn)場(chǎng)工作并了解數(shù)字化流程和注意事項(xiàng)。征詢專家和相關(guān)行政機(jī)構(gòu)的意見,結(jié)合企業(yè)背景和檔案數(shù)字化外包規(guī)定,邀請(qǐng)符合條件的公司到單位競(jìng)標(biāo),擇優(yōu)選擇。
1.2鑒定、統(tǒng)計(jì)要數(shù)字化的檔案,簽訂相關(guān)協(xié)議
1.3做好場(chǎng)地的安全設(shè)施布置
首先,工作室需要進(jìn)行全方位24小時(shí)監(jiān)控,要安裝前后攝像頭,保證360度無(wú)死角。其次,做好電子產(chǎn)品檢測(cè),合同中規(guī)定禁止攜帶電子產(chǎn)品,但是檔案部門不可能對(duì)外包人員搜身,有效的辦法是采取電子探測(cè),但自動(dòng)電子探測(cè)門的代價(jià)較高,掃描工作本身又短期性的;人工探測(cè)費(fèi)用可以接受,但是掃描人員較多,且出入頻繁,長(zhǎng)期守門也不現(xiàn)實(shí),所以這個(gè)問(wèn)題仍然不能得到很好的解決。最后,做好場(chǎng)地信號(hào)屏蔽,場(chǎng)地是無(wú)網(wǎng)絡(luò)的區(qū)域但是卻因?yàn)闂l件限制,可以接收手機(jī)信號(hào)和網(wǎng)絡(luò)信號(hào),所以應(yīng)安裝信號(hào)屏蔽器。此外,U盤變得越來(lái)越小,越來(lái)越隱秘,裝飾品成了U盤的外衣,主機(jī)USB口也較隱秘,U盤插上去人眼幾乎都無(wú)法察覺,更不用說(shuō)安裝在高處的攝像頭,因此還要拆去主機(jī)上的所有可能外設(shè)安插接口。
1.4與外包方提前協(xié)商,盡可能保證人員穩(wěn)定性
掃描工作較為枯燥,且含金量較低,工資偏低,工作人員多為年輕、低學(xué)歷人群,這就造成外包公司中掃描人員整體素質(zhì)偏低且流動(dòng)性大。而人員變動(dòng)由外包公司管轄,檔案部門無(wú)權(quán)干涉,這會(huì)造成后期檔案檢查中出現(xiàn)問(wèn)題時(shí)權(quán)責(zé)不清,如檔案單頁(yè)丟失,掃描數(shù)據(jù)交接不清等問(wèn)題,給檔案的安全性帶來(lái)極大的隱患。
1.5制訂數(shù)字化加工方案
按照《中華人民共和國(guó)行業(yè)標(biāo)準(zhǔn)(DA/T 31—2005)紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范》的要求制訂加工方案,包括:前期準(zhǔn)備標(biāo)準(zhǔn)(借還檔案,掃描文件命名、電子目錄與紙質(zhì)目錄校對(duì),紙質(zhì)目錄與紙質(zhì)原件校對(duì)),掃描中標(biāo)準(zhǔn)(確定文書、圖紙、照片等不同文件的格式、分辨率、大小、色彩度等參數(shù);掃描操作規(guī)定,要保證紙張,頁(yè)碼順序、案卷順序、檔案盒都保持拆卷前的狀態(tài),規(guī)定問(wèn)題另行備注不可在原件上進(jìn)行,不能因加工或拆卷而造成對(duì)紙質(zhì)文件的損壞)、質(zhì)量檢驗(yàn)標(biāo)準(zhǔn)(確定檢查標(biāo)準(zhǔn),文件歪斜、紙張大小與原件不符、頁(yè)碼順序不對(duì)、漏頁(yè)或重復(fù)、PDF文件未雙層處理、文件不清晰、光盤刻錄數(shù)據(jù)損壞、數(shù)據(jù)不全等重新處理)。
2.1借閱歸還檔案
第一次進(jìn)北大校園,我也好似劉姥姥進(jìn)了大觀園,感覺一切都是新鮮迷人的。北大之大,景色之奇,建筑之美,都超乎我的想象。
檔案應(yīng)遵循當(dāng)天借出、當(dāng)天歸還的原則。雙方工作人員均要在“數(shù)字化檔案借閱記錄”上登記、簽名,寫清案卷數(shù)量和卷號(hào)、借出和歸還時(shí)間、雙方負(fù)責(zé)人簽字。在檔案出庫(kù)入庫(kù)時(shí)都需清點(diǎn)清楚,出庫(kù)后數(shù)字化服務(wù)人員檢查有無(wú)缺損,入庫(kù)時(shí)檔案部門負(fù)責(zé)人檢查原件是否復(fù)原,數(shù)目、排序是否正確,有無(wú)缺頁(yè)損壞等問(wèn)題。檔案應(yīng)及時(shí)還回到庫(kù)房,以免信息外漏或者丟失。通常,實(shí)際工作中,紙質(zhì)檔案較重且較多,搬運(yùn)過(guò)程只能記錄檔號(hào)和卷數(shù),內(nèi)部雖有目錄但裝訂完了后很難做到一頁(yè)一頁(yè)的檢查,被遺漏或者訂錯(cuò)一頁(yè)或幾頁(yè),如果紙質(zhì)的檔案常年未被利用,根本無(wú)法察覺,多年后再發(fā)現(xiàn)也無(wú)從確定是怎么弄錯(cuò)的;以件為單位的檔案,由于統(tǒng)計(jì)數(shù)量更加龐大,一份一份地查看更加不現(xiàn)實(shí);檔案因年代過(guò)久,紙質(zhì)易因老化出現(xiàn)損壞;工作人員有時(shí)也因翻頁(yè)時(shí)動(dòng)作幅度較大造成原件受損;案卷過(guò)厚,數(shù)字化服務(wù)人員裝訂不仔細(xì),個(gè)別紙張會(huì)錯(cuò)位,造成打孔時(shí)打在內(nèi)容上,破壞了原件等。因此,紙質(zhì)檔案交接過(guò)程中需要工作人員耐心、細(xì)致,制定技術(shù)標(biāo)準(zhǔn)和流程規(guī)范,保持操作的統(tǒng)一,保證紙質(zhì)、數(shù)字化檔案的安全。而目前好多檔案館庫(kù)房、辦公區(qū)較小,有的僅一墻之隔,掃描直接在庫(kù)房中進(jìn)行,雖然方便操作,節(jié)省了空間和時(shí)間,但給檔案的安全帶來(lái)了極大的隱患,所以這種情況要杜絕。
2.2檔案掃描過(guò)程
第一,拆卷。檔案不論是件、卷、盒,都應(yīng)遵從復(fù)原后保持檔案裝訂原貌的原則,所以在拆卷時(shí)要按照順序,一本本有序進(jìn)行,力度適中,以不損壞檔案為原則。第二,掃描。掃描的文件、圖片、圖紙都應(yīng)達(dá)到制定的數(shù)字化標(biāo)準(zhǔn)的要求,保持內(nèi)容、大小、色彩均與原件一致,應(yīng)按照文件編號(hào)處理、合成一份文件,按照規(guī)定的命名方式命名,等待掛接。通常,普通文件按300dpi黑白掃描,老舊泛黃檔案和彩頁(yè)按300dpi彩色掃描,并保存為PDF和JPEG兩種格式;照片掃描像素為600dpi以上,保存為JPEG格式;圖紙掃描像素根據(jù)圖紙大小調(diào)整,以內(nèi)容絕對(duì)清晰為標(biāo)準(zhǔn),保存為TIF和PDF兩種格式。老舊泛黃檔案如果破損嚴(yán)重或無(wú)法直接掃描,還需要先進(jìn)行修復(fù)處理。掃描的圖片通常要進(jìn)行糾偏、去污、拼接、裁剪等技術(shù)處理。第三,裝訂。掃描完成后,應(yīng)將檔案按照檔案的裝訂原貌進(jìn)行重新裝訂,且應(yīng)注意保持檔案的頁(yè)碼、件號(hào)、卷號(hào)順序不變,內(nèi)容準(zhǔn)確、無(wú)遺漏。
3.1數(shù)字化數(shù)據(jù)檢查
掃描工作量大,重復(fù)性強(qiáng),檔案具有相似性,掃描時(shí)容易造成漏頁(yè),錯(cuò)頁(yè)的現(xiàn)象,因此,數(shù)字化后的檔案數(shù)據(jù)要進(jìn)行質(zhì)量檢查。因?yàn)閿?shù)字化數(shù)據(jù)量巨大,采用抽檢的方式進(jìn)行檢查。通常,數(shù)據(jù)驗(yàn)收時(shí)抽檢的比率不得低于5%,合格率達(dá)到95%以上(含95%),認(rèn)為合格(合格率=抽檢合格文件數(shù)/抽檢文件總數(shù)×100%)。但實(shí)際工作中發(fā)現(xiàn),檔案需要絕對(duì)的完整、清晰和真實(shí),抽檢對(duì)檔案工作來(lái)說(shuō)存在有很大的問(wèn)題。首先,掃描工作具有主觀性,和掃描個(gè)人認(rèn)真程度密切相關(guān),所以常常發(fā)現(xiàn)掃描問(wèn)題是扎堆出現(xiàn)的。其次,案卷需要裝訂,就容易出現(xiàn)頁(yè)碼遺漏、標(biāo)注錯(cuò)誤的現(xiàn)象,數(shù)字化過(guò)程也是二次糾正的一個(gè)好時(shí)機(jī),而抽檢很難發(fā)現(xiàn)。最后,如招投標(biāo)、科研文件部分檔案不需要數(shù)字化,數(shù)據(jù)自然會(huì)出現(xiàn)斷碼的情況,抽檢很難排除缺頁(yè)原因是斷碼還是漏掃。況且由于數(shù)量巨大,一旦掛接入系統(tǒng),后期利用中很難發(fā)現(xiàn)問(wèn)題,一旦出現(xiàn)問(wèn)題后,糾正也很麻煩。為了解決遺漏問(wèn)題,可能檔案還要重新掃描、處理,然后再覆蓋系統(tǒng)數(shù)據(jù)、光盤數(shù)據(jù)、移動(dòng)硬盤的錯(cuò)誤數(shù)據(jù),還會(huì)給利用者帶來(lái)不便。所以本館采用一頁(yè)一頁(yè)檢查的方式,雖然耗時(shí)耗力,但一勞永逸。審核完畢后,一定要盡快針對(duì)問(wèn)題進(jìn)行修改,再次檢查無(wú)誤后,必須負(fù)責(zé)人或相關(guān)領(lǐng)導(dǎo)確認(rèn)、簽字后方有效。
3.2存儲(chǔ)、備份數(shù)據(jù)檢查
電子數(shù)據(jù)需要載體存儲(chǔ)、備份,通常保存載體為光盤、移動(dòng)硬盤、服務(wù)器等。為保證數(shù)據(jù)安全,通常采用在線、離線備份和多套備份方式。所以檢查過(guò)程要針對(duì)不同的備份載體進(jìn)行。通常針對(duì)設(shè)備是否正常(光盤、移動(dòng)硬盤是否可讀)、數(shù)據(jù)是否可正常讀取、數(shù)據(jù)數(shù)量是否正確,數(shù)據(jù)內(nèi)容是否完整等標(biāo)準(zhǔn)檢查。檢查完成后離線備份數(shù)據(jù)需要進(jìn)行目錄著錄、粘貼標(biāo)貼、存放入庫(kù)等操作,以便今后的管理和利用。
3.3原文掛接
數(shù)字化數(shù)據(jù)檢查無(wú)誤后,可以將其掛接到系統(tǒng)中對(duì)應(yīng)的目錄下,開始進(jìn)行利用。因數(shù)字化文件數(shù)量巨大,通常采用批量掛接的方式,需要文件名稱與數(shù)據(jù)庫(kù)中目錄一一對(duì)應(yīng),這是就體現(xiàn)了文件命名規(guī)則的重要性。掛接過(guò)程會(huì)出現(xiàn)電子目錄找不到,或者目錄多條的現(xiàn)象,就需要即使修改電子目錄,重新掛接該條數(shù)據(jù)。掛接完成后,需要針對(duì)掛接的數(shù)據(jù)進(jìn)行檢查,通常問(wèn)題有數(shù)據(jù)顯示不正常、文件打不開、掛接漏頁(yè)、掛錯(cuò)位置、文件格式錯(cuò)誤,無(wú)法下載等問(wèn)題,因文件內(nèi)容本身就大,數(shù)據(jù)量又多,工作量也更加龐大,通常只能采取抽檢的方式進(jìn)行,抽檢的比率不得低于5%,合格率達(dá)到95%以上(含95%),認(rèn)為合格。掛接原文的錯(cuò)誤通常都是一眼就可發(fā)現(xiàn)的,且不涉及文件內(nèi)容,所以抽檢是可以保證檔案的真實(shí)有效性,后期利用發(fā)現(xiàn)問(wèn)題后,只需要找出備份文件重新掛接即可,工作量也較小。
館藏檔案的數(shù)字化降低了檔案的保存成本,提高了檢索利用的便捷性,同時(shí)也有效推動(dòng)了檔案電子信息化進(jìn)程,對(duì)檔案事業(yè)的發(fā)展起到了積極的推動(dòng)作用。但因檔案數(shù)量巨大而催生的數(shù)字化外包,給檔案安全也帶了新的風(fēng)險(xiǎn)。檔案部門除了在數(shù)字化外包期間做好上述的工作,還應(yīng)增強(qiáng)工作人員的安全意識(shí),對(duì)全館人員進(jìn)行數(shù)字化安全風(fēng)險(xiǎn)教育,讓檔案工作者做好數(shù)字化期間的監(jiān)督工作,確保數(shù)字化工作期間,檔案信息和原件得到最大程度的安全保障。
主要參考文獻(xiàn)
[1]李建朋.檔案數(shù)字化面臨的風(fēng)險(xiǎn)及其防控[J].四川檔案,2011(2).
[2]孫寧寧.檔案數(shù)字化管理體系建設(shè)問(wèn)題研究[J].黑龍江史志,2014(3).
[3]陳明,李莉.對(duì)實(shí)施檔案數(shù)字化工作的幾點(diǎn)思考[J].蘭臺(tái)內(nèi)外,2014(1).
[4]種金成,何祖華.高校館藏檔案數(shù)字化實(shí)施方案及安全策略研究[J].黑龍江檔案,2014(1).
[5]王靜.對(duì)檔案信息安全體系建設(shè)的幾點(diǎn)思考[J]. 東方企業(yè)文化,2014(3).
[6]王翠紅.實(shí)施檔案數(shù)字化管理的幾點(diǎn)思考[J]. 檔案管理, 2013(5).
[7]孟慶華.利用信息化建設(shè)創(chuàng)新檔案工作[J]. 黑龍江史志,2013(15).
[8]安艷芳.淺談網(wǎng)絡(luò)環(huán)境下檔案信息化管理與服務(wù)機(jī)制的創(chuàng)新[J].山西檔案, 2012(z1).
[9]所桂萍,王輝凱,李寶玲. 現(xiàn)代檔案安全保護(hù)及應(yīng)對(duì)策略研究——基于河南省檔案安全調(diào)研的視角[J]. 鄭州大學(xué)學(xué)報(bào):哲學(xué)社會(huì)科學(xué)版, 2011(5).
10.3969/j.issn.1673 - 0194.2016.16.127
G270.7
A
1673-0194(2016)16-0195-02
2016-07-02
2013年南京中醫(yī)藥大學(xué)校哲學(xué)社會(huì)科學(xué)基金項(xiàng)目(13XSK09)。