文·李艷娟
當(dāng)前,國(guó)內(nèi)的檔案信息化已進(jìn)入全方位、多層次實(shí)施階段,存量數(shù)字化、增量電子化是檔案信息化建設(shè)的兩大數(shù)據(jù)來(lái)源。然而,以利用為主導(dǎo)和目的的檔案數(shù)字化,質(zhì)量體系還存在較多不足,數(shù)字化成果的質(zhì)量還有待于進(jìn)一步提高。筆者就當(dāng)前檔案數(shù)字化成果質(zhì)量普遍存在的問(wèn)題做一簡(jiǎn)要分析,以求與專(zhuān)家同行共同探討提高。
影響數(shù)字化檔案質(zhì)量的因素有多種,比如,數(shù)字化建設(shè)方和加工方是否共同制定有合理的質(zhì)量計(jì)劃,數(shù)字化加工方是否有完善的質(zhì)量保證措施和嚴(yán)格的質(zhì)量控制過(guò)程,數(shù)字化過(guò)程中加工方、監(jiān)理方、驗(yàn)收方等各環(huán)節(jié)是否協(xié)助密切良好等。
在數(shù)字化加工環(huán)節(jié),數(shù)字化加工服務(wù)單位針對(duì)數(shù)字化的機(jī)制和各項(xiàng)工作制度是否完善,項(xiàng)目經(jīng)理數(shù)字化加工過(guò)程中管理經(jīng)驗(yàn)是否豐富,數(shù)字化加工流程是否得到充分優(yōu)化,數(shù)字化加工流程各環(huán)節(jié)上的加工人員是否得到足夠的培訓(xùn)和技術(shù)指導(dǎo),是否有專(zhuān)門(mén)的質(zhì)量檢驗(yàn)環(huán)節(jié),質(zhì)量檢驗(yàn)工作是否科學(xué)、高效、準(zhǔn)確,以上所述均為影響數(shù)字化加工成果質(zhì)量的重要因素。
1.項(xiàng)目經(jīng)理因素。實(shí)際工作中,數(shù)字化加工服務(wù)單位很多會(huì)同時(shí)擔(dān)負(fù)多個(gè)建設(shè)單位的數(shù)字化任務(wù),導(dǎo)致有經(jīng)驗(yàn)的項(xiàng)目經(jīng)理緊缺,一些僅僅參加了管理培訓(xùn)的人員被推上了項(xiàng)目經(jīng)理的崗位,致使項(xiàng)目經(jīng)理角色在項(xiàng)目上應(yīng)有的作用發(fā)揮不出來(lái),特別在數(shù)字化加工現(xiàn)場(chǎng)這種動(dòng)態(tài)變化的場(chǎng)合,數(shù)字化加工流程各環(huán)節(jié)在人員、設(shè)備、技術(shù)等方面的優(yōu)化上,就會(huì)顯得生疏、死板或無(wú)計(jì)可施。
2.具體操作人員因素。數(shù)字化加工流程各環(huán)節(jié)操作人員的技術(shù)成熟度和認(rèn)真度,對(duì)數(shù)字化成果的質(zhì)量至關(guān)重要,畢竟成果是這些人員的共同操作的結(jié)果。前處理人員若漏編頁(yè)碼或編頁(yè)有誤,就會(huì)直接影響目錄著錄人員的著錄頁(yè)碼或頁(yè)數(shù)有誤;目錄著錄人員需要嚴(yán)格按照相關(guān)著錄標(biāo)準(zhǔn)實(shí)施著錄工作,一走神可能就會(huì)有錯(cuò)字生成、目錄串行、數(shù)字誤差、時(shí)間不符邏輯等問(wèn)題產(chǎn)生;由于紙張薄弱再加上翻頁(yè)較快,掃描人員也可能會(huì)產(chǎn)生漏掃情況;圖像處理環(huán)節(jié)會(huì)出現(xiàn)漏裁邊,等等。這就讓作為數(shù)據(jù)質(zhì)量把關(guān)的質(zhì)檢環(huán)節(jié)顯得尤為重要。由于集中到此的數(shù)據(jù)量巨大,人工質(zhì)檢任務(wù)繁重,若再?zèng)]有較好的自動(dòng)質(zhì)檢工具進(jìn)行輔助,如此交付的數(shù)字化成果質(zhì)量將會(huì)大打折扣。
檔案數(shù)字化監(jiān)理的作用不可小覷,對(duì)數(shù)字化成果質(zhì)量的監(jiān)理應(yīng)是其工作中最重要的一部分。從加工方交付過(guò)來(lái)的包括目錄數(shù)據(jù)和數(shù)字化原文數(shù)據(jù)在內(nèi)的大量數(shù)據(jù),在嚴(yán)格按照建設(shè)方要求的情況下,會(huì)大大占據(jù)監(jiān)理方工作人員的時(shí)間而無(wú)暇顧及其他監(jiān)理活動(dòng)。如果監(jiān)理方因成本限制而削減人員的投入數(shù)量,或在監(jiān)理成效和監(jiān)理進(jìn)度上作出權(quán)衡,將會(huì)對(duì)數(shù)字化成果的監(jiān)理效果起到一定的消極作用,原本可能該百分百監(jiān)理的數(shù)據(jù),變成了一定程度的抽檢,高抽檢率變成了低抽檢率。
再者,很多監(jiān)理單位純靠人工進(jìn)行數(shù)據(jù)檢查,而沒(méi)有成熟的自動(dòng)化工具的輔助,大大削減了他們的監(jiān)理能力。原本很多可進(jìn)行標(biāo)準(zhǔn)化檢測(cè)的項(xiàng),如漏掃、漏著錄、頁(yè)數(shù)頁(yè)碼錯(cuò)誤、時(shí)間錯(cuò)誤、圖片不可讀、分辨率不夠、漏裁邊、密級(jí)有誤、檔案件重復(fù)等,完全靠人力而非自動(dòng)進(jìn)行檢測(cè),會(huì)大大浪費(fèi)人力資源和降低工作效率,且會(huì)有相當(dāng)一部分質(zhì)量問(wèn)題項(xiàng)被非人為地埋沒(méi)或忽略掉。
建設(shè)方一般組織自有人員成立驗(yàn)收小組對(duì)監(jiān)理交付過(guò)來(lái)的數(shù)據(jù)進(jìn)行最終驗(yàn)收。而多數(shù)情況下,驗(yàn)收方式會(huì)采用一定比率的抽檢。人工抽檢和自動(dòng)工具抽檢并用的方式,當(dāng)然是較為理想的方式,但據(jù)筆者了解,相當(dāng)多的建設(shè)方驗(yàn)收環(huán)節(jié)都是純?nèi)斯を?yàn)收,他們或沒(méi)有使用自動(dòng)抽檢工具的意識(shí),或找不到理想的自動(dòng)抽檢工具,驗(yàn)收效率可想而知。
為促進(jìn)我國(guó)數(shù)字檔案館建設(shè)向更深層次發(fā)展,2014年12月國(guó)家檔案局發(fā)布《數(shù)字檔案館系統(tǒng)測(cè)試辦法》(以下稱(chēng)為《辦法》),并于2015年開(kāi)始在全國(guó)實(shí)施“國(guó)家級(jí)數(shù)字檔案館”和“國(guó)家級(jí)示范數(shù)字檔案館”測(cè)評(píng)工作。《辦法》中把館藏紙質(zhì)檔案數(shù)字化率作為檔案館能否參與測(cè)試的硬性指標(biāo)之一,而測(cè)評(píng)指標(biāo)的100分中有33分是針對(duì)紙質(zhì)檔案數(shù)字化的,5分是針對(duì)數(shù)字化檔案質(zhì)量的。由此可見(jiàn),檔案數(shù)字化加工成果質(zhì)量在數(shù)字檔案館建設(shè)中占有很重要的地位??梢哉f(shuō),全國(guó)范圍內(nèi)的數(shù)字檔案館系統(tǒng)測(cè)試工作,正有力推動(dòng)著各級(jí)檔案館加強(qiáng)對(duì)數(shù)字化檔案質(zhì)量的重視程度。
對(duì)于已經(jīng)完成紙質(zhì)檔案數(shù)字化工作的檔案館,要想通過(guò)“國(guó)家級(jí)數(shù)字檔案館”或“國(guó)家級(jí)示范數(shù)字檔案館”測(cè)試,對(duì)數(shù)字化成果質(zhì)量的再檢測(cè)并對(duì)查出的問(wèn)題進(jìn)行修正,已成為系統(tǒng)測(cè)試前的一項(xiàng)重要工作。而人工檢測(cè)+自動(dòng)檢測(cè)已成為各級(jí)檔案館數(shù)字化檔案質(zhì)量檢測(cè)方案中的一個(gè)標(biāo)準(zhǔn)檢測(cè)模式。
而未開(kāi)始或正在紙質(zhì)檔案數(shù)字化進(jìn)程中的檔案館,也急需一種強(qiáng)大的自動(dòng)檢測(cè)工具,減輕人工質(zhì)量檢測(cè)工作的負(fù)載,幫助他們高效率地提高數(shù)字化檔案的質(zhì)量,以期順利通過(guò)數(shù)字檔案館的系統(tǒng)測(cè)試。
檔案行業(yè)的信息系統(tǒng),一直以來(lái)被認(rèn)為小眾系統(tǒng)而不被計(jì)算機(jī)特別是軟件行業(yè)的大小巨頭所看中,隨著國(guó)家檔案局對(duì)數(shù)字檔案館建設(shè)的不斷推動(dòng)且在全國(guó)范圍內(nèi)遍地開(kāi)花,大小巨頭們都逐漸把更多的注意力投向檔案行業(yè)。分別基于局域網(wǎng)、政網(wǎng)和外網(wǎng)的檔案系統(tǒng),國(guó)內(nèi)有幾家軟件行業(yè)的大佬已向市場(chǎng)提供較為成熟的產(chǎn)品。而談到數(shù)字化檔案質(zhì)量檢測(cè)方面的軟件系統(tǒng),基本被市場(chǎng)忽略或不屑一顧。原因很簡(jiǎn)單,一是質(zhì)量檢測(cè)只是檔案行業(yè)檔案數(shù)字化工作眾多工作環(huán)節(jié)的其中之一,體量偏小而容易被輕視;二是針對(duì)數(shù)字化檔案質(zhì)量檢測(cè),國(guó)家目前還沒(méi)有出臺(tái)相應(yīng)的檢測(cè)標(biāo)準(zhǔn);三是對(duì)軟件行業(yè)來(lái)說(shuō),不像電子檔案那樣,只要根據(jù)國(guó)家的關(guān)于檔案“四性”檢測(cè)的相關(guān)規(guī)范,研發(fā)符合電子檔案歸檔規(guī)則或電子檔案封裝規(guī)范的檢測(cè)系統(tǒng)即可,數(shù)字化檔案的情形就稍顯復(fù)雜,出現(xiàn)質(zhì)量問(wèn)題的可能點(diǎn)較多,所以開(kāi)發(fā)數(shù)字化檔案質(zhì)量檢測(cè)系統(tǒng)的難度就偏大一點(diǎn);四是軟件行業(yè)的產(chǎn)品經(jīng)理和工程師們無(wú)暇顧及數(shù)字化檔案質(zhì)量產(chǎn)生的相關(guān)細(xì)節(jié),所以也無(wú)法有針對(duì)性地研發(fā)數(shù)字化檔案質(zhì)量檢測(cè)方面的軟件工具。
筆者曾參與或觀摩過(guò)本地幾個(gè)檔案部門(mén)的檔案數(shù)字化工作,也曾與幾個(gè)數(shù)字化加工和監(jiān)理單位的負(fù)責(zé)人溝通交流,普遍反映自己沒(méi)有拿來(lái)即用的檢測(cè)工具,即便有,也是針對(duì)某個(gè)檔案館(室)特定的需求而臨時(shí)開(kāi)發(fā)的。這些檢測(cè)工具具有以下特點(diǎn)。
數(shù)字化檔案的質(zhì)量問(wèn)題種類(lèi)較多,如,JPEG圖片漏掃,PDF原文漏頁(yè)、目錄漏著錄、頁(yè)數(shù)與實(shí)際原文不對(duì)應(yīng)、目錄與數(shù)字化原文掛接串位、起止頁(yè)碼(如果有)著錄有誤、密級(jí)有誤、形成時(shí)間邏輯錯(cuò)誤、圖片不可讀、PDF原文不可讀、圖片分辨率不夠、圖片漏裁邊、圖片傾斜度過(guò)大、圖片不清晰、檔案案件重復(fù)、案卷整卷漏掃、目錄中錯(cuò)別字、責(zé)任者不對(duì)應(yīng)、文號(hào)有誤、文號(hào)漏填、年度(如果有)有誤、形成時(shí)間誤差、標(biāo)題與原文內(nèi)容不對(duì)應(yīng)等20余種。數(shù)字化加工方或監(jiān)理方或驗(yàn)收方所使用的檢測(cè)工具,很多僅僅包括上述質(zhì)量問(wèn)題的一小部分,很多方面的質(zhì)量問(wèn)題無(wú)法檢測(cè)而被交付到了數(shù)字化成果庫(kù),給以后的數(shù)字檔案館系統(tǒng)測(cè)試埋下了隱患,更加影響檔案的公眾利用。
目前絕大部分?jǐn)?shù)字化檔案質(zhì)量檢測(cè)工具都存在普適性差的弱點(diǎn)。表現(xiàn)在,在一個(gè)檔案數(shù)字化場(chǎng)合能夠正常使用,而到另外一個(gè)檔案數(shù)字化場(chǎng)合使用時(shí),遇到幾個(gè)增加或稍有變化的自定義檔案目錄字段就基本癱瘓;能夠?qū)嵤┳詣?dòng)檢測(cè),但無(wú)法用于人工檢測(cè);數(shù)字化加工方、監(jiān)理方、驗(yàn)收方等都能單獨(dú)使用,但三方(多方)同一個(gè)檢測(cè)系統(tǒng)中無(wú)法協(xié)作使用,缺乏統(tǒng)一的質(zhì)檢流程上的管理。
檔案數(shù)字化最終成果的好壞,是多環(huán)節(jié)多方面共同作用的結(jié)果。數(shù)字化加工服務(wù)單位在其中扮演的角色是最主要的,制度優(yōu)良、管理人員經(jīng)驗(yàn)豐富、團(tuán)隊(duì)訓(xùn)練有素是合格的數(shù)字化加工服務(wù)單位必備的條件;監(jiān)理工作能為檔案數(shù)字化成果質(zhì)量的提高保駕護(hù)航,錦上添花;自動(dòng)質(zhì)檢和驗(yàn)收系統(tǒng)作為一種重要的質(zhì)量保證手段,不僅能夠提高效率、節(jié)省人力,更能在發(fā)現(xiàn)關(guān)鍵質(zhì)量問(wèn)題上起到不可或缺且無(wú)可替代的作用。傳統(tǒng)檔案的數(shù)字化工作,其完整的質(zhì)量體系,應(yīng)為數(shù)字化加工方、數(shù)字化監(jiān)理方和數(shù)字化驗(yàn)收方三方,在各自質(zhì)量體系的基礎(chǔ)上,共同制定形成的,在整個(gè)數(shù)字化過(guò)程中統(tǒng)一實(shí)施并進(jìn)行控制的質(zhì)量措施。