摘 要:本文歸納和總結(jié)文獻數(shù)字化制作過程中的縮微膠卷數(shù)字化圖像加工流程,并對加工過程中由流程設(shè)計造成的問題進行思考與探討。
關(guān)鍵詞:縮微膠卷;膠卷數(shù)字化;圖像加工;流程優(yōu)化
中圖分類號:TP391.41
數(shù)字化信息制作部作為上海圖書館信息處理中心的歷史文獻數(shù)字化制作部門,主要承擔館內(nèi)及館外資料的數(shù)字化生產(chǎn),包括期刊、報紙、古籍善本、縮微膠卷、特殊資源等。本文歸納和總結(jié)文獻數(shù)字化制作過程中的縮微膠卷(后簡稱膠卷)數(shù)字化圖像加工流程,并對加工過程中由流程設(shè)計造成的問題進行思考與探討。
1 膠卷數(shù)字化圖像加工流程
1.1 準備工作。按加工計劃,借調(diào)膠卷并根據(jù)膠卷規(guī)格分配給相應(yīng)的膠卷掃描機或膠卷還原機,常用的有膠卷還原機microfilm sacnner 800、膠卷高速掃描儀MACH4。
1.2 機掃圖像生成。清點收到的膠卷,按膠卷號、刊名等信息生成本地存儲路徑。膠卷經(jīng)機掃還原后,按項目要求,生成TIF格式(或JPEG格式)的圖像文件,保存在相應(yīng)的存儲路徑中。完成圖像質(zhì)量自檢及圖像數(shù)量清點后,上傳至存儲服務(wù)器,進行圖像交接及原始圖像備份。
1.3 圖像處理。從存儲服務(wù)器下載圖像數(shù)據(jù)包,按加工要求,對圖像進行裁切、糾斜、拼接、去黑邊等處理。在圖像質(zhì)量查驗、修正的同時,按頁碼(書籍、期刊)或版(報紙)對圖像進行裁切,并根據(jù)加工內(nèi)容調(diào)整存儲結(jié)構(gòu)。該過程中形成2種不同類型的圖像處理流程。(1)期刊(書籍)流程。在本流程中,每一個圖像中含左右2頁,分別將裁切后獲得的圖像文件保存在對應(yīng)的文件夾內(nèi),如左側(cè)頁保存在L文件夾中,原文件名不變。最后通過文件批處理的方式,合并文件夾并按掃描順序和頁序重命名圖像文件,保存到本地工作路徑中。(2)報紙流程。在本流程中,每一個圖像中含2版以上內(nèi)容,按版面將圖像切割為若干小圖,并以“出版日期-版面號”或“原文件名-版面號”的命名方式保存到本地工作路徑中。
1.4 圖像校對(第一次)。從服務(wù)器下載已經(jīng)修正處理的圖像的數(shù)據(jù)包,按項目的圖像質(zhì)量要求,對圖像質(zhì)量進行逐張查驗,并校對數(shù)據(jù)完整性。經(jīng)校驗,整批合格的數(shù)據(jù)包,交下一加工工序加工;校驗中發(fā)現(xiàn)少量不合格圖像的數(shù)據(jù)包,由圖像校對者直接修改后,交下一加工工序;校驗中發(fā)現(xiàn)大量不合格圖像的數(shù)據(jù)包,則退回到上一道工序進行返工。
1.5 分冊。從存儲服務(wù)器下載圖像數(shù)據(jù)包,并按不同的出版形成,重建數(shù)據(jù)存儲結(jié)構(gòu)。完成后,將本地文件上傳服務(wù)器及備份服務(wù)器并提交分冊登記信息及圖像數(shù)量統(tǒng)計。(1)期刊(書籍)流程。將圖像文件按本劃分,分別存儲到相應(yīng)的文件夾中,一個文件夾對應(yīng)一本書。本工序中,增加一級存儲路徑,圖像文件存儲的目錄結(jié)構(gòu)由原來的一級目錄變?yōu)槎壞夸洝γ總€文件夾中的圖像文件,以0000(有封面的)或0001(無封面的)為初始頁,按圖像處理工序中形成的順序重命名圖像文件。(2)報紙流程。將圖像文件按出版日期劃分,分別存儲到對應(yīng)的以出版日期命名的文件夾中,一個文件夾對應(yīng)一份報紙。本工序中,增加一級存儲路徑,圖像文件存儲的目錄結(jié)構(gòu)由原來的一級目錄變?yōu)槎壞夸?。對每個文件夾中的圖像文件,以“出版日期-版面號”的命名方式重命名。當一個加工項目中,圖像文件數(shù)較少時,本工序與報紙的圖像處理工序合并進行。
1.6 圖像校對(第二次)。從服務(wù)器下載已完成分冊的數(shù)據(jù)包,按項目的圖像質(zhì)量要求,對圖像質(zhì)量進行逐張查驗,并參考分冊中數(shù)據(jù)量的統(tǒng)計結(jié)果,校對數(shù)據(jù)完整性。經(jīng)校驗,整批合格的數(shù)據(jù)包,交總校抽查;校驗中發(fā)現(xiàn)少量不合格圖像的數(shù)據(jù)包,由圖像校對者直接修改后,交總校抽查;校驗中發(fā)現(xiàn)大量不合格圖像的數(shù)據(jù)包,則退回到上一道工序進行返工。
1.7 總校。匯總通過圖像校對的數(shù)據(jù)包,經(jīng)最終抽查后,發(fā)現(xiàn)差錯的數(shù)據(jù)包,退回圖像校對環(huán)節(jié),重新核對;合格的數(shù)據(jù)包形成完整交接批次,交二次文獻加工平臺進行二次文獻數(shù)據(jù)加工。至此,膠卷數(shù)字化圖像加工工作完成。
2 問題與思考
以上是歷經(jīng)多年膠卷數(shù)字化項目逐步形成的圖像加工流程,經(jīng)實踐驗證是行之有效的。然而,每每在圖像制作過程中,會遇到這樣那樣的問題。
2.1 項目進度的問題。在加工項目啟動時,一般是按照制作計劃借調(diào)膠卷,按期刊或報紙種類來規(guī)劃生產(chǎn)加工總量。由于每種期刊或報紙的出版量差異較大,如按種來統(tǒng)計加工量,作為項目進度的依據(jù),并不能真實反映項目的進度。從膠卷的特點出發(fā),如能在項目啟動階段,預(yù)先登記膠卷號(期刊或報紙種類號)及相應(yīng)的膠卷盤數(shù),以膠卷的盤數(shù)作為項目進度控制的統(tǒng)計依據(jù),則能更好的反映項目的推進情況。
2.2 質(zhì)量控制與返工管理。在膠卷數(shù)字化圖像加工流程中,有2次圖像的校驗環(huán)節(jié),然而對于整個加工流程來說,其實每個工序都需要對其生產(chǎn)出來的圖像文件進行數(shù)量及質(zhì)量的查驗,在沒有管理軟件的幫助的情況下,這項工作的繁復(fù)而低效。由于不是每個環(huán)節(jié)都有一個有效的數(shù)據(jù)查驗機制,經(jīng)常會出現(xiàn)這樣的情況,當后一個加工環(huán)節(jié)接收數(shù)據(jù)后,發(fā)現(xiàn)大量錯誤而造成無法進行進一步的加工,不得不申請發(fā)起返工操作。這種情況下,一方面數(shù)據(jù)加工者額外的承擔了圖像校對的工作,一方面由于未在數(shù)據(jù)交接時發(fā)現(xiàn)問題,造成的工期的延誤。這里顯然需要合理使用技術(shù)手段,在每個加工環(huán)節(jié)提交數(shù)據(jù)前,對圖像文件的規(guī)范性和完整性等質(zhì)量問題進行查驗,一方面對質(zhì)量進行有效控制,另一方面則避免不比要的數(shù)據(jù)交接。同時,將質(zhì)量標準量化、返工流程規(guī)范化,以減少由多次返工造成的資源浪費與工期延誤。
2.3 項目管理規(guī)范化的問題。在現(xiàn)有的加工過程中,由于缺乏配套的管理工具,一般是以遍歷文件夾的方式來統(tǒng)計每次數(shù)據(jù)交接的總量,并通過電子表格的填寫來達到工作量統(tǒng)計的目的。雖然借助各種數(shù)據(jù)處理的工具也能達到管理的效果,但由于過程中,數(shù)據(jù)的錄入多依賴人工操作,錯誤數(shù)據(jù)的出現(xiàn)在所難免。解決這個問題,需要建設(shè)一套簡單、高效的項目管理系統(tǒng),由始至終對項目中生成及流轉(zhuǎn)的圖像文件進行狀態(tài)跟蹤,并記錄加工日志,一方面以規(guī)范的數(shù)據(jù)統(tǒng)計代替人工統(tǒng)計,解決各種統(tǒng)計數(shù)據(jù)的準確性問題;另一方面,通過加工日志,準確的反映圖像加工過程,使所有的加工操作可追溯。
3 流程重新設(shè)計
3.1 增加劃到環(huán)節(jié):這個環(huán)節(jié)主要承擔膠卷的整理登記工作,并依據(jù)膠卷登記表生成工單和服務(wù)器的存儲結(jié)構(gòu)。劃到完成后,比較膠卷數(shù)與工單總記錄數(shù)完成數(shù)據(jù)校驗。以工單為派工和交接的管理單位,改變由原先的人工劃分的數(shù)據(jù)批次或者數(shù)據(jù)包造成的工作量分配不均衡的問題。
3.2 在每個加工工序中增設(shè)數(shù)據(jù)校驗機制:以工單作為交接數(shù)據(jù)包的管理單位,由系統(tǒng)提供對工作量及圖像質(zhì)量控制中的通用屬性的查驗。(1)機掃圖像生成:1)工作量的校驗:按工單記錄,核對機掃膠卷數(shù)。2)圖像質(zhì)量自檢:由系統(tǒng)根據(jù)項目預(yù)設(shè)的文件屬性(dpi、文件后綴、圖像尺寸等)要求,對生成的圖片文件進行查驗。合格的,對應(yīng)工單標記為完成圖像生成,圖像文件上傳存儲服務(wù)器。不合格的,則提供不合格文件列表及不合格原因,由加工者選擇整批返工或按逐幀返工。(2)圖像處理:1)工作量的校驗:按加工日志中記錄的圖像分版數(shù)量,統(tǒng)計文件數(shù),對完工圖像文件數(shù)據(jù)包校驗文件數(shù)。2)圖像質(zhì)量自檢:由系統(tǒng)根據(jù)項目要求,對生成的圖片文件進行查驗。合格的,對應(yīng)工單標記為完成圖像處理,圖像文件上傳存儲服務(wù)器。不合格的,提供不合格文件列表及不合格原因,由加工者修正。(3)分冊:1)工作量的校驗:按加工日志中記錄的圖像分冊數(shù)量,統(tǒng)計冊數(shù)和文件數(shù),對完工圖像文件數(shù)據(jù)包校驗文件存儲路徑數(shù)和文件數(shù)。2)圖像質(zhì)量自檢:由系統(tǒng)根據(jù)項目要求,對生成的圖片文件進行查驗。合格的,對應(yīng)工單標記為完成圖像處理,圖像文件上傳存儲服務(wù)器。不合格的,提供不合格文件列表及不合格原因,由加工者修正。
3.3 圖像校對和返工管理的調(diào)整。(1)簡化圖像校對的工序:將圖像校對工序中原先的文件標準化及統(tǒng)計登記工作剝離,交由管理軟件完成,本工序只對圖像內(nèi)容負責(zé)。(2)增加返工發(fā)起的權(quán)限管理:由原先的流程中,每個環(huán)節(jié)都有可能發(fā)起返工的方式,調(diào)整為只能由校對和總校工序發(fā)起返工,而在加工環(huán)節(jié)中,如遇質(zhì)量問題,則按工單退回已接收的工單,同時注明退單理由。由管理者(總校或指定的管理角色)定期查詢退單的工單,如按退工理由為質(zhì)量問題的,發(fā)起返工,退回到該工單上一工序,重新加工。如為其他理由的,則按需要做另行派工的處理。
3.4 備份流程的調(diào)整:由原先的加工流程中的,完成加工即備份,調(diào)整為完成校對后并確認數(shù)據(jù)準確后,由校對工序發(fā)起備份。并由軟件比對2套拷貝的一致性,以保證數(shù)據(jù)完整。
以上是對膠卷數(shù)字化圖像加工流程調(diào)整的初步設(shè)想,其設(shè)計思路基于日常工作中遇到的一些問題與解決方法。然而,作為加工系統(tǒng)的優(yōu)化升級,其技術(shù)可行性以及設(shè)計的完整性有待實踐的驗證。
4 結(jié)束語
綜上所述,通過多年膠卷數(shù)字化工作的經(jīng)驗積累,對該加工過程中可能出現(xiàn)的問題及解決方法,進行了歸納和總結(jié),并提出了優(yōu)化調(diào)整的建議,希望為今后的加工項目提供參考。
參考文獻:
[1]唐磊.圖書館縮微文獻數(shù)字化與服務(wù)研究報告[J].數(shù)字與縮微影像,2005(03):15-18.
[2]張留杰,單廣榮.民族古籍縮微膠片數(shù)字化圖像分割方法選取研究[J].福建電腦,2008(01):3-4.
[3]張立朝,王萌萌,經(jīng)莉,陳湛綺.探析彩色縮微技術(shù)在信息資源長期保存中的應(yīng)用[J].數(shù)字與縮微影像,2013(03):1-4.
作者簡介:夏駿,本科,助理工程師,研究方向:縮微文獻數(shù)字化;陶文晴,本科,研究方向:縮微文獻數(shù)字化。
作者單位:上海圖書館上??茖W(xué)技術(shù)情報研究所,上海 200031