劉娉婷
(國(guó)家圖書(shū)館,北京 100081)
我國(guó)是歷史悠久的文明古國(guó),擁有卷帙浩繁的文獻(xiàn)典籍。據(jù)統(tǒng)計(jì),我國(guó)現(xiàn)存古籍總數(shù)3千余萬(wàn)冊(cè),其中善本古籍超過(guò)250萬(wàn)冊(cè)[1]。這些古籍是中華文化的瑰寶,但它們具有不可再生性,因此如何保護(hù)和利用好珍貴文獻(xiàn)典籍,是現(xiàn)階段工作的當(dāng)務(wù)之急。為進(jìn)一步加強(qiáng)古籍保護(hù)工作,2007年1月19日,國(guó)務(wù)院辦公廳下發(fā)《關(guān)于進(jìn)一步加強(qiáng)古籍保護(hù)工作的意見(jiàn)》(國(guó)辦發(fā)[2007]6號(hào))(以下簡(jiǎn)稱《意見(jiàn)》),對(duì)全國(guó)古籍保護(hù)工作進(jìn)行總體部署,正式實(shí)施“中華古籍保護(hù)計(jì)劃”,這是我國(guó)歷史上首次由政府主持開(kāi)展的全國(guó)性古籍保護(hù)工程?!兑庖?jiàn)》提出了“制定古籍?dāng)?shù)字化標(biāo)準(zhǔn),規(guī)范古籍?dāng)?shù)字化工作,建立古籍?dāng)?shù)字資源庫(kù)”這一明確要求[2]。在此背景下,國(guó)家古籍保護(hù)中心積極地開(kāi)展古籍?dāng)?shù)字化工作,于2012年啟動(dòng)了“中華珍貴典籍資源庫(kù)”建設(shè)項(xiàng)目。
在2016年發(fā)布的《“十三五”規(guī)劃綱要》中,國(guó)務(wù)院將中華古籍保護(hù)計(jì)劃列為文化領(lǐng)域的重大工程,《綱要》中明確提出推動(dòng)古籍原生性和再生性保護(hù)、建設(shè)國(guó)家古籍資源數(shù)據(jù)庫(kù)[3]。隨后,文化部于2017年發(fā)布《“十三五”時(shí)期全國(guó)古籍保護(hù)工作規(guī)劃》(以下簡(jiǎn)稱《規(guī)劃》),這是我國(guó)古籍保護(hù)工作方面的首個(gè)五年規(guī)劃,《規(guī)劃》中將數(shù)字化建設(shè)列為重點(diǎn)任務(wù),將“中華古籍?dāng)?shù)字資源庫(kù)”建設(shè)項(xiàng)目列為重點(diǎn)項(xiàng)目[4]。在國(guó)家政策的支持下,古籍?dāng)?shù)字化已經(jīng)逐漸成為古籍保護(hù)的重點(diǎn)方向,古籍?dāng)?shù)字化工作正在全面有序地進(jìn)行。筆者將闡述中華珍貴典籍資源庫(kù)的建設(shè)實(shí)踐,對(duì)實(shí)踐中存在的問(wèn)題進(jìn)行分析和探討,以期為古籍?dāng)?shù)字化工作提供有益的借鑒和參考。
自2008年至今,國(guó)務(wù)院先后公布了五批《國(guó)家珍貴古籍名錄》,12274部古籍入選,包括漢文和少數(shù)民族古籍、簡(jiǎn)帛古籍、敦煌遺書(shū)、碑帖拓本、古地圖和外文珍貴古籍[2]。中華珍貴典籍資源庫(kù),以《國(guó)家珍貴古籍名錄》為基礎(chǔ),從五批名錄中遴選出1115部珍貴古籍進(jìn)行數(shù)字化,優(yōu)先選擇古籍價(jià)值比較大、存世量比較小、卷次比較少的古籍。
秉持古籍?dāng)?shù)字化標(biāo)準(zhǔn)先行建設(shè)的原則,國(guó)家古籍保護(hù)中心于2012年組織編制了《古籍?dāng)?shù)字化工作手冊(cè)》(試用本),并將其作為中華珍貴典籍資源庫(kù)建設(shè)的標(biāo)準(zhǔn)規(guī)范,在全國(guó)范圍內(nèi)推廣執(zhí)行,珍貴典籍?dāng)?shù)字化工作于2013年全面開(kāi)展。隨著數(shù)字化工作的進(jìn)行,針對(duì)數(shù)字化實(shí)踐中發(fā)現(xiàn)的問(wèn)題,國(guó)家古籍保護(hù)中心于2014年推出了《古籍?dāng)?shù)字化工作手冊(cè)》(V.1修訂版),對(duì)手冊(cè)進(jìn)行了修訂完善。
數(shù)字化圖像分長(zhǎng)期保存級(jí)和發(fā)布服務(wù)級(jí)兩個(gè)級(jí)別。“中華珍貴典籍資源庫(kù)”建設(shè)項(xiàng)目的長(zhǎng)期保存級(jí)采用不壓縮或無(wú)損壓縮的TIFF格式,分辨率為400DPI,出于保真原則,一般采用24位真彩圖像。為了保證圖像輸入設(shè)備、輸出設(shè)備的色彩匹配,實(shí)現(xiàn)不同顯示器的色彩顯示的一致性[5],在每部古籍?dāng)?shù)字化前,需要先掃描或拍照IT8標(biāo)準(zhǔn)色彩導(dǎo)表(以下簡(jiǎn)稱色卡),用來(lái)準(zhǔn)確還原圖像顏色。同時(shí)為了記錄古籍開(kāi)本大小,每部古籍第一冊(cè)封面數(shù)字化時(shí)需要在原件左側(cè)放置直尺。
數(shù)字化圖像由三級(jí)結(jié)構(gòu)保存,第一級(jí)文件夾為加工記錄標(biāo)識(shí)號(hào),由4位單位代碼和4位古籍流水號(hào)構(gòu)成;第二級(jí)文件夾為冊(cè)號(hào),由4位數(shù)字構(gòu)成,從0001開(kāi)始,按流水號(hào)命名古籍冊(cè)數(shù);第三級(jí)為古籍圖像文件和色卡圖像文件,古籍圖像文件名由4位數(shù)字構(gòu)成,從0001開(kāi)始,按流水號(hào)命名,色卡圖像文件命名依色卡數(shù)字化方式而定,如果古籍使用單臺(tái)設(shè)備進(jìn)行數(shù)字化,需要數(shù)字化一個(gè)色卡,色卡圖像命名為“seka”,如果古籍同時(shí)使用兩臺(tái)設(shè)備進(jìn)行數(shù)字化,即古籍兩個(gè)半葉同時(shí)數(shù)字化,需要數(shù)字化兩個(gè)色卡,色卡圖像分別命名為“seka1”和“seka2”。
“中華珍貴典籍資源庫(kù)”建設(shè)項(xiàng)目的元數(shù)據(jù)包括文獻(xiàn)整理登記表、描述元數(shù)據(jù)、管理元數(shù)據(jù)3個(gè)部分,使用ACCESS數(shù)據(jù)庫(kù)來(lái)保存。文獻(xiàn)整理登記表包括《文獻(xiàn)整理登記表(全書(shū))》和《文獻(xiàn)整理登記表(各卷)》,記錄了古籍原件的書(shū)況信息。描述元數(shù)據(jù)包括《書(shū)目數(shù)據(jù)表》和《卷目數(shù)據(jù)表》,記錄了書(shū)目信息和卷目信息。管理元數(shù)據(jù)包括《外字表》和《管理信息表》,記錄了古籍的外字信息和數(shù)字化加工過(guò)程中的管理信息。
為保障“中華珍貴典籍資源庫(kù)”建設(shè)項(xiàng)目順利進(jìn)行,國(guó)家古籍保護(hù)中心共舉辦了三期古籍?dāng)?shù)字化培訓(xùn)班。第一期于2012年在國(guó)家圖書(shū)館舉行,來(lái)自26個(gè)省、自治區(qū)、直轄市31個(gè)單位的53名學(xué)員,參加了培訓(xùn)班。第二期于2013年在烏魯木齊市舉辦。第三期于2014年在天津圖書(shū)館舉行,來(lái)自27個(gè)省、自治區(qū)、直轄市30個(gè)單位的44名學(xué)員參加了培訓(xùn)。培訓(xùn)班針對(duì)各個(gè)參建單位古籍?dāng)?shù)字化的實(shí)際情況和提出的問(wèn)題,從古籍?dāng)?shù)字化的工作流程、元數(shù)據(jù)著錄、實(shí)物掃描技術(shù)與方法等方面進(jìn)行了培訓(xùn),同時(shí)提供了實(shí)踐機(jī)會(huì),讓學(xué)員們從理論和實(shí)踐兩個(gè)方面了解和掌握古籍?dāng)?shù)字化的流程,為“中華珍貴典籍資源庫(kù)”項(xiàng)目建設(shè)奠定了基礎(chǔ)。
“中華珍貴典籍資源庫(kù)”建設(shè)項(xiàng)目的開(kāi)展,極大地帶動(dòng)了全國(guó)公共圖書(shū)館古籍?dāng)?shù)字化項(xiàng)目工作的進(jìn)展,該項(xiàng)目具體的數(shù)字化工作是由各個(gè)古籍收藏單位承擔(dān)的,首批參建單位包括浙江圖書(shū)館、安徽省圖書(shū)館、南京圖書(shū)館等27家,截至目前已陸續(xù)收到全國(guó)21家單位約47萬(wàn)拍珍貴古籍影像資源。
古籍?dāng)?shù)字化工作分為古籍?dāng)?shù)字化加工準(zhǔn)備、古籍元數(shù)據(jù)著錄、古籍圖像數(shù)字化、數(shù)據(jù)命名、數(shù)據(jù)提交、數(shù)據(jù)驗(yàn)收、數(shù)據(jù)發(fā)布利用7個(gè)部分,具體的操作流程如圖1所示。
圖1 古籍?dāng)?shù)字化操作流程
由于各古籍收藏單位的經(jīng)濟(jì)實(shí)力和技術(shù)水平參差不齊、圖像采集的操作方法各有差異,導(dǎo)致古籍圖像成品質(zhì)量相差較大?!豆偶?dāng)?shù)字化工作手冊(cè)》(V.1修訂版)(以下簡(jiǎn)稱《手冊(cè)》)中的規(guī)范要求可能并不適用于所有的古籍。下面從數(shù)字化加工準(zhǔn)備、數(shù)字化加工和元數(shù)據(jù)制作3個(gè)方面講述古籍?dāng)?shù)字化實(shí)踐工作,并對(duì)古籍?dāng)?shù)字化過(guò)程中出現(xiàn)的若干問(wèn)題進(jìn)行探討。
本階段是指在古籍出庫(kù)后核對(duì)題名、種數(shù)和冊(cè)數(shù),對(duì)古籍進(jìn)行逐葉翻檢,詳細(xì)記錄古籍的大小、缺葉、透字、皺折、夾框等情況,統(tǒng)計(jì)古籍的葉數(shù)信息,編制文獻(xiàn)整理登記表。數(shù)字化加工準(zhǔn)備階段一方面對(duì)古籍的現(xiàn)狀進(jìn)行了比較全面的記錄,另一方面可以根據(jù)古籍的開(kāi)本大小、裝幀形式、中縫寬度、透字等實(shí)際情況,確定數(shù)字化的方式和設(shè)備。部分古籍沒(méi)有頁(yè)碼信息,為記錄缺葉、透字、皺折、夾框等詳細(xì)信息增加了難度。
古籍的裝幀形式多種多樣,難免存在特殊現(xiàn)象。例如《灌頂藥師經(jīng)疏》這部卷軸裝古籍,接縫處附有正反兩面的注解,而使用《手冊(cè)》中提供的圖像采集方法并不能夠完整、準(zhǔn)確地反映出該部古籍的原貌。
2.2.1 數(shù)字化加工設(shè)備
古籍?dāng)?shù)字化的主要方式是掃描或拍照,設(shè)備為掃描儀或數(shù)碼拍照相機(jī)。為了達(dá)到圖像的分辨率要求,數(shù)字化設(shè)備的規(guī)格需要根據(jù)古籍的開(kāi)本大小來(lái)選擇。從各個(gè)古籍收藏單位提交的數(shù)據(jù)來(lái)看,使用的掃描儀的最大幅面大多是A3幅面,對(duì)于開(kāi)本尺寸較大的古籍不能一次性完成掃描,如果分畫(huà)幅掃描再進(jìn)行拼接,得到的數(shù)字化圖像與古籍原件將有一定的出入。
部分古籍收藏單位使用了V型掃描儀,對(duì)于V型掃描儀,由于玻璃壓板是由兩塊玻璃板拼接而成,拼接處可能會(huì)遮擋古籍原件部分文字,造成部分信息缺失,如圖2所示。由于各古籍收藏單位的經(jīng)濟(jì)實(shí)力有差異,購(gòu)置的數(shù)字化加工設(shè)備規(guī)格參差不齊,部分早期的數(shù)字化加工設(shè)備已經(jīng)不能滿足現(xiàn)在的古籍?dāng)?shù)字化要求,對(duì)于具有一定使用年限的數(shù)字化加工設(shè)備,存在著部件老化等現(xiàn)象,如果不及時(shí)進(jìn)行維護(hù)和保養(yǎng),將嚴(yán)重影響數(shù)字化圖像的質(zhì)量。
圖2
2.2.2 數(shù)字化加工環(huán)境
數(shù)字化加工環(huán)境需要注意防護(hù)光源,避免透光或反射光影響數(shù)字化圖像。相機(jī)本身不具備光源,一般需要人工設(shè)置光源,如果光源設(shè)置不合理,容易造成數(shù)字化圖像亮度偏高或局部有陰影,影響圖像質(zhì)量。掃描儀一般自帶光源,但自帶光源的位置固定、不可調(diào)節(jié),往往也需要增加光源,否則可能造成數(shù)字化圖像色彩不均或局部有陰影。
2.2.3 數(shù)字化加工過(guò)程
古籍收藏單位中專門從事古籍?dāng)?shù)字化加工的工作人員較少,一般也沒(méi)有經(jīng)過(guò)系統(tǒng)的培訓(xùn),數(shù)字化加工的經(jīng)驗(yàn)不足,數(shù)字化加工的過(guò)程并不完全符合規(guī)范,影響了數(shù)字化圖像的質(zhì)量,具體的不規(guī)范現(xiàn)象有下面幾種。
(1)數(shù)字化時(shí)古籍沒(méi)有添加襯紙,圖像透字現(xiàn)象嚴(yán)重。古籍原件年代久遠(yuǎn),可能存在透背葉字跡、蟲(chóng)蛀、局部破損等現(xiàn)象,這種情況下需要墊上古籍適用的襯紙后再進(jìn)行數(shù)字化。添加襯紙這一項(xiàng)操作,一方面需要古籍相關(guān)的專業(yè)人員來(lái)進(jìn)行,另一方面降低了古籍?dāng)?shù)字化的加工效率,所以古籍收藏單位通常省略這一步驟,造成數(shù)字化圖像有透字現(xiàn)象,如圖3所示。
圖3
(2)數(shù)字化圖像上有異物、背景雜亂。掃描儀上的玻璃壓板如果不注意保護(hù),久用之后會(huì)產(chǎn)生劃痕,如果不定期清潔,玻璃壓板上會(huì)有污漬,掃描后劃痕和污漬將顯示在數(shù)字化圖像上,影響圖像質(zhì)量,如圖4所示,圖像上有明顯的劃痕。古籍原件具有一定的厚度,翻開(kāi)掃描時(shí)需要保證兩側(cè)葉面在同一水平線上,否則數(shù)字化圖像的中縫處容易產(chǎn)生黑色陰影,影響圖像質(zhì)量,如圖5所示。部分掃描儀自帶的掃描背景不是純色的,如果掃描時(shí)不使用背景紙,會(huì)造成圖像背景雜亂,如圖6所示。
圖4
圖5
圖6
(3)數(shù)字化圖像沒(méi)有留白。為了盡可能地保留古籍原件的信息,圖像葉面外圍應(yīng)該有一定范圍的留白,由于操作人員的疏忽,存在圖像沒(méi)有留白的現(xiàn)象,可能造成圖像中天頭、地腳等原件信息的缺失,不能完整地反映古籍原貌,如圖7所示。
圖7
(4)色卡上有污漬。色卡是色彩管理的重要手段,可以準(zhǔn)確還原圖像顏色。在實(shí)際操作過(guò)程中,工作人員往往不注重色卡的清潔,多次使用造成色卡表面上有污漬,影響將來(lái)還原圖像顏色。
(5)數(shù)字化時(shí)直尺放置不規(guī)范。數(shù)字化時(shí)使用直尺是為了記錄古籍的開(kāi)本大小,對(duì)每部古籍第一冊(cè)封面進(jìn)行數(shù)字化時(shí),需要將直尺放置于古籍原件左側(cè),距離古籍0.1-1厘米。如圖8所示,直尺放置在古籍的右側(cè)和下方,右側(cè)直尺緊貼古籍,下方直尺更是墊在了古籍下面。
圖8
(6)數(shù)字化圖像歪斜較大。古籍放置的位置不規(guī)范,可能造成數(shù)字化圖像歪斜較大,如圖9所示。
圖9
“中華珍貴典籍資源庫(kù)”建設(shè)項(xiàng)目的元數(shù)據(jù)制作較為復(fù)雜。盡管《手冊(cè)》對(duì)古籍元數(shù)據(jù)著錄進(jìn)行了詳細(xì)說(shuō)明,國(guó)家古籍保護(hù)中心也舉辦了多期古籍?dāng)?shù)字化培訓(xùn)班,但古籍元數(shù)據(jù)著錄不規(guī)范現(xiàn)象時(shí)有發(fā)生,一方面是由于工作人員對(duì)《手冊(cè)》理解不透徹,未完全依照《手冊(cè)》進(jìn)行著錄,另一方面是《手冊(cè)》本身有不完善的地方,這里主要列舉《手冊(cè)》中不完善的地方。
《手冊(cè)》主要針對(duì)線裝類的古籍?dāng)?shù)字化進(jìn)行了規(guī)范要求,實(shí)際上古籍的裝幀形式多種多樣,《文獻(xiàn)整理登記表(各卷)》中的“開(kāi)本”字段是要著錄古籍原件的大小,對(duì)于卷軸裝古籍來(lái)說(shuō),開(kāi)本大小如何定義沒(méi)有明確說(shuō)明;“板框”字段是要著錄書(shū)葉正面圖文四邊的圍欄大小,并不是所有的古籍都有板框,對(duì)于沒(méi)有板框的古籍來(lái)說(shuō),該字段是否著錄沒(méi)有明確說(shuō)明;“葉數(shù)”字段是要著錄各卷的葉數(shù),對(duì)于卷軸裝古籍來(lái)說(shuō),葉數(shù)如何統(tǒng)計(jì)沒(méi)有明確說(shuō)明;對(duì)于線裝類古籍,存在著上一卷卷終和下一卷卷端在一個(gè)筒子葉的現(xiàn)象,這兩卷的“葉數(shù)”字段如何著錄也沒(méi)有明確說(shuō)明。
針對(duì)前述古籍?dāng)?shù)字化過(guò)程中出現(xiàn)的種種問(wèn)題,筆者提出了幾個(gè)處理策略。
古籍?dāng)?shù)字化對(duì)設(shè)備的要求一直是比較高的,對(duì)于分辨率、數(shù)字化幅面、光源等都有較高的要求,部分早期的數(shù)字化設(shè)備已經(jīng)無(wú)法滿足現(xiàn)在的古籍?dāng)?shù)字化要求,這就需要增加資金的投入,購(gòu)買能夠滿足數(shù)字化要求的設(shè)備。設(shè)備在日常使用中,也應(yīng)該注重保養(yǎng)和維護(hù),及時(shí)更換老化的零部件,定期進(jìn)行設(shè)備的校正,以保證數(shù)字化圖像符合要求,盡量避免對(duì)古籍反復(fù)數(shù)字化,以保護(hù)古籍原件。
古籍?dāng)?shù)字化是集多種知識(shí)為一體的工作,縱觀古籍?dāng)?shù)字化的各個(gè)流程,需要古籍文獻(xiàn)、圖像采集、圖像處理等多個(gè)領(lǐng)域?qū)I(yè)人員的參與,單一領(lǐng)域的工作人員不足以支撐整個(gè)數(shù)字化工作,需要多個(gè)領(lǐng)域的工作人員相互配合,才能保障數(shù)字化工作的順利開(kāi)展。
古籍?dāng)?shù)字化是一項(xiàng)繁雜的工作,對(duì)工作人員的要求較高,應(yīng)該加強(qiáng)對(duì)工作人員的培訓(xùn),規(guī)范數(shù)字化的操作流程,以提高古籍?dāng)?shù)字化的整體水平。例如,在數(shù)字化加工準(zhǔn)備階段,對(duì)于透字嚴(yán)重的古籍需要添加襯紙;在數(shù)字化加工前,需要對(duì)設(shè)備進(jìn)行校準(zhǔn);使用色卡時(shí),需要佩戴手套以保證其清潔;數(shù)字化圖像應(yīng)該有一定范圍的留白;數(shù)字化圖像歪斜較大時(shí),需要進(jìn)行圖像糾偏處理。工作人員不但要精通專業(yè)知識(shí),還應(yīng)該具有較高的責(zé)任感,才能保障古籍?dāng)?shù)字化成品的質(zhì)量。
隨著古籍?dāng)?shù)字化的全面開(kāi)展,相關(guān)問(wèn)題也會(huì)不斷出現(xiàn)。國(guó)家古籍保護(hù)中心舉辦了古籍培訓(xùn)班,不僅可以對(duì)數(shù)字化工作人員進(jìn)行培訓(xùn),也提供了一個(gè)很好的交流途徑,各數(shù)字化單位的人員可以相互交流數(shù)字化經(jīng)驗(yàn),討論數(shù)字化中遇到的問(wèn)題。與此同時(shí),應(yīng)該召集各個(gè)相關(guān)領(lǐng)域的專家成立專家組,以解決數(shù)字化工作人員在實(shí)際操作中遇到的問(wèn)題,為其提供技術(shù)支持。
中華珍貴典籍資源庫(kù)項(xiàng)目打破了以往古籍?dāng)?shù)字化的一些限制,由國(guó)家古籍保護(hù)中心統(tǒng)一規(guī)劃并制定統(tǒng)一標(biāo)準(zhǔn)、全國(guó)古籍收藏單位合作共建,最終實(shí)現(xiàn)數(shù)字化成果的資源共享。它讓古籍?dāng)?shù)字化項(xiàng)目向前邁進(jìn)了一大步,但中華古籍博大精深,只進(jìn)行搶救性的數(shù)字化是不夠的,還有待于古籍工作者對(duì)數(shù)字圖像進(jìn)行內(nèi)容挖掘。同時(shí),這種深挖掘需要基于圖像的處理,具有較強(qiáng)的技術(shù)性,因此從事這項(xiàng)工作的工作人員,不僅要有責(zé)任感和使命感,還要有較高的技術(shù)水平。