□欒偉平
“明別集叢刊”是北京大學圖書館和黃山書社合作的大型古籍影印項目,是迄今為止規(guī)模最大的明人別集叢書,選取明代近2000位作者的詩文集,占現(xiàn)存全部明代作者及其別集的三分之二強,基本囊括了明代重要作者的重要別集。該項目選取了1500多種原書,200多種膠卷,共掃描50多萬筒子頁(包括膠卷還原),其選目與掃描工作已經(jīng)完成。筆者在北京大學圖書館古籍部就職,參與了選目工作,并承擔該項目的復(fù)核和后期處理工作,對于數(shù)字化過程中的古籍保護問題,有一些粗淺體會,今整理如下。
選擇好的底本,這是古籍數(shù)字化的重要前提。據(jù)筆者參與此項工作的體會,在選擇底本時,需注意以下幾個問題:
底本應(yīng)選取刻印年代較早、流傳稀少、具有代表性、是此后諸本的祖本,等等。這個問題主要屬于版本目錄學和文獻學的范疇,這里不展開討論了。
注意核查,給出所選底本的正確版本信息。在確定某一古籍的版本時,最好參考《中國古籍善本書目》,與其中所載條目相對照,看是否相符。出于歷史原因,我館古籍目錄存在著一些錯漏或不準確的地方。如果與《中國古籍善本書目》不相符,需細查原因——是《中國古籍善本書目》有誤,還是我館的目錄不準確?還是各有正誤之處?一般說來,《中國古籍善本書目》的版本著錄正確性較高,但也有缺陷。如:《中國古籍善本書目》10947條“榮木堂集三十二卷 明陶汝鼐撰 清順治康熙遞刻本”,本館原書為三十七卷,自然要遵從原書。再如:《中國古籍善本書目》9859條“范文忠公初集十二卷 明范景文撰年譜一卷 清王孫錫撰 清康熙四十年范毓秀、范繩祖等刻本”。關(guān)于刊刻年代,我館目錄作“清康熙十二年”,據(jù)原書序跋,該書刻于康熙十二年,康熙四十年的序為后加,故不從《中國古籍善本書目》?!懊鲃e集叢刊”中所采用的約700種善本書,筆者曾一一查閱其在《中國古籍善本書目》中的著錄。每當遇到與《中國古籍善本書目》不符合之處、且從原書中無法判斷正誤的情況,筆者盡量去我館之外的藏館查閱原書,如果沒有條件看到原書,則尋找書影,來對照是否同版。書影的獲得,基本有三種方式。第一,本館所藏影印本,如“四庫存目叢書”、“四庫禁毀叢書”、“四庫續(xù)修叢書”、“叢書集成”,等等。第二,某些圖錄類圖書,如《中國版刻圖錄》;國家珍貴古籍名錄圖錄,已經(jīng)出版的有《第一批國家珍貴古籍名錄圖錄》、《第二批國家珍貴古籍名錄圖錄》;各大圖書館的古籍善本圖錄,如《中國國家圖書館古籍珍品圖錄》、《南京圖書館館藏圖錄》等;古籍展覽圖錄,如《冊府擷英——國家珍貴古籍特展圖錄(2009)》、《楮墨蕓香:國家珍貴古籍特展圖錄(2010)》)等。第三,相關(guān)網(wǎng)上搜索。三者結(jié)合起來,對版本確定有很大幫助。
在選目過程中,如遇到同一版本有不同復(fù)本者,應(yīng)綜合考慮古籍內(nèi)容、印刷狀況、裝訂情況、紙張條件,等等,盡量選擇內(nèi)容完整、無缺頁或者缺頁較少、刷印清晰、斷版、補版較少的書。不能選中縫較緊的書,如果中縫太緊,掃描時,靠近裝訂線的文字容易變形,甚至有可能根本掃描不上,需要拆書,才能達到理想的掃描效果。但如果兩種書都中縫緊,而其中的一種有包角的話,則盡量選擇沒有包角的書,因為包角還原起來較困難??傊氡M辦法避免拆書,尤其是盡量不拆有包角的書,以保持古籍的原貌。
紙張方面,盡量選用白棉紙或皮紙等較厚而堅韌的紙張,盡量不選薄竹紙,特別是薄而脆的黃色竹紙古籍。從保護古籍來看,在掃描過程中,要翻頁,要按壓,竹紙的書更容易受損。從掃描效果看,同樣的內(nèi)容,在黑白掃描的情況下,白棉紙或皮紙等的掃描效果更清晰;另外,古籍紙張?zhí)〉脑?,容易透出反面的字,在黑白掃描的情況下,這些透字會變成圖像上的底灰,處理起來較困難。至于透字問題,有用下列方法處理的:即掃描時加襯紙,夾在筒子頁內(nèi),把兩個半頁隔開,從而避免透字。不過,古籍紙張多較松脆,襯入的紙張易把書口劃破。所以,這次“明別集叢刊”掃描時,我們沒有采用襯紙。透字問題則希望掃描公司來處理。
選書時,如果僅選用該書的部分內(nèi)容、需要插入紙簽標明起止的話,盡量用軟而薄的手工竹紙,千萬不能用厚而硬的機械制紙,以免損壞古籍原本。另外,有些宣紙雖然是手工制造,但比較厚而硬,也盡量不要選用。紙簽上的說明文字盡量用鉛筆,以免污染古籍原本。
選擇好版本后,一定要做卷頁單,也就是頁次記錄單,逐頁記錄序跋、卷次、附錄等,計算總頁碼。卷頁單是掃描的依據(jù),要詳細記錄缺頁、半頁等情況。如果古籍的某些頁有損壞,也要記錄下來,這不但是為了檢查圖像掃描的準確性,也是為了在掃描結(jié)束后,與掃描公司交接古籍原本時,作為點收依據(jù)。當然,也是為了以后的修復(fù)需要。卷頁單是非常重要的,“明別集叢刊”項目采用了部分膠卷,我館請掃描公司還原膠卷時,未提供卷頁單,導(dǎo)致還原出了錯:有時好幾種書在一個膠卷上,可能只有一種書為我們所用,而掃描公司的操作員分辨不出來,或者還原得太多,或者只還原了一部分,或者根本就沒有還原。結(jié)果,只好在提供卷頁單后,重新還原。另外,需提醒掃描公司的操作人員,即使卷頁單有錯誤(比如計算總頁碼錯誤,或者記錄個別卷次的頁碼錯誤等),也不許擅改,一定得告知參與選目的相關(guān)工作人員后,才能改動,以避免造成掃描圖像錯誤。
為了保護古籍,和掃描公司交流好非常重要。因掃描公司人員流動大,操作員的素質(zhì)與水平參差不齊,需要在掃描前提醒他們一些掃描原則。古籍掃描與普通書掃描有很大不同:古籍一定要輕拿,輕放,輕翻;而且,一定不能像掃描普通書那樣,用帶有螺旋紋的指套,因指套上的螺旋紋易刮傷古籍紙張。在進行大型數(shù)字化項目的時候,掃描公司一般會派一個組長。這位組長一定得認真負責,如果事事處處只顧及掃描速度,而不管古籍是否受損、掃描效果是否良好,這樣的組長不能用。如對掃描組長不滿意,我們可以督促掃描公司換人。如果操作員不愛護古籍,我們也要請他離開。最好和掃描公司就古籍保護問題,簽訂一份合同,詳細規(guī)定古籍掃描有哪些規(guī)矩,違反了的話,或者損傷古籍的話,需要承擔什么責任。另外,要告知掃描公司,沒有取得我們同意,不能私自拆書。又,某些古籍的封面最初印刷時,覆有薄的透明紙保護,須告知掃描公司,盡量不要撕開覆紙,可用彩色掃描,如果彩色掃描也不清楚的,寧可不掃描封面,也要保持古籍原貌。
這也是立足于保護古籍的需要。如果掃描效果不好,又無法進行后期處理的話,很可能需要重新掃描,而多次掃描原書,對古籍損害很大。古籍掃描效果是否良好,與掃描儀器、掃描參數(shù)設(shè)置、掃描的顏色模式等等,都有關(guān)系。
“明別集叢刊”項目采用了3種圖像化設(shè)備:柯美(MINOLTA)PS7000掃描儀、數(shù)碼相機、虹光(Avision)FB6080E掃描儀。FB6080E是平板式掃描儀,其圖像效果在3種設(shè)備中最好,但因為與古籍直接接觸,可能對紙張松脆的古籍有損,而且掃描速度較慢。其他兩種復(fù)制設(shè)備速度較快,掃描時只需頁面朝上,平放于托書臺,但也需要操作員手動翻閱古籍,并按壓,對古籍還是可能有微損。而且,有的古籍較厚,用后兩種復(fù)制設(shè)備時,掃描圖像可能會變形。最好采用既能與古籍零接觸,又能保證圖像效果的掃描儀器。
除了選擇好的掃描儀外,還要調(diào)整好相關(guān)掃描參數(shù),如分辨率、焦距、亮度、對比度、圖像文件格式等。如果設(shè)置不當,在掃描過程中,容易造成圖像細節(jié)丟失,即使后期通過圖像軟件進行處理,也無法獲得理想效果?!懊鲃e集叢刊”項目采用的分辨率是400dpi,文件格式是tiff。
顏色模式的選擇。在古籍圖像化中,通常有彩色、灰度以及黑白3種掃描類型?!懊鲃e集叢刊”項目基本采用黑白掃描。筆者發(fā)現(xiàn),黑白掃描有較大局限性,在某些情況下并不適合。首先,還原膠卷時,不適合用黑白模式。“明別集叢刊”先是用黑白模式還原膠卷,但發(fā)現(xiàn)效果很不理想,很多時候,底灰重得擋住字了,或者底灰遮住了版心。后來,只好換用灰度模式,效果好多了。其次,黑白掃描模式無法完整再現(xiàn)古籍原件上的紅色字跡或圖像。批校本、評點本、彩色套印本等等,最好采用彩色掃描。比如:“明別集叢刊”選用的《丹崖集》,該書是清研古樓抄本,李盛鐸批校。李用朱筆校改了上百處,用黑白掃描模式,校改痕跡非常模糊。李盛鐸為此本所做的朱筆跋語,“癸丑霜降后五日,假友人藏鈔本校,改正如右”,用黑白模式掃描不出來。由于黑白掃描失真得厲害,該書換用了彩色掃描。再如:日本延寶五年刻本《永覺和尚禪余外集》,書上有大量的紅色圈點,書眉及行間有大量朱批,用黑白模式掃不清晰,只好換用彩色模式。另外,四庫底本一般在首頁鈐有“翰林院印”的紅色滿漢文大方印,用黑白模式掃描不清。有的四庫底本有紅色眉批,還貼有飛簽,部分飛簽上鈐有四庫分校官的朱印,也在黑白模式下,無法體現(xiàn)。此外,版畫不能用黑白掃描,即使是黑白版畫也不適合。因為黑白掃描層次不豐富,無法體現(xiàn)出版畫的細膩筆調(diào)。黃山書社準備用單黑印刷“明別集叢刊”,所以,還得把彩色圖像轉(zhuǎn)化成黑白圖像。因此,在用彩色模式掃描個別書的時候,要注意顏色深淺,顏色過深,轉(zhuǎn)化成黑白圖像后,有些字會被底灰遮??;顏色過淺,轉(zhuǎn)換成黑白圖像后,又不太清晰。
筆者認為,彩色掃描是最保真的方式。但彩色掃描速度慢,而且比黑白掃描總額貴。因此,采用哪種掃描模式,要和出版社多溝通,問詢出版社需要達到什么掃描效果,并靈活掌握。最好先試掃描一部分,找出最好的掃描方式后,再進行大規(guī)模掃描。
掃描完成后,需要做圖像后處理,在以下兩個環(huán)節(jié)容易出問題:
掃描完成后,需要對兩個半頁進行拼接,形成一個筒子頁。如果操作員不認真,容易出現(xiàn)以下錯誤:左右拼版顛倒,以致版心到了邊上;缺半版;左右兩個半版有部分疊加,從而擋住版心;左右拼版歪了,以致兩版之間出現(xiàn)夾角。需要對掃描公司特別說明的是:有的筒子頁半頁有字,另半頁是空白,這半個空白頁也必須拼上,不能刪除。否則,容易把這半頁和下一個筒子頁的前半頁拼在一起,從而導(dǎo)致整本書的拼版錯誤。
掃描公司在處理圖像數(shù)據(jù)時,會對圖像邊緣進行裁切,以去除多余部分。不特別說明的話,掃描公司一般默認為以版框為裁切依據(jù),也就是說,去掉天頭、地腳以及左右邊框外的內(nèi)容。但是,有很多古籍是評點本,評點者在版框外寫評語;還有的收藏者,在版框上或者在版框外鈐印。以上內(nèi)容如果被裁切掉了的話,古籍圖像就失真了。應(yīng)告知掃描公司,以古籍原書頁面的邊緣為裁切的依據(jù)。
以上是筆者參與“明別集叢刊”項目中,關(guān)于古籍數(shù)字化與古籍保護的一些初步想法。掛一漏萬,拋磚引玉,希望得到大家的指點。
1 中國古籍善本書目編輯委員會編.中國古籍善本書目(集部).上海:上海古籍出版社,1998
2 北京圖書館編.中國版刻圖錄.北京:文物出版社,1960