孫琴
(蘇州大學(xué),215123)
中美百萬(wàn)冊(cè)書(shū)數(shù)字圖書(shū)館合作計(jì)劃(簡(jiǎn)稱CADAL,China-America Digital Academic Library)是一個(gè)由國(guó)家投資,作為公共服務(wù)體系一部分的數(shù)字圖書(shū)館項(xiàng)目。從2002年開(kāi)始到現(xiàn)在,CADAL取得了重大成就,特別是古籍、民國(guó)期刊、民國(guó)圖書(shū)數(shù)據(jù)庫(kù)的建設(shè),其模式、質(zhì)量與影響,堪為國(guó)內(nèi)特色數(shù)據(jù)庫(kù)建設(shè)的模范。
CADAL的檢索功能有:快速檢索、高級(jí)檢索、圖像檢索、視頻檢索、書(shū)法字檢索。分類檢索有:古籍、民國(guó)期刊、民國(guó)圖書(shū)、現(xiàn)代圖書(shū)、學(xué)位論文、繪畫(huà)、視頻、英文。檢索字段有書(shū)名、作者、關(guān)鍵字、描述,可以全文瀏覽,全文檢索,逐頁(yè)保存與打印,但因?yàn)楣偶c民國(guó)書(shū)刊的界定困難,有些詳細(xì)信息中沒(méi)有書(shū)刊的出版年介紹。古籍、民國(guó)書(shū)刊等珍貴文獻(xiàn)的數(shù)字化,極大地方便了讀者的閱讀,有利于數(shù)字資源的長(zhǎng)期保存與進(jìn)一步開(kāi)發(fā)利用。其數(shù)據(jù)的開(kāi)發(fā)與利用模式,值得國(guó)內(nèi)古籍與民國(guó)文獻(xiàn)特色數(shù)據(jù)庫(kù)學(xué)習(xí)與借鑒。如南京大學(xué)民國(guó)史研究中心的陳蘊(yùn)茜副教授最近要找一本貴陽(yáng)文通書(shū)局1947年出版的《甘肅夏河藏民調(diào)查》,她打開(kāi)CADAL網(wǎng)站,幾秒鐘就找到了。如果在幾年前,她必須去一趟北京的國(guó)家圖書(shū)館才能借到這本書(shū)。[2]
CADAL項(xiàng)目從開(kāi)始即建立自己的網(wǎng)站(http://www.cadal.cn/),詳細(xì)公布了該數(shù)據(jù)庫(kù)的項(xiàng)目背景、項(xiàng)目動(dòng)態(tài)、技術(shù)規(guī)范、機(jī)構(gòu)組織、合作伙伴、資金來(lái)源、版權(quán)公告等,用戶隨時(shí)可以動(dòng)態(tài)地從各方面來(lái)了解該數(shù)據(jù)庫(kù)的進(jìn)展。網(wǎng)站提供具體項(xiàng)目的具體負(fù)責(zé)人、聯(lián)系地址、電話與Email等聯(lián)系方式,有利于用戶了解該項(xiàng)目,監(jiān)督該項(xiàng)目,以及提供相關(guān)信息與建議,這是非常值得借鑒。目前,國(guó)內(nèi)很多特色數(shù)據(jù)庫(kù)的建設(shè)只在小范圍內(nèi)進(jìn)行論證,或者為了申請(qǐng)某個(gè)課題而臨時(shí)上馬,之后便進(jìn)行閉門(mén)造車(chē)。整個(gè)數(shù)據(jù)庫(kù)的建設(shè)過(guò)程外人根本無(wú)從了解,更談不上建議與監(jiān)督。
目前,國(guó)內(nèi)古籍?dāng)?shù)據(jù)庫(kù)還沒(méi)有統(tǒng)一的規(guī)范與標(biāo)準(zhǔn),各古籍與民國(guó)文獻(xiàn)特色數(shù)據(jù)庫(kù)在建設(shè)過(guò)程中無(wú)章可循,從而導(dǎo)致古籍與民國(guó)文獻(xiàn)特色數(shù)據(jù)庫(kù)近來(lái)雖發(fā)展蓬勃,但又良莠不齊。為了保障數(shù)據(jù)庫(kù)的質(zhì)量,CADAL項(xiàng)目開(kāi)始就明確提出,擬數(shù)字化古籍選目的著錄要求原則上應(yīng)與《CALIS古籍聯(lián)機(jī)合作編目規(guī)則》保持一致,但考慮到CALIS項(xiàng)目的進(jìn)度不能滿足本項(xiàng)目的實(shí)際需要,又參照《CALIS古籍聯(lián)機(jī)合作編目規(guī)則》中基本級(jí)次著錄的要求,制訂了《CADAL項(xiàng)目擬數(shù)字化古籍選目著錄格式》,從《著錄要求》、《著錄內(nèi)容》來(lái)規(guī)范古籍?dāng)?shù)據(jù)庫(kù)的建設(shè)。這樣,各成員館在參建過(guò)程中,就有章可依,嚴(yán)格按照要求數(shù)字化,從而有效避免低質(zhì)建設(shè)。
隨著CADAL項(xiàng)目成員館的不斷增加,為了在古籍與民國(guó)文獻(xiàn)資源數(shù)字化中盡量避免重復(fù)交叉,南京大學(xué)圖書(shū)館作為CADAL項(xiàng)目管理中心古籍子項(xiàng)目的牽頭單位,特別制定了《關(guān)于CADAL項(xiàng)目古籍選目協(xié)調(diào)工作的原則》,從《古籍?dāng)?shù)字化工作各階段的基本要求》、《古籍選目范圍》、《古籍選目查重、申報(bào)和著錄要求》來(lái)協(xié)調(diào)古籍?dāng)?shù)據(jù)庫(kù)的建設(shè),并適時(shí)更新《擬數(shù)字化書(shū)目查重》,各參建單位在數(shù)字化前必須先在網(wǎng)上查重,這在很大程度上避免了無(wú)意義的重復(fù)建設(shè)。
近年來(lái),國(guó)內(nèi)特色數(shù)據(jù)庫(kù)的建設(shè)蓬勃發(fā)展,大小圖書(shū)館都開(kāi)始圍繞自身的資源進(jìn)行特色數(shù)據(jù)庫(kù)建設(shè),但很多圖書(shū)館并沒(méi)有明確目標(biāo),如數(shù)據(jù)庫(kù)的規(guī)模,所依托的技術(shù)平臺(tái)??陀^而言,很多圖書(shū)館只是想把自己的部分資源數(shù)字化,如首都圖書(shū)館的《古籍插圖庫(kù)》,其實(shí)只是從首圖館藏古籍文獻(xiàn)中揀選制作,包括人物、小說(shuō)、戲曲、軍事、宗教(佛教、道教)、動(dòng)物、植物、風(fēng)景、建筑、歷史故事等許多類,但每一類數(shù)量很少。而且首都圖書(shū)館的古籍館藏在國(guó)內(nèi)并不豐富,該庫(kù)也未能利用地理優(yōu)勢(shì),對(duì)國(guó)家圖書(shū)館、北京大學(xué)圖書(shū)館等周?chē)笮蛨D書(shū)館的古籍資源加以利用,只是局限于本館館藏資源。這種類型的古籍特色數(shù)據(jù)庫(kù)在中小型圖書(shū)館中很有代表性,很多圖書(shū)館為了躋身于數(shù)字化行列,擴(kuò)大本館在數(shù)字化建設(shè)中的影響,根本不進(jìn)行可行性論證,只是利用本館的人力把本館的部分資源加以數(shù)字化,并建設(shè)成特色數(shù)據(jù)庫(kù)。就數(shù)據(jù)庫(kù)的質(zhì)量與投入的人力、物力、財(cái)力而言,這些數(shù)據(jù)庫(kù)并不成功。
CADAL 采用開(kāi)放式電子書(shū)標(biāo)準(zhǔn),采用600dpi分辨率進(jìn)行掃描,有別于目前國(guó)內(nèi)電子書(shū)大都需要專用閱讀器和低顯示精度的狀況,將大大方便讀者的閱讀,有利于數(shù)字資源的長(zhǎng)期保存與進(jìn)一步開(kāi)發(fā)利用。但這在古籍、民國(guó)書(shū)刊以及珍貴文物數(shù)字化過(guò)程中難以實(shí)現(xiàn),如古籍多以線裝裝訂,紙張脆,不能用力按壓書(shū)籍進(jìn)行掃描。即使如此,還是難以保證掃描質(zhì)量,并會(huì)嚴(yán)重?fù)p壞古書(shū)的原貌。所以,為了實(shí)現(xiàn)這一標(biāo)準(zhǔn),CADAL成員館在掃描錄入時(shí),需先把書(shū)進(jìn)行分拆,一頁(yè)一頁(yè)平鋪掃描,再由古籍修復(fù)專家穿線修補(bǔ)復(fù)原,但很多書(shū)已經(jīng)非常脆弱,尤其是民國(guó)書(shū)刊,已發(fā)黃、發(fā)脆、變酸,并且民國(guó)書(shū)刊多采用雙面印刷和機(jī)械裝訂,傳統(tǒng)的古籍修復(fù)技術(shù)無(wú)法適用。這不可避免地在某種程度上對(duì)古籍與民國(guó)書(shū)刊以及珍貴文物造成了損壞。在掃描過(guò)程中,掃描儀的光源、熱源會(huì)對(duì)文獻(xiàn)的紙張、文字、裝幀產(chǎn)生影響,尤其是掃描時(shí)拆開(kāi)書(shū)刊,必然會(huì)破壞到文物的品相,拆分掃描后,有時(shí)難以恢復(fù)原樣。那么,究竟是文獻(xiàn)的原生性重要還是文獻(xiàn)的內(nèi)容重要,這一直在圖書(shū)館學(xué)術(shù)界爭(zhēng)論不休。有些大館為了維持文獻(xiàn)的原生性,拒絕數(shù)字化過(guò)程中的破壞,拒絕傳統(tǒng)的翻閱,在某種程度上使這些文獻(xiàn)的價(jià)值難以實(shí)現(xiàn),變相地造成了一本書(shū)的“死去”。而數(shù)字化雖對(duì)其品相有一定的損壞,但可以更方便讀者利用,可實(shí)現(xiàn)這些文獻(xiàn)的最大價(jià)值,讓每一本書(shū)都“活起來(lái)”。隨著電子文獻(xiàn)的開(kāi)放,可以原則上不再對(duì)公眾開(kāi)放紙本文獻(xiàn),從而減少翻閱,長(zhǎng)久地保存在恒溫恒濕的書(shū)庫(kù)中,這是否可以理解為一種真正意義上的保護(hù)。
根據(jù)《著作權(quán)法》和《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,CADAL中尚處于版權(quán)保護(hù)期的現(xiàn)代圖書(shū)和學(xué)位論文,因授權(quán)范圍的限制,目前只能限制在館藏單位圖書(shū)館和授權(quán)用戶使用。無(wú)版權(quán)的古籍資源,免費(fèi)向公眾開(kāi)放;民國(guó)書(shū)刊向項(xiàng)目參建單位和合作單位圖書(shū)館局域網(wǎng)開(kāi)放服務(wù)。對(duì)于作者或出版社提出有版權(quán)爭(zhēng)議的圖書(shū)資料,及時(shí)從網(wǎng)站撤出。目前,各大圖書(shū)館為了加強(qiáng)對(duì)古籍與民國(guó)文獻(xiàn)的保護(hù),限制讀者復(fù)印、拍照,有些珍貴文獻(xiàn)甚至有條件閱覽,這對(duì)讀者從事學(xué)術(shù)科研極為不便。有些圖書(shū)館雖已經(jīng)對(duì)古籍與民國(guó)文獻(xiàn)數(shù)字化或做成縮微膠卷,但收費(fèi)不菲,并多有用戶限制,如只對(duì)本校師生開(kāi)放。在國(guó)內(nèi)的特色數(shù)據(jù)庫(kù)建設(shè)中,公共圖書(shū)館的建設(shè)資源多能免費(fèi)共享,如國(guó)家圖書(shū)館的《民國(guó)期刊》數(shù)據(jù)庫(kù),但高校圖書(shū)館的特色資源基本上只對(duì)本校師生開(kāi)放,校外讀者無(wú)權(quán)共享這些數(shù)字化特色資源。這實(shí)際上是“奇貨自居”在數(shù)字化上的一種反映。所以,很多圖書(shū)館絲毫不考慮自身的技術(shù)、人力、物力、財(cái)力的限制,不進(jìn)行可行性論證,只是依賴本館一些獨(dú)特的、有研究?jī)r(jià)值的文獻(xiàn)資源和一些特色收藏進(jìn)行數(shù)字化建設(shè),常常導(dǎo)致無(wú)疾而終、有始無(wú)終或有名無(wú)實(shí)?,F(xiàn)在,特色數(shù)據(jù)庫(kù)建設(shè)已成為國(guó)內(nèi)圖書(shū)館數(shù)字化進(jìn)程中不可或缺的內(nèi)容,很多圖書(shū)館擁有一些自建的特色數(shù)據(jù)庫(kù),并且在版權(quán)保護(hù)等因素下,近來(lái)已逐漸向古籍與民國(guó)文獻(xiàn)資源數(shù)字化擴(kuò)展,但并沒(méi)有充分考慮這部分資源的特殊性、重要性與敏感性,從而造就了古籍與民國(guó)文獻(xiàn)資源特色數(shù)據(jù)庫(kù)表面上的熱鬧非凡與嚴(yán)重的低質(zhì)量重復(fù)建設(shè)。
誠(chéng)然,CADAL項(xiàng)目中的古籍與民國(guó)文獻(xiàn)數(shù)據(jù)庫(kù)不是其他普通特色數(shù)據(jù)庫(kù)所能比擬的,它資金充足,技術(shù)先進(jìn),資源豐富。但是,CADAL建設(shè)過(guò)程中在對(duì)數(shù)據(jù)庫(kù)質(zhì)量的嚴(yán)格把關(guān),各參建單位的協(xié)作精神,古籍與民國(guó)文獻(xiàn)選目與著錄時(shí)的嚴(yán)格要求等,值得各古籍與民國(guó)文獻(xiàn)特色數(shù)據(jù)庫(kù)建設(shè)時(shí)加以借鑒。
目前,各大圖書(shū)館都熱衷于依靠自身資源自建特色數(shù)據(jù)庫(kù),他們難以相互合作,更不可能與專業(yè)數(shù)據(jù)庫(kù)公司共建。很多單位認(rèn)為對(duì)館藏特色資源的數(shù)字化建設(shè)可以提高本館在圖書(shū)館界中的影響,并且為了限制館藏資源的外流而迫使讀者回歸。但又常囿于技術(shù)支持與各方面因素,數(shù)據(jù)庫(kù)建設(shè)質(zhì)量難以保障,而且,很多建設(shè)單位不愿共享自己的建設(shè)成果。另一方面,專業(yè)數(shù)據(jù)庫(kù)公司亦難以找到合適的合作單位,如一些館藏單位對(duì)高額的版權(quán)支付費(fèi)的索取,加大了專業(yè)文獻(xiàn)數(shù)據(jù)庫(kù)的建設(shè)成本。如《中國(guó)基本古籍庫(kù)》,因?yàn)榻ㄔO(shè)過(guò)程中高昂的版權(quán)費(fèi)等因素,使得國(guó)內(nèi)很多學(xué)術(shù)機(jī)構(gòu)望洋興嘆,從而使如此高質(zhì)量的古籍特色數(shù)據(jù)庫(kù)難以普及。近來(lái),我國(guó)參加CADAL項(xiàng)目的高校從原來(lái)的16家擴(kuò)增到近40家,截止到2008年1月27日,該數(shù)據(jù)庫(kù)中已數(shù)字化古籍190405冊(cè)、民國(guó)圖書(shū)114202冊(cè)、民國(guó)期刊6578冊(cè)、繪畫(huà)3427件,有效地滿足了用戶對(duì)古籍與民國(guó)文獻(xiàn)資源的需求。
[1]肖 卓.CADAL項(xiàng)目與古籍整理[J].圖書(shū)與情報(bào),2005,(4):82-84.
[2]且 休.世界最大公益數(shù)字圖書(shū)館館藏突破150萬(wàn)冊(cè)[N].浙江日?qǐng)?bào),2007-11-28.
[3]關(guān)于CADAL項(xiàng)目古籍選目協(xié)調(diào)工作的原則[EB/OL].http://www.cadal.cn/.2009-11-20
[4]高等學(xué)校中英文圖書(shū)數(shù)字化國(guó)際合作項(xiàng)目[EB/OL].http://www.cadal.cn/.2009-11-20.