王雁行
以“中華古籍保護計劃”為依托 建設(shè)國家古籍資源數(shù)據(jù)庫
王雁行
古籍數(shù)字化能夠有效解決古籍保護與利用之間的矛盾,建設(shè)“國家古籍資源數(shù)據(jù)庫”首次寫入國家五年發(fā)展規(guī)劃,這是解決古籍數(shù)字化現(xiàn)存問題的良好契機。應(yīng)利用國家古籍保護中心和各類古籍收藏機構(gòu)已有的古籍數(shù)字化成果,以“中華古籍保護計劃”為依托,統(tǒng)籌規(guī)劃,在全國范圍內(nèi)組織建設(shè)國家古籍資源數(shù)據(jù)庫,保障國家文化安全,促進中華優(yōu)秀傳統(tǒng)文化的繼承與弘揚。參考文獻13。
古籍數(shù)字化 國家古籍資源數(shù)據(jù)庫 國家古籍保護中心 中華古籍保護計劃
古籍是中華優(yōu)秀傳統(tǒng)文化的重要載體,是全人類珍貴的文化遺產(chǎn)。據(jù)粗略統(tǒng)計,目前我國現(xiàn)存古籍約20萬個品種、50萬個版本,堪稱中華民族重要的文化財富和精神家園。
為進一步加強古籍保護工作,2007年1月19日,國務(wù)院辦公廳下發(fā)《關(guān)于進一步加強古籍保護工作的意見》(國辦發(fā)〔2007〕6號)(以下簡稱《意見》),對全國古籍保護工作進行總體部署,正式實施“中華古籍保護計劃”,這是我國歷史上首次由政府主持開展的全國性古籍保護工程。《意見》提出了“制訂古籍數(shù)字化標準,規(guī)范古籍數(shù)字化工作,建立古籍數(shù)字資源庫”這一明確要求。實施“中華古籍保護計劃”的根本目的在于做好古籍原生性保護的同時,更好地發(fā)揮古籍的利用價值,促進中華優(yōu)秀傳統(tǒng)文化的傳播。古籍數(shù)字化是能夠有效解決古籍保護與利用之間矛盾的重要手段之一。為此,國家古籍保護中心近年來通過國家數(shù)字圖書館工程、合作開展海內(nèi)外古籍整理研究、各類專項古籍書目與全文數(shù)據(jù)庫建設(shè)等途徑,積極推進中華古籍數(shù)字化工作,取得了一系列成果。
最新發(fā)布的《中華人民共和國國民經(jīng)濟和社會發(fā)展第十三個五年規(guī)劃綱要》中,專欄25“文化重大工程”里明確寫到:“實施中華古籍保護計劃?;就瓿晒偶詹楣ぷ?,推動古籍原生性和再生性保護,推出300種國家重點古籍整理出版項目,建設(shè)國家古籍資源數(shù)據(jù)庫”[1]。這是“中華古籍保護計劃”“國家古籍資源數(shù)據(jù)庫”等條款首次出現(xiàn)在國家五年規(guī)劃文本中。以此為契機,在借鑒古籍保護工作者和研究者歷年來對“古籍數(shù)字化”主題相關(guān)研究成果的基礎(chǔ)上,結(jié)合當前我國古籍數(shù)字化發(fā)展現(xiàn)狀,本文提出以“中華古籍保護計劃”為依托,建設(shè)國家古籍資源數(shù)據(jù)庫,并展開探討。
我國古籍數(shù)字化工作起于20世紀80年代,最早始于臺灣地區(qū)。該地區(qū)的圖書館等機構(gòu)通過實施“數(shù)位典藏計劃”等專項工程,使得其古籍數(shù)字化的規(guī)劃布局、古籍文獻信息處理技術(shù)與標準、資源庫建設(shè)的數(shù)量、質(zhì)量以及資源共建共享等均在全球處于較為領(lǐng)先的地位。香港地區(qū)的古籍數(shù)字化工作始于20世紀80年代末,香港中文大學(xué)中國文化研究所下屬的“劉殿爵中國古籍研究中心”(前身為建于1988年的漢達古文獻資料庫)致力于全面整理中國古代傳世及出土文獻,并建立全文數(shù)據(jù)庫,以供學(xué)術(shù)研究之用。比較而言,我國大陸地區(qū)的古籍數(shù)字化工作起步較晚,但自90年代中后期開始迅速發(fā)展,主要標志是一些大規(guī)模、基礎(chǔ)性的古籍著作被開發(fā)成為真正意義上的數(shù)字化產(chǎn)品并走向市場[2]。
1.1古籍數(shù)字化成果
1.1.1古籍書目數(shù)據(jù)庫
在我國,公共圖書館最早開展對館藏古籍書目進行數(shù)字化。臺灣地區(qū)“中央”圖書館于20世紀80年代初率先開始建立古籍書目數(shù)據(jù)庫,遼寧省圖書館是我國大陸地區(qū)古籍書目數(shù)據(jù)庫建設(shè)較早的公共圖書館,于1997年建成普通古籍書目數(shù)據(jù)庫[3],國家圖書館、上海圖書館也都于1999年開始了館藏古籍書目數(shù)據(jù)庫的建設(shè)。目前,全國擁有古籍館藏的主要收藏機構(gòu)大都建立了古籍書目數(shù)據(jù)庫,同時還通過開展合作建立了很多古籍聯(lián)合目錄數(shù)據(jù)庫,例如中國古籍善本書目聯(lián)合導(dǎo)航系統(tǒng)、中國高等教育文獻保障系統(tǒng)(CALIS)古籍聯(lián)機編目、中國科學(xué)院古籍聯(lián)合書目數(shù)據(jù)庫等。
1.1.2古籍全文數(shù)據(jù)庫
上海圖書館較早地開展了古籍全文數(shù)字化工作,1999年開始建設(shè)“古籍影像光盤制作及檢索系統(tǒng)”,目前打造的“上海圖書館藏家譜全文瀏覽系統(tǒng)”旨在使上海圖書館成為中國家譜的資源中心。國家圖書館致力于建設(shè)特色珍貴古籍文獻數(shù)據(jù)庫,陸續(xù)推出了“甲骨世界”“碑帖菁華”“敦煌遺珍”“西夏碎金”“數(shù)字方志”“宋人文集”等一系列珍貴古籍影像專題數(shù)據(jù)庫。此外,其他圖書館、研究機構(gòu)、出版機構(gòu)和數(shù)字化商業(yè)機構(gòu)近年來也不斷進行探索和研究,取得了一大批古籍數(shù)字化成果,如建設(shè)完成的“中國基本古籍庫”、文淵閣《四庫全書》光盤版、《四部叢刊》電子版、《二十五史》數(shù)字版、中國基本用典電子文庫“國學(xué)寶典”、臺灣“漢籍全文數(shù)據(jù)庫”、香港“漢達文庫”等。
1.1.3以國際合作形式開展古籍數(shù)字化項目
與海外開展的國際合作項目,除豐富了我國古籍的數(shù)字文化遺產(chǎn)外,還給古籍數(shù)字化工程帶來了先進的技術(shù)與管理經(jīng)驗[4]。我國多家公藏機構(gòu)尋求開展此類國際合作項目,其中國家圖書館承擔最多?!皣H敦煌學(xué)項目”(IDP)堪稱古籍文獻數(shù)字化跨國合作項目的典范,該項目始于1994年,由英國國家圖書館發(fā)起,中國國家圖書館、法國國家圖書館等機構(gòu)積極參與,各館將各自館藏敦煌文獻進行編目并數(shù)字化,形成數(shù)據(jù)庫供全世界學(xué)者免費使用。“中華古籍善本國際聯(lián)合書目系統(tǒng)”首先由美國發(fā)起建設(shè),包括我國7家圖書館在內(nèi)的全球30余家圖書館共同參與,著錄了北美圖書館的絕大部分中文古籍善本和我國圖書館的部分古籍,自2005年以來通過中國國家圖書館網(wǎng)站對公眾開放?!皷|京大學(xué)東洋文化研究所漢籍全文影像數(shù)據(jù)庫”由東京大學(xué)東洋文化所自2002年開始建設(shè),2009年與中國國家圖書館開展合作,將其所藏中文古籍4,000余種以數(shù)字化方式無償提供給中國國家圖書館,通過中國國家圖書館網(wǎng)站向讀者提供開放性服務(wù)[5]。
1.2 古籍數(shù)字化標準規(guī)范與應(yīng)用技術(shù)的發(fā)展
隨著各類機構(gòu)古籍數(shù)字化實踐工作的不斷深入,與古籍數(shù)字化相關(guān)的著錄標準、應(yīng)用技術(shù)等迅速發(fā)展。自2008年起,國家數(shù)字圖書館工程開始研制既符合現(xiàn)實需求又具備前瞻性的標準規(guī)范,包括字符編碼、古籍用字規(guī)范、生僻字與避諱字處理規(guī)范、專門元數(shù)據(jù)規(guī)范、對象數(shù)據(jù)加工標準、管理元數(shù)據(jù)規(guī)范、數(shù)字資源長期保存規(guī)范等二十余項標準規(guī)范[6]。同年,中華人民共和國國家標準《古籍著錄規(guī)則》(GB3792.7)正式發(fā)布。在數(shù)字化應(yīng)用技術(shù)方面,古籍數(shù)字化輸入技術(shù)包括拍照、非接觸式掃描以及縮微膠片轉(zhuǎn)數(shù)字化技術(shù)。其他相關(guān)技術(shù)包括:OCR漢字識別技術(shù),通過對古籍影像圖片識別率較高的OCR識別軟件來提高古籍全文數(shù)字化效率;智能化處理技術(shù),能對古籍數(shù)字化的信息單元進行重組,是數(shù)據(jù)庫內(nèi)容的分析工具,可提高古籍整理效率;現(xiàn)代化的網(wǎng)絡(luò)技術(shù),為古籍數(shù)字化資源跨平臺、跨系統(tǒng)瀏覽與統(tǒng)一檢索提供技術(shù)支撐等等。
1.3古籍數(shù)字化建設(shè)中存在的問題
目前,較系統(tǒng)、成規(guī)模地開展古籍數(shù)字化工作的機構(gòu)主要有三類:(1)大學(xué)教學(xué)和研究機構(gòu)。這類機構(gòu)的古籍數(shù)字化工作目的性強,主要是根據(jù)相關(guān)機構(gòu)的教學(xué)和科研需要來選定需數(shù)字化的古籍和相應(yīng)的數(shù)字化格式。(2)各類圖書館。圖書館的古籍數(shù)字化工作主要是根據(jù)其館藏資源有選擇、有目的地進行,特色鮮明,封閉性較強。(3)各種商業(yè)性機構(gòu)。商業(yè)機構(gòu)古籍數(shù)字化工作的內(nèi)容和形式主要由市場需求或潛在的市場需求決定,哪一類古籍有市場,就進行哪一類古籍的數(shù)字化??紤]到市場運作,商業(yè)機構(gòu)的數(shù)字化古籍常常會選擇一些大型類書、叢書[7]。在這種模式下,各類機構(gòu)開展的古籍數(shù)字化工作嚴重缺乏國家層面的宏觀管理和統(tǒng)一規(guī)劃,存在的一系列問題日益凸顯:我國古籍資源數(shù)量龐大,且分散于各地區(qū)、各系統(tǒng)存藏單位,導(dǎo)致古籍數(shù)字化重復(fù)建設(shè)現(xiàn)象嚴重,極大地浪費了人力、物力、財力;因各地區(qū)經(jīng)濟水平差異,經(jīng)濟發(fā)達地區(qū)的古籍數(shù)字化工作開展較好,欠發(fā)達或落后地區(qū)的古籍數(shù)字化工作進展緩慢、技術(shù)力量薄弱,數(shù)字化工作仍停留在簡單掃描的落后階段,導(dǎo)致國內(nèi)各地區(qū)間古籍數(shù)字化發(fā)展不均衡,有些地區(qū)的珍貴古籍不能及時通過數(shù)字化進行整理,無法加強保護和提供利用;各機構(gòu)研發(fā)的古籍數(shù)字化著錄標準、技術(shù)規(guī)范類型各異,難以統(tǒng)一,致使各數(shù)據(jù)之間無法順利實現(xiàn)數(shù)據(jù)交換和格式轉(zhuǎn)換,極大地阻礙了數(shù)據(jù)庫資源的有效整合和統(tǒng)一檢索,嚴重地影響了古籍數(shù)字資源在全國范圍內(nèi)的共享與利用。
近年來,為進一步提升古籍服務(wù)水平,滿足科研工作者和社會普通大眾對古籍的利用需求,在“中華古籍保護計劃”框架下,國家古籍保護中心在組織開展古籍數(shù)字化工作方面做出了一系列有益的探索與嘗試,在全國范圍內(nèi)積極地推進古籍數(shù)字化工作。
依據(jù)“標準先行”的原則,國家古籍保護中心組織專家編制了《古籍數(shù)字化工作手冊》(試用本),對古籍數(shù)字化加工流程,包括古籍數(shù)字化加工準備、古籍元數(shù)據(jù)著錄、古籍圖像數(shù)字化、數(shù)據(jù)命名規(guī)范、數(shù)據(jù)提交、數(shù)據(jù)驗收以及數(shù)據(jù)發(fā)布利用等內(nèi)容都做了具體規(guī)定。同時,面向全國各省級古籍保護中心舉辦多期古籍數(shù)字化培訓(xùn)班,采取授課與實踐相結(jié)合的方式,開展有針對性的古籍數(shù)字化業(yè)務(wù)培訓(xùn),培訓(xùn)學(xué)員127人次,在全國公共圖書館領(lǐng)域培養(yǎng)了一批熟悉和掌握古籍數(shù)字化業(yè)務(wù)、具備數(shù)字化實操技能的專業(yè)人才。對各省級古籍保護中心開展業(yè)務(wù)指導(dǎo)和問題咨詢,為順利開展全國范圍內(nèi)的古籍數(shù)字化工作奠定了堅實基礎(chǔ)。
國家古籍保護中心提出建設(shè)“中華古籍數(shù)字資源庫”的構(gòu)想,并以此為目標,在已有成果的基礎(chǔ)上,依托國家數(shù)字圖書館工程,通過合作共建、資源購買、海外專項等方式,陸續(xù)開展了“中華珍貴典籍資源庫建設(shè)”等一系列古籍數(shù)字化專項工作,并取得較好的階段性成果。
2.1中華珍貴典籍資源庫建設(shè)項目
自2008年至今,國務(wù)院先后公布了五批《國家珍貴古籍名錄》,12,274部古籍入選,包括漢文和少數(shù)民族古籍、簡帛古籍、敦煌遺書、碑帖拓本、古地圖和外文珍貴古籍。2012年底,依托《國家珍貴古籍名錄》評審成果,國家古籍保護中心啟動“中華珍貴典籍資源庫建設(shè)”項目,通過專家選目,從中遴選出1,115部珍貴古籍進行數(shù)字化,首批參建單位27家。目前,國家古籍保護中心已收到全國19家單位約28萬拍的珍貴古籍影像資源,在數(shù)據(jù)陸續(xù)提交的同時,國家古籍保護中心積極研究并推進資源的網(wǎng)上發(fā)布。
2.2國家圖書館藏善本縮微膠片數(shù)字化項目
該項目自2012年啟動,計劃將國家圖書館所藏1.8萬部約900萬拍善本縮微膠片進行數(shù)字化,本著“邊建設(shè)、邊服務(wù)”的原則,數(shù)字化成果在四年內(nèi)陸續(xù)上網(wǎng)發(fā)布。國家圖書館古籍善本不僅直接收藏了南宋緝熙殿、元翰林國史院、明文淵閣、清內(nèi)閣大庫等皇家珍藏,而且廣泛匯集了明清以來許多私人藏書家的畢生所聚,包括宋元舊槧、明清精刻、名刊名抄、名家校跋、古代戲曲小說、方志家譜等,內(nèi)容豐富且特色鮮明。到目前為止,項目已完成17,363部133,295冊8,746,115拍善本縮微膠片的轉(zhuǎn)換工作,建成了“數(shù)字善本”專題資源庫,網(wǎng)上發(fā)布古籍影像10,975部91,467冊6,124,464拍。待該項目全部完成后,國家圖書館所藏善本縮微膠片影像將可通過網(wǎng)絡(luò)全部免費提供給讀者閱覽。
2.3國家圖書館藏普通古籍數(shù)字化項目
在做好善本古籍數(shù)字化的同時,為進一步豐富和完善古籍品種、版本,加強對普通古籍的保存保護和開發(fā)利用,自2015初開始,國家古籍保護中心啟動了“國家圖書館藏普通古籍數(shù)字化”項目,該項目在前期古籍遴選查重的基礎(chǔ)上,首選讀者利用率較高、文獻價值較大的普通古籍5,623種進行數(shù)字化,以滿足社會大眾對普通古籍的閱覽需求。預(yù)計整個項目將完成圖像掃描108萬拍,經(jīng)圖像采集加工、數(shù)據(jù)著錄、數(shù)據(jù)驗收等流程后,最終會在網(wǎng)上對公眾發(fā)布。
2.4購買館外古籍數(shù)字化資源
為避免重復(fù)建設(shè),擴大已有古籍數(shù)字資源的利用范圍,2014年底,國家古籍保護中心通過遴選查重,以單一來源采購方式購買了天津圖書館5,300余種約300萬拍的古籍數(shù)字資源。目前正處于數(shù)據(jù)拷貝提交階段,已完成50%數(shù)據(jù)量的接收工作。該批資源在驗收加工后,將通過網(wǎng)絡(luò)發(fā)布并免費提供閱覽服務(wù)。
2.5海外中華古籍調(diào)查暨數(shù)字化合作項目
為了解中華古籍在海外各主要機構(gòu)的存藏情況,國家古籍保護中心不斷加強海外中華古籍調(diào)查工作,建設(shè)“海外中華古籍書目數(shù)據(jù)庫”,目前海外古籍登記平臺已累計錄入包括美國、加拿大、西班牙、日本等4個國家30家收藏單位的24萬條書目數(shù)據(jù)(含子目)。同時,國家古籍保護中心積極開展國際合作,為海內(nèi)外學(xué)人利用和研究中華古籍創(chuàng)造條件。與哈佛燕京圖書館合作共建的“哈佛大學(xué)哈佛燕京圖書館善本特藏資源庫”已通過網(wǎng)絡(luò)發(fā)布古籍資源741部,獲得法國國家圖書館藏《圓明園四十景圖》和敦煌寫卷、英國牛津大學(xué)波德利圖書館藏19冊《永樂大典》高清數(shù)字版,使這些流失海外的珍貴中華典籍以數(shù)字化形式實現(xiàn)回歸。
2.6中華再造善本數(shù)據(jù)庫
“中華再造善本數(shù)據(jù)庫”是將“中華再造善本工程”中影印出版的珍貴古籍善本進行圖像數(shù)字化,目前已包括《中華再造善本》(一期)中758種珍稀古籍的數(shù)字資源,隨著項目的不斷開展,還將收錄更多善本。數(shù)據(jù)庫所收錄的每一種善本均配有提要,并提供檢索功能,具有較高的文獻數(shù)據(jù)價值、學(xué)術(shù)研究價值和保存?zhèn)鞑r值。
中華古籍數(shù)字化是一項保護和弘揚中華文化遺產(chǎn)的工程,具有強烈的公益色彩,需要各方面加強協(xié)調(diào),整體規(guī)劃[8]。根據(jù)《中華人民共和國國民經(jīng)濟和社會發(fā)展第十三個五年規(guī)劃綱要》的要求,結(jié)合國內(nèi)古籍數(shù)字化發(fā)展現(xiàn)狀及存在的問題,我國古籍數(shù)字化建設(shè)的后續(xù)開展,應(yīng)在國家統(tǒng)一部署、組織協(xié)調(diào)下建設(shè)國家古籍資源數(shù)據(jù)庫,全面反映中華古籍的品種與版本,供社會大眾免費利用。此舉有利于古籍原本的保存與保護,實現(xiàn)中華典籍資源的異地異質(zhì)災(zāi)備,切實保障國家文化安全。
3.1確立領(lǐng)導(dǎo)機構(gòu)
“中華古籍保護計劃”的領(lǐng)導(dǎo)機構(gòu)是全國古籍保護工作部際聯(lián)席會議,成員單位包括文化部、國家發(fā)展改革委、教育部、科技部、國家民委、財政部、國家新聞出版廣電總局、國家宗教局、國家文物局、國家中醫(yī)藥管理局,聯(lián)席會議辦公室設(shè)在文化部。2007年5月,經(jīng)中央機構(gòu)編制委員會辦公室批準,國家圖書館加掛“國家古籍保護中心”牌子,是“中華古籍保護計劃”的具體組織實施單位。
文化部委托國家古籍保護中心進行了多次調(diào)研,于2012年初擬定了《中華古籍數(shù)字資源庫建設(shè)方案》(征求意見稿),提出合作共建、資源共享的重要原則,希望通過全國古籍收藏單位間的共建共享,全面推動我國古籍數(shù)字化工作的科學(xué)有序發(fā)展[9]?!皣夜偶Y源數(shù)據(jù)庫”項目的實施可在全國古籍保護工作部際聯(lián)席會議的統(tǒng)一領(lǐng)導(dǎo)下,以“中華古籍保護計劃”為依托,由國家古籍保護中心擔任組織協(xié)調(diào)機構(gòu),統(tǒng)籌全國古籍收藏單位開展數(shù)據(jù)庫建設(shè)任務(wù)。
3.2統(tǒng)籌規(guī)劃,統(tǒng)一標準
國家古籍資源數(shù)據(jù)庫的建設(shè)目標為古籍品種完備、版本豐富,集中發(fā)布各類古籍專題資源,實現(xiàn)在線瀏覽和全文檢索。數(shù)據(jù)庫建設(shè)應(yīng)統(tǒng)籌規(guī)劃、協(xié)調(diào)發(fā)展,本著“邊建設(shè)、邊服務(wù)”的原則,有計劃、分步驟地開展?!爸腥A古籍保護計劃”啟動至今,全國2,000余家古籍收藏單位已累計完成古籍普查數(shù)據(jù)量200余萬條,應(yīng)充分利用普查登記成果開展古籍數(shù)字化工作??沙闪⑷珖偶當?shù)字化專家委員會,在普查數(shù)據(jù)基礎(chǔ)上開展數(shù)字化底本選目,同時整合國家古籍保護中心和其他古籍收藏單位現(xiàn)有的古籍數(shù)字化資源,在最大程度上減少或避免重復(fù)建設(shè)。國家古籍保護中心應(yīng)出臺數(shù)字化加工標準、元數(shù)據(jù)著錄標準、格式轉(zhuǎn)換標準、資源長期保存和發(fā)布標準等一系列統(tǒng)一的古籍數(shù)字化標準規(guī)范,確保各參建單位古籍數(shù)字化資源的長期保存、發(fā)布利用和共建共享,提高古籍數(shù)字化產(chǎn)品的使用效率和中華文化的傳播能力。
3.3合作共建,資源共享
國家古籍資源數(shù)據(jù)庫的建設(shè)思路應(yīng)包括:(1)積極利用國家圖書館等各類型古籍收藏單位已有的古籍數(shù)字化成果,匯集一系列專題資源庫,并對其進行整合,以實現(xiàn)統(tǒng)一平臺的集中檢索、分布式管理為最終目標。(2)國家古籍保護中心應(yīng)聯(lián)合各省級古籍保護中心,組織開展一些有關(guān)古籍數(shù)字化的重點專項建設(shè)。例如,在已有基礎(chǔ)上完成“中華珍貴典籍資源庫”建設(shè),涵蓋入選《國家珍貴古籍名錄》的全部古籍,各參建單位合作共建、資源共享,數(shù)據(jù)通過國家古籍保護中心實現(xiàn)在線發(fā)布。(3)應(yīng)充分調(diào)動各古籍收藏單位的參與積極性,提供財政專項經(jīng)費,采用項目申報制的形式開展古籍數(shù)字化工作。各申請單位應(yīng)優(yōu)先選擇特色館藏開展數(shù)字化,根據(jù)要求填寫項目申報書,國家古籍保護中心組織專家對申報項目進行嚴格審核,審批過程中應(yīng)鼓勵跨地區(qū)、跨系統(tǒng)的合作項目,審批通過后方可進入實施階段,項目建設(shè)完成后進行驗收及發(fā)布。
國家古籍資源數(shù)據(jù)庫的古籍數(shù)字化成果一般免費向社會發(fā)布,提供讀者利用。未經(jīng)收藏單位授權(quán),不得進行商業(yè)性開發(fā)、出版及銷售,以促進中華傳統(tǒng)文化典籍為社會大眾平等、便捷地享有。
3.4項目成本效益評價
國家古籍資源數(shù)據(jù)庫應(yīng)為國家財政支持的公益性數(shù)字化建設(shè)項目,進行成本投入和效益產(chǎn)出分析是非常必要的,不僅可以更好地對國家經(jīng)費的投入進行管控,而且有利于數(shù)字化工作的整體布局、階段性規(guī)劃和建設(shè)完善。古籍數(shù)字化的成本效益評價分為三類:用戶評估、建設(shè)者自我評估、第三方評估。在實際評估過程中,用戶評估比較容易通過一系列指標體系對古籍數(shù)字化的效益和質(zhì)量得出結(jié)論,而關(guān)于古籍數(shù)字化背后的成本數(shù)據(jù)則難以獲得,因而不易全面客觀地分析成本效益;建設(shè)者自我評估比較便于分析成本,但自我評估結(jié)果缺乏權(quán)威性和說服力[10]。因而,對于“國家古籍資源數(shù)據(jù)庫”這樣大型的古籍數(shù)字化項目,應(yīng)委托權(quán)威的第三方評價機構(gòu)開展,可以相對公正、客觀地分析和評價古籍數(shù)字化項目的成本效益,從而不斷完善工作流程、提高古籍數(shù)字化建設(shè)效率。
3.5人才隊伍建設(shè)
建設(shè)國家古籍資源數(shù)據(jù)庫,離不開專業(yè)的人才隊伍,同時項目的實施又會極大地帶動古籍數(shù)字化專業(yè)人員自身的進步與發(fā)展。古籍數(shù)字化不僅僅是圖像的簡單掃描,單靠普通的文獻數(shù)字化人員或商業(yè)數(shù)字化公司,肯定無法高質(zhì)量地完成相關(guān)數(shù)據(jù)庫的建設(shè)任務(wù)。對于實施古籍數(shù)字化項目的單位來說,既需要具備古典文獻學(xué)、古籍版本鑒定與??钡葘I(yè)知識的古籍整理研究專業(yè)人員,也需要熟悉圖書館文獻數(shù)字化流程、數(shù)字化標準規(guī)范、數(shù)據(jù)庫關(guān)鍵技術(shù)應(yīng)用的現(xiàn)代化技術(shù)人員,兩類人員缺一不可。在一定程度上而言,內(nèi)容是數(shù)據(jù)庫建設(shè)的核心,技術(shù)手段始終為內(nèi)容服務(wù)。因此,在項目規(guī)劃中,應(yīng)確保古籍整理研究專家切實參與到選目等內(nèi)容建設(shè)過程中;在數(shù)字化實施階段,更重視打造一支技術(shù)能力突出的現(xiàn)代化專業(yè)人才隊伍。
古籍數(shù)字化絕不是簡單的電子版本的制作,而是數(shù)字信息時代利用現(xiàn)代化技術(shù)對古籍開展的整理工作,廣義上屬于古籍整理的范疇。古籍數(shù)字化的過程即為在對傳統(tǒng)紙質(zhì)古籍文獻進行版本鑒定、篩選、??闭淼幕A(chǔ)上,利用計算機與網(wǎng)絡(luò)技術(shù)將其變?yōu)榭蔀g覽、可檢索、語義關(guān)聯(lián)與知識重組的數(shù)字化信息的過程。國家古籍資源數(shù)據(jù)庫的組織應(yīng)分階段、分步驟進行,逐步建設(shè)成為一個集高智能檢索系統(tǒng)、超文本鏈接功能、資源分類導(dǎo)航系統(tǒng)為一體的開放式、分層次、結(jié)構(gòu)化的古籍資源庫群。
4.1高智能的檢索系統(tǒng)
國家古籍資源數(shù)據(jù)庫應(yīng)建設(shè)成為以全文檢索為基礎(chǔ)的高智能檢索系統(tǒng),這將有助于減少研究者查找文獻所花費的時間與精力??衫肙CR技術(shù),將簡單的圖像轉(zhuǎn)換為適應(yīng)網(wǎng)絡(luò)時代圖像資源發(fā)展需求的雙層DjVu格式,針對圖像的不同圖層,DjVu采用了JB2與IW44等不同的先進圖像壓縮技術(shù),獨特的雙層格式使其兼具圖像與文檔的特性,既能滿足圖像瀏覽的要求,又可實現(xiàn)全文檢索的目標[11]。數(shù)據(jù)庫應(yīng)在完善現(xiàn)有檢索技術(shù),實現(xiàn)精確檢索、模糊檢索、邏輯檢索等各類型檢索的同時,以古籍整理研究為基礎(chǔ),添加古籍文獻所特有的一些檢索項目,提高系統(tǒng)檢索能力,便于學(xué)者開展古籍研究。建設(shè)方還應(yīng)建立繁簡異體字對照表,實現(xiàn)內(nèi)部的智能轉(zhuǎn)換,方便讀者的檢索文字輸入,提高系統(tǒng)的查全率與查準率。此外,應(yīng)允許讀者利用檢索定位功能,對已檢索出的結(jié)果進行二次檢索,以提高效率,節(jié)省讀者瀏覽頁面的時間。
4.2具備超文本鏈接功能
高質(zhì)量、高層次的古籍資源數(shù)據(jù)庫應(yīng)在實現(xiàn)全文瀏覽與智能檢索的基礎(chǔ)上,致力于采取多種方式和技術(shù)手段,建設(shè)成為超越原文本內(nèi)容,連接、集合相關(guān)信息的知識資源庫,為讀者提供一種良好的立體閱覽體驗。這需要投入足夠的研發(fā)和技術(shù)力量,經(jīng)過逐步的建設(shè)完善得以實現(xiàn),國家古籍資源數(shù)據(jù)庫應(yīng)以此為建設(shè)目標。可采用超鏈接等技術(shù),實現(xiàn)原文與相關(guān)知識點之間的鏈接。古籍中的傳世經(jīng)典著述通常有古代著名學(xué)者為其注疏,其中包含著豐富的內(nèi)容,是后人閱讀和理解原文的重要紐帶,也是繼續(xù)研究的前提和基礎(chǔ)。在原文與注疏之間進行鏈接應(yīng)是拓展古籍閱讀內(nèi)容的有效和必要方式[12]。此外,國家古籍資源數(shù)據(jù)庫中包含中華古籍的各類品種和版本,通過鏈接技術(shù)可實現(xiàn)不同版本之間的跳轉(zhuǎn),同時輔以字詞表、歷史年表、電子地圖等工具,將對研究工作中的版本鑒定、內(nèi)容批校對照提供便利。
4.3基于分類導(dǎo)航的資源整合系統(tǒng)
國家古籍資源數(shù)據(jù)庫的建設(shè)方針是各古籍收藏單位共建共享,特別是對已有數(shù)字化成果進行資源整合,統(tǒng)一檢索入口。這就需要開展基于分類導(dǎo)航系統(tǒng)的資源整合。導(dǎo)航系統(tǒng)是指將多種古籍數(shù)字資源的檢索入口整合在一起,并提供獲取數(shù)字資源途徑的知識庫數(shù)據(jù)集合[13]。分類導(dǎo)航系統(tǒng)可充分利用古籍文獻自身的類型、主題、特點等屬性,將文獻內(nèi)容重組、序化,以多種導(dǎo)航方式,對數(shù)據(jù)資源進行分類,形成書目數(shù)據(jù)庫、專題庫、知識庫等多個導(dǎo)航數(shù)據(jù)庫,并通過數(shù)據(jù)交換接口實現(xiàn)不同平臺間數(shù)據(jù)的鏈接與交換,允許讀者分類瀏覽、統(tǒng)一檢索。
中華典籍浩如煙海,但迭經(jīng)歷史上的水火兵燹,流傳至今者百不存一?!笆濉逼陂g,國家應(yīng)站在保障文化安全的戰(zhàn)略高度,盡快啟動“國家古籍資源數(shù)據(jù)庫”建設(shè)項目,統(tǒng)籌規(guī)劃、合作共建,實現(xiàn)中華典籍的保存保護,促進古籍資源為全民共享,號召全社會參與到國家古籍保護事業(yè)中來,永續(xù)中華文脈,更好地繼承和弘揚中華優(yōu)秀傳統(tǒng)文化。
1中華人民共和國國民經(jīng)濟和社會發(fā)展第十三個五年規(guī)劃綱要[EB/OL].[2016-3-22]. http://news.xinhuanet.com/politics/2016lh/ 2016-03/17/c_1118366322_18.htm.
2李國新.中國古籍資源數(shù)字化的進展與任務(wù)[J].大學(xué)圖書館學(xué)報,2002(1).
3康爾琴.公共圖書館古籍數(shù)字化的實踐與思考[J].圖書館工作與研究,2010(8).
4高娟,劉家真.中國大陸地區(qū)古籍數(shù)字化問題及對策[J].中國圖書館學(xué)報,2013(4).
5龍偉,朱云.中華古籍數(shù)字化國際合作及實踐探討[J].圖書館工作與研究,2013(7).
6龍偉.以“中華古籍保護計劃”為契機推進文獻典籍資源數(shù)字化[J].數(shù)字與縮微影像,2012(3).
7陳得媛.古籍數(shù)字化工作統(tǒng)籌協(xié)調(diào)機制的構(gòu)建[J].中國圖書館學(xué)報,2009(5).
8李明杰.中文古籍數(shù)字化基本理論問題芻議[J].圖書館論壇,2005(5).
9梁愛民,陳荔京.古籍數(shù)字化與共建共享[J].國家圖書館學(xué)刊,2012(5).
10王立清.我國古籍數(shù)字化建設(shè)的國家控制與管理模式研究[J].情報資料工作,2009(2).
11劉聰明,鄭曉惠.DjVu在資源建設(shè)中的應(yīng)用及其探討[J].現(xiàn)代情報,2008(7).
12徐清,等.古籍數(shù)字化資源的深度開發(fā)[J].圖書情報工作,2007(3).
13毛建軍.古籍數(shù)字化資源導(dǎo)航庫的模式選擇與資源評估[J].圖書館學(xué)研究,2011(21).
(王雁行 館員 國家圖書館 國家古籍保護中心辦公室副主任)
Construct National Database of Ancient Books on the Basis of China's Project of Ancient Books'Preservation and Conservation
Wang Yanhang
Digitization can effectively resolve conflicts between preservation and utilization of ancient books. The construction of National Database of Ancient Books is now involved in the national five-year plan for the first time.In order to solve current problems,it is necessary to build the National Database of Ancient Books under an overall planning,based on the existing achievements of ancient books digitization by the National Centre for Preservation and Conservation of Ancient Books and all kinds of collecting agencies of ancient books,and with the implementation of China's Project of Ancient Books'Preservation and Conservation,so as to safeguard national cultural security and promote the inheritance and promotion of Chinese excellent traditional culture.13 refs.
Digitization of Ancient Books;National Database of Ancient Books;National Centre for Preservation and Conservation of Ancient Books;China's Project of Ancient Books'Preservation and Conservation
2016-04-05