陳文韜
籍資源數(shù)字化開發(fā)與利用是新時代古籍整理出版的新趨勢和新方向。目前古籍資源數(shù)字化的主要類型有原典的數(shù)字化和古籍整理成果的數(shù)字化兩種,面臨缺乏整體規(guī)劃、古籍整理成果資源有限、缺乏統(tǒng)一的數(shù)字化標(biāo)準(zhǔn)、尚未形成明晰的盈利模式等主要問題。未來應(yīng)當(dāng)加強對古籍資源數(shù)字化的行業(yè)監(jiān)管和引導(dǎo),進行項目資助,建立古籍資源數(shù)字化版權(quán)保護規(guī)章制度,加強古籍資源數(shù)字化人才培養(yǎng),加強多種途徑的嘗試,探索古籍資源數(shù)字化的更多可能性。
古籍資源數(shù)字化是指利用現(xiàn)代信息技術(shù)對古籍文獻進行加工處理,使其轉(zhuǎn)化為電子數(shù)據(jù)形式,通過光盤、網(wǎng)絡(luò)等介質(zhì)保存和傳播。古籍資源的數(shù)字化開發(fā)和利用,已經(jīng)成為古籍整理出版的新趨勢和新方向。
古籍資源數(shù)字化
開發(fā)與利用的現(xiàn)狀
一是對古籍善本的原物掃描和原樣復(fù)制。海內(nèi)外各圖書館和其他收藏機構(gòu)進行了大量的古籍原典數(shù)字化的工作,很多古籍善本通過掃描制作成圖片的方式,實現(xiàn)了網(wǎng)絡(luò)存儲、查詢、下載和共享,對我們接觸和研究古籍文獻提供了極大的便利。如國家圖書館出版社近年來開發(fā)的“中華再造善本數(shù)據(jù)庫”,便將“中華再造善本工程”中影印出版的珍貴古籍善本進行圖像數(shù)字化,并通過對珍貴古籍善本的數(shù)字化加工和多元應(yīng)用,實現(xiàn)珍貴古籍善本的再開發(fā)和再利用,是一個具有重要學(xué)術(shù)研究價值的古籍?dāng)?shù)字資源平臺。
二是用數(shù)字化的形式展現(xiàn)古籍整理的已有成果,發(fā)布專業(yè)文本供讀者瀏覽,還可實現(xiàn)多功能檢索。經(jīng)過多年的努力,出版機構(gòu)尤其是專業(yè)古籍出版社積累了大量的古籍整理出版成果,將這些古籍整理出版資源數(shù)字化,提供網(wǎng)絡(luò)閱讀和檢索服務(wù),將使古籍整理出版成果得到更廣泛的利用。由中華書局下屬古聯(lián)(北京)數(shù)字傳媒科技有限公司開發(fā)的“中華經(jīng)典古籍庫”,便在這一方向進行了很好的實踐,取得了一定的成績?!爸腥A經(jīng)典古籍庫”收錄了中華書局及其他古籍出版社出版的整理本古籍圖書,涵蓋經(jīng)史子集各部,包含了“二十四史”、“史料筆記叢刊”、“古典文學(xué)基本叢書”、“佛教典籍選刊”、《資治通鑒》、《新編諸子集成》、《清人十三經(jīng)注疏》等經(jīng)典系列?!爸腥A經(jīng)典古籍庫”提供了豐富的古籍?dāng)?shù)字化閱讀、檢索服務(wù)以及必備的輔助工具,特別提供了文本數(shù)據(jù)與原書圖像的對照,并能自動生成引用格式,便于了解版式信息,省去了核對紙書的麻煩,為用戶帶來了便利。
古籍資源數(shù)字化
開發(fā)與利用面臨的問題
1.重復(fù)建設(shè)的情況嚴(yán)重
除了“中華再造善本數(shù)據(jù)庫”“中華經(jīng)典古籍庫”這些較為知名的古籍?dāng)?shù)據(jù)庫之外,還有大量的機構(gòu)在進行古籍資源數(shù)字化的工作,如“中國哲學(xué)書電子化計劃”“書同文古籍?dāng)?shù)據(jù)庫”“中國基本古籍庫”“國學(xué)寶典”等等。由于缺少統(tǒng)一的規(guī)劃,這些數(shù)據(jù)庫出現(xiàn)了重復(fù)建設(shè)的問題。一些熱門古籍不斷重復(fù)地被不同的數(shù)據(jù)庫進行數(shù)字加工,如多個數(shù)據(jù)庫都收錄了《四庫全書》和《二十五史》;數(shù)字化成果質(zhì)量良莠不齊,既有可以代表古籍整理較高水平的數(shù)字化資源,也有粗制濫造的簡單圖片掃描??傮w來說,結(jié)合???、輯佚等深度整理的精良本的數(shù)據(jù)庫較少。
2.古籍資源數(shù)字化缺乏“源頭活水”
古籍原典數(shù)字化面臨較為嚴(yán)重的資源限制。以各大圖書館為代表的收藏機構(gòu)保存了大量的古籍善本,其中不乏稀見文獻資料。但大部分收藏機構(gòu)將這些古籍資源視為自己的獨有資源,不愿輕易示人,更不要說進行數(shù)字化傳播了。因此,受資源壟斷的限制,一些珍稀古籍文獻和善本得不到進行數(shù)字化的機會。古籍整理成果資源有限。數(shù)字化的古籍應(yīng)該是經(jīng)過認(rèn)真整理的古籍,需要運用目錄學(xué)、版本學(xué)、??睂W(xué)、文字學(xué)、音韻學(xué)、歷史文獻學(xué)等各方面專業(yè)知識進行點校,成為現(xiàn)有最好或較好的版本。否則,將會造成謬誤流傳,劣本取代善本。但目前流傳的古籍?dāng)?shù)字化資源,有很多是未經(jīng)專業(yè)整理的粗制濫造的版本。目前“中華經(jīng)典古籍庫”收書2300余種,12.6億字,預(yù)計再經(jīng)過數(shù)年的努力,可以達到5000種、20億字的規(guī)模。這一數(shù)據(jù)相較我國現(xiàn)存的古籍圖書規(guī)模,屬于九牛一毛、冰山一角。制約“中華經(jīng)典古籍庫”規(guī)模的最大因素,在于優(yōu)質(zhì)古籍整理成果的匱乏。
3.缺乏統(tǒng)一的數(shù)字化標(biāo)準(zhǔn)
各機構(gòu)開發(fā)的數(shù)據(jù)庫都有自己的數(shù)字化標(biāo)準(zhǔn),沒有形成統(tǒng)一的跨平臺接口。古籍資源數(shù)字化的技術(shù)標(biāo)準(zhǔn)必須符合中文古籍的特點。古籍?dāng)?shù)字化流程中,數(shù)據(jù)采集標(biāo)準(zhǔn)規(guī)范、圖像采集處理規(guī)范、文字采集規(guī)范、資源內(nèi)容表示規(guī)范、古籍用字標(biāo)準(zhǔn)、專有名詞標(biāo)準(zhǔn)、整理本古籍元數(shù)據(jù)標(biāo)準(zhǔn)、整理本古籍文獻數(shù)據(jù)標(biāo)注標(biāo)準(zhǔn)等等,都必須符合中文古籍的特點。目前國內(nèi)對古籍?dāng)?shù)字化缺少統(tǒng)一的行業(yè)標(biāo)準(zhǔn),各數(shù)據(jù)庫自行制定的標(biāo)準(zhǔn)存在較大差異,導(dǎo)致各數(shù)據(jù)庫的質(zhì)量良莠不齊,也不利于不同數(shù)據(jù)庫之間的合作開發(fā)與利用。
4.尚未形成很明晰的盈利模式
進行古籍資源的數(shù)字化,需要投入大量的人力、物力和財力,并且周期長,投資回報率不高。從目前來看,古籍資源的數(shù)字化尚處于探索期,并未形成明晰的盈利模式。由出版單位開發(fā)的各類數(shù)據(jù)庫,主要依靠圖書館、高校等專業(yè)組織的購買,難以形成廣泛的零售需求,很難擴大銷售規(guī)模,難以帶來巨大收益。以“國學(xué)大師”“書格”等為代表的共享數(shù)據(jù)庫,主要通過收取網(wǎng)站廣告費、網(wǎng)友捐贈、移動硬盤拷貝資料銷售等方式來維持運營,未能找到更好的盈利模式。
對古籍資源數(shù)字化
開發(fā)與利用的建議
1.政府部門設(shè)立相關(guān)機構(gòu),加強對古籍資源數(shù)字化的行業(yè)監(jiān)管和引導(dǎo)
制定古籍資源數(shù)字化發(fā)展規(guī)劃,協(xié)調(diào)各出版機構(gòu)的古籍資源數(shù)字化工作,整合各出版機構(gòu)的優(yōu)勢資源,可以避免同質(zhì)化重復(fù)建設(shè)。主管部門制定統(tǒng)一的古籍資源數(shù)字化標(biāo)準(zhǔn),建立跨平臺、跨數(shù)據(jù)庫的統(tǒng)一接口,使各數(shù)據(jù)庫能夠?qū)崿F(xiàn)跨平臺資源檢索和使用,充分實現(xiàn)各平臺優(yōu)質(zhì)資源的共享。
2.在古籍資源數(shù)字化盈利模式尚不明晰的情況下通過項目資助的方式,對古籍資源數(shù)字化進行引導(dǎo)
為古籍資源數(shù)字化提供必要的資金支持。以項目資助的方式,引導(dǎo)圖書館等收藏單位將已有古籍善本進行數(shù)字化開發(fā)和利用,鼓勵圖書館進行稀有古籍善本的數(shù)字化開發(fā)和網(wǎng)絡(luò)共享,使更多研究者和讀者能夠通過數(shù)字化平臺接觸古籍善本影像資料,實現(xiàn)對古籍善本的有效保護和利用。通過資金扶持,引導(dǎo)出版機構(gòu)進行古籍整理出版資源的數(shù)字化。鼓勵出版機構(gòu)加大古籍整理工作力度,整理出版更多古籍善本,為古籍資源數(shù)字化不斷提供新的古籍整理優(yōu)質(zhì)內(nèi)容。此外,還可以通過稅費減免等方式,降低古籍資源數(shù)字化機構(gòu)的運營成本,鼓勵更多的企業(yè)參與到古籍資源數(shù)字化工作中來。
3.對古籍資源數(shù)字化版權(quán)進行有效保護建立古籍資源數(shù)字化版權(quán)保護規(guī)章制度
古籍資源數(shù)字化存在難制作、易被侵權(quán)的問題。應(yīng)當(dāng)做好古籍資源數(shù)字化版權(quán)登記,加強對古籍資源數(shù)字化版權(quán)的保護力度,嚴(yán)厲打擊侵犯古籍資源數(shù)字化版權(quán)的行為。
4.加強多種途徑的嘗試探索古籍資源數(shù)字化的更多可能性
除了古籍原典的數(shù)字化、古籍整理成果的數(shù)字化這兩大最主要的古籍資源數(shù)字化途徑之外,我們還應(yīng)積極嘗試更多可行的途徑。(1)古籍的數(shù)字化整理。古籍的數(shù)字化整古理可以通過數(shù)字化平臺實現(xiàn)古籍的自動???、自動標(biāo)點、自動編纂、自動注釋、自動索引、自動排版等功能,可以極大提高古籍整理出版工作效率,并降低人力成本。筆者相信,在技術(shù)不斷成熟和完善的基礎(chǔ)上,古籍的數(shù)字化整理必將成為古籍整理出版工作的新動力。(2)古籍資源的數(shù)據(jù)庫開發(fā)與利用。目前大多數(shù)的古籍?dāng)?shù)據(jù)庫還處于“資料庫”的階段,只能提供較為簡單的檢索和閱讀服務(wù)。而古籍資源的數(shù)據(jù)庫采用社會科學(xué)的方法論和電腦運算工具,如超文本、資料視覺化、統(tǒng)計學(xué)、文本探勘、數(shù)位制圖等,實現(xiàn)運算、分析、統(tǒng)計等功能,可以將古籍資源進行更深入的開發(fā)和利用,產(chǎn)生新的價值。(3)古籍資源的融合出版。古籍出版單位可以在紙質(zhì)圖書中加入AR、VR等新技術(shù),使閱讀體驗更加豐富,更加富有層次。如對文博考古類圖書中出現(xiàn)的圖片進行AR處理,使圖片中器物的細節(jié)更加豐富立體;對圖書中展示的考古發(fā)掘現(xiàn)場進行VR展示,使讀者能進行全方位、多角度的觀看,如身臨其境。
(湖南岳麓書社有限責(zé)任公司)