韓偉
摘 要:作為一個具有四千多年歷史的文明古國,我們擁有浩如煙海的古代典籍。據(jù)粗略統(tǒng)計,我國現(xiàn)存古籍達十萬種以上。這些典籍經(jīng)過歷史的選擇和淘汰,飽經(jīng)戰(zhàn)火和災(zāi)難流傳至今,凝聚了我國古代人民的智慧和經(jīng)驗。它們不僅是國家的寶貴文化遺產(chǎn),也是今人做學問、搞研究取之不盡、用之不竭的豐富寶藏。隨著科學技術(shù)的飛速發(fā)展,利用現(xiàn)代科技整理和研究古籍,使其數(shù)字化、網(wǎng)絡(luò)化是大勢所趨。
關(guān)鍵詞:古籍;數(shù)字化
一、從古籍特點看古籍數(shù)字化的必要性
所謂古籍數(shù)字化,就是利用數(shù)字技術(shù)將古籍轉(zhuǎn)換成數(shù)字信息,存貯于計算機或光盤上,以利古籍的使用與保護。中國古籍與其他文獻相比,有其特殊性。一、分布分散?,F(xiàn)有古籍主要分布于全國各地圖書館、資料室、科研單位及私人藏書家手中。也有一部分由于歷史原因藏于海外其他國家。其分散性造成利用不便。二、重藏輕用。由于古籍的文物價值及保管不易,古籍普遍存在重藏輕用現(xiàn)象。尤其是一些善本、孤本價值較高,收藏者往往秘不示人,給古籍的利用帶來困難。三、數(shù)量多,內(nèi)容復(fù)雜。歷代學者搞研究都離不開對前人成果的利用,但是面對汗牛充棟的古籍,究個人力量爬梳、挖掘,耗時耗力,常有力不從心之感。雖然學術(shù)界已進行大量整理工作,編纂了多種引得、通檢等工具書,但對于數(shù)量龐大的古籍文獻來說,整理只是少數(shù),這是傳統(tǒng)的手工作業(yè)難以解決的問題。
二、利用現(xiàn)代科技整理古籍,使其數(shù)字化、網(wǎng)絡(luò)化的可行性
(1)技術(shù)上的準備?,F(xiàn)代科技的飛速發(fā)展為古籍開發(fā)和整理帶來了良好的契機。早在1983年,全國語言學學科規(guī)劃會議上就指出:“隨著電子技術(shù)的發(fā)展,加上古籍整理工作者和計算機工作者的合作,計算機一定能夠幫助我們在古籍整理研究方面做更多、更復(fù)雜的事情?!笔畮啄赀^去了,大家有目共睹,計算機及網(wǎng)絡(luò)技術(shù)等日新月異,為古籍現(xiàn)代化鋪平了道路。如今,利用計算機及網(wǎng)絡(luò)技術(shù)等在資料存儲、整理、檢索、傳輸?shù)确矫娴膬?yōu)勢對古籍進行有計劃的系統(tǒng)的發(fā)掘整理,使其數(shù)字化、網(wǎng)絡(luò)化從而達到保存、利用與共享的目的是完全可能的。首先,新一代高性能計算機的海量存儲和秒級運算能力驚人,大容量、高密度的硬盤和光盤及光盤塔、光盤庫的面市,使古籍龐大的數(shù)量不再成為難題。其次,新的計算機應(yīng)用技術(shù)大大降低了古籍數(shù)字化的難度,使古籍數(shù)字化不僅成為理論上而且是技術(shù)上的可能。非鍵盤輸入技術(shù)使文獻載體轉(zhuǎn)換方式發(fā)生了一場革命,如自動識別輸入技術(shù)(ODR)使海量信息輸入工作量大大降低。數(shù)字挖掘技術(shù)(簡稱KDD)是一種可從大量數(shù)據(jù)中提取可信的、新穎的、有效的知識的高級處理過程,尤為適合古籍的數(shù)字化處理。另外如OCR光學識別技術(shù)可將古籍轉(zhuǎn)化為文本,可自動從圖像文件中抽取題名、著者等檢索點,較之人工標引快捷、簡單。其他如數(shù)字圖像技術(shù)、多媒體壓縮與傳輸技術(shù)、安全保密技術(shù)等都為古籍數(shù)字化提供了有力的支持。第三,網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展使信息資源的共享成為可能,為數(shù)字化古籍的共享和遠程利用提供了方便。國際互聯(lián)網(wǎng)不斷拓寬的網(wǎng)帶已將世界連接為一個地球村,數(shù)字化古籍的服務(wù)范圍從理論上說可以擴展到每個人的家門口。
(2)實踐中的經(jīng)驗。中國古籍是世界文化遺產(chǎn)的重要組成部分,分散于世界各地的古籍早已被各國學者所重視和研究。用現(xiàn)代科技整理開發(fā)古籍已積累了大量的實踐經(jīng)驗。美國借助其技術(shù)的先進,首先建立起古籍數(shù)據(jù)庫,如著名的聯(lián)機系統(tǒng)OCLC和RLIN,使一些流傳海外的古籍被許多學者所研究和利用。日本于1980年便開始本國古籍的自動化系統(tǒng)研究,十年后其數(shù)據(jù)庫正式運行。我國的古籍數(shù)字化工作始于八十年代中期,主要表現(xiàn)在對重要古籍數(shù)字化和編制專書專題檢索系統(tǒng)方面。例如中國社科院《全唐詩》、《全唐文》、《十三經(jīng)》、《先秦魏晉南北朝詩》檢索系統(tǒng)、《論語》逐字索引、南京師范大學的《全宋詞》檢索系統(tǒng)、四川大學古籍所《全宋文》資料檢索系統(tǒng)、陜西師范大學古籍整理研究所《二十五史》全文檢索系統(tǒng)、河南大學《宋人筆記檢索系統(tǒng)》、《南宋主要歷史文獻全文數(shù)據(jù)庫》等。尤為值得一提的是,我國古代卷帙最大的綜合性叢書《四庫全書》也已有數(shù)種電子版問世。其中濟南匯文科技開發(fā)中心研制的《四庫全書》原文電子版囊括了《四庫全書》三萬余冊所有文獻,不僅能閱讀原文,而且能夠按書名、著者、書號和指定卷、冊、頁進行檢索;上海人民出版社與香港迪志文化出版有限公司聯(lián)合開發(fā)的《文淵閣四庫全書》光盤版在保持原書原貌的基礎(chǔ)上,同時為讀者提供了快速有效的檢索、整理和編輯功能。另外,我國一些大型圖書館還都紛紛投入一定人力、物力,進行本館古籍書目數(shù)據(jù)庫的建設(shè)。
三、關(guān)于古籍數(shù)字化的思考
(1)面臨的困難。放眼古籍數(shù)字化工作,多年的研究成果令人欣喜。但是相對浩瀚的古籍資料,用現(xiàn)代技術(shù)開發(fā)整理的只是極少一部分,遠遠不能滿足搶救和利用古籍的需要。透過看似繁榮熱鬧的古籍數(shù)字化表面,我們不能不正視存在的困難。
(2)關(guān)于古籍數(shù)字化的思考。鑒于目前古籍數(shù)字化的現(xiàn)狀和存在問題,不能不引起我們的理論思考。進行統(tǒng)一的有計劃的古籍全面數(shù)字化,必須兼顧古籍書目數(shù)據(jù)庫與全文數(shù)據(jù)庫兩個層次的建設(shè)。
①首先談?wù)劰偶畷繑?shù)據(jù)庫。中國傳統(tǒng)目錄學相當發(fā)達,歷來公藏私藏之書都有編制目錄的傳統(tǒng),歷代學者無不依賴目錄作為治學津梁。因此,建立統(tǒng)一的中國聯(lián)合古籍書目數(shù)據(jù)庫,全面反映中國古籍現(xiàn)狀,為研究者提供便捷的古籍書目檢索系統(tǒng),是當今圖書館界人們的共識,也是古籍數(shù)字化、網(wǎng)絡(luò)化的基礎(chǔ)。
第一,實行標準著錄,統(tǒng)一著錄規(guī)則。中國傳統(tǒng)著錄有一定程式,但并不標準。例如對書名隨意穿靴戴帽,對版本著錄不提供客觀依據(jù),著者有著其名者、有著其號者,還有掛帶官名、籍貫的等等。八十年代以來,中國古籍有了標準著錄規(guī)則,前幾年又進一步做了修訂,并出臺了標準著錄條例。這一標準的制定結(jié)合了我國古籍特點,同時考慮到計算機著錄的要求。統(tǒng)一和推廣標準化著錄是建聯(lián)合書目數(shù)據(jù)庫的基礎(chǔ)。
第二,要規(guī)范中國古籍分類法。對于古籍,我國藏書單位采用了不同的分類法,有用科圖法的,有用人大法的,也有用中圖法、劉國鈞十五大類分類法的,但大部分單位采用的是傳統(tǒng)的四部分類法。四部分類法沿用一千余年,其分類標準是依據(jù)我國古籍的內(nèi)容、學術(shù)發(fā)展和目錄學體系而設(shè)置的,影響廣泛,使用也合習慣。因此將四部分類法加以細化,對不合理的地方加以調(diào)整,并給予科學配號,以此作為統(tǒng)一書目數(shù)據(jù)庫的分類標引應(yīng)當是可行的和易于接受的。
第三,必須制定統(tǒng)一的古籍書目機讀格式。書目機讀格式必須統(tǒng)一,如果格式不統(tǒng)一,任何軟件都將難以處理。目前大部分圖書館古籍編目采用的是國內(nèi)圖書館界中文圖書計算機著錄的通用格式CNMARC。但CNMARC格式中,有關(guān)古籍著錄方面的內(nèi)容相對欠缺,依據(jù)這些粗線條的規(guī)定,即使不同單位都采用,仍會在數(shù)據(jù)中出現(xiàn)差別。國家圖書館在CNMARC基礎(chǔ)上,根據(jù)多年實踐經(jīng)驗,由館內(nèi)外專家研究制訂了比較詳細的《漢語文古籍機讀目錄格式使用手冊》,已交由北京圖書館出版社出版。國家圖書館于今年10月還面向全國各地圖書館舉辦了機讀目錄格式培訓班,在全國圖書館界推廣統(tǒng)一的MARC標準,為建立標準的可共享的古籍書目數(shù)據(jù)庫打下了基礎(chǔ)。
古籍數(shù)字化賦予了傳統(tǒng)文化以新的生命。作為一個當代人,站在祖先遺留下來的古老墨香與現(xiàn)代科技的炫目光彩之間,我們肩負的是繼往開來的責任。雖然大規(guī)模的可共享的古籍數(shù)字化、網(wǎng)絡(luò)化絕非一朝一夕的事,但我們畢竟看到了希望。
參考文獻:
1.王純.古籍數(shù)字化之趨勢.圖書館理論與實踐,2020(3)
2.王雪迎.楊慧.計算機古籍編目初探.人大復(fù)印報刊資料.圖書學.信息科學·資料工作,2021(9)
3.李致忠.再論建立中國古籍書目數(shù)據(jù)庫·北京圖書館出版社,2020