張宛艷
摘要:作者闡述了古籍檔案數(shù)字化建設(shè)的基本實(shí)施途徑,并從古籍檔案數(shù)字化的幾種實(shí)現(xiàn)方式和存在的若干問(wèn)題等方面探討了古籍檔案整理利用的特點(diǎn),提出了個(gè)人對(duì)古籍檔案數(shù)字化建設(shè)的一些思考,以期為古籍檔案管理者提供工作參考。
關(guān)鍵詞:古籍檔案;古籍檔案整理;古籍檔案數(shù)字化:檔囊管理者
我國(guó)歷史源遠(yuǎn)流長(zhǎng)。古代文獻(xiàn)檔案浩如煙海。古籍檔案作為民族歷史文化的象征,是先人留給我們的歷史文化瑰寶和寶貴財(cái)富。是今人研究歷代社會(huì)政治經(jīng)濟(jì)、科技文化等方面的重要原始材料,整理保存和研究利用古籍檔案是一項(xiàng)長(zhǎng)期而艱巨的任務(wù)。隨著文獻(xiàn)信息載體向數(shù)字化、網(wǎng)絡(luò)化發(fā)展的趨勢(shì),古籍檔案整理已經(jīng)走出傳統(tǒng)觀念,正在朝著數(shù)字化存儲(chǔ)和網(wǎng)絡(luò)化服務(wù)的方向發(fā)展。
1古籍檔案數(shù)字化建設(shè)的意義
古籍文獻(xiàn)對(duì)于人類(lèi)文明與社會(huì)發(fā)展有重要的史料作用,同時(shí)也是我國(guó)檔案文獻(xiàn)遺產(chǎn)中重要的一部分。據(jù)有關(guān)專(zhuān)家估計(jì)保存至今的古籍約23萬(wàn)卷,全國(guó)古籍藏量應(yīng)在5000萬(wàn)冊(cè)左右,可謂卷帙浩繁。這些寶貴的文化遺產(chǎn),蘊(yùn)藏著豐富的信息資源,為學(xué)者進(jìn)行學(xué)術(shù)研究提供了取之不盡、用之不竭的資料,古籍檔案作為紙質(zhì)文獻(xiàn),隨著時(shí)間的推移,它越“古老”,其珍貴價(jià)值就越高;同時(shí)紙張的老化也在加劇,且不易修復(fù);再加上反復(fù)借閱使用,必將加速紙張的磨損,這些都造成對(duì)古籍文獻(xiàn)或多或少的損壞,隨著計(jì)算機(jī)應(yīng)用、數(shù)據(jù)庫(kù)技術(shù)、網(wǎng)絡(luò)多媒體技術(shù)的普遍實(shí)施,科技的發(fā)展迫使古籍檔案的整理也應(yīng)與之相適應(yīng),然而實(shí)際情況是古籍檔案整理工作的科技應(yīng)用和其他領(lǐng)域相比顯得要落后許多,開(kāi)拓古籍檔案整理與研究的現(xiàn)代化領(lǐng)地,是擺在我們面前的嚴(yán)峻課題。
古籍檔案數(shù)字化就是從利用和保護(hù)古籍檔案的目的出發(fā),采用計(jì)算機(jī)技術(shù),將常見(jiàn)的語(yǔ)言文字或圖形符號(hào)轉(zhuǎn)化為能被計(jì)算機(jī)識(shí)別的數(shù)字符號(hào),從而制成古籍檔案書(shū)目數(shù)據(jù)庫(kù)和古籍檔案全文數(shù)據(jù)庫(kù),用以揭示古籍檔案信息資源的一項(xiàng)系統(tǒng)工作。古籍檔案數(shù)字化以后,讀者可以通過(guò)光盤(pán)或者網(wǎng)絡(luò)瀏覽閱讀電子讀物,可以任意跳躍查找或局部放大,避免了直接翻閱古籍檔案的諸多不便,給古籍檔案的使用帶來(lái)革命性的變化,數(shù)字化后的古籍檔案不僅可提供屏幕閱讀、內(nèi)容檢索,還可以提供下載打印、遠(yuǎn)程全文傳送、專(zhuān)題展覽。以及制作多媒體電子媒介等多種全方位的服務(wù)。事實(shí)證明,古籍檔案數(shù)字化不但有效地保護(hù)了古籍檔案,而且方便了讀者的閱讀使用,大大提高了古籍檔案的利用價(jià)值。
2古籍檔案數(shù)字化建設(shè)的方式
我國(guó)從上世紀(jì)80年代中期就開(kāi)始古籍檔案數(shù)字化的嘗試,從單純的全文掃描圖像,到制作書(shū)目數(shù)據(jù)庫(kù)、開(kāi)發(fā)研制各種檢索工具,再到現(xiàn)在的對(duì)古籍檔案全文數(shù)字化,經(jīng)過(guò)這么長(zhǎng)期的探索,已取得不少成就,也積累了豐富的經(jīng)驗(yàn)。目前古籍檔案數(shù)字化一般來(lái)說(shuō)有以下四種方式:
完全圖像方式。這是最簡(jiǎn)單的一種數(shù)字化的方,法。只需將古籍檔案掃描成圖像,存儲(chǔ)在存儲(chǔ)介質(zhì)上即可,文字是以圖像方式如BMP、JI G、TAG、GIF等格式存儲(chǔ),通過(guò)這種方式得到的古籍檔案數(shù)字化版本被稱(chēng)為“全圖像版”,全圖像版直觀真實(shí)、快捷實(shí)用,但文字與圖像之間沒(méi)有索引關(guān)系,無(wú)法直接檢索到古籍檔案內(nèi)容。不便查找。
目錄文本、正文圖像方式。這是在“全圖像版”基礎(chǔ)上的一種改進(jìn)。目錄全部用文本方式存儲(chǔ),而正文部分采用圖像方式存儲(chǔ),并建立目錄與正文之間的索引關(guān)系。讀者可以在目錄級(jí)進(jìn)行檢索和查找,并可根據(jù)目錄與正文之間的索引關(guān)系,找到所需的正文圖像。這里的目錄可以認(rèn)為是廣義的目錄,除了包括卷名、書(shū)名、大小標(biāo)題外。還可以包括圖名和表名等,這種方式的古籍檔案數(shù)字化版本可稱(chēng)為“標(biāo)題檢索版”。
全文本方式。“標(biāo)題檢索版”只實(shí)現(xiàn)了目錄級(jí)的檢索與查找問(wèn)題。全文本方式是將書(shū)中所有文字全部采用文本方式存儲(chǔ),屬于真正意義下的數(shù)字化圖書(shū),可以實(shí)現(xiàn)全文檢索和查找。這種古籍檔案數(shù)字化版本我們稱(chēng)為“全文本版”。
全文圖文對(duì)照方式。該方式是上述方式的綜合體,也是目前古籍檔案整理工作者普遍運(yùn)用的方法。它分別以圖像和文本方式存儲(chǔ)古籍,還對(duì)古籍檔案中的每一個(gè)漢字與它在原書(shū)中的圖像之間建立索引關(guān)系,用戶(hù)既可以在“全文本版”中檢索、查找和閱讀古籍檔案,又可以迅速方便地“翻閱”到當(dāng)前文字在“全圖像版”中對(duì)應(yīng)的位置。這種方式得到的古籍檔案數(shù)字化版本我們稱(chēng)為“圖文檢索版”。“圖文檢索版”是目前最為理想化的數(shù)字化方式,既可以讀文、檢索,又可以觀察原文圖像,觀看古籍檔案中字體的寫(xiě)法、排版特點(diǎn)等情況。
3古籍檔案數(shù)字化中存在的問(wèn)題及對(duì)策
古籍檔案的數(shù)字化極大提高了古籍檔案的利用價(jià)值,解決了古籍檔案“藏”與“用”之間的矛盾,但是在利用過(guò)程中我們也看到古籍檔案數(shù)字化還存在不少的問(wèn)題。
3.1古籍檔案數(shù)字化申存在的問(wèn)題
目前古籍檔案數(shù)字化建設(shè)和利用中存在著許多值得重視的問(wèn)題,主要是:偏重于硬件建設(shè),軟件開(kāi)發(fā)和信息服務(wù)明顯滯后:核心技術(shù)開(kāi)發(fā)能力薄弱,關(guān)鍵硬件和軟件依賴(lài)進(jìn)口;信息資源開(kāi)發(fā)嚴(yán)重不足,而網(wǎng)絡(luò)和數(shù)據(jù)庫(kù)又存在大量低水平的重復(fù)建設(shè),且難以實(shí)現(xiàn)互聯(lián)共享;信息安全存在隱患。
現(xiàn)行通用的標(biāo)準(zhǔn)是1996年10月由中國(guó)文獻(xiàn)編目規(guī)則編撰小組編撰、全國(guó)情報(bào)文獻(xiàn)工作標(biāo)準(zhǔn)化技術(shù)委員會(huì)及中國(guó)圖書(shū)館學(xué)會(huì)推薦使用的《中國(guó)文獻(xiàn)編目規(guī)則·古籍著錄規(guī)則》。隨著時(shí)代的進(jìn)步和科學(xué)技術(shù)的日新月異,原有標(biāo)準(zhǔn)已經(jīng)無(wú)法完全適用。因此,我們有必要根據(jù)這個(gè)著錄規(guī)則編目或?qū)σ延械哪夸浖右孕抻喲a(bǔ)充,統(tǒng)一著錄標(biāo)準(zhǔn),以保證數(shù)據(jù)庫(kù)的質(zhì)量和查詢(xún)服務(wù)效果。不僅要有規(guī)范的著錄條例、數(shù)據(jù)庫(kù)格式、編目軟件使用字庫(kù),還要有統(tǒng)一的古籍分類(lèi)法,這些標(biāo)準(zhǔn)的制定不僅要有圖書(shū)館界、檔案界、信息產(chǎn)業(yè)界和軟件開(kāi)發(fā)商共同參與,而且要有從事古籍檔案整理的專(zhuān)業(yè)人員參與,這樣才能為讀者提供一個(gè)數(shù)字化古籍檔案的統(tǒng)一平臺(tái)。
古籍檔案數(shù)字化建設(shè)和利用工作是需要學(xué)術(shù)界和軟件廠商的共同參與,因而有產(chǎn)業(yè)化的趨勢(shì)。由于前期參與的機(jī)構(gòu)眾多,造成數(shù)據(jù)文件格式繁多。一般不能通用,需要單獨(dú)的閱讀器才能使用,這樣的局面極不利于讀者閱讀、使用。另外,在古籍檔案數(shù)字化產(chǎn)品中,選題和內(nèi)容重復(fù)也是一個(gè)不爭(zhēng)的事實(shí)。例如《四庫(kù)全書(shū)》原文電子版、《四庫(kù)全書(shū)》全文檢索版、《四部叢刊》全文檢索版等。重復(fù)的選題,造成了人力、物力、財(cái)力等資源的巨大浪費(fèi)。
還有,當(dāng)今在學(xué)術(shù)界愿意從事古籍檔案整理工作的年輕人才已經(jīng)非常少,特別是那種既具備古籍檔案整理知識(shí)又能熟練掌握應(yīng)用現(xiàn)代化信息技術(shù)的較高層次的復(fù)合型人才更為匱乏。隨著從事古籍檔案整理的老一輩工作人員的陸續(xù)退休,古籍檔案數(shù)字化建設(shè)工作的人才“斷層”問(wèn)題,顯得尤為突出。
3.2對(duì)古籍檔案數(shù)字化建設(shè)的思考
我國(guó)的古籍檔案浩繁,且分布地域廣泛,為了避免造成重復(fù)建設(shè)的資源浪費(fèi),全面了解全國(guó)古籍檔案數(shù)字化建設(shè)和應(yīng)用情況,促進(jìn)古籍檔案數(shù)字化建設(shè)和利用的健康發(fā)展,我們呼吁成立全國(guó)古籍檔案數(shù)字化建設(shè)領(lǐng)導(dǎo)小組和古籍檔案數(shù)字化建設(shè)專(zhuān)家組,由各相關(guān)專(zhuān)業(yè)、各相關(guān)領(lǐng)域的學(xué)者專(zhuān)家組成,加強(qiáng)統(tǒng)籌協(xié)調(diào),堅(jiān)持面向市場(chǎng),統(tǒng)一規(guī)劃,統(tǒng)一領(lǐng)導(dǎo),相互協(xié)調(diào),相互配合,相互支持,在古籍檔案數(shù)字化建設(shè)中實(shí)現(xiàn)資源共享,扎扎實(shí)實(shí)推進(jìn)我國(guó)古籍檔案數(shù)字化的建設(shè)和應(yīng)用。
要進(jìn)行廣泛調(diào)研和深入分析,吸取經(jīng)驗(yàn)教訓(xùn),避免走彎路;在技術(shù)上要高起點(diǎn),實(shí)行整體規(guī)劃,業(yè)務(wù)系統(tǒng)建設(shè)與整合分步實(shí)施:在建設(shè)中要充分考慮對(duì)已有系統(tǒng)整合與無(wú)縫連接,共同協(xié)商制定古籍檔案數(shù)字化的內(nèi)容、標(biāo)引的深度、相關(guān)檢索工具的配置等,不能為了數(shù)字化而搞數(shù)字化,要用市場(chǎng)的辦法發(fā)展數(shù)字化;不能搞沒(méi)有效益的數(shù)字化,更不能搞“花架子”。同時(shí)各個(gè)相關(guān)業(yè)務(wù)單位應(yīng)該樹(shù)立大局意識(shí),舍棄小我利益,既要培育競(jìng)爭(zhēng)機(jī)制,又要加強(qiáng)統(tǒng)籌協(xié)調(diào),努力為古籍檔案數(shù)字化發(fā)展創(chuàng)造良好的環(huán)境:要按照互聯(lián)互通、資源共享的原則,杜絕各種網(wǎng)絡(luò)和系統(tǒng)的重復(fù)建設(shè),防止一哄而起;既要重視對(duì)外開(kāi)放與合作,又要加強(qiáng)自主科研開(kāi)發(fā)。
古籍檔案的數(shù)字化建設(shè)對(duì)研究人員提出了更高的標(biāo)準(zhǔn),它不僅要求研究人員要掌握古籍檔案的分類(lèi)、版本鑒定、編目,還要會(huì)編制數(shù)據(jù)庫(kù),懂得計(jì)算機(jī)網(wǎng)絡(luò)、多媒體等現(xiàn)代技術(shù),并能輔導(dǎo)讀者利用現(xiàn)代化的科技手段來(lái)閱讀、使用和研究古籍檔案。因此盡快培養(yǎng)一批學(xué)有專(zhuān)長(zhǎng)、信息素養(yǎng)較高、技術(shù)熟練、善于合作的復(fù)合型人才顯得極為重要而又迫切。
總之,古籍檔案數(shù)字化整理工作是隨著科技的進(jìn)步而進(jìn)步的,它需要檔案工作者和研究者、古漢語(yǔ)學(xué)者和數(shù)字信息專(zhuān)家們的通力合作。相信只要我們進(jìn)行不懈的努力,最終定能實(shí)現(xiàn)數(shù)字化的古籍檔案真正意義上的資源共享。
參考文獻(xiàn):
[1]覃燕梅,我國(guó)高校圖書(shū)館古籍文獻(xiàn)保護(hù)工作研究[J].圖書(shū)館論壇,2007(4).
[2]朱小健,古籍整理通用系統(tǒng)及其中字典的編纂[J].語(yǔ)言文字應(yīng)用,2000(3).
[3]余述淳,古籍資源數(shù)字化建設(shè)的一些探討[J].大學(xué)圖書(shū)情報(bào)學(xué)刊,2003(2).
[4]潘德利,中國(guó)古籍?dāng)?shù)字化進(jìn)程和展望[J].圖書(shū)情報(bào)工作,2002(7).
[5]王發(fā)杜,古籍?dāng)?shù)字化的幾點(diǎn)思考[J].圖書(shū)館論壇,2006(3).
[6]厲莉,古籍?dāng)?shù)字化的現(xiàn)狀及對(duì)策[J].江西圖書(shū)館學(xué)刊,2002(1).
[7]鄭幸飛,從書(shū)院文化數(shù)據(jù)庫(kù)建設(shè)看古籍文獻(xiàn)數(shù)字化[J].圖書(shū)館,2006(6).
(作者簡(jiǎn)介:南陽(yáng)師范學(xué)院來(lái)稿日期:2009-06-20)