夏超群
(河南省圖書(shū)館,河南 鄭州 450000)
我國(guó)是一個(gè)歷史文化古國(guó),古籍是我國(guó)的不可再生的文化遺產(chǎn),隨著時(shí)間的變化,古籍的數(shù)量將會(huì)越來(lái)越少。因此怎么保存好現(xiàn)有的古籍已經(jīng)成為圖書(shū)和檔案管理部門(mén)最為重要的任務(wù)[1]。由于電子掃描技術(shù)具有成本低、操作簡(jiǎn)單和保存時(shí)間比較久的特點(diǎn),因此對(duì)古籍進(jìn)行數(shù)字化管理是解決目前古籍檔案管理中面臨的一系列問(wèn)題的最有效的辦法。
我們從古籍?dāng)?shù)字化成就來(lái),能夠?qū)偶當(dāng)?shù)字化歸納為下面幾個(gè)方面的特點(diǎn):
我國(guó)政府長(zhǎng)久以來(lái)對(duì)非常對(duì)古籍保護(hù)進(jìn)行重視,自從二十一世紀(jì)以來(lái),我國(guó)在政策方面對(duì)古籍?dāng)?shù)字化工作給以高度的支持,給我國(guó)古籍?dāng)?shù)字化工作的健康發(fā)展打下良好的基礎(chǔ)。
除了不一樣級(jí)別圖書(shū)館以及科研學(xué)術(shù)機(jī)構(gòu)外,更多的商業(yè)機(jī)構(gòu)都參加到了古籍?dāng)?shù)學(xué)化工作當(dāng)中,另外從參加到的組織來(lái)看,國(guó)際數(shù)字化國(guó)際合作力量也越來(lái)越大,其給古籍?dāng)?shù)字化管理發(fā)展帶來(lái)新的方法以及內(nèi)容。
從經(jīng)典文集到方志的家譜,從紙質(zhì)的善本到碑帖的甲骨。我國(guó)的古籍資源越來(lái)越多。這帶來(lái)了古籍?dāng)?shù)字化工作在內(nèi)容方面也越來(lái)越多。民族古籍、中醫(yī)藥的古籍以及農(nóng)業(yè)古籍等等也越來(lái)越細(xì)化以及深化,不斷對(duì)現(xiàn)有古籍?dāng)?shù)字化成果進(jìn)行完善。
古籍?dāng)?shù)字化為古籍整理工作的發(fā)展以及延長(zhǎng)。在數(shù)字化的過(guò)程當(dāng)猴子呢個(gè),將面對(duì)這構(gòu)建字庫(kù),選擇版本和古籍整理基礎(chǔ)技術(shù)等方面。國(guó)外技術(shù)以及經(jīng)驗(yàn)不能給我國(guó)古籍?dāng)?shù)字化建設(shè)帶來(lái)一定的參考和借鑒。這就需要我國(guó)古籍?dāng)?shù)字化工作人員研究一種適合中華古籍?dāng)?shù)字化技術(shù)方案,并且不斷的進(jìn)行升級(jí)以及優(yōu)化。
中華民族是一個(gè)擁有著悠久歷史的文化古國(guó),古書(shū)籍的版本也比較多,就拿我們大家都熟悉的《紅樓夢(mèng)》來(lái)說(shuō)吧,就分為兩個(gè)版本,其中一個(gè)版本是八十回抄本系統(tǒng),題名為《石頭記》,也叫“脂本”系統(tǒng)。另外一種是一百二十回本系統(tǒng),也叫程高本。這兩個(gè)系統(tǒng)中還包括乙卯本和庚辰本等版本。古代的人總是說(shuō)“書(shū)非借不能讀也”。所以,我們?cè)趯?duì)古籍進(jìn)行數(shù)字化管理是要選擇合適的底本,還要對(duì)其進(jìn)行查缺補(bǔ)漏。而且由于一些保存條件的原因或者書(shū)的材質(zhì)本身的原因,造成了一些藏書(shū)已經(jīng)破損和殘缺等現(xiàn)象[2]。
在對(duì)古籍進(jìn)行數(shù)字化的過(guò)程中面臨的難點(diǎn)問(wèn)題就是漢字的處理。古籍?dāng)?shù)字化需要字庫(kù)作為支撐,然而字庫(kù)中的漢字量是有限的。但是古代的書(shū)籍中又有很多的繁體字、通假字、避諱字等,這些不規(guī)范的字體導(dǎo)致計(jì)算機(jī)文字的編碼沒(méi)有辦法使用。現(xiàn)階段行業(yè)內(nèi)一般采用的是Unicode文字處理標(biāo)準(zhǔn),然而這項(xiàng)技術(shù)定義的漢字也僅有7萬(wàn)多字,這個(gè)數(shù)字量和古籍中所涵蓋的漢字量比還有一定的差距,這直接影響了古籍?dāng)?shù)字化的發(fā)展[3]。OCR雖然是一種很先進(jìn)的信息輸入技術(shù),但是他對(duì)圖像和文字的規(guī)范化程度要求都比較高,經(jīng)常應(yīng)用于近代文獻(xiàn)以及現(xiàn)代文獻(xiàn)的數(shù)字化中。因?yàn)楣偶淖舟E一般都具有比較模糊和污漬等特點(diǎn),因此利用OCR進(jìn)行處理,也沒(méi)辦法真正有效的處理這些信息資源,甚至可能會(huì)出現(xiàn)亂碼的情況。還有一些手寫(xiě)的古籍更沒(méi)有辦法通過(guò)這種技術(shù)進(jìn)行識(shí)別。
目前,在我國(guó)的圖書(shū)館古籍管理人員中,從事古籍?dāng)?shù)字化掃描工作的人員是非常少的,這是我國(guó)古籍?dāng)?shù)字化的一個(gè)普遍問(wèn)題。使得從事古籍?dāng)?shù)字化工作的人員的工作壓力比較大,如一個(gè)工作人員把古籍從前期整理到后期數(shù)據(jù)著錄等工作做完的話,一天只能處理100幅左右的書(shū)影,導(dǎo)致掃描的進(jìn)度較慢,甚至可能會(huì)造成漏掃或者重復(fù)掃描等問(wèn)題的發(fā)生[4]。
數(shù)字化是一類(lèi)工具,古籍?dāng)?shù)字化存在許多用途,當(dāng)有助于古籍的利用及再利用,有助于保護(hù)古籍原件及有利于對(duì)原件修復(fù)等等。古籍?dāng)?shù)字化多類(lèi)用途和最終目標(biāo)不一樣,其最終目標(biāo)是實(shí)現(xiàn)保護(hù)原典以及方便古籍的而利用及再利用。當(dāng)前,我國(guó)對(duì)古籍?dāng)?shù)字化認(rèn)識(shí)還不夠全面。例如:古籍?dāng)?shù)字化最終定位在了知識(shí)發(fā)展服務(wù)方面。古籍?dāng)?shù)字化最終目的是更大范圍、更便捷以及更有效的讓文獻(xiàn)給人們所用。古籍?dāng)?shù)組化應(yīng)用立足古典保存和內(nèi)容服務(wù)。此外,還能更方便典藏以及研究等。如果對(duì)古籍?dāng)?shù)字化認(rèn)識(shí)不全面將會(huì)造成數(shù)字化過(guò)程中出現(xiàn)一定的風(fēng)險(xiǎn),或直接影響古籍?dāng)?shù)字化有關(guān)技術(shù)方法以及技術(shù)指標(biāo)的選擇,同時(shí)還會(huì)影響古籍?dāng)?shù)據(jù)管理策略方面的制定,其中含有制定有關(guān)古籍?dāng)?shù)字化有關(guān)技術(shù)等。
古籍?dāng)?shù)字化是一類(lèi)系統(tǒng)工程,其要利用科學(xué)的規(guī)劃以及發(fā)展戰(zhàn)略來(lái)統(tǒng)籌。但是,當(dāng)前我國(guó)古籍的數(shù)字化工作還缺少宏觀的調(diào)控以及管理。在這個(gè)環(huán)境當(dāng)中,缺少分工協(xié)作意識(shí)。此外,各單位在建設(shè)完成的估計(jì)數(shù)字化方面,還存在許多不足。首先,選題方面出現(xiàn)偏頗,資源大多在熱點(diǎn)的項(xiàng)目當(dāng)中,特別對(duì)商業(yè)機(jī)構(gòu)在資源來(lái)發(fā)的時(shí)候大多集中到比較少的常用古籍內(nèi)。第二,資源集中造成了許多重復(fù)的建設(shè),大大對(duì)人力以及財(cái)力進(jìn)行了浪費(fèi)。
如果想建立一個(gè)健全完善的古籍?dāng)?shù)據(jù)庫(kù),讓借閱人員上電腦就能看到古籍的整體面貌,就要建立一個(gè)統(tǒng)一的、行之有效的機(jī)讀目錄,且一定要制定統(tǒng)一的標(biāo)準(zhǔn),這是我國(guó)現(xiàn)階段古籍?dāng)?shù)字化必須解決的問(wèn)題。在古籍?dāng)?shù)字化中,僅對(duì)卷冊(cè)的頁(yè)碼、文獻(xiàn)的形態(tài)及題名等方面進(jìn)行健全,且對(duì)這些方面進(jìn)行了一同的分類(lèi)原則以及分類(lèi)標(biāo)準(zhǔn)。這將會(huì)讓制作成的產(chǎn)品更加便于閱覽者進(jìn)行操作及進(jìn)行訪問(wèn),更好的讓古籍?dāng)?shù)字化的成果發(fā)揮到最大,且更好的對(duì)資源進(jìn)行共享。這些方面的制定不但要通過(guò)信息產(chǎn)業(yè)界、標(biāo)準(zhǔn)的有關(guān)軟件、圖書(shū)館的情報(bào)界等有關(guān)軟件進(jìn)行開(kāi)發(fā)商的參與,且也含有一些古籍整理專(zhuān)業(yè)人員的參加。只有如此,才可給讀者帶來(lái)對(duì)古籍文獻(xiàn)進(jìn)行共享的一個(gè)平臺(tái)。
在進(jìn)行古籍?dāng)?shù)字化管理中,有一個(gè)非常重要的環(huán)節(jié)就是對(duì)底本的選擇,這環(huán)節(jié)必須要謹(jǐn)慎,盡量從所有底本中選擇出最優(yōu)的底本,善本的好壞對(duì)所制作的電子產(chǎn)品質(zhì)量有非常大的影響,因此在選擇底本的過(guò)程中,首先要看善本的情況。所謂的善本,就是古書(shū)籍中保存相對(duì)較完整的書(shū)。善本也是我國(guó)的一種比較珍貴的歷史文化遺產(chǎn),對(duì)其進(jìn)行科學(xué)合理的利用和選擇,并對(duì)其進(jìn)行數(shù)字化管理,有利于我國(guó)文化遺產(chǎn)的長(zhǎng)期保存。
要想提高古籍?dāng)?shù)字化管理人員的素質(zhì),不僅要對(duì)其進(jìn)行古籍整理方面的知識(shí)的培訓(xùn),還要對(duì)其進(jìn)行相關(guān)的信息技術(shù)的培訓(xùn)。所以古籍的數(shù)字化管理是在傳統(tǒng)的古籍管理的基礎(chǔ)上利用當(dāng)代的科學(xué)技術(shù)進(jìn)行信息化管理。為了保證古籍?dāng)?shù)字化工作能順利進(jìn)行,培養(yǎng)一批既具有古籍整理專(zhuān)業(yè)知識(shí)又掌握當(dāng)代的信息技術(shù)的綜合型人才是我們現(xiàn)階段的首要任務(wù),不僅要具有良好的職業(yè)道德,還應(yīng)具有良好的品行和較高的文化修養(yǎng)。
制作古籍掃描設(shè)備的企業(yè)要多采納古籍?dāng)?shù)字化工作人員的意見(jiàn),并不斷的對(duì)軟件進(jìn)行升級(jí),比如要將一些參數(shù)的設(shè)置固定化,減少重復(fù)設(shè)定的問(wèn)題,增加一些按照批次處理的功能等等;還要對(duì)掃描設(shè)備的硬件配置進(jìn)行不斷的完善,比如可在以往的操作臺(tái)上增加升降功能。只有不斷的更新和完善掃描設(shè)備,才能提高古籍?dāng)?shù)字化的工作效率和書(shū)影的質(zhì)量。此外,還可通過(guò)一些通訊軟件,多與用戶進(jìn)行實(shí)時(shí)溝通,并進(jìn)行不斷的改進(jìn)。
通過(guò)我國(guó)的古籍保護(hù)中心等機(jī)構(gòu)來(lái)牽頭組織,更好的規(guī)劃,科學(xué)分工,對(duì)古籍資源共同建設(shè)進(jìn)行統(tǒng)籌,給控制管理古籍?dāng)?shù)字化工作進(jìn)行選題。首先,避免充分建設(shè),盲目的進(jìn)行建設(shè)。第二,鼓勵(lì)及促進(jìn)特色古籍資源數(shù)字化建設(shè),讓古籍?dāng)?shù)字化工作持續(xù)健康的發(fā)展。除此之外,利用統(tǒng)籌規(guī)劃沖破建設(shè)單位來(lái)另起爐灶,對(duì)共享共建提出比較高的要求,盡可能的整合以及利用數(shù)字化成果,大大提升使用的效率,降低物力、財(cái)力、人力方面的浪費(fèi)。
我國(guó)是一個(gè)歷史文化古國(guó),古籍是我國(guó)的不可再生的文化遺產(chǎn),隨著時(shí)間的變化,古籍的數(shù)量將會(huì)越來(lái)越少。因此怎么保存好現(xiàn)有的古籍已經(jīng)成為圖書(shū)和檔案管理部門(mén)最為重要的任務(wù)。目前古籍?dāng)?shù)字化雖然取得了一定的成果,但是還存在一些列問(wèn)題。所以,我國(guó)要對(duì)中文古籍檔案標(biāo)準(zhǔn)的進(jìn)行研究,并制定檔案標(biāo)準(zhǔn),還要慎重的選擇底本,建立完善的古籍資源庫(kù),并加強(qiáng)相關(guān)人員的培訓(xùn)工作。