古海峰
摘 要:隨著古籍文獻(xiàn)數(shù)字化資源的開(kāi)發(fā)與建設(shè),地方文獻(xiàn)古籍?dāng)?shù)字化的進(jìn)程也在有序地開(kāi)展,本文從地方文獻(xiàn)古籍?dāng)?shù)字化的意義入手,通過(guò)列舉本館在數(shù)字化工作中遇到的問(wèn)題,并提出了解決這些問(wèn)題的對(duì)策和方法。
關(guān)鍵詞:地方文獻(xiàn);古籍;數(shù)字化
地方文獻(xiàn)古籍即地方古代書(shū)籍、文獻(xiàn),是綜合反映一個(gè)地區(qū)歷史進(jìn)程中政治、經(jīng)濟(jì)、文化、教育、歷史、地理、風(fēng)土人情、人物傳記、物產(chǎn)資源、名勝古跡等重要內(nèi)容的文獻(xiàn)資源,它是各地區(qū)民族歷史文化的重要載體,各地區(qū)的歷史文化和民族的精神有賴于它而傳承、延續(xù)。
筆者所在的梧州市,是嶺南古都,自建制以來(lái),歷漢、三國(guó)、魏晉南北朝,達(dá)700多年。梧州市圖書(shū)館館藏的地方文獻(xiàn)古籍以方志為主,如廣西通志(清嘉慶六年刻本 )、蒼梧縣志(清同治十三年刻本)、臨桂縣志(清嘉慶七年刻本)等。這些舊方志的很多材料來(lái)自現(xiàn)實(shí)生活,會(huì)記載大量的人物傳記,這部分人物在正史中多半是不收錄或者記載不詳細(xì),因此舊方志對(duì)于了解梧州地區(qū)一些特殊人物的真實(shí)生活情況,幫助更全面的還原這些人物的各種信息具有不可替代的作用。
1 地方文獻(xiàn)古籍?dāng)?shù)字化的意義
地方文獻(xiàn)古籍是珍貴文化遺產(chǎn),我們既要保護(hù)好珍貴的地方文獻(xiàn)古籍,又要利用好地方文獻(xiàn)古籍給我們的精神遺產(chǎn)。但是地方文獻(xiàn)古籍往往由于保護(hù)不力,都會(huì)出現(xiàn)蟲(chóng)蛀、殘缺、發(fā)霉等破損情況,很多館藏單位本著保護(hù)文獻(xiàn)的目的,都不提供對(duì)外借閱,這就產(chǎn)生了保護(hù)與利用不能共存的矛盾。而地方文獻(xiàn)古籍?dāng)?shù)字化以后,這個(gè)矛盾就不存在了,因?yàn)閿?shù)字化地方文獻(xiàn)古籍是對(duì)原文獻(xiàn)的整理后以計(jì)算機(jī)數(shù)字形式呈現(xiàn),它將原文獻(xiàn)的文化價(jià)值和文物價(jià)值分開(kāi)來(lái),既實(shí)現(xiàn)了地方文獻(xiàn)古籍的數(shù)字化永久保存,有可以使研究人員、讀者在不接觸原文獻(xiàn)的基礎(chǔ)上進(jìn)行閱讀和研究。
2 地方文獻(xiàn)古籍?dāng)?shù)字化概念
地方文獻(xiàn)古籍?dāng)?shù)字化可以稱為“計(jì)算機(jī)化”,分為兩個(gè)步驟:一是古籍文獻(xiàn)的數(shù)字圖像化,一是古籍文字的數(shù)字編碼化。通過(guò)電子掃描、數(shù)碼照相等技術(shù)手段,可以將古籍的圖文處理成用計(jì)算機(jī)能識(shí)別和處理的數(shù)據(jù)。數(shù)字編碼化是通過(guò)多種手段以字符方式輸人計(jì)算機(jī),現(xiàn)在普遍做法是在古籍文圖的數(shù)字圖像化基礎(chǔ)上采用OCR (光學(xué)字符自動(dòng)識(shí)別)技術(shù),再輔以人工校對(duì)。古籍?dāng)?shù)字化后,利用計(jì)算機(jī)可對(duì)古籍作進(jìn)一步整理、研究,進(jìn)而予以更充分的利用。
3 地方文獻(xiàn)古籍?dāng)?shù)字化存在的主要問(wèn)題
3.1 存在重復(fù)建設(shè)現(xiàn)象
地方文獻(xiàn)古籍相對(duì)于一般古籍來(lái)說(shuō)地域性十分明顯,收藏單位基本上是本地區(qū)的相關(guān)單位,可是相同收藏也十分普遍,如本館館藏的蒼梧縣志(清同治十三年刻本),廣西民族大學(xué)圖書(shū)館、廣西壯族自治區(qū)圖書(shū)館、廣西檔案局、廣西壯族自治區(qū)博物館等單位也收藏有,如果各單位都進(jìn)行數(shù)字化工程,很容易產(chǎn)生重復(fù)建設(shè)現(xiàn)象。
3.2 圖像處理標(biāo)準(zhǔn)化問(wèn)題
數(shù)字化工作第一個(gè)步驟是圖像掃描或拍照,由于不同的項(xiàng)目和工作人員變動(dòng),在圖像處理工作中會(huì)出現(xiàn)很多問(wèn)題,例如由于設(shè)備的不同,拍照或者掃描的圖片會(huì)出現(xiàn)很多種格式和不同的分辨率,導(dǎo)致數(shù)據(jù)文件延續(xù)性很差和文件十分混亂,沒(méi)有一個(gè)同一的標(biāo)準(zhǔn),會(huì)使得數(shù)字化成果無(wú)法達(dá)到我們數(shù)據(jù)庫(kù)建設(shè)最終預(yù)期,直接關(guān)系著數(shù)字化成果的利用效率。
3.3 文字編碼化中異形字問(wèn)題
在地方文獻(xiàn)古籍文字編碼化過(guò)程中,大量異體字的存在是很麻煩的事,人常說(shuō)“字無(wú)定量”,就是說(shuō)因?yàn)闈h字異體字多得無(wú)法估量。如廣西永??h壽城石壁上有幅《百壽圖》雕刻有百個(gè)壽字,除不同字體外,至少有三十種不同寫(xiě)法。地方文獻(xiàn)古籍中復(fù)雜多變的異體字,在文字編碼化過(guò)程中處理起來(lái)非常棘手,稍不注意,就會(huì)出錯(cuò)。其中常遇到的異形字問(wèn)題主要有三種:
3.3.1 同字異寫(xiě),例如“半”上的兩點(diǎn)寫(xiě)為八,“流”字右上無(wú)一點(diǎn),“戶”字上部寫(xiě)成一撇(戶)或一橫(戸)等。
3.3.2 訛誤異體字,即部分字長(zhǎng)期被錯(cuò)誤書(shū)寫(xiě),漸漸發(fā)展成常見(jiàn)態(tài)勢(shì)。這類字常見(jiàn)的如“擊”成了“撃”;“達(dá)”往往少了一 橫,變成“逹”字;“淫”誤寫(xiě)成“潘”等。
3.3.3 用字混亂現(xiàn)象,現(xiàn)今人們區(qū)分很清楚的形近字,古人卻常常混用,常見(jiàn)的如“已一巳一己”、“戊一戌一 戍”等。
3.4 地方文獻(xiàn)數(shù)字化人員缺乏和素質(zhì)有待提高
目前地方文獻(xiàn)數(shù)字化人員十分缺乏。如梧州市圖書(shū)館地方文獻(xiàn)和古籍的整理工作都是輔導(dǎo)部人員兼職,所以進(jìn)行地方文獻(xiàn)數(shù)字化工作就會(huì)十分的緩慢,我們館早在2007年已經(jīng)購(gòu)買(mǎi)了專業(yè)的冷光零邊距掃描儀設(shè)備,但由于沒(méi)有專職人員,數(shù)字化工作經(jīng)常中斷,將近10年的時(shí)間才完成少量的地方文獻(xiàn)的掃描工作。而且由于不是專職,人員的專業(yè)知識(shí)得不到持續(xù)的學(xué)習(xí)和提高。
4 解決方法與對(duì)策
4.1 建立統(tǒng)一古籍?dāng)?shù)字化的標(biāo)準(zhǔn)規(guī)范
在國(guó)家沒(méi)有建立古籍?dāng)?shù)字化標(biāo)準(zhǔn)規(guī)范的情況下,各館之間要加強(qiáng)交流溝通,在進(jìn)行數(shù)字化項(xiàng)目前,要跟項(xiàng)目文獻(xiàn)有相同館藏的單位進(jìn)行聯(lián)系,了解他們的情況,最好能達(dá)成一起合作開(kāi)發(fā)、合作共建,這樣不僅能很好的避免重復(fù)立項(xiàng),重復(fù)建設(shè)現(xiàn)象,還能可以實(shí)現(xiàn)優(yōu)勢(shì)互補(bǔ)、資源共享。
4.2 制定數(shù)字化工作手冊(cè),統(tǒng)一圖像處理標(biāo)準(zhǔn)
不論是采用照相還是掃描儀掃描的方式去獲取文獻(xiàn)的圖像,解析度決定了一張圖像所能呈現(xiàn)出來(lái)的效果。解析度所用的單位是dpi,我館在實(shí)踐中把dpi值設(shè)定為600dpi,文件格式為JPG,既兼顧了清晰度又控制文件的大小。我館還把這一標(biāo)準(zhǔn)寫(xiě)入工作手冊(cè)中,并把標(biāo)準(zhǔn)上墻懸掛。這樣即使以后工作人員變動(dòng),都會(huì)按照標(biāo)準(zhǔn)來(lái)執(zhí)行,使圖像數(shù)據(jù)規(guī)范統(tǒng)一。
4.3 異體字的同功能替換
所謂“同功能替換”,即只可替換字形,而替換前后的字形所記錄的詞語(yǔ)的音義不能有絲毫的改變。
對(duì)于同字異寫(xiě)字,宜盡量統(tǒng)一成一個(gè)字形,將不常見(jiàn)的、字形怪異的改為常見(jiàn)的規(guī)范字。如 “戶”改作“戶”、“趂”改作 “趁”、“畄”改作“留”等。因?yàn)閷?duì)應(yīng)關(guān)系比較簡(jiǎn)單,所以這個(gè)問(wèn)題相對(duì)較好解決。對(duì)于地方文獻(xiàn)古籍中存在的訛誤異體字,編輯的時(shí)候一定要養(yǎng)成職業(yè)敏感,做到目光如炬,一經(jīng)發(fā)現(xiàn),立刻改回為規(guī)范字。對(duì)于常見(jiàn)的用字混亂現(xiàn)象,編輯遇到這種情況,也要有一個(gè)起碼的區(qū)分意識(shí),不能一仍其舊,而是要能夠根據(jù)上下文語(yǔ)境選擇正確的字。
4.4 提高圖書(shū)館館員的綜合素質(zhì)
人才是做好地方文獻(xiàn)古籍?dāng)?shù)字化工作的關(guān)鍵,數(shù)字化工作是技能性、專業(yè)性很強(qiáng)的工作,我館很重視人才的培養(yǎng),每年都制定古籍人才的培訓(xùn)計(jì)劃,定期派遣人員參加國(guó)家古籍保護(hù)中心舉辦的各種培訓(xùn)和進(jìn)修班,由于經(jīng)常參加培訓(xùn),館員的技術(shù)每年都會(huì)有提高,開(kāi)展古籍相關(guān)工作就會(huì)順利很多。
5 結(jié)語(yǔ)
雖然地方文獻(xiàn)古籍?dāng)?shù)字化現(xiàn)在還存在各種各樣的問(wèn)題,但其查詢的便捷性、數(shù)字化后的便攜性等優(yōu)點(diǎn)將極大地方便研究人員和普通讀者。地方文獻(xiàn)古籍只有通過(guò)數(shù)字化的開(kāi)發(fā)與建設(shè),才能使各地區(qū)的傳統(tǒng)民族文化更加容易傳播,被大眾熟悉,這些珍貴資源的數(shù)據(jù)庫(kù)才能易被大家利用和推廣,滿足了現(xiàn)代讀者對(duì)于傳統(tǒng)地方文化的多層次需求。
參考文獻(xiàn)
[1] 劉偉紅,中文古籍?dāng)?shù)字化的現(xiàn)狀與意義[J3].圖書(shū)與情報(bào),2009(4): 134一137.
[2] 劉聰明,姜愛(ài)蓉,鄭小惠.信息技術(shù)在古籍?dāng)?shù)字化實(shí)踐中的應(yīng)用[J].蘭臺(tái)世界,2011(5):17一18.
[3] 康爾琴,中國(guó)古籍書(shū)目數(shù)據(jù)庫(kù)建設(shè)淺議[J].圖書(shū)館界,2003, (2):14-16.