陳素美
(河南中醫(yī)學院圖書館,鄭州 450008)
古籍數(shù)字化最早始于20世紀70~80年代。我國中醫(yī)藥院校圖書館對古籍文獻的研究開發(fā),不論是基礎保護和數(shù)字化加工,還是深層次研究和開發(fā)利用方面,都還有大量的工作要做。
中醫(yī)古籍是我國浩如煙海古籍中重要的組成部分,更是中醫(yī)理論知識的來源,是中醫(yī)傳承發(fā)展的基礎。中醫(yī)古籍以圖文形式記錄了中醫(yī)學數(shù)千年來積累的理論知識和臨床經(jīng)驗,不僅具有珍貴的史學價值,而且具有重要的實用價值[1]。中醫(yī)古籍數(shù)字化是借助現(xiàn)代化的技術與手段,充分保護、研究、揭示與利用這些中華民族豐富的、不可再生的醫(yī)學資源,使古老傳統(tǒng)的中醫(yī)學煥發(fā)出新的活力,在中醫(yī)學的繼承與創(chuàng)新、中醫(yī)藥現(xiàn)代化、中醫(yī)走向世界等方面發(fā)揮重要作用[2]。
數(shù)字化是保護和利用古籍的手段之一。在保存條件欠佳、自然損耗無法避免的情況下,古籍數(shù)字化能最大程度地減少借閱造成的古籍損壞。信息網(wǎng)絡的發(fā)展為數(shù)字化信息的快速準確傳播提供了基礎條件,因此高質量的數(shù)字化中醫(yī)古籍資源更能適應讀者快速、準確的信息需求。中醫(yī)古籍數(shù)字化是中醫(yī)古籍數(shù)據(jù)庫建設的第一步,也是建立中醫(yī)知識庫的基礎條件。
古籍存放需要良好的環(huán)境。當前各個圖書館的保存條件不一,在這種情況下減少人為翻閱對古籍造成的損傷就顯得尤為重要。而對于已經(jīng)破損的孤本、善本,利用數(shù)字化盡快保存其原貌是刻不容緩的任務。建設中醫(yī)古籍數(shù)字化資源,引導讀者利用數(shù)據(jù)庫來搜索中醫(yī)古籍,通過擴大數(shù)字化古籍的數(shù)量滿足師生的利用需求,從而達到避免人為利用對古籍造成損傷以及加速古籍老化的目的。
中醫(yī)藥古籍是中華民族幾千年來防病治病寶貴經(jīng)驗的結晶,是中華民族優(yōu)秀文化遺產(chǎn)的重要組成部分,不僅傳承了中醫(yī)藥學理論知識,而且大量的經(jīng)驗方直接指導臨床,中醫(yī)藥古籍文獻中所收載的理法方藥、養(yǎng)生保健知識取之不盡、用之不竭,具有極高的實用價值。而中醫(yī)藥古籍的數(shù)字化資源建設,為醫(yī)者提供了知識服務和臨床需求,更廣泛地傳播了中醫(yī)文化和信息。
作為大規(guī)模信息集成的數(shù)據(jù)庫,隨著存儲量的增加必須改進信息組織方式,以滿足讀者不斷增加的需求。此時單純的數(shù)字化信息已經(jīng)難以滿足人們對知識的需求,只有對知識庫進行數(shù)據(jù)挖掘和知識挖掘,發(fā)現(xiàn)信息間深層次的聯(lián)系和新知識,促進中醫(yī)理論和中醫(yī)實踐的發(fā)展,而中醫(yī)古籍數(shù)字化將是中醫(yī)知識庫建設的先決條件和基礎。
元數(shù)據(jù)是建設規(guī)范性古籍數(shù)字化的基礎,是共享數(shù)據(jù)的必要接口。古籍數(shù)字化應用范圍有限,規(guī)模相對固定,因此古籍數(shù)字化的元數(shù)據(jù)標準一旦確立,基本變動不大。在制定規(guī)范的古籍數(shù)字化元數(shù)據(jù)標準時,要考慮古籍的特殊性,盡可能包含盡可能完整的信息。一是版本信息。有版本類型、年代、版式特征等;二是收藏信息。該文獻所屬收藏單位;三是作者信息。作者姓名(包括字、號)、朝代、生卒年、籍貫、著作等;四是作品信息。所屬四部分類、所屬類別等;五是古籍定級信息。所屬朝代、所定級別等。
應用統(tǒng)一、規(guī)范的元數(shù)據(jù)標準,才能使數(shù)字化的數(shù)據(jù)庫、知識庫在以后的使用過程中更好地檢索和知識傳遞,降低不同標準造成的信息孤島現(xiàn)象,提高數(shù)字化信息的利用率,最大限度地發(fā)揮數(shù)字化古籍的使用價值。
目前參與古籍數(shù)字化的機構或公司眾多,但這些機構或公司采用眾多的文件格式,如文本(txt)、超文本(html)、便攜式文檔(pdf)、電子書(CEB)以及超星圖書(PDG)等。在使用不同公司的數(shù)字資源時就要求用戶使用各種對應的軟件,造成使用不便,大大降低了數(shù)字資源的通用度和使用率,為以后數(shù)據(jù)共享設下重重障礙。
統(tǒng)一古籍數(shù)字資源的文件格式,開發(fā)通用程度更高的軟件,不僅方便使用者,也為參與古籍數(shù)字化的諸多機構節(jié)省時間,為建立通用度更高的數(shù)據(jù)庫打下基礎。
在借閱古籍過程中若用耗時甚久的傳統(tǒng)信息組織和檢索方式,那么將乏人問津,無法充分發(fā)揮其價值。利用數(shù)字化技術對其進行二次開發(fā)保護,一方面為使眾多版本、品質精良的古籍原貌能保存下去;另一方面為建設古籍數(shù)字資源庫,利用計算機強大的運算能力,提高古籍數(shù)字化資源的檢索速度和精度。在數(shù)據(jù)庫的建設過程中,數(shù)字化對象的選擇是基礎,其選取標準如下。
數(shù)字化對象選取應著重古籍的學術、文獻價值,要有中醫(yī)文獻專家把關。如品種上應優(yōu)先選擇年代久遠者、中醫(yī)學經(jīng)典名著、各中醫(yī)流派代表著作或各類中醫(yī)古籍基本文獻;次選具有廣泛應用價值,載有獨特診治疾病和養(yǎng)生保健經(jīng)驗,對中醫(yī)學理論研究和臨床診療具有指導意義的基本古籍。版本盡量選擇珍本、善本古籍,首選年代久遠者;版本形式按稿本、刻本、抄本、影印本、石印本順序選擇;同一種古籍版本較多者,一般只選完本,按精校本、祖本、通行本順序選擇;孤本或刻印較少、流傳不多的稀見版本選擇要求適當放寬[4]。
在古籍流傳過程中,同一種古籍往往會出現(xiàn)眾多版本,其質量難免參差不齊。在選擇數(shù)字化對象時,在版本選擇的基礎上,還要尤其注意內容是否準確,表述是否清晰。要結合文獻專家和醫(yī)學專家的意見,選擇公認的高質量本子進行數(shù)字化,避免重復工作。
只有完善的古籍檢索系統(tǒng)才能為古籍數(shù)據(jù)庫的使用提供良好的平臺,使讀者樂于和便于檢索所需信息。(1)較高的檢全率和檢準率。檢索系統(tǒng)的檢準率和檢全率是保證檢索質量的重要指標。中醫(yī)古籍中各種藥名的不同稱謂,以及通假字、異體字、避諱字的使用,使得提高中醫(yī)古籍數(shù)字資源的檢索檢準率和檢全率面對重重困難;(2)較快的檢索速度??斓臋z索響應速度是留住讀者的關鍵;(3)符合中醫(yī)學科特點。要設置針對中醫(yī)學科的專有名詞、著者信息等特有的關鍵詞。
中醫(yī)古籍數(shù)字化需要中醫(yī)藥、圖書情報以及信息技術等多方面人才。古籍數(shù)字化中,建設數(shù)據(jù)庫是基礎工程,進一步的提供服務以及更深層次的數(shù)據(jù)挖掘、知識挖掘才是古籍數(shù)字化的意義所在。要建設中醫(yī)古籍數(shù)據(jù)庫、知識庫,需要各類人才的通力合作。在數(shù)據(jù)庫建設過程中,標引、著錄、知識挖掘需要計算機專業(yè)、信息專業(yè)和古籍等相關專業(yè)各種人才的合作。要把古籍數(shù)據(jù)庫建設成為數(shù)據(jù)挖掘、知識挖掘的源泉,需要多專業(yè)人才實現(xiàn)學科融合。高素質人才隊伍的建設關乎古籍數(shù)字化的現(xiàn)在和未來。
古籍數(shù)字化是為了減少紙質古籍的使用、保護古籍,并提供高質量的數(shù)字資源。目前開展古籍數(shù)字化的機構眾多,一擁而上的形勢下重復建設數(shù)量眾多,質量良莠不齊,這樣不僅浪費寶貴的人力、物力和時間,也使更多適合數(shù)字化、需要保護的古籍得不到及時有效的處理。中醫(yī)古籍更多孤本、抄本等急需數(shù)字化,因此古籍數(shù)字化進程中,要以建設“準確”、“完整”的古籍資源為前提,聯(lián)合各個機構的力量,避免資源的重復建設。
圖片數(shù)據(jù)庫或全文數(shù)據(jù)庫是無法完全滿足讀者對知識的需求,故具備較高學術水準的專題化、知識庫類型的數(shù)據(jù)庫是未來古籍數(shù)字化的發(fā)展方向。因此,在古籍數(shù)字化規(guī)劃之初,就應該考慮到長遠的發(fā)展趨勢和目標,即數(shù)據(jù)庫要為建設更高質量的專題數(shù)據(jù)庫和知識庫做準備。
作為與國人生活和文化息息相關的中醫(yī)在醫(yī)療、保健等領域有著獨特的優(yōu)勢。中醫(yī)古籍數(shù)字化是保護中醫(yī)古籍的方法之一,也是適應網(wǎng)絡化、信息化社會發(fā)展趨勢。結合技術變化,優(yōu)化中醫(yī)知識傳播方式和渠道,對傳統(tǒng)中醫(yī)理論知識進行深層次的知識挖掘,加快學科建設,促進中醫(yī)理論知識新發(fā)展的重要方式。各中醫(yī)院校圖書館應結合當前正在進行的全國古籍普查活動,摸清家底,做好定級、定損,規(guī)劃古籍數(shù)字化的下一步進程,建設具有館藏特色的中醫(yī)數(shù)字資源。
[1]裴麗,曹霞.中醫(yī)古籍數(shù)字化多功能閱讀環(huán)境模型構建[J].中醫(yī)藥信息,2010,27(1):118.
[2]楊繼紅.中醫(yī)古籍數(shù)字化資源建設概述[J].現(xiàn)代情報,2008,28(5):136.
[3]葉莉.對古籍數(shù)字化進程中若干問題的思考[J].圖書館界,2010,31(4):10-11.
[4]李兵,劉國正,符永馳,等.中醫(yī)古籍數(shù)字化整理方案探討[J].中國數(shù)字醫(yī)學,2010,5(5):35.