漆勝蘭
摘要:中醫(yī)古籍是中華民族幾千年防病治病的智慧結(jié)晶,是我國傳統(tǒng)文化的寶貴財富。本文綜合了2004-2014年中醫(yī)古籍?dāng)?shù)據(jù)庫的發(fā)展?fàn)顩r,提出存在的問題,并對未來研究思路進(jìn)行了闡述。
關(guān)鍵詞:中醫(yī)古籍:數(shù)據(jù)庫:建設(shè):綜述
中醫(yī)古籍是中華民族幾千年防病治病的智慧結(jié)晶,是我國傳統(tǒng)文化的寶貴財富。古籍?dāng)?shù)字化是指利用現(xiàn)代技術(shù)將古籍中的文字或圖像信息轉(zhuǎn)化為能被計算機識別的數(shù)字符號,形成書目數(shù)據(jù)庫、全文數(shù)據(jù)庫和知識庫,從而實現(xiàn)古籍整理、存儲、檢索、閱讀、傳輸?shù)饶康?,達(dá)到保護(hù)、利用和挖掘古籍知識的功效。通過數(shù)字化處理,既可以實現(xiàn)對珍貴古籍的保存,又可實現(xiàn)資源共享,傳承中華文明。古籍?dāng)?shù)據(jù)庫建設(shè)是古籍?dāng)?shù)字化的一種方式,本文對2004-2014年間國內(nèi)外中醫(yī)古籍?dāng)?shù)據(jù)庫的建設(shè)進(jìn)行綜述。
1 中醫(yī)古籍?dāng)?shù)據(jù)庫現(xiàn)狀
1.1 中醫(yī)古籍?dāng)?shù)據(jù)庫的建設(shè)形式及現(xiàn)狀
陳力認(rèn)為中國大陸古籍成規(guī)模的數(shù)字化工作基本上是由教學(xué)和研究機構(gòu)、圖書館、商業(yè)機構(gòu)這3個類型的部門完成。從目前的數(shù)字化成果來看,中醫(yī)古籍?dāng)?shù)字化建設(shè)形式主要有書目型數(shù)據(jù)庫、全文型數(shù)據(jù)庫、全圖像型數(shù)據(jù)庫、圖文型數(shù)據(jù)庫、古籍知識庫。
1.1.1 中醫(yī)古籍書目型數(shù)據(jù)庫書目型數(shù)據(jù)庫是將古籍書名、著者、版本、卷次、摘要、出版年等信息輸入計算機而形成的數(shù)據(jù)庫,讀者可以通過書名、著者等檢索到某古籍的相關(guān)信息。該類型的代表是中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所的“全國中醫(yī)藥珍善本古籍檔案管理系統(tǒng)”、“海外古籍書目數(shù)據(jù)庫”,及中國中醫(yī)科學(xué)院圖書館的“館藏中醫(yī)古籍目錄數(shù)據(jù)庫”。
目前國內(nèi)有一定中醫(yī)藥古籍藏書規(guī)模的醫(yī)學(xué)院校、科研機構(gòu)、圖書館也都相繼進(jìn)行了書目數(shù)據(jù)庫的建設(shè),如北京中醫(yī)藥大學(xué)圖書館的“中醫(yī)藥古籍書目數(shù)據(jù)庫”、上海圖書館的“古籍書目數(shù)據(jù)庫”和“中醫(yī)古籍善本書目提要”、大連圖書館的“特色館藏古籍線裝書目庫”、北京大學(xué)及多家圖書館的“CALIS(中國高等教育文獻(xiàn)保障系統(tǒng))古籍聯(lián)合目錄”、上海中醫(yī)藥大學(xué)圖書館的“善本書目提要數(shù)據(jù)庫”、浙江中醫(yī)藥大學(xué)圖書館的“館藏古籍目錄數(shù)據(jù)庫”、山西中醫(yī)藥大學(xué)圖書館的“古籍書目數(shù)據(jù)庫”、山東中醫(yī)藥大學(xué)圖書館的“占籍書目數(shù)據(jù)庫”等等。但因國內(nèi)沒有統(tǒng)一的建庫標(biāo)準(zhǔn),各種書目數(shù)據(jù)庫揭示的深度不一樣。
1.1.2 中醫(yī)古籍全文型數(shù)據(jù)庫全文型數(shù)據(jù)庫是將古籍全文手工錄入,形成電子文本,供用戶查詢。這種數(shù)據(jù)庫存儲空間小,便于檢索和閱讀,但是沒有保持古籍原貌,且文字錄入有難度,容易出錯。中醫(yī)藥古籍含有穴位、圖譜等信息,數(shù)字化的困難更大。臺灣高雄市立中醫(yī)院的“中醫(yī)古籍文獻(xiàn)全文檢索系統(tǒng)”和由湖南電子音像出版社出版的光盤版《中華醫(yī)典》就是典型的全文型數(shù)據(jù)庫。
1.1.3 中醫(yī)古籍全圖像型數(shù)據(jù)庫 全圖像型數(shù)據(jù)庫是將古籍直接以圖像格式掃描存儲,加入簡單標(biāo)題和分類,能保存古籍原貌,有助于專業(yè)研究,但是這種數(shù)據(jù)庫存儲空間大且不方便檢索。如武漢大學(xué)出版社開發(fā)出的《四庫全書》光盤版就是以文淵閣本《四庫全書》為底本,掃描全書,手工錄入總目。
1.1.4 中醫(yī)古籍圖文型數(shù)據(jù)庫 圖文型數(shù)據(jù)庫是利用圖像處理技術(shù)與超鏈接技術(shù)結(jié)合形成的數(shù)據(jù)庫,即在古籍書頁圖像化的基礎(chǔ)上,將書中具有檢索意義的信息轉(zhuǎn)化為電腦可識別的文字,并加以合適的軟件工具,為用戶提供快捷有效的檢索、統(tǒng)計、整理和編輯功能。這種數(shù)據(jù)庫能再現(xiàn)古籍原貌、方便檢索,是目前古籍?dāng)?shù)字化的最佳方式。中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所的“中醫(yī)藥珍善本占籍多媒體數(shù)據(jù)庫”和由北京大學(xué)劉俊文教授總策劃、總編纂的《中國基本古籍庫》(醫(yī)書集成)可為此類代表。
1.1.5 古籍知識庫 古籍知識庫是人工智能和數(shù)據(jù)庫結(jié)合的產(chǎn)物,它以統(tǒng)一的形式存儲知識。知識庫的知識是高度結(jié)構(gòu)化的符號數(shù)據(jù),用戶可以進(jìn)行深層次的知識挖掘,實現(xiàn)由書目到全文等多個知識點的關(guān)聯(lián)檢索,也可以由一個作者檢索到其他相關(guān)作者等。中國中醫(yī)科學(xué)院中國醫(yī)史文獻(xiàn)研究所中醫(yī)古籍?dāng)?shù)字化研究室的“中醫(yī)藥古文獻(xiàn)知識庫”是其代表。該知識庫構(gòu)建了我國第一個中醫(yī)古籍知識庫系統(tǒng),目前已經(jīng)建成中醫(yī)古籍本草知識庫、中醫(yī)古籍方劑知識庫,以及張仲景、陳士鐸、新安醫(yī)學(xué)、婦科、醫(yī)案、蒙醫(yī)藥等6個中醫(yī)古籍專題知識庫。
1.1.6 國外中醫(yī)古籍?dāng)?shù)據(jù)庫 國內(nèi)的中醫(yī)古籍?dāng)?shù)字化取得了一些成就,國外中醫(yī)古籍?dāng)?shù)據(jù)庫也在建設(shè)中。雖然在建設(shè)規(guī)模和涵蓋資源上與國內(nèi)有些差距,但是也具有非凡的意義和價值。例如日本的全文數(shù)據(jù)庫“全國漢籍?dāng)?shù)據(jù)庫一一子部醫(yī)家類”“數(shù)字化善本書——醫(yī)學(xué)”“民族藥物資料館——證類本草”,加拿大的“中醫(yī)在線圖書館”以及美國的全影像數(shù)據(jù)庫“YiJing: The mlrror of medicine”等等。
1.2 中醫(yī)古籍養(yǎng)生數(shù)據(jù)庫的現(xiàn)狀
古今往來,健康長壽是人類的美好愿望,養(yǎng)生保健是人們永恒的話題和社會關(guān)注的熱點。特別是近年來,隨著科學(xué)的發(fā)展和生活水平的提高,人們自我保健意識和養(yǎng)生要求逐漸提高,中醫(yī)養(yǎng)生學(xué)顯示出強大的生命力,中國數(shù)千年積累的養(yǎng)生法備受世界青睞。我國養(yǎng)生學(xué)內(nèi)容廣泛,方法眾多,養(yǎng)生論著卷帙浩繁,有的是養(yǎng)生專著,有的則是部分章節(jié)論述養(yǎng)生,更多的是散見于各類著作中,如道教、佛教、史學(xué)典籍等,未形成一個全面、系統(tǒng)的學(xué)科。中醫(yī)古籍?dāng)?shù)據(jù)庫的建設(shè)方興未艾,取得了一定成果,如《中華醫(yī)典》以及“中國中醫(yī)藥數(shù)據(jù)庫”“中國古籍資源數(shù)據(jù)庫”“龍語瀚堂典籍?dāng)?shù)據(jù)庫”都收錄了大量中醫(yī)古籍,但是關(guān)于養(yǎng)生類的專題數(shù)據(jù)庫發(fā)展還比較緩慢。如目前中醫(yī)古籍?dāng)?shù)據(jù)庫當(dāng)中收錄最全、范圍最廣的電子資源文獻(xiàn)庫“龍語瀚堂典籍?dāng)?shù)據(jù)庫”所收錄的中醫(yī)藥文獻(xiàn)達(dá)700多部近10000冊,只在中醫(yī)藥類收錄養(yǎng)生類古籍35種。巨型數(shù)字古籍叢書《中國基本古籍庫》收錄了上自先秦、下至民國的歷代典籍10000余種,其中休閑養(yǎng)生目收錄28部,武術(shù)技擊目收錄14部,氣功健身目收錄11部。目前,南京中醫(yī)藥大學(xué)的“氣功基本古籍提要庫”是以專門的氣功、導(dǎo)引、養(yǎng)生著作為主要內(nèi)容的數(shù)據(jù)庫,屬于氣功養(yǎng)生的專題庫。中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所建設(shè)開發(fā)的“中醫(yī)古籍養(yǎng)生數(shù)據(jù)庫”收錄養(yǎng)生古籍110種,并可瀏覽全文圖片。
2 中醫(yī)古籍?dāng)?shù)據(jù)庫建設(shè)存在的問題
2.1 中醫(yī)古籍書目收集及錄入
中醫(yī)古籍?dāng)?shù)量大,版本多,全面收集版本優(yōu)良的古籍是古籍?dāng)?shù)字化中的一大課題。古籍圖書印刷格式多樣,出版方式隨意,多處標(biāo)有正題名且各處書名不盡相同,編目人員需要對各種書名信息進(jìn)行分析、思考,方能準(zhǔn)確而規(guī)范地著錄正題名。另外,摘要由編目人員編寫,編目人員的責(zé)任心和相關(guān)專業(yè)知識,如對古籍中同藥異名、異藥同名,古籍中的病證和現(xiàn)代病名等知識的掌握,也直接影響書目數(shù)據(jù)的質(zhì)量。
2.2 中醫(yī)古籍用字
古籍?dāng)?shù)字化建設(shè)難度大,其中面臨最多的問題是有關(guān)用字的問題。據(jù)查,《康熙字典》收字就達(dá)49 030個。漢字在漫長的演變過程中產(chǎn)生的繁簡字、異體字、古今字、通假字就更數(shù)不勝數(shù)了。中醫(yī)古籍?dāng)?shù)字化目前面臨著無古籍大字庫、古籍生僻字錄入、古籍光學(xué)字符識別系統(tǒng)(Optical Character Recognition,OCR)識別、古籍排版等幾個難題。陳進(jìn)等認(rèn)為產(chǎn)生這些現(xiàn)象的原因主要是對字體的認(rèn)知障礙和技術(shù)障礙。高晶晶認(rèn)為可以通過私用區(qū)造字法、圖片代替法、自然語言描述法、動態(tài)組字法等方法在一定范圍內(nèi)解決古籍閱讀和檢索用字的問題。
2.3 中醫(yī)古籍?dāng)?shù)字化標(biāo)準(zhǔn)尚未建立
合作與共享是中醫(yī)古籍?dāng)?shù)字化發(fā)展的趨勢,文獻(xiàn)標(biāo)準(zhǔn)化是文獻(xiàn)資源共享的前提和基礎(chǔ)。古籍?dāng)?shù)字化,需要規(guī)范的著錄條例、數(shù)據(jù)庫格式、編目軟件使用字庫,還要統(tǒng)一的古籍分類法。但是中醫(yī)古籍?dāng)?shù)字化標(biāo)準(zhǔn)尚未建立,國內(nèi)至今未形成統(tǒng)一的古籍分類法。曾燕認(rèn)為應(yīng)以《四庫法》(即按經(jīng)、史、子、集分類)為基礎(chǔ),制定完善的古籍分類法。劉文波等認(rèn)為《全國中醫(yī)圖書聯(lián)合目錄》的分類體系,基本上包括了現(xiàn)存中醫(yī)古籍的主要種類,比較符合讀者“以類求書”的使用習(xí)慣。李兵認(rèn)為中醫(yī)古籍?dāng)?shù)據(jù)庫內(nèi)容、檢索功能、輔助功能和服務(wù)功能這4個要素可以作為中醫(yī)古籍?dāng)?shù)據(jù)庫的評價要素和一級指標(biāo)。
2.4 中醫(yī)古籍?dāng)?shù)字化的開發(fā)深度
符永馳等認(rèn)為中醫(yī)古籍?dāng)?shù)字化不應(yīng)僅僅滿足于對古籍的閱覽和查詢。劉毅認(rèn)為在數(shù)據(jù)庫和網(wǎng)絡(luò)普及的時代,利用現(xiàn)代技術(shù)手段,挖掘中醫(yī)古籍的內(nèi)涵知識很重要,但是目前由于各種因素的影響,數(shù)據(jù)庫不具備古籍知識深度挖掘的功能,從這方面來說,專業(yè)的中醫(yī)古籍?dāng)?shù)據(jù)庫尚處于初級階段。古代中醫(yī)藥文獻(xiàn)是一個知識寶庫,在數(shù)字化的基礎(chǔ)上挖掘古籍中的寶貴知識財富,實現(xiàn)知識發(fā)現(xiàn)和知識拓展,更好地為中醫(yī)藥事業(yè)的發(fā)展和人類健康服務(wù)是中醫(yī)古籍?dāng)?shù)字化的最高目標(biāo)。
除上述內(nèi)容以外,技術(shù)手段落后、經(jīng)費制約等等也是中醫(yī)古籍?dāng)?shù)據(jù)庫建設(shè)中存在的問題。
3 總結(jié)與展望
中醫(yī)古籍?dāng)?shù)字化已經(jīng)取得了一定成就,建立了不同類型的數(shù)據(jù)庫,在很大程度上實現(xiàn)了保護(hù)和利用中醫(yī)古籍的目的。但是數(shù)據(jù)庫建設(shè)中的用字問題、數(shù)據(jù)庫建設(shè)標(biāo)準(zhǔn)及數(shù)據(jù)庫知識的深度挖掘問題仍然有待研究。同時,養(yǎng)生學(xué)作為中醫(yī)的一個重要學(xué)科,其數(shù)據(jù)庫建設(shè)仍有待加強,構(gòu)建數(shù)量多、版本齊全、信息涵蓋量大的古籍養(yǎng)生數(shù)據(jù)庫有著重要的現(xiàn)實意義和學(xué)術(shù)研究意義,對中醫(yī)養(yǎng)生學(xué)科的內(nèi)涵外延的界定具有促進(jìn)作用。在建立信息涵蓋量大的古籍養(yǎng)生數(shù)據(jù)庫的基礎(chǔ)上,從小處著眼,著重研究新安醫(yī)籍中的養(yǎng)生古籍,建立數(shù)據(jù)庫,研究其與前人、同時代及后世之間的學(xué)術(shù)繼承、借鑒和影響,可操作性強。作為中醫(yī)古籍?dāng)?shù)據(jù)庫建設(shè)的一部分,養(yǎng)生類古籍文獻(xiàn)的整理與數(shù)據(jù)庫開發(fā)有待進(jìn)一步拓展與深化。總之,在計算機及網(wǎng)絡(luò)技術(shù)不斷發(fā)達(dá)的今天,中醫(yī)古籍?dāng)?shù)據(jù)庫的建設(shè)會有更大的發(fā)展前景,會為中醫(yī)傳承做出更大的貢獻(xiàn)。