安 歡,張華敏,符永馳,李 兵中國中醫(yī)科學院中醫(yī)藥信息研究所,北京100700
?
中醫(yī)古籍知識庫發(fā)展現(xiàn)狀及古籍養(yǎng)生知識庫的構(gòu)建思路*
安歡,張華敏,符永馳,李兵△
中國中醫(yī)科學院中醫(yī)藥信息研究所,北京100700
分析中醫(yī)古籍知識庫構(gòu)建的研究現(xiàn)狀,探討如何全面、準確、規(guī)范地表達養(yǎng)生古籍知識,并提出構(gòu)建中醫(yī)古籍養(yǎng)生知識庫的思路與設想。
養(yǎng)生古籍;古籍數(shù)字化;中醫(yī)養(yǎng)生;知識庫
中醫(yī)古籍內(nèi)容豐富,是中醫(yī)學的寶貴財富[1]。古籍的特殊性使現(xiàn)代人在中醫(yī)古籍的檢索利用方面存在諸多障礙,中醫(yī)古籍數(shù)字化較好地解決了古籍保存與利用之間的矛盾[2-3]。目前,隨著計算機、人工智能的迅猛發(fā)展,中醫(yī)古籍數(shù)字化資源組織形式開始由基于字詞檢索的全文數(shù)據(jù)庫開發(fā)轉(zhuǎn)向基于知識單元概念檢索的知識庫系統(tǒng)建設[4-5]。因此構(gòu)建中醫(yī)古籍養(yǎng)生知識庫,能促進中醫(yī)古籍中養(yǎng)生知識更好地被挖掘和利用,為中醫(yī)養(yǎng)生的研究提供支撐。
知識庫是人工智能和數(shù)據(jù)庫結(jié)合的產(chǎn)物,知識庫中存儲的知識是高度結(jié)構(gòu)化的符號數(shù)據(jù),用戶可以進行深層次的知識挖掘,實現(xiàn)由書目到全文等多個知識點的關(guān)聯(lián)檢索,也可以由一個作者檢索到其他相關(guān)作者[6-7]。隨著中醫(yī)古籍數(shù)字化的廣泛開展,許多中醫(yī)藥高校和科研院所都建立了中醫(yī)古籍數(shù)據(jù)庫,如中國中醫(yī)科學院信息所的中醫(yī)古籍資源數(shù)據(jù)庫、南京中醫(yī)藥大學和浙江中醫(yī)藥大學的古籍數(shù)據(jù)庫等,此外還包括一些專題數(shù)據(jù)庫,如中醫(yī)古籍養(yǎng)生數(shù)據(jù)庫、溫病大成數(shù)據(jù)庫、古籍本草有毒重要數(shù)據(jù)庫等,為我們構(gòu)建中醫(yī)古籍知識庫提供了一定的基礎[8]。在方法上,一些研究者提出基于本體、知識元、知識聚類和知識組織的古籍知識庫構(gòu)建方法[9-10]。
1.1中醫(yī)藥古文獻知識庫中醫(yī)藥古文獻知識庫是中國中醫(yī)科學院醫(yī)史文獻研究所基于知識元的方法構(gòu)建的中醫(yī)古籍知識庫系統(tǒng),該系統(tǒng)通過專家解析標注形成以知識元為關(guān)聯(lián)的知識網(wǎng)絡,進而實現(xiàn)中醫(yī)古籍知識庫中知識的有效查詢和發(fā)現(xiàn)知識。目前該系統(tǒng)包括中醫(yī)古籍本草知識庫、中醫(yī)古籍方劑知識庫,以及張仲景、陳士鐸、新安醫(yī)學、婦科、醫(yī)案、蒙醫(yī)藥等6個中醫(yī)古籍專題知識庫[11]。
1.2基于知識組織的本草古籍知識系統(tǒng)該系統(tǒng)基于本草古籍的體例結(jié)構(gòu)、知識特征確定古籍中本草知識的分類,在此基礎上對各類本草古籍知識進行系統(tǒng)梳理,然后基于本草古籍原文,以藥物為核心,提取名稱、性味、歸經(jīng)、功用、主治等各類本草古籍知識。通過對原文的解析、關(guān)聯(lián),形成以藥物為核心的知識體,以設定的語義類型和語義關(guān)系為基礎對各類知識之間的概念關(guān)系進行分析,定義知識之間的語義關(guān)聯(lián)并形成關(guān)聯(lián)詞表,從而構(gòu)建成本草古籍的知識庫。
1.3基于本體的溫病古籍知識庫該系統(tǒng)首先確定溫病古籍中知識的本體類,提取中醫(yī)溫病古籍中所蘊含的疾病、病因病機、癥狀體征、證候、治則治法、方劑等相關(guān)概念、術(shù)語和詞匯,并進行規(guī)范,通過對概念、關(guān)系的分析進行知識的映射,將溫病古籍知識明確、規(guī)范地表達,構(gòu)建中醫(yī)溫病古籍本體框架?;跍夭」偶倔w,設計和構(gòu)建了溫病古籍知識檢索系統(tǒng),實現(xiàn)溫病古籍知識的可視化深度檢索與利用[12]。
1.4方劑古籍知識庫該知識庫包含30余部方劑類古籍文獻,在分析方劑知識特征的基礎上,對存在于古籍文本中方劑知識體、知識元的各種形式進行系統(tǒng)梳理。通過對方劑知識中各種概念間關(guān)系的研究,定義各種語義關(guān)系,將中醫(yī)古籍方劑知識領域各種語義關(guān)系分別納入關(guān)聯(lián)含義和關(guān)聯(lián)對象兩種分類體系下,以進一步實現(xiàn)對語義類型和語義關(guān)系的精確化定義。通過語義關(guān)系關(guān)聯(lián)起中醫(yī)古籍方劑知識語義網(wǎng)絡,從而構(gòu)建起以知識元為核心的知識表示體系[13]。
2.1書目選取及數(shù)字化加工數(shù)字化是古籍數(shù)據(jù)庫和知識庫構(gòu)建的基礎,因此首先要選擇有代表性的中醫(yī)養(yǎng)生古籍進行整理和分析,并進行數(shù)字化加工處理,獲取中醫(yī)養(yǎng)生古籍的原文圖像和文本化數(shù)據(jù)。
2.2古籍養(yǎng)生知識的獲取與規(guī)范基于養(yǎng)生古籍原文,按照不同類型的養(yǎng)生知識,參考相關(guān)標準及規(guī)范,制定數(shù)據(jù)提取和分類的原則,基于原文提取、梳理養(yǎng)生古籍知識的概念類型和概念關(guān)系,構(gòu)建中醫(yī)古籍養(yǎng)生知識框架。
2.3語義類型和語義關(guān)系的定義參考中醫(yī)藥一體化語言系統(tǒng)中語義類型設定和語義關(guān)系提取的方式,結(jié)合古籍養(yǎng)生知識體系的特點,系統(tǒng)整理、分析養(yǎng)生的知識表示和組織方法,歸納和定義養(yǎng)生古籍中各類中醫(yī)養(yǎng)生知識的概念類型、概念關(guān)系,建立中醫(yī)古籍養(yǎng)生知識體系中涉及的概念與概念、概念與名詞之間的內(nèi)在聯(lián)系,構(gòu)建古籍中醫(yī)古籍養(yǎng)生知識語義網(wǎng)絡,形式化表示中醫(yī)古籍養(yǎng)生知識。
2.4中醫(yī)古籍養(yǎng)生知識的語義關(guān)聯(lián)參考語義本體或知識組織的方法,對養(yǎng)生理論、服食、起居、導引、情志、針灸、推拿按摩等各類養(yǎng)生知識進行關(guān)聯(lián)和整合,基于養(yǎng)生知識的概念類型及其內(nèi)部之間的概念關(guān)系進行語義關(guān)聯(lián),形成古籍養(yǎng)生知識關(guān)聯(lián)詞表。
2.5設計并構(gòu)建中醫(yī)古籍養(yǎng)生知識庫知識庫構(gòu)建的系統(tǒng)構(gòu)架、數(shù)據(jù)表和整體框架設計,開發(fā)和構(gòu)建適合于養(yǎng)生知識表達的知識檢索模塊,使用戶能夠通過簡單的檢索得到所需專題的養(yǎng)生知識,實現(xiàn)養(yǎng)生古籍中的知識化檢索與服務。在知識庫構(gòu)建過程中可利用到本體構(gòu)建工具,如Protege。知識庫的架構(gòu)可采用Jena框架。
中醫(yī)養(yǎng)生古籍集歷代養(yǎng)生學說之精華,記載有特色、系統(tǒng)、全面的養(yǎng)生理論。雖然養(yǎng)生古籍已經(jīng)有了一定的數(shù)字化基礎,但是深度的開發(fā)和利用不足。從中醫(yī)古籍數(shù)字化資源建設發(fā)展歷程看,利用現(xiàn)代信息技術(shù)進行中醫(yī)古籍整理的手段正在逐步完善,對中醫(yī)古籍知識的計算機表達也有了創(chuàng)造性的突破,中醫(yī)古籍知識庫的建設已成為古籍數(shù)字化未來的發(fā)展方向。設計并構(gòu)建中醫(yī)古籍養(yǎng)生知識庫,為中醫(yī)古籍專題知識庫的發(fā)展起到一定的作用。
[1]高越敏,胡濱.古醫(yī)籍助讀(五)——標格資于詁訓[J].浙江中醫(yī)學院學報,1986,5(5):42-44.
[2]李兵.中醫(yī)古籍數(shù)字化整理方案研究[D].北京:中國中醫(yī)科學院,2009.
[3]任玉蘭,李政,梁紅,等.中醫(yī)古籍數(shù)字化建設與知識服務模式的構(gòu)建[J].世界科學技術(shù):中醫(yī)藥現(xiàn)代化,2013,15(1):45-48.
[4]楊繼紅.基于本體的中醫(yī)古籍敘詞表構(gòu)建方法研究[D].北京:中國中醫(yī)科學院,2008.
[5]佟琳,劉寨華,唐丹麗,等.中醫(yī)古籍“孤島現(xiàn)象”及其對策[J].河北中醫(yī)藥學報,2010,25(4):6-8.
[6]楊繼紅.中醫(yī)古籍數(shù)字化資源建設概述[J].現(xiàn)代情報,2008,28(5):136-138.
[7]劉毅.中醫(yī)古籍數(shù)字化與知識挖掘[J].圖書館工作與研究,2010,32(12):92-94.
[8]李兵,符永馳,張華敏,等.中醫(yī)藥行業(yè)古籍數(shù)據(jù)庫的建設與服務[J].西部中醫(yī)藥,2014,27(2):85-87.
[9]賈鳳旭.基于知識類聚的古籍知識庫構(gòu)建方法[J].圖書館學刊,2015,24(5):45-48.
[10]羅晨光,山川,王珊.基于本體的古籍知識庫建設初探[J].現(xiàn)代圖書情報技術(shù),2007,23(4):8-11.
[11]漆勝蘭.2004-2014年中醫(yī)古籍數(shù)據(jù)庫建設研究進展[J].中國中醫(yī)藥圖書情報雜志2015,39(1):60-62.
[12]李兵,張華敏,符永馳,等.基于語義關(guān)聯(lián)的溫病古籍知識檢索系統(tǒng)的構(gòu)建研究[J].遼寧中醫(yī)雜志,2012,39(12):2403-2404.
[13]丁侃.基于知識元的中醫(yī)古籍方劑知識表示研究[D].北京:中國中醫(yī)科學院,2012.
Construction Idea of Ancient Books Database for Health Care and Current State of TCM Ancient Books Database
AN Huan,ZHANG Huamin,F(xiàn)U Yongchi,LI Bing△
Institute of Information on Traditional Chinese Medicine in China Academy of Chinese Medical Sciences,Beijing 100700,China
Current state of TCM ancient books database construction was analyzed to explore how to express the knowledge in ancient books about health care fully,accurately and regularly,simultaneously,the thinking and fancy of TCM ancient books database construction were raised.
ancient books about health care;digitized ancient books;TCM health care;data base
R212
A
1004-6852(2016)06-0158-02
2016-02-21
國家中醫(yī)藥管理局中醫(yī)藥行業(yè)科研專項項目(編號201507006-02);中國中醫(yī)科學院基礎科研業(yè)務費自主選題項目(編號ZZ080318)
安歡(1989—),女,碩士研學位。研究方向:中醫(yī)古籍的保護與利用研究。
△李兵(1983—),男,博士學位,助理研究員。研究方向:中醫(yī)藥古文獻整理與利用研究、中醫(yī)藥信息學研究。