曹馨宇,謝 琪,周洪偉,馬 劍,邱 恒
(1. 中國中醫(yī)科學院中醫(yī)臨床基礎醫(yī)學研究所 北京 100700;2. 中國中醫(yī)科學院 北京 100700;3. 北京匯晨養(yǎng)老機構管理有限公司 北京 100012)
面向中醫(yī)養(yǎng)生的冠心病知識本體構建研究*
曹馨宇1,謝 琪2**,周洪偉1,馬 劍3,邱 恒3
(1. 中國中醫(yī)科學院中醫(yī)臨床基礎醫(yī)學研究所 北京 100700;2. 中國中醫(yī)科學院 北京 100700;3. 北京匯晨養(yǎng)老機構管理有限公司 北京 100012)
冠心病是老年人最常見的疾病之一,本研究充分利用現(xiàn)代醫(yī)學和現(xiàn)代科技的理論與成果,對提高冠心病的診療水平,做好老年人冠心病的防治具有重要的意義。本文參照統(tǒng)一醫(yī)學語言系統(tǒng)、醫(yī)學系統(tǒng)命名法-臨床術語、中醫(yī)臨床術語集等多個知識系統(tǒng)中的規(guī)范化術語及術語間的語義關系,采集與中醫(yī)養(yǎng)生有關的多種信息來源,梳理面向中醫(yī)養(yǎng)生的與冠心病相關的語義關系,構建面向中醫(yī)養(yǎng)生的冠心病知識本體,為老年人對冠心病的防治與保健需求提供知識服務。
冠心病 知識本體 中醫(yī)養(yǎng)生
冠心?。–oronary Artery Disease,CAD)是老年人最常見的疾病之一[1],又稱缺血性心臟病,是指各種原因引起冠狀動脈狹窄或阻塞,導致心肌缺血缺氧甚至壞死的心臟疾病。近20年來,我國冠心病的發(fā)病率逐年上升,老年人冠心病的患病率更為突出,已成為影響老年人生活質量的主要疾病,也是60-74歲年輕老年人的主要死因[2]。因此,提高冠心病的診療水平,做好冠心病的防治,已成為老年病臨床工作的一個重要課題。
中醫(yī)藥是中華民族與疾病長期斗爭過程中積累的寶貴財富,其豐富知識和有效實踐經(jīng)驗中蘊含著深厚的科學內涵[3]。充分利用現(xiàn)代醫(yī)學和現(xiàn)代科技的理論與成果,利用現(xiàn)代科學的語言表達傳統(tǒng)醫(yī)學的內涵,創(chuàng)建服務于中醫(yī)藥現(xiàn)代化的知識與技術創(chuàng)新體系,以實現(xiàn)中醫(yī)的現(xiàn)代化和國際化[4]。目前隨語義網(wǎng)技術的發(fā)展,本體在知識共享、表示、推理和服務等方面發(fā)揮著越來越重要的作用。以建立知識本體和數(shù)據(jù)挖掘為核心的生物醫(yī)學正顯示出良好的研究和發(fā)展前景。研究和構建以中醫(yī)養(yǎng)生為目標的冠心病知識本體既是疾病信息學發(fā)展的需要,也是有效防治老年人冠心病的方法。
在信息與知識系統(tǒng)領域,本體被廣泛接受的定義由Gruber提出“是概念化的明確的規(guī)范說明”,基于其定義相對于其它知識組織方式,本體能有效表示概念、概念層次結構和概念間的語義,可以對邏輯推理進行良好的支持,能在語義知識層面上對其信息系統(tǒng)進行概念建模,實現(xiàn)對知識結構的描述,揭示知識體系的功能。因此人們認為本體提高了知識系統(tǒng)的互操作及可靠性,可作為一種語義共享和知識建模的工具,廣泛應用于信息檢索等知識系統(tǒng)領域。通過本體構建可以使醫(yī)學領域的術語概念規(guī)范化,并明確術語概念的定義,通過分析構建概念間的語義關系,形成具有鮮明醫(yī)學特點的醫(yī)學領域知識體系,從而支持醫(yī)學信息的采集、標注、分析與語義互操作?;诒倔w角度構建的知識庫,具有統(tǒng)一、規(guī)范概念術語,在知識獲取、檢索、分析與共享等方面發(fā)揮重要作用。
領域本體是對特定領域知識明確而規(guī)范的說明,描述該領域內所涉及的概念,以及概念間的語義關系等知識[5]。運用本體中規(guī)范化的概念和關系來描述該領域的相關事物和知識,減少了對相同涵義信息的表達異質性,有利于領域知識在“人-機-人”之間進行準確理解和高效交流[6]。而中醫(yī)臨床術語具有表達多樣性的特征,醫(yī)學本體能較好地規(guī)范醫(yī)學術語、醫(yī)學概念的定義及表達形式,建立概念間的從屬關系、語義關系展示醫(yī)學概念的本質。因此,醫(yī)學本體為醫(yī)學領域知識的應用提供相對統(tǒng)一的共享信息資源。
目前在國際上與醫(yī)學相關的常用本體或術語系統(tǒng)主要有,人類疾病本體(Disease Ontology,DO)[7]、醫(yī)學主題詞表(Medical Subject Headings,MeSH)*http://www.ncbi.nlm.nih.gov/mesh、國際疾病分類(International Classification of Diseases,ICD)**http://www.who.int/classification/icd/en第10版、統(tǒng)一醫(yī)學語言系統(tǒng)(Unified Medical Language System,UMLS)***http://uts.nlm.nih.gov/metathesaurus.html、醫(yī)學系統(tǒng)命名法-臨床術語(Systematized Nomenclature of Medicine-Clinical Terms,SNOMED CT)****http://www.ihtsdo.org/snomed-ct,上述醫(yī)學本體或術語體系規(guī)范化術語定義,描述概念之間及術語之間的語義關系,但沒有利用概念或術語之間的語義關系進行醫(yī)學事實的描述[8]。國內醫(yī)學領域本體及術語系統(tǒng)研究成果有:曹存根等[9]研究給出了一個中醫(yī)經(jīng)絡系統(tǒng)的本體;曹存根等[10]在2004年提出從中藥文本和中藥方劑文本中獲取知識的方法,利用獲取的知識構建中藥本體和方劑本體,并以框架的方式表示;于琦等[11]初步建立中醫(yī)溫病診療知識模型,提供一種有效的知識組織方式,使中醫(yī)文獻支持中醫(yī)臨床決策;方安等[12]在對現(xiàn)有領域本體構建方法進行綜合分析基礎上,通過對已有模型的改進,嘗試構建手足口病本體;郭會雨[13]進行疾病領域本體模型構建研究,利用protégé嘗試構建了疾病領域本體,描述疾病相關的概念、概念屬性、概念間的語義關系及制定醫(yī)學領域知識公理,為實現(xiàn)疾病領域知識的有序組織及利用提供了一定的實踐經(jīng)驗?!吨嗅t(yī)臨床術語集》[14,15]是借鑒目前國際上先進的臨床醫(yī)學術語集SNOMED CT的構建模式,以中醫(yī)自身獨特理論為核心,以本體論方法構建的術語系統(tǒng)。
目前對于疾病本體的構建多服務于智能診斷系統(tǒng)、醫(yī)學決策支持系統(tǒng),面向服務目的不同,構建本體的內容也應不相同。本研究的重點在于通過構建知識本體為冠心病的預防及保健提供中醫(yī)養(yǎng)生服務。
2.1 領域知識來源
以“中醫(yī)”、“養(yǎng)生”、“健康”、“保健”等關鍵詞進行文獻收集,獲取相關標準、指南、教科書以及較權威的中醫(yī)科普類圖書、中醫(yī)養(yǎng)生類古籍以及養(yǎng)生保健類期刊、報紙等作為文獻資源,如:中醫(yī)養(yǎng)生類古籍《千金翼方》、《中醫(yī)養(yǎng)生學》,中醫(yī)傳統(tǒng)醫(yī)學經(jīng)典《黃帝內經(jīng)》、《備急千金要方》,飲食衛(wèi)生與營養(yǎng)學專著《飲膳正要》等。另外,該文獻庫還對中醫(yī)養(yǎng)生領域的現(xiàn)代文獻進行系統(tǒng)搜集和存儲。從萬方、CNKI等數(shù)據(jù)庫中檢出與中醫(yī)養(yǎng)生相關的現(xiàn)代文獻,通過建立文獻庫對上述文獻的元數(shù)據(jù)和全文進行存儲和管理。除了生命科學和醫(yī)學方面的專業(yè)文獻之外,還收集整理了報刊中的中醫(yī)養(yǎng)生科普文章,從而滿足人們對普及中醫(yī)養(yǎng)生知識的需要。作為面向中醫(yī)養(yǎng)生的冠心病知識本體的數(shù)據(jù)來源。
2.2 概念關系的確定
通過領域專家的指導,首先提取已有資源MeSH、UMLS、SNOMED CT、中醫(yī)臨床術語集中與疾病相關的概念關系的描述,如“被……治療”、“預防”、“發(fā)生于”等;其次根據(jù)本研究中知識本體構建的目標——為老年人的養(yǎng)生保健提供服務,則用戶可能更想要獲取與冠心病相關的保健及預防方面的知識,結合已有的語義關系,梳理面向中醫(yī)養(yǎng)生的冠心病知識本體中涉及的語義關系。圖1展示了構建面向養(yǎng)生的冠心病知識本體中所需要的語義關系。
圖1中每個點表示一類概念,線表示兩類概念之間具有某種語義關聯(lián)。實線表示兩個概念間具有上下位關系,實線的起點表示上位概念,實線的終點表示下位概念。虛線表示其它語義關系。由于其中許多語義關系是對稱的,我們可以只描述其單向語義關系,如概念對(“冠心病”、“預防手段”)之間具有對稱關系“被……預防”與關系“預防”,我們可以只針對“冠心病”概念構建“被……預防”關系。下位概念可以繼承其上位概念相關的語義關系。如存在關系發(fā)生于“治療手段”和“案例”,則對于“治療手段”的下位概念“中醫(yī)治療”也與“案例”具有關系“發(fā)生于”。
圖1 冠心病相關語義關系圖
圖2 面向中醫(yī)養(yǎng)生的冠心病知識本體中部分概念
2.3 領域概念的獲取
為規(guī)范化冠心病知識本體中的概念,我們使用中醫(yī)臨床術語集中的術語表示本體中涉及的概念。根據(jù)概念關系中所涉及的概念類,從中醫(yī)臨床術語集中抽取相應術語作為本體中的實例概念。
2.4 冠心病知識本體構建
我們采用protégé*http://protege.stanford.edu/作為面向中醫(yī)養(yǎng)生的冠心病知識本體構建的輔助工具。將語義關系圖中涉及的與冠心病具有語義關聯(lián)的概念作為頂層概念,同時建立其與冠心病的語義關聯(lián)。圖2展示了所構建本體中的部分類概念與實例概念。圖3展示本體中的部分語義關系。不同顏色的虛線表示不同的語義關系,如綠色表示關系“高危因素”,是UMLS語義關系“引起”的子類。
圖3 面向中醫(yī)養(yǎng)生的冠心病知識本體中部分語義關系
本體構建并沒有唯一的途徑和方法,這一特點決定了本體構建必須面向特定的應用目的。本文以滿足冠心病老年患者的中醫(yī)養(yǎng)生需求為導向,側重于對面向中醫(yī)養(yǎng)生的冠心病知識本體構建方法進行探討,通過最大限度的復用已有知識系統(tǒng)如UMLS或中醫(yī)臨床術語集等中的規(guī)范化術語及概念間語義關系,初步構建了一個面向養(yǎng)生的冠心病知識本體。本課題組后續(xù)將進行實證性研究,以證明本體的有效性。
1 劉平,陳群.老年2型糖尿病合并冠心病的臨床特點.實用老年醫(yī)學, 2013, 27(4): 268-271.
2 韓明,靳文正,錢耐思,等.上海市2014年60歲以上老年人死亡特征分析.上海預防醫(yī)學, 2015, 27(9): 523-527.
3 孫峰,蘇剛強,余景亮.中醫(yī)藥科研的現(xiàn)狀分析及決策創(chuàng)新要略思考.中國醫(yī)藥導報, 2014, 11(6): 81-83,86.
4 李毅,張梅,奎杜,等.中醫(yī)腦病學本體的探討及其構建.世界科學技術-中醫(yī)藥現(xiàn)代化, 2007, 9(6): 96-101.
5 楊春媛.人類肝臟疾病本體的構建及其應用.北京:北京協(xié)和醫(yī)學院博士學位論文, 2012: 1-150.
6 楊春媛,李滿生,朱云平.生物醫(yī)學領域本體的構建、評估與應用.中國科學:生命科學, 2013, 43(3): 223-239.
7 Schriml L M, Arze C, Nadendla S, et al. Disease ontology: a backbone for disease semantic integration. Nucleic Acids Res, 2011, 40(Database issue): D940-D946.
8 周鈞.基于本體的臨床醫(yī)學案例知識庫研究.杭州:浙江工業(yè)大學碩士學位論文, 2012: 1-67.
9 Cao C G, Sui Y F. Building an ontology and knowledge base of the human meridian-collateral system. Proceedings of the 25thSGAI International Conference on Innovative Techniques and Applications of Artificial Intelligence, 2005: 195-208.
10 Cao, C G, Wang H T, Sui Y F. Knowledge modeling and acquisition of traditional Chinese drugs and formulae. Artif Intell Med, 2004, 32(1): 3-13.
11 于琦,崔蒙,李園白,等.中醫(yī)溫病診療知識模型初探.中醫(yī)藥信息學, 2012, 19(10): 19-20.
12 方安,王惠臨,王軍輝,等.臨床疾病領域本體構建方法研究——以手足口病本體為例.情報雜志, 2009, 28(11): 180-184.
13 郭會雨.疾病領域本體模型構建研究.北京:中國人民解放軍軍事醫(yī)學科學院碩士學位論文, 2011: 1-95.
14 郭玉峰,劉保延,崔蒙,等.借鑒SNOMED CT發(fā)展中醫(yī)臨床標準術語集.中醫(yī)藥發(fā)展與人類健康——慶祝中國中醫(yī)研究院成立50周年論文集(上冊), 2005: 425-433.
15 楊陽,李園白,崔蒙.建立中醫(yī)臨床術語集探索性研究.中國中醫(yī)藥信息雜志, 2006, 13(12): 105, 110.
Constructing Knowledge Ontology of Coronary Artery Disease Based on Traditional Chinese Medicine
Health Preservation
Cao Xinyu1, Xie Qi2, Zhou Hongwei1, Ma Jian3, Qiu Heng3
(1. Institute of Basic Research in Clinical Evaluation, China Academy of Chinese Medical Sciences, Beijing 100700, China;
2. China Academy of Chinese Medical Sciences, Beijing 100700, China;
3 Beijing Huichen Pension Institutions Management Ltd., Beijing 100012, China)
Coronary heart disease is common among the elderly. In this study, taking full advantages of theories and achievements of modern medicine and Sci-Tech will make significant contributions to improving the diagnosis and treatments of coronary artery disease (CAD) and its prevention in the elderly. The knowledge ontology of CAD based on traditional Chinese medicine (TCM) was constructed by collecting multiple sources of TCM health preservation related information and sorting out semantic relationships between TCM health preservation and CAD according to the standard terms and semantic relationships among terms in the knowledge system such as Unified Medical Language System, Systematized Nomenclature of Medicine-Clinical Terms and TCM Clinical Terminology was constructed to provide the elder people with knowledge services on CAD prevention and fulfill their healthcare service demands.
Coronary artery disease, knowledge ontology, traditional Chinese medicine
10.11842/wst.2016.04.021
R212
A
(責任編輯:朱黎婷,責任譯審:朱黎婷)
2016-04-06
修回日期:2016-04-12
* 國家自然科學基金委青年科學基金項目(81403281):基于本體的中醫(yī)臨床診療信息模型構建研究,負責人:曹馨宇;科學技術部國家“十二五”科技支撐計劃項目(2013BAH06F03):服務老年公寓的健康服務應用系統(tǒng)研發(fā)與應用,負責人:謝琪。
** 通訊作者:謝琪,研究員,學術管理處處長,主要研究方向:中醫(yī)藥信息學。