,, ,,,
糖尿病是一種嚴重的慢性非傳染性疾病,2010年我國18歲以上的糖尿病患病率達到9.7%,并且患者人數(shù)有不斷增加的趨勢,給個人和社會帶來極大的經(jīng)濟負擔[1]。由于國內(nèi)基層設(shè)備落后,醫(yī)務(wù)人員水平有限,糖尿病的漏診率與誤診率也較高。
本體作為語義網(wǎng)知識表示的核心,在國內(nèi)外成為研究的熱點。隨著本體技術(shù)不斷成熟,逐漸被用于醫(yī)學領(lǐng)域的知識表示。構(gòu)建相應(yīng)的知識庫,以此搭建醫(yī)療專家系統(tǒng),實現(xiàn)輔助醫(yī)療診斷等功能。如牟冬梅與范軼等構(gòu)造了心電圖領(lǐng)域本體,并在此基礎(chǔ)上實現(xiàn)了本體的語義推理,用于對心臟病的診斷[2];張巍和張絢等為使用計算機輔助診斷和治療高血壓,提出了基于本體和案例推理的高血壓診療系統(tǒng)模型[3]等。
在糖尿病領(lǐng)域,國外有控制糖尿病食物領(lǐng)域本體的構(gòu)建并通過推理對糖尿病患者飲食方案提供建議[4],有基于本體構(gòu)建糖尿病臨床支持系統(tǒng)為醫(yī)務(wù)工作者提醒患者的相關(guān)病情[5],還有結(jié)合本體與語義網(wǎng)規(guī)則語言(SWRL)以及根據(jù)不同患者的不同身體狀況,為糖尿病患者提供個性化服務(wù)如提供合適的藥物[6]等。
國外也有應(yīng)用糖尿病的本體技術(shù)為糖尿病患者或醫(yī)務(wù)工作者提供個性化服務(wù),但是基本沒有為基層全科醫(yī)生提供轉(zhuǎn)診服務(wù)。目前國內(nèi)糖尿病專家系統(tǒng)研究主要在糖尿病診斷和數(shù)據(jù)挖掘方面,而基于本體,利用糖尿病相關(guān)指南以及專家知識對糖尿病進行診斷和治療的研究卻并不多[7]。
本文構(gòu)建了糖尿病領(lǐng)域本體與診療規(guī)則模型并實現(xiàn)了語義推理,為后續(xù)基于本體的糖尿病管理系統(tǒng)研究奠定了基礎(chǔ)。以此為基礎(chǔ)開發(fā)基于本體的糖尿病管理系統(tǒng),為基層全科醫(yī)生糖尿病患者診療提供科學規(guī)范的決策支持,能夠有效提高糖尿病的知曉率和降低各種并發(fā)癥的致殘率,對于控制血糖、減輕糖尿病帶來的經(jīng)濟與社會負擔具有重要意義。
糖尿病領(lǐng)域本體相關(guān)的概念、屬性、關(guān)系以及診療規(guī)則主要來自國內(nèi)糖尿病領(lǐng)域相關(guān)的臨床指南及糖尿病領(lǐng)域?qū)<?。其中主要抽取有關(guān)糖尿病風險評估、患者癥狀、糖尿病診斷方法、糖尿病診療路徑、相關(guān)治療藥物如降糖藥、調(diào)脂藥與降壓藥以及糖尿病的生活干預方式等知識,經(jīng)過反復論證,確保概念以及概念關(guān)系的準確性及統(tǒng)一性。并按照格魯伯提出的清晰性、完整性、一致性、最大單調(diào)可擴展性以及最小承諾原則構(gòu)建本體五項原則,保證本體構(gòu)建的科學性。在語義推理階段,則根據(jù)患者健康檔案數(shù)據(jù),創(chuàng)建相應(yīng)的患者實例,實現(xiàn)語義推理。
目前,國內(nèi)外本體構(gòu)建方法主要有兩種:一是直接從知識工程的角度出發(fā)構(gòu)建本體,稱為本體工程;二是在現(xiàn)有詞表資源的基礎(chǔ)上直接向本體轉(zhuǎn)化[8]。
本體工程強調(diào)構(gòu)造本體時要按照一定的規(guī)范和標準。目前為止,其主要的方法有TOVE法、七步法、骨架法、IDEF5法以及SENSUS法等,還沒有統(tǒng)一的構(gòu)造本體的標準。以上方法都是在構(gòu)建具體項目的本體時總結(jié)出來的。相較于其他的本體構(gòu)建方法,斯坦福大學開發(fā)的七步法構(gòu)建領(lǐng)域本體最為成熟[9],但缺少“檢查和評估以及用戶的反饋”環(huán)節(jié)[10]。因此本文借鑒骨架法領(lǐng)域本體構(gòu)建方法,引進本體評價環(huán)節(jié),創(chuàng)建了新的糖尿病領(lǐng)域本體構(gòu)建方法(圖1)。
圖1糖尿病領(lǐng)域本體構(gòu)建方法
Maja Hadzic和Elizabeth Chang 等學者提出了人類疾病本體模型即疾病類型、表型、治療手段與病因四維模型[11]。本文在此基礎(chǔ)上將其拓展為一種含有疾病類型、臨床表現(xiàn)、治療手段、檢查項目、并發(fā)癥以及患者6個維度的糖尿病本體構(gòu)建模型,使用新的本體構(gòu)建方法在斯坦福大學Protégé 3.5平臺構(gòu)建糖尿病領(lǐng)域本體。
糖尿病領(lǐng)域本體的框架主要由疾病類型、臨床表現(xiàn)、治療手段、檢查項目、并發(fā)癥以及患者6個核心類組成。在這6個核心類的基礎(chǔ)上,逐層創(chuàng)建子類,增添其屬性與關(guān)系以并創(chuàng)建實例,進而逐步完善糖尿病領(lǐng)域本體。
根據(jù)臨床指南定義糖尿病領(lǐng)域的概念及它們的關(guān)系,確定概念與概念的層次。國內(nèi)糖尿病領(lǐng)域相關(guān)的臨床指南包含了大量術(shù)語以及關(guān)系,通過較完整的抽取,盡可能保證糖尿病領(lǐng)域概念的完整性,而概念的抽取確保了類屬性的定義以及實例的創(chuàng)建。該研究使用自頂向下與自底向上的方法相結(jié)合定義概念,并使用本體描述語言O(shè)WL DL描述糖尿病領(lǐng)域本體,對其進行編碼與形式化。
本體中的關(guān)系代表了在領(lǐng)域中概念之間的交互作用,主要包含基本關(guān)系和自定義關(guān)系兩部分。除了系統(tǒng)預設(shè)的4種基本關(guān)系(即part-of 概念之間部分與整體的關(guān)系,kind-of 概念之間的繼承關(guān)系、父子類關(guān)系,instance-of 概念的實例和概念之間的關(guān)系、類對象和類之間的關(guān)系),attribute-of 某個概念是另一概念的屬性外,該研究還定義了12種關(guān)系,豐富了糖尿病領(lǐng)域本體庫。其中,屬性分為對象屬性和數(shù)據(jù)類型屬性,對象屬性表示兩個實例之間的關(guān)系,數(shù)據(jù)類型屬性描述類實例與數(shù)據(jù)類型值的關(guān)系。該研究構(gòu)建了7個數(shù)據(jù)類型屬性,部分屬性與關(guān)系見表1。
表1 糖尿病領(lǐng)域本體部分屬性
實例是概念的具體化,繼承了概念的屬性,當構(gòu)建大量的實例后,就逐漸形成相關(guān)領(lǐng)域的知識庫。實例數(shù)據(jù)經(jīng)過處理形成符合格式的實例數(shù)據(jù),方便事實庫的形成,從而與規(guī)則庫結(jié)合,在JESS推理機中實現(xiàn)推理。經(jīng)過概念、屬性以及實例的構(gòu)建,最終形成部分糖尿病領(lǐng)域本體庫。
語義網(wǎng)規(guī)則語言(SWRL)是萬維網(wǎng)聯(lián)盟(W3C)于2004 年提出的,用于描述推理規(guī)則。它是以O(shè)WL子語言O(shè)WL DL/OWL Lite 和RuleML為基礎(chǔ)的規(guī)則描述語言,其目的是為了讓規(guī)則可與OWL產(chǎn)生結(jié)合,從而提高本體的推理能力[12]。糖尿病診療規(guī)則庫使用SWRL進行構(gòu)建。
結(jié)合國內(nèi)糖尿病相關(guān)的權(quán)威指南、政策文件以及糖尿病專家的建議,形成規(guī)范的糖尿病診療路徑(圖2),繼而生成糖尿病診療規(guī)則庫,主要包含早期糖尿病篩查規(guī)則、糖尿病的診斷規(guī)則、糖尿病的分型規(guī)則、糖尿病的藥物推薦規(guī)則以及轉(zhuǎn)診規(guī)則,共28條規(guī)則(圖3)。如早期糖尿病篩查規(guī)則:人(?P)∧FPG值(?p,?x)∧swrlb:lessThan(?x,7.0) ∧ swrlb:greaterThanOrEqual(?x,6.1)∧_2HPG值(?p,?y)∧swrlb:lessThan(?y,7.8)→ 風險評估結(jié)果(?p,有空腹血糖受損)。表示的是如果一個人,空腹血糖大于等于6.1,且小于7.0,葡萄糖負荷后2小時血糖值小于7.8,那么這個人有空腹血糖受損。
圖2部分糖尿病診療流程
圖3 糖尿病診療規(guī)則庫
Jess推理引擎主要由事實庫、規(guī)則庫和推理機3部分組成。先根據(jù)本體,創(chuàng)建相應(yīng)的實例。Jess推理機將患者領(lǐng)域本體轉(zhuǎn)化為Jess事實庫,再將SWRL規(guī)則轉(zhuǎn)化為Jess規(guī)則庫,推理機結(jié)合Jess事實庫與Jess規(guī)則庫,實現(xiàn)本體語義推理,揭示糖尿病領(lǐng)域潛在的知識,實現(xiàn)早期糖尿病的篩查、診斷、糖尿病藥物推薦以及轉(zhuǎn)診服務(wù)。如圖4所示,實例中患者李明(化名),最終診斷為糖尿病,疑似為2型糖尿病,并且合并有高血壓和高血脂,最終推薦使用抗糖藥物有a-糖苷抑制劑、二甲雙胍,降壓藥有血管緊張素受體拮抗劑、血管緊張素轉(zhuǎn)換酶抑制劑以及降脂藥他汀類藥物。由于收縮壓大于150mmHg,專家建議轉(zhuǎn)診到上級醫(yī)院確診并制定診療方案。
圖4語義推理實現(xiàn)
本文從Maja Hadzic和Elizabeth Chang 提出的四維人類疾病本體模型出發(fā),在此模型基礎(chǔ)上綜合應(yīng)用七步法與骨架法本體構(gòu)建方法,構(gòu)造了較為完整的糖尿病領(lǐng)域本體,并且實現(xiàn)了基于糖尿病領(lǐng)域本體的語義推理,是本體技術(shù)在糖尿病領(lǐng)域的有意義的嘗試,為糖尿病管理系統(tǒng)的開發(fā)打下基礎(chǔ)。
本研究還存在一定的局限性,主要在于以下幾個方面。構(gòu)建的糖尿病領(lǐng)域本體可能不夠完整,需要更多的領(lǐng)域?qū)<覅⑴c;本體全部由人工創(chuàng)建,工作量大且繁瑣,后續(xù)我們將對本體的自動化構(gòu)建進行有益的探索;采用基于產(chǎn)生規(guī)則式的推理,不能很好地將部分知識轉(zhuǎn)化為結(jié)構(gòu)化的規(guī)則存儲于糖尿病知識庫。健康飲食與運動對糖尿病的治療非常重要,因此糖尿病診療規(guī)則庫也需要不斷地調(diào)整和完善,使之不僅能實現(xiàn)糖尿病高危人群的篩查、糖尿病診斷、抗糖尿病藥物的推薦以及轉(zhuǎn)診建議,還將實現(xiàn)糖尿病飲食與運動方面的指導功能。