雷行云,戴國(guó)琳,陳荃,胡紅濮
罕見病是指發(fā)病率低、病情一般較為嚴(yán)重且診斷治療較為復(fù)雜的疾病,據(jù)估計(jì),我國(guó)罕見病患者人數(shù)近4 000萬(wàn)[1]。雖然我國(guó)罕見病患者的總數(shù)較多,但因每種罕見病的患病人數(shù)少、臨床病例不足且患病人群分散,罕見病患者及其家屬、醫(yī)務(wù)人員和公眾等對(duì)罕見病防控和診療的知識(shí)儲(chǔ)備多不足。目前,罕見病知識(shí)受眾通過(guò)傳統(tǒng)路徑獲取的罕見病知識(shí)非常有限。罕見病知識(shí)的缺乏在導(dǎo)致醫(yī)生對(duì)罕見病的診斷能力不足的同時(shí),也使罕見病易被誤診或漏診。當(dāng)疾病的種類都難以判斷時(shí),治療也就無(wú)從談起。另外,罕見病患者非常關(guān)注所患疾病的前沿診療方法和研究進(jìn)展,并期望通過(guò)多種途徑獲取罕見病知識(shí)[2-3]。面對(duì)我國(guó)罕見病診療中仍存在認(rèn)知不足這一問(wèn)題,需借助信息分析處理技術(shù)將大量異構(gòu)的罕見病知識(shí)、權(quán)威診療經(jīng)驗(yàn)、技術(shù)方法和電子病歷等進(jìn)行結(jié)構(gòu)化處理,構(gòu)建罕見病知識(shí)庫(kù),并在此基礎(chǔ)上建立罕見病疾病與癥狀之間的關(guān)聯(lián)模型、罕見病之間及罕見病與常見病之間的鑒別模型,以期提升醫(yī)務(wù)工作者、罕見病患者和公眾等的罕見病認(rèn)知水平,并為進(jìn)一步研發(fā)罕見病相關(guān)智能系統(tǒng)和平臺(tái)奠定基礎(chǔ),為解決罕見病難題提供一定的技術(shù)手段和重要信息支撐。當(dāng)前,疾病知識(shí)庫(kù)領(lǐng)域研究主要聚焦于臨床知識(shí)庫(kù)、傳染病知識(shí)庫(kù)和慢性病知識(shí)庫(kù),對(duì)于罕見病知識(shí)庫(kù)的關(guān)注程度較低,并且現(xiàn)有的罕見病知識(shí)庫(kù)研究多集中于對(duì)知識(shí)庫(kù)的方法學(xué)和采取的關(guān)鍵信息技術(shù)進(jìn)行探討[4],關(guān)于罕見病模型庫(kù)構(gòu)建的報(bào)道較少。本研究在明確罕見病知識(shí)庫(kù)和模型庫(kù)構(gòu)建流程的基礎(chǔ)上,描述了9類知識(shí)庫(kù)和2類模型庫(kù)之間的關(guān)系及各知識(shí)庫(kù)和模型庫(kù)包含的具體內(nèi)容,并完成了知識(shí)庫(kù)和模型庫(kù)的設(shè)計(jì),可為智慧化罕見病知識(shí)服務(wù)體系的建設(shè)奠定良好的基礎(chǔ)。
本研究在文獻(xiàn)調(diào)研、專家咨詢的基礎(chǔ)上,廣泛收集包括罕見病臨床指南、典型案例和診療方案等在內(nèi)的多種類型知識(shí)源。通過(guò)對(duì)罕見病國(guó)內(nèi)外文獻(xiàn)、臨床診療方案和信息進(jìn)行系統(tǒng)分析,并借鑒現(xiàn)有的疾病臨床數(shù)據(jù)和樣本資源庫(kù),結(jié)合國(guó)內(nèi)外醫(yī)療機(jī)構(gòu)在實(shí)踐中形成的診療經(jīng)驗(yàn)或臨床路徑,完成對(duì)罕見病知識(shí)庫(kù)和模型庫(kù)的設(shè)計(jì)。罕見病知識(shí)庫(kù)和模型庫(kù)的構(gòu)建流程為:通過(guò)廣泛收集罕見病領(lǐng)域的權(quán)威知識(shí)并對(duì)其進(jìn)行分類和處理,形成不同類型的罕見病知識(shí)節(jié)點(diǎn)和記錄,并根據(jù)本體關(guān)系定義和映射建立罕見病知識(shí)概念描述,在此基礎(chǔ)上構(gòu)建知識(shí)圖譜、知識(shí)網(wǎng)絡(luò)、知識(shí)地圖和知識(shí)規(guī)則,并總結(jié)典型案例,最終形成9類罕見病知識(shí)庫(kù)和2類模型庫(kù),見圖1。
圖1 罕見病知識(shí)庫(kù)和模型庫(kù)構(gòu)建流程設(shè)計(jì)Figure 1 Process of the design of knowledge databases and model databases for rare diseases
1.1 知識(shí)采集 罕見病知識(shí)庫(kù)和模型庫(kù)構(gòu)建過(guò)程中的知識(shí)來(lái)源包括教科書、專家經(jīng)驗(yàn)、臨床指南、典型案例、臨床診療方案、電子健康檔案、電子病歷、文獻(xiàn)資料和網(wǎng)絡(luò)資源等。教科書、臨床指南、臨床診療方案和文獻(xiàn)資料等作為罕見病診療過(guò)程中必須或普遍遵循的基本原則的主要來(lái)源,也是罕見病知識(shí)庫(kù)中知識(shí)的基本來(lái)源。專家經(jīng)驗(yàn)作為罕見病知識(shí)庫(kù)中知識(shí)的另一重要來(lái)源,主要為從事罕見病相關(guān)研究的基礎(chǔ)醫(yī)學(xué)、臨床醫(yī)學(xué)和影像學(xué)等學(xué)科的專家,以及具有罕見病診療經(jīng)驗(yàn)的高年資臨床醫(yī)師和內(nèi)外婦兒等??频呐R床醫(yī)學(xué)專家的研究和診療經(jīng)驗(yàn)。電子健康檔案和電子病歷主要提供已確診罕見病患者的就診記錄、主要癥狀、主要檢查項(xiàng)目及其結(jié)果、用藥及手術(shù)情況和康復(fù)情況等內(nèi)容。
對(duì)于第1類載體中的知識(shí),由于其具有較高的權(quán)威性和規(guī)范性,一般無(wú)須嚴(yán)格的質(zhì)量審核即可進(jìn)行知識(shí)加工;而對(duì)于后2類載體中的知識(shí),則需要通過(guò)專家咨詢等方式對(duì)其行進(jìn)一步篩選,以保證知識(shí)的權(quán)威性和科學(xué)性,避免出現(xiàn)知識(shí)謬誤或自相矛盾的情況。
1.2 知識(shí)體系構(gòu)建 罕見病知識(shí)來(lái)源多樣、載體類型眾多,這也使得罕見病知識(shí)信息量大、結(jié)構(gòu)復(fù)雜且更新速度快,將多源知識(shí)轉(zhuǎn)化為體系式的知識(shí)是知識(shí)庫(kù)構(gòu)建過(guò)程中非常重要的一個(gè)環(huán)節(jié)。鑒于知識(shí)獲取的非延續(xù)性和知識(shí)利用的非系統(tǒng)化,形成系統(tǒng)、完善的知識(shí)體系可有助于上述問(wèn)題的解決。通過(guò)將罕見病知識(shí)抽象為單一實(shí)體(如疾病的名稱、別稱、主要臨床表現(xiàn)和藥品名稱等),并獲取各實(shí)體間的關(guān)系(如成骨不全癥又稱瓷娃娃病,肌萎縮側(cè)索硬化臨床表現(xiàn)為肌肉萎縮等),以構(gòu)建罕見病本體庫(kù)。在此基礎(chǔ)上,利用可視化技術(shù),形成罕見病知識(shí)圖譜、知識(shí)網(wǎng)絡(luò)、知識(shí)地圖和知識(shí)圖解等,在建立罕見病相關(guān)知識(shí)規(guī)則的同時(shí),構(gòu)建罕見病案例知識(shí)庫(kù)。在知識(shí)體系構(gòu)建過(guò)程中,以關(guān)聯(lián)模型為載體,將鑒別模型建立在關(guān)聯(lián)模型數(shù)據(jù)庫(kù)中,以解決相同癥狀和不同癥狀疾病在本體中的處理及儲(chǔ)存問(wèn)題。對(duì)于一些現(xiàn)有的、存儲(chǔ)在知識(shí)庫(kù)中的罕見病醫(yī)療術(shù)語(yǔ)庫(kù),利用關(guān)聯(lián)模型和鑒別診斷模型之間的聯(lián)系可使其為罕見病本體建模提供數(shù)據(jù),以更好地建立罕見病知識(shí)體系。
1.3 知識(shí)庫(kù)和模型庫(kù)的形成 在從多種權(quán)威知識(shí)源中獲取罕見病知識(shí)并建立罕見病知識(shí)體系的基礎(chǔ)上,兼顧???綜合性醫(yī)療機(jī)構(gòu)對(duì)于罕見病診療的需求、基層醫(yī)療衛(wèi)生機(jī)構(gòu)對(duì)于慢性罕見病患者的管理需求及罕見病患者的自我管理需求,構(gòu)建罕見病知識(shí)庫(kù)和模型庫(kù)。所形成的知識(shí)庫(kù)包括罕見病通用知識(shí)庫(kù)、預(yù)防知識(shí)庫(kù)、癥狀知識(shí)庫(kù)、特異癥狀知識(shí)庫(kù)、異常檢查指標(biāo)知識(shí)庫(kù)、診斷知識(shí)庫(kù)、藥物循證知識(shí)庫(kù)、治療知識(shí)庫(kù)和隨訪知識(shí)庫(kù)。模型庫(kù)包括癥狀與疾病關(guān)聯(lián)模型庫(kù)和疾病鑒別模型庫(kù)。
1.4 知識(shí)庫(kù)和模型庫(kù)的關(guān)聯(lián)關(guān)系 通用知識(shí)庫(kù)是其他知識(shí)庫(kù)的基礎(chǔ),其以疾病為分類維度,對(duì)疾病信息進(jìn)行全面、系統(tǒng)地描述。癥狀知識(shí)庫(kù)以疾病癥狀為分類維度,描述癥狀的具體特征及可能與之相關(guān)的疾病。其他知識(shí)庫(kù)可協(xié)助醫(yī)務(wù)人員對(duì)罕見病進(jìn)行預(yù)防和診斷,并助力罕見病患者的治療和隨訪,同時(shí)支持知識(shí)的直接查詢。癥狀和疾病關(guān)聯(lián)模型是整個(gè)知識(shí)和模型庫(kù)的核心,其在疾病通用知識(shí)庫(kù)和癥狀知識(shí)庫(kù)的基礎(chǔ)上結(jié)合專家咨詢和電子病歷擬合等方式構(gòu)建而成。
2.1 通用知識(shí)庫(kù) 通用知識(shí)庫(kù)內(nèi)容不僅包括疾病概述、危險(xiǎn)因素、發(fā)病機(jī)制、臨床表現(xiàn)、臨床分型、主要癥狀、診斷要點(diǎn)、鑒別診斷、預(yù)防、治療和康復(fù)等在內(nèi)的罕見病基礎(chǔ)信息,還包括國(guó)內(nèi)外公開發(fā)布的罕見病別稱、共病、基因、基因型、疾病表型、疾病-基因型關(guān)聯(lián)、疾病-表型關(guān)聯(lián)、流行病學(xué)特征及與其他關(guān)系數(shù)據(jù)庫(kù)間的映射信息等內(nèi)容[5-6]。同時(shí),通用知識(shí)庫(kù)根據(jù)不同人群的知識(shí)需求設(shè)計(jì)為不同版本,主要版本包括患者及家屬版、基層醫(yī)生版、???綜合性醫(yī)院醫(yī)生版和研究人員版,見圖2。
圖2 罕見病通用知識(shí)庫(kù)設(shè)計(jì)Figure 2 Design of the universal knowledge database for rare diseases
2.2 預(yù)防知識(shí)庫(kù) 針對(duì)80%以上的罕見病是由遺傳缺陷引起、95%以上的疾病尚無(wú)有效治療手段這一特點(diǎn),設(shè)計(jì)罕見病預(yù)防知識(shí)庫(kù),內(nèi)容包括孕前綜合干預(yù)、孕期保健、產(chǎn)前篩查、產(chǎn)前診斷及出生缺陷干預(yù)等知識(shí),并通過(guò)知識(shí)服務(wù)平臺(tái)進(jìn)行宣傳。
2.3 癥狀知識(shí)庫(kù) 以罕見病臨床癥狀為分類維度,對(duì)罕見病的主要癥狀、癥狀特征、癥狀相關(guān)疾病和多個(gè)癥狀組合對(duì)應(yīng)的疾病等進(jìn)行提煉與總結(jié),并設(shè)計(jì)相應(yīng)的流程和關(guān)聯(lián)規(guī)則,以建立癥狀知識(shí)庫(kù)。
2.4 特異癥狀知識(shí)庫(kù) 對(duì)罕見病的特異癥狀進(jìn)行詳細(xì)描述,采用多樣化的呈現(xiàn)方式,如文字、圖解、圖片和視頻等,協(xié)助用戶對(duì)罕見病進(jìn)行識(shí)別和診斷,并設(shè)計(jì)相應(yīng)的流程和關(guān)聯(lián)規(guī)則,以提升疾病診斷的及時(shí)性和準(zhǔn)確性。
2.5 異常檢查指標(biāo)知識(shí)庫(kù) 明確診斷和治療各種罕見病時(shí)需要開展的檢查項(xiàng)目和參考的指標(biāo)及其參考范圍。在對(duì)異常檢查結(jié)果的臨床意義進(jìn)行解釋的同時(shí),對(duì)異常檢查結(jié)果可能關(guān)聯(lián)的疾病進(jìn)行分析,并對(duì)各檢查指標(biāo)設(shè)立異常預(yù)警值,以形成異常檢查指標(biāo)知識(shí)庫(kù)[7]。
2.6 罕見病診斷知識(shí)庫(kù) 根據(jù)罕見病的特異癥狀、常見癥狀和各項(xiàng)檢查指標(biāo)的參考范圍,結(jié)合臨床診療標(biāo)準(zhǔn)和專家經(jīng)驗(yàn),形成相應(yīng)的罕見病診斷規(guī)則和診療流程,最終構(gòu)建罕見病診斷知識(shí)庫(kù)[8]。
2.7 罕見病治療知識(shí)庫(kù) 通過(guò)將罕見病典型案例、診療指南和綜合干預(yù)措施等與專家診療經(jīng)驗(yàn)相整合,構(gòu)建以病種為索引的罕見病治療知識(shí)庫(kù),以系統(tǒng)呈現(xiàn)罕見病的治療方案、常見用藥、手術(shù)方案、放化療方案和預(yù)后等內(nèi)容。
2.8 藥物循證知識(shí)庫(kù) 挖掘罕見病特效藥物使用和疾病轉(zhuǎn)歸之間的關(guān)系,并以疾病和藥物作為本體,結(jié)合罕見病患者的用藥需求和罕見病新藥研發(fā)、疾病譜變化與藥物政策調(diào)整等情況,建立藥物循證知識(shí)庫(kù)[9-10]。
2.9 隨訪知識(shí)庫(kù) 對(duì)于已確診的罕見病患者,根據(jù)其所患罕見病的種類,明確其隨訪周期和隨訪具體內(nèi)容等。
3.1 癥狀與疾病關(guān)聯(lián)模型庫(kù) 通過(guò)分析與臨床癥狀相關(guān)聯(lián)的疾病,構(gòu)建癥狀與疾病間的關(guān)聯(lián)關(guān)系網(wǎng)絡(luò),以建立定性模型。在建立定性模型的基礎(chǔ)上,對(duì)罕見病的特異癥狀、常見癥狀、伴隨癥狀、偶發(fā)癥狀、異常信息和檢驗(yàn)結(jié)果進(jìn)行權(quán)重設(shè)計(jì),建立相應(yīng)的定量模型[6,11]。
3.2 疾病鑒別模型庫(kù) 將疾病臨床診斷標(biāo)準(zhǔn)、特異性癥狀、主要發(fā)病過(guò)程與專家經(jīng)驗(yàn)相結(jié)合,對(duì)需要鑒別的疾病和與之相對(duì)應(yīng)的癥狀進(jìn)行賦值,尤其對(duì)特異性癥狀進(jìn)行重點(diǎn)標(biāo)記,以形成罕見病的鑒別診斷模型[12]。
4.1 規(guī)范化知識(shí)檢索 對(duì)國(guó)內(nèi)外罕見病領(lǐng)域文獻(xiàn)、診療信息、診療方案、診療指南和教材等知識(shí)進(jìn)行編輯和加工,采用規(guī)則、框架、批注和流程等形式表示,將罕見病相關(guān)預(yù)防、診療知識(shí)存儲(chǔ)入知識(shí)庫(kù),并以規(guī)范化格式為相關(guān)用戶提供知識(shí)檢索和利用服務(wù)[13-14]。
4.2 專題知識(shí)檢索與查詢 在建立疾病通用知識(shí)庫(kù)的基礎(chǔ)上結(jié)合罕見病患者及其家屬、醫(yī)務(wù)人員、教學(xué)科研人員及公眾等的不同知識(shí)需求,構(gòu)建多樣化的罕見病專題庫(kù),包括罕見病預(yù)防專題庫(kù)、診斷專題庫(kù)、治療專題庫(kù)、藥品專題庫(kù)、醫(yī)保專題庫(kù)和政策專題庫(kù)等[15-16]。各專題庫(kù)支持用戶采用多種檢索方式(如關(guān)鍵詞、主題詞檢索等)對(duì)該專題內(nèi)的信息進(jìn)行檢索和查詢。
4.3 輔助診斷和治療 以癥狀和疾病關(guān)聯(lián)模型為基礎(chǔ),采用多種形式關(guān)聯(lián)患者的癥狀等信息,并結(jié)合疾病鑒別模型、特異癥狀知識(shí)庫(kù)、診斷知識(shí)庫(kù)和異常檢查知識(shí)庫(kù)中的診斷規(guī)則,以發(fā)揮輔助醫(yī)務(wù)人員診斷罕見病的作用。在明確疾病診斷的基礎(chǔ)上,治療知識(shí)庫(kù)和藥物循癥知識(shí)庫(kù)可為患者提供個(gè)體化的治療方案。
4.4 分析預(yù)測(cè) 分析預(yù)測(cè)功能主要面向醫(yī)務(wù)人員和科研工作者開發(fā),以醫(yī)學(xué)統(tǒng)計(jì)學(xué)方法為基礎(chǔ),實(shí)現(xiàn)對(duì)相關(guān)信息(如罕見病個(gè)案)的整理、分析和知識(shí)可視化展示,并可結(jié)合SPSS、Stata、R語(yǔ)言等統(tǒng)計(jì)分析軟件,助力科研人員進(jìn)行罕見病相關(guān)數(shù)據(jù)的統(tǒng)計(jì)分析[17]。同時(shí),分析預(yù)測(cè)功能也可為預(yù)測(cè)罕見病的發(fā)生、發(fā)展提供支持,并助力罕見病風(fēng)險(xiǎn)預(yù)測(cè)模型的構(gòu)建。該功能也可為患者提供服務(wù),以預(yù)測(cè)其疾病近、遠(yuǎn)期預(yù)后[18]。
4.5 更新與管理 隨著醫(yī)療科學(xué)技術(shù)的不斷進(jìn)步,知識(shí)庫(kù)和模型庫(kù)需具備完善的更新與管理功能,以允許管理者根據(jù)最新知識(shí)前沿修正或更新知識(shí)庫(kù)內(nèi)容。為保障信息安全,更新與管理功能一般僅對(duì)系統(tǒng)管理者開放[19]。此外,由于知識(shí)庫(kù)和模型庫(kù)對(duì)于臨床診療具有一定的指導(dǎo)作用,因此,針對(duì)醫(yī)務(wù)工作者和科研人員開發(fā)的版本中增加了“內(nèi)容糾錯(cuò)”功能,允許醫(yī)務(wù)工作者和科研人員通過(guò)在線申報(bào),向知識(shí)庫(kù)建設(shè)單位進(jìn)行錯(cuò)誤反饋,以確保知識(shí)庫(kù)和模型庫(kù)內(nèi)容完善、可靠。
本研究明確了罕見病知識(shí)庫(kù)和模型庫(kù)的建設(shè)思路和內(nèi)容,并梳理了知識(shí)庫(kù)、模型庫(kù)在罕見病預(yù)防控制、診斷和治療等環(huán)節(jié)可能發(fā)揮的作用及其實(shí)現(xiàn)形式。罕見病知識(shí)庫(kù)和模型庫(kù)可以獨(dú)立使用,以實(shí)現(xiàn)知識(shí)的表示、檢索、查詢、挖掘和利用;也可以與基層衛(wèi)生信息系統(tǒng)、醫(yī)院信息系統(tǒng)、區(qū)域全民健康信息平臺(tái)、疾病預(yù)防控制平臺(tái)和慢性病管理系統(tǒng)等進(jìn)行對(duì)接,輔助醫(yī)務(wù)人員進(jìn)行罕見病的診斷和治療。下一步,可在構(gòu)建罕見病知識(shí)庫(kù)和模型庫(kù)的基礎(chǔ)上建立罕見病智能知識(shí)服務(wù)平臺(tái),以為罕見病患者及其家屬、醫(yī)務(wù)人員和研究人員檢索、查詢罕見病知識(shí)提供便利,同時(shí)促進(jìn)知識(shí)受眾間的溝通交流。罕見病知識(shí)庫(kù)和模型庫(kù)的應(yīng)用可為解決罕見病防控中存在的問(wèn)題提供方案,并為破解罕見病診斷難、易漏診和誤診,以及罕見病知識(shí)更新快速且難以獲取、醫(yī)務(wù)人員難以及時(shí)跟進(jìn)罕見病研究與診療進(jìn)展等難題提供幫助[20]。
作者貢獻(xiàn):雷行云負(fù)責(zé)文章的構(gòu)思與設(shè)計(jì)、質(zhì)量控制及審校;雷行云、胡紅濮負(fù)責(zé)文章的可行性分析;戴國(guó)琳負(fù)責(zé)文獻(xiàn)/資料收集;陳荃負(fù)責(zé)文獻(xiàn)/資料整理;雷行云、戴國(guó)琳、陳荃和胡紅濮撰寫論文;雷行云、陳荃和胡紅濮負(fù)責(zé)論文的修訂;陳荃、胡紅濮負(fù)責(zé)英文的修訂;胡紅濮對(duì)文章整體負(fù)責(zé),監(jiān)督管理。
本文無(wú)利益沖突。