袁 方 任海玲 馬鴻儒 趙 夢(mèng) 廖 聰 李洲誼 宋 菲
1.銀川市第一人民醫(yī)院信息管理部,寧夏銀川 750001;2.寧夏醫(yī)科大學(xué)臨床醫(yī)學(xué)院,寧夏銀川 750004;3.寧夏醫(yī)科大學(xué)醫(yī)學(xué)信息與工程學(xué)院,寧夏銀川 750004
新發(fā)傳染?。╡merging infectious diseases,EIDs)是全球衛(wèi)生重點(diǎn)關(guān)注問(wèn)題,嚴(yán)重威脅人類健康及社會(huì)發(fā)展[1]。傳染病監(jiān)測(cè)是公共衛(wèi)生的重要組成內(nèi)容[2],合理有效的傳染病監(jiān)測(cè)可盡早發(fā)現(xiàn)疫情趨勢(shì),幫助及時(shí)采取預(yù)防控制措施,遏制疫情蔓延,有效控制因疾病流行和暴發(fā)給人類發(fā)展和生存造成的危害[3-6]。我國(guó)傳染病監(jiān)測(cè)工作已經(jīng)開展70 年,依據(jù)歷史監(jiān)測(cè)數(shù)據(jù),利用數(shù)據(jù)模型進(jìn)行準(zhǔn)確分析和預(yù)測(cè),能夠及時(shí)獲知傳染病的發(fā)病趨勢(shì)[7-8]。但我國(guó)建立的傳染病監(jiān)測(cè)系統(tǒng)大多數(shù)是針對(duì)診斷后的病歷信息進(jìn)行監(jiān)測(cè),是被動(dòng)的監(jiān)測(cè)系統(tǒng),缺乏對(duì)EIDs 的預(yù)警能力。近年來(lái),隨著醫(yī)院信息化建設(shè)的成熟,云計(jì)算[9]、物聯(lián)網(wǎng)[10]、大數(shù)據(jù)[11-12]、互聯(lián)網(wǎng)[13]、人工智能[14-15]等技術(shù)在醫(yī)療領(lǐng)域的廣泛深入應(yīng)用,大量臨床真實(shí)世界數(shù)據(jù)(clinical real world data,CRWD)得以累積及保存,基于現(xiàn)有的CRWD,將人工智能、數(shù)據(jù)挖掘技術(shù)用于探索EIDs 的預(yù)警研究成為可能。本研究以某一區(qū)域的傳染病為例,基于醫(yī)療全周期CRWD,以數(shù)據(jù)挖掘、自然語(yǔ)言處理、機(jī)器學(xué)習(xí)和智能交互等人工智能技術(shù)為核心,開發(fā)EIDs 檢測(cè)預(yù)警系統(tǒng),以期對(duì)傳染病暴發(fā)進(jìn)行早期探查、預(yù)警和快速反應(yīng),從而提高甄別傳染病疫情的敏感性。
系統(tǒng)的預(yù)警邏輯分為醫(yī)療智能診斷和流行病學(xué)分析兩個(gè)部分:醫(yī)療智能診斷模型根據(jù)就診患者的病情表述、檢驗(yàn)、檢查等數(shù)據(jù)快速計(jì)算該病歷為新發(fā)傳染病的概率;流行病學(xué)分析模型基于某段時(shí)間疑似新發(fā)傳染病患者數(shù)據(jù),綜合相關(guān)流行病學(xué)史信息,整體分析后給出預(yù)警結(jié)果,并針對(duì)傳播范圍和速度、傳播方式和影響、易感人群給出預(yù)測(cè)。在實(shí)現(xiàn)框架上,分為靜默監(jiān)控預(yù)警及主動(dòng)嗅探預(yù)警兩個(gè)部分。傳染病預(yù)警系統(tǒng)架構(gòu)見(jiàn)圖1。
1.1.1 診前數(shù)據(jù)收集 基于移動(dòng)端智能導(dǎo)診及智能預(yù)問(wèn)診系統(tǒng),通過(guò)智能人機(jī)對(duì)話方式,詢問(wèn)并主動(dòng)采集患者相關(guān)醫(yī)療數(shù)據(jù)。智能導(dǎo)診系統(tǒng)自動(dòng)采集基于人口學(xué)特征的患者主訴及病情數(shù)據(jù),包括住址、年齡、性別、癥狀等數(shù)據(jù);預(yù)問(wèn)診系統(tǒng)自動(dòng)采集患者的主訴、現(xiàn)病史、既往史等數(shù)據(jù)。
1.1.2 診中數(shù)據(jù)收集 基于智能診室機(jī)器人,主動(dòng)收集診中的以患者病情為中心的全部醫(yī)療數(shù)據(jù),包括電子病歷、檢查檢驗(yàn)、影像、病理、手術(shù)等數(shù)據(jù)。
1.1.3 診后數(shù)據(jù)收集 基于智能隨訪管理系統(tǒng),對(duì)院外患者進(jìn)行隨訪和跟蹤,自動(dòng)收集患者的病情變化、用藥、飲食等數(shù)據(jù),同時(shí)也對(duì)患者家屬或密切接觸者進(jìn)行跟蹤觀察。
1.1.4 醫(yī)療全周期CRWD 整理 對(duì)以上數(shù)據(jù)中非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行病歷文本結(jié)構(gòu)化處理,最終形成完整的、多維度的、基于時(shí)間軸的患者病情畫像。
假設(shè)每一種新發(fā)傳染病,都能找到相似同源,通過(guò)學(xué)習(xí)目前傳染病的已知特征,構(gòu)建醫(yī)療智能診斷模型來(lái)實(shí)現(xiàn)對(duì)輸入病情進(jìn)行預(yù)測(cè);假設(shè)某病歷為傳染病的概率向量:
P(i)=[p(dj,1),p(di,2),...p(di,j),...p(di,n)]。
其中p(di,j)表示:病歷i 疑似為已知傳染病的概率。j=0 時(shí),表示為傳染病。
1.2.1 傳染病智能診斷模型 基于人工智能學(xué)習(xí)醫(yī)療全周期CRWD,考慮時(shí)間空間維度特征,構(gòu)建傳染病智能診斷模型。該模型將貝葉斯模型和W&D 模型(wide &deep learning,W&D)進(jìn)行融合,首先將患者病情特征、知識(shí)圖譜數(shù)據(jù)映射為向量表示,其次基于歷史診斷行為進(jìn)行參數(shù)學(xué)習(xí),最后達(dá)到針對(duì)新輸入病情描述給出疑似疾病的概率。智能診斷模型示意圖見(jiàn)圖2。
圖2 傳染病智能診斷模型
①貝葉斯模型:
argmax P(di|x1,x2,...,xn)≈P(x1,x2,...,xn|di)*P(di)。
其中,argmax P(di|x1,x2,...,xn)表示,在病情特征x1,x2,...,xn的條件下,計(jì)算疾病di的概率,最大概率值對(duì)應(yīng)的疾病即為預(yù)測(cè)疾病。在系統(tǒng)實(shí)際應(yīng)用中,選擇最有可能的1~3 種疾病作為待融合結(jié)果。
②W&D 模型:
W&D 模型,結(jié)合淺層模型的記憶能力和深層模型的泛化優(yōu)勢(shì),進(jìn)行學(xué)習(xí)和推理,模型示意圖如下。
圖3 W&D 模型
1.2.2 傳染病知識(shí)圖譜 以權(quán)威文獻(xiàn)為基礎(chǔ),利用信息抽取、語(yǔ)義表示自然語(yǔ)言處理技術(shù),并以專家共識(shí)作為有效補(bǔ)充,搭建傳染病知識(shí)圖譜。傳染病知識(shí)圖譜包括病原微生物、傳染病流行病學(xué)特點(diǎn)、病程階段、臨床表現(xiàn)、檢驗(yàn)、檢查、治療及歷史上該傳染病事件相關(guān)內(nèi)容。
醫(yī)院上線系統(tǒng)以來(lái),可按照我國(guó)法定報(bào)告的甲、乙、丙3 類傳染病做特定篩選統(tǒng)計(jì),對(duì)相應(yīng)就診患者進(jìn)行動(dòng)態(tài)監(jiān)測(cè),同時(shí)通過(guò)靜默檢測(cè)預(yù)警結(jié)合主動(dòng)嗅探預(yù)警設(shè)置做傳染病的精準(zhǔn)預(yù)測(cè),幫助醫(yī)院及時(shí)準(zhǔn)確掌握傳染病患者就診情況,并做相應(yīng)準(zhǔn)備和預(yù)防工作。
靜默監(jiān)控預(yù)警是指在不影響醫(yī)生任何診療行為前提下,基于醫(yī)院每天自然產(chǎn)生的數(shù)據(jù)進(jìn)行預(yù)警。傳染病AI 預(yù)警引擎嵌入門診全系列系統(tǒng)中,在問(wèn)診過(guò)程中,實(shí)時(shí)聽取醫(yī)患問(wèn)診時(shí)的溝通對(duì)話,進(jìn)行語(yǔ)義分析與結(jié)構(gòu)化處理,通過(guò)流行病學(xué)分析模型及指定時(shí)間段的疑似數(shù)據(jù)綜合判斷,分析得出傳染病概率P>0.8時(shí),主動(dòng)提示醫(yī)生進(jìn)行預(yù)警分析,并將分析報(bào)告發(fā)給相應(yīng)專家復(fù)審、評(píng)估。同時(shí),針對(duì)監(jiān)控預(yù)警報(bào)告進(jìn)行日志可視化,重點(diǎn)病歷進(jìn)行標(biāo)注,上傳預(yù)警中心進(jìn)行分析展示。靜默檢測(cè)界面見(jiàn)圖4。
圖4 靜默監(jiān)測(cè)界面
主動(dòng)嗅探預(yù)警是指當(dāng)靜默監(jiān)控預(yù)警結(jié)論通過(guò)專家復(fù)審,啟動(dòng)流行病學(xué)信息采集器來(lái)采集更多臨床信息支持預(yù)警計(jì)算。該采集器會(huì)集成醫(yī)院搭建的智能導(dǎo)診系統(tǒng)、智能預(yù)問(wèn)診系統(tǒng)、診室聽譯機(jī)器人及診后隨訪系統(tǒng)數(shù)據(jù),針對(duì)具有疑似特征患者進(jìn)行深度詢問(wèn),主要體現(xiàn):導(dǎo)診、預(yù)問(wèn)診按照特定的流行病學(xué)史詢問(wèn)邏輯自動(dòng)采集數(shù)據(jù);門診輔助機(jī)器人智能引導(dǎo)醫(yī)生圍繞流行病學(xué)史進(jìn)行詢問(wèn),輔助醫(yī)生給患者開具相關(guān)檢驗(yàn)檢查,以供醫(yī)學(xué)診斷模型分析;診后隨訪系統(tǒng)針對(duì)疑似患者詢問(wèn)康復(fù)信息,詢問(wèn)密切接觸者的健康狀況等;匯總所有數(shù)據(jù)后,同步更新傳染病AI 預(yù)警模型分析模型的結(jié)果,輔助專家二次確認(rèn)。主動(dòng)嗅探觸發(fā)界面見(jiàn)圖5。
圖5 主動(dòng)嗅探觸發(fā)
針對(duì)靜默監(jiān)控系統(tǒng)日志與預(yù)警信息,通過(guò)監(jiān)控空間特征和時(shí)間特征,及時(shí)對(duì)傳染病進(jìn)行預(yù)警。系統(tǒng)預(yù)警記錄見(jiàn)圖6。
圖6 系統(tǒng)預(yù)警記錄
預(yù)警中心做出決策后,醫(yī)院、社區(qū)衛(wèi)生等機(jī)構(gòu),將聯(lián)系該患者進(jìn)行相應(yīng)的檢查、檢驗(yàn)。一旦確診,職能部門進(jìn)行傳染病上報(bào)。
傳染病預(yù)測(cè)通常分為定性預(yù)測(cè)、定量預(yù)測(cè)和綜合預(yù)測(cè),主要對(duì)傳染病進(jìn)行時(shí)空分布描述、發(fā)展變化趨勢(shì)描述。常用的分析方法有單一預(yù)警模型(時(shí)間模型[16]、空間模型[17])、組合預(yù)警模型(時(shí)空模型[18]、關(guān)聯(lián)模型(如癥狀-疾病關(guān)聯(lián)模型[19])、信息可視化展示[20]、區(qū)塊鏈技術(shù)應(yīng)用[21]、人工智能技術(shù)賦能[22]、物聯(lián)網(wǎng)增效[23]等。常用的是時(shí)間序列模型中的CUSUM 模型、AR1MA模型。如利用ARIMA 模型進(jìn)行某區(qū)域手足口病發(fā)病趨勢(shì)分析[24]、猩紅熱發(fā)病趨勢(shì)預(yù)測(cè)[25]、乙型肝炎發(fā)病率預(yù)測(cè)[26-27]等。
基于數(shù)據(jù)模型開展傳染病預(yù)警研究是近年來(lái)公共衛(wèi)生領(lǐng)域的研究熱點(diǎn),國(guó)內(nèi)外學(xué)者大多都以病歷、癥狀、互聯(lián)網(wǎng)大數(shù)據(jù)等作為監(jiān)測(cè)資料[28],利用統(tǒng)計(jì)學(xué)方法、數(shù)學(xué)方法或物理學(xué)法搭建模型,同時(shí)將新一代信息技術(shù)作為輔助方法用于完善模型的建立與運(yùn)行。結(jié)果顯示,現(xiàn)有國(guó)內(nèi)外研究對(duì)于傳統(tǒng)傳染病預(yù)警效果較好,但對(duì)于新發(fā)傳染病的預(yù)警效果欠佳,影響傳染病模型預(yù)警效果的主要原因可能:一是受數(shù)據(jù)及時(shí)性、準(zhǔn)確性和敏感性及數(shù)據(jù)類型局限性的影響,模型只能在單一傳染病預(yù)警中表現(xiàn)較好或在某一階段的傳染病預(yù)警中表現(xiàn)良好;二是數(shù)據(jù)格式的統(tǒng)一化程度會(huì)影響傳染病預(yù)警的準(zhǔn)確性。
本研究基于醫(yī)療全周期臨床真實(shí)世界數(shù)據(jù)建立的新發(fā)傳染病監(jiān)測(cè)預(yù)警系統(tǒng),一方面數(shù)據(jù)資料及時(shí)、全面、準(zhǔn)確、可用,另一方面基于數(shù)據(jù)挖掘技術(shù)的定性定量相結(jié)合的思路提高了EIDs 預(yù)警的及時(shí)性,提升了重大EIDs 的預(yù)警靈敏度,達(dá)到快速、及時(shí)、動(dòng)態(tài)監(jiān)測(cè)預(yù)警,對(duì)于提高疫情防控的效率和效果,使防控關(guān)口前移,具有重要意義。