王亦凡,李繼云
(東華大學(xué) 計算機(jī)科學(xué)與技術(shù)學(xué)院,上海 201620)
患者病案包括臨床中患者本人對自己健康狀況的描述以及醫(yī)療人員對患者的客觀檢查結(jié)果以及對患者的病情的分析、診療的記錄.通過比較患者病案的相似程度可以為醫(yī)生提供具有較高可信度的病案參考.隨著醫(yī)院和診所中的臨床病案數(shù)據(jù)的不斷積累,如何充分利用這些記錄是相當(dāng)重要的,許多研究使用臨床醫(yī)療病案來協(xié)助醫(yī)生進(jìn)行臨床決策和預(yù)后[1].
相似病案是包含相同臨床意義的醫(yī)療實(shí)體,具有相似屬性的病人的病案.目前,部分研究將相似病案衡量任務(wù)視作具有不同醫(yī)療實(shí)體的臨床文本多分類問題[2–4].部分研究通過提取病案中的隱藏信息并依據(jù)醫(yī)療代碼進(jìn)行對齊,以便衡量各個組成部分的距離[5],從而對相似病案進(jìn)行度量.這樣的度量有助于精準(zhǔn)醫(yī)療中不同種類的患者細(xì)分[6],作為醫(yī)生診療的參考.在本文中,我們將醫(yī)療實(shí)體定義為與患者治療相關(guān)的醫(yī)療專有名詞.如果某一患者病案中的兩個醫(yī)療實(shí)體共同出現(xiàn),我們就認(rèn)為這對醫(yī)療實(shí)體存在某種關(guān)系.我們利用基于異構(gòu)圖嵌入的方法來學(xué)習(xí)病案表示,通過計算患者病案表示的余弦相似度可以獲取相似病案.
以上的方法通過對患者病案中的醫(yī)療實(shí)體標(biāo)簽化或者根據(jù)醫(yī)療實(shí)體對應(yīng)的醫(yī)療代碼進(jìn)行距離度量,但它們丟失了患者病案中的細(xì)節(jié)信息.比如僅保留關(guān)鍵的疾病分類分期分型信息,而丟失了疾病分布位置以及發(fā)展情況這些判斷依據(jù).
醫(yī)療實(shí)體網(wǎng)絡(luò)研究中僅僅考慮了單一醫(yī)療實(shí)體的影響,忽略了同一醫(yī)療實(shí)體在不同患者病案場景下的含義可能不同的問題.在患者病案的場景中,病史中存在某種疾病(病史關(guān)系)和診療中發(fā)現(xiàn)某種疾病(病癥關(guān)系)是截然不同的情況,可能是長期存在某種病癥,也可能是疾病復(fù)發(fā)導(dǎo)致.
針對同一醫(yī)療實(shí)體在不同患者病案場景下具有不同含義這一問題,本文提出構(gòu)建基于醫(yī)療實(shí)體和實(shí)體關(guān)系的患者病案異構(gòu)圖嵌入模型.通過學(xué)習(xí)醫(yī)療實(shí)體及其不同類別的關(guān)系表示,提升相似病案的推薦效果.
網(wǎng)絡(luò)結(jié)構(gòu)一般包括諸多節(jié)點(diǎn)和邊,用于反映事物之間的復(fù)雜關(guān)系.采用圖嵌入的目的是為了學(xué)習(xí)網(wǎng)絡(luò)中高維向量的低維表示,圖嵌入學(xué)習(xí)主要應(yīng)用于節(jié)點(diǎn)分類和推薦算法等任務(wù)中.網(wǎng)絡(luò)表示學(xué)習(xí)采用低維向量表示網(wǎng)絡(luò)中的節(jié)點(diǎn),盡可能地學(xué)習(xí)網(wǎng)絡(luò)中的潛在信息.傳統(tǒng)的網(wǎng)絡(luò)表示學(xué)習(xí)算法主要關(guān)注于網(wǎng)絡(luò)的結(jié)構(gòu)信息.相關(guān)研究工作包括:DeepWalk[7]使用隨機(jī)游走來學(xué)習(xí)潛在的嵌入,將Word2Vec 算法應(yīng)用于圖中.Node2vec[8]采用通過隨機(jī)游走實(shí)現(xiàn)深度遍歷和廣度遍歷之間的平衡.LINE (Large-scale Information Network Embedding,大規(guī)模信息網(wǎng)絡(luò)嵌入)[9]定義了二階相似度來保持圖的結(jié)構(gòu).GF (Graph Factorization,圖因式分解)[10]將結(jié)點(diǎn)內(nèi)積視作邊權(quán)來優(yōu)化節(jié)點(diǎn)向量,達(dá)到降維的效果.Struc2vec[11]考慮空間結(jié)構(gòu)的相似性.雖然這些算法一步步地完善節(jié)點(diǎn)的潛在結(jié)構(gòu)表示,但僅僅利用網(wǎng)絡(luò)中的結(jié)構(gòu)特點(diǎn),學(xué)習(xí)到表示向量缺乏對下游任務(wù)的支持與擴(kuò)展.圖嵌入學(xué)習(xí)的結(jié)果對下游任務(wù)的效果有較大的影響.現(xiàn)實(shí)世界中廣泛存在著異構(gòu)的網(wǎng)絡(luò),包括不同類型的節(jié)點(diǎn)或不同類型的邊.充分利用這些異構(gòu)信息有助于提高表示向量的表征能力.
目前基于異構(gòu)網(wǎng)絡(luò)的算法主要包括基于矩陣分解的方法以及基于神經(jīng)網(wǎng)絡(luò)的方法.CMF (Coordinate Matrix Factorization,坐標(biāo)矩陣分解)[12]通過矩陣分解獲取實(shí)體與類別之間的潛在聯(lián)系,構(gòu)建更多關(guān)系矩陣.KGCN (Knowledge Graph Convolutional Networks,知識圖卷積網(wǎng)絡(luò))[13]通過圖卷積神經(jīng)網(wǎng)絡(luò)對物品之間的不同關(guān)系進(jìn)行建模,提高推薦的多樣性.目前異構(gòu)圖的研究主要著眼于不同類型節(jié)點(diǎn)或者不同類型的邊,同時考慮它們的研究較少.
多數(shù)生物醫(yī)學(xué)網(wǎng)絡(luò)上的圖嵌入學(xué)習(xí)都著眼于藥物[14],蛋白質(zhì)和疾病之間的關(guān)聯(lián).在生物醫(yī)學(xué)領(lǐng)域內(nèi)的圖嵌入研究目前主要基于同種類型的關(guān)系.GameNet[14]將藥物相互作用知識和患者醫(yī)療記錄進(jìn)行融合,實(shí)現(xiàn)對藥物組合的推薦.實(shí)際上,醫(yī)療領(lǐng)域內(nèi)醫(yī)療實(shí)體存在不同類型的關(guān)系,而同構(gòu)網(wǎng)絡(luò)學(xué)習(xí)算法不可以直接應(yīng)用于這樣的圖網(wǎng)絡(luò)中.因此,將患者病案引入醫(yī)療網(wǎng)絡(luò),將患者病案與醫(yī)療實(shí)體的不同關(guān)系作為補(bǔ)充信息,可以提升患者病案推薦的效果.
病案數(shù)據(jù)是我國主要的臨床醫(yī)療數(shù)據(jù)之一.基于醫(yī)療數(shù)據(jù)的相似性比較是醫(yī)療數(shù)據(jù)的預(yù)測以及預(yù)測建模中的研究方向之一[1].SimSVM[2]使用與新患者相似的臨床記錄對化療后的患者的生存情況進(jìn)行分類.標(biāo)準(zhǔn)醫(yī)療編碼如ICD-10 可以用于概念層次的相似度比較,醫(yī)療概念層次模型可以應(yīng)用于判斷住院天數(shù)是否長期,并且針對不同年齡層次進(jìn)行住院天數(shù)的細(xì)分[3].在獲取了相似醫(yī)療數(shù)據(jù)后,醫(yī)生就可以進(jìn)行病程的比較,也有助于預(yù)測和推理等下游任務(wù)[15].雖然這些方法都是基于臨床的診療過程進(jìn)行研究,但是診療過程中由于臨床中存在事件的先后次序,因此數(shù)據(jù)之間存在著依賴關(guān)系,需要考慮此種關(guān)系的影響.
本文將相似度比較按照數(shù)據(jù)抽取及建模方法分為如表1所示的3 種類型,從醫(yī)療數(shù)據(jù)中提取特征,對醫(yī)療數(shù)據(jù)進(jìn)行距離度量或者學(xué)習(xí)醫(yī)療數(shù)據(jù)的表示.PSF (Patient Similarity evaluation Framework,患者相似度評估框架)提出了具有臨床意義的患者距離評價方法,并將有監(jiān)督方法和無監(jiān)督方法進(jìn)行融合來評判心力衰竭診斷的結(jié)果[16].PSDML (Patient Similarity Measuring using Deep Metric Learning,基于深度度量學(xué)習(xí)的患者相似度比較)利用ICD-10 編碼來優(yōu)化腦卒中疾病的監(jiān)督距離,并進(jìn)行kNN (k-Nearest Neighbor,k 最近鄰)分類[17].卷積神經(jīng)網(wǎng)絡(luò)可以用于學(xué)習(xí)患者臨床記錄表示[18].
表1 醫(yī)療數(shù)據(jù)相似性比較框架
盡管這些方法在各自的疾病領(lǐng)域內(nèi)具有較大的提升.然而這些方法需要對不同領(lǐng)域疾病進(jìn)行不同處理[19],并且忽略了現(xiàn)實(shí)世界中醫(yī)療數(shù)據(jù)的依賴性,需要我們對實(shí)體之間的復(fù)雜關(guān)系進(jìn)行建模,學(xué)習(xí)高維數(shù)據(jù)的表示.
為了準(zhǔn)確描述面向診療過程的患者病案表示問題,我們對以下概念進(jìn)行定義.
定義1.患者病案:對于患者,患者病案可以定義為醫(yī)療實(shí)體以及其關(guān)系的集合Pi=
定義2.醫(yī)療實(shí)體:患者病案中存在的具有臨床診療意義的醫(yī)療術(shù)語視作一個醫(yī)療實(shí)體.
定義3.醫(yī)療實(shí)體的關(guān)系:給定患者病案Pi的病案,假設(shè)存在T={t1,t2,···,tk}代表病案與醫(yī)療實(shí)體的關(guān)系類型,若存在醫(yī)療實(shí)體e,那么該病案與e存在二元關(guān)系t=(Pi,e),t∈T.
根據(jù)以上概念,可以構(gòu)建醫(yī)療實(shí)體網(wǎng)絡(luò),采用圖嵌入算法對醫(yī)療實(shí)體及其關(guān)系進(jìn)行建模,得到患者病案的低維向量表示,患者病案相似度可以根據(jù)患者病案表示計算得到.
定義4.患者病案相似度:給定一個患者病案Pi,可以通過計算其余患者病案表示和患者病案Pi的余弦相似度,得出該患者病案和其余患者病案的相似度分?jǐn)?shù)列表Si={si,1,si,2,···si,i?1,si,i+1···},其中si,1代表患者病案Pi和患者病案P1的余弦相似度,Si代表患者病案Pi對應(yīng)的余弦相似度分?jǐn)?shù)集合.
針對同一醫(yī)療實(shí)體在不同患者病案場景下具有不同含義這一問題,本文在關(guān)系建模中引入病案節(jié)點(diǎn),將病案節(jié)點(diǎn)與臨床醫(yī)療實(shí)體節(jié)點(diǎn)劃分為二部圖,構(gòu)建基于醫(yī)療實(shí)體和實(shí)體關(guān)系的患者病案異構(gòu)圖嵌入模型,如圖1所示.
圖1 基于隨機(jī)游走的病案表示學(xué)習(xí)
本文將患者病案的表示視作醫(yī)療實(shí)體經(jīng)過某種融合函數(shù)的結(jié)果,由于每個醫(yī)療實(shí)體包含了一個節(jié)點(diǎn)信息(醫(yī)療實(shí)體)和一些帶有類型屬性的邊(醫(yī)療實(shí)體關(guān)系),我們需要學(xué)習(xí)醫(yī)療實(shí)體及其關(guān)系的表示.
醫(yī)療實(shí)體表示可以通過構(gòu)建醫(yī)療實(shí)體的共現(xiàn)來獲取.如圖1(a)圖所示,對于存在于同一病案的不同醫(yī)療實(shí)體,我們將他們視作共現(xiàn),病案中每個醫(yī)療實(shí)體兩兩之間包含了共現(xiàn)關(guān)系,可以構(gòu)建出醫(yī)療實(shí)體網(wǎng)絡(luò),如圖1(b)所示.通過隨機(jī)游走的方法獲取醫(yī)療實(shí)體的序列,采用skip-gram 進(jìn)行更新,可以獲得醫(yī)療實(shí)體的表示,如圖1(c)下圖所示.在實(shí)際醫(yī)療場景中,醫(yī)療實(shí)體存在不同含義,本文把不受醫(yī)療場景影響的實(shí)體表示記為醫(yī)療實(shí)體的公共表示,而受到其影響的實(shí)體表示記為基于關(guān)系的實(shí)體表示.為了建模這種醫(yī)療實(shí)體與患者病案的關(guān)系,本文在圖中引入了患者病案節(jié)點(diǎn).
引入病案節(jié)點(diǎn)后,病案與醫(yī)療實(shí)體構(gòu)成的醫(yī)療網(wǎng)絡(luò)變?yōu)楫悩?gòu)圖網(wǎng)絡(luò),包含異構(gòu)的節(jié)點(diǎn),即病案節(jié)點(diǎn)與醫(yī)療實(shí)體節(jié)點(diǎn)類型不同,以及異構(gòu)的邊,即兩種節(jié)點(diǎn)之間可以通過不同的關(guān)系連接.醫(yī)療實(shí)體與患者病案的關(guān)系類型不同,我們可以分別為每個關(guān)系類型學(xué)習(xí)一個表示,如圖1(c)上圖所示.關(guān)系之間并不是完全獨(dú)立的,因此需要對相互之間的影響進(jìn)行建模.
對于每個醫(yī)療實(shí)體,為每種類型的關(guān)系提出一個公共表示和基于關(guān)系的表示,如式(1)所示.其中ei,e代表醫(yī)療實(shí)體的公共表示,ei,r代表醫(yī)療實(shí)體關(guān)系的表示.
醫(yī)療實(shí)體的公共表示不受醫(yī)療實(shí)體關(guān)系的類別變化的影響.在異構(gòu)邊條件下,需要分別對醫(yī)療實(shí)體的關(guān)系表示進(jìn)行學(xué)習(xí),通過聚合鄰居節(jié)點(diǎn)獲取關(guān)系t下的醫(yī)療實(shí)體表示,經(jīng)過k次聚合后,此時對應(yīng)的醫(yī)療實(shí)體表示如式(2)所示.
其中,j代表相鄰的節(jié)點(diǎn),N是相鄰節(jié)點(diǎn)的個數(shù),σ是激活函數(shù),ωk是需要訓(xùn)練的參數(shù).由于我們不知道醫(yī)療實(shí)體關(guān)系的聯(lián)系,利用self-attention 建模不同醫(yī)療實(shí)體關(guān)系之間的權(quán)重,依據(jù)上述公式,醫(yī)療實(shí)體ei基于關(guān)系的表示如式(3)所示.
其中,t為醫(yī)療實(shí)體的關(guān)系類型.對于任意t類型,隨機(jī)游走序列中的節(jié)點(diǎn)e,假設(shè)它的位置為i,我們將ei?b,···,ei?1,ei+1,···,ei+b視作它的鄰居節(jié)點(diǎn).其中,b是窗口大小的一半.
為了建模異構(gòu)的病案節(jié)點(diǎn)和醫(yī)療實(shí)體節(jié)點(diǎn),我們預(yù)先設(shè)置序列的隨機(jī)游走模式,比如醫(yī)療實(shí)體-病案-醫(yī)療實(shí)體,獲取隨機(jī)游走的轉(zhuǎn)移概率.因此,給定醫(yī)療實(shí)體的序列,我們的目標(biāo)是最小化如式(4)所示的目標(biāo)函數(shù).
對于每一個邊,如式(5)所示,由醫(yī)療實(shí)體ei生成醫(yī)療實(shí)體ej的條件概率可利用Softmax 函數(shù)獲得.
其中,e′是醫(yī)療實(shí)體上下文的向量表示.最后,通過負(fù)采樣來近似目標(biāo)函數(shù),如式(6)所示.
其中,σ是Sigmoid 函數(shù),可以表示成σ(x)=1/(1+exp(?x))的形式.
由于我們的模型是基于隨機(jī)游走的方法,假設(shè)我們有T個關(guān)系類型的子網(wǎng)絡(luò)和E個節(jié)點(diǎn),模型的時間復(fù)雜度為O (TE).模型的內(nèi)存復(fù)雜度是O ((d+dt·T)·E).
最終我們從醫(yī)療網(wǎng)絡(luò)中可獲取醫(yī)療實(shí)體節(jié)點(diǎn)和患者病案節(jié)點(diǎn)兩類節(jié)點(diǎn)的表示.患者病案表示對病案中所有醫(yī)療實(shí)體的節(jié)點(diǎn)表示經(jīng)過算術(shù)平均或者加權(quán)平均計算獲取.如果直接采取患者病案節(jié)點(diǎn)作為患者病案的表示會丟失醫(yī)療實(shí)體之間的共現(xiàn)信息.此外,采用這種方式,我們不僅可以獲取患者病案的全局表示,還可以根據(jù)不同的醫(yī)療實(shí)體關(guān)系獲取不同醫(yī)療場景下的患者病案表示.由于患者病案是不定長的醫(yī)療實(shí)體集合.通過融合函數(shù)對不同醫(yī)療實(shí)體表示進(jìn)行處理,便可以獲取同一維度的患者病案.通過醫(yī)療實(shí)體獲取患者病案表示的公式如式(7)所示.
其中,g函數(shù)可以為簡單算數(shù)平均或者加權(quán)平均函數(shù).給定一個患者病案Pi,推薦任務(wù)的目標(biāo)是推薦給醫(yī)生個有序的病案列表.為了完成這個任務(wù),對于患者病案Pi以外的患者病案均計算出一個分?jǐn)?shù),這個分?jǐn)?shù)值是衡量患者病案Pi,和其他患者病案之間的相似度.最后將相似病案推薦給當(dāng)前的患者.患者病案之間的相似度分?jǐn)?shù)定義如式(8)所示.
最后,根據(jù)相似性分?jǐn)?shù)的相對大小排序,就實(shí)現(xiàn)了基于患者病案表示的相似病案推薦.
圖2 病案表示的建模流程
本節(jié)主要介紹實(shí)驗(yàn),包括實(shí)驗(yàn)的數(shù)據(jù)集、評測指標(biāo)、實(shí)驗(yàn)結(jié)果以及結(jié)果分析等多個方面的內(nèi)容.將未考慮醫(yī)療實(shí)體關(guān)系類型的圖嵌入算法和所提出的方法進(jìn)行對比.選取圖嵌入算法中具有代表性的方法,包括基于隨機(jī)游走的DeepWalk 算法、基于矩陣因式分解的GF 算法以及基于神經(jīng)網(wǎng)絡(luò)的LINE 算法.
圖2展示了本文提出的患者病案表示方法的建模主要流程.首先,確定醫(yī)療實(shí)體的標(biāo)注標(biāo)準(zhǔn)并進(jìn)行人工標(biāo)注.使用Bi-LSTM-CRF 模型對數(shù)據(jù)集進(jìn)行訓(xùn)練,以便從病案中提取醫(yī)療實(shí)體.其次,通過圖嵌入算法學(xué)習(xí)患者病案對應(yīng)的不同種醫(yī)療實(shí)體關(guān)系以及學(xué)習(xí)不同關(guān)系的相互作用.最后,將病案中醫(yī)療實(shí)體列表經(jīng)過融合函數(shù)作為患者病案表示.
本文的患者病案數(shù)據(jù)是來自于某三甲醫(yī)院的真實(shí)世界數(shù)據(jù).由于真實(shí)世界數(shù)據(jù)并非為了研究而特意收集,存在大量的冗余以及缺失的字段,存在完整性問題,并且難以獲取結(jié)構(gòu)化的數(shù)據(jù)信息,醫(yī)療場景下的患者病案存在大量的醫(yī)療術(shù)語,并且患者病案的表述因人而異.
目前國內(nèi)針對患者病案尚沒有通用的框架,難以適應(yīng)不同源的數(shù)據(jù).我們采用命名實(shí)體識別技術(shù)對患者病案進(jìn)行信息抽取,便于從自由醫(yī)療文本中獲取醫(yī)療實(shí)體以及其關(guān)系.原始醫(yī)療數(shù)據(jù)消除敏感性信息后,如表2所示.經(jīng)過Bi-LSTM-CRF 模型的訓(xùn)練后,能夠自動獲取病案中的醫(yī)療實(shí)體信息.表2中加粗字段為輸出對應(yīng)的醫(yī)療實(shí)體.
表2 患者病案樣例
首先通過關(guān)鍵字從數(shù)據(jù)中選取乳腺疾病的患者.經(jīng)過人工標(biāo)注,數(shù)據(jù)集中包含1002 個患者以及285 146個醫(yī)療實(shí)體.將其中80% 的數(shù)據(jù)作為訓(xùn)練集,20%的數(shù)據(jù)作為測試集,并設(shè)計了如表3所示的醫(yī)療實(shí)體分類.
表3 醫(yī)療實(shí)體分類
患者最終的臨床診斷可以用來評價患者表示學(xué)習(xí)模型的效果.根據(jù)出院的診療結(jié)果以及病理結(jié)果將患者分類.遵循乳腺疾病發(fā)展規(guī)律,依據(jù)診斷的嚴(yán)重程度進(jìn)行劃分.對于患者病案,本文在實(shí)驗(yàn)中使用ROC 和F1 作為相似任務(wù)中常用的評價標(biāo)準(zhǔn).值越高,相似病案的推薦效果更好.本文采用DeepWalk 作為基準(zhǔn)方法,實(shí)驗(yàn)結(jié)果如表4所示.
表4 患者表示學(xué)習(xí)結(jié)果
從實(shí)驗(yàn)結(jié)果可以看出我們的方法對于患者相似度衡量的結(jié)果優(yōu)于現(xiàn)有的算法,證明了該方法的有效性.
患者病案表示模型中實(shí)驗(yàn)參數(shù)對實(shí)驗(yàn)結(jié)果有重要的影響,因而需要對參數(shù)敏感度進(jìn)行分析.本文同時對于向量維度、隨機(jī)游走步數(shù)、類型維度對實(shí)驗(yàn)結(jié)果的影響進(jìn)行探討,并對實(shí)驗(yàn)結(jié)果的可能因素進(jìn)行分析,實(shí)驗(yàn)結(jié)果如圖3所示.
從圖3中可以看出選擇的參數(shù)均對結(jié)果有一定的影響.患者病案表示模型基于隨機(jī)游走,因此需要充分考慮對于隨機(jī)游走過程中的步長和步數(shù),這里本文選取20 作為步長和10 作為步數(shù).步數(shù)是對一個節(jié)點(diǎn)的不同鄰居進(jìn)行反復(fù)學(xué)習(xí)的數(shù)目,進(jìn)而獲取完整的節(jié)點(diǎn)信息,如果節(jié)點(diǎn)較為稀疏或造成一定的過度學(xué)習(xí).一般來說,步長越長,可以學(xué)習(xí)到更遠(yuǎn)的結(jié)構(gòu)信息,從而把握全局的結(jié)構(gòu).在實(shí)際中,遠(yuǎn)處鄰居對節(jié)點(diǎn)表示影響不大,所以步長不宜設(shè)置過大.由于更大的維度可以容納更多的信息,起初隨著維度的增大可以產(chǎn)生更好的結(jié)果.但是當(dāng)維度到達(dá)某一階段后,對于結(jié)果產(chǎn)生了負(fù)面的影響,這可能是由于高維信息增加了模型的復(fù)雜度,并且考慮到高維信息會導(dǎo)致下游任務(wù)耗費(fèi)更多時間,因此選擇100 維作為表示維度.對于類型維度而言,本文設(shè)置其大小為30,增加外部類型信息可以擴(kuò)充信息量,進(jìn)而提高模型的準(zhǔn)確率.但類型維度過高會造成對于補(bǔ)充信息的過分依賴,反而忽視了原本的主要表示信息.
圖3 參數(shù)敏感性
本文提出了一種面向醫(yī)生的患者病案推薦算法,通過在醫(yī)療實(shí)體網(wǎng)絡(luò)引入患者病案節(jié)點(diǎn),將患者病案對應(yīng)的不同種醫(yī)療實(shí)體關(guān)系進(jìn)行建模,通過異構(gòu)圖嵌入方法獲取了在患者病案相似度衡量中更為優(yōu)越的病案表示,最大程度地利用了數(shù)據(jù)當(dāng)中的信息,并基于此實(shí)現(xiàn)了患者病案推薦.本方法在各個評價指標(biāo)上均有上升.在真實(shí)世界中,由于醫(yī)療實(shí)體的數(shù)目繁多,難以全部涵蓋于模型中,因此存在冷啟動的問題.下一步,將會考慮利用時間因素進(jìn)行建模,對患者入院后的醫(yī)生的每個診斷后進(jìn)行在線學(xué)習(xí),提高實(shí)時性能.