亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        循環(huán)神經(jīng)網(wǎng)絡(luò)模型在腹膜透析臨床預(yù)后預(yù)測(cè)中的初步應(yīng)用

        2019-06-18 10:25:40高峻逸馬辛宇張超賀馬連韜王亞沙
        關(guān)鍵詞:腹膜預(yù)測(cè)模型

        唐 雯, 高峻逸, 馬辛宇,3, 張超賀, 馬連韜,3, 王亞沙,4△

        (1. 北京大學(xué)第三醫(yī)院腎內(nèi)科, 北京 100191; 2. 北京大學(xué)高可信軟件技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室, 北京 100871; 3. 北京大學(xué)信息科學(xué)技術(shù)學(xué)院, 北京 100871; 4. 北京大學(xué)軟件工程國家工程研究中心, 北京 100871)

        腹膜透析是終末期腎病的重要替代治療手段,作為居家治療的替代治療方式,具有較好的成本效益比,在國內(nèi)外得到了廣泛應(yīng)用[1]。但進(jìn)行腹膜透析治療的終末期腎病患者病情復(fù)雜,常合并多種合并癥和并發(fā)癥,需要專業(yè)醫(yī)護(hù)人員長期持續(xù)的照顧。在治療和管理腹膜透析患者的過程中,需要根據(jù)患者隨訪過程中的各種變化因素,全面合理地進(jìn)行病情評(píng)估,并據(jù)此給予具有針對(duì)性的個(gè)體化治療方案。

        隨著醫(yī)療信息化程度的不斷深入,各個(gè)醫(yī)院已經(jīng)積累了與患者健康相關(guān)的大量數(shù)據(jù)?;谶@些數(shù)據(jù)進(jìn)行分析和挖掘,建立患者預(yù)后預(yù)測(cè)模型成為近年來醫(yī)學(xué)與信息學(xué)交叉研究的熱點(diǎn)方向[2]。目前對(duì)于腹膜透析患者的預(yù)后預(yù)測(cè)研究多為基于基線數(shù)據(jù)的統(tǒng)計(jì)學(xué)回歸分析模型,該模型由于難以描述患者隊(duì)列數(shù)據(jù)中的徑向關(guān)系,且難以捕捉數(shù)據(jù)之間復(fù)雜的非線性關(guān)系,而使其性能受限。

        近年來,數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)技術(shù)蓬勃發(fā)展,特別是深度學(xué)習(xí)模型因其在計(jì)算機(jī)視覺、語音識(shí)別、自然語言處理、人機(jī)博弈等領(lǐng)域取得的顯著應(yīng)用效果而獲得了廣泛關(guān)注[3]。一些學(xué)者嘗試將深度學(xué)習(xí)應(yīng)用于醫(yī)療數(shù)據(jù)分析中,并在疾病自動(dòng)診斷[4-5]、相似病人檢索、醫(yī)學(xué)影像數(shù)據(jù)分析[6]等方面獲得了長足的進(jìn)展。循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)及其變體門控循環(huán)單元(gated recurrent unit,GRU)作為典型的深度學(xué)習(xí)模型,可以靈活地處理變長時(shí)序數(shù)據(jù),挖掘數(shù)據(jù)中深層的非線性關(guān)系,抽取數(shù)據(jù)中隱藏的模式,很適合腹膜透析患者的隊(duì)列數(shù)據(jù)分析場(chǎng)景,較之回歸分析模型可能會(huì)產(chǎn)生更加優(yōu)越的預(yù)后預(yù)測(cè)性能。目前,尚未見基于循環(huán)神經(jīng)網(wǎng)絡(luò)的腹膜透析臨床預(yù)后預(yù)測(cè)研究,因此,本研究基于北京大學(xué)第三醫(yī)院腹膜透析門診的常規(guī)診療數(shù)據(jù),構(gòu)建死亡風(fēng)險(xiǎn)預(yù)測(cè)模型,并與傳統(tǒng)邏輯回歸(Logistic regression,LR)模型進(jìn)行性能比較,初步探討人工智能預(yù)后模型的相關(guān)發(fā)現(xiàn)。

        1 資料與方法

        1.1 資料來源

        本研究納入2006年1月至2018年1月在北京大學(xué)第三醫(yī)院腎內(nèi)科腹膜透析門診長期隨訪的腹膜透析患者共計(jì)1 118人(數(shù)據(jù)處理篩選后656人),所有患者隨訪截止至2018年10月31日。所有研究資料來自北京大學(xué)第三醫(yī)院腹膜透析門診的常規(guī)診療數(shù)據(jù),數(shù)據(jù)包括患者在開始透析時(shí)的基線數(shù)據(jù)、隨訪數(shù)據(jù)和預(yù)后數(shù)據(jù)。

        基線數(shù)據(jù)包括患者的人口學(xué)資料、腎臟病原發(fā)病、在透析開始時(shí)的合并癥狀況(糖尿病、心力衰竭、肺部感染、冠心病、心肌梗死、腦出血、腦梗塞、截肢病史等),以及透析開始時(shí)的血壓、化驗(yàn)檢查(血肌酐、血尿素、血紅蛋白、血白蛋白、血鈣、血磷、甲狀旁腺激素等)信息。

        隨訪數(shù)據(jù)包括在治療過程中患者隨訪檢查的化驗(yàn)數(shù)據(jù)(血常規(guī)、腎功能、血白蛋白、電解質(zhì)、血鈣、血磷、血甲狀旁腺激素、血糖、肝功能、血尿酸)、體重、血壓等指標(biāo),以及患者在隨訪過程中所出現(xiàn)的各種急、慢性合并癥。

        預(yù)后數(shù)據(jù)指患者在隨訪結(jié)束時(shí)的狀態(tài)及時(shí)間,包括死亡及死亡原因(排除非正常死亡,即經(jīng)濟(jì)原因放棄治療或自殺患者)、轉(zhuǎn)血液透析及其原因、腎移植、存活、轉(zhuǎn)其他腹膜透析中心或失訪。

        按照醫(yī)學(xué)指標(biāo)(下稱特征)所衡量的患者的不同身體情況,對(duì)所有用于本次研究的數(shù)據(jù)特征進(jìn)行分類,詳情如表1所示。

        表1 腹膜透析相關(guān)醫(yī)療特征Table 1 Clinical features of peritoneal dialysis

        WBC, white blood cell; Hb, hemoglobin; ALB, albumin; Cr, creatinine; K, blood potassium; Na, blood sodium; Cl, blood chlorine; CO2CP, carbon-dioxide combining power; Glu, blood glucose; hs-CRP, high-sensitivity C-reactive protein; Ca, blood calcium; P, blood phosphorus; iPTH, intact parathyroid hormone.

        1.2 研究結(jié)局與預(yù)測(cè)變量

        本研究的結(jié)局變量為腹膜透析患者在數(shù)據(jù)記錄時(shí)刻的死亡風(fēng)險(xiǎn)狀態(tài)(riskt),模型的預(yù)測(cè)結(jié)果為患者在相應(yīng)時(shí)刻的死亡風(fēng)險(xiǎn)(概率)。利用在第1.1小節(jié)中提到的患者所有歷次的數(shù)據(jù)記錄對(duì)死亡風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè)。具體而言,將歷次隨訪數(shù)據(jù)合并為數(shù)條時(shí)間記錄序列(record1,record2,…,recordt),而預(yù)后數(shù)據(jù)主要用于提供患者的身體狀況信息,用于計(jì)算結(jié)局變量。

        對(duì)預(yù)后信息的處理如圖1,對(duì)觀察窗口內(nèi)死亡患者,取死亡時(shí)間之前一年內(nèi)時(shí)間段就診為高死亡風(fēng)險(xiǎn)狀態(tài),記結(jié)局變量riskt=1;兩年之前為低死亡風(fēng)險(xiǎn)狀態(tài),記結(jié)局變量riskt=0;中間為死亡風(fēng)險(xiǎn)不確定狀態(tài),記結(jié)局變量riskt=uncertain。對(duì)觀察窗口內(nèi)存活患者,將觀察窗口截止處一年內(nèi)設(shè)為不確定狀態(tài),一年以前記錄全部設(shè)為低風(fēng)險(xiǎn)狀態(tài)。

        綜上,本研究綜合考慮了base,record1,record2, …,recordt的信息并對(duì)riskt給出了一個(gè)概率性的預(yù)測(cè)。

        1.3 數(shù)據(jù)納入、排除與補(bǔ)全標(biāo)準(zhǔn)

        本研究排除了在某項(xiàng)特征或指標(biāo)下沒有數(shù)據(jù)記錄的所有患者,且只選取出現(xiàn)于至少60%患者中的特征納入預(yù)測(cè)模型。對(duì)記錄中的缺失值,用該特征缺失時(shí)間點(diǎn)之前最近的數(shù)據(jù)進(jìn)行補(bǔ)全。

        圖1 健康風(fēng)險(xiǎn)狀態(tài)標(biāo)簽的定義Figure 1 Definition of health risk labels

        1.4 預(yù)測(cè)模型

        其中,函數(shù)σ為激活函數(shù)。已知當(dāng)前時(shí)間戳下的真實(shí)死亡風(fēng)險(xiǎn)為riskt,則定義交叉熵?fù)p失函數(shù)為:

        圖2 循環(huán)神經(jīng)網(wǎng)絡(luò)模型Figure 2 Recurrent neural network

        1.4.2門控循環(huán)單元 門控循環(huán)單元(gated recurrent unit,GRU)是RNN的一種變體[8],其大體時(shí)序信息傳播結(jié)構(gòu)與RNN模型相似(圖3)。σ和tanh分別為神經(jīng)網(wǎng)絡(luò)中sigmoid和tanh非線性激活函數(shù),符號(hào)“×”和“+”指代矩陣的元素積和矩陣加法。GRU模型和RNN模型的區(qū)別在于其每個(gè)時(shí)間節(jié)點(diǎn)t下的處理更為復(fù)雜,對(duì)上一時(shí)間戳的狀態(tài)ht-1,GRU會(huì)選擇性地通過“更新門”和“重置門”機(jī)制對(duì)其保留和遺忘,即分別對(duì)應(yīng)圖中的zt和rt。而在醫(yī)療時(shí)序數(shù)據(jù)分析預(yù)測(cè)中,數(shù)據(jù)的長時(shí)間依賴對(duì)當(dāng)前時(shí)間預(yù)測(cè)很重要,而傳統(tǒng)RNN在處理時(shí)序數(shù)據(jù)時(shí),無法很好地抽取長時(shí)間間距之間信息的相關(guān)信息,GRU的“更新門”和“重置門”機(jī)制很好地解決了這一問題。具體而言,GRU對(duì)于每一個(gè)時(shí)間戳下的輸入向量recordt,結(jié)合節(jié)點(diǎn)狀態(tài)向量ht-1,計(jì)算更新門與重置門,更新門的值越大則模型將會(huì)利用更多新時(shí)刻的信息,重置門的值越大則保留更多歷史信息:

        圖3 基于時(shí)序數(shù)據(jù)進(jìn)行分類的門控循環(huán)單元Figure 3 Gated recurrent unit, which is used to perform classification based on time series data

        模型中的sigmoid函數(shù)即體現(xiàn)了最終輸出概率與輸入之間的非線性關(guān)系。同樣采用交叉熵?fù)p失函數(shù)來衡量損失,并采用隨機(jī)梯度下降的方式最小化損失,從而計(jì)算得到模型所需的最優(yōu)參數(shù)W和b。值得一提的是,LR模型無法考慮時(shí)間這一因素帶來的影響,而是單純從每個(gè)數(shù)據(jù)本身挖掘其背后的特征和意義。因?yàn)長R模型無法處理時(shí)間序列,本研究將患者就診記錄序列中的每次就診數(shù)據(jù)獨(dú)立地輸入LR模型中,每次就診記錄中包含的數(shù)據(jù)類型與RNN和GRU模型相同。某種程度上講,前文提及的RNN和GRU模型納入的信息相較于LR而言是更全面的。

        1.5 統(tǒng)計(jì)分析

        本研究采用十折交叉驗(yàn)證的方式對(duì)模型的超參數(shù)進(jìn)行調(diào)整,并使用獨(dú)立驗(yàn)證集進(jìn)行性能測(cè)試。其中,測(cè)試集在全部患者集合中隨機(jī)選取50位。在訓(xùn)練集中利用GRU建立預(yù)測(cè)模型,在測(cè)試集中主要采用了受試者工作特征(receiver operation characteristic,ROC)曲線下面積(area under the ROC curve,AUROC)、召回率(recall)、F1分?jǐn)?shù)(F1-score)三個(gè)指標(biāo)來衡量模型對(duì)患者死亡風(fēng)險(xiǎn)的預(yù)測(cè)情況。其中,召回率在統(tǒng)計(jì)學(xué)上指所有預(yù)測(cè)為正樣本中預(yù)測(cè)正確的比率,F(xiàn)1分?jǐn)?shù)則指預(yù)測(cè)精確率和召回率的調(diào)和平均值。通過對(duì)比這三個(gè)指標(biāo),可以很容易地對(duì)不同模型的預(yù)測(cè)能力進(jìn)行評(píng)估。

        2 結(jié)果

        2.1 腹膜透析患者數(shù)據(jù)集基本統(tǒng)計(jì)特征

        經(jīng)過數(shù)據(jù)清洗、補(bǔ)全等預(yù)處理,本研究使用的數(shù)據(jù)集共有656例患者,包括死亡患者261例,所有患者共計(jì)13 091條記錄?;颊咂骄挲g(58.55±15.81)歲,平均每位患者擁有(19.95±13.53)條記錄,女性患者占比49%?;颊叩母黜?xiàng)化驗(yàn)指標(biāo)的統(tǒng)計(jì)見表2,合并癥記錄統(tǒng)計(jì)見表3,患者基本信息統(tǒng)計(jì)見表4及圖4。

        表2 數(shù)據(jù)集中腹膜透析相關(guān)醫(yī)療特征統(tǒng)計(jì)Table 2 Statistics of peritoneal dialysis clinical features in the dataset

        Std, standard devation. Other abbreviations as in Table 1.

        2.2 模型的性能比較結(jié)果

        對(duì)GRU、RNN和LR模型的性能進(jìn)行十折交叉驗(yàn)證、調(diào)整超參數(shù),并在測(cè)試集測(cè)試,結(jié)果見表5,各模型的ROC曲線見圖5。可以看出RNN模型和GRU模型在AUROC、召回率、F1分?jǐn)?shù)三項(xiàng)指標(biāo)上都明顯優(yōu)于傳統(tǒng)的LR模型。雖然LR模型已經(jīng)達(dá)到了一定的預(yù)測(cè)水平,但其未考慮生存時(shí)間變量因素,很難隨著患者的不同隨訪時(shí)間變化,做出更加準(zhǔn)確的預(yù)測(cè)。RNN和GRU模型與LR模型相比,不僅能夠處理當(dāng)前狀態(tài)數(shù)據(jù),還能夠處理時(shí)序數(shù)據(jù),通過納入患者之前的狀態(tài)來對(duì)當(dāng)前狀態(tài)進(jìn)行預(yù)測(cè),所以其結(jié)果優(yōu)于LR模型。但RNN模型在處理時(shí)序數(shù)據(jù)時(shí),無法很好地抽取長距離信息依賴,GRU的“更新門”和“重置門”機(jī)制很好地解決了這一問題,同時(shí)從結(jié)果中也可以看出GRU模型的性能有了進(jìn)一步的提升,說明GRU模型可以更深刻地理解當(dāng)前數(shù)據(jù)背后的臨床意義,并且能更好地?cái)M合數(shù)據(jù)。

        表3 數(shù)據(jù)集中腹膜透析相關(guān)合并癥統(tǒng)計(jì)Table 3 Statistics of peritoneal dialysis complications in the dataset

        表4 數(shù)據(jù)集基本統(tǒng)計(jì)特征Table 4 Statistics information of patients

        Std, standard deviation.

        圖4 數(shù)據(jù)集中年齡與就診頻次的分布Figure 4 Data distribution of age and visiting frequency in the dataset

        表5 測(cè)試集各預(yù)測(cè)模型性能的平均值Table 5 Average performance of each prediction model in testset

        LR, logistic regression; RNN, recurrent neural network; GRU, gated recurrent unit; AUROC, area under the receiver operation charac-teristic curve.

        為了確定模型對(duì)于不同死亡原因的預(yù)測(cè)表現(xiàn),本研究計(jì)算了測(cè)試集上不同死亡原因的平均召回率。此外,還分析了預(yù)測(cè)窗口設(shè)置為3個(gè)月時(shí)模型的性能(圖6)。相比于RNN和LR模型,GRU模型具有更好的預(yù)測(cè)效果,所以下文的結(jié)果和討論均使用GRU模型。

        3 討論

        本研究發(fā)現(xiàn),與傳統(tǒng)的LR模型相比,RNN及其變體GRU模型都具有更優(yōu)的擬合和預(yù)測(cè)效果,展現(xiàn)了循環(huán)神經(jīng)網(wǎng)絡(luò)模型在臨床預(yù)測(cè)模型中的潛在應(yīng)用價(jià)值,在此基礎(chǔ)上的數(shù)據(jù)挖掘可能為臨床提供更為有意義的發(fā)現(xiàn)。

        此外,根據(jù)圖6中模型的表現(xiàn),我們發(fā)現(xiàn)幾種死亡原因(如感染、胃腸道出血、營養(yǎng)不良和癌癥等)具有相當(dāng)高的召回率,提示模型對(duì)于這幾種原因?qū)е碌乃劳龅念A(yù)測(cè)效果較好,但同時(shí),一些死亡原因(如心血管疾病、腦血管疾病)的召回率相對(duì)較低,提示模型對(duì)急性發(fā)病的心腦血管疾病預(yù)測(cè)效果不佳,進(jìn)一步提示需要在模型中納入更多可能的危險(xiǎn)因素,或在臨床上需要進(jìn)一步尋找可能的預(yù)測(cè)因子來提高模型的預(yù)測(cè)效果。

        AUROC, area under the receiver operation characteristic curve.圖5 預(yù)測(cè)模型的ROC曲線Figure 5 ROC of prediction models

        PDAP, peritoneal dialysis associated peritonitis; PVD, peripheral vascular disease; GI, gastrointestinal.圖6 不同預(yù)測(cè)窗口下對(duì)不同死因的召回率Figure 6 Recall of different death reasons at different prediction windows

        需要注意的是,心腦血管疾病雖然具有相對(duì)較低的召回率,但隨著預(yù)測(cè)窗口從一年減少到3個(gè)月,腦血管疾病的召回率增加,心血管疾病召回率增加不明顯,表明對(duì)于患有腦血管疾病的患者,如果醫(yī)生可以更加密切隨訪患者,則可以使用現(xiàn)有類型的臨床數(shù)據(jù)進(jìn)行預(yù)警。而對(duì)于患有心血管疾病的患者,當(dāng)前的臨床信息不足以更準(zhǔn)確地對(duì)死亡做出預(yù)警,因此,臨床上對(duì)于心血管疾病的預(yù)測(cè),可能需要進(jìn)行更詳細(xì)的測(cè)試(如心電圖、心肌酶、冠狀動(dòng)脈CT血管造影、超聲心動(dòng)圖等心臟檢查),進(jìn)一步探索納入這些心臟測(cè)試后的模型預(yù)測(cè)效果。

        本研究也存在不足之處,比如數(shù)據(jù)缺失率較高[2],對(duì)風(fēng)險(xiǎn)預(yù)測(cè)有明顯的負(fù)面影響。RNN模型中的機(jī)制旨在分析患者健康狀況的變化特征,因此對(duì)缺失率較高的數(shù)據(jù)補(bǔ)全策略引起的異常變化非常敏感。在未來的工作中,將不同來源的數(shù)據(jù)更合理地結(jié)合或進(jìn)行遷移學(xué)習(xí)和數(shù)據(jù)補(bǔ)全可能會(huì)解決這一問題。

        綜上所述,相比于傳統(tǒng)醫(yī)學(xué)研究所使用的LR模型,RNN模型,尤其RNN的變體GRU模型的性能更優(yōu),更適合預(yù)測(cè)終末期腎病腹膜透析患者的死亡風(fēng)險(xiǎn)。使用基于循環(huán)神經(jīng)網(wǎng)絡(luò)模型的死亡風(fēng)險(xiǎn)預(yù)測(cè)系統(tǒng)來輔助醫(yī)生進(jìn)行臨床決策和干預(yù),可能有助于臨床醫(yī)生更好地隨訪和檢測(cè)患者,提高醫(yī)療質(zhì)量。

        猜你喜歡
        腹膜預(yù)測(cè)模型
        一半模型
        無可預(yù)測(cè)
        黃河之聲(2022年10期)2022-09-27 13:59:46
        選修2-2期中考試預(yù)測(cè)卷(A卷)
        選修2-2期中考試預(yù)測(cè)卷(B卷)
        重要模型『一線三等角』
        活血化瘀藥對(duì)腹膜透析腹膜高轉(zhuǎn)運(yùn)患者結(jié)局的影響
        山莨菪堿在腹膜透析治療中的應(yīng)用
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        不必預(yù)測(cè)未來,只需把握現(xiàn)在
        3D打印中的模型分割與打包
        99精品视频69v精品视频| 成人无码免费一区二区三区| 精品无码人妻一区二区三区品| 日日噜噜夜夜狠狠久久无码区| 欧美黑寡妇特a级做爰| 日日摸天天摸人人看| 男女18禁啪啪无遮挡| 久久99热精品这里久久精品| 制服无码在线第一页| 国内精品嫩模av私拍在线观看| 国产色av一区二区三区| 成人女同av在线观看网站| 亚洲av色影在线| 丰满熟女人妻中文字幕免费| 欧美中文在线观看| 扒开非洲女人大荫蒂视频| av免费一区二区久久| 在厨房拨开内裤进入毛片| 国产乱子伦农村xxxx| 狠狠色噜噜狠狠狠狠888奇禾| 久久综合亚洲色社区| 日韩av一区在线播放| 最新天堂一区二区三区| 亚洲精品无码不卡在线播he| 中文字幕丰满伦子无码| 香蕉人妻av久久久久天天| 亚洲精品你懂的在线观看| 国产性一交一乱一伦一色一情| 亚洲一区二区三区新视频| 三区中文字幕在线观看| 东京热久久综合久久88| 中文字幕人妻丝袜乱一区三区 | 亚洲av无码一区东京热久久| 国产操逼视频| 老色鬼永久精品网站| 国产精品99久久精品女同| 亚洲天堂久久午夜福利| 日韩精品一区二区三区在线视频| 欧美日韩一区二区三区在线观看视频 | jjzz日本护士| 亚洲日本精品一区二区三区|