亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        機器學(xué)習(xí)算法對危重患者死亡率預(yù)測效能的比較*

        2020-09-14 08:16:40李惠萍胡安民
        廣東醫(yī)學(xué) 2020年16期
        關(guān)鍵詞:模型

        李惠萍, 胡安民

        深圳市人民醫(yī)院 1呼吸與危重癥醫(yī)學(xué)科, 2麻醉科(廣東深圳 518020)

        醫(yī)療信息化的發(fā)展促進了大數(shù)據(jù)技術(shù)的進步和在醫(yī)療領(lǐng)域中的應(yīng)用,包括優(yōu)化患者治療,提高臨床決策,改善臨床試驗設(shè)計,合理分配醫(yī)療資源以及實施個體化治療等多個方面。數(shù)據(jù)科學(xué)使用機器學(xué)習(xí)(machine learning,ML)算法建立疾病預(yù)測和預(yù)后模型,盡早識別病情變化并進行干預(yù),評估患者可能的臨床終點,以利于指導(dǎo)臨床決策。重癥監(jiān)護室(ICU)患者病情重,病死率高,其中ICU老年患者的30 d死亡率為11.6%,而合并真菌血癥的ICU患者死亡率可達40.6%[1-2]。目前臨床上常用的簡化急性生理評分-Ⅱ(simplified acute physiology score-Ⅱ,SAPS-Ⅱ)可在一定程度上反映患者的危重度,但此評分要求變量與對應(yīng)結(jié)果呈線性關(guān)系,在病情復(fù)雜、存在眾多影響預(yù)后因素的ICU患者上使用時,其準(zhǔn)確性受到影響。機器學(xué)習(xí)算法是一門交叉學(xué)科,綜合運用概率論、統(tǒng)計學(xué)、算法復(fù)雜度理論等多種知識,對大型數(shù)據(jù)庫進行分析學(xué)習(xí),并優(yōu)化程序性能。機器學(xué)習(xí)包括監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)和強化學(xué)習(xí)3種模式,其中監(jiān)督學(xué)習(xí)中的支持向量機(support vector machines,SVM)和隨機森林(random forest,RF)算法可對多個變量進行模式識別,構(gòu)建預(yù)測模型,可應(yīng)用于療診斷輔助、圖像分析等,同時這兩種算法還可通過非線性關(guān)系規(guī)則,構(gòu)建危重患者預(yù)后的預(yù)測模型[3-6]。本研究使用美國重癥醫(yī)學(xué)數(shù)據(jù)庫(medical information mart for intensive care,MIMIC-Ⅲ)的臨床數(shù)據(jù),分別使用SVM和RF算法構(gòu)建預(yù)后模型,并與SAPS-Ⅱ模型進行比較,評估這3種模型對危重患者30 d全因死亡率的預(yù)測效能。

        1 資料與方法

        1.1 一般資料 2018年1月至2019年6月,本研究基于MIMIC-Ⅲ,收集庫中2002年6月至2012年10月的重癥患者信息。MIMIC-Ⅲ數(shù)據(jù)庫由Beth Israel Deaconess醫(yī)療中心重癥監(jiān)護室中住院的46 520例患者的醫(yī)療數(shù)據(jù)組成。數(shù)據(jù)庫根據(jù)患者的人口學(xué)信息、診斷編碼、實驗室檢查、醫(yī)療干預(yù)事件進行分類整理[7]。該數(shù)據(jù)庫經(jīng)過嚴(yán)格的去隱私處理,得到哈佛大學(xué)醫(yī)學(xué)院倫理審查委員會與麻省理工學(xué)院共同批準(zhǔn)。本研究數(shù)據(jù)由通過“保護人類受試者培訓(xùn)”的研究人員胡安民(證書編號:26450451)提取。下載的數(shù)據(jù)均已通過嚴(yán)格去隱私化。納入標(biāo)準(zhǔn):首次接受ICU治療的成人重癥患者。排除標(biāo)準(zhǔn):年齡<18歲或>89歲;ICU停留時間<24 h。

        1.2 研究結(jié)局與預(yù)測變量 以患者進入ICU接受治療后30 d內(nèi)的死亡率為主要研究結(jié)果。納入患者的死亡時間,以及患者進入ICU首日可能影響預(yù)后的103項數(shù)據(jù),包括性別、年齡、種族、體質(zhì)指數(shù),入ICU類型、時間,首日的液體出入量、尿量、生命體征(脈搏血氧飽和度、心率、收縮壓、舒張壓、體溫)極大值和極小值、血氣分析(酸堿度、碳酸氫根濃度、血鉀離子濃度、血鈣離子濃度、鈉離子濃度、氯離子濃度、陰離子間隙、堿剩余、動脈血氧分壓、動脈血二氧化碳分壓、肺動脈-氧壓力梯度、血乳酸)的極大值和極小值、血常規(guī)(血紅蛋白、血細(xì)胞比容、血小板、白細(xì)胞計數(shù)、中性粒細(xì)胞百分比)的極大值和極小值、凝血功能檢查(凝血酶原時間、活化部分凝血活酶時間、國際標(biāo)準(zhǔn)化比值)的極大值和極小值、肝腎功能檢查(血清總膽紅素、丙氨酸氨基轉(zhuǎn)移酶、天冬氨酸氨基轉(zhuǎn)移酶、血清白蛋白、血清肌酐、內(nèi)生肌酐清除率、血清尿素氮)的極大值和極小值、C反應(yīng)蛋白極大值、心肌標(biāo)志物(肌酸激酶同工酶質(zhì)量、肌鈣蛋白T、肌鈣蛋白I)極大值、腦利鈉肽極大值、GCS評分極小值、是否存在合并癥(高血壓、糖尿病、肺循環(huán)疾病、慢性肺部疾病、充血性心力衰竭、心律失常、瓣膜疾病、糖尿病并發(fā)癥、肝病、腎病、中風(fēng)、其他神經(jīng)系統(tǒng)疾病、外周血管疾病、消化性潰瘍、艾滋病、淋巴瘤、實體腫瘤、轉(zhuǎn)移性癌癥、類風(fēng)濕關(guān)節(jié)炎、凝血功能障礙、體重下降、電解質(zhì)紊亂、失血性貧血、缺鐵性貧血、酒精濫用、藥物濫用、精神病、抑郁)。

        以上變量經(jīng)過特征變量篩選后用于構(gòu)建預(yù)測模型。用于構(gòu)建模型的原始數(shù)據(jù)均發(fā)布在ZENODO數(shù)據(jù)庫中(http://doi.org/10.5281/zenodo.3876289)。

        1.3 模型評價 基于數(shù)據(jù)庫采用結(jié)構(gòu)化查詢語言(structured query language,SQL)進行數(shù)據(jù)提取。將篩選出的原始數(shù)據(jù)通過Rv.3.6.0軟件進行數(shù)據(jù)分析、構(gòu)建模型并評估。研究首先基于SAPS-Ⅱ評分構(gòu)建邏輯回歸模型。將數(shù)據(jù)庫患者的影響預(yù)后的特征變量資料通過R語言的Boruta包進行數(shù)據(jù)清洗后篩選[8]。存在缺失值的特征變量通過RF多重插補算法依次進行建模插補[9],分別構(gòu)建SVM模型[10]和RF模型[11]。研究采用十折交叉的方法進行模型性能的驗證,把數(shù)據(jù)隨機分為10等份,依次將10等份中的每1份作為單獨測試集,其余9份作為構(gòu)建模型的訓(xùn)練集,進行效能驗證。

        在完成構(gòu)建模型后,通過計算真陽性率(true positive rate,TPR)、陽性預(yù)測值(positive predictive value,PPV)、F值、受試者工作特征(receiver operation characteristic,ROC)曲線下面積(area under the ROC curve,AUC)進行模型評估。TPR=正確判斷為陽性/所有實際陽性的樣本×100%;PPV=正確預(yù)測到的病例數(shù)/預(yù)測病例總數(shù);F值是TPR和PPV的加權(quán)調(diào)和平均值,綜合反映模型整體性能。

        1.4 統(tǒng)計學(xué)方法 采用Rv 3.6.0統(tǒng)計軟件,連續(xù)性計量資料的比較采用t檢驗和單因素方差分析,計數(shù)資料的比較采用2檢驗。以P<0.05為差異有統(tǒng)計學(xué)意義。

        2 結(jié)果

        2.1 危重患者數(shù)據(jù)的基本特征 篩選出符合條件的危重患者30 833例,中位年齡65歲,住院的中位時間為7.5 d。進入ICU后的30 d內(nèi)死亡2 909例(9.4%)。與存活的患者比較,死亡患者年齡更大,女性占比多,急診納入ICU比例高,體溫、pH值和血紅蛋白的最小值均更低,SAPS-Ⅱ評分更高,ICU治療時間和住院時間均更長,見表1。

        表1 患者總體人口學(xué)特征及進入ICU 30 d后存活或死亡的患者特征 例(%)

        2.2 特征變量篩選和多重插補 篩選后得到特征變量59個,依次對含有缺失值的特征變量通過RF算法構(gòu)建多重插補模型,然后使用該模型插補缺失值,補齊后的數(shù)據(jù)用于構(gòu)建危重患者死亡率的預(yù)測模型。

        2.3 模型評估 根據(jù)十折交叉驗證結(jié)果,SAPS-Ⅱ模型的TPR值明顯高于SVM模型,差異有統(tǒng)計學(xué)意義(P<0.001),但SAPS-Ⅱ模型與RF模型之間差異無統(tǒng)計學(xué)意義。SAPS-Ⅱ、SVM、RF的PPV值之間差異有統(tǒng)計學(xué)意義(P<0.001)。SVM模型和RF模型的F值均顯著高于SAPS-Ⅱ模型(P<0.001)。3個模型的AUC值逐漸升高,其中RF模型顯著高于SAPS-Ⅱ模型和SVM模型(P<0.001),RF模型預(yù)測較SAPS-Ⅱ、SVM模型更加精準(zhǔn)。見表2、圖1。

        注:A:TRP;B:PPV;C:F值;D:AUC;*P<0.001

        表2 3種模型的預(yù)測效能比較

        3 討論

        危重患者的病情復(fù)雜,影響其預(yù)后的因素眾多,預(yù)后評估方法繁瑣,導(dǎo)致臨床醫(yī)生難以得到患者個體死亡風(fēng)險結(jié)論[12]。此外,臨床工作中往往容易忽略個體患者的弱預(yù)測變量之間相互作用所導(dǎo)致的潛在風(fēng)險,從而影響對患者預(yù)后評估。因此建立能夠精準(zhǔn)預(yù)測患者預(yù)后的模型十分重要。傳統(tǒng)的SAPS-Ⅱ評分預(yù)測模型要求預(yù)測變量與相應(yīng)結(jié)果之間呈線性關(guān)系[2],對多元共線性數(shù)據(jù)、缺失數(shù)據(jù)和非平衡數(shù)據(jù)敏感性差,難以實現(xiàn)高階交互作用[13]。此外未得到充分校準(zhǔn)的SAPS-Ⅱ評分模型無法準(zhǔn)確預(yù)測患者的死亡率[14-15]。因此SAPS-Ⅱ評分預(yù)測模型的預(yù)測效能并不理想。

        本研究使用機器學(xué)習(xí)的SVM和RF算法構(gòu)建危重患者30 d死亡率的預(yù)測模型,并評估其預(yù)測效能。SVM具有分類思想簡單、分類效果好、通過使用核函數(shù)可以向高維空間進行映射來解決非線性的特點[10]。RF模型對分類不平衡的數(shù)據(jù)和缺失數(shù)據(jù)具有很強的抗干擾能力,抗過擬合能力比較強[9],因此可用于構(gòu)建死亡預(yù)測模型。本研究結(jié)果顯示,與傳統(tǒng)的SAPS-Ⅱ預(yù)測模型比較,SVM和RF算法構(gòu)建的模型均優(yōu)于SAPS-Ⅱ模型,而RF模型比SVM模型在危重患者預(yù)后的預(yù)測效能更好。

        在這項研究中,我們證明了機器學(xué)習(xí)算法可通過提供全面的危重患者臨床數(shù)據(jù)而深度整合,具有重要的臨床意義。先前的大規(guī)模研究已經(jīng)證明了SAPS-Ⅱ評分系統(tǒng)選擇變量有限,對危重患者的預(yù)后預(yù)測存在缺陷[14-15],而機器學(xué)習(xí)算法能夠在大量數(shù)據(jù)的基礎(chǔ)上在很多領(lǐng)域進行準(zhǔn)確預(yù)測和決策,同樣機器算法也可以為危重患者預(yù)后風(fēng)險分層提供更好的預(yù)測模型。SVM和RF模型各有特點,但RF模型比SVM模型對危重患者30 d死亡率的預(yù)測效能更好,從而為建立新的危重患者預(yù)后預(yù)測系統(tǒng)提供了重要依據(jù)。

        但本研究尚存在不足之處:首先,機器學(xué)習(xí)方法是通過使用更多的變量和交互作用來預(yù)測風(fēng)險,對明確能夠降低該個體患者風(fēng)險的具體治療目標(biāo)指導(dǎo)作用相對比較弱。目前臨床需要根據(jù)危重患者的病理改變進行對應(yīng)的治療,如果無法確定具體的風(fēng)險因素或相互作用,則可能減弱醫(yī)生治療方案調(diào)整的及時性。另外,本研究只討論機器學(xué)習(xí)算法的可行性和預(yù)測效能,未能討論其具體實現(xiàn)的過程。本研究采用的機器學(xué)習(xí)方法具備處理大量多維度信息的能力,但只有在將這些變量實際輸入到機器學(xué)習(xí)算法中時才具有優(yōu)勢。目前這一過程相對耗時,隨著計算機計算能力的提高,這一問題也會逐漸解決。目前我國很多醫(yī)院可以自動收集危重患者臨床數(shù)據(jù),為醫(yī)院構(gòu)建多變量的預(yù)后模型提供便利[16],因此在對模型的實際應(yīng)用中不會給醫(yī)護人員帶來額外負(fù)擔(dān),從而可以進行即時風(fēng)險評分計算。

        本研究證實,基于機器學(xué)習(xí)算法的SVM和RF模型優(yōu)于傳統(tǒng)的SAPS-Ⅱ模型,但在危重患者30 d全因死亡率的預(yù)測效能上,RF模型整體預(yù)測性能優(yōu)于SVM模型,能更準(zhǔn)確地協(xié)助臨床醫(yī)生進行決策。本研究為今后危重患者預(yù)后的預(yù)測系統(tǒng)在臨床使用提供堅實的數(shù)據(jù)支持。

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機模型
        提煉模型 突破難點
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        3D打印中的模型分割與打包
        亚洲一级无码片一区二区三区| 亚洲av综合av一区| 55夜色66夜色国产精品视频| 日韩在线第二页| 色青青女同性恋视频日本熟女| 国产一区av男人天堂| 中文字幕无线码| 亚洲精品二区中文字幕| 一区二区三区精品偷拍av| 日韩亚洲一区二区三区四区| 天天躁日日躁狠狠躁| 911国产精品| 中文字幕乱码亚洲美女精品一区| 日本av亚洲中文字幕| 国产成人亚洲综合色婷婷| 国产成人啪精品午夜网站| 亚洲综合色视频在线免费观看| 精品国产一区二区三区av| 成人免费看www网址入口| 99在线视频精品费观看视| 精品中文字幕精品中文字幕| 无码人妻精品一区二区三区东京热| av片在线观看免费| 久久亚洲精彩无码天堂| 男女射精视频在线观看网站| 国产又爽又黄又刺激的视频| 国产偷v国产偷v亚洲偷v| 日本免费a一区二区三区 | 国产精品一区二区av麻豆日韩| 99久久婷婷国产综合精品电影| 国产精品九九热| 日韩av中文字幕波多野九色| 国语自产偷拍在线观看| 国模私拍福利一区二区| 一本久久伊人热热精品中文| 边添小泬边狠狠躁视频| 丰满女人又爽又紧又丰满| 国产 无码 日韩| 在线观看免费日韩精品| 三级在线看中文字幕完整版| 久久亚洲AV无码一区二区综合|