張 晗,張愛舷,羅嘉琪,張曉萌,陳 力
1 解放軍醫(yī)學(xué)院,北京 100853;2 解放軍總醫(yī)院第一醫(yī)學(xué)中心急診科,北京 100853;3 解放軍總醫(yī)院第一醫(yī)學(xué)中心全科醫(yī)學(xué)科,北京 100853
調(diào)查顯示,我國創(chuàng)傷的總發(fā)病率高達(dá)50%,病死率為19/100 000,是引起青少年人群死亡的首要原因[1-3]。而創(chuàng)傷性休克(traumatic shock,TS)是創(chuàng)傷患者的嚴(yán)重并發(fā)癥,是引發(fā)患者死亡的主要因素之一[4]。因此,關(guān)注TS 患者的預(yù)后具有重要意義。構(gòu)建預(yù)測模型是研究患者預(yù)后的常見方法。但針對TS 患者,目前大部分研究為預(yù)警模型研究,預(yù)后模型研究則較為少見[5-6]。
隨著檢測技術(shù)的發(fā)展,獲取實(shí)驗(yàn)室檢查指標(biāo)越來越方便快捷,尤其以血?dú)夥治鰹榇?,借助最新的便攜式血?dú)夥治鰞x,在理想條件下可以將檢測時(shí)間控制在3 min 左右[7],這為利用這些指標(biāo)建立預(yù)測模型來幫助醫(yī)務(wù)人員進(jìn)行快速早期傷情判斷及輔助臨床決策創(chuàng)造了條件。另外,近年來包括機(jī)器學(xué)習(xí)在內(nèi)的人工智能技術(shù)逐漸應(yīng)用于醫(yī)療領(lǐng)域。機(jī)器學(xué)習(xí)技術(shù)在發(fā)掘醫(yī)療數(shù)據(jù)關(guān)系和建立臨床預(yù)測模型方面具有獨(dú)特的優(yōu)勢[8]。本研究旨在通過構(gòu)建基于機(jī)器學(xué)習(xí)的TS 患者院內(nèi)死亡預(yù)測模型,探討患者入院早期指標(biāo)和機(jī)器學(xué)習(xí)技術(shù)對TS 患者院內(nèi)死亡的預(yù)測價(jià)值,以期為今后建立和完善TS 患者預(yù)后預(yù)測模型提供參考和借鑒。
1 數(shù)據(jù)來源 本研究為回顧性研究,用于模型訓(xùn)練及驗(yàn)證的數(shù)據(jù)均來源于解放軍總醫(yī)院第一醫(yī)學(xué)中心急診科收治的TS 患者臨床數(shù)據(jù)。2014 年6 月 - 2021 年5 月收治TS 患者的臨床數(shù)據(jù)用于建模及內(nèi)部驗(yàn)證,2021 年6 - 12 月收治TS 患者的臨床數(shù)據(jù)用于外部驗(yàn)證。納入標(biāo)準(zhǔn):(1)因創(chuàng)傷入院;(2)入院前或入院時(shí)已診斷為TS;(3)入院休克指數(shù)(shock index,SI)≥1。排除標(biāo)準(zhǔn):(1)未成年患者,即年齡<16 歲;(2)發(fā)生創(chuàng)傷到入院時(shí)間>48 h;(3)存在嚴(yán)重影響特征參數(shù)的基礎(chǔ)疾病和用藥史,如房顫、哮喘、二甲雙胍用藥史等;(4)無法明確臨床結(jié)局的患者。同時(shí)滿足納入標(biāo)準(zhǔn)中的(1)、(2)或(1)、(3)且不存在排除標(biāo)準(zhǔn)中提及的各類情況的病例即納入本次研究。本研究符合醫(yī)學(xué)倫理學(xué)標(biāo)準(zhǔn),并且已通過解放軍總醫(yī)院第一醫(yī)學(xué)中心醫(yī)學(xué)倫理委員會(huì)審查(審批號:S2022-068-02 號)。
2 結(jié)局指標(biāo) 以TS 患者本次出院時(shí)是否存活作為結(jié)局指標(biāo),本研究將基于機(jī)器學(xué)習(xí)算法,利用TS 患者入急診后10 min 內(nèi)可獲取的早期指標(biāo),開發(fā)TS 患者院內(nèi)死亡預(yù)測模型,用于預(yù)測患者出院時(shí)是否存活。
3 數(shù)據(jù)收集 基于此次研究目的,參考相關(guān)臨床研究經(jīng)驗(yàn),結(jié)合患者信息的數(shù)據(jù)特點(diǎn),我們收集以下數(shù)據(jù)。(1)人口統(tǒng)計(jì)學(xué)信息:性別、年齡、院內(nèi)生存情況;(2)病程信息:傷因、傷部、受傷到入院的轉(zhuǎn)運(yùn)時(shí)間;(3)入院時(shí)的生命體征信息:心率(heart rate,HR)、體溫(body temperature,T)、呼吸頻率(respiratory rate,RR)、收縮壓(systolic blood pressure,SBP)、舒張壓(diastolic blood pressure,DBP)、動(dòng)脈血氧飽和度(arterial oxyhemoglobin saturation,SaO2)、意識(shí)狀態(tài);(4)入院血?dú)夥治鼋Y(jié)果:酸堿度(potential of hydrogen,pH)、二氧化碳分壓(partial pressure of carbon dioxide,PCO2)、氧分壓(partial pressure of oxygen,PO2)、血鈉(serum natrium,Na)、血鉀(serum kalium,K)、血鈣(serum calcium,Ca)、血糖(blood glucose,Glu)、血乳酸(blood lactate,Lac)、紅細(xì)胞比容(hematocrit,HCT)、實(shí)際碳酸氫鹽(actual bicarbonate,AB)、標(biāo)準(zhǔn)碳酸氫鹽(standard bicarbonate,SB)、二氧化碳總量(total carbon dioxide,TCO2)、剩余堿(base excess,BE)。其中,院內(nèi)生存情況用作本研究的結(jié)局指標(biāo)。患者年齡、性別、傷因、轉(zhuǎn)運(yùn)時(shí)間、入院生命體征(意識(shí)、HR、T、RR、SBP、DBP、SaO2)以及入院血?dú)夥治鼋Y(jié)果(pH、 PCO2、PO2、 Na、 K、Ca、Glu、Lac、HCT、AB、SB、TCO2、BE)等24 項(xiàng)指標(biāo)用作本研究初始備選特征,經(jīng)特征重要性分析后,保留合適的指標(biāo)進(jìn)行建模。
4 數(shù)據(jù)預(yù)處理 刪除缺失信息和出現(xiàn)不合邏輯異常值的病例數(shù)據(jù)。對性別、傷因、意識(shí)狀態(tài)等無等級含義的多分類變量進(jìn)行獨(dú)熱編碼。另外,由于死亡病例顯著少于存活病例,導(dǎo)致數(shù)據(jù)出現(xiàn)嚴(yán)重不平衡,故在建模前采用合成少數(shù)類過采樣技術(shù)(synthetic minority over-sampling technique,SMOTE)進(jìn)行不平衡處理。SMOTE 利用插值為少數(shù)類合成新的樣本,克服了隨機(jī)過采樣技術(shù)容易過擬合的問題,是機(jī)器學(xué)習(xí)技術(shù)常用的不平衡數(shù)據(jù)處理方法[9]。
5 模型開發(fā)與驗(yàn)證 采用Python(3.6.15) 基于決策樹(decision tree,DT)、邏輯回歸(logistic regression,LR)、隨機(jī)森林(random forest,RF)三種分類算法建立模型,模型中訓(xùn)練集∶測試集=8∶2,并迭代50 次。最終以準(zhǔn)確率、精確率、召回率、F值、受試者工作特征曲線下面積(area under receiver operator characteristic curve,AUC)等分類器性能指標(biāo)評估模型預(yù)測效能。兩模型間預(yù)測效能差異主要通過AUC 進(jìn)行比較。模型的校準(zhǔn)度和臨床實(shí)用性分別通過校準(zhǔn)曲線和決策曲線進(jìn)行評估。
6 統(tǒng)計(jì)學(xué)分析 使用SPSS 25.0 對納入患者的基本特征進(jìn)行分析,根據(jù)數(shù)據(jù)類型及分布特點(diǎn)選擇χ2檢驗(yàn)、t檢驗(yàn)或秩和檢驗(yàn)進(jìn)行比較,P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
1 數(shù)據(jù)基線特征 在建模及內(nèi)部驗(yàn)證過程中,共篩選出281 例TS 患者納入研究,具體納入過程見圖1,患者基線特征見表1。根據(jù)本研究的結(jié)局指標(biāo),即患者是否院內(nèi)存活,將研究病例分為生存組(218 例)和死亡組(63 例)??傮w上看,所有281例TS 患者中,絕大多數(shù)為男性(226 例,80.43%),致傷原因主要為車禍傷(165 例,58.72%)。在所有24 項(xiàng)備選特征中,性別、年齡、HR、Na、K、Ca 這6 項(xiàng)特征在生存組與死亡組之間無統(tǒng)計(jì)學(xué)差異(P>0.05),其余特征在兩組間的差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。死亡組患者PCO2、Glu 和Lac 的中位數(shù)較生存組高,而SBP、DBP、SaO2、pH、PO2、AB、SB、BE 和意識(shí)清楚患者構(gòu)成比等特征的平均數(shù)或中位數(shù)則顯著低于生存組。
表1 TS 患者不同臨床結(jié)局組基線特征比較Tab. 1 Comparison of baseline characteristics between the two groups of TS patients with different clinical outcomes
圖1 TS 患者納入排除過程Fig.1 The inclusion and exclusion process of TS patients
2 特征重要性分析 對24 項(xiàng)備選特征進(jìn)行重要性分析后,保留對構(gòu)建模型有貢獻(xiàn)的特征參數(shù),包括患者年齡、傷因、轉(zhuǎn)運(yùn)時(shí)間、意識(shí)、HR、T、RR、SBP、DBP、SaO2、pH、 PCO2、PO2、Ca、Glu、Lac、HCT、AB、SB、BE 等20 項(xiàng),結(jié)果見圖2。如圖所示,重要性排序前5 名依次為意識(shí)、SB、pH、SBP、SaO2,而PO2、T、PCO2、Ca和傷因等參數(shù)則排名靠后。在所有特征參數(shù)中,貢獻(xiàn)度最高的參數(shù)為患者的意識(shí)狀態(tài),包括意識(shí)清楚(格拉斯哥昏迷評分=15 分)和意識(shí)不清(格拉斯哥昏迷評分<15 分)。這提示患者入院時(shí)的意識(shí)狀態(tài)與患者的預(yù)后可能存在較為緊密的聯(lián)系。
圖2 特征重要性排名Fig.2 Ranking of important features
3 預(yù)測模型效能比較 基于DT、LR、RF 三種分類算法建立院內(nèi)死亡預(yù)測模型,各模型經(jīng)過內(nèi)部驗(yàn)證得到的預(yù)測效能見表2,ROC 曲線見圖3,校準(zhǔn)曲線見圖4,決策曲線見圖5。從模型區(qū)分度的角度看,三種模型的準(zhǔn)確率、精確率、召回率、F值、AUC 等指標(biāo)均值均大于0.75,表明它們對正負(fù)樣本的區(qū)分能力較強(qiáng)。其中,RF 模型的AUC(0.856,95%CI:0.847 ~ 0.865)最高,LR 模型的AUC 次之(0.801,95%CI:0.780 ~ 0.822),DT 模型的AUC(0.756,95%CI:0.740 ~ 0.772)最低。三種模型的AUC 進(jìn)行兩兩比較,差異均有統(tǒng)計(jì)學(xué)意義(P<0.05)。 在模型校準(zhǔn)度方面,三種模型的校準(zhǔn)曲線主要位于對角線上方,提示對死亡風(fēng)險(xiǎn)有所低估。其中,RF 模型與對角線最貼近,表明RF 模型的校準(zhǔn)度最好。利用決策曲線對模型的臨床效用進(jìn)行評估,RF 模型的決策曲線距離參照線最遠(yuǎn),說明利用RF 模型評估TS 患者院內(nèi)死亡風(fēng)險(xiǎn)的臨床凈獲益優(yōu)于LR 和DT 模型。
表2 三種模型對TS 患者院內(nèi)死亡預(yù)測效能Tab. 2 In-hospital mortality prediction performance of 3 models for TS patients
圖3 三種模型預(yù)測TS 患者院內(nèi)死亡的ROC 曲線Fig.3 ROC curve of 3 models for TS patients in-hospital mortality prediction
圖4 三種模型預(yù)測TS 患者院內(nèi)死亡的校準(zhǔn)曲線Fig.4 Calibration curve of 3 models for TS patients in-hospital mortality prediction
圖5 三種模型預(yù)測TS 患者院內(nèi)死亡的決策曲線Fig.5 Decision curve analysis of 3 models for TS patients in-hospital mortality prediction
4 模型外部驗(yàn)證 從解放軍總醫(yī)院第一醫(yī)學(xué)中心急診科2021 年6 月 - 2021 年12 月收治患者中篩選出符合標(biāo)準(zhǔn)的TS 患者50 例(篩選過程見圖1),對內(nèi)部驗(yàn)證中表現(xiàn)最佳的RF 模型的最終迭代版本進(jìn)行外部驗(yàn)證,測試模型的泛化能力。外部驗(yàn)證中RF 模型的預(yù)測效能見表3。可以看出,RF 模型外部驗(yàn)證集中的AUC(0.741)較內(nèi)部驗(yàn)證集(0.856)有所下降,但仍大于0.7。其他各項(xiàng)性能指標(biāo)內(nèi)外部驗(yàn)證集中保持相似水平,提示本研究建立的RF 模型具有較強(qiáng)的外部泛化能力。
表3 RF 對TS 患者院內(nèi)死亡預(yù)測效能內(nèi)外部驗(yàn)證比較Tab. 3 Comparison of in-hospital mortality prediction performance of RF models for TS patients in internal and external validation
TS 是嚴(yán)重創(chuàng)傷患者致死的重要原因,盡快識(shí)別TS 患者死亡風(fēng)險(xiǎn)并及時(shí)處置,對防止患者病情進(jìn)一步惡化和挽救患者生命很有意義[10-13]。同時(shí),TS 作為創(chuàng)傷患者經(jīng)常合并的一類臨床綜合征,通過患者生命體征和典型的臨床表現(xiàn)對其早期識(shí)別和診斷的技術(shù)已經(jīng)比較成熟[14]。但TS 幾乎涵蓋所有休克類型,受到復(fù)雜致傷機(jī)制和多種病理過程影響,其早期臨床表現(xiàn)與病情嚴(yán)重程度往往并不相符[15],這為早期判斷TS 患者的預(yù)后造成了困難。
目前臨床上尚無特異的TS 預(yù)后判斷工具,臨床工作者往往利用通用的創(chuàng)傷檢傷工具來輔助判斷TS 患者預(yù)后,如利用簡易檢傷分類法(simple triage and rapid treatment,START)、檢傷分類修正創(chuàng)傷評分(triage-revised trauma score,T-RTS)、CRAMS 評分(circulation,respiration,abdomen,motor,and speech)等簡易檢傷工具來進(jìn)行早期快速傷情判斷[16-17]。這類工具的優(yōu)點(diǎn)是涉及指標(biāo)較少,操作較為簡易,可較快完成傷情評估,但正由于設(shè)計(jì)過于簡易,其傷情判斷的準(zhǔn)確性通常較為有限[18]。相較之下,損傷嚴(yán)重度評分(injury severity score,ISS)和急性生理和慢性健康評分系統(tǒng)(acute physiology and chronic health evaluation,APACHE)等工具則因評估項(xiàng)目較全面而準(zhǔn)確性更高,甚至作為很多創(chuàng)傷研究的“金標(biāo)準(zhǔn)”[19]。但其評估難度大、完成耗時(shí)長等特點(diǎn)顯然限制了它們在嚴(yán)重TS 患者中的應(yīng)用。
傳統(tǒng)的評分模型依賴于通過邏輯回歸分析對各參數(shù)進(jìn)行賦分,具有模型解釋性強(qiáng)的優(yōu)點(diǎn),但其難以處理復(fù)雜變量之間的交互作用,容易出現(xiàn)欠擬合[20],而機(jī)器學(xué)習(xí)分類算法能夠避免這部分缺點(diǎn)。因此,本研究基于機(jī)器學(xué)習(xí)分類算法,利用患者年齡、入院生命體征、入院血?dú)夥治龅仍缙谥笜?biāo)來建立TS 患者死亡預(yù)測模型,期望可以輔助臨床工作者對TS 患者預(yù)后進(jìn)行早期判斷。在模型的內(nèi)部驗(yàn)證過程中RF 模型的預(yù)測表現(xiàn)最佳,其準(zhǔn)確率(0.807)、精確率(0.886,)、召回率(0.866)、F值(0.876)、AUC(0.856,95%CI:0.847 ~ 0.865)等指標(biāo)平均值均大于0.8,并且RF 模型在外部驗(yàn)證集中預(yù)測表現(xiàn)與內(nèi)部驗(yàn)證相似,提示該模型對TS 患者院內(nèi)生存病例和院內(nèi)死亡病例的分類性能較強(qiáng)。
近年來,創(chuàng)傷救治相關(guān)領(lǐng)域也出現(xiàn)了許多基于機(jī)器學(xué)習(xí)的臨床研究。趙宇卓[21]利用MIMICⅢ數(shù)據(jù)庫中患者的生命體征和實(shí)驗(yàn)室檢查等多項(xiàng)指標(biāo),建立了基于機(jī)器學(xué)習(xí)的創(chuàng)傷失血性休克預(yù)警模型,最優(yōu)模型的AUC 可達(dá)0.98。Li 等[22]則通過隨機(jī)森林算法建立創(chuàng)傷性凝血病的預(yù)測模型,其準(zhǔn)確度可達(dá)到0.94。但針對TS 群體利用機(jī)器學(xué)習(xí)算法進(jìn)行死亡預(yù)測,作者查閱文獻(xiàn)后發(fā)現(xiàn)目前缺乏這方面相關(guān)研究。希望本研究可以為今后的相關(guān)研究提供一定的參考。
本研究存在一定的局限性:(1)本研究為單中心研究,可收集的樣本量較少,限制了機(jī)器學(xué)習(xí)分類算法的選擇,可能對模型效能產(chǎn)生不利影響;(2)基于現(xiàn)存數(shù)據(jù)庫進(jìn)行回顧性分析,難以確保TS 患者生命體征采集和血?dú)獠杉耐瑫r(shí)性,可能存在一定偏倚;(3)納入的病例數(shù)據(jù)時(shí)間跨度長,這可能對整體數(shù)據(jù)質(zhì)量造成不良影響。之后,我們將嘗試克服以上局限,繼續(xù)進(jìn)行研究以不斷改進(jìn)模型的預(yù)測效能。
總之,通過建立基于機(jī)器學(xué)習(xí)的TS 患者院內(nèi)死亡預(yù)測模型,在確保相當(dāng)準(zhǔn)確性的前提下,幫助醫(yī)務(wù)人員盡快完成TS 患者死亡風(fēng)險(xiǎn)識(shí)別與病情判斷,可以為后續(xù)的救治處理爭取時(shí)間。另外,基于人工智能算法的預(yù)測模型通過直接搭載到電子系統(tǒng),可以節(jié)省人力成本。隨著人工智能和大數(shù)據(jù)技術(shù)的不斷發(fā)展,相關(guān)研究在醫(yī)療領(lǐng)域的應(yīng)用前景相信會(huì)越來越廣闊。
作者貢獻(xiàn)張晗:總體構(gòu)思,方法設(shè)計(jì),規(guī)范分析,撰寫初稿;張愛舷:軟件處理,參與方法設(shè)計(jì)和數(shù)據(jù)管理;羅嘉琪:有效驗(yàn)證,參與數(shù)據(jù)管理;張曉萌:數(shù)據(jù)管理;陳力:資金獲取,資源提供,監(jiān)督指導(dǎo),審讀和修訂。
利益沖突所有作者聲明無利益沖突。
數(shù)據(jù)共享聲明本篇論文相關(guān)數(shù)據(jù)可依據(jù)合理理由從作者處獲取,Email:928050098@qq.com。