[摘要] 目的 利用機器學習算法預測早產(chǎn)兒重癥監(jiān)護病房(intensive care unit,ICU)死亡風險,為臨床醫(yī)生提供早期診斷和風險評估的輔助決策工具。方法 回顧性收集兒科重癥監(jiān)護數(shù)據(jù)庫中早產(chǎn)兒病例的臨床數(shù)據(jù)?;谧钚〗^對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸分析和多因素Logistic回歸分析,篩選影響早產(chǎn)兒預后的關(guān)鍵臨床特征。研究通過人工少數(shù)類過采樣技術(shù)算法平衡數(shù)據(jù),結(jié)合7種機器學習模型構(gòu)建預測模型并評估其性能。使用沙普利加性解釋法(Shapley additive explanations,SHAP)進行模型解釋。結(jié)果 最終納入患兒923例,生存組886例,死亡組37例,共收集38個臨床特征。LASSO篩選出8個與早產(chǎn)兒ICU死亡密切相關(guān)的變量(乳酸、呼吸頻率、氯離子濃度、中性粒細胞、紅細胞分布寬度等)。多因素Logistic回歸分析顯示乳酸、呼吸頻率是早產(chǎn)兒ICU預后的獨立影響因素。內(nèi)部測試及外部驗證顯示輕量梯度提升機模型在準確性、精確性等指標上均優(yōu)于其他模型。SHAP分析顯示,呼吸頻率和乳酸對早產(chǎn)兒死亡風險的預測貢獻最大。結(jié)論 本研究為早產(chǎn)兒預后的早期識別和干預提供可靠工具,強調(diào)關(guān)鍵指標的重要性。
[關(guān)鍵詞] 早產(chǎn)兒;ICU死亡風險;機器學習;輕量梯度提升機模型;風險預測
[中圖分類號] R722.6" """"[文獻標識碼] A """[DOI] 10.3969/j.issn.1673-9701.2025.18.007
Mortality risk assessment and interpretability analysis of preterm infants in the ICU by using machine learning models
SU Yanfeng1, HONG Suru2, CHEN Yushuang3, WU Xiayang3
1.Department of Emergency Medicine, the Second Affiliated Hospital of Xiamen Medical College, Xiamen 361021, Fujian, China; 2.Department of Radiology, Xiamen Children’s Hospital, Xiamen 361006, Fujian, China; 3.Department of Pharmacy, Xiamen Children’s Hospital, Xiamen 361006, Fujian, China
[Abstract] Objective To aim at using machine learning algorithms to predict the risk of neonatal intensive care unit (ICU) mortality, providing clinicians with an early diagnosis and risk assessment tool to assist in decision-making. Methods Clinical data of preterm infants from the paediatric intensive care database retrospectively were collected. By using least absolute shrinkage and selection operator (LASSO) regression analysis and multivariate Logistic regression analysis, key clinical characteristics affecting preterm infant prognosis were screened. The study was balanced the data by using the synthetic minority oversampling technique, combined seven machine learning models to build a predictive model and evaluate its performance. The Shapley additive explanations (SHAP) was used for model interpretation. Results A total of 923 preterm infants were finally included, survival group comprised 886 infants, and death group comprised 37 infants. A total of 38 clinical characteristics were collected. LASSO screening identified 8 variables significantly associated with neonatal ICU mortality, including lactate, respiratory rate, chloride concentration, neutrophils, and red blood cell distribution width etc. Multivariate Logistic regression analysis revealed that lactate and respiratory rate were independent predictors of neonatal ICU outcomes. Internal testing and external validation showed that light gradient boosting machine model outperformed other models in terms of accuracy and precision etc. indicators. SHAP analysis indicated that respiratory rate and lactate levels had the largest predictive contribution to the risk of preterm infants mortality. Conclusion This study provides reliable tools for early identification and intervention in the prognosis of preterm infants, emphasizing the importance of key indicators.
[Key words] Preterm infants; ICU mortality risk; Machine learning; Light gradient boosting machine model; Risk prediction
早產(chǎn)兒因器官發(fā)育不成熟,出生后面臨嚴重的健康挑戰(zhàn),尤以重癥監(jiān)護病房(intensive care unit,ICU)死亡率居高不下為甚。研究表明早產(chǎn)兒在新生兒重癥監(jiān)護病房(neonatal intensive care units,NICU)中的呼吸窘迫、中樞神經(jīng)感染及壞死性小腸結(jié)腸炎等發(fā)生率明顯高于足月兒,提示需加強監(jiān)護和干預以降低死亡風險[1-2]。傳統(tǒng)預測方法在早期診斷中雖有一定作用,但對個體化風險預測仍有限。近年來,機器學習技術(shù)為復雜數(shù)據(jù)分析和高效預測提供新途徑,具有可解釋性的高性能模型有助于評估預后并支持臨床決策,然而此類模型在臨床較缺乏。因此,構(gòu)建應用于早產(chǎn)兒ICU死亡風險預測且兼具良好可解釋性的機器學習模型,具有重要的臨床應用價值。
本研究基于兒科重癥監(jiān)護(paediatric intensive care,PIC)數(shù)據(jù)庫進行回顧性分析,旨在利用機器學習模型預測患兒的ICU死亡風險。為臨床醫(yī)生提供一種輔助決策工具,輔助早期診斷和風險評估,及時發(fā)現(xiàn)不良預后風險并進行干預,為臨床早產(chǎn)兒個性化治療方案提供數(shù)據(jù)支持和新的研究視角。
1" 資料與方法
1.1" 資料來源
本研究的回顧性隊列數(shù)據(jù)來源于PIC數(shù)據(jù)庫中診斷為早產(chǎn)兒的臨床病例資料,外部驗證數(shù)據(jù)提取自美國大型重癥監(jiān)護醫(yī)學信息數(shù)據(jù)庫Ⅲ(medical information mart for intensive care Ⅲ,MIMIC-Ⅲ)。研究者已通過數(shù)據(jù)庫的相關(guān)課程,獲得數(shù)據(jù)庫的使用授權(quán)(證書編號:64962098)。
1.2" 納排標準
納入標準:①年齡0~1歲;②早產(chǎn)兒,依據(jù)國際疾病分類診斷編碼第10次修訂本(international classification of diseases-10,ICD10)識別P07.3; ③首次進入ICU治療;④有完整的病例分析。排除標準:需要研究的臨床數(shù)據(jù)缺失。
1.3" 提取數(shù)據(jù)
提取患兒的人口統(tǒng)計學資料和入住ICU首日的實驗室指標、生命體征、預后信息等。根據(jù)出ICU時是否診斷死亡將患兒分為生存組和死亡組。
1.4" 數(shù)據(jù)清洗
若某列數(shù)據(jù)缺失值達到總數(shù)的20%,則刪除該例數(shù)據(jù),避免大量缺失值帶來的分析偏差;缺失數(shù)據(jù)lt;20%時多重插補填充,最大限度減少偏差。
1.5" 特征篩選
采用最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸篩選特征變量,通過壓縮回歸系數(shù)為零的變量,剔除不必要特征。將篩選出的非零系數(shù)指標納入多因素Logistic回歸模型,確定與ICU死亡風險相關(guān)的獨立預后因素并計算優(yōu)勢比(odds ratio,OR)及對應95%CI。
1.6" 模型構(gòu)建與評估
利用人工少數(shù)類過采樣技術(shù)(synthetic minority oversampling technique,SMOTE)平衡兩組患兒組間差異。將數(shù)據(jù)按7∶3的比例隨機分為訓練集與內(nèi)部測試集,訓練集用于建立模型,內(nèi)部測試集評估模型性能,并使用MIMIC-Ⅲ數(shù)據(jù)庫進行外部驗證。將臨床變量納入決策樹、梯度決策樹(gradient boosting decision tree,GBDT)、隨機森林(random forest,RF)、支持向量機(support vector machine,SVM)、輕量梯度提升機(light gradient boosting machine,LGBM)、極端梯度提升機(extreme gradient boosting,XGB)、樸素貝葉斯(naive Bayes,NB)7種機器學習算法構(gòu)建預測模型,通過臨床決策曲線(decision curve analysis,DCA)比較各模型凈收益,計算受試者操作特征曲線下面積(area under the curve,AUC)、準確度、精確度、召回率和F1值綜合評估模型性能,選擇最佳模型作進一步解釋。
1.7" 統(tǒng)計學方法
采用DecisionLinnc 1.3軟件進行統(tǒng)計分析。對計量資料進行正態(tài)性檢驗后,符合正態(tài)分布的計量資料以均數(shù)±標準差()表示,組間比較采用t檢驗;不符合正態(tài)分布的計量資料以中位數(shù)(四分位數(shù)間距)[M(Q1,Q3)]表示,組間比較采用秩和檢驗。計數(shù)資料以例數(shù)(百分率)[n(%)]表示,比較采用c2檢驗或Fisher確切概率法。P lt;0.05為差異有統(tǒng)計學意義。
2" 結(jié)果
2.1 "兩組患兒的基線資料比較
本研究共納入923例患兒,生存組886例,死亡組37例。兩組患兒的性別、呼吸頻率、血小板計數(shù)、紅細胞分布寬度、鉀離子、總蛋白、球蛋白、pH、ICU時間差異有統(tǒng)計學意義(Plt;0.05),見表1。
2.2 "LASSO回歸篩選特征變量
通過LASSO回歸分析對38個變量進行降維處理,篩選出最具代表性的死亡風險影響因素,見圖1。結(jié)果顯示呼吸頻率、淋巴細胞、紅細胞分布寬度、中性粒細胞、氯離子濃度、球蛋白、二氧化碳分壓和乳酸8個變量為早產(chǎn)兒ICU死亡的影響因素。
2.3" 早產(chǎn)兒ICU死亡風險影響因素的多因素Logistic回歸分析
以是否ICU死亡(死亡=1,存活=0)為因變量,LASSO回歸模型篩選的8個變量為自變量,通過多因素Logistic回歸模型進一步分析,結(jié)果顯示乳酸、呼吸頻率是早產(chǎn)兒ICU死亡風險相關(guān)的獨立預后因素(Plt;0.001),見表2。
2.4" 構(gòu)建預測模型及性能評價
本研究生存組886例,死亡組37例,數(shù)據(jù)分布明顯失衡,可能影響模型性能[3]。常規(guī)解決方案包括過采樣與欠采樣。欠采樣可減少多數(shù)類樣本,但可導致信息丟失并降低預測精度,因此優(yōu)先選擇過采樣[4]。SMOTE算法可通過線性插值在少數(shù)類樣本間生成合成數(shù)據(jù),提升樣本均衡度,規(guī)避過擬合風險[3]。應用SMOTE后,數(shù)據(jù)集擴增至1740個樣本,按7∶3比例劃分訓練集與內(nèi)部測試集。
DCA曲線分析顯示LGBM模型在較大閾值范圍內(nèi)均能顯著提高臨床凈獲益,見圖2。具體指標方面,LGBM模型綜合表現(xiàn)最優(yōu):準確率為0.9693,精確率為0.9601,特異性達0.9563,召回率為0.9815,AUC為0.9957,F(xiàn)1值為0.9707,見表3。
2.5" 預測模型的外部驗證
外部驗證結(jié)果顯示,LGBM模型的綜合性能良好,與內(nèi)部測試結(jié)果相同,見圖3、表4。
2.6" LGBM的模型解釋
針對7種模型中表現(xiàn)最佳的LGBM模型,本研究使用沙普利加性解釋法(Shapley additive explanations,SHAP)進行解釋。結(jié)果顯示呼吸頻率、中性粒細胞、乳酸是模型中最重要的特征。中性粒細胞計數(shù)、氯離子濃度和淋巴細胞百分比的升高與死亡風險增加呈正相關(guān),而呼吸頻率和乳酸則與生存率改善相關(guān)。球蛋白和二氧化碳分壓點云分布較窄,表明其對預測的貢獻較低,見圖4。
3" 討論
本研究通過特征篩選發(fā)現(xiàn)呼吸頻率、淋巴細胞、紅細胞分布寬度、中性粒細胞、氯離子、球蛋白、二氧化碳分壓和乳酸與早產(chǎn)兒ICU死亡風險密切相關(guān)。這些指標的異常反映早產(chǎn)兒當前的健康狀況和潛在的并發(fā)癥,如肝功能障礙、代謝性酸中毒、呼吸功能不全及全身炎癥反應等[5-7]。動態(tài)監(jiān)測這些指標并結(jié)合臨床干預,可優(yōu)化早產(chǎn)兒的預后。
選擇LGBM作為核心模型,主要因其在高維數(shù)據(jù)處理中的優(yōu)越表現(xiàn)及高效訓練能力,適合大規(guī)模數(shù)據(jù)分析,性能比較結(jié)果亦驗證其優(yōu)勢。盡管機器學習模型存在“黑箱”性質(zhì),但本研究通過引入SHAP分析,計算每個特征對模型決策的貢獻值,從而提升模型的可解釋性。SHAP結(jié)果表明呼吸頻率和乳酸水平異常是預測死亡風險的最強貢獻因子,與早產(chǎn)兒呼吸窘迫綜合征及全身炎癥反應密切相關(guān)[8-9]。乳酸水平異常提示組織低灌注,還與膿毒癥繼發(fā)的線粒體功能障礙相關(guān)[10-11];呼吸頻率異常則可能是肺順應性下降和中樞性呼吸調(diào)控異常的早期征象[12]。此外,氯離子濃度和中性粒細胞升高的預測權(quán)重提示電解質(zhì)紊亂與感染風險的關(guān)鍵作用,這與Fleischmann-Struzek等[13]研究中院內(nèi)感染對早產(chǎn)兒死亡率的影響一致。
本研究構(gòu)建基于機器學習算法的早產(chǎn)兒ICU死亡風險預測模型,突破傳統(tǒng)評分系統(tǒng)依賴單一生理指標的局限性。通過整合生理參數(shù)與實驗室指標,更全面地反映早產(chǎn)兒機體的缺氧與代謝代償狀態(tài),為早期干預提供敏感生物標志物。創(chuàng)新性結(jié)合SMOTE算法與SHAP可解釋技術(shù),有效解決兒科重癥數(shù)據(jù)中普遍存在的類不平衡與臨床可解釋性難題。
綜上,基于LGBM模型并動態(tài)監(jiān)測呼吸頻率和乳酸水平等關(guān)鍵指標,可為早產(chǎn)兒的健康評估和早期干預提供更高效、更精確的工具。未來研究需擴大樣本量,以提升模型的穩(wěn)定性和普適性。
利益沖突:所有作者均聲明不存在利益沖突。
[參考文獻]
[1]"" 許敏, 趙冬瑩, 張擁軍. 早產(chǎn)兒晚發(fā)型細菌性和真菌性敗血癥的臨床早期鑒別[J]. 上海醫(yī)學, 2017, 40(5): 280–285.
[2]"" DHIRENDRA K S, CLAIRE M M, KELLY A O, et al. Necrotizing enterocolitis: Bench to bedside approaches and advancing our understanding of disease pathogenesis[J]. Front Pediatr, 2023, 10: 1107404.
[3]"" NI Z, ZHU Y, QIAN Y, et al. Synthetic minority over-sampling technique-enhanced machine learning models for predicting recurrence of postoperative chronic subdural hematoma[J]. Front Neurol, 2024, 15: 1305543.
[4]"" SAMPATH P, ELANGOVAN G, RAVICHANDRAN K, et al. Robust diabetic prediction using ensemble machine learning models with synthetic minority over-sampling technique[J]. Sci Rep, 2024, 14(1): 28984.
[5]"" 蔡思銘, 岑紅霞, 廖趙妹, 等. 天冬氨酸轉(zhuǎn)氨酶與血小板比值指數(shù)對早產(chǎn)兒腸外營養(yǎng)相關(guān)性膽汁淤積癥的預測價值[J]. 肝臟, 2021, 26(8): 917–919.
[6]"" 王麗穎. 早期呼吸管理在胎齡27~31周早產(chǎn)兒中的應用價值[J]. 臨床醫(yī)學研究與實踐, 2021, 6(7): 93–95.
[7]"" NERMEEN A A, HODA A M, EMAN M N, et al. Prognostic biomarkers in predicting mortality in respiratory patients with ventilator-associated pneumonia[J]. Egypt J Bronchol, 2021, 15(1): 1–16.
[8]"" SWEET D G, CARNIELLI V P, GREISEN G, et al. European consensus guidelines on the management of respiratory distress syndrome: 2022 update[J]. Neonatology, 2023, 120(1): 3–23.
[9]"" MUSTAFA SENOL A, OZHAN A, ESIN O, et al. Systemic inflammatory indices as predictors of lung maturation in preterm infants born before 32 weeks of gestation[J]. J Pediatric Int Care, 2024. DOI: 10. 1055/s- 0044-1791788.
[10] SINGER M, DEUTSCHMAN C S, SEYMOUR C W, "et al. The third international consensus definitions for sepsis and septic shock (sepsis-3)[J]. JAMA, 2016, 315(8): 801–810.
[11] GARCIA-ALVAREZ M, MARIK P, BELLOMO R. Sepsis-associated hyperlactatemia[J]. Crit Care, 2014, 18(5): 503.
[12] SCHMIDT A R, RAMAMOORTHY C. Bronchopulmonary dysplasia[J]. Tidsskr Nor Laegeforen, 2022, 32(2): 174–180.
[13] FLEISCHMANN-STRUZEK C, GOLDFARB D M, SCHLATTMANN P, et al. The global burden of paediatric and neonatal sepsis: A systematic review[J]. Lancet Respir Med, 2018, 6(3): 223–230.
(收稿日期:2025–02–19)
(修回日期:2025–06–04)
通信作者:吳夏陽,電子信箱:56425477@qq.com