汪瑜 朱愛滿 魯清 張靖
因骨關(guān)節(jié)炎、骨質(zhì)疏松性骨折、椎管狹窄和脊柱畸形等肌肉骨骼退行性疾病發(fā)生逐年增加,脊柱手術(shù)患者數(shù)量也急劇增加[1]。其手術(shù)時(shí)間長(zhǎng)、創(chuàng)傷大、術(shù)中失血多等,加之手術(shù)全身麻醉,因而術(shù)后譫妄 (postoperative delirium,POD) 發(fā)病率高達(dá)40.5%[2]。POD 無確切有效治療方法,30%~40% 的POD 病例可預(yù)防,但 71% 的患者由于癥狀不典型而被臨床醫(yī)護(hù)忽略[3]。因此,識(shí)別和管理高危 POD 患者對(duì)于改善患者預(yù)后及臨床學(xué)科建設(shè)至關(guān)重要。
激活的炎癥 -免疫系統(tǒng)會(huì)促進(jìn)機(jī)體多種有害炎癥因子釋放,此類細(xì)胞因子可直接或間接作用于中樞神經(jīng)系統(tǒng),可繼發(fā)和直接損害患者神經(jīng)活動(dòng)和損害突觸連接功能,誘導(dǎo) POD[4]。因此,臨床研究觀察到一些術(shù)前復(fù)合全身炎癥 -免疫反應(yīng)標(biāo)志物中性粒細(xì)胞與淋巴細(xì)胞比值 (neutrophil to lymphocyte ratio,NLR)[5]、血小板與淋巴細(xì)胞比值 (platelet to lymphocyte ratio,PLR)[6]、單核細(xì)胞與淋巴細(xì)胞比值 (monocyte to lymphocyte ratio,MLR)[7]、C-反應(yīng)蛋白與白蛋白比值 (C-reactive protein to albumin ratio,CAR)[8]和白蛋白與球蛋白比值 (albumin to globulin ratio,AGR)[9]與 POD 風(fēng)險(xiǎn)相關(guān);此外,也發(fā)現(xiàn)單指標(biāo)血紅蛋白[10]、紅細(xì)胞分布寬度[11]、高密度脂蛋白比值[12]與 POD 風(fēng)險(xiǎn)相關(guān)。
基于文獻(xiàn)檢索和查閱本研究收集 8 種全身炎癥 -免疫反應(yīng)標(biāo)志物,通過最小絕對(duì)值收斂和選擇算子(least absolute value convergence and selection operators,LASSO) 算法構(gòu)建一種復(fù)合炎癥 -免疫反應(yīng)評(píng)分 (complex inflammation-immune response score,CIIRS)。POD 風(fēng)險(xiǎn)模型通常使用常規(guī)統(tǒng)計(jì)方法邏輯回歸 (logistic regression,LR)[13],但 POD 病因多樣性及混雜性且 LR 準(zhǔn)確度較差[14]。機(jī)器學(xué)習(xí) (machine learning,ML) 算法以高效率、準(zhǔn)確性和普適性等優(yōu)勢(shì)已廣泛應(yīng)用于骨折患者預(yù)后及 POD 研究中[15-17]。因此,本研究基于2019 年1 月至2022 年7 月 293例脊柱手術(shù)患者臨床數(shù)據(jù)并結(jié)合 CIIRS 開發(fā) 10 種ML 模型,通過比較模型旨在獲得可以顯著性提高預(yù)測(cè)脊柱手術(shù)患者 POD 風(fēng)險(xiǎn)模型,從而指導(dǎo)臨床制訂個(gè)性化診療方案,實(shí)現(xiàn) POD 的高效率管理。
1.納入標(biāo)準(zhǔn):(1) 年齡 >18 歲者;(2) 擇期脊柱手術(shù)者;(3) 全身麻醉者。
2.排除標(biāo)準(zhǔn):(1) 精神分裂癥、癲癇、帕金森病、腦損傷或腦部手術(shù)史者;(2) 表達(dá)及聽力障礙者;(3) 嚴(yán)重肝腎功能不全和惡性腫瘤者;(4) 血常規(guī)、生化常規(guī)等臨床資料不完整者。
1.數(shù)據(jù)收集:收集患者術(shù)前臨床資料,包括年齡、性別、體質(zhì)量指數(shù) (body mass index,BMI),美國(guó)麻醉醫(yī)師協(xié)會(huì) (American Society of Anesthesiologists,ASA) 評(píng)分、簡(jiǎn)易精神狀態(tài)檢查量表 (mini-mental state examinatio,MMSE) 評(píng)分、吸煙、深靜脈血栓、病變部位 (頸椎、胸椎和腰椎)、中性粒細(xì)胞、淋巴細(xì)胞、血小板、血紅蛋白、紅細(xì)胞分布寬度、單核細(xì)胞、高密度脂蛋白、C-反應(yīng)蛋白、白蛋白、球蛋白;同時(shí)收集手術(shù)時(shí)間和失血量。根據(jù)血液中表達(dá)水平計(jì)算 NLR、PLR、ML、CAR、血紅蛋白與紅細(xì)胞分布寬度 (haemoglobin and red blood cell distribution width ratio,HRR)、單核細(xì)胞與高密度脂蛋白比值 (monocyte to high-density lipoprotein cholesterol ratio,MHR) 和紅細(xì)胞分布寬度與血小板比值 (red blood cell distribution width to platelet ratio,RPR)。
2.譫妄診斷:主治醫(yī)師每天在病房查房時(shí)觀察并記錄患者譫妄癥狀和體征。如果懷疑 POD,則使用混淆評(píng)估方法診斷 POD,該方法包括四個(gè)標(biāo)準(zhǔn):(1) 急性發(fā)作和波動(dòng)過程;(2) 注意力不集中;(3)思維混亂;(4) 意識(shí)水平改變。當(dāng)指標(biāo) (1) 和 (2)同時(shí)滿足,或 (3) 與其中任何一項(xiàng)同時(shí)滿足,或單獨(dú)滿足 (4),則診斷為 POD。
3.ML 模型和可視化:使用 Shuffle 函數(shù)將 293例患者原始數(shù)據(jù)順序打亂,使用 Permutation 函數(shù)將所有數(shù)據(jù)隨機(jī)分成 10 份,采用 10 種 ML 算法構(gòu)建模型:LR,隨機(jī)森林 (random forest,RF),支持向量機(jī) (support vector machine,SVM),樸素貝葉斯模型 (naive Bayesian model,NB),線性判別分析(linear discriminant analysis,LDA),混合判別分析(mixture discriminant analysis,MDA),靈活判別分析 (flexible discriminant analysis,F(xiàn)DA),梯度增強(qiáng)機(jī) (gradient boosting machine,GBM),極端梯度提升 (extreme gradient boosting,XGBoost),分類梯度提升 (category boosting,CatBoost)。通過網(wǎng)格搜索算法優(yōu)化 ML 模型性能,避免過擬合。使用 10 倍交叉驗(yàn)證法驗(yàn)證模型。隨后 293 例患者按 3∶2 比例劃分訓(xùn)練集和測(cè)試機(jī)來訓(xùn)練 ML 模型。采用校準(zhǔn)曲線、接受者操作特征曲線 (receiver operating characteristic curve,ROC)、精確-召回曲線 (precise-recall curve,PRC) 和精確-召回收益曲線 (precise-recall gain curve,PRGC) 來評(píng)估 10 種 ML 模型并計(jì)算曲線下面積 (area under curve,AUC),并使用學(xué)習(xí)曲線來驗(yàn)證最佳性能模型擬合度。SHAP (SHapley Additive exPlanations) 通過計(jì)算貢獻(xiàn)值來衡量變量特征重要性,同時(shí)描述變量特征對(duì)結(jié)局變量的影響是積極的還是消極的,并被引入以解決機(jī)器學(xué)習(xí)模型的“黑盒”問題。根據(jù) SHAP 官網(wǎng) (https://github.com/slundberg/shap) 的學(xué)習(xí)指南,使用全局和局部可視化方法來解釋 ML 模型的輸出意義。本研究所使用的代碼均可在網(wǎng)址 (https://github.com/MD-shan/MLSHAP) 上獲得。
本研究數(shù)據(jù)采用 SPSS 22.0 和 R 3.6.1 統(tǒng)計(jì)學(xué)軟件進(jìn)行分析和處理。計(jì)數(shù)資料用率 (%) 表示,采用χ2或秩和檢驗(yàn)。計(jì)量資料采用表示,正態(tài)分布計(jì)量資料采用獨(dú)立樣本t檢驗(yàn),非正態(tài)分布計(jì)量資料采用秩和檢驗(yàn)。使用 glmnet 包進(jìn)行 LASS 回歸,使用 scikit-learn Python 庫和 XGBoost 框架在 Python中建立 XGBoost 模型。SHAP Python 框架 (https://github.com/slundberg/shap) 用于 SHAP 算法。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
293 例患者中,59 例出現(xiàn) POD (20.1%)。POD患者年齡、ASA 評(píng)分、吸煙和糖尿病比例及手術(shù)時(shí)間高于無 POD 患者,差異有統(tǒng)計(jì)學(xué)意義 (P<0.05)(表1)。
表1 患者一般臨床資料及比較Tab.1 General clinical information and comparison of patients
POD 患者 NLR、MLR、MHR、CAR、PLR 高于無 POD 患者,差異有統(tǒng)計(jì)學(xué)意義 (P<0.05),HRR低于無 POD 患者,差異有統(tǒng)計(jì)學(xué)意義 (P<0.05)(圖1)。8 種炎癥反應(yīng)標(biāo)志物間存在不同程度的相關(guān)性,其中 NLR 和 PLR 間相關(guān)性最高 (r=0.694,P<0.001) (圖2)。8 種炎癥反應(yīng)標(biāo)志物診斷 POD 的ROC 見圖3 和表2,其中 NLR 的 AUC 最高 [ AUC(95%CI):0.895 (0.855~0.928) ],RPR 的 AUC 最低[ AUC (95%CI):0.526 (0.441~0.609) ]。對(duì) NLR、MLR、MHR、CAR、PLR 和 HRR 進(jìn)行 LASSO 算法分析,在 Log (λ)=-4.598 最小值時(shí)識(shí)別出上述6 種炎癥反應(yīng)標(biāo)志物與 POD 相關(guān) (圖4a)。同時(shí),根據(jù) LASSO 算法所得的回歸系數(shù)構(gòu)建 CIIRS=NLR水平×0.537+PLR水平×0.009+MLR水平×0.168 -HRR水平×1.548+MHR水平×0.954+CAR水平×6.166,POD 患者CIIRS 顯著高于無 POD 患者 (P<0.05,圖4b) 且具有較高診斷 POD [ AUC (95%CI):0.936 (0.904~0.962)] 能力 (圖4c,表2)。
圖1 8 種炎癥反應(yīng)標(biāo)志在 POD 和非 POD 患者中差異分析的箱式圖Fig.1 Box plot of the analysis of differences between 8 inflammatory response markers in POD and non-POD patients
圖2 8 種炎癥反應(yīng)標(biāo)志的相關(guān)性分析Fig.2 Correlation analysis of 8 inflammatory response markers
圖3 8 種炎癥反應(yīng)標(biāo)志的 ROCFig.3 ROC of 8 inflammatory response markers
圖4 a:NLR、MLR、MHR、CAR、PLR 和 HRR 的 LASSO 算法分析;b:CIIRS 在 POD 和非 POD 患者中差異分析的箱式圖;c:CIIRS的 ROC (CIIRS=NLR*0.537+PLR*0.009+MLR*0.168 -HRR*1.548+MHR*0.954+CAR*6.166)Fig.4 a: LASSO algorithm analysis of NLR,MLR,MHR,CAR,PLR and HRR;b: Box plots for the analysis of differences between CIIRS in POD and non-POD patients;c: ROC for CIIRS (CIIRS=NLR*0.537+PLR*0.009+MLR*0.168 -HRR*1.548+MHR*0.954+CAR*6.166)
表2 相關(guān)變量的 ROC 分析結(jié)果Tab.2 Results of ROC analysis of relevant variables
將表1 分析結(jié)果 (年齡、ASA 評(píng)分、吸煙、糖尿病和手術(shù)時(shí)間) 及 CIIRS 進(jìn)行 LASSO 算法,確定年齡、吸煙、手術(shù)時(shí)間和 CIIRS 與 POD 風(fēng)險(xiǎn)相關(guān)(圖5),年齡、吸煙、手術(shù)時(shí)間在診斷 POD 的 ROC見圖6 和表2。基于4 個(gè) POD 風(fēng)險(xiǎn)變量,通過 10 倍交叉驗(yàn)證比較 10 個(gè) ML 模型:LR,RF,SVM,NB,LDA,MDA,F(xiàn)DA,GBM,XGBoost,CatBoost的 ROC (圖7a),通過均值 AUC 發(fā)現(xiàn) XGBoost 模型具有最高預(yù)測(cè)表現(xiàn)。隨后將 293 例患者以 3∶2 分為訓(xùn)練組與測(cè)試組。首先在訓(xùn)練組的校準(zhǔn)曲線 (圖7b)中觀察到 XGBoost 具有較高的預(yù)測(cè)準(zhǔn)確度且 PRC(圖7c)、PRGC (圖7e) 和 ROC (圖7f) 的 AUC 均處于最高。同時(shí),在測(cè)試集組的校準(zhǔn)曲線 (圖8a)中觀察到 XGBoost 具有較高預(yù)測(cè)準(zhǔn)確度且 PRC(圖8b)、PRGC (圖8c) 和 ROC (圖8d) 的 AUC 均處于最高。學(xué)習(xí)曲線 (圖8e) 顯示 XGBoost 模型具有良好擬合度,這進(jìn)一步證明 XGBoost 模型具有更好建模效果。
圖5 年齡、ASA 評(píng)分、吸煙、糖尿病和手術(shù)時(shí)間及 CIIRS 的 LASSO 算法Fig.5 LASSO algorithm for age,ASA score,smoking,diabetes and duration of surgery and CIIRS
圖6 年齡、吸煙和手術(shù)時(shí)間的 ROCFig.6 ROC for age,smoking and duration of surgery
圖7 a:基于測(cè)試組數(shù)據(jù),10 種 ML 模型的 10 倍交叉驗(yàn)證下的均值 AUC;b~e:XGBoost 模型的校準(zhǔn)曲線 (b)、PRC (c)、PRGC (d)和 ROC (e)Fig.7 a: Mean AUC under 10-fold cross-validation for 10 ML models based on test group data;b-e: XGBoost models for calibration curves (b),PRC (c),PRGC (d) and ROC (e)
圖8 測(cè)試組的 10 種 ML 模型驗(yàn)證分析 a~d:基于測(cè)試組的 XGBoost 模型的校準(zhǔn)曲線 (a)、PRC (b)、PRGC (c) 和 ROC (d);e:XGBoost 模型的學(xué)習(xí)曲線Fig.8 Validation analysis of 10 ML models for the test group a-d: Calibration curves of XGBoost models based on the test group (a),PRC (b),PRGC (c) and ROC (d);e: Learning curve of XGBoost models
通過分析 4 個(gè)關(guān)鍵 POD 風(fēng)險(xiǎn)變量年齡、吸煙、手術(shù)時(shí)間和 CIIRS 的 SHAP 絕對(duì)值,條形圖 (圖9a)顯示這些變量對(duì) POD 風(fēng)險(xiǎn)的影響程度,最高風(fēng)險(xiǎn)貢獻(xiàn)變量為 CIIRS;此外,根據(jù)患者是否抽煙進(jìn)行亞組分析,也證實(shí)最高 POD 風(fēng)險(xiǎn)貢獻(xiàn)變量為 CIIRS(圖9b)。SHAP 散點(diǎn)圖 (圖9c) 通過不同顏色展示4 個(gè)關(guān)鍵 POD 風(fēng)險(xiǎn)變量對(duì)預(yù)測(cè) POD 風(fēng)險(xiǎn)的正面或負(fù)面影響,可以顯著觀察到 4 個(gè)關(guān)鍵 POD 風(fēng)險(xiǎn)變量貢獻(xiàn)值存在“兩端分離”現(xiàn)象,表明這些風(fēng)險(xiǎn)變量能很好地區(qū)分 POD。SHAP 全局圖 (圖9d) 解釋 4 個(gè)關(guān)鍵風(fēng)險(xiǎn)對(duì)最終決定 POD 風(fēng)險(xiǎn)的貢獻(xiàn)累積影響。接下來,通過單病例 SHAP 瀑布圖 (圖8e) 解釋每個(gè)風(fēng)險(xiǎn)變量對(duì) POD 預(yù)測(cè)結(jié)果的正面和負(fù)面影響及預(yù)測(cè)結(jié)果。其中,E[f(x)] 表示 XGBoost 模型的基本預(yù)測(cè) SHAP 值,f(x) 表示模型最終預(yù)測(cè) SHAP 值。根據(jù)計(jì)算公式,XGBoost 模型基本預(yù)測(cè)概率=1-1/[math.exp (-3.693)+1]=0.024,最終預(yù)測(cè)概率=1-1/[math.exp (-6.719)+1]=0.001,該患者實(shí)際狀態(tài)為無 POD。
圖9 基于 SHAP 可視化 XGBoost 模型 a:SHAP 條形圖顯示年齡、吸煙、手術(shù)時(shí)間和 CIIRS 對(duì) XGBoost 模型的影響程度;b:基于患者是否抽煙的亞組分析的 SHAP 條形圖顯示年齡、吸煙、手術(shù)時(shí)間和 CIIRS 對(duì) XGBoost 模型的影響程度;c:SHAP 散點(diǎn)圖通過不同顏色展示 4 個(gè)關(guān)鍵 POD 風(fēng)險(xiǎn)變量對(duì)預(yù)測(cè) POD 風(fēng)險(xiǎn)的正面或負(fù)面影響;d:SHAP 全局圖解釋 4 個(gè)關(guān)鍵風(fēng)險(xiǎn)對(duì)最終決定 POD 風(fēng)險(xiǎn)的貢獻(xiàn)累積影響;e:來自 1 例患者數(shù)據(jù),該患者 CIIRS 為 2.174,不吸煙,手術(shù)時(shí)間 117 min,年齡 60 歲,XGBoost 模型基本預(yù)測(cè)概率為 1-1/[math.exp (-3.693)+1]=0.024,最終預(yù)測(cè)概率=1-1/[math.exp (-6.719)+1]=0.001,該患者實(shí)際狀態(tài)為無 PODFig.9 SHAP-based visualisation of the XGBoost model a: SHAP bar chart showing the extent to which age,smoking,duration of surgery and CIIRS influenced the XGBoost model;b: SHAP bar chart showing the extent to which age,smoking,duration of surgery and CIIRS influenced the XGBoost model based on subgroup analysis of smoking;c: SHAP scatter plot showing by different colours the positive or negative impact of the 4 key POD risk variables on predicting POD risk;d: SHAP global plot explaining the cumulative impact of the contribution of the 4 key risks to the final decision on POD risk;e: Data from a patient with a CIIRS of 2.174,non-smoking,117 min duration of surgery,age 60 years,and XGBoost model with a basic predicted probability of 1-1/[math.exp (-3.693)+1]=0.024,final predicted probability=1-1/[math.exp (-6.719)+1]=0.001,this patient's actual status indicated no POD
基于病因?qū)W假設(shè),許多臨床研究從炎癥-免疫反應(yīng)角度探索脊柱手術(shù)患者 POD 風(fēng)險(xiǎn)的生物標(biāo)志物并取得不同程度的研究成果[5-12]。但這些研究結(jié)果較為分散且很難臨床實(shí)踐轉(zhuǎn)化。為解決這些問題,本研究收集 8 種炎癥-免疫反應(yīng)標(biāo)志物并在脊柱手術(shù)患者中全面刻畫其表達(dá)模式及與脊柱手術(shù)患者 POD關(guān)聯(lián)。通過 LASSO 算法構(gòu)建 CIIRS (公式 NLR水平×0.537+PLR水平×0.009+MLR水平×0.168 -HRR水平×1.548+MHR水平×0.954+CAR水平×6.166);此外,CIIRS 具有極滿意的預(yù)測(cè)脊柱手術(shù)患者 POD 性能(AUC:0.936);隨后,LASSO 算法確定 CIIRS 獨(dú)立于年齡、吸煙、手術(shù)時(shí)間預(yù)測(cè)脊柱手術(shù)患者 POD。中性粒細(xì)胞、淋巴細(xì)胞和單核細(xì)胞是血液中白細(xì)胞亞型,介導(dǎo)外周和中樞炎癥反應(yīng),參與免疫調(diào)節(jié)和導(dǎo)致認(rèn)知功能障礙性炎癥。血小板通過調(diào)節(jié)免疫和炎癥導(dǎo)致認(rèn)知功能障礙[18]。單核細(xì)胞動(dòng)員和刺激可以釋放增強(qiáng)炎癥反應(yīng)的細(xì)胞因子,放大損傷性炎癥反應(yīng)[7]。淋巴細(xì)胞減少、兒茶酚胺和皮質(zhì)醇水平升高、淋巴細(xì)胞向淋巴組織重新分布以及細(xì)胞凋亡加速,結(jié)合疾病能激活損傷性炎癥反應(yīng)[19]。血紅蛋白下降會(huì)造成血氧合及氧輸送能力下降,腦血氧飽和度降低,腦內(nèi)乙酰膽堿減少,增加 POD 風(fēng)險(xiǎn)[10]。高RDW 會(huì)影響紅細(xì)胞生成,增加紅細(xì)胞脆性,導(dǎo)致破碎,也表現(xiàn)出促炎作用,縮短紅細(xì)胞存活時(shí)間。此外,也具有促進(jìn)氧化應(yīng)激反應(yīng)作用,產(chǎn)生大量活性氧自由基,引起神經(jīng)元損傷和凋亡[11]。HDL-C 能夠逆轉(zhuǎn)膽固醇運(yùn)輸,防止脂質(zhì)水平升高,并防止內(nèi)皮功能障礙、氧化應(yīng)激、炎癥、血栓形成等,也能夠結(jié)合 Aβ 肽并阻礙其聚集成淀粉樣蛋白,降低Aβ 肽神經(jīng)毒性[12]。CRP 是急性期炎癥反應(yīng)、感染和組織損傷的非特異性標(biāo)志物,通過激活白介素-6(interleukin-6,IL-6) 誘導(dǎo)神經(jīng)損傷[4]。血清白蛋白是反應(yīng)炎癥和營(yíng)養(yǎng)狀況常用標(biāo)志物,具有抗炎、維持生理穩(wěn)態(tài)和抗氧化活性作用[20]。上述理論背景及本研究結(jié)果強(qiáng)調(diào) CIIRS 具有多層次、多維度、多功能特點(diǎn)的綜合指標(biāo),其臨床意義包括:(1) 將分散的炎癥 -免疫反應(yīng)標(biāo)志物進(jìn)行整合,從多角度揭示炎癥-免疫反應(yīng)與 POD 風(fēng)險(xiǎn)的關(guān)聯(lián),提高預(yù)測(cè)準(zhǔn)確度;(2) 使用炎癥 -免疫反應(yīng)標(biāo)志物的實(shí)際觀察值,非最佳截?cái)嘀祦眍A(yù)測(cè) POD 風(fēng)險(xiǎn),提高臨床實(shí)踐轉(zhuǎn)化效果。
構(gòu)建風(fēng)險(xiǎn)模型是管理 POD 的一種有效解決方案。既往研究基于傳統(tǒng) Logistic 模型確定骨科手術(shù)患者 POD 風(fēng)險(xiǎn)變量及構(gòu)建預(yù)測(cè)模型[21-22]。盡管 Logistic模型具有很好的解釋性,但由于某些因素與輸出變量有因果關(guān)系,可能導(dǎo)致統(tǒng)計(jì)學(xué)結(jié)果不顯著;此外,邏輯回歸模型準(zhǔn)確度較低,在實(shí)際臨床應(yīng)用中受限[23]。因此,本研究在構(gòu)建 CIIRS 及評(píng)估預(yù) POD風(fēng)險(xiǎn)關(guān)系時(shí),均采用 LASSO 算法,它可以解決傳統(tǒng)Logistic 模型的多重共線性及過擬合問題;也將一部分變量系數(shù)壓縮至 0,實(shí)現(xiàn)變量選擇。ML 模型能識(shí)別數(shù)據(jù)模式并優(yōu)化自身性能,比傳統(tǒng) Logistic 模型具有更多數(shù)學(xué)運(yùn)算,更好定義風(fēng)險(xiǎn)因素和結(jié)果間復(fù)雜關(guān)系,具有極高預(yù)測(cè)準(zhǔn)確性。本研究基于年齡、吸煙、手術(shù)時(shí)間和 CIIRS 構(gòu)建 10 種 ML 模型,通過校準(zhǔn)曲線、ROC、PRC 和 PRGC 發(fā)現(xiàn) XGBoost 模型的綜合診斷性能幾乎接近完美。因此,選擇使用XGBoost 算法構(gòu)建預(yù)測(cè)脊柱手術(shù)患者 POD 風(fēng)險(xiǎn)模型以達(dá)到最佳診斷水平。然而,ML 算法存在復(fù)雜非線性關(guān)系,導(dǎo)致模型結(jié)果難以解釋,產(chǎn)生“黑匣子”問題,限制模型臨床應(yīng)用[24]。因此,最新研究使用SHAP 通過全局和局部可視化來解釋 ML 模型結(jié)果以解決“黑匣子”問題[25]。本研究的 SHAP 絕對(duì)值條形圖揭示年齡、吸煙、手術(shù)時(shí)間和 CIIRS 對(duì) POD 的風(fēng)險(xiǎn)預(yù)測(cè)具有顯著積極作用;同時(shí),也證實(shí) CIIRS在 XGBoost 模型上分配了最大貢獻(xiàn)值,在吸煙的亞組分析中也得到一致結(jié)果,其次的貢獻(xiàn)值排名依次是手術(shù)時(shí)間,年齡和吸煙。SHAP 散點(diǎn)圖可以顯著觀察到 4 個(gè)關(guān)鍵 POD 風(fēng)險(xiǎn)變量 SHAP 值存在“兩端分離”現(xiàn)象,表明這些風(fēng)險(xiǎn)變量能很好區(qū)分 POD。本研究也通過單病例 SHAP 瀑布圖解釋 XGBoost 模型的預(yù)測(cè)結(jié)果。該患者 CIIRS 為 2.174,不吸煙,手術(shù)時(shí)間 117 min,年齡 60 歲,XGBoost 模型基本預(yù)測(cè)概率為 0.024,最終預(yù)測(cè)概率 0.001,該患者實(shí)際狀態(tài)為無 POD。明顯看出盡管 XGBoost 模型基本預(yù)測(cè)概率在診斷 POD 上具有很低值,但與訓(xùn)練后 XGBoost模型最終預(yù)測(cè)概率比,似乎增加 0.023 倍的 POD 診斷的假陽性率。
圍術(shù)期預(yù)防策略是資源和人員密集型的,所有手術(shù)患者一般預(yù)防不符合成本效益,而且可能沒有必要。一個(gè)更實(shí)在的解決方案是實(shí)現(xiàn)脊柱手術(shù)患者 POD 風(fēng)險(xiǎn)分層,針對(duì)高風(fēng)險(xiǎn)患者采取預(yù)防措施。本研究通過年齡、吸煙、手術(shù)時(shí)間和 CIIRS 構(gòu)建了XGBoost 模型來預(yù)測(cè)脊柱手術(shù)患者 POD 風(fēng)險(xiǎn);同時(shí),SHAP 為預(yù)測(cè)模型提供個(gè)性化、合理解釋,打破一直阻礙復(fù)雜模型發(fā)展的“黑匣子”問題,顯著提高臨床模型的應(yīng)用價(jià)值和醫(yī)護(hù)對(duì)預(yù)測(cè)模型的信心。本研究的 XGBoost 模型能確定是否可以啟動(dòng)更積極、更充分的預(yù)防措施,這既優(yōu)化有限醫(yī)療資源,又提高患者健康水平,還可使患者避免因藥物暴露引起的不良事件。如術(shù)中可以使用右美托咪定[26]或體溫管理[27]來降低脊柱手術(shù) POD 風(fēng)險(xiǎn)。
本研究也存在一定局限性。首先,本研究是回顧性設(shè)計(jì),數(shù)據(jù)來自單中心患者,因此存在選擇偏倚可能性;其次,未詳細(xì)收集術(shù)前治療藥物的信息,這潛在地影響患者炎癥 -反應(yīng)標(biāo)志物水平;最后,本研究仍然需要進(jìn)行大樣本、多中心的研究來更好地訓(xùn)練 XGBoost 模型。
綜上所述,本研究全面刻畫了脊柱手術(shù)患者8 種炎癥 -免疫反應(yīng)標(biāo)志物水平并構(gòu)建 CIIRS。通過比較 10 種 ML 模型建立了一種預(yù)測(cè) POD 風(fēng)險(xiǎn)的XGBoost 模型并利用 SHAP 可視化模型,該模型是篩選脊柱手術(shù)患者高 POD 風(fēng)險(xiǎn)的重要臨床工具,具有極高的預(yù)測(cè)性能。