曾瑞璜,陳智熙,王小林,秦昌宏
(敘永縣中醫(yī)醫(yī)院檢驗(yàn)科,四川 敘永 646400)
心血管疾病是中國(guó)居民死亡的首要原因,患病率仍處于持續(xù)上升趨勢(shì),其中缺血性腦卒中的發(fā)病人數(shù)居首位,具有較高的致殘率和致死率[1]。肺炎是卒中后最常見的并發(fā)癥,是院內(nèi)死亡和卒中后不良結(jié)局的主要原因[2-3]。因此早期診斷急性缺血性腦卒中并發(fā)卒中相關(guān)肺炎(stroke-associated pneumonia,SAP)具有重要意義。以往相關(guān)研究多采用單指標(biāo),評(píng)分量表及新型生物標(biāo)志物等方式進(jìn)行預(yù)測(cè)[4-6],在預(yù)測(cè)效能和臨床實(shí)用性方面具有一定局限性。而列線圖作為一種模型可視化方式,在疾病的診斷和預(yù)測(cè)方面具有較好的臨床實(shí)用性[7-8],近年來隨著預(yù)測(cè)計(jì)算器的興起,使得列線圖的使用和實(shí)用性得到極大的提高[9],并且常規(guī)檢驗(yàn)數(shù)據(jù)易獲取、成本低,具有一定可操作性。因此本研究擬通過對(duì)常規(guī)檢驗(yàn)數(shù)據(jù)進(jìn)行挖掘分析,應(yīng)用最小絕對(duì)收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)篩選相關(guān)檢驗(yàn)參數(shù),構(gòu)建聯(lián)合檢測(cè)的列線圖模型,布置網(wǎng)頁(yè)計(jì)算器,充分發(fā)揮檢驗(yàn)數(shù)據(jù)的剩余價(jià)值,為臨床提供經(jīng)濟(jì)、方便、準(zhǔn)確的預(yù)測(cè)模型。
1.1 研究對(duì)象 選取2019年6月—2021年6月敘永縣中醫(yī)醫(yī)院確診為急性缺血性腦卒中的患者作為研究的基本人群,2021年7月—2022年6月在該院確診為急性缺血性腦卒中的患者作為外部驗(yàn)證人群。納入標(biāo)準(zhǔn):符合SAP的診斷標(biāo)準(zhǔn)[10]。排除標(biāo)準(zhǔn):(1)腦卒中后遺癥期和出血性腦卒中;(2)嚴(yán)重肝、腎功能不全;(3)自身免疫性疾??;(4)血液疾病和腫瘤。
1.2 方法
1.2.1 資料收集 回顧性收集患者的性別、年齡、高血壓病史、糖尿病史,及入院24 h內(nèi)的相關(guān)實(shí)驗(yàn)室檢測(cè)結(jié)果。使用邁瑞B(yǎng)C-6900檢測(cè)血常規(guī)參數(shù):白細(xì)胞(WBC)、中性粒細(xì)胞(NEU)、淋巴細(xì)胞(LYM)、血紅蛋白(Hb)、紅細(xì)胞體積分布寬度變異系數(shù)(RDW-CV)、血小板(PLT)。使用德國(guó)思塔高STA R MAX檢測(cè)凝血相關(guān)項(xiàng)目參數(shù):纖維蛋白原(Fib)和D-二聚體。使用邁瑞B(yǎng)S-2000M檢測(cè)生化相關(guān)參數(shù):丙氨酸氨基轉(zhuǎn)移酶(ALT)、天門冬氨酸氨基轉(zhuǎn)移酶(AST)、γ-谷氨酰轉(zhuǎn)肽酶(γ-GGT)、清蛋白(Alb)、前清蛋白(PA)、尿素(Ur)、肌酐(Cr)、尿酸(UA)、葡萄糖(Glu)、甘油三酯(TG)、總膽固醇(TC)、高密度脂蛋白膽固醇(HDL-C)、低密度脂蛋白膽固醇(LDL-C)、載脂蛋白A1(APOA1)、載脂蛋白B(APOB)、同型半胱氨酸(Hcy),脂蛋白a[Lp(a)]。試劑盒和校準(zhǔn)品分別購(gòu)自深圳邁瑞和德國(guó)思塔高公司。
1.2.2 LASSO篩選檢驗(yàn)參數(shù) LASSO通過構(gòu)造一個(gè)懲罰函數(shù),控制參數(shù)lambda對(duì)高緯度特征變量進(jìn)行壓縮,將不重要特征變量系數(shù)壓縮為0,留下相關(guān)性較強(qiáng)的特征變量。參數(shù)設(shè)置:模型設(shè)置為二項(xiàng)式分布(“family-binomial”),衡量模型指標(biāo)函數(shù)為-2倍的對(duì)數(shù)似然值(type.measure=deviance),通過10折交叉驗(yàn)證選擇最優(yōu)lambda參數(shù)。
1.2.3 聯(lián)合檢測(cè)列線圖預(yù)測(cè)模型構(gòu)建與驗(yàn)證 采用訓(xùn)練集、測(cè)試集和驗(yàn)證集將LASSO篩選出的檢驗(yàn)項(xiàng)目參數(shù)通過回歸系數(shù)加權(quán)后對(duì)模型進(jìn)行可視化分析與驗(yàn)證。每個(gè)指標(biāo)根據(jù)相應(yīng)權(quán)重具有不同的評(píng)分范圍,根據(jù)指標(biāo)得分總和從而獲得患者的患病風(fēng)險(xiǎn)概率。構(gòu)建的列線圖模型通過Hosmer-Lemeshow檢驗(yàn)分析列線圖的擬合度,繪制校準(zhǔn)曲線分析模型的校準(zhǔn)度,采用受試者工作特征(receiver operating characteristic,ROC)曲線判斷模型預(yù)測(cè)效能,評(píng)估模型的區(qū)分度。通過臨床決策曲線(decision curve analysis,DCA)判斷模型的凈獲益,評(píng)估模型的臨床實(shí)用性。
1.2.4 布置網(wǎng)頁(yè)計(jì)算器 通過將傳統(tǒng)列線圖以網(wǎng)頁(yè)計(jì)算器形式布置到shinyapps.io網(wǎng)頁(yè)上,臨床醫(yī)生通過訪問相應(yīng)網(wǎng)址或者二維碼能方便、快捷的使用該計(jì)算器進(jìn)行風(fēng)險(xiǎn)預(yù)測(cè),提高臨床實(shí)用性。
2.1 研究人群基本情況 本次研究共納入379例急性缺血性腦卒中患者作為研究的基本人群,其中SAP 42例,發(fā)病率為11.08%。SAP組與非SAP組患者的基本情況見表1。
表1 研究人群基本情況
2.2 建模驗(yàn)證人群拆分 將2019年6月—2021年6月收治的379例急性缺血性腦卒中病例以7∶3分配方式,分為訓(xùn)練集265例,年齡(66.07±9.30)歲;測(cè)試集114例,年齡(66.38±9.64)歲;兩組患者年齡、性別、高血壓病史、糖尿病史、NEU、LYM、PA、Fib、D-二聚體等臨床特征比較,差異均無(wú)統(tǒng)計(jì)學(xué)意義(均P>0.05),見表2。將2021年7月—2022年6月收治的157例急性缺血性腦卒中病例作為驗(yàn)證集,其中SAP 24例,發(fā)病率為15.29%。
表2 訓(xùn)練集和測(cè)試集臨床數(shù)據(jù)比較[例(%)]
2.3 模型建立 將納入的25個(gè)檢驗(yàn)參數(shù)通過LASSO的10折交叉驗(yàn)證對(duì)特征變量組合進(jìn)行擬合,采用-2倍的對(duì)數(shù)似然值作為評(píng)價(jià)標(biāo)準(zhǔn),將25個(gè)特征變量通過增加lambda值進(jìn)行壓縮組合,見圖1。通過對(duì)壓縮過程中不同變量數(shù)目組合間的性能評(píng)價(jià),剔除不重要的臨床特征變量,從而篩選出最優(yōu)變量及最優(yōu)lambda參數(shù),見圖2。最終選擇lambda.1se作為最優(yōu)變量選擇參數(shù),共篩選出5個(gè)檢驗(yàn)參數(shù),分別NEU、LYM、PA、Fib、D-二聚體。
圖1 LASSO壓縮參數(shù)
圖2 LASSO篩選參數(shù)
將篩選出的5個(gè)檢驗(yàn)參數(shù)根據(jù)最佳截?cái)嘀颠M(jìn)行二分類變量轉(zhuǎn)化,以簡(jiǎn)化列線圖模型和網(wǎng)頁(yè)計(jì)算器,便于臨床使用,見表3。根據(jù)5個(gè)檢驗(yàn)參數(shù)相應(yīng)回歸系數(shù)權(quán)重構(gòu)建列線圖模型,通過每個(gè)檢驗(yàn)參數(shù)不同的權(quán)重可以獲得不同的評(píng)分,從而計(jì)算出相應(yīng)的風(fēng)險(xiǎn)概率。
表3 檢驗(yàn)參數(shù)最佳截?cái)嘀?/p>
2.4 模型的驗(yàn)證 為了防止聯(lián)合檢測(cè)出現(xiàn)過擬合,通過對(duì)全數(shù)據(jù)集的拆分,使用訓(xùn)練集構(gòu)建模型,測(cè)試集進(jìn)行內(nèi)部驗(yàn)證模型,驗(yàn)證集進(jìn)行外部驗(yàn)證模型。以確保聯(lián)合檢測(cè)模型的準(zhǔn)確性及穩(wěn)定性。區(qū)分度評(píng)估顯示全數(shù)據(jù)集曲線下面積(Area Under Curve,AUC)=0.924,靈敏度為83.33%,特異度為87.24%,見圖3。訓(xùn)練集AUC=0.922,靈敏度為79.31%,特異性為91.95%,見圖4。測(cè)試集AUC=0.919,靈敏度為84.62%,特異性為86.14%,見圖5。結(jié)果表明模型具有良好的預(yù)測(cè)效能,全數(shù)據(jù)集、訓(xùn)練集、測(cè)試集5個(gè)檢驗(yàn)參數(shù)AUC與聯(lián)合檢測(cè)相比差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見表4。校準(zhǔn)度評(píng)估顯示訓(xùn)練集其Hosmer-Lemeshow檢驗(yàn)擬合優(yōu)度差異無(wú)統(tǒng)計(jì)學(xué)意義(χ2=6.565,P=0.476),校準(zhǔn)曲線顯示預(yù)測(cè)概率和實(shí)際概率具有良好的一致性。測(cè)試集其Hosmer-Lemeshow檢驗(yàn)擬合優(yōu)度差異無(wú)統(tǒng)計(jì)學(xué)意義(χ2=7.015,P=0.319),校準(zhǔn)曲線顯示預(yù)測(cè)概率和實(shí)際概率較一致,見圖6。臨床實(shí)用性評(píng)估顯示訓(xùn)練集DCA結(jié)果顯示高風(fēng)險(xiǎn)閾值在0~0.75,凈獲益為0~0.11。測(cè)試集高風(fēng)險(xiǎn)閾值在0~0.65,凈獲益為0~0.11,見圖7。均具有良好的臨床實(shí)用性,外部驗(yàn)證采用驗(yàn)證集,其AUC=0.850,靈敏度為66.67%,特異度為89.47%,陽(yáng)性似然比為6.33,陰性似然比為0.37,陽(yáng)性預(yù)測(cè)值為53.30%,陰性預(yù)測(cè)值為93.70%,模型具有良好的外部適用性,見圖8。
圖3 全數(shù)據(jù)集ROC曲線
圖4 訓(xùn)練集ROC曲線
圖5 測(cè)試集ROC曲線
表4 預(yù)測(cè)效能比較
圖6 訓(xùn)練集和測(cè)試集校準(zhǔn)曲線
圖7 訓(xùn)練集和測(cè)試集DCA曲線
圖8 驗(yàn)證集ROC曲線
2.5 模型呈現(xiàn) 將構(gòu)建好的聯(lián)合檢測(cè)列線圖預(yù)測(cè)模型,見圖9。通過R語(yǔ)言的“DynNom”軟件包布置到https://ww-rstudiomn.shinyapps.io/SAP-nomgram/或通過二維碼進(jìn)行訪問,見圖10。經(jīng)過測(cè)試網(wǎng)頁(yè)計(jì)算器性能,測(cè)試結(jié)果穩(wěn)定,見圖11。
圖9 訓(xùn)練集聯(lián)合預(yù)測(cè)列線圖模型
圖10 二維碼
圖11 網(wǎng)頁(yè)計(jì)算器
本研究通過常規(guī)檢驗(yàn)數(shù)據(jù)的挖掘分析,構(gòu)建了急性缺血性腦卒中并發(fā)SAP的預(yù)測(cè)模型,模型具有較好的預(yù)測(cè)效能,且通過布置網(wǎng)頁(yè)計(jì)算器提高了其臨床實(shí)用性,助力臨床進(jìn)行早期診斷及治療。近年來列線圖在臨床醫(yī)學(xué)中廣泛使用,其相對(duì)于傳統(tǒng)logistic 回歸模型,其可視化得到了極大的提高,具有一定的臨床實(shí)用性[11-12]。列線圖的臨床實(shí)用性雖然有所提高,但是臨床醫(yī)生的使用率并不高,其使用過程仍不夠簡(jiǎn)便。因此本研究為了進(jìn)一步提高臨床實(shí)用性,對(duì)構(gòu)建的列線圖進(jìn)行優(yōu)化,將連續(xù)變量轉(zhuǎn)變?yōu)槎诸愖兞?,并采用網(wǎng)頁(yè)列線圖形式,使參數(shù)指標(biāo)更加直觀的判斷,并且使用性能方面得到較大提升,對(duì)于輔助臨床醫(yī)生進(jìn)行診斷更具有臨床實(shí)用性[13]。當(dāng)然檢驗(yàn)參數(shù)指標(biāo)的選擇也尤為重要,以往對(duì)于SAP的預(yù)測(cè)多采用的是單個(gè)指標(biāo),評(píng)分量表及新的生物標(biāo)志物,這些方式可能存在一定局限性,例如可能會(huì)增加患者檢測(cè)費(fèi)用,預(yù)測(cè)效能不高,不利于臨床推廣,不便于臨床醫(yī)生使用。因此本研究采用既往常規(guī)檢驗(yàn)數(shù)據(jù)的挖掘,通過LASSO篩選出具有價(jià)值的檢驗(yàn)參數(shù),充分利用檢驗(yàn)數(shù)據(jù)的剩余價(jià)值,開發(fā)出新的聯(lián)合檢測(cè)預(yù)測(cè)模型,為臨床提供輔助診斷。Li等[14]研究顯示通過機(jī)器學(xué)習(xí)開發(fā)的缺血性腦卒中并發(fā)SAP的模型中XGBoost模型具有較高的診斷效能,其AUC為0.841,靈敏度為81.00%,特異度為73.30%。張娜等[15]研究比較了6種預(yù)測(cè)缺血性腦卒中并發(fā)醫(yī)院獲得性肺炎的評(píng)分量表,其中ISAN量表預(yù)測(cè)效能最高,AUC為0.778。本研究通過NEU、LYM、PA、Fib、D-二聚體等5個(gè)檢驗(yàn)參數(shù)構(gòu)建的列線圖網(wǎng)頁(yè)計(jì)算器,其訓(xùn)練集AUC為0.922、測(cè)試集AUC為0.919,驗(yàn)證集AUC為0.850,預(yù)測(cè)效能均較高,并且臨床實(shí)用性較高,對(duì)于臨床輔助診斷具有一定價(jià)值。
急性缺血性腦卒中后容易誘發(fā)免疫抑制綜合征(SIDS),過度、持續(xù)的炎癥反應(yīng)可能耗盡免疫系統(tǒng),最終導(dǎo)致系統(tǒng)免疫的抑制,削弱人體對(duì)病原體的抵抗力并導(dǎo)致肺部感染[16]。本文研究篩選出的檢驗(yàn)參數(shù)中,NEU、LYM、Fib、D-二聚體反映機(jī)體的炎癥及免疫系統(tǒng)狀態(tài),研究結(jié)果顯示SAP組中NEU、Fib、D-二聚體均高于非SAP組,LYM低于非SAP組,表明機(jī)體可能存在持續(xù)的炎癥狀態(tài),存在免疫抑制風(fēng)險(xiǎn)。相關(guān)研究[17]表明,營(yíng)養(yǎng)不良會(huì)增加感染風(fēng)險(xiǎn),營(yíng)養(yǎng)風(fēng)險(xiǎn)評(píng)分越低,SAP發(fā)病率越高。PA作為營(yíng)養(yǎng)不良的敏感指標(biāo),可能是確定臨床狀態(tài)和預(yù)后的有效指標(biāo),本文研究顯示,SAP組PA水平低于非SAP組,并且具有良好的預(yù)測(cè)效能,研究結(jié)果與文獻(xiàn)[17]一致。當(dāng)然本研究也存在一定局限性,由于是單中心小樣本量研究,外部驗(yàn)證僅采用了本中心數(shù)據(jù),模型外部適用性和準(zhǔn)確性可能存在一定偏倚。
綜上所述,本研究利用檢驗(yàn)相關(guān)參數(shù)構(gòu)建的SAP預(yù)測(cè)模型在臨床相關(guān)性及臨床實(shí)用性方面都具有一定價(jià)值,充分實(shí)現(xiàn)了檢驗(yàn)項(xiàng)目的剩余價(jià)值,為臨床早期的預(yù)防性抗菌藥物治療、抗炎和免疫調(diào)節(jié)治療以及營(yíng)養(yǎng)支持提供了依據(jù)。
利益沖突:所有作者均聲明不存在利益沖突。