沈夢媛,李 偉,顏學(xué)兵,李春陽,周冬梅
根據(jù)臨床特征,新型冠狀病毒肺炎(COVID-19)可分為:輕型、普通型、重型和危重型[1]。輕癥患者預(yù)后良好,重癥是構(gòu)成死亡的主要原因。然而,由于快速的病毒復(fù)制和細胞因子風(fēng)暴,該疾病可在短時間內(nèi)(7~10 d)由輕癥進展為重癥,包括急性呼吸窘迫綜合征(ARDS)和其他多器官并發(fā)癥等[2]。這種突然暴發(fā)性進展導(dǎo)致了疾病死亡率的增加。目前還沒有針對COVID-19的特效藥物。部分重癥患者最終會出現(xiàn)呼吸困難,而在早期階段患者沒有特異的癥狀[3]。因此,及早確定COVID-19進展的實驗室預(yù)測因素至關(guān)重要。通過嚴格的監(jiān)測和早期診斷,及時識別和干預(yù)是降低重癥患者病死率的關(guān)鍵。
選取2020年1月10日—2月27日在南京鼓樓醫(yī)院共享數(shù)據(jù)平臺可收集到的江蘇多地醫(yī)院救治的COVID-19患者,共計342例。數(shù)據(jù)經(jīng)脫敏處理,真實可靠。
納入標(biāo)準:符合國家衛(wèi)生健康委員會發(fā)布的《新型冠狀病毒肺炎診療方案(試行第八版)》[1]診斷標(biāo)準的確診病例。排除標(biāo)準:臨床資料不全及精神障礙者。按病情嚴重程度分為輕型、普通型、重型、危重型[4]。各型診斷標(biāo)準為:輕型為①臨床癥狀輕微;②影像學(xué)未見肺炎表現(xiàn)。普通型為①具有發(fā)熱、呼吸道癥狀等;②影像學(xué)可見肺炎表現(xiàn)。重型為符合下列特征之一,即①出現(xiàn)氣促,呼吸≥30 次/min;②靜息狀態(tài)下,指脈血氧飽和度≤93%;③動脈血氧分壓(PaO2)/吸氧濃度(FiO2)≤300 mm Hg;④肺部影像學(xué)顯示24~ 48 h內(nèi)病灶進展>50%。危重型為符合下列特征之一,即①出現(xiàn)呼吸衰竭,且需要機械通氣;②出現(xiàn)休克;③合并其他器官衰竭需要入住ICU治療。輕型和普通型患者為非重癥組,重型和危重型患者為重癥組。
回顧性分析兩組患者的基礎(chǔ)信息包括性別、年齡、體重指數(shù)(BMI),既往生活史信息如有無吸煙、飲酒,患病史信息如有無糖尿病、高血壓、慢性肺疾病等;實驗室指標(biāo)[空腹血糖(FBG)、紅細胞計數(shù)(RBC)、血紅蛋白(HGB)、血小板計數(shù)(PLT)、白細胞計數(shù)、中性粒細胞百分比(NE%)、中性粒細胞百分比/淋巴細胞百分比(NLR)等。
采用 SPSS 23.0軟件進行分析,計量資料符合正態(tài)分布的數(shù)據(jù)采用均數(shù)±標(biāo)準差表示,組間比較采用獨立樣本t檢驗。不符合正態(tài)分布的數(shù)據(jù)采用中位數(shù)(四分位數(shù))表示,組間比較采用Mann-WhitneyU檢驗。分類計數(shù)資料采用例數(shù)(百分比)表示,組間比較采用χ2檢驗。利用logistic回歸分析確定獨立危險因素,對各指標(biāo)繪制受試者工作特征(ROC)曲線,并計算曲線下面積(AUC)。利用K折交叉驗證后LASSO回歸算法和彈性網(wǎng)回歸算法分別針對預(yù)測重癥患者的高風(fēng)險因子進行篩選,并建立預(yù)測模型。最后利用ROC曲線及AUC值對各模型性能進行比較,從而篩選出最佳預(yù)測模型。按檢驗水準P<0.05表示差異具有統(tǒng)計學(xué)意義。
2.1.1 一般情況比較 分析兩組患者基礎(chǔ)信息、患病史、生活史等發(fā)現(xiàn),重癥組中糖尿病患者比例較高,同時,年齡、BMI也高于非重癥組,差異具有統(tǒng)計學(xué)意義(P<0.05),見表1。
2.1.2 實驗室指標(biāo)比較 重癥組患者的NE%、NLR高于非重癥組患者,淋巴細胞百分比(LY%)、PLT低于非重癥組患者,差異均具有統(tǒng)計學(xué)意義 (P<0.05),見表1。
表1 重癥與非重癥COVID-19患者一般情況比較Table 1 Clinical and laboratory data compared between severe and non-severe COVID-19 patients
2.1.3 重癥COVID-19危險因素分析 以是否重癥為因變量,單因素分析結(jié)果顯示差異有統(tǒng)計學(xué)意義的指標(biāo)為自變量,進行逐步logistic回歸分析,結(jié)果顯示BMI、NLR、FBG為重癥COVID-19的獨立危險因素,見表2。
表2 重癥COVID-19的危險因素逐步logistic回歸分析Table 2 Stepwise logistic regression analysis of risk factors for severe COVID-19
2.1.4 應(yīng)用ROC曲線評價相關(guān)指標(biāo)對重癥風(fēng)險預(yù)測價值 BMI 預(yù)測重癥COVID-19的 ROC曲線的AUC是 0.738,P<0.001,95%可信區(qū)間為 0.688~0.784;FBG的 ROC曲線的AUC是 0.839,P<0.001,95%可信區(qū)間為 0.796~0.877;NLR的 ROC曲 線 的AUC是 0.818,P<0.001,95%可信區(qū)間為 0.773~0.857,見圖1??梢姡珺MI、FBG、NLR 均能較好地預(yù)測重癥COVID-19的發(fā)生,其中 FBG較BMI、NLR預(yù)測的靈敏度更高。
對于預(yù)測重癥COVID-19患者的高風(fēng)險因子,利用K折交叉驗證后LASSO回歸算法和彈性網(wǎng)回歸算法分別進行篩選,經(jīng)過對比分析,最終選出以下5項指標(biāo):糖尿病、LY%、NLR、PLT、總膽紅素(TBIL)。
2.2.1K折交叉驗證的LASSO 回歸 根據(jù)本文數(shù)據(jù)設(shè)定3折交叉驗證,也就是κ= 3。本文采用使均方誤差(MSE)最小值的logλ確定的λ值去擬合模型。在測試集上驗證使用K折交叉驗證之后的 LASSO 模型,模型的誤差為 0.060 033 26,并且通過模型篩選出7個變量,分別是NLR、單核細胞百分比(MO%)、單核細胞數(shù)、RBC、HGB、PLT、TBIL,見表3。
表3 K折交叉驗證的 LASSO 回歸結(jié)果Table 3 Results of K-fold cross-validation for LASSO regression model
2.2.2 彈性網(wǎng)回歸 結(jié)合彈性網(wǎng)模型參數(shù)的最優(yōu)組合為λ= 0.02,α= 0.8,篩選出的特征結(jié)果如下,LY%、NLR、PLT、TBIL,見表4。
表4 彈性網(wǎng)回歸結(jié)果Table 4 The results of elastic net regression
由于 LASSO 回歸算法在篩選變量時預(yù)測變量具有群組效應(yīng),也就是當(dāng)一組數(shù)據(jù)具有很密切的相關(guān)關(guān)系時,用 LASSO 回歸只能選出其中一個變量而且不考慮變量被篩選的缺陷,因此可結(jié)合彈性網(wǎng)回歸進行變量篩選。
本研究利用重采樣方式,指定參數(shù)為 LOOCV,最終得到彈性網(wǎng)模型的最優(yōu)網(wǎng)絡(luò)參數(shù),根據(jù)選擇最優(yōu)模型的原則就是選擇均方根誤差(RMSE)值最小的模型,最終,結(jié)合彈性網(wǎng)模型參數(shù)的最優(yōu)組合λ= 0.02,α= 0.8,篩選出的特征結(jié)果如下:LY%、NLR、PLT、TBIL。
2.2.3 重癥COVID-19危險因素logistic回歸預(yù)測 利用上文篩選出的4個連續(xù)特征變量以及1個分類變量糖尿病,采用 logistic 回歸模型對是否為重癥進行預(yù)測,結(jié)果見表5。
優(yōu)勢比可以解釋為特征中1個單位的變化導(dǎo)致的結(jié)果發(fā)生比的變化:一般系數(shù)>1,則表明特征的值增加,結(jié)果的發(fā)生比會增加,反之,結(jié)果的發(fā)生比降低??梢缘玫奖疚牡腖Y%、NLR的系數(shù)<1,而糖尿病、TBIL、PLT的系數(shù)>1。
2.2.4 多重共線性檢驗 對各個特征進行潛在多重共線性檢驗,查看VIF統(tǒng)計量的值,根據(jù)VIF經(jīng)驗法則,共線性對模型影響不大(VIF統(tǒng)計 量<5),見表5。
表5 logistic 回歸和各變量優(yōu)勢比結(jié)果Table 5 The results of logistic regression and multicollinearity test
2.2.5 驗證模型準確性 將數(shù)據(jù)按8∶2的比例劃分訓(xùn)練集和測試集,在訓(xùn)練集上模型的混淆矩陣,可以看出預(yù)測錯誤的概率為0.083 9,見表6。
表6 logistic回歸訓(xùn)練集混淆矩陣結(jié)果(閾值為0.5)Table 6 logistic regression analysis of training set confusion matrix at cutoff value of 0.5
同時給出在測試集上模型的混淆矩陣,其預(yù)測錯誤的概率為0.102 9,見表7。
表7 logistic回歸測試集混淆矩陣結(jié)果(閾值為0.5)Table 7 logistic regression analysis of testing set confusion matrix at cutoff value of 0.5
2.2.6 應(yīng)用ROC評價相關(guān)模型預(yù)測性能 為更好地選擇具體模型,分別加入了交叉驗證后的logistic 模型、基于 BIC 準則的最優(yōu)子集模型與全模型進行對比,模型的選擇主要是利用 ROC曲線對分類器性能進行比較,上述 ROC 曲線中分別給出了logistic 全(full)模型、基于 BIC 最小模型、基于K折交叉驗證logistic 模型,由于K折交叉驗證后將模型的特征減少至只剩一個變量,即LY%,僅有一個特征的模型,成為糟糕(bad)模型。logistic全模型的AUC值最高,為0.906 332,僅有一個特征的糟糕模型AUC值最小,為0.862 997 7。從各個方面來看,logistic全模型的預(yù)測效果更優(yōu)。因此,從該模型可以得到,重癥COVID-19的高危因素為:糖尿病、LY%、NLR、PLT、TBIL。見圖2。
重癥COVID-19患者病情通常迅速進展,常合并多種并發(fā)癥,最終導(dǎo)致患者死亡。因此,明確與病情嚴重程度相關(guān)的指標(biāo),及時準確判斷病情并采取相應(yīng)治療可能是降低重癥患者比例、減少COVID-19死亡的關(guān)鍵。
既往發(fā)現(xiàn)在233例肺炎鏈球菌肺炎患者中,F(xiàn)BG≥10 mmol/L的患者死亡率是FBG<7 mmol/L 患者的3.4倍[3]。在無糖尿病病史的患者中,疾病的嚴重程度與FBG的水平有很強的聯(lián)系[4],這與本研究結(jié)果相符。COVID-19嚴重程度與高血糖之間的關(guān)系可能是雙向的,感染可能帶來應(yīng)激狀態(tài),引發(fā)促炎性細胞因子的增強釋放,可能導(dǎo)致胰島素抵抗[5]。應(yīng)激也可能誘發(fā)應(yīng)激激素的釋放,使肝糖原溶解,加重影響[6]。這些因素共同作用,可能導(dǎo)致COVID-19重癥患者高血糖的發(fā)生。
有研究表明,COVID-19患者中白細胞和中性粒細胞計數(shù)增加,而淋巴細胞減少[7]。根據(jù) logistic 模型的結(jié)果可以看到,LY%的P值為0.027 5,明顯小于 0.05,表明LY%對于危重癥患者的預(yù)測具有顯著影響。同時結(jié)合模型中LY%的優(yōu)勢比其結(jié)果小于1,這就表明當(dāng)LY%減少時,重癥的可能性會增加。淋巴細胞的作用主要為體液免疫、細胞免疫和直接殺傷作用,因此,我們認為LY%的減少與疾病的發(fā)展相關(guān)。
根據(jù)logistic 模型的結(jié)果,NLR的P值為 0.819 7,明顯大于 0.1,表明NLR對于危重癥患者的預(yù)測不具有顯著影響。但因NLR為復(fù)合指標(biāo),且優(yōu)勢比為0.96,接近1,可以看作優(yōu)勢比≥1,因此,可以認為,NLR越高,重癥的發(fā)生率越高。其主要原因可能由于這一指標(biāo)主要反映了NE%與LY%之間的平衡,在本研究COVID-19患者隊列中,NLR也成為死亡率的獨立預(yù)測指標(biāo)之一,該結(jié)果與先前發(fā)表的研究一致[8-9]。有研究表明,與非重癥患者相比,重癥患者中較高的炎性細胞因子、趨化因子和NLR與疾病的嚴重程度相關(guān),提示細胞因子風(fēng)暴與疾病嚴重程度的關(guān) 系[10-13]。重癥患者由于免疫功能低下而更容易出現(xiàn)細菌和病毒雙重感染,這也可能是重癥患者中性粒細胞升高的原因之一。有研究發(fā)現(xiàn)NLR>19.94的患者死亡率更高[14],表明NLR的升高可作為預(yù)測COVID-19患者預(yù)后的標(biāo)志物[15]。上述發(fā)現(xiàn)均與本研究結(jié)果一致。
本研究發(fā)現(xiàn),BMI也是重癥COVID-19的獨立危險因素,高BMI已被確定為下呼吸道感染預(yù)后不佳的重要危險因素。肥胖患者的氣道狹窄與氣道關(guān)閉和氣道高反應(yīng)性相關(guān)[16]。COVID-19可能導(dǎo)致潛在的氣道威脅,并導(dǎo)致急性呼吸窘迫綜合征(ARDS)[17]。由于呼吸道阻力增加和胸壁力學(xué)增加,呼吸肌力量下降,需氧量增加了3倍以上[18],耗氧量增加會導(dǎo)致需要更多的氧氣支持,甚至呼吸衰竭。
本研究為一項多中心回顧性分析,比較了COVID-19重癥、非重癥患者的相關(guān)實驗室指標(biāo)及既往病史,此外,在分析原有數(shù)據(jù)的基礎(chǔ)上,通過LASSO回歸聯(lián)合彈性網(wǎng)回歸篩選高危因素,基于多因素回歸分析,將多個指標(biāo)進行整合,構(gòu)建預(yù)測模型,將各高危因素導(dǎo)致重癥的風(fēng)險進行量化,并通過多重共線性檢驗及ROC曲線對分類器性能的比較,證明該模型預(yù)測性能較佳,這對輔助臨床評估患者,選擇更具針對性的防治措施以及臨床工作具有指導(dǎo)意義。
本研究尚有幾個局限性:首先,樣本量較少,尤其是重癥患者,因數(shù)據(jù)受限,未能進一步闡述糖化血紅蛋白的影響。其次,當(dāng)收集相應(yīng)樣本時,處于不同炎癥階段的患者可能也會導(dǎo)致炎性因子風(fēng)暴指標(biāo)的變化。 第三,由于各地檢測儀器設(shè)備的不同,可能會存在系統(tǒng)誤差。
本次通過回顧性分析發(fā)現(xiàn)既往有糖尿病病史的患者中,重癥發(fā)生的比例更高,與其他研究的結(jié)論一致[19-20]。同時在研究中發(fā)現(xiàn),重癥患者的NE%、NLR、TBIL指標(biāo)較非重癥患者更高,LY%、PLT較輕癥患者更低。由此,我們認 為,F(xiàn)BG、BMI、NLR、NE%、LY%是 重 癥COVID-19的獨立危險因素。
COVID-19疫情防控任務(wù)仍然艱巨,如果能在確診早期判斷和評估出患者轉(zhuǎn)為重癥的潛在風(fēng)險,及時予以針對性治療,能降低疾病死亡率。因此,建議應(yīng)用更多研究以驗證FBG、BMI、NE%、LY%和NLR早期診斷重癥COVID-19患者的臨床價值,用于識別危重患者、改善患者預(yù)后。