李楠 鄭嶸炅 揭方榮 朱艷芳 魯曉擘
HBV相關(guān)慢加急性肝衰竭(HBV-related acute-on-chronic liver failure, HBV-ACLF)常伴有多臟器功能損害,并發(fā)癥多,3個(gè)月的病死率高(40%~70%)[1-3]。如何根據(jù)臨床表現(xiàn)及實(shí)驗(yàn)室檢查等手段準(zhǔn)確判斷HBV-ACLF患者的預(yù)后,對(duì)于制訂臨床治療策略有很好的指導(dǎo)意義。本研究的目的是采用機(jī)器學(xué)習(xí)中的Bagging算法分析HBV-ACLF短期死亡影響因素并建立HBV-ACLF短期預(yù)后模型,比較其與MELD評(píng)分對(duì)患者短期預(yù)后評(píng)估的效能。
一、研究對(duì)象
收集2010年1月至2017年4月在新疆醫(yī)科大學(xué)第一附屬醫(yī)院感染性疾病中心住院且資料齊全、隨訪至少3個(gè)月的HBV-ACLF患者131例,其中男性110例,女性21例,年齡22~81歲。依據(jù)電話隨訪3個(gè)月生存情況,將其分為生存組和死亡組。HBV-ACLF納入標(biāo)準(zhǔn):①年齡≥18歲;②有慢性乙型病毒性肝炎(CHB)病史,且HBsAg陽(yáng)性超過(guò)6個(gè)月;③近28 d內(nèi)黃疸進(jìn)行性加深[總膽紅素(TBil)≥171 μmol/L或者每日上升≥17.1 μmol/L],伴凝血功能障礙[凝血酶原活動(dòng)度(PTA)≤40%或國(guó)際標(biāo)準(zhǔn)化比率(INR)≥1.5],同時(shí)伴有腹水和(或)肝性腦病。排除標(biāo)準(zhǔn):①合并藥物性、酒精性、自身免疫性、脂肪性、代謝性肝病等其他因素肝損害,②合并其他嗜肝病毒感染,③合并妊娠,④合并其他嚴(yán)重影響生命的疾病,⑤肝移植術(shù)后患者。
二、 觀察指標(biāo)
收集131例患者診斷HBV-ACLF時(shí)的年齡、性別、血白蛋白、血尿素、血肌酐、血鈉、血氨、總膽紅素、間接膽紅素、直接膽紅素、谷丙轉(zhuǎn)氨酶、谷草轉(zhuǎn)氨酶、堿性磷酸酶、甲胎蛋白、甘油三酯、膽固醇、高密度脂蛋白、低密度脂蛋白、空腹血糖、血膽汁酸、膽堿酯酶、白細(xì)胞、中性粒細(xì)胞百分比、降鈣素原、血小板、血漿凝血酶原時(shí)間、凝血酶原活動(dòng)度、國(guó)際標(biāo)準(zhǔn)化比值、血漿纖維蛋白原、活化部分凝血活酶時(shí)間、確診乙肝時(shí)間、乙肝表面抗原定量、HBV DNA、發(fā)病時(shí)是否使用抗病毒藥物、有無(wú)食管胃底靜脈曲張、有無(wú)脾大、有無(wú)脂肪肝、吸煙史、飲酒史、發(fā)病至入院天數(shù)。
三、研究方法
Bagging算法(Bootstrap Aggregation,Bagging):Breiman 于1996年提出了著名的Bagging方法,它是改進(jìn)不穩(wěn)定學(xué)習(xí)算法和規(guī)則學(xué)習(xí)算法的準(zhǔn)確性的簡(jiǎn)單但強(qiáng)大的獨(dú)立集成方法之一。該方法主要基于可重復(fù)采樣(Bootstrap Sampling)技術(shù),即每次按照一定的概率,以“有放回”的方式重新選取樣本,這樣就可以產(chǎn)生多個(gè)具有差異性的樣本子集;然后利用這些不同的樣本子集分別對(duì)多個(gè)基分類(lèi)器進(jìn)行訓(xùn)練就可以得到具有一定多樣性的集成分類(lèi)器。 Bagging模型的多樣性策略簡(jiǎn)單而有效,可以降低誤差(variance),并且可以避免過(guò)擬合。
MELD評(píng)分[4]計(jì)算公式為:11.2×ln(INR)+3.8×ln(總膽紅素mg/dL)+9.6×ln(血清Cr mr/dL)+6.4×(病原學(xué):酒精性或膽汁淤積性為0,其他為1)。
四、統(tǒng)計(jì)學(xué)方法
一般資料的分析,通過(guò)軟件SPSS.19.0完成,計(jì)數(shù)資料采用卡方檢驗(yàn),計(jì)量資料采用t檢驗(yàn)。Bagging算法通過(guò)軟件R 3.4.1進(jìn)行處理。采用受試者工作曲線( receiver operating characteristic curve,ROC)及曲線下面積( area under the curve,AUC)比較Bagging算法及MELD評(píng)分對(duì)預(yù)后的評(píng)估效能。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
一、一般資料
本研究共納入131例HBV-ALCF患者,3個(gè)月內(nèi)死亡61例,存活70例,3個(gè)月病死率為46.6%。生存組男59人,女11人,死亡組男51人,女10人,兩組性別差異無(wú)統(tǒng)計(jì)學(xué)意義。生存組和死亡組平均年齡分別為(43±11.03)歲和(50±15.28)歲,差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。
二、Bagging算法結(jié)果
HBV-ALCF患者生存狀況為二分類(lèi)變量(生存和死亡),我們將41個(gè)特征變量作為自變量納入Bagging模型來(lái)預(yù)測(cè)作為因變量的HBV-ALCF患者的生存狀況。在本實(shí)驗(yàn)中,數(shù)據(jù)集被劃分為二部分:訓(xùn)練集(全部數(shù)據(jù))、測(cè)試集(10-折交叉驗(yàn)證方式產(chǎn)生測(cè)試集),利用R軟件中的Fold()函數(shù)來(lái)產(chǎn)生測(cè)試集,它將整個(gè)數(shù)據(jù)集分成10份,每次實(shí)驗(yàn)取其中一份作為測(cè)試集,剩余的9份作為訓(xùn)練集,取多次測(cè)試準(zhǔn)確率的平均值作為最終結(jié)果。10-折交叉驗(yàn)證保證了數(shù)據(jù)集中的每一個(gè)樣本都有機(jī)會(huì)作為測(cè)試集和訓(xùn)練集。Bagging算法的核心函數(shù)為bagging()函數(shù)。
圖1顯示了41個(gè)特征變量和它們的重要性得分,從中我們可以明顯得出HBV-ACLF短期死亡影響因素順序依次為年齡、凝血酶原活動(dòng)度、血漿凝血酶原時(shí)間、白蛋白、血尿素、血鈉、血小板、甘油三酯、血漿纖維蛋白原、中性粒細(xì)胞百分比。利用Bagging算法分類(lèi)的結(jié)果,計(jì)算出Bagging模型的準(zhǔn)確率為90%,靈敏度90%,特異度90%,誤判率10%,10折交叉驗(yàn)證數(shù)據(jù)集的平均誤判率為30.92%。
三、ROC曲線及相關(guān)結(jié)果
Bagging算法及MELD評(píng)分ROC曲線下面積分別為0.9743,0.6985。MELD評(píng)分對(duì)HBV-ACLF患者3個(gè)月病死率預(yù)測(cè)能力弱,Bagging模型預(yù)測(cè)能力強(qiáng)。
圖1 Bagging算法特征變量重要性得分
目前,臨床上對(duì)HBV- ACLF患者的診療難度較大。很多HBV-ACLF患者對(duì)常規(guī)藥物治療效果差,往往需要短期內(nèi)接受人工肝、肝移植等治療。另外,影響該類(lèi)患者近期預(yù)后的因素尚未十分明確。目前臨床上最常用的預(yù)后評(píng)分模型仍是基于歐美人群(酒精性、藥物性肝病、丙肝為主)終末期肝病建立的評(píng)分標(biāo)準(zhǔn),如MELD評(píng)分系統(tǒng)、Child-Pugh分級(jí)評(píng)分[5-6]、慢性肝衰竭-序貫器官衰竭評(píng)估(CLIF-SOFA)評(píng)分模型等[7],它們對(duì)于HBV- ACLF患者的預(yù)后準(zhǔn)確性不夠滿意[8-9]。HBV- ACLF患者的病情嚴(yán)重程度及預(yù)后如何,是否應(yīng)及早肝移植,亟需準(zhǔn)確的預(yù)后評(píng)估系統(tǒng)進(jìn)行評(píng)估及判斷。
MELD評(píng)分被廣泛應(yīng)用于肝衰竭病人特別是終末期肝病患者的預(yù)后評(píng)估。MELD評(píng)分的優(yōu)點(diǎn)是無(wú)肝性腦病等主觀性指標(biāo),血肌酐、血膽紅素及國(guó)際標(biāo)準(zhǔn)化比值均以客觀的實(shí)驗(yàn)室檢查作為依據(jù),唯一需要醫(yī)師判斷的指標(biāo)是病因,故結(jié)果較為客觀。
本研究中,Bagging模型相比MELD評(píng)分法預(yù)測(cè)效果好(見(jiàn)圖2)。從Bagging模型所得重要性評(píng)分可以看出,年齡、凝血酶原活動(dòng)度、血漿凝血酶原時(shí)間、白蛋白、血尿素、血鈉、血小板、甘油三酯、血漿纖維蛋白原、中性粒細(xì)胞百分比是影響HBV-ACLF患者預(yù)后前十位的重要指標(biāo)。
年齡及凝血功能對(duì)HBV-ACLF患者的預(yù)后有重要影響,這在國(guó)內(nèi)、國(guó)際的研究中均已得到論證[10-11]。血清白蛋白(Alb)通常被用來(lái)評(píng)估肝臟合成功能,但患者的基礎(chǔ)營(yíng)養(yǎng)狀況對(duì)白蛋白的水平有一定影響,故臨床上并不能完全以血清白蛋白來(lái)評(píng)估肝臟合成功能。血尿素氮(BUN)、血鈉(Na)是臨床評(píng)價(jià)腎功能的重要指標(biāo)。因BUN的產(chǎn)生受很多因素的影響,如感染、發(fā)熱、高蛋白飲食、營(yíng)養(yǎng)不良等高分解狀態(tài)等,而血肌酐(Cr)是由肌肉組織釋放的,較少受疾病及代謝狀態(tài)的影響,故目前觀點(diǎn)普遍認(rèn)為,Cr水平是比BUN更準(zhǔn)確的評(píng)價(jià)腎功能指標(biāo)。但有研究表明在急性肝損傷發(fā)生過(guò)程中BUN是比Cr更敏感的指標(biāo)[12]。考慮因尿素經(jīng)由肝臟合成,當(dāng)肝功能異常,BUN的代謝則更容易受到影響。血小板計(jì)數(shù)主要與以下因素相關(guān):①肝臟、腎臟所產(chǎn)生的促血小板生成素(TPO)的減少;②門(mén)脈高壓癥所造成的脾大脾亢,導(dǎo)致血小板被大量清除。脾功能亢進(jìn)多為肝硬化期或者肝硬化失代償期,故本指標(biāo)亦提示發(fā)病前肝臟基礎(chǔ)功能已明顯損害的患者,預(yù)后更差。甘油三酯(TG):當(dāng)肝細(xì)胞受損嚴(yán)重時(shí),肝臟參與的內(nèi)源性脂蛋白代謝途徑明顯受到影響。在既往關(guān)于HBV-ACLF的預(yù)后因素分析中,鮮少有把甘油三酯列入預(yù)后模型的研究,臨床上也極少會(huì)考慮甘油三酯對(duì)HBV-ACLF患者預(yù)后的影響,值得引起注意。中性粒細(xì)胞百分比升高往往提示存在細(xì)菌感染,慢加急性肝衰竭時(shí)患者免疫力下降,易并發(fā)肺部感染、腹腔感染等,進(jìn)一步加重對(duì)機(jī)體的打擊。
另外,Bagging算法中膽紅素指標(biāo)的重要性在第11位,與傳統(tǒng)評(píng)分系統(tǒng)相比,重要性靠后??紤]因?yàn)锳CLF診斷中膽紅素的標(biāo)準(zhǔn)每日上升≥17.1 μmol/L,故早期就診且行血液檢驗(yàn)的患者的膽紅素可能未達(dá)到171 μmol/L。另外,目前血液透析等治療手段的臨床應(yīng)用對(duì)血膽紅素值的干預(yù)也占重要作用[13]。膽紅素在肝臟瘀滯會(huì)使肝細(xì)胞功能受損,同時(shí)血膽紅素過(guò)高也會(huì)對(duì)大腦及神經(jīng)系統(tǒng)造成損害,故膽紅素指標(biāo)仍是評(píng)價(jià)肝功能及預(yù)后的重要指標(biāo)之一。
機(jī)器學(xué)習(xí)因其智能化的分析模式而在分析數(shù)據(jù)時(shí)占據(jù)優(yōu)勢(shì)。越來(lái)越多的疾病開(kāi)始使用機(jī)器學(xué)習(xí)方法構(gòu)建診斷及預(yù)后模型,比如肝性腦病預(yù)后因素分析[14]、前列腺癌的診斷及乳腺癌的診斷等。若能實(shí)現(xiàn)多中心、大樣本量(>500例)數(shù)據(jù)訓(xùn)練,則可以建立準(zhǔn)確性更高的預(yù)測(cè)模型。本研究中,我們希望將來(lái)可以納入更多樣本,建立精確的預(yù)后評(píng)估模型,實(shí)現(xiàn)對(duì)HBV- ACLF患者的精準(zhǔn)的預(yù)后判斷。同時(shí)我們希望,能夠開(kāi)發(fā)出相關(guān)檢測(cè)軟件(APP),將給臨床工作帶來(lái)便利。