高小蓮,肖明中,陶軍秀,艾亞婷
目前,非酒精性脂肪性肝?。╪onalcoholic fatty liver disease,NAFLD)已成為全球最常見(jiàn)的慢性肝病和重要的公共衛(wèi)生問(wèn)題[1]。最近的一篇薈萃分析顯示中國(guó)成年人NAFLD患病率現(xiàn)已高達(dá)29.2%[2]。據(jù)馬爾可夫模型預(yù)測(cè),至2030年,中國(guó)將成為NAFLD總體患病率和相對(duì)患病率增幅最大的國(guó)家,屆時(shí)中國(guó)將超過(guò)美國(guó)成為因肝臟相關(guān)并發(fā)癥而死亡人數(shù)最多的國(guó)家[3]。目前,超聲檢查為篩查NAFLD的首選檢查方法,但其僅對(duì)中重度脂肪肝的靈敏度高,容易遺漏輕度脂肪肝;磁共振成像檢查的質(zhì)譜分析及質(zhì)子密度脂肪分?jǐn)?shù)對(duì)輕度脂肪肝的靈敏度高,但有賴于患者的依從性并存在費(fèi)用顧慮;肝活檢是診斷NAFLD特別是非酒精性脂肪性肝炎(NASH)的“金標(biāo)準(zhǔn)”,但有創(chuàng)傷,可發(fā)生并發(fā)癥和采樣誤差,臨床應(yīng)用極為謹(jǐn)慎,可重復(fù)性差[4]。作為疾病風(fēng)險(xiǎn)評(píng)估的量化工具,疾病預(yù)測(cè)模型可為患者和醫(yī)務(wù)人員提供更直觀、科學(xué)的信息。借助無(wú)創(chuàng)的體檢指標(biāo)或低成本、易采集的實(shí)驗(yàn)室檢查項(xiàng)目構(gòu)建靈敏度和特異度高的疾病預(yù)測(cè)模型對(duì)評(píng)估高危人群NAFLD發(fā)生風(fēng)險(xiǎn)(概率)、促進(jìn)個(gè)體分級(jí)分層管理具有重要的衛(wèi)生經(jīng)濟(jì)學(xué)意義。本文擬對(duì)已追溯到的8種NAFLD預(yù)測(cè)模型特征進(jìn)行分析,包括其建模方法、模型的質(zhì)量表現(xiàn)、模型的表達(dá)和應(yīng)用現(xiàn)狀等方面,以期為NAFLD預(yù)測(cè)模型的選擇和進(jìn)一步研究提供參考依據(jù)。
本文采取文獻(xiàn)檢索法,檢索不設(shè)定起止時(shí)間,限定為學(xué)術(shù)期刊。在基于專業(yè)知識(shí)的前提下,以“Nonalcoholic fatty liver disease”“fatty liver disease”“prediction”為英文關(guān)鍵詞檢索PubMed、Web of Science;以“非酒精性脂肪性肝病”“脂肪肝”“預(yù)測(cè)模型”為中文關(guān)鍵詞檢索中國(guó)知網(wǎng)、維普網(wǎng)、萬(wàn)方數(shù)據(jù)知識(shí)服務(wù)平臺(tái)。研究人員通過(guò)小組討論和共識(shí)會(huì)議,制定納入標(biāo)準(zhǔn)和排除標(biāo)準(zhǔn)。納入標(biāo)準(zhǔn):完整的研究性論文且可以在網(wǎng)上找到;論文的研究對(duì)象為普通人群;論文中有明確的模型表達(dá)式;模型的預(yù)測(cè)因子必須無(wú)創(chuàng)、易收集、低成本。排除標(biāo)準(zhǔn):排除針對(duì)肝纖維化的預(yù)測(cè)模型。第一批論文是僅通過(guò)在標(biāo)題和摘要中搜索特定的關(guān)鍵字獲得,從中篩選出有明確的模型表達(dá)式的論文,然后對(duì)篩選出的論文進(jìn)行分析,剔除研究對(duì)象為肝病患者的論文,對(duì)保留下來(lái)的論文進(jìn)行全文閱讀,進(jìn)一步排除針對(duì)肝纖維化的預(yù)測(cè)模型,如NAFLD纖維化評(píng)分(NFS)、FI4、BARD評(píng)分、Pohl評(píng)分等。
按照上述納入及排除標(biāo)準(zhǔn),共查找到8種預(yù)測(cè)模型[5-12],表1歸納了8種預(yù)測(cè)模型名稱、第一作者、首發(fā)時(shí)間、期刊名稱、研究地點(diǎn)及研究?jī)?nèi)容。
表1 8種預(yù)測(cè)模型文獻(xiàn)的基本情況Table 1 General data of studies of eight NAFLD prediction models
2.1 建模方法 除Mika Aizawa模型[12]使用蒙特卡洛法(又稱隨機(jī)模擬方法或統(tǒng)計(jì)模擬方法)建模外,其余7種預(yù)測(cè)模型均為L(zhǎng)ogistic回歸建模。Logistic回歸分析在醫(yī)學(xué)研究中的應(yīng)用非常廣泛,是研究二分類或多分類反應(yīng)變量與多個(gè)影響因素之間關(guān)系的多重回歸分析方法,主要用于探索疾病發(fā)生的危險(xiǎn)因素,利用回歸模型計(jì)算結(jié)局的發(fā)生率,對(duì)結(jié)局做出概率性的預(yù)測(cè)[13]。
然而,隨著人工智能的興盛,機(jī)器學(xué)習(xí)(machine learning,ML)[14]因其方法學(xué)優(yōu)勢(shì)而已經(jīng)成為大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)的方向,如基于人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)等的建模方法正逐漸變成分析數(shù)據(jù)的流行工具[15]。ANN具有并行處理方式、自組織、自學(xué)習(xí)、聯(lián)想記憶和容錯(cuò)等能力,尤其在疾病的早期預(yù)防、診斷和預(yù)后評(píng)估等方面可起到專家系統(tǒng)的作用[16]。至今,研究小組未能檢索到基于機(jī)器學(xué)習(xí)算法的NAFLD預(yù)測(cè)模型,分析其原因可能在于:NAFLD的危險(xiǎn)因素及診斷標(biāo)準(zhǔn)尚處于探討階段,研究者在權(quán)重系數(shù)的假設(shè)檢驗(yàn)、計(jì)算權(quán)重系數(shù)的可信區(qū)間及隱含層權(quán)重系數(shù)的醫(yī)學(xué)解釋等方面尚有爭(zhēng)議。
2.2 模型的質(zhì)量表現(xiàn) 預(yù)測(cè)模型的評(píng)價(jià)指標(biāo)常從區(qū)分度和校準(zhǔn)度兩個(gè)方面衡量[17]。衡量區(qū)分度的最常用的指標(biāo)是C統(tǒng)計(jì)量,當(dāng)終點(diǎn)事件是二分類變量時(shí),受試者工作特征曲線下面積(AUC)即為C值,C值越接近1,表示模型區(qū)分度越好[17]。校準(zhǔn)度則考察預(yù)測(cè)結(jié)果和實(shí)際狀況的吻合程度,常用Hosmer-Lemeshow卡方(H-L χ2)檢驗(yàn)進(jìn)行評(píng)價(jià)。H-L χ2檢驗(yàn)中P≥0.05代表模型效準(zhǔn)度較好;P<0.05代表模型效準(zhǔn)度較差[18]。本文最終納入的8種NAFLD預(yù)測(cè)模型預(yù)測(cè)NAFLD的AUC為0.797~0.870,靈敏度為71.7%~93.1%,特異度為71.0%~93.4%,說(shuō)明模型區(qū)分度較好。但是,除了AUC,其他指標(biāo)鮮見(jiàn)報(bào)道,究其原因,首先在于AUC簡(jiǎn)單直觀、易于理解,其次是絕大多數(shù)研究系內(nèi)部驗(yàn)證(先建模后驗(yàn)證),僅用AUC即可說(shuō)明問(wèn)題。8種NAFLD預(yù)測(cè)模型的預(yù)測(cè)因子、截?cái)嘀导百|(zhì)量表現(xiàn)詳見(jiàn)表2。
表2 8種NAFLD預(yù)測(cè)模型的預(yù)測(cè)因子、截?cái)嘀导百|(zhì)量表現(xiàn)Table 2 Predictors,cutoff values and performance accuracy of eight NAFLD prediction models
2.3 模型的表達(dá)及應(yīng)用現(xiàn)狀
2.3.1 脂肪肝指數(shù)(FLI)[5]根據(jù)原始研究,F(xiàn)LI對(duì)肝脂肪變性的預(yù)測(cè)準(zhǔn)確性良好,AUC為0.840;預(yù)測(cè)因子包括腰圍、體質(zhì)指數(shù)(BMI)、三酰甘油(TG)和谷氨酰轉(zhuǎn)肽酶(GGT)。FLI臨床意義為:FLI取值范圍為0~100,F(xiàn)LI<30排除肝脂肪變性,靈敏度為87.0%;FLI≥60判定為肝脂肪變性,特異度為 86.0%。FLI計(jì)算公式如下:
目前已有眾多學(xué)者將FLI引用到NAFDL的篩查。KOEHLER等[19]報(bào)道FLI能準(zhǔn)確識(shí)別NAFLD,在2 652名〔平均年齡(76.3±6.0)歲〕老年白種人中,F(xiàn)LI診斷NAFLD的AUC為0.813。伊朗學(xué)者M(jìn)OTAMED等[20]根據(jù)其隊(duì)列研究第一階段(2009—2010年)的數(shù)據(jù)運(yùn)用FLI進(jìn)行計(jì)算,評(píng)估FLI對(duì)NAFLD的預(yù)測(cè)能力,結(jié)果顯示,在相關(guān)數(shù)據(jù)存在的情況下,男性和女性FLI的AUC分別為0.712和0.721,F(xiàn)LI顯示出較好的預(yù)測(cè)NAFLD新發(fā)病例的能力。韓國(guó)學(xué)者KIM等[21]在成年人中進(jìn)行FLI的驗(yàn)證,結(jié)論為FLI是預(yù)測(cè)NALFD的一個(gè)有用的指標(biāo),但其并不優(yōu)于腰圍和BMI。CHEN等[22]研究認(rèn)為男性和女性受試者FLI的截?cái)嘀悼煞謩e設(shè)置為20和10,以增加在該地區(qū)人群中預(yù)測(cè)NAFLD的敏感性。HUANG等[23]證實(shí)FLI可準(zhǔn)確識(shí)別NAFLD,其AUC為0.834,最佳截?cái)嘀禐?0,靈敏度為79.89%,特異度為71.51%。經(jīng)FLI診斷的NAFLD患者的代謝特征(腰圍、BMI、血壓、血脂、轉(zhuǎn)氨酶)較超聲診斷的NAFLD患者更差(均P<0.05),提示FLI可早預(yù)警,有助于NAFLD的早干預(yù)。
2.3.2 肝脂肪變性指數(shù)(HSI)[6]原始研究顯示HSI預(yù)測(cè)NAFLD的準(zhǔn)確性良好且操作簡(jiǎn)單。HSI臨床意義為:HSI<30時(shí),可排除NAFLD,靈敏度為93.1%;HSI>36時(shí),可判定為NAFLD,特異度為92.4%。驗(yàn)證隊(duì)列中HSI<30或>36的2 692名受試者中2 305名(85.6%)被正確分類。HSI計(jì)算公式:HSI=8×丙氨酸氨基轉(zhuǎn)移酶(ALT)/天冬氨酸氨基轉(zhuǎn)移酶(AST)+BMI(+2,如果女性;+2,如果糖尿?。?。
郭蕓蕾等[24]研究認(rèn)為HSI結(jié)合超聲的實(shí)時(shí)剪切波彈性成像(SWE)技術(shù)更有利于準(zhǔn)確檢出中重度NAFLD,AUC為(0.904±0.028)、靈敏度為88.3%、特異度為87.0%。CHEN等[25]在成年阻塞型睡眠呼吸暫停低通氣綜合征(OSAHS)患者中進(jìn)行了FLI和HSI篩查NAFLD的準(zhǔn)確性驗(yàn)證,結(jié)果顯示,F(xiàn)LI和HSI預(yù)測(cè)NAFLD的AUC分別為0.802〔95%CI(0.762,0.839)〕 和 0.753〔95%CI(0.710,0.793)〕,F(xiàn)LI的 AUC顯著高于HSI(P=0.038 3),F(xiàn)LI和HSI的最佳截?cái)嘀捣謩e為60(靈敏度66%、特異度80%)和35(靈敏度81%、特異度60%),因此FLI和HSI均可作為成年OSAHS患者NAFLD的篩查工具,但FLI優(yōu)于HSI。
2.3.3 肝脂肪百分比[7]肝脂肪百分比
肝脂肪百分比是利用代謝和遺傳因素預(yù)測(cè)NAFLD和肝臟脂肪化。原始研究結(jié)果表明代謝綜合征和2型糖尿病、空腹血清胰島素水平、AST、AST/ALT是NAFLD的獨(dú)立預(yù)測(cè)因子。模型預(yù)測(cè)組AUC為0.870,驗(yàn)證組AUC為0.860,最佳截?cái)嘀禐?0.640,高于此值預(yù)示NAFLD的存在,靈敏度為86%,特異度為71%[7]。遺傳信息的加入僅使肝脂肪百分比預(yù)測(cè)精度提高了不到1%,說(shuō)明遺傳僅作為內(nèi)因存在,后天環(huán)境因素在NAFLD發(fā)病方面具有更重要的作用。
2.3.4 Framingham脂肪變性指數(shù)(FSI)[8]FSI以年齡、性別、BMI、TG、高血壓、糖尿病、ALT/AST作為預(yù)測(cè)因子。FSI=7.981+0.011×年齡(years)-0.146×性別(女性=1;男性 =0)+0.173×BMI(kg/m2)+0.007×TG(mg/dl)+0.593× 高血壓(是=1;不是=0)+0.789×糖尿?。ㄊ?1;不是=0)+1.1×ALT/AST(≥1.33,是=1;不是=0)。
總體上,F(xiàn)SI預(yù)測(cè)NAFLD的AUC為0.830。當(dāng)模型中加入ALT/AST≥1.33這一預(yù)測(cè)因子時(shí),AUC整體提高到0.845。在23的截?cái)嘀瞪?,F(xiàn)SI推導(dǎo)隊(duì)列中識(shí)別NAFLD的靈敏度為79%,特異度為71%。模型的外部驗(yàn)證顯示,F(xiàn)SI對(duì)非西班牙裔白人的AUC為0.775(n=1 714),整個(gè)驗(yàn)證隊(duì)列的AUC為0.760(n=4 489),模型擬合度較好。在23的截?cái)嘀瞪希現(xiàn)SI驗(yàn)證隊(duì)列對(duì)NAFLD的靈敏度較低,特異度較高。研究者認(rèn)為,F(xiàn)SI可用于NAFLD的流行病學(xué)研究,但還需要在臨床實(shí)踐中評(píng)估FSI的準(zhǔn)確性和成本效益[8]。
2.3.5 ZJU指數(shù)[9]ZJU指數(shù)以BMI、空腹血糖(FPG)、TG、ALT/AST為預(yù)測(cè)因子。ZJU指數(shù)<32時(shí),排除NAFLD,靈敏度為92.4%;ZJU指數(shù)>38時(shí),判定為NAFLD,特異度為93.3%。ZJU指數(shù)=BMI(kg/m2)+FPG(mmol/L)+TG(mmol/L)+3×ALT(U/L)/AST(U/L)(+2,如果女性)。
ZJU指數(shù)已得到國(guó)內(nèi)學(xué)者的驗(yàn)證。劉捷等[26]驗(yàn)證了ZJU指數(shù)對(duì)健康體檢人群NAFLD患病風(fēng)險(xiǎn)的預(yù)測(cè)價(jià)值,結(jié)果顯示,30 826名體檢者基于ZJU指數(shù)所得NAFLD的患病率為34.83%,其中男性人群為40.53%,女性人群為29.26%,且患病趨勢(shì)隨著年齡的增長(zhǎng)而升高。LI等[27]通過(guò)一項(xiàng)橫斷面研究評(píng)估了ZJU指數(shù)在中國(guó)人群中預(yù)測(cè)NAFLD的準(zhǔn)確性,結(jié)果顯示ZJU指數(shù)預(yù)測(cè)NAFLD的AUC為0.925〔95%CI(0.919,0.931)〕,顯著高于脂肪肝指數(shù)、肝脂肪變性指數(shù)、脂肪累積產(chǎn)物、內(nèi)臟脂肪指數(shù)四種模型(P<0.001)。
2.3.6 NAFLD篩查評(píng)分(NSS)[10]NSS也是面向中國(guó)人群的簡(jiǎn)易評(píng)分模型,是由年齡、FPG、BMI、TG、ALT/AST、尿酸(UA)組成的基本評(píng)分(表3)。NSS預(yù)測(cè)男性和女性NAFLD的截?cái)嘀涤胁町?,其中男性截?cái)嘀禐?2,AUC為0.825,靈敏度為79.86%,特異度為66.13%;女性截?cái)嘀禐?9,AUC為0.861,靈敏度和特異度分別為89.39%和68.98%。研究者開(kāi)發(fā)NSS的目的在于識(shí)別NAFLD高危人群,但NSS的外部驗(yàn)證尚未見(jiàn)文獻(xiàn)報(bào)道。
表3 NSS評(píng)分(分)Table 3 Scoring of the NSS
2.3.7 Young Jin Park模型[11]Young Jin Park模型用來(lái)篩選需要行腹部超聲檢查的NAFLD患者。研究者利用多因素Logistic回歸分析確定了ALT/AST、γ-谷氨酰轉(zhuǎn)肽酶(γ-GTP)、TG、BMI四個(gè)獨(dú)立的危險(xiǎn)因素。通過(guò)將1個(gè)臨床評(píng)分點(diǎn)與0.7個(gè)Logistic回歸系數(shù)進(jìn)行比較,確定指數(shù)系統(tǒng)分值為0~6分(表4)。Young Jin Park模型預(yù)測(cè)NAFLD的AUC為0.797,以3分作為截?cái)嘀?,靈敏度為71.7%,特異度為75.9%;以4分作為截?cái)嘀?,靈敏度降低至46.9%,特異度升高至92.3%。
表4 Young Jin Park模型評(píng)分(分)Table 4 Scoring of the Young-Jin Park model
2.3.8 Mika Aizawa模 型[12]Mika Aizawa模 型 針 對(duì) 的 是NAFLD的預(yù)防與管理,其以生活方式相關(guān)風(fēng)險(xiǎn)因素為基礎(chǔ),應(yīng)用蒙特卡洛法建立脂肪肝的自然史模型,探討影響脂肪肝發(fā)病過(guò)程的主要因素,結(jié)果顯示,BMI和低密度脂蛋白膽固醇/高密度脂蛋白膽固醇(LDL-C/HDL-C)顯著升高有助于預(yù)測(cè)脂肪肝的發(fā)生。利用30~39歲的受試者的數(shù)據(jù)模擬脂肪肝的自然史時(shí),患病率從40~59歲時(shí)的20%上升到32%,然后下降到70~79歲時(shí)的24%。當(dāng)BMI和LDL-C/HDL-C每年更新降低/增加1%時(shí),脂肪肝的最高患病率(32%)分別降低/增加-8.0%/10.7%和-1.6%/1.4%。研究者認(rèn)為BMI和LDL-C/HDL-C對(duì)預(yù)測(cè)脂肪肝的發(fā)生具有重要作用,而個(gè)體BMI的年度變化對(duì)脂肪肝的自然史影響更大,持續(xù)控制個(gè)人BMI可能是減少脂肪肝發(fā)生、預(yù)防NAFLD最有效的選擇[12]。
2.4 模型的優(yōu)缺點(diǎn) 綜上所述,8種NAFLD預(yù)測(cè)模型均是借助無(wú)創(chuàng)、低廉、易采集的預(yù)測(cè)因子預(yù)測(cè)NAFLD發(fā)生風(fēng)險(xiǎn),擬合的數(shù)學(xué)模型簡(jiǎn)易、精煉,這既有助于評(píng)估普通人群在當(dāng)前的健康狀態(tài)下未來(lái)患NAFLD的情況,也為健康管理工作者實(shí)施健康教育和行為干預(yù)提供了便捷、有說(shuō)服力的工具。同時(shí),相較于目前臨床常用的肝臟瞬時(shí)彈性檢測(cè)(FiborTouch)技術(shù),疾病預(yù)測(cè)模型還具有不受操作員手法及患者性別、體位、皮下組織等因素影響的優(yōu)勢(shì)。不過(guò),疾病的發(fā)生并不能通過(guò)建立一個(gè)數(shù)學(xué)公式就足以判定。從統(tǒng)計(jì)建模的角度來(lái)說(shuō),上述模型的結(jié)局多為是否發(fā)生,屬于二分類變量,所以,在模型的技術(shù)層面上還是存在待解決的問(wèn)題,如預(yù)測(cè)因子的選擇、模型的外部驗(yàn)證等環(huán)節(jié)分歧較大,也限制了模型的推廣。
NAFLD預(yù)測(cè)模型研究正處于起始階段,尤其是建模方法還有優(yōu)化的空間。ML與NAFLD大數(shù)據(jù)結(jié)合,有望為我國(guó)NAFLD的一級(jí)預(yù)防提供更為準(zhǔn)確的預(yù)測(cè)模型。隨著衛(wèi)生信息技術(shù)的快速發(fā)展,人們多通過(guò)電子病歷、醫(yī)療檢查和監(jiān)護(hù)設(shè)備、可穿戴健康設(shè)備、手機(jī)健康應(yīng)用程序(APP)等進(jìn)行大數(shù)據(jù)的收集。ML屬于人工智能模型的一個(gè)分支,是基于計(jì)算機(jī)系統(tǒng)對(duì)大數(shù)據(jù)的訓(xùn)練,能實(shí)現(xiàn)高精度的預(yù)測(cè)和決策[28]。當(dāng)今ML程序框架發(fā)展迅速,極大地簡(jiǎn)化了訓(xùn)練過(guò)程,為慢性病精準(zhǔn)管理提供了可能性。基于NAFLD大數(shù)據(jù)與ML融合進(jìn)行展望,肝病研究者可從以下入手:第一,強(qiáng)化和提高數(shù)據(jù)管理能力。大數(shù)據(jù)包含結(jié)構(gòu)化、半結(jié)構(gòu)化或非結(jié)構(gòu)化信息,具有復(fù)雜的相互關(guān)系和組織網(wǎng)絡(luò)。數(shù)據(jù)管理過(guò)程的某些不確定性可影響ML的質(zhì)量,導(dǎo)致決策的偏倚,如數(shù)據(jù)損壞、數(shù)據(jù)輸入錯(cuò)誤、重復(fù)或丟失記錄、不完整記錄等。因此,研究團(tuán)隊(duì)必須從數(shù)據(jù)標(biāo)準(zhǔn)化、存儲(chǔ)和傳輸?shù)确矫鎻?qiáng)化和提高數(shù)據(jù)管理能力。第二,加強(qiáng)學(xué)科協(xié)同、交叉、融合,科學(xué)地使用ML算法。支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、決策樹(shù)等ML算法的精準(zhǔn)度、靈敏度和適應(yīng)性各有不同[29],醫(yī)學(xué)研究者只有與計(jì)算機(jī)工程師進(jìn)行優(yōu)勢(shì)互補(bǔ)、熟悉不同算法的適用條件及優(yōu)缺點(diǎn)和方法學(xué)特征、根據(jù)大數(shù)據(jù)來(lái)源選擇合適的算法才有可能創(chuàng)造出具有最佳效果的NAFLD預(yù)測(cè)模型。
作者貢獻(xiàn):高小蓮進(jìn)行文章的構(gòu)思及論文撰寫(xiě);肖明中負(fù)責(zé)文章的質(zhì)量控制及審校,對(duì)文章整體負(fù)責(zé),監(jiān)督管理;陶軍秀、艾亞婷進(jìn)行文獻(xiàn)收集及整理。
本文無(wú)利益沖突。