黃良江 毛德文 鄭景輝 王明剛 姚春
1廣西中醫(yī)藥大學 (南寧 530200);廣西中醫(yī)藥大學第一附屬醫(yī)院 2肝病科,3科研部 (南寧 530023);4廣西中醫(yī)藥大學附屬瑞康醫(yī)院 (南寧 530023)
肝性腦?。╤epatic encephalopathy, HE)是一個累及多系統(tǒng)、多臟腑的復雜疾病,其臨床常表現(xiàn)為意識障礙、行為失常甚至昏迷等。它是各種肝病中常見的并發(fā)癥之一,其病因和發(fā)病機制復雜,同時也容易復發(fā)或者加重病情,最常見的形式是由于肝硬化和慢性肝病而發(fā)展起來的。HE 的識別、治療和臨床管理一直存在難以突破的瓶頸,面臨著診斷不足、發(fā)病機制不明確、表型缺乏統(tǒng)一的分類標準等挑戰(zhàn),而且,高死亡風險和與急性加重相關的高成本也給患者的生活質量帶來了嚴重的影響,并增加了社會經(jīng)濟負擔[1-3]。過去幾十年間,許多研究者都致力于建立HE 風險預測模型,以幫助醫(yī)生評估患者發(fā)生肝性腦病的概率[4]。隨著人工智能(artificial Intelligence, AI)技術的快速發(fā)展,它在醫(yī)學領域的應用日益受到關注[5]。最近的研究[6]表明,使用AI 技術對醫(yī)療數(shù)據(jù)進行系統(tǒng)分析可以有利于精準醫(yī)療,可使患者受益。人工智能技術具有處理大規(guī)模數(shù)據(jù)和挖掘潛在非線性關系的能力,因此被認為可以提高HE 風險預測的準確性和預測能力[7]。人工智能技術包括機器學習算法、深度學習算法等,它們可以自動學習和調(diào)整模型參數(shù),從而提高預測模型的性能[8-12]。本文旨在綜述HE 風險預測模型的研究進展,并介紹人工智能在該領域的應用前景,探討其在HE 風險預測模型研究中的挑戰(zhàn)及潛在的未來發(fā)展方向。
在臨床實踐中,傳統(tǒng)的HE 風險評估主要基于統(tǒng)計學方法,包括logistics 回歸[13]、Cox 比例風險模型等[14-15]。目前,有多種傳統(tǒng)的HE 風險評估方式,如Child-Pugh 評分系統(tǒng)、終末期肝病模型評分系統(tǒng)(MELD)等[16],這些模型通過分析臨床數(shù)據(jù)和生化指標等因素,來評估患者發(fā)生肝性腦病的概率(表1)。傳統(tǒng)模型的建立包括以下幾個步驟:特征選擇、模型訓練和模型評估。特征選擇是構建預測模型的關鍵步驟之一。傳統(tǒng)的特征選擇方法通?;趯<医?jīng)驗或統(tǒng)計學方法。專家經(jīng)驗方法是根據(jù)醫(yī)生的臨床經(jīng)驗和領域知識選擇相關的特征。統(tǒng)計學方法包括單變量分析、相關性分析和回歸分析等,它們通過分析特征與HE 之間的關系來選擇最相關的特征。在特征選擇之后,選擇的特征被用來訓練預測模型。logistics 回歸便是常用的模型之一,它基于線性回歸模型,并通過sigmoid 函數(shù)將線性預測結果轉化為概率值。Cox比例風險模型是另一種常用的模型,它可以考慮到生存時間和事件發(fā)生之間的關系。這些模型通常通過最大似然估計或梯度下降等方法來估計模型參數(shù)。模型評估是判斷預測模型性能的關鍵步驟。常用的評估指標包括準確率、靈敏度、特異度、受試者工作特征(receiver operating characteristic,ROC)曲線和曲線下面積(area under curve,AUC)值等。準確率是模型正確預測的比例,靈敏度是模型正確預測陽性樣本的比例,特異度是模型正確預測陰性樣本的比例。ROC 曲線是用來評估模型的預測能力的圖形,它的橫軸代表假陽性率(false positive rate, FPR),縱軸代表真陽性率(true positive rate, TPR)。AUC 值,反映了模型區(qū)分正負樣本的能力,AUC 值越大,模型的預測能力越好[4]。
表1 傳統(tǒng)的HE 風險預測模型Tab.1 Traditional risk prediction model for hepatic encephalopathy
此外,還有一些研究者基于傳統(tǒng)算法開發(fā)出各類HE 發(fā)病風險預測模型,早在2006 年,TAKIKAWA 等[17]在一項急性肝炎相關的前瞻性研究中,納入164 例患者進行研究,應用傳統(tǒng)算法中的logistics 回歸分析構建了HE 發(fā)病風險預測模型,計算公式為logit(p)=0.084×年齡(Age)+0.129×血清總膽紅素(TB)-0.158×凝血酶原時間(%)。在164 例重型肝炎患者中,31%患者在8 周前后出現(xiàn)HE,研究結果表明,高齡、凝血酶原時間延長、高血清總膽紅素可作為HE 發(fā)病風險預測因素,然而,該研究[17]報道其敏感性較低,說明僅通過納入因素PT 來代表凝血方面的變化不足以預測HE 的發(fā)生。2019 年,LABENZ 等[18]基于既往病史及免疫學研究納入237 例肝硬化患者,以MHE(minimal hepatic encephalopathy)病史、HE 病史、C 反應蛋白、白蛋白、MELD 評分、血清白細胞介素-6(IL-6)作為預測因素建立預測模型,以驗證IL-6 識別HE發(fā)生的預測價值,結果顯示,加入IL-6 檢測對未來180 d 內(nèi)顯性HE 發(fā)病的預測性能大幅提高。相比logistics 回歸模型,Cox 比例風險模型以生存結局和生存時間為因變量,可同時分析眾多因素對生存期的影響,研究不同時間點的發(fā)病率[18]。TAPPER 等[19]使用人口統(tǒng)計學、臨床、實驗室和藥學數(shù)據(jù),基于Cox 比例風險回歸模型構建HE 發(fā)病風險預測模型,最終預測模型由白蛋白、膽紅素、他汀類藥物使用和非選擇性β 受體阻滯劑4 個預測因素組成,結果顯示,43.7%肝硬化患者5 年內(nèi)發(fā)生HE;該模型同時將肝硬化患者發(fā)生HE 的風險進行了分層,使用基線數(shù)據(jù)和縱向數(shù)據(jù)轉換為風險評分,并使用自舉驗證得到AUC 為0.73。總的來說,傳統(tǒng)算法構建的HE 風險預測模型在一定程度上可以預測患者發(fā)生HE 的概率,但是它們可能無法整合與HE 預測相關的新式且多樣化的數(shù)據(jù)來源,如基因組數(shù)據(jù)、代謝組數(shù)據(jù)、微生物組數(shù)據(jù)等,這會降低其全面性和及時性,且復雜的計算公式同樣限制了其進一步臨床應用的可行性。與之相反,AI 具有處理大量復雜數(shù)據(jù)的能力,使用AI 技術可以克服傳統(tǒng)預測模型的一些缺點,從而提高預測的準確性和效率。因此,引入人工智能技術來改進HE 風險預測模型,具有重要的意義。
近年來,人工智能在重癥監(jiān)護和肝病學領域的應用顯著增加。這與人工智能技術和計算能力以及大數(shù)據(jù)隊列的可用性的重大進步相吻合[22]。人工智能是指通過計算機程序代表人類智能的技術。機器學習算法 (machine learning, ML)是基于統(tǒng)計技術的人工智能技術的一個分支,用于自學和解決問題技能的發(fā)展。它通過使用復雜的算法來分析大量數(shù)據(jù)、識別模式、做出不需要特定代碼的預測和決策。常用的機器學習算法包括支持向量機(SVM)[21]、隨機森林(random forest)[22]、決策樹(decision tree)[23]等(表2)。目前已有一些基于人工智能技術的HE 發(fā)病風險預測模型被構建并應用于臨床實踐。劉寶榮等[24]回顧性納入479 例乙型肝炎慢加急性肝衰竭患者,采用人工神經(jīng)網(wǎng)絡算法(artificial neural network, ANN)開發(fā)了慢加急性肝衰竭發(fā)生肝性腦病風險預測模型,利用11 個獨立危險因素[包括年齡、肺部感染、腹腔感染、上消化道出血、總膽紅素、血鈉、血肌酐、國際標準化比值(INR)、白細胞計數(shù)、血紅蛋白、甲胎蛋白],結果顯示,ANN 模型具有較好的危險因素評估預測價值,INR 升高、WBC 升高、Hb 降低和年齡偏大是乙型肝炎慢加急性肝衰竭患者發(fā)生HE 的主要危險因素[26]。王旭春等[22]采用SVM、MLP、隨機森林以及綜合以上3 種算法預測結果的Voting 異質集成分類算法構建肝硬化并發(fā)HE 的風險預測模型。結果顯示,logistic 回歸篩選了7 個風險預測因子,采用重采樣技術后的分類模型的預測性能整體上優(yōu)于不平衡數(shù)據(jù)模型,以SVM-SMOTE 最優(yōu);基于隨機森林與支持向量機算法可以彌補傳統(tǒng)機器學習在非均衡數(shù)據(jù)分類問題中的不足,提高模型對于此類數(shù)據(jù)的分類預測性能。在進行肝硬化并發(fā)HE 分類預測時,基于代價敏感的隨機森林與支持向量機算法的預測性能高于其模型,而且加權隨機森林可提供患者的發(fā)病概率,使得HE 發(fā)生概率的估計更為直觀與高效[21]。程璠等[25]基于潛在類別模型對HE 誘發(fā)因素進行特征識別,對具有不同誘因的肝硬化患者進行分類,選擇上消化道出血、各種感染、大量使用利尿劑、手術、水電解質代謝異常、便秘、腹水7 個HE 誘發(fā)因素進行潛在類別分析,用以劃分特征人群來提示高危患者。結果模型擬合指標顯示3-cluster 為最佳模型。cluster1、cluster2 與cluster3 分別命名為誘因較多組、腹水利尿組與一般人群組。個體分類后,三組患者肝性腦病發(fā)病率差異有統(tǒng)計學意義(χ2= 60.830,P<0.001),誘因較多組、腹水利尿組、一般人群組分別為16.4%、8.8%、2.4%,研究[25]表明,潛在類別模型可用于對不同HE 誘發(fā)因素潛在類別的識別,對具有不同誘因特征的肝硬化患者的分類,比較不同特征患者HE 的發(fā)病風險,提示高風險患者,為該類患者的護理干預提供依據(jù)。談軍濤等[26]納入我國重慶地區(qū)7 家醫(yī)療機構共1 498 例肝硬化患者,應用機器學習構建的logistic 回歸、隨機森林、決策樹和XGBoost 算法構建肝硬化發(fā)生HE 風險預測模型,比較4 種模型的診斷價值結果顯示:隨機森林模型AUC 為0.883,綜合預測效能優(yōu)于其余3種模型。然而,該研究為橫斷面研究,同時未進行外部驗證,模型的準確性有待今后進一步驗證。另外,有研究者采用彈性網(wǎng)絡正則化(Elastic net regularization)方法對某三甲醫(yī)院消化內(nèi)科950 例肝硬化住院患者的臨床數(shù)據(jù)集進行變量初篩,再以MMHC 混合算法構建貝葉斯網(wǎng)絡,參數(shù)估計采用極大似然估計。結果經(jīng)ElasticNet 特征篩選后11 個變量最終進入模型;MMHC 算法所構建的肝硬化并發(fā)HE 貝葉斯網(wǎng)絡模型顯示:肝腎綜合征、電解質紊亂和精神萎靡與HE 直接相關;證明貝葉斯網(wǎng)絡能很好地揭示肝硬化并發(fā)HE 及其相關因素之間的復雜網(wǎng)絡聯(lián)系,進而有針對性地對肝硬化并發(fā)HE 進行預防控制,在分析相關因素上具有更好的應用前景[27]。這些研究證明了利用人工智能方法進行HE 預測建模的益處,與傳統(tǒng)評分系統(tǒng)相比,診斷的準確性有所提高。
表2 常見機器學習算法的類型Tab.2 Types of common machine-learning algorithms
HE 是一種嚴重影響個人生存質量的危急重癥,故在管理和預防方面亟需準確的預測方法。雖然AI 技術在醫(yī)學領域得到了廣泛的應用,尤其是機器學習方法,可以從大量的數(shù)據(jù)中提取有用的信息和模式,為臨床決策提供支持。然而,開發(fā)預測HE 的機器學習模型仍然面臨著一些挑戰(zhàn)和局限性,主要包括以下幾個方面:首先,在模型解釋性方面,基于深度學習算法的人工智能并不透明,這在臨床實踐中可能會產(chǎn)生一定的困惑和不信任[28]。如何提高人工智能模型的可解釋性是一個需要解決的問題。出于這個原因,許多研究工作都集中在簡化AI 模型,以便臨床醫(yī)生更好地理解,提高使用AI 模型的信心[29]。目前,已有研究者提出開發(fā)使用可解釋的深度學習模型,如解釋型神經(jīng)網(wǎng)絡,它可以提供對模型預測結果的解釋[30]。其次,人工智能技術需要高質量和標準化的數(shù)據(jù)來訓練和測試其模型,由于道德、法律、隱私或技術問題,這些數(shù)據(jù)在現(xiàn)實世界中可能不容易獲得,特別是當涉及帶有偏見的訓練驗證數(shù)據(jù)集和隨后的資源分配或決策支持的潛力時。同時,在算法、參數(shù)、特征或數(shù)據(jù)集的選擇,人工智能技術可能會在其模型中引入偏差或錯誤,這可能會影響其預測的有效性和可靠性[31]。特別值得一提的是,目前已有一些基于機器學習的HE 預測模型被提出,但是這些模型通常只考慮了一些單一或有限的預測因子,如血清氨、血清鈉、肝功能指標等[18]。然而,HE 的發(fā)生是一個復雜的多因素過程,可能涉及遺傳、代謝、免疫、營養(yǎng)、微生物、藥物等多個方面[26]。因此,未來的研究應該探索更多的潛在預測因子,從多領域候選預測因子中為HE預測評分,如基因多態(tài)性、代謝組學、微生物組學、藥物暴露歷史等,并利用機器學習方法從中篩選出最具有預測價值的因子,構建更加準確和全面的HE 預測評分[32]。我們還可以使用個性化評估比如年齡,從而促進對HE 的早期干預和管理。不同的患者可能存在不同的HE 發(fā)病風險和臨床表現(xiàn),這可能與患者的個體差異有關,如年齡、性別、基礎疾病、合并感染等。應該考慮患者的個體特征,為每例患者提供個性化的HE 風險評估和干預建議[33]。例如,根據(jù)患者的年齡分層,為不同年齡段的患者制定不同的閾值和策略。這樣可以提高HE 的早期識別和治療效果,降低患者的死亡率和并發(fā)癥。如今,由于AI 技術具有更強的特征提取和建模能力,HE 風險預測模型的研究在人工智能技術的參與下取得了顯著的進展,故關注HE 發(fā)病風險預測模型的的研究越來越多,但我們也應該注意到,盡管研究者報道了出色的模型性能結果,但這些模型很少受到其他研究人員的關注,用于實際臨床實施的研究只是少數(shù),也很少有研究來進一步驗證它們的穩(wěn)定性[26-27]。此外,關于后續(xù)臨床應用的報道很少。再者,這些研究中很多都是在回顧性診斷的患者數(shù)據(jù)集上進行訓練和驗證的,而且沒有充分比較人工智能優(yōu)于現(xiàn)有決策工具和臨床診斷的能力[22]。因此,這些模型應通過臨床試驗進行廣泛的前瞻性驗證,以更好地指導HE 治療。最后,大多數(shù)基于機器學習的HE 預測模型都是基于小樣本或單中心的數(shù)據(jù)進行開發(fā)和驗證,這可能導致模型存在過擬合或偏倚的問題,限制了模型在不同人群或地區(qū)的應用[34]。鑒于此,未來的研究應該利用更多來源和規(guī)模更大的數(shù)據(jù),如多中心或國際合作的數(shù)據(jù),對模型進行充分的訓練和測試,并在不同的人群或地區(qū)進行外部驗證,以評估模型的穩(wěn)健性和泛化能力。這樣可以提高模型的信度和效度,增加模型在臨床實踐中的可用性和推廣性[35]。
隨著計算能力的提升和算法的進一步優(yōu)化,預測模型將能夠整合和分析更加多樣和大規(guī)模的醫(yī)學數(shù)據(jù),如臨床指標、影像學資料、基因組學信息等,通過AI 技術的集成分析,從中發(fā)現(xiàn)更多隱藏的風險因素和病情變化規(guī)律,大幅提升模型的準確度和穩(wěn)健性,提供更全面的風險評估。另一方面,持續(xù)涌現(xiàn)的新興AI 技術也為HE 風險預測帶來新機遇。例如,增強學習可以實現(xiàn)模型的動態(tài)更新和自我完善,使預測細致適應個體變化;遷移學習可以充分利用其他疾病領域的數(shù)據(jù)和經(jīng)驗,縮短模型的訓練周期;多任務學習可以組合相關的預測任務,實現(xiàn)風險評估的全面性和一致性。同時,結合自然語言處理和情感分析等技術,我們還可以利用社交媒體數(shù)據(jù)和個人行為數(shù)據(jù),精準地識別潛在的心理和環(huán)境因素,充分利用這些前沿技術,有望推動HE 風險預測向著更個性化、動態(tài)化和精細化的方向發(fā)展。隨著這些技術的發(fā)展,將需要適當?shù)母倪M和透明度,在此過程中,它們應該增強和補充提供者的決策,而不是取代傳統(tǒng)。只有在保證安全可控的前提下,HE 風險預測模型才能真正被臨床采納,為患者提供價值。未來,我們可以期待這些創(chuàng)新的大數(shù)據(jù)技術與AI的結合,為HE 的早期診斷和預防提供更加有效的支持,大大提高患者的生活質量和健康水平。
綜上所述,人工智能技術為HE 的預測提供了新的可能性和機遇,但今后還需要解決可行性、可解釋性、可推廣性和公平性等問題,以便更安全地將這些模型應用于日常臨床實踐,這需要醫(yī)學和信息技術團隊的密切協(xié)作,和諧發(fā)展人工智能在醫(yī)療健康領域的應用,以提高HE 預測模型的性能和實用性,為HE 的早期診斷和治療提供更有力的支持,及時、高效地進一步加強醫(yī)院資源的有效管理。