梁智星, 葉林森, 楊 揚(yáng)
中山大學(xué)附屬第三醫(yī)院 肝臟外科暨肝移植中心, 中山大學(xué)器官移植研究所,廣東省器官移植研究中心, 廣州 510630
醫(yī)院信息系統(tǒng)的進(jìn)步極大地增加了醫(yī)療機(jī)構(gòu)收集的患者數(shù)據(jù)量,據(jù)估計,2020年全球?qū)a(chǎn)生2314兆字節(jié)的醫(yī)療數(shù)據(jù)[1],這為使用數(shù)據(jù)分析技術(shù)實現(xiàn)個性化醫(yī)療及改善患者預(yù)后提供了可能。然而,如何把龐大的數(shù)據(jù)轉(zhuǎn)化為可實踐的知識仍然是一個重大的挑戰(zhàn),這一點在肝移植領(lǐng)域尤為明顯。自 1963年Starzl教授首次將肝移植應(yīng)用于臨床以來,經(jīng)過半個多世紀(jì)的發(fā)展和完善,肝移植已成為治療各種終末期肝病最有效的方法。與其他領(lǐng)域的“單患者”數(shù)據(jù)分析不同,肝移植通常需要考慮供體和受體“雙患者”的特征以及移植過程中的變量,所涉及的大量因素使用傳統(tǒng)生物統(tǒng)計學(xué)分析顯得非常困難。人工智能(artificial intelligence,AI)的核心是通過機(jī)器學(xué)習(xí)算法挖掘大型數(shù)據(jù)中的隱藏聯(lián)系,其優(yōu)勢在于能從現(xiàn)有的數(shù)據(jù)中學(xué)習(xí),找到變量之間的新聯(lián)系并產(chǎn)生預(yù)測,相比傳統(tǒng)方法更有效地生產(chǎn)預(yù)測模型?;谶@一優(yōu)勢,越來越多學(xué)者將AI方法應(yīng)用于肝移植領(lǐng)域,尤其是在預(yù)后預(yù)測和器官分配方面。
從概念上而言,AI并不新鮮,最早由阿蘭·圖靈在1937年提出,受限于當(dāng)時的計算機(jī)技術(shù),AI技術(shù)的發(fā)展曾一度停滯。直到20世紀(jì)后期,數(shù)據(jù)量的爆發(fā)性增長和計算能力的提升使得這一領(lǐng)域重新得到關(guān)注,自1998年以來,醫(yī)學(xué)AI領(lǐng)域的研究數(shù)量成倍增長[2]。在實踐中,AI算法通常區(qū)分為機(jī)器學(xué)習(xí)(machine learning, ML)和深度學(xué)習(xí)(deep learning, DL)。
ML可分為監(jiān)督學(xué)習(xí)方法(如支持向量機(jī)、決策樹、隨機(jī)森林、樸素貝葉斯等算法)和非監(jiān)督學(xué)習(xí)方法(如主成分分析)。監(jiān)督學(xué)習(xí)即用一部分已知結(jié)果的樣本訓(xùn)練機(jī)器,讓其學(xué)習(xí)輸入數(shù)據(jù)(如患者特征、圖像等)與結(jié)果(如發(fā)生并發(fā)癥、死亡等)之間的聯(lián)系,從而預(yù)測患者是否發(fā)生某一終點事件。非監(jiān)督學(xué)習(xí)即是讓機(jī)器學(xué)習(xí)數(shù)據(jù)中的潛在分布或聯(lián)系,根據(jù)樣本的相似性進(jìn)行聚類。ML在醫(yī)學(xué)領(lǐng)域中通常使用的都是監(jiān)督學(xué)習(xí)算法[3](表1)。
DL是ML的一個子集,包含人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks, ANN)、卷層神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)、 循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks, RNN)等算法模型。神經(jīng)網(wǎng)絡(luò)是模擬大腦神經(jīng)元組成的仿生模型,能夠挖掘數(shù)據(jù)中復(fù)雜的非線性關(guān)系,允許更復(fù)雜的監(jiān)督和無監(jiān)督學(xué)習(xí)任務(wù)(表1)。與其他ML算法相比,DL特別適用于大規(guī)模復(fù)雜或高維度的數(shù)據(jù),能夠處理一些環(huán)境信息十分復(fù)雜、知識背景不清楚和推理規(guī)則不明確的問題[4],通常用于影像識別、病理診斷、預(yù)后預(yù)測等。
縱觀當(dāng)前AI算法在肝移植領(lǐng)域的應(yīng)用主要有以下2個方面:(1)緩和日趨嚴(yán)重的器官供需矛盾問題——使用分類技術(shù)評估供肝,減少經(jīng)驗性誤判導(dǎo)致的供肝廢棄,擴(kuò)大供體池;(2)制訂最佳的器官分配方案,避免因分配不佳導(dǎo)致的不良預(yù)后,提升供體池的整體獲益,提高捐獻(xiàn)器官的有效利用率及移植患者生存獲益——使用回歸模型預(yù)測移植肝存活及受體預(yù)后。利用AI算法在復(fù)雜和高維度數(shù)據(jù)中的優(yōu)勢,擴(kuò)大供體池,提高供受體匹配成功率,為肝移植患者長期生存提供有力支持。
移植肝脂肪變性(hepatic steatosis,HS)被認(rèn)為是影響移植物功能的最重要因素之一[5],移植肝組織的病理學(xué)活檢是評估HS的金標(biāo)準(zhǔn)。然而病理檢查通常在器官獲取后進(jìn)行,其結(jié)果一般在移植手術(shù)前難以獲得,因此供肝的HS評估常依賴于獲取人員視覺和觸覺上的經(jīng)驗性判斷。然而有研究[6]表明超過90%的器官獲取人員對供肝移植物衰竭發(fā)生風(fēng)險的預(yù)測存在很大差異,特別是低估了高風(fēng)險供肝的移植物衰竭發(fā)生風(fēng)險,說明依賴經(jīng)驗性的判斷是不夠準(zhǔn)確的。
表1 常用的AI算法
Kuppili等[7]利用極限學(xué)習(xí)機(jī)算法構(gòu)建的脂肪肝診斷模型,能夠根據(jù)肝臟超聲圖像快速診斷HS,準(zhǔn)確率高達(dá)96.75%。而Byra等[8]提出的CNN模型能更進(jìn)一步地從超聲圖像中自動評估HS的程度。此外,支持向量機(jī)算法[9]還能夠根據(jù)數(shù)字化的病理圖像對HS進(jìn)行自動分類,并能以高準(zhǔn)確率(≥95%)區(qū)分大泡性和小泡性HS。Moccia等[10]和Cesaretti等[11]更是創(chuàng)造性地使用手機(jī)拍攝的供肝圖像進(jìn)行半監(jiān)督訓(xùn)練,取得了88%的準(zhǔn)確度、95%的靈敏度和81%的特異度,實現(xiàn)了在手術(shù)室快速評估供肝HS,為評估HS提供了一個全新的視野。這些研究表明,AI算法在供肝HS評估中表現(xiàn)出良好的性能,使獲取術(shù)中的供肝客觀評估成為可能。
臨床供肝評估是一個動態(tài)的過程,涉及供體情況、獲取及轉(zhuǎn)運(yùn)過程等多個變量,這是一個隨時間變化、非常復(fù)雜的多維度非線性關(guān)系。傳統(tǒng)的生物統(tǒng)計方法需要假設(shè)解釋變量和結(jié)果變量之間是獨立的和線性的關(guān)系,并且無法納入大量的臨床變量進(jìn)行分析,而這正是AI算法的優(yōu)勢。筆者團(tuán)隊利用ML算法構(gòu)建供肝評估模型,納入供體基本特征、獲取前各項實驗室檢查結(jié)果、獲取/移植手術(shù)特征以及受體基本特征共67項變量數(shù)據(jù),較傳統(tǒng)生物統(tǒng)計學(xué)方法具有更優(yōu)的預(yù)測評估效能(AUC:0.85 vs 0.73; NRI=0.368 5, 95%CI: 0.321 0~0.415 9,P<0.001),相關(guān)經(jīng)驗正在進(jìn)一步總結(jié)當(dāng)中。除了對供肝客觀、全面、精準(zhǔn)的評估,AI技術(shù)還有望應(yīng)用于供肝能否劈離的精準(zhǔn)識別、活體肝移植供肝分割容量的判斷等方面,為外科醫(yī)生的臨床決策提供支持。
目前在世界大部分地區(qū),對等待移植名單患者進(jìn)行優(yōu)先排序的金標(biāo)準(zhǔn)仍然是終末期肝病模型,但這種基于“病重患者優(yōu)先”原則的分配政策存在一定缺陷[12]。肝移植中最佳器官分配的關(guān)鍵是準(zhǔn)確預(yù)測特定供受體組合的移植結(jié)果,因此一個能最大限度考慮到所有供體和受體因素的可重復(fù)預(yù)測模型,無疑能最大限度地提高現(xiàn)有供體池的整體效益。目前已有許多學(xué)者嘗試?yán)肁I技術(shù)建立器官分配模型[13-20]。
一項西班牙多中心的回顧性研究[13]使用ANN算法提出了一個創(chuàng)新的供體-受體匹配模型,其納入了1003對肝移植供體-受體,以及供體、受體和移植過程中的64個變量信息,準(zhǔn)確預(yù)測移植后3個月的移植物存活率(AUC=0.81)和移植物丟失率(AUC=0.82),為臨床決策提供參考,以使肝臟分配更加公平、高效。此外,Bertsimas等[18]使用貝葉斯最優(yōu)分類器預(yù)測候選者在移植等待名單上的3個月病死率或除名風(fēng)險,開發(fā)了病死率優(yōu)化預(yù)測模型(optimized prediction of mortality, OPOM)。OPOM可以根據(jù)疾病的嚴(yán)重程度,更準(zhǔn)確和客觀地確定等待移植名單患者的優(yōu)先次序,使器官的分配更加公平。在肝臟模擬分配中,與MELD相比,OPOM分配可使等待移植名單上的死亡人數(shù)大幅減少418例。
器官分配的目的是最大程度地降低移植物丟失的風(fēng)險以及提高移植物存活的可能性,需要對特定的供-受體分配進(jìn)行精準(zhǔn)的預(yù)測。要清楚的意識到,在未來利用AI技術(shù)根據(jù)供體來源(腦死亡、循環(huán)死亡、活體供肝)和受體原發(fā)病(良性終末期肝病、肝惡性腫瘤)建立分組預(yù)測模型,指導(dǎo)肝移植臨床決策,有望實現(xiàn)腦死亡器官捐獻(xiàn)/心臟死亡器官捐獻(xiàn)整肝供肝的精準(zhǔn)分配。另一方面,筆者單位是全國最大的劈離式肝移植中心,利用AI技術(shù)在劈離方式、劈離后供體分配等方面實現(xiàn)精準(zhǔn)分配,建立本中心的數(shù)據(jù)庫,為國家的器官分配政策提供參考。
AI技術(shù)在評估移植肝存活及患者預(yù)后方面同樣發(fā)揮著巨大作用,使用ML和神經(jīng)網(wǎng)絡(luò)算法構(gòu)建的預(yù)測模型可以更準(zhǔn)確地預(yù)測移植預(yù)后[21-34]。Liu等[22]根據(jù)患者的術(shù)前生理測量值,設(shè)計一個預(yù)測模型來預(yù)測術(shù)后30 d內(nèi)的患者生存率,該研究利用隨機(jī)森林算法評估特征的重要性,結(jié)果顯示,年齡、BMI、白細(xì)胞及淋巴細(xì)胞數(shù)量、血小板、國際標(biāo)準(zhǔn)化比值以及鈉鎂離子濃度是移植術(shù)后早期生存的重要影響因素。Hoot等[24]利用器官共享聯(lián)系網(wǎng)絡(luò)的數(shù)據(jù)庫建立貝葉斯模型預(yù)測早期移植物存活率,通過對29個移植前變量進(jìn)行學(xué)習(xí)分析,該模型90 d移植物存活的預(yù)測準(zhǔn)確度可達(dá)91%。另一項大型研究[25]回顧性分析了62 294例肝移植患者術(shù)后10年內(nèi)的生存情況,從超過600個變量信息中篩選出97個預(yù)測因子構(gòu)建模型,結(jié)果顯示,使用ANN算法構(gòu)建的預(yù)測模型對移植術(shù)后遠(yuǎn)期生存的預(yù)測性能明顯優(yōu)于傳統(tǒng)的Cox回歸模型。
急性腎損傷、移植后糖尿病(post-transplant diabetes mellitus, PTDM)、皮膚癌等是移植術(shù)后的重要并發(fā)癥,與移植物丟失及患者生存相關(guān)。梯度提升機(jī)[27]對各階段的急性腎損傷預(yù)測效能明顯優(yōu)于其他常用的機(jī)器學(xué)習(xí)方法(AUC=0.90),相比之下,傳統(tǒng)的生物統(tǒng)計學(xué)方法logistic回歸的AUC為0.61。Bhat等[29]使用多種機(jī)器學(xué)習(xí)方法發(fā)現(xiàn)高齡、男性和肥胖的受者是PTDM的高危因素,以西羅莫司為主要免疫抑制劑的患者術(shù)后1年內(nèi)發(fā)生PTDM的風(fēng)險較他克莫司高33%,提示了對這部分受者應(yīng)該采取更積極的預(yù)防策略和更密切的隨訪。Jain等[33]建立的機(jī)器學(xué)習(xí)模型能夠準(zhǔn)確預(yù)測肝移植術(shù)后心血管事件的發(fā)生率和病死率,幫助臨床醫(yī)生篩選出可能發(fā)生心血管不良事件的移植受者。
筆者團(tuán)隊率先在基于放射學(xué)特征、放射組學(xué)特征、臨床變量機(jī)器組合構(gòu)建XGBoost算法模型,以及基于醫(yī)學(xué)圖像識別構(gòu)建CNN模型,能夠在術(shù)前準(zhǔn)確識別肝細(xì)胞癌患者腫瘤微血管侵犯(AUC分別為0.952、0.980),為預(yù)測肝癌患者術(shù)后復(fù)發(fā)提供參考[35]。隨著肝移植病例數(shù)據(jù)量的不斷增長、影像學(xué)和病理學(xué)等多學(xué)科評估的加入,以及前瞻性研究的驗證,AI預(yù)測模型將更能發(fā)揮出其在處理高維度、多種類數(shù)據(jù)方面的優(yōu)勢,最終真正應(yīng)用到臨床診療實踐當(dāng)中,為肝移植患者提供更好的生存獲益。
盡管許多研究已經(jīng)證明AI算法模型具有更佳的預(yù)測作用,但正如其發(fā)展歷史那樣,AI的應(yīng)用極依賴于高質(zhì)量的數(shù)據(jù)庫。事實上,AI算法并非總能得出比傳統(tǒng)生物統(tǒng)計學(xué)方法(如線性回歸、logistic回歸等)更好的結(jié)果[36],只有當(dāng)數(shù)據(jù)集龐大且各變量間隱含非線性關(guān)系時,AI算法的表現(xiàn)才能達(dá)到預(yù)期,這一限制在肝移植領(lǐng)域更為明顯。盡管獨特的“雙患者”模式能夠提供更多的臨床資料信息,但單中心的移植病例數(shù)量仍遠(yuǎn)少于其他疾病,這在一定程度上局限了AI模型的準(zhǔn)確性與可信度。多中心的合作有望彌補(bǔ)這一缺陷,但各中心在數(shù)據(jù)產(chǎn)生、收集以及分析過程中采取策略的不同,導(dǎo)致了部分特征的數(shù)據(jù)缺失,這對于某些AI算法來說可能是致命的。
此外,嚴(yán)謹(jǐn)?shù)难芯吭O(shè)計、數(shù)據(jù)預(yù)處理策略、模型的選擇及該模型與臨床研究的適配性都是影響AI模型的關(guān)鍵因素,某些類型的AI模型可能更適合于特定類型的數(shù)據(jù),比如CNN適用于圖像識別、RNN適用于有時序先后順序的數(shù)據(jù)。模型構(gòu)建的過程中還應(yīng)該注意不要讓模型與訓(xùn)練數(shù)據(jù)過度擬合,這是AI算法特別是神經(jīng)網(wǎng)絡(luò)最容易發(fā)生的錯誤,模型能否泛化應(yīng)用要比數(shù)據(jù)擬合更為重要。AI技術(shù)的另一大挑戰(zhàn)源于其本身的不透明性,AI算法的高精確度可能是以失去對工作原理的可解釋性為代價,盡管已有研究[37]嘗試使模型更具解釋性,但算法在輸入數(shù)據(jù)-輸出結(jié)果的學(xué)習(xí)過程仍難以被完全理解,因此AI經(jīng)常被認(rèn)為是“黑箱”模型。這也許是AI技術(shù)真正應(yīng)用到臨床決策的最后障礙——當(dāng)部分的決定權(quán)從人類手中移交給機(jī)器算法時,患者及其臨床醫(yī)生對算法的可接受性和信任程度。
肝移植的過程通常產(chǎn)生大量的供-受體數(shù)據(jù)信息,這與AI技術(shù)依賴于龐大數(shù)據(jù)的特性尤為匹配。比傳統(tǒng)方法更為精準(zhǔn)的AI預(yù)測模型,能夠幫助臨床醫(yī)生采取干預(yù)來改善患者的預(yù)后,比如對脂肪變性供肝縮短特定的缺血時間、對移植術(shù)后肝癌復(fù)發(fā)高風(fēng)險的患者采取預(yù)防性綜合治療等。5G網(wǎng)絡(luò)與AI技術(shù)的結(jié)合還有望實現(xiàn)供肝運(yùn)輸過程中的在線實時評估、實時分配,更加公平、高效地選擇最優(yōu)受體,提高現(xiàn)有供體池的整體效益。隨著AI技術(shù)在肝移植領(lǐng)域的廣泛應(yīng)用,基于AI算法構(gòu)建臨床模型,實現(xiàn)對器官的公平分配、對移植術(shù)后生存和預(yù)后的預(yù)測,成為幫助臨床醫(yī)生及患者作出關(guān)鍵決策的寶貴工具,使外科醫(yī)生做出更多基于證據(jù)的決策,并幫助患者了解接受特定肝移植的風(fēng)險/效益比,更好地為肝移植患者服務(wù)。
利益沖突聲明:所有作者均聲明不存在利益沖突。
作者貢獻(xiàn)聲明:梁智星負(fù)責(zé)撰寫論文;葉林森負(fù)責(zé)修改論文;楊揚(yáng)負(fù)責(zé)擬定寫作思路,指導(dǎo)撰寫文章并最后定稿。