樊鳳仙,胡萬(wàn)均,姜艷麗,鄒婕,楊品,張靜*
肝纖維化(liver fibrosis,LF)是各種慢性肝病發(fā)展為肝硬化、肝癌的必經(jīng)途徑,全球的肝硬化患者已從1990年的7100萬(wàn)大幅上升至2017年的1.22億[1]。大量臨床研究發(fā)現(xiàn)多數(shù)病因?qū)е碌腖F和早期肝硬化經(jīng)過(guò)治療干預(yù)是可以消退、逆轉(zhuǎn)的[2],因此,LF的早期診斷和及時(shí)的臨床干預(yù)成為肝病領(lǐng)域最重要的任務(wù)。肝活檢是LF 診斷和分期的金標(biāo)準(zhǔn),但肝活檢的有創(chuàng)性、發(fā)生并發(fā)癥的風(fēng)險(xiǎn)、抽樣誤差等缺點(diǎn)使其不能在臨床廣泛開(kāi)展,且不適于肝病進(jìn)展的隨訪。
隨著人工智能技術(shù)的不斷發(fā)展,已經(jīng)在肝臟疾病中開(kāi)發(fā)了多種機(jī)器學(xué)習(xí)算法并結(jié)合臨床參數(shù)來(lái)預(yù)測(cè)肝臟彌漫型疾病的風(fēng)險(xiǎn)和進(jìn)程,例如評(píng)估LF 和脂肪變性,預(yù)測(cè)原發(fā)性硬化性膽管炎的肝臟失代償、篩選和選擇肝移植受體以及預(yù)測(cè)肝移植后的生存率和并發(fā)癥等[3]。Yasaka 等[4]運(yùn)用釓塞酸二鈉(Gd-EOB-DTPA)增強(qiáng)的肝膽相圖像,研究了深度學(xué)習(xí)算法在LF 分期中的應(yīng)用,但研究者所開(kāi)發(fā)的算法需要手動(dòng)選擇包括肝臟輪廓在內(nèi)的肝實(shí)質(zhì)區(qū)域進(jìn)行圖像裁剪,該方法可能容易出現(xiàn)觀察者間的差異,且所獲得的感興趣區(qū)(region of interest, ROI)為2D圖像。此外,Gd-EOB-DTPA增強(qiáng)檢查需額外注射對(duì)比劑,存在過(guò)敏風(fēng)險(xiǎn)。因此,本研究基于LF 患者的常規(guī)T1WI、T2WI、表觀擴(kuò)散系數(shù)(apparent diffusion coefficient, ADC)平掃圖像開(kāi)發(fā)基于深度學(xué)習(xí)的3D 卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)模型,以區(qū)分無(wú)顯著LF(S0~S1)、顯著LF(≥S2)。
回顧性分析2016 年1 月至2020 年7 月蘭州大學(xué)第二醫(yī)院行肝臟組織穿刺活檢或手術(shù)病理檢查證實(shí)為L(zhǎng)F,并在病理檢查后3 個(gè)月內(nèi)[4]接受過(guò)肝臟MRI 平掃檢查的患者病例。納入標(biāo)準(zhǔn):(1)符合LF病理診斷標(biāo)準(zhǔn),并有明確病理分期;(2)具有完整的臨床病史資料及臨床實(shí)驗(yàn)室檢查資料。排除標(biāo)準(zhǔn):(1)MRI 掃描機(jī)型及參數(shù)不一致或掃描序列不完整者;(2)圖像質(zhì)量不佳,無(wú)法進(jìn)行分析,如圖像偽影重或重建后圖像有間隔;(3)肝臟彌漫病灶或單發(fā)較大腫塊(最大直徑>5 cm);(4)既往肝臟手術(shù)史。本研究經(jīng)蘭州大學(xué)第二醫(yī)院倫理委員會(huì)批準(zhǔn),免除受試者知情同意,批準(zhǔn)文號(hào):2021A-196。
所有患者均經(jīng)超聲引導(dǎo)下病理穿刺活檢證實(shí)為L(zhǎng)F,穿刺點(diǎn)為肝右葉。參照國(guó)內(nèi)學(xué)者以Scheuer評(píng)分系統(tǒng)為基礎(chǔ)修訂的慢性肝炎的病理學(xué)診斷標(biāo)準(zhǔn)[5]中有關(guān)標(biāo)準(zhǔn)進(jìn)行LF 分期,將LF 分為S0~S4期:S0為無(wú)纖維化;S1 為匯管區(qū)纖維化擴(kuò)大,局限性竇周及小葉內(nèi)纖維化;S2為匯管區(qū)周?chē)w維化,纖維間隔形成,小葉結(jié)構(gòu)保留;S3 為纖維間隔伴小葉結(jié)構(gòu)紊亂,無(wú)肝硬化;S4為早期肝硬化。本研究納入病例中S0~S4期LF患者分別為7例、107例、62例、29例、19例。MRI檢查與病理檢查平均間隔時(shí)間為4.5 d(0~89 d)。根據(jù)《肝纖維化診斷及治療共識(shí)(2019年)》[6],以S0~S1定義為無(wú)顯著LF,≥S2定義為顯著LF。
所有患者均行肝臟MRI平掃檢查,檢查前空腹>6 h,并進(jìn)行呼吸和屏氣訓(xùn)練以獲得良好的配合。采用荷蘭Philips 3.0 T Ingenia MRI掃描儀,16通道相控陣體線圈。軸位T2WI 頻率衰減翻轉(zhuǎn)恢復(fù)(T2WI spectral attenuated inversion recovery, T2WI-SPAIR)序列掃描參數(shù):TR/TE 718 ms/77 ms,F(xiàn)OV 350 mm×392 mm,矩陣232×200,層厚/層間距6.5 mm/1 mm;軸位T1魔鏡成像(T1-mDIXON)序列掃描參數(shù):TR/TE 3.7 ms/1.31 ms,F(xiàn)OV 400 mm×350 mm,矩 陣244×193,層 厚/層 間 距4 mm/-2 mm;軸位擴(kuò)散加權(quán)成像(diffusion weighted imaging, DWI)序列參數(shù):TR/TE 2462 ms/75 ms,F(xiàn)OV 400 mm×353 mm,矩陣132×117,層厚/層間距6.5 mm/1 mm,b=0、800 s/mm2,掃描結(jié)束后DWI 序列重建出ADC圖。
從影像歸檔和通信系統(tǒng)(picture archiving and communication system, PACS)中下載患者圖像并存儲(chǔ)為DICOM格式文件。預(yù)處理步驟包括:(1)T1WI選擇mDIXON序列的水相,從T1-mDIXON序列中單獨(dú)保存水相,以T1 水相為標(biāo)準(zhǔn)圖像,應(yīng)用ITK-SNAP(version 3.6.0,http://www.itksnap.org/)軟件對(duì)圖像進(jìn)行預(yù)處理,運(yùn)用仿射配準(zhǔn)方法將T2WI 圖及ADC 圖配準(zhǔn)到T1WI圖,重建后圖像層厚4 mm,層間距-2 mm,所有圖像以NiFTI格式保存,然后對(duì)所有患者圖像進(jìn)行配準(zhǔn);(2)使用Python 3.7軟件編寫(xiě)的代碼對(duì)圖像進(jìn)行處理和自動(dòng)裁剪,為更好對(duì)應(yīng)病理穿刺區(qū)域,基于肝右葉所在目標(biāo)區(qū)域坐標(biāo),對(duì)圖像隨機(jī)裁剪10次,步長(zhǎng)為10,重疊10 個(gè)體素大小,分辨率為28 mm×28 mm×28 mm;(3)使用直方圖均衡化、拉普拉斯換算法對(duì)圖像進(jìn)行增強(qiáng),以增加訓(xùn)練樣本的數(shù)量,更好地提取圖像特征、泛化模型,最終每個(gè)序列生成211 200幅圖像,將圖像轉(zhuǎn)換為對(duì)應(yīng)的圖像矩陣,輸入CNN模型;(4)為了減少偏場(chǎng)效應(yīng),對(duì)裁剪后的圖像進(jìn)行歸一化處理,將像素值歸一化到-1~1之間;(5)按8∶2 的比例隨機(jī)將所有患者分為訓(xùn)練集(n=179)、測(cè)試集(n=45)。
CNN模型在GeForce GTX 1060(NVIDIA, California,USA)圖形處理單元上進(jìn)行有監(jiān)督訓(xùn)練,該模型是在TensorFlow后端(Google,https://www.Tensorflow.org/)上運(yùn)行的Python 3.7 和Pytorch 2.4(https://pytorch.org)構(gòu)建。應(yīng)用訓(xùn)練集圖像對(duì)模型進(jìn)行網(wǎng)絡(luò)結(jié)構(gòu)(包括權(quán)重計(jì)算和梯度自動(dòng)求導(dǎo))迭代訓(xùn)練,將CNN 輸出的預(yù)測(cè)值與實(shí)際值(即纖維化病理分期)進(jìn)行比較,利用損失函數(shù)(loss,本研究為交叉熵)計(jì)算誤差。然后對(duì)誤差進(jìn)行反向傳播,并更新網(wǎng)絡(luò)權(quán)重、梯度自動(dòng)求導(dǎo)以減少損失。利用深度學(xué)習(xí)中常用的隨機(jī)梯度下降(stochastic gradient descent, SGD)優(yōu)化器優(yōu)化訓(xùn)練模型,并更新CNN 中的參數(shù),更新網(wǎng)絡(luò)權(quán)重,以減小LF 分類(lèi)模型與LF 病理分期之間的差異。以四個(gè)樣本數(shù)據(jù)為batch 進(jìn)行訓(xùn)練。由于小批次的樣本訓(xùn)練初始權(quán)重和患者選擇存在隨機(jī)性,因此進(jìn)行了1500 個(gè)epoch(即所有訓(xùn)練數(shù)據(jù)前向傳播和反向傳播后更新參數(shù)的過(guò)程,訓(xùn)練過(guò)程中全部參數(shù)進(jìn)行了6000 次更新)。訓(xùn)練完成后,用測(cè)試集數(shù)據(jù)對(duì)CNN 模型進(jìn)行測(cè)試,使用準(zhǔn)確度(accuracy,ACC)曲線、loss 曲線及受試者工作特征(receiver operating characteristic, ROC)曲線來(lái)評(píng)價(jià)模型的性能。
最終的CNN模型構(gòu)成:(1)三個(gè)卷積層,全部使用3D 卷積,其中第一層對(duì)于原始圖像中的每個(gè)像素都有56 個(gè)卷積濾波器,而另外兩個(gè)層在所有像素上都有112 個(gè)濾波器,每個(gè)濾波器通過(guò)將體素卷積為2 mm×2 mm×2 mm來(lái)生成濾波后的圖像;(2)批標(biāo)準(zhǔn)化層(batch normalization, BN)、三個(gè)最大池化(max pooling)層(大小均為2 mm×2 mm×2 mm),BN層可防止模型過(guò)擬合,最大池層降低了濾波圖像的分辨率,但具有空間不變性(即通過(guò)體素移動(dòng)的特征仍可以用相同的神經(jīng)元表示,這樣有助于特征提取);(3)兩個(gè)全連接(fully connected network,FC)層,一層具有1024 個(gè)神經(jīng)元,另一層輸出最終二分類(lèi)結(jié)果。模型構(gòu)成見(jiàn)圖1。
圖1 3D卷積神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)。輸入圖像經(jīng)過(guò)三個(gè)卷積層、三個(gè)最大池化層處理,然后使用兩個(gè)全連接層來(lái)處理數(shù)據(jù)。C:通道;U:?jiǎn)卧?。Fig. 1 The structure of 3D convolutional neural network model. The input image data was processed by three convolution layers and three maximum pooling layers. Then two fully connected layers were used to process the data.C:channel;U:unit.
使用SPSS 26.0(IBM, Armonk, New York, USA)軟件進(jìn)行統(tǒng)計(jì)分析。符合正態(tài)分布的計(jì)量資料用均值±標(biāo)準(zhǔn)差(xˉ±s)表示,計(jì)數(shù)資料采用頻數(shù)表示。采用單因素方差分析(ANOVA)比較不同纖維化分期患者年齡組間差異。計(jì)數(shù)資料采用卡方檢驗(yàn)進(jìn)行分析。P<0.05為差異具有統(tǒng)計(jì)學(xué)意義。
根據(jù)納入及排除標(biāo)準(zhǔn)最終納入患者病例224例,其中:男134例,年齡17~62(37.7±9.9)歲;女90例,年 齡18~61(40.3±10.0)歲;無(wú) 顯 著LF(S0~S1)114例;顯著LF(≥S2)110例?;颊吲R床資料見(jiàn)表1。
表1 肝纖維化患者臨床資料Tab.1 Clinical data of patients with LF
模型訓(xùn)練過(guò)程性能評(píng)價(jià)如圖2 所示,隨著epoch數(shù)量的增加,訓(xùn)練集和測(cè)試集中l(wèi)oss值不斷下降,ACC不斷升高,且測(cè)試集ACC優(yōu)于訓(xùn)練集,提示該模型有較好的分類(lèi)性能。模型訓(xùn)練完成后,基于多模態(tài)MRI的3D-CNN 模型在訓(xùn)練集中的ROC 曲線下面積(area under the curve, AUC)值為0.94,在測(cè)試集中的AUC為0.98(圖3)。
慢性肝病給社會(huì)帶來(lái)了沉重的衛(wèi)生經(jīng)濟(jì)負(fù)擔(dān),幾乎任何慢性肝病均可引起LF。《肝纖維化診斷及治療共識(shí)(2019 年)》指出在LF 發(fā)生的早期階段以病因治療、抗炎保肝治療為主,進(jìn)展期、顯著LF 期以及肝硬化期時(shí)需要進(jìn)行抗LF治療[6],因此本研究中將患者分類(lèi)為無(wú)顯著LF(S0~S1)、顯著LF(≥S2)。深度學(xué)習(xí)技術(shù)在醫(yī)學(xué)成像中發(fā)展迅速,其可以從圖像中獲得額外的診斷信息,從而全面和客觀地評(píng)估圖像特征。CNN是最流行的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),也是最常應(yīng)用于圖像的算法[7]。本研究建立基于多模態(tài)MRI 圖像的3D-CNN 模型,將LF有效分為無(wú)顯著LF、顯著LF,對(duì)指導(dǎo)臨床治療方法的選擇有重要意義。
以往對(duì)LF分期的深度模型開(kāi)發(fā)多基于CT和超聲圖像[8-10],而MRI圖像具有多參數(shù)、多方位成像及較高的軟組織分辨率等優(yōu)勢(shì),可以使CNN捕捉到更廣泛的成像特征。Yasaka等[4]、Hectors等[11]基于Gd-EOB-DTPA增強(qiáng)MRI的肝膽期圖像建立了深度學(xué)習(xí)的LF預(yù)測(cè)模型,特別是Hectors等的研究中實(shí)現(xiàn)了全自動(dòng)深度學(xué)習(xí)算法,可自動(dòng)進(jìn)行肝臟分割,該深度學(xué)習(xí)模型在預(yù)測(cè)纖維化嚴(yán)重程度方面表現(xiàn)出色,在單獨(dú)的測(cè)試集中與磁共振彈性成像(magnetic resonance elastography,MRE)有相似的表現(xiàn)。本研究結(jié)果表明,基于T1WI、T2WI、ADC 圖多模態(tài)MRI 的訓(xùn)練模型能夠在測(cè)試集對(duì)LF 進(jìn)行準(zhǔn)確分類(lèi),其AUC 值達(dá)0.98。本研究在LF 分類(lèi)中具有較高ACC 可能原因如下:(1)首先也是最重要的原因是本研究應(yīng)用了3D-CNN 網(wǎng)絡(luò),與2D 網(wǎng)絡(luò)相比,3D 網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)勢(shì)在于密集的連接將信息從之前的所有層傳送到下面的層,這些類(lèi)型的網(wǎng)絡(luò)更容易訓(xùn)練,可以有效提高分類(lèi)精確度,減少過(guò)度擬合[12]。此外,3D網(wǎng)絡(luò)可以編碼更豐富的空間信息,通過(guò)3D樣本訓(xùn)練的層次結(jié)構(gòu)可提取更具代表性的特征[13]。多項(xiàng)研究證實(shí)3D-CNN 較傳統(tǒng)2D-CNN 模型有更優(yōu)的分類(lèi)性能[14-15]。(2)另一個(gè)原因可能是本研究從多模態(tài)MRI 圖像中提取和綜合分析了眾多特征,可以實(shí)現(xiàn)不同序列中特征信息互補(bǔ),研究發(fā)現(xiàn)這種方法明顯優(yōu)于單個(gè)MRI圖像的模型,且圖像的配準(zhǔn)不會(huì)影響模型的分類(lèi)性能[16]。
LF 與膠原蛋白等大分子物質(zhì)在肝臟中的沉積有關(guān),導(dǎo)致肝臟血管和結(jié)構(gòu)改變,從而產(chǎn)生組織紋理的改變,多項(xiàng)研究評(píng)估了MRI 影像組學(xué)在評(píng)估LF 中的應(yīng)用[17-18],雖然取得了良好的結(jié)果,但影像組學(xué)分析需要手動(dòng)勾畫(huà)ROI,不僅費(fèi)時(shí),ROI 的選擇也受到觀察者間差異的影響;此外,影像組學(xué)定性語(yǔ)義特征和定量特征均屬于淺層特征,主要表征圖像的“表象”[19]。深度學(xué)習(xí)不依賴(lài)于預(yù)定義的、手工設(shè)計(jì)的特征,使用CNN的深度學(xué)習(xí)能夠自動(dòng)捕獲初始卷積層中多個(gè)層次的特征信息,隨著卷積層感知域的增大,高層次的抽象特征被提取出來(lái),這些特征往往與臨床狀態(tài)有關(guān),從而有助于識(shí)別性能的提高[20]。
MRE 是有最高可信度和診斷性能的MRI 定量方法,已經(jīng)成為L(zhǎng)F 評(píng)估的無(wú)創(chuàng)性標(biāo)準(zhǔn)[21],但MRE 檢查需要配備額外硬件,檢查耗時(shí)、費(fèi)用較高等限制了其普及與應(yīng)用。深度學(xué)習(xí)作為一種圖像處理方法,在不需要額外硬件的情況下,應(yīng)用常規(guī)序列即可對(duì)LF 進(jìn)行無(wú)創(chuàng)性評(píng)估,是肝臟疾病影像學(xué)評(píng)估中非常有前途的輔助工具。
本研究存在一些局限性。第一,本研究在肝臟分割時(shí)僅自動(dòng)選擇了10個(gè)體素大小為28 mm×28 mm×28 mm的3D 正方體圖像,LF 為彌漫性病變,可能無(wú)法反映少部分肝臟的纖維化進(jìn)展。目前有部分研究采用全自動(dòng)的肝臟分割算法[11],很好地避免了這個(gè)問(wèn)題,因此在今后研究中應(yīng)不斷改進(jìn)研究方法。第二,本研究為回顧性研究,患者選擇存在偏倚、樣本量數(shù)據(jù)過(guò)少,不同纖維化分期間樣本量不平衡,無(wú)法預(yù)測(cè)確切的纖維化階段,因此采用了二分類(lèi)LF分類(lèi)方法。但本研究通過(guò)圖像增強(qiáng)方法增加了樣本量,模型在二分類(lèi)中有較好的診斷性能,今后的工作將不斷擴(kuò)大研究隊(duì)列。
綜上所述,利用常規(guī)序列多模態(tài)MRI 圖像,基于深度學(xué)習(xí)的3D-CNN 模型可對(duì)無(wú)顯著LF 和顯著LF 進(jìn)行準(zhǔn)確分類(lèi),在LF 的無(wú)創(chuàng)性診斷中具有廣闊的應(yīng)用前景。
作者利益沖突聲明:所有作者均聲明不存在利益沖突。