王麗珊,張瑞明
濰坊醫(yī)學(xué)院附屬益都中心醫(yī)院放射科,山東 濰坊 262500
影像組學(xué)通過提取定量特征,將圖像轉(zhuǎn)換為可開采數(shù)據(jù),然后對這些數(shù)據(jù)進行分析,以支持臨床決策[1],自2012年興起以來[2-4],它在臨床腫瘤診斷及預(yù)后方面顯現(xiàn)出了巨大優(yōu)勢[2,4-8]。影像組學(xué)在非腫瘤學(xué)方面也有研究進展,在神經(jīng)系統(tǒng)方面,主要有影像組學(xué)自動化工具箱腦體積精確測量,注意缺陷多動障礙兒童的MR影像組學(xué)圖像特點及精神分裂癥患者影像組學(xué)方法診斷的準確性。在心血管系統(tǒng)方面,有影像組學(xué)鑒別肥厚性心肌病和高血壓性心臟病,急性冠脈綜合征和粥樣斑塊影像組學(xué)特點。在消化系統(tǒng),基于超聲和磁共振的肝硬化影像組學(xué)精確診斷研究也是熱點。如同在腫瘤系統(tǒng)精確診療和臨床決策上取得了顯著成果一樣,在非腫瘤及功能性疾病的精確診斷方面嶄露頭角并提出相關(guān)進一步研究方向。本文通過文獻復(fù)習(xí),根據(jù)所研究病變所屬系統(tǒng)分類綜述如下。
有研究使用3個廣泛使用的自動化工具箱[9]:SPM(www.fil.ion.ucl.ac.uk/spm/),F(xiàn)reeSurfer(surfer.nmr.mgh.harvard.edu)和 FSL(https://fsl.fmrib.ox.ac.uk/fsl)對38例患者研究質(zhì)量的薄層腦MR圖像和常規(guī)的臨床MR圖像進行腦容量估計。分別對腦總體積(TBV)、灰質(zhì)體積(GMV)和白質(zhì)體積(WMV)進行了估計。利用類內(nèi)相關(guān)系數(shù)(ICCs)對每種方法的薄截面和厚截面體積進行了比較。SPM表現(xiàn)出良好的ICCs(TBV、GMV、WMV的ICCs分別為0.97、0.85、0.83)。在TBV、GMV和WMV中,F(xiàn)SL的ICCs分別為0.69、0.51和0.60,但低于SPM。Free Surfer僅對TBV表現(xiàn)出良好的ICC(0.63)。在此之前,有研究對來自相同患者的不同切片厚度(1~6 mm)的MR圖像使用FSL,發(fā)現(xiàn)TBV的FSL估計值不隨切片厚度的變化而變化[10-11]。有學(xué)者研究了圖像切片稀疏采樣的效果[12],結(jié)果表明,在25個切片中采樣密度為1的情況下,可以可靠地估算出顱內(nèi)總?cè)萘?。有研究利用薄片圖像比較了SPM version 5、FSL和FreeSurfer在計算GMV、WMV和TBV方面的性能,發(fā)現(xiàn)SPM version 5和FSL的體積精度優(yōu)于FreeSurfer[13]。Malone等[14]研究表明,SPM version 12在計算顱內(nèi)總?cè)萘糠矫鎯?yōu)于FreeSurfer。
一項前瞻性研究分析了患有注意缺陷多動障礙(ADHD)兒童的MR圖像[15]。研究對83名ADHD兒童和87名健康對照兒童的T1加權(quán)容積和擴散張量圖像進行了影像組學(xué)分析。表明大腦形態(tài)的改變可以區(qū)ADHD患者和對照組,以及最常見的ADHD亞型。ADHD患兒與對照組在腦總?cè)萘考盎野踪|(zhì)體積上無明顯差異。用分類器對ADHD患者與對照組患者進行分類的平均準確率為73.7%。左顳葉、雙側(cè)楔葉及左側(cè)中央溝周圍皮質(zhì)形態(tài)的改變,對群體辨別有重要作用。使用分類器區(qū)分ADHD-I和ADHD-C的平均分類準確率為80.1%,在模型構(gòu)建過程中,所有相關(guān)特征的選擇過程識別出左顳葉皮質(zhì)形狀的改變,雙側(cè)楔葉及左側(cè)中央溝周圍區(qū)域?qū)DHD患者與對照組的區(qū)分有顯著貢獻,而涉及默認模式網(wǎng)絡(luò)和島葉皮質(zhì)的特征對ADHD亞型的區(qū)分有顯著貢獻。有研究認為隨著年齡的增長,兒童的大腦會沿著既定的發(fā)展軌跡發(fā)生顯著變化[16]。有文獻研究的兒童年齡為7~14歲,檢測到大腦特征的改變是由于正常發(fā)育而不是ADHD,并認為將上述研究的方法論框架應(yīng)用于年齡范圍較窄的多動癥參與者,將發(fā)育軌跡效應(yīng)與疾病效應(yīng)分離開來,將是有趣而重要的[15]。
有研究應(yīng)用功能連接特征進行數(shù)據(jù)集內(nèi)訓(xùn)練診斷精神分裂癥患者的準確性為87.09%,在獨立的重復(fù)數(shù)據(jù)集中進行驗證(準確性82.61%)[17]。數(shù)據(jù)間集驗證通過功能連接特征進一步確認了疾病定義(訓(xùn)練集準確性83.15%,驗證集準確性80.07%),展示了精神分裂癥患者皮層和邊緣系統(tǒng)區(qū)域之間的連接以及皮層和皮層下區(qū)域之間的連接。邊緣系統(tǒng)檢測到額下回三角部分、杏仁核和補充運動區(qū)、海馬和顳上回的異常連接。除此之外,包括丘腦、尾狀核、殼核、蒼白球和伏隔核在內(nèi)的所有皮質(zhì)下區(qū)域都顯示出異常的連接模式。
肥厚性心肌病和高血壓性心臟病的鑒別是一個挑戰(zhàn),因為對這兩種心肌病患者的處理及其結(jié)果是不同的。有研究對232名(高血壓性心臟病53例,肥厚性心肌病108例)受試者進行了多切片T1 mapping的影像組學(xué)紋理分析[18-19],應(yīng)用4組紋理描述符捕獲空間相關(guān)和獨立的像素統(tǒng)計信息,依次選擇6個具有高血壓性心臟病和肥厚性心肌病最佳區(qū)分能力的紋理特征,并使用支持向量機分類器對其進行測試。每個疾病組均按4:1隨機分組,在驗證數(shù)據(jù)集中分析了模式的可重復(fù)性。6個紋理特征在高血壓性心臟病和肥厚性心肌病之間具有最佳的鑒別能力。與T1區(qū)分這兩種病理實體的準確率為64%相比,T1 mapping影像組學(xué)紋理分析的總體準確率為86.2%,內(nèi)部驗證準確性為80.0%。
易引起急性冠狀動脈綜合征的進展性動脈粥樣硬化斑塊的特征是大量富含脂質(zhì)的壞死核、炎癥細胞數(shù)量增加和纖維帽?。?0]。這些動脈粥樣硬化病變被認為是易損斑塊,有很高的破裂和動脈粥樣硬化血栓驅(qū)動急性冠狀動脈綜合征的可能性。目前臨床應(yīng)用最廣泛的評估冠狀動脈斑塊的非侵入性成像方式是冠狀動脈計算機斷層血管成像(CCTA)。冠狀動脈計算機斷層血管攝影可以檢測到正性重構(gòu)、低衰減斑塊和斑點狀鈣化,這些是已知的急性冠狀動脈綜合征的前兆。這些動脈粥樣硬化斑塊特征也與心肌缺血有關(guān),預(yù)示著更惡性、快速進展的冠狀動脈疾病。目前還沒有單一的檢測方法能夠以一種經(jīng)濟有效且對患者友好的方式捕捉所有已知的易損性先兆。
有研究使用影像組學(xué)技術(shù)對具有napkin-ring征的冠狀動脈斑塊進行了識別[21],該研究比較了30例有napkin-ring征斑塊的患者與30例沒有napkin-ring征斑塊的患者,這些斑塊具有相似程度的鈣化、腔阻塞、定位和獲取參數(shù)。所有斑塊均采用商用軟件(QAngio CT)手工分割,計算8種常規(guī)斑塊定量指標(biāo)(病變長度、面積狹窄、平均斑塊負荷、病變體積、重塑指數(shù)、平均斑塊衰減、最小和最大斑塊衰減)。使用作者開發(fā)的影像組學(xué)圖像分析軟件包對分割斑塊進行分析,以量化4440個影像組學(xué)參數(shù)。采用接收機曲線分析和5次交叉驗證比較了影像組學(xué)參數(shù)與常規(guī)參數(shù)對具有餐巾環(huán)征斑塊的識別性能。結(jié)果發(fā)現(xiàn),一些影像組學(xué)特征對(包括3個參數(shù)-短期和長期的低灰度強調(diào)和高衰減體素與總表面的表面比值-突出了napkin-ring信號斑塊的低衰減和異質(zhì)形態(tài))高危斑塊的鑒別能力明顯高于病變體積和其他常規(guī)定量參數(shù)。
另一項前瞻性研究對25例疑似冠心病患者的44個冠狀動脈斑塊進行了分析[22]。所有患者均在90 d內(nèi)接受CCTA、18F-NaF PET、IVUS和OCT檢查。在所有試驗中,均建立了斑塊易損性的常規(guī)標(biāo)記物的存在和程度,并與CCTA中至少存在兩種斑塊易損性的常規(guī)特征相關(guān)聯(lián)。隨后,研究人員評估了影像組學(xué)特征與斑塊易損性標(biāo)志物之間的相關(guān)性??偣灿嬎懔?35個影像組學(xué)特征,并研究了這些特征相對于傳統(tǒng)特征的增量值。本研究的主要發(fā)現(xiàn)是影像組學(xué)標(biāo)記顯著提高了CCTA對易損斑塊特征的診斷準確性。影像組學(xué)參數(shù)“高衰減體素表面”的準確性獲得了最高的增益,該參數(shù)在接收算子曲線下的面積為0.87,用于識別18F-NaF PET陽性病灶,而傳統(tǒng)高風(fēng)險斑塊特征的識別面積為0.65。其他學(xué)者認為該研究在處理少量的患者時,一個挑戰(zhàn)是避免大量的影像組學(xué)參數(shù)與少量傳統(tǒng)的易損斑塊參數(shù)之間的虛假關(guān)聯(lián)。為了解決這個問題,使用大量重復(fù)的分層交叉驗證來獲得診斷性能的可靠估計是一種公認的方法,可以在真實世界中獲得診斷準確性的普遍性;研究的另一個限制是需要在影像組學(xué)分析之前手工分割斑塊,這可以通過應(yīng)用深度學(xué)習(xí)技術(shù)來克服[20];另外,作者只考慮了有餐巾環(huán)征的斑塊,而沒有考慮其他不利斑塊特征(低衰減、正重構(gòu))[23]。
乙型肝炎病毒(HBV)感染在中國是一個嚴重的問題,據(jù)報道世界上超過1/3的HBV感染者(約9300萬)居住在中國[24]。肝纖維化是慢性乙型肝炎的一種進行性疾病,準確評估肝纖維化對慢性乙型肝炎患者的預(yù)后、監(jiān)測和管理至關(guān)重要。肝活檢被認為是肝纖維化分期的參考標(biāo)準。然而,它是侵入性的,受樣本誤差、觀察者之間的變異性和各種潛在并發(fā)癥的限制。生物標(biāo)志物如APRI和FIB-4也被用來評估肝纖維化,但它們的診斷性能在HBV感染患者中仍然存在爭議。近年來,基于無創(chuàng)超聲成像技術(shù)的肝臟硬度測量因其在肝纖維化評估中的有效性和可行性而受到許多指南的大力推薦。幾項研究表明,二維實時剪切波彈性成像(2DSWE)在評估肝纖維化方面的診斷性能可與瞬時彈性成像或剪切波彈性成像測量值相比,甚至更好。盡管有這些優(yōu)點,2D-SWE的肝臟硬度測量仍然受到很多因素的影響。定義肝臟硬度測量的最佳感興趣區(qū)域、區(qū)分可靠和不可靠的測量以及控制整體圖像質(zhì)量的重要標(biāo)準在指導(dǎo)方針中仍然是模糊的。相比之下,一種名為影像組學(xué)的新興技術(shù)可以從醫(yī)學(xué)圖像中自動量化大量圖像特征(稱為影像組學(xué)表型),這有可能揭示肉眼無法識別的疾病特征。
一項前瞻多中心研究假設(shè)發(fā)現(xiàn),一種獨特的影像組學(xué)技術(shù)可能能夠使用更多來自2D-SWE圖像的有價值的信息,而不是僅僅依賴2D-SWE值,從而可能提供更好的肝纖維化分期準確性[24]。該研究從中國12家醫(yī)院招募了398名患者,最終選取1990幅2D-SWE圖像,試圖探討一種名為卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法在HBV感染多中心患者的2D-SWE圖像中對纖維化分期的診斷性能。本研究以肝臟活檢獲得的組織學(xué)為參考,并使用2D-SWE和生物標(biāo)志物與這種新的定量診斷策略,即彈性成像的深度學(xué)習(xí)影像組學(xué)(DLRE)進行比較。采用ROC曲線下面積(AUC)估計正確預(yù)測肝纖維化分期的概率。在評估肝硬化(F4)和晚期纖維化(F3)方面,DLRE與2D-SWE和生物標(biāo)志物相比有顯著改善。在訓(xùn)練隊列中,DLRE的AUC分別為1.00和0.99;在驗證隊列中,DLRE的AUC分別為0.97和0.98,說明DLRE與參考標(biāo)準肝活檢具有相似的診斷效果。2D-SWE的診斷準確率第2,訓(xùn)練隊列的AUCs分別為0.87和0.81,驗證隊列的AUC分別為0.86和0.85;生物標(biāo)志物的AUC在分層和隊列中均≤0.75。為了研究不同ALT、BMI和炎癥水平是否影響2D-SWE和DLRE的表現(xiàn),對亞組進行分層分析。結(jié)果表明,肝硬化(F4)炎癥等級對2D-SWE的性能影響顯著,而對DLRE的影響不顯著。另外,研究發(fā)現(xiàn)DLRE高度依賴于數(shù)據(jù)量。如果每個患者獲得更多的2D-SWE圖像來訓(xùn)練DLRE模型,那么無論是在訓(xùn)練還是驗證隊列中,它都顯示出在評估所有纖維化階段時診斷準確性的系統(tǒng)性提高;與DLRE不同的是,2D-SWE并沒有隨著數(shù)據(jù)量的增加而表現(xiàn)出顯著的差異。最后,DLRE在多中心研究中表現(xiàn)出了顯著的魯棒性。采用隨機選擇的3家醫(yī)院組合建立訓(xùn)練隊列,使用DLRE對訓(xùn)練和驗證隊列進行肝纖維化分級,未發(fā)現(xiàn)有顯著差異,診斷準確率與DLRE的總體診斷準確率相符。
有研究選取接受過釓酸增強MRI檢查的436例肝纖維化患者,按照3:1的比例隨機分為訓(xùn)練隊列(n=329)和測試隊列(n=107)[25],在訓(xùn)練隊列中,建立了一個模型來計算影像組學(xué)組學(xué)纖維化指數(shù)(RFI),采用logistic回歸和彈性網(wǎng)絡(luò)正則化來區(qū)分F3-F4期和F0-F2期。通過ROC分析,確定診斷臨床顯著纖維化(F2-F4期)、晚期纖維化(F3-F4期)和肝硬化(F4期)的最佳RFI截止時間。在測試隊列中,應(yīng)用Obuchowski指數(shù)與歸一化肝增強、APRI、FIB-4指數(shù)進行比較。研究表明,MRI增強肝膽期圖像的影像組學(xué)分析可以準確地分期肝纖維化。使用訓(xùn)練隊列數(shù)據(jù)創(chuàng)建的RFI模型使驗證隊列中的肝纖維化分期成為可能,曲線下面積為0.89~0.91,準確率為80%~81%。與假設(shè)一致,RFI結(jié)合了來自多個圖像特征的信息,使得肝纖維化的分期(Obuchowski index,0.86)比歸一化肝增強(Obuchowski index,0.77)更準確,且優(yōu)于血清學(xué)指標(biāo)(Obuchowski index,0.60~0.62)。
在過去的10年里,計算能力的進步為醫(yī)學(xué)成像提供了一種新的視角。高功率計算的可用性使得自動分析更詳細的層析圖像和快速提取可轉(zhuǎn)換為數(shù)字的量化亞視覺特征成為可能。對這些圖像進行分割后,測量其選擇性特征。對于每張圖像,通常會測量和評估數(shù)百種不同的特征。根據(jù)所捕獲的圖像屬性類型,定量特征大致可分為4類:強度、結(jié)構(gòu)、紋理/梯度和小波,這個過程通常被稱為影像組學(xué)[19]。多中心前瞻性研究及深度學(xué)習(xí)方法是研究的亮點及優(yōu)勢所在[24]。研究的主要局限性是受限于人群規(guī)模[9,20,24];患者人群分布不平衡;圖像是從不同的成像儀上獲取的,具有不同的采集平面和采集序列[9];單一制造商成像儀上進行的,這可能限制了推廣研究結(jié)果的能力[25];回顧性研究可能引入了選擇偏差。深度學(xué)習(xí)方法尚處于發(fā)展階段[24],未來的研究需要讓更多的、更大范圍的患者參與進來,從而更好地訓(xùn)練深度學(xué)習(xí)模型;而更大的多中心、多供應(yīng)商、多領(lǐng)域研究可能提供更好的結(jié)果概括性,包括外部驗證背景下的整體穩(wěn)定性驗證[18]。