陳志庚,李響,沙琳
作者單位:大連醫(yī)科大學(xué)附屬第二醫(yī)院放射科,大連116027
新輔助化療(neoadjuvant chemotherapy,NAC)是絕大多數(shù)乳腺癌,尤其是局部晚期乳腺癌的標(biāo)準(zhǔn)治療方法[1-2],其旨在降低腫瘤分期,減少手術(shù)干預(yù)程度。雖然多數(shù)患者可以從中受益,但是全世界范圍內(nèi)僅12%~28%達(dá)到病理完全緩解(pathologic complete response,pCR)[3],另有10%~35%對(duì)NAC不敏感以及5%左右出現(xiàn)病灶進(jìn)展[4]。乳腺癌的反應(yīng)可分為六種,即pCR、單病灶縮小、單病灶伴衛(wèi)星灶殘留、多病灶殘留、病灶穩(wěn)定以及病灶進(jìn)展[5-6]。在手術(shù)方案的制訂中,對(duì)pCR和單病灶縮小傾向于采取保乳手術(shù),余者更傾向于乳房切除術(shù)。
目前NAC 療效評(píng)估的金標(biāo)準(zhǔn)是病理活檢。Miller-Payne(MP)分級(jí)是基于病理活檢的臨床評(píng)估方法,其根據(jù)鏡下腫瘤細(xì)胞的密度和形態(tài)劃分G1~G5。實(shí)體瘤的療效評(píng)估(RECIST 1.1)是基于影像學(xué)檢查的評(píng)價(jià)方法。MRI 能夠?qū)⒛[瘤內(nèi)部信息可視化后用于分析,在乳腺癌的良惡性鑒別、分級(jí)和NAC 反應(yīng)評(píng)估等方面得到普遍應(yīng)用[7-8]。有別于傳統(tǒng)影像診斷,機(jī)器學(xué)習(xí)(machine learning,ML)能夠提取醫(yī)學(xué)圖像中肉眼無(wú)法識(shí)別的信息并轉(zhuǎn)換為定量特征,篩選其中與腫瘤異質(zhì)性高度相關(guān)者用于預(yù)測(cè)或分類(lèi)。本文就ML基于不同MR序列預(yù)測(cè)NAC后乳腺癌的反應(yīng)進(jìn)行綜述。
ML 是統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)的交叉學(xué)科,專(zhuān)注于對(duì)數(shù)據(jù)進(jìn)行學(xué)習(xí)歸納并不斷自我完善,常用于處理預(yù)測(cè)和分類(lèi)的問(wèn)題。按學(xué)習(xí)方式分為監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。監(jiān)督學(xué)習(xí)是一類(lèi)基于已標(biāo)記的訓(xùn)練樣本進(jìn)行學(xué)習(xí)進(jìn)而推測(cè)未知樣本的算法,而無(wú)監(jiān)督學(xué)習(xí)所采用的訓(xùn)練樣本無(wú)需標(biāo)記[9]。半監(jiān)督學(xué)習(xí)介于二者之間,是一種兼具低成本和準(zhǔn)確性的方法[10]。強(qiáng)化學(xué)習(xí)與無(wú)監(jiān)督學(xué)習(xí)相似,但是引入了獎(jiǎng)懲函數(shù),以獎(jiǎng)勵(lì)信號(hào)函數(shù)值達(dá)到最大為目標(biāo)[11]。影像組學(xué)(radiomics)主要流程為:(1)獲取醫(yī)學(xué)圖像;(2)勾畫(huà)感興趣區(qū)(region of interest,ROI);(3)提取影像特征;(4)特征降維;(5)建立模型。ML 已涉及其中(2)~(5)。相關(guān)研究常以監(jiān)督學(xué)習(xí)方法建立預(yù)測(cè)模型,常用算法有支持向量機(jī)(support vector machine,SVM)、隨機(jī)森林(random forest,RF)、邏輯回歸(Logistic regression)等。
動(dòng)態(tài)對(duì)比增強(qiáng)磁共振成像(dynamic contrast-enhanced magnetic resonance imaging,DCE-MRI)是乳腺M(fèi)RI 最靈敏的成像序列,該技術(shù)的原理是通過(guò)連續(xù)、快速地掃描獲取對(duì)比劑注射前后多個(gè)時(shí)間點(diǎn)的圖像。在以往研究中,NAC評(píng)估常用的MRI特征有腫瘤直徑、體積和病灶增強(qiáng)等,但從現(xiàn)有證據(jù)來(lái)看,該特征并不足以作為pCR的早期預(yù)測(cè)因素[12]。直方圖和紋理分析是基于統(tǒng)計(jì)建模對(duì)腫瘤異質(zhì)性的定量分析,Bitencourt等[13]對(duì)DCE-MRI進(jìn)行分析發(fā)現(xiàn)直方圖特征的熵、第90百分位數(shù)、方差,紋理特征的區(qū)域長(zhǎng)度方差與pCR 密切相關(guān),其預(yù)測(cè)效能優(yōu)于包括腫瘤直徑、增強(qiáng)類(lèi)型在內(nèi)的臨床和MRI 特征。DCE-MRI的血流動(dòng)力學(xué)參數(shù)同樣可以用于定量分析,容積轉(zhuǎn)移參數(shù)(Ktrans)、速率參數(shù)(Kep)以及血管外細(xì)胞外容積分?jǐn)?shù)(Ve)是早期預(yù)測(cè)腫瘤反應(yīng)的良好特征[14]。但是Braman等[15]研究認(rèn)為與影像特征相比,血流動(dòng)力學(xué)參數(shù)并非高度相關(guān)特征。這表示影像特征可能更具備成為生物標(biāo)志物的潛力。浸潤(rùn)性乳腺癌對(duì)周?chē)M織具有侵犯性,其浸潤(rùn)范圍與手術(shù)范圍密切相關(guān),因此腫瘤周?chē)鷧^(qū)域同樣需要深入分析。Braman等[15]提取腫瘤周?chē)鷧^(qū)域特征用于分析,其結(jié)果證明腫瘤周?chē)鷧^(qū)域的直方圖特征和紋理特征可用于預(yù)測(cè)模型,但是不同乳腺癌亞型的最佳預(yù)測(cè)特征存在差異。NAC 方案通常需要6 到8 個(gè)周期,期間腫瘤異質(zhì)性的變化是值得深入探討的。治療前的圖像通常稱(chēng)之為基線圖像,F(xiàn)an等[16]選取基線與兩個(gè)治療周期后圖像通過(guò)配準(zhǔn)形成雅可比圖以反映圖像體素變化,該模型基于此三類(lèi)圖像進(jìn)行特征提取,其分析結(jié)果顯示反映腫瘤異質(zhì)性的直方圖特征(例如平均值)和紋理特征(例如太依賴(lài)高灰度強(qiáng)調(diào))的變化可用于早期預(yù)測(cè),NAC應(yīng)答組的降低程度高于無(wú)應(yīng)答組。Sutton等[17]表明基線和NAC 后不同增強(qiáng)時(shí)間點(diǎn)的圖像紋理特征的變化同樣具有預(yù)測(cè)價(jià)值。該特征變化由生長(zhǎng)分割混合高斯模型計(jì)算圖像間體素差異而得。研究中所用的Gabor 濾波器對(duì)圖像邊緣敏感,可以細(xì)致地獲取紋理的變化,此類(lèi)特征屬于高階特征。但是Gabor 變換對(duì)突變信號(hào)和非平穩(wěn)信號(hào)處理能力不足,而小波變換可以彌補(bǔ)該缺點(diǎn)。小波變換是對(duì)空間頻率的局部化分析,可有效地提取圖像中的高頻和低頻信號(hào),更加細(xì)致、全面地分析紋理變化[18]。從Zhou 等[19]的研究可知小波變換紋理特征對(duì)預(yù)測(cè)pCR 有良好的表現(xiàn),并且優(yōu)于體積紋理特征和周邊紋理特征。另有學(xué)者將關(guān)注點(diǎn)對(duì)準(zhǔn)了高斯拉普拉斯(Laplacian of Gaussion,LoG),這是圖像二階空間導(dǎo)數(shù)的二維各向同性測(cè)度,用于突出圖像中強(qiáng)度發(fā)生快速變化的區(qū)域[20]。Choudhery 等[21]提取三陰性乳腺癌的3D 形狀特征和紋理特征用于分析,發(fā)現(xiàn)基于LoG 濾波器的信號(hào)強(qiáng)度平均值、信號(hào)強(qiáng)度中位數(shù)、最大信號(hào)強(qiáng)化、最小信號(hào)強(qiáng)度和信號(hào)強(qiáng)度標(biāo)準(zhǔn)差可用于預(yù)測(cè)pCR。上述特征類(lèi)別不盡相同,所用濾波器和特征計(jì)算方法也存在差異,能夠更可信地解釋腫瘤間差異化緩解的關(guān)鍵特征可能尚待發(fā)掘。因此,特征的優(yōu)劣對(duì)比及對(duì)更多高階特征的嘗試值得深入探索。
彌散加權(quán)成像(diffusion-weighted imaging,DWI)是基于組織內(nèi)水分子彌散運(yùn)動(dòng)的成像手段,表觀彌散系數(shù)(apparent diffusion coefficient,ADC)是其量化指標(biāo)。DWI 和ADC 可以反映水分子的彌散率、腫瘤細(xì)胞密度和細(xì)胞膜完整性,用于預(yù)測(cè)NAC 反應(yīng)[22]。Chen 等[23]對(duì)比了DCE-MRI和ADC 圖,結(jié)果表明基于ADC 圖的模型能夠預(yù)測(cè)pCR,并且基于DCE-MRI 和ADC 圖的聯(lián)合模型表現(xiàn)更好,其所用四個(gè)影像特征中兩個(gè)取自ADC 圖。由此可知,多模態(tài)序列中納入DWI和ADC 是一個(gè)值得考慮的選擇。另外,研究認(rèn)為基于邏輯回歸的諾謨圖具備定量預(yù)測(cè)pCR 的潛能。Bian 等[24]和Chen 等[25]基于DWI、DCE-MRI、和T2WI 高效地預(yù)測(cè)了pCR 并肯定了諾謨圖的作用,并且后者通過(guò)決策曲線分析(decision curve analysis,DCA)證實(shí)了諾謨圖的有效性。上述研究大多致力于對(duì)pCR 的預(yù)測(cè),然而非pCR 腫瘤的退縮模式是影響手術(shù)方式的重要因素,如能準(zhǔn)確識(shí)別將有助于治療方案制定和調(diào)整。Zhuang 等[5]將pCR 和單病灶縮小作為一組,其余非pCR退縮模式為另一組,基于多模態(tài)基線圖進(jìn)行預(yù)測(cè),AUC 可達(dá)0.826。目前早期預(yù)測(cè)研究一種聚焦于基線圖像,另一種聚焦于治療期間圖像的變化。Eun 等[26]選取基線和治療中期(第3 或4 治療周期)的多模態(tài)圖像(DWI、ADC 圖、DCE-MRI 和T2)進(jìn)行紋理分析,經(jīng)對(duì)比表明治療中期的預(yù)測(cè)效能優(yōu)于基線及治療中期-基線。目前,多序列的結(jié)合較之單一序列效能更佳,但是最佳的序列組合尚無(wú)定論,后續(xù)可以對(duì)此做進(jìn)一步的比對(duì)研究。
目前,ML 正在向深度學(xué)習(xí)(deep learning,DL)方向發(fā)展。DL基本結(jié)構(gòu)是輸入層、隱含層和輸出層,其中隱含層包括卷積層、池化層以及全連接層。卷積層負(fù)責(zé)提取圖像特征,池化層則對(duì)特征進(jìn)行篩選和信息過(guò)濾,得到的特征最后進(jìn)入全連接層進(jìn)行非線性組合得以輸出。這是一種端到端的結(jié)構(gòu)類(lèi)型,即前端輸入原始圖像后末端直接輸出結(jié)果,無(wú)需對(duì)特征進(jìn)行預(yù)設(shè)定,可自行創(chuàng)建特征并進(jìn)行學(xué)習(xí),建立起從輸入端到輸出端的函數(shù)關(guān)系[27]。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)是DL的代表算法之一,該網(wǎng)絡(luò)結(jié)構(gòu)是對(duì)生物神經(jīng)網(wǎng)絡(luò)的模擬,在圖像識(shí)別方面擁有其他算法不可比擬的作用[28]。
VGGNet (visual geometry group network)是CNN 中常用的網(wǎng)絡(luò)結(jié)構(gòu),常使用L2 正則化(regularization)、增強(qiáng)(augmentation)、舍棄(dropout)防止數(shù)據(jù)過(guò)擬合。在一些研究中已經(jīng)展現(xiàn)出比傳統(tǒng)ML 更高的效能。在Ha 等[29]研究中將NAC 后腫瘤的反應(yīng)分為pCR、部分緩解和無(wú)緩解或進(jìn)展三組,使用基線DCE-MRI 實(shí)現(xiàn)了良好的預(yù)測(cè)效能。El Adoui 等[30]進(jìn)一步討論了NAC前后DCE-MRI在CNN預(yù)測(cè)pCR中的差異。他們發(fā)現(xiàn)雖然使用基線與NAC后圖像的組合模型的AUC最高,但是基線圖像的AUC 也達(dá)到0.7969,并且高于NAC 后圖像。此外,該研究顯示選用未經(jīng)分割的圖像較人工分割腫瘤邊界的圖像效能更佳。這說(shuō)明CNN足以應(yīng)付復(fù)雜信息,人為裁剪圖像可能反而減少與腫瘤異質(zhì)性相關(guān)的數(shù)據(jù),限制了CNN的能力。隨著DL 深度的增加可能會(huì)出現(xiàn)梯度消失和梯度爆炸,導(dǎo)致淺層參數(shù)未能得到充分訓(xùn)練。多通道CNN可以有效減少此類(lèi)問(wèn)題,使DL的淺層學(xué)習(xí)到更具區(qū)分性的特征。前文El Adoui等[30]以包含兩個(gè)并行子通道的多通道CNN 同時(shí)分析治療前后的圖像,Qu等[31]則擴(kuò)展至12個(gè)并行子通道將治療前后DCE-MRI的六個(gè)增強(qiáng)階段圖像納入分析。后者表示NAC 后圖像的預(yù)測(cè)效能優(yōu)于基線圖像,不過(guò)采用治療前后圖像數(shù)據(jù)的組合模型表現(xiàn)仍是最優(yōu)的,并且該研究通過(guò)DCA 證實(shí)多通道CNN 具有臨床價(jià)值。目前乳腺癌CNN 研究仍以DCE-MRI 為主,而在結(jié)直腸癌中,除主要序列T2WI外,還對(duì)多種序列及其組合(DCE-MRI、ADC等)進(jìn)行了探索并取得良好成效[32]。有鑒于此,多模態(tài)序列及新興序列的CNN應(yīng)用可作為后續(xù)研究的思路之一。
綜上所述,直方圖特征、紋理特征和高階特征對(duì)NAC 反應(yīng)的預(yù)測(cè)作用已經(jīng)得到證實(shí),但是受限于開(kāi)發(fā)人員的專(zhuān)業(yè)知識(shí),傳統(tǒng)ML 設(shè)定的特征可能無(wú)法獲取正常與異常間的復(fù)雜變化。DL 則很好地彌補(bǔ)了這點(diǎn),但是具有很高的敏感度的同時(shí)也存在較高的假陽(yáng)性率。傳統(tǒng)ML 研究大部分采取人工勾畫(huà)ROI,雖然這是金標(biāo)準(zhǔn),但是需要大量的時(shí)間和人力成本,也存在主觀因素的干擾。值得期待的是自動(dòng)分割和半自動(dòng)分割有望取代人工分割[33-35],不過(guò)仍需要更多的研究來(lái)進(jìn)行論證。無(wú)論是傳統(tǒng)ML還是DL,都需要大數(shù)據(jù)作為支撐才能發(fā)揮出應(yīng)有的效果。雖然近年的研究中納入的樣本量正在逐漸增多,但是仍然需要進(jìn)一步地?cái)U(kuò)大。機(jī)器型號(hào)或參數(shù)等都可能對(duì)預(yù)測(cè)模型產(chǎn)生影響,因此圖像的預(yù)處理是極為重要的環(huán)節(jié)[36]。對(duì)預(yù)處理的具體步驟目前尚無(wú)統(tǒng)一的標(biāo)準(zhǔn),在許多研究中往往也欠缺細(xì)致的說(shuō)明。最后,現(xiàn)階段的預(yù)測(cè)模型還停留在研究階段,絕大多數(shù)是單一中心的回顧性研究,而且關(guān)于DL 應(yīng)用于預(yù)測(cè)乳腺癌NAC反應(yīng)的研究的數(shù)量較之傳統(tǒng)ML尚顯不足。總而言之,ML 強(qiáng)大的分析能力為乳腺癌診療技術(shù)的進(jìn)步帶來(lái)了希望,相信隨著人工智能技術(shù)的進(jìn)步,未來(lái)將開(kāi)發(fā)出更精準(zhǔn)、適用范圍更廣且更具臨床價(jià)值的ML模型。
作者利益沖突聲明:全體作者均聲明無(wú)利益沖突。