劉波,劉菲,周冠知,張登云,王鶴翔,王赫,張群,張堅*
作為最常見的癌癥之一,胃癌的死亡率位列我國癌癥相關(guān)死因的第四名[1]。大約20%的進展期患者在接受根治手術(shù)后1 年內(nèi)復(fù)發(fā)[2]。中國臨床腫瘤學會(Chinese Society of Clinical Oncology,CSCO)胃癌指南[3]推薦使用的超聲內(nèi)鏡(endoscopic ultrasound,EUS)、MRI、計算機斷層掃描(computed tomography,CT)、正電子發(fā)射計算機斷層顯像(positron emission tomography computer tomography,PET-CT)等影像學檢查在胃癌的臨床診斷、療效評估及預(yù)后預(yù)測等領(lǐng)域發(fā)揮著重要作用。但是,傳統(tǒng)影像學檢查反映腫瘤異質(zhì)性的生物學信息明顯不足,其主要關(guān)注病變的形態(tài)、大小及強化特征,且診斷準確率為40.8%~98.1%不等[4-6]。隨著胃癌個體化診療的發(fā)展,迫切需要更準確、經(jīng)濟、無創(chuàng)的評估方法。近十年來,人工智能(artificial intelligence,AI)技術(shù)發(fā)展迅速?;贏I技術(shù)的影像組學和深度學習技術(shù),正是醫(yī)工學科交叉的產(chǎn)物,該技術(shù)能夠突破常規(guī)影像學依靠視覺進行主觀判斷的局限,將影像圖像轉(zhuǎn)換為海量可挖掘的數(shù)據(jù)特征,客觀量化地表現(xiàn)腫瘤內(nèi)的異質(zhì)性和微環(huán)境。AI技術(shù)在胃癌的臨床診療及預(yù)后預(yù)測研究中已展現(xiàn)出了巨大的優(yōu)勢,是目前學術(shù)研究的熱點[7]。因此,本文著重介紹基于AI技術(shù)的胃癌影像學研究中的方法框架及研究進展。
由于不同成像方式、機器協(xié)議等原因,原始圖像均帶有不可避免的異質(zhì)性,為了減少這種干擾,就需要對圖像進行預(yù)處理。預(yù)處理圖像最常用的兩種技術(shù)為圖像歸一化和重采樣。具體而言,圖像歸一化技術(shù)是將原始圖像轉(zhuǎn)換為統(tǒng)一的標準格式,減少各組圖像之間的差異[8-9]。重采樣技術(shù)則是通過提升或降低像素采樣將原始圖像轉(zhuǎn)換為目標尺寸[10-13],現(xiàn)今,圖像預(yù)處理技術(shù)已成為基于AI技術(shù)的胃癌影像學研究的常規(guī)步驟。臨床病理特征在基于AI技術(shù)的模型構(gòu)建中也發(fā)揮著重要作用,這些因素包括患者年齡、性別、體質(zhì)量指數(shù)、癌胚抗原(carcinoembryonic antigen,CEA)、糖類抗原199 (carbohydrate antigen 199,CA199)、糖類抗原724 (carbohydrate antigen 724,CA724)、腫瘤位置、腫瘤大小和TNM分期等,可通過結(jié)合上述臨床特征改善模型性能[10,11,14]。
對于感興趣區(qū)(rregion of interests,ROI)的分割可使用人工、半自動或全自動三種方法。其中,人工分割通常由影像科醫(yī)生手工勾畫病灶的三維/二維(3D/2D)邊界生成ROI。Wang 等[15]手動勾畫完整腫瘤生成3D ROI,以此構(gòu)建影像組學模型預(yù)測胃腺癌的組織分型,其在內(nèi)部驗證組中AUC 為0.904。Dong等[10]通過勾畫腫瘤最大截面生成2D ROI,構(gòu)建深度學習模型以預(yù)測進展期胃癌的淋巴結(jié)轉(zhuǎn)移狀態(tài),其在4 組外部驗證組的C 指數(shù)為0.777~0.817。此外,Zhang 等[13]通過在CT 圖像勾畫生成2D ROI,基于18 層殘差卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)算法構(gòu)建深度學習模型,預(yù)測進展期胃癌患者的術(shù)后復(fù)發(fā)與總生存期,在內(nèi)部和外部驗證組中的AUC 分別為0.826 和0.806。由于不同影像科醫(yī)師對腫瘤邊界的主觀判斷可能存在差異,因此需要多位醫(yī)師在不同時間點進行勾畫,以評估同一醫(yī)師和不同醫(yī)師間的勾畫差異性。通常計算組內(nèi)和組間相關(guān)系數(shù)(intra- and interclass correlation coefficients,ICC)來評估特征的穩(wěn)定性和復(fù)現(xiàn)性[12,14,16]。與人工分割相比,半自動分割技術(shù)可大大降低工作量,其通常包括兩個步驟:先由影像科醫(yī)生勾畫幾個標記點,然后自動分割程序根據(jù)標記點自動識別并生成ROI。多項研究通過使用這種方法取得了令人滿意的實驗結(jié)果,模型的AUC為0.630~0.940[15,17-18],并采用計算機軟件(Frontier、Syngo via、Siemens Healthcare 等軟件中的一種)應(yīng)用二分法半自動區(qū)分正常與病變區(qū)域。全自動分割需要構(gòu)建自動識別的CNN算法,對于計算機技術(shù)要求較高,現(xiàn)應(yīng)用于前列腺癌、神經(jīng)疾病等領(lǐng)域[19-21],胃癌相關(guān)研究仍處于探索階段,Zhang 等[22]構(gòu)建了可自動勾畫病灶的3D深度學習網(wǎng)絡(luò),該算法具有良好的病灶分割和淋巴結(jié)分類能力,AUC為0.837~0.860。Li等[23]構(gòu)建了新型可自動分割病灶的3D 金字塔網(wǎng)絡(luò)(3D improved feature pyramidal network,3D IFPN),其性能優(yōu)于現(xiàn)有的其他自動分割算法。無論是全自動或半自動分割技術(shù),都較人工手動勾畫節(jié)省大量的人力與時間,并且應(yīng)用標準化的計算機算法可以提高病灶分割的復(fù)現(xiàn)性。當未來AI 模型應(yīng)用于臨床實踐時,將有利于提升模型應(yīng)用的泛化性與工作效率。并且,隨著計算機算法的發(fā)展,自動分割技術(shù)將更加成熟與穩(wěn)定,相信該技術(shù)未來將在基于AI 技術(shù)將在胃癌影像學研究中發(fā)揮愈發(fā)重要的作用。
分割病灶生成ROI后,可以通過特征提取軟件計算出定量的影像組學特征。常規(guī)影像組學特征可以分類為一階統(tǒng)計量特征、形狀特征、紋理特征。一階統(tǒng)計量特征用于表現(xiàn)ROI 中體素強度的分布,但不包含體素間的空間關(guān)系;形狀特征用于表現(xiàn)ROI的幾何特性,如:直徑、體積、致密度和偏心度等;紋理特征用于表現(xiàn)空間中體素分布情況。不同于常規(guī)影像組學特征,深度學習特征來自深度學習神經(jīng)網(wǎng)絡(luò)算法,該技術(shù)將影像圖片編碼為特征圖,從中提取肉眼無法發(fā)現(xiàn)的信息。Gao等[24]基于快速區(qū)域CNN算法建模預(yù)測胃周淋巴結(jié)轉(zhuǎn)移狀態(tài),其AUC和準確度為0.954 和78.0%。Zhang 等[13]結(jié)合3 種常規(guī)影像組學特征、6 種深度學習特征和臨床因素構(gòu)建列線圖,用于預(yù)測胃癌患者的術(shù)后早期復(fù)發(fā),在內(nèi)部和外部驗證組中AUC 分別為0.826 和0.806。常規(guī)的影像組學特征表現(xiàn)了ROI 的形態(tài)、強度和紋理,而深度學習神經(jīng)網(wǎng)絡(luò)可以從圖像中直接提取像素相關(guān)特征。因此,結(jié)合常規(guī)影像組學特征和深度學習特征,可以獲得更高維度的數(shù)據(jù)以提高模型效能。
最常用的特征選擇方法分為包裹式、過濾式、嵌入式。在這些方法中,包裹式(如回歸特征消除、順序特征選擇算法等)是在保證模型獲得最佳性能的同時,通過多次訓練模型以提取特征子集。不同于包裹式,過濾式(如相關(guān)性分析、方差分析等)是較簡單的特征選擇方法,其根據(jù)數(shù)據(jù)的相關(guān)性篩選特征[25-27]。包裹式和過濾式經(jīng)常會被結(jié)合使用以提高特征選擇的能力。通過結(jié)合Pearson 相關(guān)性分析和序列浮動前向選擇(sequential floating forward selection,SFFS)算法,Yang 等[27]選取腫瘤和淋巴結(jié)的常規(guī)影像組學特征建模,該模型取得了滿意的預(yù)測性能。嵌入式是將分類器算法的訓練和特征選擇過程結(jié)合,然而在患者數(shù)量較少、組學特征很多時,該方法易出現(xiàn)過擬合,此時可應(yīng)用正則化來避免。LASSO(least absolute shrinkage and selection operator)回歸是一種經(jīng)典且應(yīng)用廣泛的嵌入式算法[11,16],通過構(gòu)造懲罰函數(shù)不斷減少特征,因此應(yīng)用該算法可以構(gòu)建簡單而有效的數(shù)個特征組成的模型。在研究過程中,各特征選擇方法并非孤立,通過合理的結(jié)合可以獲得效能最佳的特征集合。
關(guān)于模型構(gòu)建,Logistic 回歸模型(如:多因素Logistic回歸分析、LASSO 回歸算法)已廣泛應(yīng)用在基于AI 技術(shù)的胃癌研究中[28-29]。支持向量機(support vector machine,SVM)和隨機森林算法也是構(gòu)建模型常用的機器學習分類器方法[10,12,30]。在一項多中心研究中,Dong等[10]構(gòu)建了結(jié)合深度學習特征、常規(guī)影像組學特征和臨床特征的AI 模型,應(yīng)用多種建模方法包括SVM、CNN、隨機森林、Spearman 相關(guān)性分析、Logistic 回歸分析和線性回歸分析等算法并進行性能比較,其中基于SVM 算法構(gòu)建的模型產(chǎn)生了較佳的預(yù)測效能?,F(xiàn)今,在基于AI 技術(shù)的胃癌影像學研究中,普遍通過結(jié)合多種算法和組學特征旨在構(gòu)建性能最佳的預(yù)測模型,其相應(yīng)算法亦是該研究最合適的建模方法,然而哪種是最佳的建模方法尚無定論。
TNM 分期系統(tǒng)是胃癌診療中最權(quán)威且應(yīng)用最廣泛的分期系統(tǒng),臨床診療過程中可應(yīng)用CT和MRI檢查對胃癌診斷、分期與評估[31-32]。CT 檢查掃描時間短,受胃腸道蠕動影響較小,目前在胃癌臨床診療方面應(yīng)用比較廣泛,大多數(shù)研究都應(yīng)用CT圖像對病理TNM分期進行術(shù)前預(yù)測[10,12,6]。由于淋巴結(jié)常發(fā)生炎性反應(yīng)而腫大,傳統(tǒng)影像學檢查存在淋巴結(jié)評估困難的問題。胃癌相關(guān)的淋巴結(jié)多位于腹膜后,穿刺活檢較困難,因此無創(chuàng)地評估淋巴結(jié)轉(zhuǎn)移情況成為預(yù)測TNM分期的難點[4]。既往多數(shù)研究旨在區(qū)分N (+)和N (-)[12,16,33],也有部分研究旨在區(qū)分特定的N分期(N0~N3)[9-10]。上述研究基于常規(guī)影像組學特征、深度學習特征的模型,在驗證組中的AUC 范圍是0.760~0.890[10,12,16]。對于T 分期的預(yù)測,既往有多項研究旨在區(qū)分T1/T2 和T3/T4 分期[18,33-34]、T3 和T4a 分期[35-37],較少研究對T1~T4各分期進行區(qū)分[17],各研究構(gòu)建的模型均產(chǎn)生良好的預(yù)測效果,在驗證組中的AUC 范圍是0.820~0.910。對于M 分期,Liu等[38]基于進展期胃癌的靜脈期CT圖像建模以預(yù)測隱匿性腹膜轉(zhuǎn)移,該研究的影像組學模型(AUC=0.724)性能略遜于臨床模型(AUC=0.762),該研究對后續(xù)的組學研究有一定的參考價值,也從側(cè)面說明臨床特征和影像科醫(yī)師的主觀評估在臨床實踐中的重要性。由于MRI檢查采集時間長,患者消化道蠕動、呼吸和患者運動引起的運動偽影會隨之加重,因此其在胃癌患者中的應(yīng)用較少[39]。既往也有多項研究應(yīng)用MRI圖像通過勾畫胃癌完整病灶,利用表觀擴散系數(shù)(apparent diffusion coefficient,ADC)分析,預(yù)測胃癌T、N 分期,AUC 約為0.80,但未驗證模型性能[25,40-41]。Chen 等[42]提取了基于MRI 的ADC、常規(guī)影像組學特征構(gòu)建預(yù)測N 分期的模型,其中由影像組學特征、ADC 值、影像醫(yī)師評估的N 分期組成的列線圖取得了最佳預(yù)測性能。該研究利用雙中心數(shù)據(jù),進行內(nèi)、外部驗證,列線圖在驗證組中AUC 為0.860~0.880。相信隨著成像技術(shù)的不斷進步,MRI在胃癌的影像組學研究中將發(fā)揮出愈發(fā)重要的應(yīng)用價值。
關(guān)于術(shù)前預(yù)測胃癌的組織病理學狀態(tài),既往多項研究基于AI 技術(shù)建模預(yù)測胃癌的組織分化程度[26,43]、Lauren 分型[15,26,44]、淋巴血管和神經(jīng)侵犯[14]等,均取得了良好的預(yù)測效能。其中Zhang等[43]基于MRI的ADC直方圖分析建模預(yù)測胃癌的組織分化程度,各ADC 分組的AUC 范圍為0.550~0.680,該研究首次將MRI的完整腫瘤的ADC分析應(yīng)用于胃癌研究,具有一定的開拓意義。除預(yù)測常規(guī)病理特征以外,Gao等[11]基于CT構(gòu)建影像組學模型評估一種新興的生物標志物——腫瘤浸潤調(diào)節(jié)性T (tumor-infiltrating regulatory T,TITreg)細胞的富集程度,并取得了良好的預(yù)測效果,各模型AUC為0.847~0.884。此外,還有多項研究構(gòu)建模型預(yù)測胃癌患者的人類表皮受體-2 (human epidermal receptor-2,HER-2)表達狀態(tài),可無創(chuàng)地識別出適合于曲妥珠單抗靶向治療的HER-2 陽性患者[45-46]。因此伴隨著基礎(chǔ)研究的發(fā)展,基于AI 技術(shù)的胃癌影像學研究也將延伸到更為復(fù)雜的腫瘤內(nèi)部微環(huán)境狀態(tài)相關(guān)方向,從而提升模型對臨床結(jié)果預(yù)測的精確性及可解釋性,有助于影像組學在臨床上的應(yīng)用和發(fā)展。
既往多項影像學研究方向為胃癌的鑒別診斷[28,47-48]。其中,通過紋理分析,Ba-Ssalamah 等[28]基于動脈期和靜脈期增強CT 對腺癌、淋巴瘤和胃腸道間質(zhì)瘤進行區(qū)分,誤分類率為0%~10%。Feng等[47]通過結(jié)合常規(guī)影像組學特征、CT表現(xiàn)構(gòu)建模型以區(qū)分Borrmann Ⅳ型胃癌與原發(fā)性胃淋巴瘤,驗證組中AUC 為0.932。目前影像組學在胃癌與胃平滑肌肉瘤間的鑒別診斷研究鮮有報道,準確區(qū)分此類良惡性病變也具有重要的臨床意義。
新輔助化療(neoadjuvant chemotherapy,NAC)可提高胃癌患者根治性切除率和生存獲益[49],廣泛應(yīng)用于進展期胃癌的Ⅲ期及以上的患者中。然而,NAC的實際效果存在個體差異性,約有至少20%接受NAC 的患者無法明顯獲益,徒增經(jīng)濟負擔并延誤手術(shù)時機[50]。因此,在新輔助治療前識別NAC有效者對于患者的診療決策至關(guān)重要。既往多項研究基于CT 構(gòu)建影像組學模型預(yù)測NAC 治療無效者模型的AUC 為0.650~0.820[29-30,51],其中Sun等[30]的研究結(jié)果證明影像組學模型的預(yù)測效能優(yōu)于臨床模型。術(shù)后化療和放療是進展期胃癌患者最主要的兩種術(shù)后治療方案。既往多項研究建模預(yù)測患者的化療效果及預(yù)后[8,52-53]。其中,Jiang 等[8]基于CT 的影像組學模型提示具有較高影像組學評分的Ⅱ期和Ⅲ期胃癌患者對化療反應(yīng)較好并進行生存分析,結(jié)果顯示影像組學模型預(yù)測性能優(yōu)于TNM分期系統(tǒng)。除此以外,Jiang等[53]基于PET-CT構(gòu)建了影像組學分數(shù)(radiomics score,Rad-score),發(fā)現(xiàn)化療敏感者分數(shù)較高。Klaassen等[52]通過勾畫食管胃結(jié)合部癌患者的肝轉(zhuǎn)移灶,構(gòu)建CT 影像組學模型來預(yù)測對化療反應(yīng)良好的患者,在驗證組中模型的AUC為0.650~0.790。Hou等[54]基于CT圖像建模以區(qū)分發(fā)生腹腔轉(zhuǎn)移后對放療敏感的患者,其預(yù)測精準度為0.714~0.816。CSCO 指南[3]推薦對于可耐受同步放化療的患者,盡可能同步治療,目前胃癌的影像組學研究預(yù)測接受同步放化療患者治療效果的研究鮮有報道。隨著影像組學與腫瘤學結(jié)合的發(fā)展,相信AI 技術(shù)與胃癌臨床診療應(yīng)用價值的結(jié)合將更加深入。
預(yù)后是胃癌研究的重點,更是基于AI 技術(shù)的胃癌影像學研究的重點,既往多項研究表明常規(guī)影像組學和深度學習特征與胃癌預(yù)后之間存在密切關(guān)聯(lián)[8,13,18]。大部分研究均使用CT 圖像作為數(shù)據(jù)來源[11,13,30],也有研究應(yīng)用PET-CT 圖像提取影像組學特征,以預(yù)測患者輔助治療效果及生存預(yù)后[53]。早期影像組學研究僅基于影像紋理特征構(gòu)建預(yù)后預(yù)測模型[45,55],隨著影像組學及深度學習技術(shù)的發(fā)展,已有多項研究通過聯(lián)合常規(guī)影像組學、深度學習特征及臨床特征建模,預(yù)測胃癌患者的總生存期、無病生存期和早期復(fù)發(fā),并取得了良好的預(yù)測效能[11,13,18]。除此以外,既往多項影像組學研究預(yù)測與預(yù)后相關(guān)的臨床和病理學特征,例如TITreg 細胞、脈管癌栓、不良病理組織學分級、腫瘤免疫微環(huán)境和對NAC 反應(yīng)程度,進而預(yù)測生存、預(yù)后相關(guān)指標[11,14,17,30,56]。基于AI 的影像組學研究在胃癌的預(yù)后預(yù)測中表現(xiàn)出廣泛的應(yīng)用價值,為了將影像組學生物標志物真正應(yīng)用于臨床診療,還需進行國際性大樣本和多中心研究進一步驗證相關(guān)模型及特征的穩(wěn)定性及泛化性。
常規(guī)影像組學特征和深度學習特征在胃癌的診斷、鑒別診斷、治療和預(yù)后方面具有較大的應(yīng)用價值。與CT 相比,MRI在胃癌臨床診療過程中應(yīng)用較少,也造成了MRI在基于AI技術(shù)的胃癌影像組學研究中成果較為稀缺,相信未來隨著成像技術(shù)的發(fā)展,MRI在臨床實踐中也將得到更為廣泛的使用,進而推動基于MRI的影像組學研究的進展。MRI對軟組織病變有著更佳的分辨效果,MRI圖像可能包含更多的腫瘤內(nèi)部異質(zhì)性特征,可能會提高模型預(yù)測準確性。因此,未來的研究應(yīng)進一步開展基于MRI 的胃癌影像組學研究,通過結(jié)合更先進的組學特征和建模算法,提升預(yù)測模型性能。在臨床實踐中,患者由于各種原因可能行多種影像學檢查明確病情,未來可同時聯(lián)合提取多種影像學檢查的組學特征建模,也許會提升預(yù)測性能。淋巴結(jié)轉(zhuǎn)移狀況是治療前和術(shù)后評估的重要組成部分。許多研究開發(fā)了基于AI 技術(shù)的影像組學預(yù)測模型,包括預(yù)測淋巴結(jié)是否轉(zhuǎn)移和特定的N 分期。然而,目前還沒有針對某個特定淋巴結(jié)的研究,這需要外科、病理科、影像科的通力協(xié)作,將術(shù)前影像中腫大的淋巴結(jié)和術(shù)后相同解剖位置的淋巴結(jié)病理結(jié)果相對應(yīng),嚴格統(tǒng)一研究對象的金標準。我們建議未來的研究可以將重點放在預(yù)測嚴格基于病理相關(guān)性的單個淋巴結(jié)轉(zhuǎn)移狀態(tài)。此外,鮮有研究分析影像組學特征與臨床病理表現(xiàn)之間的原理性問題,這需要更深入的基礎(chǔ)研究、計算機研究共同探索其中分子、通路層面的機制。
既往通過分析77項腫瘤影像組學研究,Park等[57]提出當前影像組學研究的整體科研方法學質(zhì)控不足。AI技術(shù)應(yīng)用在胃癌研究的圖像采集、分割、特征提取、特征選擇、模型構(gòu)建到模型性能評估的每個過程都出現(xiàn)了不同程度的問題。在這種情況下,遵守嚴格的放射組學質(zhì)量評分(the radiomics quality score,RQS)[58]和預(yù)后或診斷相關(guān)的臨床預(yù)測模型的TRIPOD(the Transparent Reporting of a multivariable prediction model for Individual Prognosis Or Diagnosis,TRIPOD)指南[59]可以提高研究的可信度。此外,在未來的研究中,建議進行國際性多中心的前瞻性研究以建立更全面的數(shù)據(jù)庫。未來還應(yīng)繼續(xù)積極開展提升AI 技術(shù)在臨床研究中算法性能的研究,這將依托于開發(fā)更先進的算法框架。而且,考慮到AI 技術(shù)在分析高通量信息方面的強大能力,現(xiàn)研究的臨床特征多局限于常規(guī)臨床病理特征,未來研究可考慮結(jié)合基因組學[60-62]、蛋白質(zhì)組學[63]等,通過多組學研究實現(xiàn)更深入的精準醫(yī)療目的??傊?,我們希望所有科學研究成果能夠?qū)⒒贏I技術(shù)的胃癌影像學研究從探索階段轉(zhuǎn)變?yōu)槌R?guī)臨床應(yīng)用階段,并真正可以使患者獲益。
胃癌是消化道最常見的惡性腫瘤之一,與胃癌診療、預(yù)后相關(guān)的研究是既往臨床研究的重點。未來隨著AI和醫(yī)學影像學技術(shù)的發(fā)展,多中心、前瞻性、大樣本的多種成像技術(shù)及多模態(tài)、多時相、多維度技術(shù)的聯(lián)合應(yīng)用將不斷推動基于AI技術(shù)的胃癌影像學研究發(fā)展,進一步提高胃癌相關(guān)的臨床診療水平。
作者利益沖突聲明:全部作者均聲明無利益沖突。