李 巧,王宇昊,夏一凡,張玉東*
1南京醫(yī)科大學(xué)第一附屬醫(yī)院放射科,2泌尿外科,江蘇 南京 210029
透明細(xì)胞腎細(xì)胞癌(clear cell renal cell carcinoma,ccRCC)是腎細(xì)胞癌最常見(jiàn)的類(lèi)型[1-2],相比乳頭狀和嫌色細(xì)胞亞型,更容易進(jìn)展、轉(zhuǎn)移,預(yù)后較差[3-4]?;颊郀顟B(tài)、腫瘤分期、細(xì)胞核分級(jí)等是臨床實(shí)踐中常用的預(yù)后指標(biāo)。然而,隨著ccRCC 個(gè)體化治療的不斷發(fā)展,特別是晚期腎癌,免疫治療僅對(duì)20%~30%的患者有效,目前尚無(wú)有效靶標(biāo)對(duì)患者進(jìn)行篩選和療效預(yù)測(cè)[5]。
腫瘤微環(huán)境包括細(xì)胞外基質(zhì)、可溶性分子和腫瘤基質(zhì)細(xì)胞,對(duì)腫瘤患者的免疫治療療效及預(yù)后影響重大[6-7]。腫瘤突變負(fù)荷(tumor mutational burden,TMB)即每個(gè)腫瘤基因組編碼區(qū)域的突變總數(shù),是免疫治療的生物標(biāo)志物,TMB越高的腫瘤患者免疫治療效果往往越好[8-9]。微衛(wèi)星不穩(wěn)定性(microsatellite instability,MSI)即重復(fù)DNA 束中核苷酸的自發(fā)丟失或獲得,可以輔助診斷胃腸道、子宮內(nèi)膜和結(jié)直腸腫瘤的表型,為各種癌癥提供治療決策信息[10-11]。基于機(jī)器學(xué)習(xí)(machine learning,ML)的CT影像組學(xué)分析可捕獲肉眼無(wú)法識(shí)別的圖像特征,并揭示病理生理相關(guān)的潛在生物醫(yī)學(xué)圖像變化,預(yù)測(cè)治療反應(yīng)和生存期[11-13]。
因此,本研究利用集成ML算法,將ccRCC影像組學(xué)特征與腫瘤免疫微環(huán)境表達(dá)相關(guān)聯(lián),建立多模通道的免疫影像(immuno-radiomics,ImRad)分型,并進(jìn)一步研究該表型對(duì)患者術(shù)后生存的預(yù)測(cè)價(jià)值。
納入南京醫(yī)科大學(xué)第一附屬醫(yī)院經(jīng)手術(shù)病理證實(shí)為ccRCC、術(shù)前行腎臟CT增強(qiáng)掃描且具有完整臨床病理及免疫基因資料的患者113 例。其中,男77 例,女36例,年齡(59.4±12.9)歲(26~88歲);AJCC分期68.1%為T(mén)1~2 期,31.9%為T(mén)3~4 期;41.6%為低級(jí)別細(xì)胞核分級(jí),58.4%為高級(jí)別。113例患者均有標(biāo)準(zhǔn)隨訪結(jié)果,隨訪內(nèi)容包括治療后有無(wú)復(fù)發(fā)及總生存時(shí)間(overall survival,OS),隨訪時(shí)間為1~86 個(gè)月,刪失病例OS 按最長(zhǎng)隨訪時(shí)間計(jì)算。中位OS 為31(10~54)個(gè)月。
患者臨床、影像數(shù)據(jù)從公開(kāi)數(shù)據(jù)庫(kù)癌癥影像檔案(the cancer imaging archive,TCIA)下載(http://www.cancerimagingarchive.net),對(duì)應(yīng)免疫、基因數(shù)據(jù)從癌癥基因圖譜(the cancer genome atlas,TCGA)庫(kù)中獲得(https://portal.gdc.cancer.gov)[14]。利用癌癥樣本轉(zhuǎn)錄譜的特性來(lái)推斷腫瘤細(xì)胞以及浸潤(rùn)的各種正常細(xì)胞含量,獲得3 個(gè)CD8+T 浸潤(rùn)評(píng)分、TMB、MSI、4 種免疫耗竭相關(guān)基因(LAG3、CD244、PDCD1及TIGIT)[15]以及21 種免疫細(xì)胞得分(使用R 語(yǔ)言estimate 包中的ESTIMATE 算法),根據(jù)得分中位數(shù)分為高、低表達(dá)兩組。
1.2.1 CT圖像勾畫(huà)和特征提取
使用國(guó)內(nèi)開(kāi)發(fā)的軟件SRhythm Multi Label 和Oncology Imaging Analysis(OCIA,上海師范大學(xué)上海磁共振重點(diǎn)實(shí)驗(yàn)室),分別由1名具有3年腹部影像診斷經(jīng)驗(yàn)的放射科醫(yī)師和1名具有6年臨床手術(shù)經(jīng)驗(yàn)的泌尿外科醫(yī)生在CT 皮質(zhì)期軸位圖像上對(duì)病灶邊緣進(jìn)行逐層勾畫(huà),然后融合成三維感興趣區(qū)(region of interest,ROI);每一次勾畫(huà)均由另1 名具有15 年腹部影像診斷經(jīng)驗(yàn)的放射科醫(yī)師進(jìn)行校對(duì)。校準(zhǔn)完畢后利用Pyradiomics 軟件包提取腫瘤影像組學(xué)特征,包括14 個(gè)形狀特征、18 個(gè)一階直方圖特征以及75個(gè)紋理特征、24個(gè)灰度共生矩陣(gray level co-occurrence matrix,GLCM)特征、16個(gè)灰度游程矩陣(gray level run-length matrix,GLRLM)特征、16 個(gè)灰度區(qū)域大小矩陣(gray level size zone matrix,GLSZM)特征、5 個(gè)鄰域灰度差分矩陣(neighborhood gray-tone difference matrix,NGTDM)特征、14個(gè)灰度相關(guān)矩陣(gray level dependence matrix,GLDM)特征[16]。
1.2.2 模型構(gòu)建
構(gòu)建腫瘤ImRad:①降維及特征篩選??紤]高維數(shù)據(jù)ML 建模產(chǎn)生的過(guò)擬合風(fēng)險(xiǎn),首先采用4種特征篩選算法,即信息增益(information gain,Info.gain)、增益率(gain ratio)、基尼系數(shù)下降(gini decrease,Gini)、快速相關(guān)濾波器(fast correlation based filter,F(xiàn)CBF),分別對(duì)影像組學(xué)特征降維篩選。②集成ML 建模。利用隨機(jī)森林(random forest,RF)、梯度增強(qiáng)(gradient boosting,GDBT)、邏輯回歸(logistic regression,LR)、支持向量機(jī)(support vector machines,SVM)、樸素貝葉斯(naive bayes,NB)、k 最近鄰(k-nearest neighbor,kNN)、神經(jīng)網(wǎng)絡(luò)(neural network,NN)及堆疊式集成學(xué)習(xí)(stacking learning)8 種算法在經(jīng)篩選后的20 個(gè)組學(xué)特征上建立二分類(lèi)預(yù)測(cè)模型[17],預(yù)測(cè)目標(biāo)包含3個(gè)CD8+T浸潤(rùn)評(píng)分、1個(gè)TMB 表達(dá)、1 個(gè)MSI 表達(dá)、4 個(gè)免疫耗竭相關(guān)基因及21 種免疫細(xì)胞浸潤(rùn)表達(dá)結(jié)果,共建立30 個(gè)ImRad表型。多種分類(lèi)器算法的消融實(shí)驗(yàn)以獲得最優(yōu)算法,五折法用于小樣本數(shù)據(jù)下模型的準(zhǔn)確性驗(yàn)證。
生存分析:納入指標(biāo)包括患者性別、年齡、AJCC TNM 分期、細(xì)胞核分化程度、ImRad分型、3個(gè)CD8+T浸潤(rùn)評(píng)分、TMB、MSI、4種免疫耗竭關(guān)鍵基因及21種免疫細(xì)胞表達(dá)。對(duì)于維度較多的臨床-病理-免疫影像(clinicopathologic-immuno-radiomics,Clinic-Pt-ImRad)融合模型,利用Lasso-Cox 回歸將不相關(guān)特征的回歸系數(shù)縮小到零,得到系數(shù)不為零的特征。使用最大相關(guān)最小冗余法(mRMRe)基于有無(wú)腫瘤復(fù)發(fā)對(duì)851個(gè)組學(xué)特征進(jìn)行降維,獲取30個(gè)關(guān)鍵特征構(gòu)建影像組學(xué)(radiomics,Rad)預(yù)后模型。
進(jìn)一步多因素Cox 回歸分析,最終構(gòu)建如下預(yù)后模型:①Rad 及ImRad 模型;②臨床-病理-免疫(clinicopathologic immune,Clinic-Pt-Im)模型;③Clinic-Pt-ImRad模型。
采用受試者工作特征(receiver operating characteristic,ROC)曲線和ROC 曲線下面積(area under curve,AUC)評(píng)價(jià)分類(lèi)器效能。多因素Cox回歸分析計(jì)算各模型中預(yù)測(cè)因子高、低表達(dá)組間OS的風(fēng)險(xiǎn)比(hazards ratio,HR)及其95%可信區(qū)間(confidence interval,CI)。C-index 評(píng)價(jià)模型預(yù)測(cè)效能。采用Kaplan-Meier 生存曲線分析獨(dú)立預(yù)測(cè)因子的生存影響并進(jìn)行Log-Rank 檢驗(yàn)。采用SPSS 26、R3.6.1 和MeCalc19.9.4 軟件進(jìn)行統(tǒng)計(jì)學(xué)分析。雙尾P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
在兩步驟算法的32 種組合中(4 種特征篩選×8 種ML 分類(lèi)器算法),NB 算法較其他分類(lèi)器建模有更好的分類(lèi)效能(AUC:0.717~0.956,表1)。基于NB 算法構(gòu)建的ImRad 表型能夠有效監(jiān)測(cè)腫瘤組織記憶B 細(xì)胞(AUC=0.954)、靜息態(tài)記憶CD4+T 細(xì)胞(AUC=0.942)、激活態(tài)自然殺傷細(xì)胞(AUC=0.931)、嗜酸性粒細(xì)胞(AUC=0.956)和調(diào)節(jié)性T細(xì)胞(AUC=0.908)浸潤(rùn)(P<0.05)。
表1 集成機(jī)器學(xué)習(xí)構(gòu)建免疫影像ImRad表型及其AUCTable 1 ImRad and AUC constructed by ensemble machine learning algorithms
分別對(duì)比分析Rad、ImRad、Clinic-Pt-Im、Clinic-Pt-ImRad對(duì)OS的預(yù)測(cè)效能。
采用梯度提升樹(shù)算法(gradient boosting machine,GBM-Cox)對(duì)Rad 預(yù)測(cè)因子建模,獲取1 年、3 年、5 年OS 的校準(zhǔn)曲線圖(圖1)。30 個(gè)經(jīng)mRMRe降維后的關(guān)鍵Rad特征中,wavelet-LLL_glcm_Imc1、wavelet -LHL_ngtdm_Strength、wavelet_HHH_glrlm_Long Run Low Gray Level Emphasis為獨(dú)立預(yù)測(cè)因子(表2),Rad模型預(yù)測(cè)OS的C-index為0.756(95%CI:0.636~0.876)。
圖1 Rad模型預(yù)測(cè)1年、3年、5年生存期的校準(zhǔn)曲線圖Figure 1 Calibration curve of Rad on predicting 1-year,3-year,5-year survival period
表2 Rad、ImRad及Clinc-Pt-Im模型多因素Cox分析Table 2 Multivariate Cox analysis of Rad,ImRad and Clinc-Pt-Im models
30 個(gè)基于獨(dú)立預(yù)測(cè)因子建立ImRad 預(yù)后指數(shù)(表2,圖2A),其預(yù)測(cè)OS的C-index為0.857(95%CI:0.787~0.927),優(yōu)于Rad 模型。Clinic-Pt-Im 指標(biāo)中,AJCC 分期、TMB、初始B細(xì)胞等11個(gè)指標(biāo)是患者OS的獨(dú)立預(yù)測(cè)因子,Clinic-Pt-Im模型預(yù)測(cè)OS的C-index為0.924(95%CI:0.872~0.976),優(yōu)于Rad 和ImRad(表2,圖2B)。
圖2 ImRad(A)、Clinic-Pt-Im(B)和Clinic-Pt-ImRad(C)的森林圖Figure 2 Forest maps of ImRad(A),Clinic-Pt-Im(B),and Clinic-Pt-ImRad(C)models
融合模型Clinic-Pt-ImRad 預(yù)測(cè)OS的C-index 為0.938(95%CI:0.902~0.974),優(yōu)于Rad、ImRad 和Clinic-Pt-Im模型(表3,圖2C)。
表3 Clinic-Pt-ImRad的LASSO-Cox回歸模型Table 3 LASSO-Cox regression of Clinic-Pt-ImRad model
各獨(dú)立預(yù)測(cè)因子的生存分析中,Rad-靜息態(tài)樹(shù)突狀細(xì)胞、Rad-激活態(tài)肥大細(xì)胞及Rad-M1巨噬細(xì)胞3個(gè)免疫影像特征的Kaplan-Meier曲線在高、低表達(dá)組間存在顯著差異(P<0.05)。AJCC分期越早預(yù)后越好;激活態(tài)肥大細(xì)胞及MSI 高表達(dá)均提示預(yù)后不佳,而靜息態(tài)樹(shù)突狀細(xì)胞高浸潤(rùn)提示預(yù)后良好,其高、低表達(dá)組間生存曲線均存在顯著差異(P<0.05,圖3)。
圖3 部分獨(dú)立預(yù)測(cè)因子的Kaplan-Meier生存曲線Figure 3 Kaplan-Meier survival curves of partial independent predictors
ccRCC 多位于腎皮質(zhì),單發(fā)多見(jiàn),通常大小不一,圓形或橢圓形,和周?chē)I實(shí)質(zhì)分界較清晰,可有假包膜,常有鈣化、出血、壞死及囊變。顯微鏡下腫瘤細(xì)胞體積較大,圓形或多邊形,胞質(zhì)豐富,透明或顆粒狀,間質(zhì)具有豐富的毛細(xì)血管和血竇。CT平掃表現(xiàn)主要取決于腫瘤本身的成分和血供的差異,以及腫瘤內(nèi)有無(wú)出血、壞死、囊變、鈣化等。通常CT平掃時(shí)密度與周?chē)I實(shí)質(zhì)呈等或略低密度,體積較小的腫瘤密度多均勻,而體積較大者密度多不均勻,與瘤體內(nèi)容易出血有關(guān)。絕大多數(shù)ccRCC 為富血供腫瘤,增強(qiáng)掃描動(dòng)脈期多明顯不均勻或條紋狀強(qiáng)化,強(qiáng)化程度多與鄰近腎皮質(zhì)相仿,甚至略高,靜脈期及延遲期強(qiáng)化程度較周?chē)I實(shí)質(zhì)減低,多呈“快進(jìn)快出”的特點(diǎn)。病理研究顯示其早期高強(qiáng)化與透明細(xì)胞的小泡狀結(jié)構(gòu)密切相關(guān)。本研究基于CT 增強(qiáng)圖像及集成ML 構(gòu)建ccRCC 的免疫影像表型,并探討其對(duì)患者預(yù)后的預(yù)測(cè)價(jià)值。
目前基于全腫瘤影像組學(xué)特征分析主要用于腫瘤細(xì)胞異質(zhì)性研究[12],而本研究通過(guò)集成ML 及全腫瘤ROI 影像組學(xué)特征分析,構(gòu)建ccRCC 的多重免疫影像分型,在技術(shù)方法及臨床應(yīng)用方面具有一定探索性。本研究通過(guò)影像-免疫關(guān)聯(lián),構(gòu)建了30個(gè)ImRad 免疫影像分型,其中8 個(gè)ImRad 分型與患者OS獨(dú)立相關(guān),基于ImRad分型構(gòu)建的Cox模型對(duì)OS的預(yù)測(cè)效能優(yōu)于傳統(tǒng)方法。而且發(fā)現(xiàn)Rad-靜息態(tài)樹(shù)突狀細(xì)胞、Rad-M1巨噬細(xì)胞及Rad-激活態(tài)肥大細(xì)胞3個(gè)ImRad標(biāo)志物表達(dá)水平不同,其OS存在顯著差異,提示免疫影像分型對(duì)患者臨床預(yù)后具有較好的預(yù)測(cè)價(jià)值,從而為優(yōu)化臨床治療方案提供重要參考依據(jù)。
與既往研究對(duì)比,本研究有以下創(chuàng)新:首先,通過(guò)泌尿?qū)I(yè)及影像專(zhuān)業(yè)醫(yī)生雙盲參與腫瘤ROI 勾畫(huà),對(duì)于形態(tài)不規(guī)則的腫瘤,結(jié)合臨床和影像的經(jīng)驗(yàn),如強(qiáng)化環(huán)、腫瘤包膜隆突等,從而提高勾畫(huà)精準(zhǔn)性,并由經(jīng)驗(yàn)更豐富的高年資醫(yī)師進(jìn)行校準(zhǔn)。其次,本研究在技術(shù)上進(jìn)行了多重算法對(duì)比及集成,并通過(guò)消融實(shí)驗(yàn)獲得最優(yōu)參數(shù)配置,提升了模型的魯棒性,五折法用于小樣本數(shù)據(jù)模型的準(zhǔn)確性驗(yàn)證,所構(gòu)建的30 個(gè)ImRad 分型中,基于貝葉斯算法的模型表現(xiàn)最佳,在多重驗(yàn)證中均取得比較可靠的結(jié)果。另外,在Cox 回歸分析中,通過(guò)Rad、ImRad、Clinic-Pt-Im 以及Clinic-Pt-ImRad 多重對(duì)比,證實(shí)基于影像免疫關(guān)聯(lián)的ImRad 模型優(yōu)于單純Rad 模型,Clinic-Pt-ImRad 優(yōu)于Clinic-Pt-Im 模型。該結(jié)果提示,多重免疫與高通量影像特征具有微觀-宏觀上的關(guān)聯(lián)性,通過(guò)構(gòu)建免疫影像分型,有望為臨床提供一種可靠的無(wú)創(chuàng)性影像檢查方法來(lái)預(yù)測(cè)腫瘤免疫微環(huán)境狀態(tài),從而為提高患者免疫治療效果提供可靠依據(jù)。以往研究發(fā)現(xiàn)TMB 可用于預(yù)測(cè)肺癌、膀胱癌、黑色素瘤及結(jié)直腸癌等實(shí)體腫瘤的免疫治療療效[18],MSI 決定了胃腸癌患者對(duì)免疫治療的反應(yīng)[10-11],筆者首次將TMB 和MSI 應(yīng)用于ccRCC 中,其對(duì)患者術(shù)后預(yù)后的預(yù)測(cè)價(jià)值在Clinic-Pt-Im 和Clinic-Pt-ImRad 模型中均得到驗(yàn)證,高M(jìn)SI 和TMB預(yù)示著復(fù)發(fā)死亡風(fēng)險(xiǎn)更高,集成ML 構(gòu)建Rad-TMB和Rad-MSI的AUC、精確度及準(zhǔn)確度均>0.70,揭示腫瘤TMB 及MSI 表型與影像組學(xué)特征具有一定關(guān)聯(lián)性。
同時(shí)本研究發(fā)現(xiàn),高AJCC 分期(Ⅲ和Ⅳ)是不良預(yù)后的獨(dú)立風(fēng)險(xiǎn)因素,這與既往研究一致[3-4]。另外對(duì)CD8+T 細(xì)胞浸潤(rùn)的3 個(gè)關(guān)鍵評(píng)分分析,發(fā)現(xiàn)高Rad-腫瘤基質(zhì)評(píng)分及腫瘤純度評(píng)分提示預(yù)后良好,可能因?yàn)槊庖哐装Y型(具有密集的CD8+T 細(xì)胞浸潤(rùn))腫瘤免疫微環(huán)境具有較好的免疫原性和對(duì)免疫治療的應(yīng)答性,從而提高患者遠(yuǎn)期生存率[19]。21種免疫細(xì)胞浸潤(rùn)表達(dá)及其ImRad 分型中,Rad-靜息態(tài)樹(shù)突狀細(xì)胞及靜息態(tài)樹(shù)突狀細(xì)胞浸潤(rùn)均提示預(yù)后良好,其OS曲線在高、低表達(dá)組間均存在顯著差異;Rad-M1 巨噬細(xì)胞及M1 巨噬細(xì)胞浸潤(rùn)提示預(yù)后良好,Rad-M1 巨噬細(xì)胞的生存曲線在高、低表達(dá)組間存在顯著差異,說(shuō)明影像免疫分型有預(yù)測(cè)免疫細(xì)胞活性的能力;Rad-漿細(xì)胞高表達(dá)提示預(yù)后良好,但漿細(xì)胞浸潤(rùn)預(yù)后不良,這可能與小樣本數(shù)據(jù)分布不均有關(guān);高Rad-激活態(tài)肥大細(xì)胞及激活態(tài)肥大細(xì)胞患者預(yù)后不良,其生存曲線高、低表達(dá)組間均存在顯著差異;高Rad-嗜酸性粒細(xì)胞表達(dá)的患者預(yù)后不良,高Rad-激活態(tài)樹(shù)突狀細(xì)胞的患者預(yù)后良好而激活態(tài)樹(shù)突狀細(xì)胞浸潤(rùn)對(duì)預(yù)后無(wú)影響,既往研究表明嗜酸性粒細(xì)胞同時(shí)有促腫瘤和抗腫瘤功能[20],但具體截?cái)嘀涤写M(jìn)一步研究。樹(shù)突狀細(xì)胞介導(dǎo)的抗原特異性T細(xì)胞抗癌免疫治療在臨床上取得了巨大成功[21]。另外,靜息態(tài)自然殺傷細(xì)胞、M0巨噬細(xì)胞、M2 巨噬細(xì)胞高表達(dá)是預(yù)后良好的獨(dú)立預(yù)測(cè)因子。4 種免疫耗竭關(guān)鍵基因中(LAG3、CD244、PDCD1、TIGIT),Rad-PDCD1 是ccRCC 患者術(shù)后復(fù)發(fā)死亡的獨(dú)立預(yù)測(cè)因子,高Rad-PDCD1表達(dá)預(yù)后良好,這與Miao 等[22]研究結(jié)果稍有不同,兩組結(jié)果差異的原因有待進(jìn)一步擴(kuò)大樣本量研究。
本研究存在局限性,第一,來(lái)自公共數(shù)據(jù)集的圖像質(zhì)量存在較大差異,掃描參數(shù)不盡相同,這可能會(huì)影響分析結(jié)果的準(zhǔn)確性。第二,本研究是回顧性研究,存在樣本選擇偏倚的風(fēng)險(xiǎn)。第三,研究樣本量有限,將113例ccRCC進(jìn)行五折交叉驗(yàn)證以保證預(yù)測(cè)模型的過(guò)擬合風(fēng)險(xiǎn),準(zhǔn)確性及可重復(fù)性需要在獨(dú)立驗(yàn)證集中進(jìn)一步評(píng)估。此外,陽(yáng)性表達(dá)記憶B細(xì)胞、漿細(xì)胞、靜息態(tài)記憶CD4+T細(xì)胞、調(diào)節(jié)性T細(xì)胞、激活態(tài)自然殺傷細(xì)胞和嗜酸性粒細(xì)胞等免疫細(xì)胞浸潤(rùn)的患者數(shù)量較少,可能會(huì)導(dǎo)致測(cè)量偏倚,這也是其他組學(xué)研究中常面臨的技術(shù)問(wèn)題[23]。因此,在臨床應(yīng)用之前,基于有限數(shù)據(jù)集的研究結(jié)果需要通過(guò)多中心和大規(guī)模的研究進(jìn)行前瞻性驗(yàn)證。
總之,本研究通過(guò)影像-免疫表達(dá)關(guān)聯(lián),證實(shí)增強(qiáng)CT 影像組學(xué)特征在預(yù)測(cè)ccRCC 患者的腫瘤免疫微環(huán)境和TMB方面具有良好的臨床應(yīng)用潛力,構(gòu)建的ImRad免疫影像分型可用于ccRCC患者的術(shù)后生存預(yù)測(cè),將有助于臨床醫(yī)生對(duì)ccRCC 患者進(jìn)行更好的風(fēng)險(xiǎn)分層和臨床治療。