徐向東,羅詩(shī)維,韋瑞麗,張婉麗,姚旺,丁文雙,龐欣蕊,王曄,楊蕊夢(mèng),賴勝圣
腎細(xì)胞癌(renal cell carcinoma,RCC)是最常見的腎臟原發(fā)惡性腫瘤,約占腎臟腫瘤的90%~95%[1]。其中,透明細(xì)胞腎細(xì)胞癌(clear cell renal cell carcinoma,ccRCC)是RCC中最常見的亞型,預(yù)后最差[2]。既往研究證實(shí):病理核分級(jí)是判斷ccRCC預(yù)后的獨(dú)立影響因素,對(duì)其個(gè)體化治療措施的制訂尤為重要[3]。現(xiàn)階段,F(xiàn)uhrman核分級(jí)系統(tǒng)是最常用的ccRCC病理核分級(jí)體系[4],但其診斷依賴于經(jīng)皮穿刺活檢或術(shù)后組織樣本,存在有創(chuàng)性、滯后性或易出現(xiàn)并發(fā)癥及取樣偏倚等缺點(diǎn)[5]。
近年來(lái),基于無(wú)創(chuàng)性醫(yī)學(xué)影像檢查的影像組學(xué)在臨床腫瘤領(lǐng)域的應(yīng)用受到越來(lái)越多的關(guān)注,它可以通過高通量提取醫(yī)學(xué)圖像的信息定量評(píng)估腫瘤分期、病理分型和治療預(yù)后,進(jìn)而指導(dǎo)臨床決策的制定[6]。既往研究報(bào)道采用影像組學(xué)方法對(duì)ccRCC進(jìn)行病理高低核級(jí)別預(yù)測(cè),并取得了良好的預(yù)測(cè)效果,然而,腎臟的CT四期動(dòng)態(tài)掃描各具特點(diǎn),對(duì)納入影像組學(xué)分析的最優(yōu)CT期相選擇尚不統(tǒng)一[7-10]。此外,作為影像組學(xué)分析流程中的重要一環(huán),感興趣區(qū)(region of interest,ROI)的勾畫策略仍存在爭(zhēng)議[11,12]。有研究者建議選用腫瘤最大層面2D-ROI,認(rèn)為2D-ROI已能提供足夠的影像信息,且勾畫較為簡(jiǎn)便;而有研究者認(rèn)為三維全瘤感興趣區(qū)(3D-ROI)能提供更全面的信息,如3D形態(tài)學(xué)特征等。因此,本研究旨在探討不同CT掃描期相及不同ROI勾畫策略(2D-ROI或3D-ROI)對(duì)影像組學(xué)方法預(yù)測(cè)ccRCC核分級(jí)效能的影響。
回顧性搜集2011年1月-2019年1月在本院就診且符合研究要求的137例ccRCC患者的臨床和影像資料。納入標(biāo)準(zhǔn):①病理證實(shí)為ccRCC且有完整的Fuhrman核分級(jí)信息;②術(shù)前行腹部CT平掃及三期增強(qiáng)掃描。排除標(biāo)準(zhǔn):①囊性ccRCC;②CT圖像上有明顯偽影,圖像質(zhì)量欠佳。
病理切片F(xiàn)uhrman核分級(jí)由具有9年泌尿系統(tǒng)病理診斷經(jīng)驗(yàn)的病理醫(yī)師完成。為確保病理診斷的可重復(fù)性和減少觀察者間差異性,傳統(tǒng)的4級(jí)Fuhrman核分級(jí)系統(tǒng)被簡(jiǎn)化為低級(jí)別(1級(jí)和2級(jí))和高級(jí)別(3級(jí)和4級(jí))。
使用Toshiba Aquilion One(14例)、Siemens Somatom Definition(36例)、GE HiSpeed 16(14例)和Philips Brilliance 64(73例)螺旋CT機(jī)。掃描參數(shù):120~140 kV,自動(dòng)管電流調(diào)控。增強(qiáng)掃描采用高壓注射器經(jīng)肘靜脈注入非離子型碘對(duì)比劑(劑量1.0~2.0 mg/kg)。依次采集4個(gè)期相的CT圖像:平掃期(unenhanced phase,UP);增強(qiáng)掃描腎皮髓質(zhì)期(corticomedullary phase,CMP),注射對(duì)比劑后約30 s啟動(dòng)掃描;增強(qiáng)掃描腎實(shí)質(zhì)期(nephrographic phase,NP),注射對(duì)比劑后約70 s啟動(dòng)掃描;增強(qiáng)掃描腎排泄期(excretory phase,EP),注射對(duì)比劑后180~300 s啟動(dòng)掃描。
由兩位分別有4年及5年影像診斷經(jīng)驗(yàn)的放射科醫(yī)師在不知病理結(jié)果的情況下使用ITK-SNAP軟件完成腎臟腫瘤2D-ROI及3D-ROI的勾畫。選取病灶最大層面沿病灶邊緣進(jìn)行2D-ROI的勾畫;按照上述方法逐層勾畫病灶的ROI,軟件即可自動(dòng)生成病灶的3D-ROI。先在腎實(shí)質(zhì)期圖像上進(jìn)行勾畫,再將所獲得的各層2D-ROI復(fù)制到其它3個(gè)期相的圖像上,依據(jù)情況進(jìn)行略微調(diào)整(圖1)。采用集合相似度度量函數(shù)Dice系數(shù)來(lái)評(píng)估兩位醫(yī)師所勾畫ROI的相似度。對(duì)于Dice系數(shù)>0.9的病例,取兩位醫(yī)師勾畫區(qū)域的交集;對(duì)于Dice系數(shù)<0.9的病例,兩位醫(yī)師通過進(jìn)一步分析和討論來(lái)解決沿病變邊界勾畫ROI時(shí)的差異問題,以達(dá)成一致。
首先,使用Pyradiomics軟件,在每個(gè)期相的圖像上分別基于2D-ROI和3D-ROI提取病灶的形態(tài)學(xué)特征、直方圖特征及紋理特征。然后采用22種特征選擇方法[conditional infomax feature extraction (CIFE),conditional mutual information (CMIM),double input symmetrical relevance (DISR),interaction capping (ICAP),joint mutual information (JMI),mu-tual information based feature selection (MIFS),mutual information maximisation (MIM),minimal redundancy maximum relevance (MRMR),fisher_score,lap_score,relevant features (reliefF),spectral feature selection (SPEC),trace_ratio,ll_121,ls_121,multi-cluster feature selection (MCFS),nonnegative discriminatve feature selection (NDFS),robust feature selection (RFS),unsupervised discriminative feature selection (UDFS),f_score,gini-index,t_score]分別與8種分類算法[邏輯回歸(logistic regression,LR),支持向量機(jī)(support vector machine,SVM),樸素貝葉斯(na?ve bayers),K-近鄰算法(K-nearest neighbor,KNN),決策樹(decision tree,DT),Bagging引導(dǎo)聚類算法,隨機(jī)森林(random forest,RF),自適應(yīng)增強(qiáng)算法(adaptive boosting,AdaBoos-ting)]進(jìn)行組合用于構(gòu)建影像組學(xué)模型,共建立了176(22×8)個(gè)預(yù)測(cè)模型,并采用五折交叉檢驗(yàn)法驗(yàn)證模型的效能。為了減少病例隊(duì)列數(shù)據(jù)數(shù)量不均衡產(chǎn)生的影響,通過引入合成特征樣本,采用合成少數(shù)類過采樣技術(shù)(synthetic minority oversampling technique,SMOTE)對(duì)高級(jí)別ccRCC組進(jìn)行過采樣。模型的鑒別效能采用ROC曲線下面積(area under the curve, AUC)、符合率、敏感度和特異度等指標(biāo)進(jìn)行定量分析。
使用SPSS 20.0軟件進(jìn)行統(tǒng)計(jì)學(xué)分析。比較ccRCC核分級(jí)高級(jí)別組和低級(jí)別組之間臨床特征及影像學(xué)特征的差異。計(jì)量資料的組間比較采用獨(dú)立樣本t檢驗(yàn),二分類變量的組間比較采用卡方檢驗(yàn)。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
137例中低級(jí)別ccRCC組96例(1級(jí)15例,占10.9%;2級(jí)81例,占59.1%)及高級(jí)別ccRCC組41例(其中3級(jí)32例,占23.4%;4級(jí)9例,占6.6%)。兩組患者的臨床和病灶特征的比較見表1。兩組之間年齡、性別構(gòu)成和病灶直徑的差異均無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05)。
表1 高、低核分級(jí)ccRCC患者臨床和影像學(xué)特征的比較
每個(gè)期相的圖像上,基于2D-ROI或3D-ROI各提取了107個(gè)組學(xué)特征,基于不同的算法組合,各建立了176個(gè)預(yù)測(cè)模型。采用ROC曲線分析模型預(yù)測(cè)高級(jí)別ccRCC的效能,每個(gè)期相中基于2D-ROI和3D-ROI構(gòu)建的模型中AUC最大的5個(gè)模型的效能指標(biāo)的平均值見表2。結(jié)果顯示,每個(gè)期相基于3D-ROI構(gòu)建模型的AUC平均值要大于2D-ROI,相應(yīng)的符合率、敏感度和特異度大部分也有類似表現(xiàn),即基于3D-ROI的影像組學(xué)模型顯示出更好的預(yù)測(cè)能力。此外,在四個(gè)期相中,平掃期的平均AUC明顯高于其它3個(gè)期相,提示基于平掃圖像的組學(xué)特征模型具有更好的診斷效能?;?D-ROI和3D-ROI的平掃期各組學(xué)模型的AUC熱圖見圖2??傮w而言,基于3D-ROI的模型與基于2D-ROI的模型相比預(yù)測(cè)效果更好。其中KNN分類算法在兩組中均顯示出較好的效能,而DT算法在兩組均表現(xiàn)不佳。
圖2 平掃期CT圖像上基于2D-ROI(2a)和3D-ROI(2b)提取的影像組學(xué)特征構(gòu)建的176個(gè)預(yù)測(cè)模型的AUC熱圖。
表2 四期CT圖像基于2組構(gòu)建的組學(xué)模型的效能指標(biāo)值
核分級(jí)作為ccRCC的獨(dú)立預(yù)后因素,可為治療策略的制訂提供重要參考[13]。若能在術(shù)前了解ccRCC的核分級(jí)信息,將對(duì)臨床診療的實(shí)施提供關(guān)鍵性幫助[2]。穿刺活檢是術(shù)前評(píng)估腎腫瘤的常用手段,但其為有創(chuàng)性檢查存在發(fā)生并發(fā)癥的可能,而且其診斷效能依賴于取樣技術(shù)和經(jīng)驗(yàn)等[14]。影像學(xué)檢查作為臨床上廣泛應(yīng)用的無(wú)創(chuàng)性評(píng)估腎腫瘤的方法,為臨床診療提供了很多指導(dǎo)和幫助,而近年來(lái)出現(xiàn)的影像組學(xué)方法可進(jìn)一步挖掘醫(yī)學(xué)影像的潛在價(jià)值,有望為臨床診療提供更多信息。
目前基于CT的影像組學(xué)方法已經(jīng)廣泛應(yīng)用于腹部疾病的研究[15],在腎臟腫瘤方面的研究主要集中在腎臟良惡性腫瘤的鑒別和腎細(xì)胞癌的核分級(jí)[16-18]。ROI的勾畫作為影像組學(xué)分析基本流程中至關(guān)重要的一環(huán),影響到所提取的影像組學(xué)特征的可重復(fù)性和穩(wěn)定性,進(jìn)一步?jīng)Q定了后續(xù)機(jī)器學(xué)習(xí)模型的效能[19]。其中,選擇腫瘤最大層面的2D-ROI還是腫瘤多個(gè)層面的3D-ROI一直存在爭(zhēng)議。2D-ROI更容易獲得,耗費(fèi)的人力更少,復(fù)雜度更低,后續(xù)的計(jì)算速度更快。而3D-ROI包含了腫瘤的每一個(gè)層面,可提供更多關(guān)于腫瘤的信息,如三維形態(tài)學(xué)信息,但其勾畫比較耗費(fèi)人力和時(shí)間。Yang等[20]對(duì)比了基于2D-ROI和3D-ROI的CT紋理分析在預(yù)測(cè)肺腺癌淋巴管和血管侵犯方面的效能,結(jié)果顯示基于2D-ROI的預(yù)測(cè)效能優(yōu)于3D-ROI。Shen等[12]對(duì)比分析了二維和三維CT影像組學(xué)特征在預(yù)測(cè)非小細(xì)胞肺癌(NSCLC)預(yù)后方面的效能,發(fā)現(xiàn)兩者預(yù)測(cè)能力相似,但考慮到二維ROI更容易獲取,因此更推薦采用二維特征進(jìn)行預(yù)測(cè)。Xu等[11]探索了應(yīng)用二維和三維影像組學(xué)特征在多種腫瘤(肝內(nèi)膽管細(xì)胞癌、高級(jí)別骨肉瘤、胰腺神經(jīng)內(nèi)分泌腫瘤)早期復(fù)發(fā)、淋巴結(jié)轉(zhuǎn)移、5年生存率及病理分級(jí)預(yù)測(cè)中的效能,結(jié)果顯示兩種方法提取的組學(xué)特征都有一定的預(yù)測(cè)效能,但三維影像學(xué)特征的表現(xiàn)優(yōu)于二維,因此更推薦在影像組學(xué)研究中采用三維影像特征。在本研究中,我們對(duì)比了2D-ROI和3D-ROI對(duì)CT影像組學(xué)模型預(yù)測(cè)ccRCC核分級(jí)的影響,結(jié)果顯示基于3D-ROI的組學(xué)模型的綜合診斷效能更優(yōu),為后續(xù)腎癌影像組學(xué)研究提供了參考。
在腎癌影像組學(xué)研究中,在掃描期相的選擇方面也一直存在爭(zhēng)議。有研究者僅選取單個(gè)期相進(jìn)行影像組學(xué)研究。如Bektas等[7]自門靜脈期CT圖像上提取二維紋理特征,建立多個(gè)機(jī)器學(xué)習(xí)分類器來(lái)預(yù)測(cè)ccRCC核分級(jí),結(jié)果顯示基于SVM的模型表現(xiàn)最佳,AUC達(dá)0.860。Kocak等[9]的研究中僅在平掃CT圖像上提取病灶的紋理特征,并分別采用人工神經(jīng)網(wǎng)絡(luò)和二進(jìn)制邏輯回歸分析建立模型來(lái)預(yù)測(cè)ccRCC的核分級(jí),相應(yīng)的AUC分別達(dá)0.714和0.656。更進(jìn)一步的研究中,有學(xué)者選用多個(gè)增強(qiáng)掃描期相的圖像提取影像組學(xué)特征,探討哪一期相或哪幾個(gè)期相聯(lián)合構(gòu)建的模型能取得更好的效果。Haji-Momenian等[21]選取小ccRCC(<4 cm)的平掃期、皮髓質(zhì)期和實(shí)質(zhì)期CT圖像進(jìn)行影像組學(xué)分析,并采用4種算法(KNN、SVM、隨機(jī)森林和決策樹)構(gòu)建組學(xué)模型來(lái)預(yù)測(cè)ccRCC核分級(jí),結(jié)果顯示這4種算法利用皮髓質(zhì)期的直方圖特征構(gòu)建的模型的預(yù)測(cè)效果最佳,AUC達(dá)0.97。Shu等[22]選用皮髓質(zhì)期和實(shí)質(zhì)期增強(qiáng)CT圖像進(jìn)行影像組學(xué)分析來(lái)預(yù)測(cè)ccRCC的核分級(jí),結(jié)果顯示基于皮髓質(zhì)期、實(shí)質(zhì)期和兩者聯(lián)合的組學(xué)模型的AUC分別為0.766、0.818和0.822。在本研究中,我們發(fā)現(xiàn)不論是選用2D-ROI還是3D-ROI,平掃期對(duì)ccRCC核分級(jí)的鑒別效果均優(yōu)于其它期相。對(duì)此可能的解釋是ccRCC病理核分級(jí)由腎癌細(xì)胞核大小、不規(guī)則性及核仁顯著性決定,相較于反映腎癌血流動(dòng)力學(xué)情況的動(dòng)態(tài)增強(qiáng)期相而言,保留腫瘤細(xì)胞核的形態(tài)學(xué)特征的平掃期對(duì)核級(jí)的鑒別效果更好。
本研究存在一定的局限性:①納入研究的樣本量較小,且缺乏外部驗(yàn)證集,這是由于病例納入標(biāo)準(zhǔn)較為嚴(yán)格,需要具備4期CT圖像,后續(xù)需進(jìn)一步擴(kuò)充樣本量;②本研究采用的是Fuhrman核分級(jí)系統(tǒng),沒有選擇新的WHO/ISUP核分級(jí)系統(tǒng),這是由于我們自2011年開始搜集數(shù)據(jù),當(dāng)時(shí)主要采用的是Fuhrman核分級(jí),WHO/ISUP對(duì)病理醫(yī)師評(píng)判時(shí)病理切片的放大倍數(shù)有嚴(yán)格要求,有些病例的病理組織切片已缺失;③目前僅對(duì)單個(gè)掃描期相進(jìn)行研究,未對(duì)多種期相組合的情況進(jìn)行探索,后續(xù)有待完善;④本研究中病例檢查采用了多臺(tái)CT掃描設(shè)備,可能對(duì)影像組學(xué)特征的穩(wěn)定性造成影響,但這在一定程度上也可以彌補(bǔ)缺乏外部驗(yàn)證集的不足。
綜上所述,本研究結(jié)果初步表明基于3D-ROI建立的影像組學(xué)模型在預(yù)測(cè)ccRCC核分級(jí)方面的表現(xiàn)優(yōu)于2D-ROI建立的模型,基于平掃期的組學(xué)模型比其它期相的表現(xiàn)更佳。這為ccRCC影像組學(xué)的應(yīng)用提供了參考,也需要進(jìn)一步探索改進(jìn)分割的方法,更好地推進(jìn)影像組學(xué)在醫(yī)學(xué)領(lǐng)域的應(yīng)用。