黃忠江 姜增譽(yù) 李健丁 張智星 陳文青
1山西醫(yī)科大學(xué)醫(yī)學(xué)影像學(xué)院(太原030000);2山西醫(yī)科大學(xué)第一醫(yī)院影像科(太原030000)
血管平滑肌脂肪瘤(angiomyolipoma,AML)是最常見(jiàn)腎臟良性實(shí)性腫瘤,通常因其含有脂質(zhì)成分,在臨床影像診斷中與腎透明細(xì)胞癌(clear cells renal cell carcinoma,ccRCC)較易鑒別,而少數(shù)缺乏或僅含有少量成熟脂肪成分,被稱(chēng)為腎乏脂肪AML,其影像學(xué)表現(xiàn)與無(wú)囊變、壞死、出血的均質(zhì)性ccRCC 極其相似,影像科醫(yī)生對(duì)圖像征象的主觀觀察還不足以區(qū)分兩者,因此非常容易誤診[1],通常需要活檢或手術(shù)才能確診。過(guò)往研究中多數(shù)是定量分析影像學(xué)特征來(lái)提高鑒別診斷能力[2-4],然而仍然存在誤診及無(wú)法確診的難題。近年來(lái)影像組學(xué)受到越來(lái)越多的關(guān)注,與傳統(tǒng)的影像圖像分析不同,影像組學(xué)使用數(shù)學(xué)算法來(lái)定量提取大量不能直接觀察到的病灶內(nèi)部特征[5-6]。影像組學(xué)在腎腫瘤領(lǐng)域中已被應(yīng)用于腎透明細(xì)胞癌分級(jí)及腎癌亞型的鑒別診斷[7-8]。術(shù)前鑒別腎均質(zhì)ccRCC與腎乏脂肪AML 可減少患者有創(chuàng)活檢及手術(shù)痛苦。本研究的目的是探討基于CT 增強(qiáng)影像組學(xué)聯(lián)合機(jī)器學(xué)習(xí)建立組學(xué)模型并聯(lián)合臨床特征建立綜合模型術(shù)前鑒別腎均質(zhì)ccRCC與腎乏脂肪AML。
1.1 一般資料回顧性分析2017年9月至2020年12月在我院泌尿外科手術(shù)病理證實(shí)且影像診斷報(bào)告無(wú)法確診及誤診的ccRCC 和腎乏脂肪AML 的患者,納入標(biāo)準(zhǔn):(1)病理結(jié)果證實(shí)單發(fā)ccRCC 和腎乏脂肪AML 的患者。(2)術(shù)前在我院行泌尿系增強(qiáng)CT,圖像質(zhì)量好,可滿(mǎn)足分析要求。(3)臨床資料齊全。排除標(biāo)準(zhǔn):(1)CT 平掃圖像有可見(jiàn)病灶內(nèi)脂肪的腎AML 患者;(2)腫瘤有明顯壞死、囊變或出血的ccRCC 患者。研究共納入患者48 例,男19例,女29例,年齡26~83歲,平均(52.7±12.7)歲。經(jīng)術(shù)后病理證實(shí)均質(zhì)性ccRCC 28 例,腎乏脂肪AML 22 例。
1.2 CT 圖像分析及特征提取將原始DICOM 圖像導(dǎo)入ITK-SNAP 軟件(version3.8.0,www.itksnap.org),由2名住院醫(yī)師和1名5年工作經(jīng)驗(yàn)影像主治醫(yī)師對(duì)皮質(zhì)期及髓質(zhì)期薄層圖像(層厚為0.5 mm)逐層勾畫(huà)感興趣區(qū)(region of interests,ROIs),要求勾畫(huà)不超過(guò)腫瘤邊緣且<1 mm,最后保存為三維容積ROIs(圖1),然后由2 名15年以上工作經(jīng)驗(yàn)的影像主任醫(yī)師對(duì)之前影像醫(yī)生勾畫(huà)感興趣區(qū)進(jìn)行檢驗(yàn),最后由主任醫(yī)師的標(biāo)準(zhǔn)為最終結(jié)果。使用開(kāi)源python 平臺(tái)“Pyradiomics 1.3.0”(http://www.radiomics.io/pyradiomics.html)在原始圖像上和經(jīng)過(guò)濾波處理的派生圖像進(jìn)行特征提取,具體為在原始圖像上提取了一階統(tǒng)計(jì)特征、基于形狀特征和紋理特征,然后將原始圖像小波濾波轉(zhuǎn)換成高、低頻組合成8 個(gè)不同頻率組合的特征,將再次提取一階統(tǒng)計(jì)特征和紋理特征,兩期CT 圖像總共可提取1 706 個(gè)組學(xué)特征。
圖1 腫瘤感興趣勾畫(huà)生成三維ROIsFig.1 Tumor region of interests are sketched to generate 3D ROIs
1.3 特征篩選與組學(xué)預(yù)測(cè)模型建立所有數(shù)據(jù)進(jìn)行訓(xùn)練建模,為了保證數(shù)據(jù)的平衡性采用了合成少數(shù)類(lèi)過(guò)采樣技術(shù)(SMOTE),然后對(duì)特征進(jìn)行z-score 歸一化處理。選擇皮爾遜相關(guān)系數(shù)(PCC)降維,使用方差分析(ANOVA)來(lái)選擇特征,為了避免模型過(guò)擬合,按F 值排名分別選取1~6 個(gè)數(shù)量的特征進(jìn)行建模,利用邏輯回歸(LR)、隨機(jī)森林(random forest,RF)和支持向量機(jī)(support vector machine,SVM)三種機(jī)器學(xué)習(xí)方法建立共18 個(gè)預(yù)測(cè)模型,進(jìn)行5 倍交叉驗(yàn)證,選取交叉驗(yàn)證集AUC值最高的為最佳模型。對(duì)模型采用bootstrap 法內(nèi)部驗(yàn)證得到受試者工作特征(ROC)曲線(xiàn)分析計(jì)算ROC 曲線(xiàn)下面積(AUC)值評(píng)估模型的診斷效能。
1.4 臨床特征分析根據(jù)患者臨床信息和CT 圖像信息將年齡、性別、腫瘤大?。–T 軸位最長(zhǎng)徑)、腫瘤位置(左腎或右腎)納入臨床特征,進(jìn)行單因素分析,然后將有統(tǒng)計(jì)學(xué)意義的臨床特征進(jìn)行二元logistic 回歸分析,建立臨床預(yù)測(cè)模型并計(jì)算ROC 曲線(xiàn)下面積。
1.5 建立綜合模型并繪制列線(xiàn)圖利用所選臨床特征和最佳組學(xué)模型預(yù)測(cè)值進(jìn)行多因素二元logistic 回歸建立綜合模型,并繪制列線(xiàn)圖,采用Hosmer-Lemeshow 擬合優(yōu)度檢驗(yàn)評(píng)價(jià)綜合模型的擬合度,并繪制校正曲線(xiàn)。繪制決策曲線(xiàn)評(píng)價(jià)綜合模型鑒別均質(zhì)性ccRCC 和腎乏脂肪AML 的凈獲益。最后DeLong 檢驗(yàn)比較臨床模型、組學(xué)模型和綜合的ROC 曲線(xiàn)的性能。
1.6 統(tǒng)計(jì)學(xué)方法臨床組學(xué)特征數(shù)據(jù)處理及構(gòu)建模型使用開(kāi)源FAE 軟件,采用SPSS 25.0 分析臨床特征,對(duì)定量變量進(jìn)行獨(dú)立樣本t檢驗(yàn),對(duì)定性變量進(jìn)行卡方檢驗(yàn)或Fisher 確切概率法,然后進(jìn)行多因素二元logistic 回歸分析。使用MedCalc 軟件繪制ROC 曲線(xiàn)并進(jìn)行DeLong 檢驗(yàn)。R 軟件使用“RMS”軟件包進(jìn)行列線(xiàn)的繪制和校準(zhǔn),使用“Generalhoslem”軟件包進(jìn)行Hosmer-Lemeshow 檢驗(yàn),決策曲線(xiàn)使用“dca.R”軟件包。P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
2.1 組學(xué)模型建立及效能18 個(gè)組學(xué)預(yù)測(cè)模型中結(jié)果選取5 個(gè)特征數(shù)LR 模型交叉驗(yàn)證集AUC=0.70 為最高(圖2),將此模型選為最優(yōu)模型,所選特征及特征貢獻(xiàn)度(圖3)。此模型經(jīng)bootstrap 法內(nèi)部驗(yàn)證AUC 值為0.836(95%CI:0.701~0.927)。
圖2 LR 模型不同特征數(shù)交叉驗(yàn)證集AUC 分布Fig.2 AUC distribution of cross validation set of different feature numbers in LR model
圖3 最佳模型特征貢獻(xiàn)值Fig.3 Feature contribution value of the best model
2.2 臨床預(yù)測(cè)模型建立患者臨床信息和CT影像信息分析得出,只有性別差異有統(tǒng)計(jì)學(xué)意義(表1),因此將性別作為預(yù)測(cè)因子建立臨床預(yù)測(cè)模型,模型AUC 值為0.656(95%CI:0.499~0.812)。
表1 臨床特征分析Tab.1 Analysis of clinical features ±s
表1 臨床特征分析Tab.1 Analysis of clinical features ±s
組別腎乏脂AML均質(zhì)ccRCC t/χ2值P 值例數(shù)22 26男/女4/18 14/12 6.467 0.011年齡(歲)51.5±12.1 53.8±13.4-0.645 0.551腫瘤大?。╟m)3.15±1.79 2.78±1.31 0.820 0.279右腎腫瘤(例)12 9 1.923 0.244
2.3 繪制綜合模型列線(xiàn)圖與不同模型比較綜合模型的AUC 為0.869(95%CI:0.740~0.949),綜合模型繪制的列線(xiàn)圖(圖4)提供預(yù)測(cè)為均質(zhì)性ccRCC 的預(yù)測(cè)概率。綜合模型的校準(zhǔn)曲線(xiàn)(圖5)具有良好的一致性(P>0.05)。決策曲線(xiàn)分析(圖6)顯示大部分概率值綜合模型可獲得更多的凈收益。三種模型的ROC 曲線(xiàn)分析性能比較(圖7),通過(guò)DeLong 檢驗(yàn),組學(xué)模型和綜合模型都比臨床模型的效能高,差異有統(tǒng)計(jì)學(xué)意義(P<0.05),雖組學(xué)模型與綜合模型效能差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05),但綜合模型AUC 值更高。
圖4 根據(jù)腫瘤大小及組學(xué)模型預(yù)測(cè)值通過(guò)多因素二元logistic 回歸分析預(yù)測(cè)均質(zhì)透明性細(xì)胞癌的列線(xiàn)圖Fig.4 The nomogram for predicting homogeneous clear cell renal cell carcinoma based on tumor size and predicted values of radiomics model by binary logistic regression analysis
圖5 綜合模型的校準(zhǔn)曲線(xiàn)Fig.5 Calibration curve of the comprehensive model
圖6 三種模型的臨床決策曲線(xiàn)Fig.6 Clinical decision curves of the three models
圖7 三種模型ROC 曲線(xiàn)性能比較Fig.7 ROC curve comparison of the three models
腎AML 和ccRCC 是最常見(jiàn)的良、惡性腎腫瘤,兩者的臨床決策和預(yù)后截然不同[9]。腎乏脂肪AML 與ccRCC 有相似的影像學(xué)表現(xiàn),特別是與無(wú)明顯壞死、囊性變或出血的均質(zhì)性ccRCC 比較時(shí),使得常規(guī)影像鑒別診斷相當(dāng)困難[10]。影像組學(xué)是一種新的研究方法。它在醫(yī)學(xué)圖像中的應(yīng)用,特別是在癌癥領(lǐng)域的應(yīng)用,已成為眾多學(xué)者研究的熱點(diǎn)[11]。本研究結(jié)合影像組學(xué)特征聯(lián)合臨床因素建立綜合模型鑒別腎乏脂肪AML和均質(zhì)性ccRCC。首先,最佳組學(xué)模型具有良好的鑒別能力,AUC 值為0.836。其次,本研究納入了年齡、性別,腫瘤大小臨床特征因素,經(jīng)分析得出性別可以作為獨(dú)立預(yù)測(cè)因子,與過(guò)往研究結(jié)果一致,可能有本研究納入標(biāo)準(zhǔn)嚴(yán)格和病例數(shù)量有限的原因,并未得到年齡也是一個(gè)獨(dú)立預(yù)測(cè)因子[12-14]。利用性別因素建立的臨床模型性能較一般。為驗(yàn)證組學(xué)模型和臨床模型是否具有互補(bǔ)性,因此,本研究建立綜合模型效果最佳。
交叉驗(yàn)證集AUC 值高的模型穩(wěn)定即泛化能力好[15]。本研究雖提取出大量特征,但由于樣本量有限,為了避免過(guò)擬合特征選擇數(shù)少于樣本量的1/8,故本研究值篩選F 值排名前六的特征數(shù)開(kāi)發(fā)了基于三種機(jī)器學(xué)習(xí)方法的18 個(gè)模型,若樣本量繼續(xù)擴(kuò)大,可選擇更多的特征數(shù)建模。目前已有多項(xiàng)研究利用CT 圖像紋理分析鑒別腎乏脂肪AML 和腎細(xì)胞癌(renal cell carcinoma,RCC)。HODGDON 等[16]開(kāi)發(fā)了一個(gè)CT 紋理模型,使用SVM 分類(lèi)器在CT 平掃圖像上區(qū)分腎乏脂肪AML和RCC,結(jié)果AUC 為0.89。LEE 等[17]使用三種特征選擇方法和四種機(jī)器學(xué)習(xí)算法開(kāi)發(fā)了一個(gè)基于紋理分析的分類(lèi)系統(tǒng),結(jié)果得出采用Relief 特征選擇方法使用k 近鄰和SVM 分類(lèi)器對(duì)腎乏脂肪AML和RCC 診斷的準(zhǔn)確率分別達(dá)到了72.3%和72.1%。VARGHESE 等[18]收集了129 例RCC(包括三種亞型)和45 例良性腎腫瘤(嗜酸細(xì)胞瘤和腎乏脂肪AML),用CT 紋理特征在鑒別良、惡性以及其中某一類(lèi)亞型和其余所有腫瘤的準(zhǔn)確性。結(jié)果鑒別良惡性的AUC 為0.87,其中某一類(lèi)亞型和其余所有腫瘤的AUC 為0.80~0.98。與上述研究相比本研究目的更加明確,研究對(duì)象只選擇無(wú)明顯壞死、囊變或出血的均質(zhì)性ccRCC 和腎乏脂肪AML,兩者是臨床工作中最常遇到的診斷難題,也最容易誤診。本研究的方法也做了幾點(diǎn)改進(jìn)。首先,本研究中使用的是三維ROIs,與二維ROIs 相比,實(shí)現(xiàn)了分辨效率的提高,三維ROIs 是整體腫瘤分析,比最大橫截面更能提示出腫瘤的異質(zhì)性[19]。其次,之前多項(xiàng)研究是基于幾十個(gè)紋理特征分析。然而,近年來(lái)影像組學(xué)的快速發(fā)展已經(jīng)可提出更多的特征,能夠更全面地了解腫瘤異質(zhì)性[20]。本研究提取了原始圖像及小波濾波圖像中特征,每個(gè)病例的動(dòng)、靜脈期CT 圖像中共提取1 706 個(gè)特征,提供了更多有價(jià)值的特征。本研究的模型所選特征為小波特征是常規(guī)紋理分析無(wú)法獲取的。
為了探索臨床應(yīng)用,本研究在綜合模型基礎(chǔ)上建立了一個(gè)列線(xiàn)圖,作為鑒別腎乏脂肪AML 和均質(zhì)性ccRCC 實(shí)用工具。綜合模型具有較高的AUC,表明具有較好的鑒別能力及推廣價(jià)值。此外,從決策曲線(xiàn)分析可以得到大部分概率值獲得更多凈收益,表明用綜合模型作臨床決策可獲得較好的結(jié)果。本研究的列線(xiàn)圖為臨床醫(yī)生提供了一個(gè)具有前景的工具。具體來(lái)講根據(jù)列線(xiàn)圖給出的均質(zhì)ccRCC 的預(yù)測(cè)概率,可采取不同的治療策略。腎AML 患者可選擇定期觀察,ccRCC 患者則選擇手術(shù)治療[21]。
本研究也存在局限性。首先,作為病例對(duì)照研究,樣本量小且沒(méi)有設(shè)置獨(dú)立測(cè)試集數(shù)據(jù),因此模型采用bootstrap 法內(nèi)部驗(yàn)證。研究需進(jìn)一步擴(kuò)大樣本量,展現(xiàn)出模型的泛化能力。其次,人工分割三維ROIs 既耗時(shí)又復(fù)雜,特別是對(duì)于邊界不清的腫瘤。今后重點(diǎn)應(yīng)開(kāi)發(fā)一種深度學(xué)習(xí)算法自動(dòng)分割腎腫瘤??傊?,本研究開(kāi)發(fā)了一種基于臨床因素和CT 影像組學(xué)的綜合模型,具有良好的術(shù)前鑒別腎乏脂肪AML 和均質(zhì)性ccRCC 效能,可將其作為一種無(wú)創(chuàng)、實(shí)用的方法來(lái)輔助臨床診療。