于子洋,由 賀,龐惠澤,黃文鏡,任 克*
(1.中國(guó)醫(yī)科大學(xué)附屬第一醫(yī)院放射科,3.病理科,遼寧 沈陽(yáng) 110000;2. 中國(guó)醫(yī)科大學(xué)腫瘤醫(yī)院,遼寧省腫瘤醫(yī)院醫(yī)學(xué)放射科,遼寧 沈陽(yáng) 110000)
圖1 患者女,54歲,RO,結(jié)合冠狀位圖像,在軸位腎臟增強(qiáng)掃描皮質(zhì)期和實(shí)質(zhì)期圖像病灶內(nèi)1 mm處逐層勾畫ROI(A~C),并生成三維圖像(D)
腎臟嫌色細(xì)胞癌(chromophobe cell renal carcinoma, CCRC)和嗜酸性細(xì)胞腺瘤(renal oncocytoma, RO)均起源于腎集合管潤(rùn)細(xì)胞,發(fā)病比例分別為6%~8%和3%~7%[1],但因性質(zhì)不同,手術(shù)方法及預(yù)后均不同,故術(shù)前鑒別診斷十分重要。紋理分析是新興的圖像后處理技術(shù),通過(guò)計(jì)算機(jī)軟件提取肉眼無(wú)法識(shí)別的紋理特征數(shù)據(jù),結(jié)合機(jī)器學(xué)習(xí)能夠?qū)δ[瘤內(nèi)在異質(zhì)性進(jìn)行定量分析[2],進(jìn)而有效鑒別腎臟不同類型腫瘤[3]。本研究探討基于腎臟CT圖像的紋理分析鑒別CCRC與RO的價(jià)值。
1.1 一般資料 收集2013年1月-2018年7月中國(guó)醫(yī)科大學(xué)附屬第一醫(yī)院收治的經(jīng)術(shù)后病理證實(shí)的64例CCRC和31例RO患者。CCRC組男30例,女34例,年齡31~79歲,平均(53.2±9.5)歲;RO組男11例,女20例,年齡23~79歲,平均(55.0±13.8)歲。納入標(biāo)準(zhǔn):①首診發(fā)現(xiàn)病灶,未行穿刺或相關(guān)治療;②經(jīng)術(shù)后病理及免疫組織化學(xué)證實(shí)診斷;③采用同一臺(tái)CT機(jī)進(jìn)行腎臟CT增強(qiáng)掃描。排除標(biāo)準(zhǔn):①混合型腎腫瘤;②病灶<1.0 cm且無(wú)法準(zhǔn)確勾畫ROI。
1.2 CT掃描方法 囑患者掃描前飲水1 000 ml。采用Philips 256層螺旋CT機(jī)行仰臥位屏氣掃描,范圍自膈肌至髂前上棘連線水平。掃描參數(shù):管電壓120 kV,管電流100 mAs,層厚5 mm、 層距0.5 mm;用高壓注射器將1.5 ml/kg體質(zhì)量碘海醇注射液經(jīng)肘靜脈于25 s內(nèi)注射完畢后行增強(qiáng)掃描,采用閾值觸發(fā)掃描技術(shù),將檢查區(qū)置于降主動(dòng)脈與腹主動(dòng)脈交界處,自動(dòng)觸發(fā)閾值設(shè)定為100 HU,達(dá)到閾值后延遲25 s行皮質(zhì)期掃描,隨后30 s行實(shí)質(zhì)期掃描,3 min后再行排泄期掃描。
1.3 圖像分析
1.3.1 選取 圖像及ROI 從圖像存儲(chǔ)與傳輸系統(tǒng)(picture archiving and communications system, PACS)中檢索圖像,并將2組皮質(zhì)期和實(shí)質(zhì)期圖像導(dǎo)出至ITK-SNAP version 4.11.0軟件(www.itk-snap.org),由2名高年資放射科醫(yī)師采用雙盲法選取皮質(zhì)期和實(shí)質(zhì)期圖像進(jìn)行紋理分析,意見不一致時(shí)經(jīng)協(xié)商解決。結(jié)合冠狀位圖像,在軸位腎臟增強(qiáng)掃描皮質(zhì)期和實(shí)質(zhì)期圖像上沿腫瘤輪廓內(nèi)約1 mm逐層進(jìn)勾畫ROI(圖1A~1C),得到腫瘤的三維ROI(圖1D)。
1.3.2 提取紋理特征參數(shù) 將所得ROI傳輸?shù)杰浖嗀.K.Version V3.0.0.R(Analysis Kit,GE Healthcare, China)提取紋理特征參數(shù)。采用紋理分析方法在分割出的腫瘤區(qū)域深入挖掘CT圖像紋理特征,提取其中重復(fù)性好、非冗余、可表示腫瘤影像灰度分布和異質(zhì)性的定量紋理參數(shù)。
1.4 統(tǒng)計(jì)學(xué)分析
1.4.1 篩選紋理特征參數(shù) 采用Anaconda2軟件(www.anaconda.com)以Python語(yǔ)言從“sklearn”及“scipy”學(xué)習(xí)包中選擇代碼語(yǔ)言進(jìn)行統(tǒng)計(jì)處理(圖2);以“RandomForestClassifier”分類器對(duì)皮質(zhì)期、實(shí)質(zhì)期及綜合兩期后的396個(gè)紋理參數(shù)分別進(jìn)行學(xué)習(xí)。設(shè)置396個(gè)紋理參數(shù)權(quán)重值總和為1分,使用“accuracy_score”算法來(lái)計(jì)算各期各紋理參數(shù)的權(quán)重值,并從高到低進(jìn)行排序,去除權(quán)重值為0的冗余參數(shù)。根據(jù)樣本量與參數(shù)的最佳擬合比及各參數(shù)所占比重選取紋理參數(shù)。
圖2 使用隨機(jī)森林算法及篩選紋理參數(shù)代碼流程圖
1.4.2 隨機(jī)森林分類器 ①分別選取CCRC和RO的皮質(zhì)期、實(shí)質(zhì)期及聯(lián)合兩期降維后得到的前20個(gè)紋理參數(shù),按照學(xué)習(xí)組與驗(yàn)證組樣本量4∶1比例構(gòu)建3個(gè)機(jī)器模型,利用Bootstrap方法將學(xué)習(xí)組樣本集隨機(jī)分成若干子集;②在CCRC和RO學(xué)習(xí)樣本中隨機(jī)選取若干個(gè)紋理特征,作為決策樹每個(gè)節(jié)點(diǎn)的候選分裂特征,通過(guò)計(jì)算Giniindex選取評(píng)分最高的特征,以之劃分每個(gè)節(jié)點(diǎn),由此在若干個(gè)訓(xùn)練樣本集中生成多棵決策樹;③將所有訓(xùn)練決策樹集成為隨機(jī)森林分類器模型,以之預(yù)測(cè)驗(yàn)證樣本的良惡性,根據(jù)多數(shù)投票準(zhǔn)則,將票數(shù)最多的結(jié)果作為最終預(yù)測(cè)結(jié)果。
1.5 評(píng)價(jià)紋理參數(shù)效能及統(tǒng)計(jì)學(xué)分析 采用Logistic回歸計(jì)算患者風(fēng)險(xiǎn)評(píng)分,評(píng)分范圍為0~1,分?jǐn)?shù)越高表明診斷CCRC的概率越大,進(jìn)而評(píng)價(jià)納入的紋理參數(shù)預(yù)測(cè)因子對(duì)預(yù)測(cè)此2種腎疾病分類的效能。采用Bootstrapping法進(jìn)行紋理分析標(biāo)簽的內(nèi)部驗(yàn)證,避免過(guò)擬合偏差,并以逐步向后法準(zhǔn)則選擇紋理參數(shù)變量。應(yīng)用ROC曲線獲得AUC確定紋理分析定量參數(shù)對(duì)于 CCRC和RO的診斷閾值及效能(敏感度、特異度和準(zhǔn)確率)。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 紋理特征 共收集到396個(gè)紋理參數(shù)特征,自每個(gè)ROI內(nèi)提取代表CT圖像灰度特征的144個(gè)灰度共生矩陣(grey level co-occurrence matrix, GLCM)、180個(gè)灰度游程長(zhǎng)度矩陣(gray-level size zone matrix, GLSZM)和11個(gè)灰階運(yùn)行長(zhǎng)度矩陣(run-length matrix, RLM),代表圖像紋理特征的10個(gè)Haralick特征,代表CT體素強(qiáng)度的42個(gè)直方圖特征(Histogram)和代表ROI的三維大小和形狀的9個(gè)Formfactor特征。
2.2 紋理參數(shù)
2.2.1 紋理分析參數(shù)及預(yù)測(cè)結(jié)果 按學(xué)習(xí)組與驗(yàn)證組4∶1比例分配皮質(zhì)期、實(shí)質(zhì)期及聯(lián)合兩期病例,得到3個(gè)驗(yàn)證集的AUC值(圖3);根據(jù)Hughes效應(yīng)及參數(shù)權(quán)重>0.01選取權(quán)重值由高到低的前20個(gè)紋理參數(shù)(圖4)。
2.2.2 評(píng)價(jià)3個(gè)模型的診斷效能 采用Logistics回歸法檢驗(yàn)隨機(jī)森林算法篩選所得20個(gè)紋理參數(shù)的擬合優(yōu)度,得出皮質(zhì)期、實(shí)質(zhì)期及兩期聯(lián)合模型的ROC曲線,見圖5、表1。
CCRC與RO具有相似的形態(tài)學(xué)、組織學(xué)及超微結(jié)構(gòu),病理學(xué)僅靠光鏡觀察HE染色片難以鑒別,需要進(jìn)一步結(jié)合免疫組織化學(xué)加以區(qū)分[4]。術(shù)前定性診斷腫瘤具有重要臨床意義。臨床對(duì)RO多采取保守觀察,對(duì)CCRC則多行腫瘤部分或根治性切除術(shù)。 CT或MR主要依據(jù)中央星狀瘢痕延遲強(qiáng)化診斷RO,但實(shí)際上僅25%~30% 的RO存在中央瘢痕,且多為直徑>2.5 cm的腫瘤[5];而約23%的CCRC也有此表現(xiàn)[6],使得傳統(tǒng)影像學(xué)方法鑒別二者具有一定局限性。紋理分析是通過(guò)計(jì)算圖像像素強(qiáng)度得到像素分布規(guī)律,定量提取能夠反映病變異質(zhì)性紋理參數(shù)的圖像后處理技術(shù),其目的是充分挖掘醫(yī)學(xué)圖像的特征[7]。紋理分析結(jié)合機(jī)器模型能夠?qū)W習(xí)圖像內(nèi)部肉眼無(wú)法識(shí)別的特征,進(jìn)而實(shí)現(xiàn)對(duì)疾病鑒別診斷及預(yù)測(cè)預(yù)后[8-9]。目前已證實(shí)紋理分析有助于鑒別腫瘤良惡性和腫瘤分期及療效、預(yù)后評(píng)估[10-11]。本研究顯示基于CT圖像的紋理分析鑒別CCRC與RO的準(zhǔn)確率高于86%。
在腎臟平掃圖像上無(wú)法準(zhǔn)確勾畫病灶的ROI,且有研究[2,12]發(fā)現(xiàn)基于CT平掃的紋理分析對(duì)于腎腫瘤分型無(wú)意義,故本研究未納入平掃圖像,而選擇腎臟皮質(zhì)期和實(shí)質(zhì)期紋理參數(shù)進(jìn)行分析。本研究用于篩選紋理參數(shù)的隨機(jī)森林算法具有較高準(zhǔn)確性和較低過(guò)擬合性,近年研究[13]證實(shí)其適合用于篩選紋理參數(shù)。該算法是HO在1995年發(fā)明的一種機(jī)器學(xué)習(xí)技術(shù),可根據(jù)變量層次結(jié)構(gòu)將樣本分類為數(shù)個(gè)已知的“森林”,每個(gè)“森林”由大量隨機(jī)生成的包含樣本不同特征的“樹”組成,每“樹”可根據(jù)變量特征隨機(jī)對(duì)數(shù)據(jù)集進(jìn)行分類,最終得到的分類器可用于對(duì)給定樣本進(jìn)行分類。本研究發(fā)現(xiàn)結(jié)合皮質(zhì)期和實(shí)質(zhì)期的紋理參數(shù)準(zhǔn)確率為0.945,高于任一單期相,與SHU等[14]研究的結(jié)論相符,可能與樣本量增加及參數(shù)特征多樣化有助于提高機(jī)器模型對(duì)于疾病診斷的準(zhǔn)確性有關(guān)。
表1 皮質(zhì)期、實(shí)質(zhì)期及其聯(lián)合診斷效能
圖5 降維后紋理參數(shù)鑒別CCRC和RO的ROC曲線 A.皮質(zhì)期驗(yàn)證集AUC值,結(jié)果為0.88; B.實(shí)質(zhì)期驗(yàn)證集AUC值,結(jié)果為0.86; C.兩期聯(lián)合驗(yàn)證集AUC值,結(jié)果為0.94
本研究對(duì)CCRC和RO兩種少見腫瘤進(jìn)行回顧性分析,發(fā)現(xiàn)基于CT圖像的紋理分析可無(wú)創(chuàng)、簡(jiǎn)便、準(zhǔn)確地區(qū)分CCRC與RO。本組樣本量較少,且手動(dòng)勾畫ROI可導(dǎo)致一定誤差。后續(xù)將納入更多標(biāo)準(zhǔn)化圖像,采取自動(dòng)勾畫ROI方法進(jìn)一步驗(yàn)證紋理分析對(duì)于CCRC與RO的鑒別診斷價(jià)值。