宋若晨,褚相樂,黃勇華,劉海燕,張海深
(新鄉(xiāng)醫(yī)學院附屬濮陽市油田總醫(yī)院放射科,河南 濮陽 457001)
腦為顱外惡性腫瘤常見轉(zhuǎn)移部位[1],原發(fā)腫瘤以肺癌和乳腺癌多見,但約10%的腦轉(zhuǎn)移癌來源未知[1-2]。MRI為無創(chuàng)診斷腦轉(zhuǎn)移癌的常規(guī)方法,但欲準確鑒別原發(fā)灶仍面臨困難。影像組學有助于發(fā)現(xiàn)腫瘤內(nèi)在分子生物學改變[3],可實現(xiàn)腫瘤聚類。既往影像組學多采用傳統(tǒng)機器學習方法分析圖像,提取特征準確性欠佳,致模型習得的有效特征信息不足。深度學習可自動量化和選擇最具魯棒性的特征,以更有效學習語義信息,已用于影像學[4-5]及病理學[6-8]等領域。本研究基于顱腦對比增強T1WI(contrast enhanced T1WI,T1CE),以深度學習卷積神經(jīng)網(wǎng)絡(convolutional neural network, CNN)算法構建模型,分析其鑒別肺癌與乳腺癌腦轉(zhuǎn)移的效能。
1.1 一般資料 回顧性分析2015年6月—2022年10月濮陽市油田總醫(yī)院收治的97例經(jīng)手術病理確診的乳腺癌或肺癌腦轉(zhuǎn)移患者。其中39例乳腺癌腦轉(zhuǎn)移,男1例、女38例,年齡49~83歲、平均(52.9±12.3)歲;58例肺癌腦轉(zhuǎn)移,男36例、女22例,年齡37~79歲、平均(64.2±8.4)歲。納入標準:①接受顱腦增強MR掃描;②經(jīng)病理證實原發(fā)灶為肺癌或乳腺癌,且僅有一種原發(fā)腫瘤;③顱腦增強MR檢查前均未接受針對腦部病灶的抗腫瘤治療;④顱腦MRI無明顯偽影,質(zhì)量滿足研究要求。排除標準:①臨床資料不全;②無明確腦內(nèi)結節(jié)或腫塊;③腦轉(zhuǎn)移癌病灶最大徑<1 cm。檢查前及術前患者及家屬簽署知情同意書。本研究經(jīng)院倫理審查委員會批準(2022-03-0033-E01)并免除知情同意要求。
1.2 儀器與方法 采用Philips Ingenia 3.0T MR儀、頭部線圈進行頭顱掃描。參數(shù):平掃軸位T1WI,TR 2 000 ms,TE 20 ms,矩陣296×151,FOV 230 mm×230 mm;軸位T2WI,TR 3 366 ms,TE 93 ms,矩陣256×256,FOV 230 mm×230 mm;軸位液體衰減反轉(zhuǎn)恢復(fluid attenuated inversion recovery,FLAIR) T2WI,TI 2 800 ms,TR 11 000 ms,TE 120 ms,矩陣216×130,FOV 230 mm×230 mm;層厚均為5 mm,層間距均為1.5 mm。經(jīng)肘靜脈團注0.1 mmol/kg體質(zhì)量釓特酸普胺(流率2.5 ml/s)后采集軸位、矢狀位和冠狀位增強T1WI,TR 267 ms,TE 2.1 ms,矩陣328×208,FOV 230 mm×230 mm,層厚5 mm,層間距1.5 mm。
1.3 圖像處理與分割 以DICOM格式將T1CE從圖像存儲與傳輸系統(tǒng)(picture archiving and communication systems, PACS)中導出。由2名具有6年MRI診斷經(jīng)驗的影像科主治醫(yī)師以開源ITK-SNAP 3.8.0軟件對顱腦軸位T1CE進行分割并標注病灶ROI,即距腫瘤邊緣2 mm以內(nèi)的腫瘤組織(不排除腫瘤壞死部分)并生成三維ROI;若意見存在分歧,則由另一名高級職稱醫(yī)師決定。見圖1。
1.4 提取與選擇特征 采用Pyradiomics 3.0.1軟件于病灶ROI內(nèi)提取影像組學特征,去除異常值后采用z-score標準化法對特征數(shù)據(jù)進行標準化處理。之后以獨立樣本t檢驗或Mann-WhitneyU檢驗篩選差異有統(tǒng)計學意義的特征;以最小絕對收縮和選擇算法(least absolute shrinkage and selection operator,LASSO)進行特征降維。
1.5 構建模型
1.5.1 CNN 通過調(diào)整網(wǎng)絡輸入格式、批處理數(shù)(batchsize)及學習率(learning rate)等對模型進行初始化。選用交叉熵損失函數(shù),結合網(wǎng)絡訓練技巧對網(wǎng)絡進行修正,以訓練分類適當?shù)哪P?。將?shù)據(jù)按7∶3隨機分為訓練集(含17例65個乳腺癌腦轉(zhuǎn)移、39例肺癌77個腦轉(zhuǎn)移病灶)和驗證集(含22例36個乳腺癌腦轉(zhuǎn)移、19例肺癌24個腦轉(zhuǎn)移病灶)。經(jīng)多次實驗后發(fā)現(xiàn),在驗證集中batchsize為164、learning rate為0.000 1時損失值最小。
1.5.2 傳統(tǒng)機器學習 分別以7種常見機器學習方法,包括支持向量機(support vector machine, SVM)、隨機梯度下降(stochastic gradient descent, SGD)、K鄰近(K-nearest neighbor, KNN)、決策樹(decision tree, DT)、隨機森林(random forest, RF)、極端隨機樹(extremely randomized trees, ET)及邏輯回歸(logistic regression, LR) 建立模型。于訓練集中訓練模型,基于5倍交叉以驗證集對模型進行驗證。
1.6 統(tǒng)計學分析 采用SPSS 27.0及Python 3.7.6統(tǒng)計分析軟件。以±s表示計量資料,行獨立樣本t檢驗;采用χ2檢驗比較計數(shù)資料。以受試者工作特征(receiver operating characteristic, ROC)曲線及曲線下面積(area under the curve, AUC) 評估各模型鑒別肺癌與乳腺癌腦轉(zhuǎn)移的效能;采用DeLong檢驗比較各模型AUC。P<0.05為差異有統(tǒng)計學意義。
共納入202個腦轉(zhuǎn)移癌病灶,乳腺癌、肺癌腦轉(zhuǎn)移各101個;共于T1CE中提取1 050個病灶特征;經(jīng)單因素分析,于訓練集中篩選出162個差異有統(tǒng)計學意義的特征(P均<0.05),經(jīng)LASSO算法降維后獲得5個最優(yōu)特征(表1、圖2),據(jù)此分別以SVM、SGD、KNN、DT、RF、ET、LR及CNN構建8種影像組學模型。
表1 經(jīng)LASSO算法降維得到的5個腦轉(zhuǎn)移癌最優(yōu)影像組學特征
圖2 LASSO篩選回歸特征圖 A.模型偏差隨參數(shù)λ變化曲線圖,虛線表示選取的最優(yōu)log(λ)值及1個標準誤差所在位置; B.模型影像組學特征系數(shù)隨log(λ)變化的曲線圖,虛線表示選取的最優(yōu)log(λ)值所在位置
針對驗證集獲得的各模型ROC曲線(圖3)顯示,CNN模型鑒別肺癌腦轉(zhuǎn)移與乳腺癌腦轉(zhuǎn)移的AUC為0.90,在8個模型中最高(表2);DeLong檢驗顯示CNN模型的AUC與SGD(Z=3.28)、DT(Z=0.69)、RF(Z=0.69)及ET(Z=1.41)的AUC差異均有統(tǒng)計學意義(P均<0.05),與SVM、KNN及LR模型的AUC差異均無統(tǒng)計學意義(P均>0.05)。
圖3 8種影像組學模型鑒別驗證集肺癌與乳腺癌腦轉(zhuǎn)移的ROC曲線
表2 各模型鑒別驗證集肺癌與乳腺癌腦轉(zhuǎn)移的效能
對于腦轉(zhuǎn)移癌患者,準確判斷原發(fā)腫瘤并適當實施全身治療是改善預后的關鍵[9-10]。MRI中,腦轉(zhuǎn)移癌多呈不均勻長T1長T2信號,增強后多呈環(huán)狀強化,其內(nèi)多見囊變壞死,部分合并瘤內(nèi)出血,周圍水腫帶雖具一定特異性,但與以上所述均為轉(zhuǎn)移癌的共同特征,對于鑒別來源價值有限[11]。通過影像組學技術提取的影像組學特征可通過量化圖像信息而實現(xiàn)腫瘤分類[12-15]。研究[16-17]表明,基于腦部MRI提取拉普拉斯-高斯變換特征的可重復性和再現(xiàn)性均較好。
本研究基于肺癌及乳腺癌腦轉(zhuǎn)移患者顱腦T1CE篩選出3個基于拉普拉斯-高斯變換提取的圖像紋理特征(log-sigma-3-0-mm-3D_glszm_High Gray Level Zone Emphasis、log-sigma-4-0-mm-3D_glcm_Cluster Shade、log-sigma-4-0-mm-3D_glszm_Small Area High Gray Level Emphasis)和2個基于小波變換的紋理特征(wavelet-HHH_glszm_Size Zone Non-Uniformity Normalized、wavelet-LLH_ngtdm_Contrast),其中1個為灰度共生矩陣(gray level cooceurence matrix, GLCM)特征、3個灰度區(qū)域大小矩陣(gray level size zone matrix,GLSZM)特征、1個鄰域灰度差矩陣(neighbouring gray tone difference matrix, NGTDM)特征。GLCM可描述圖像變化幅度、相鄰間隔、方向等方面信息。GLSZM描述同質(zhì)性區(qū)域的特征,以全局及局部尺度反映腫瘤異質(zhì)性,可用于評估肺癌腦轉(zhuǎn)移病理類型[15]。NGTDM則反映體素間的差異。
近年多采用傳統(tǒng)機器學習算法建立模型,基于MRI影像組學判斷腦轉(zhuǎn)移癌原發(fā)灶[12-14];但傳統(tǒng)機器學習算法對部分影像組學特征讀取不充分,影響其診斷效能。本研究基于顱腦T1CE提取5個最優(yōu)特征,分別以深度學習CNN算法和7種常用傳統(tǒng)機器學習算法構建模型;ROC曲線結果顯示,8種模型中,CNN鑒別驗證集肺癌與乳腺癌腦轉(zhuǎn)移的AUC最高,達0.90,提示以CNN算法建模鑒別肺癌與乳腺癌腦轉(zhuǎn)移的效能優(yōu)于傳統(tǒng)機器學習算法。分析可能原因:深度學習使用多層感知器學習深層特征,可自動優(yōu)化擬合模型;T1CE可清晰顯示腫瘤內(nèi)血管及腫瘤血供程度,提取的影像組學信息更為豐富、準確。
綜上所述,基于顱腦T1CE構建的CNN模型可有效鑒別肺癌與乳腺癌腦轉(zhuǎn)移。但本研究數(shù)據(jù)來自單中心,且樣本量有限,有待納入多中心大樣本數(shù)據(jù)作為外部驗證集進一步觀察。