徐一銘,袁 梅,邱 琳,于瑞磊,俞同福
南京醫(yī)科大學第一附屬醫(yī)院放射科,江蘇 南京 210029
肺結節(jié)及腫塊的鑒別診斷是臨床工作的重點之一,早期診斷及治療對患者意義重大[1]。傳統(tǒng)影像學主要依賴于CT 圖像上病灶的形態(tài)學及增強掃描特征進行診斷[2]。近年來新興的能譜CT 成像技術利用各物質能譜曲線的差異實現碘的物質分離,同時生成單能量圖像、碘基圖及有效原子序數圖,提供更多輔助診斷的定量參數。目前已有學者初步探討能譜CT 成像技術在肺部炎性及惡性病變上的鑒別診斷價值,二者在能譜曲線斜率及碘濃度等定量參數之間存在差異[3]。然而,能譜CT成像的數據信息尚未被充分利用,大量基于影像組學方法的影像組學特征可以為疾病診療提供更多信息[4]。本研究在能譜CT定量參數的基礎上,探討基于碘基圖的影像組學特征對于肺內炎性及惡性的定性診斷價值,尋求更優(yōu)的鑒別診斷策略。
回顧性分析2018年8月23日—2019年8月1日于南京醫(yī)科大學第一附屬醫(yī)院接受能譜CT 胸部增強掃描的檢查結果,收集表現為結節(jié)或腫塊影的影像資料。本研究為回顧性研究,經醫(yī)院倫理委員會批準,患者均簽署知情同意書。排除標準:①在掃描前接受新輔助治療的惡性病變;②非原發(fā)性惡性病變;③影像表現呈磨玻璃密度;④圖像質量差、偽影重以致影響后續(xù)圖像分析。最終共納入123 例,男85 例,女38 例,中位年齡64 歲(37~89 歲),其中惡性組85例(腺癌52例,鱗癌21例,小細胞癌6例,其他6 例),炎性組38 例,均經手術、CT 引導下細針穿刺活檢、經支氣管鏡活檢或后續(xù)隨訪證實。
1.2.1 掃描方法
掃描設備采用Discovery CT 750HD(GE Healthcare 公司,美國),患者取仰臥位,足先進,于深吸氣末屏氣時進行掃描,掃描范圍自兩肺尖至肺底部,經肘靜脈團注非離子型對比劑碘普羅胺(300 mgI/mL)90 mL,注射流率3 mL/s,分別在動脈期(30 s)、靜脈期(60 s)進行掃描,層厚及層距為5.0 mm,轉速為0.5 s/r,矩陣512x512,其中動脈期采用能譜掃描模式(gemstone spectral imaging,GSI),管電壓為80~140 kVp 瞬時切換,管電流自適應,靜脈期采用常規(guī)掃描方式,管電壓為120 kVp,管電流為240 mA。掃描完成后重建出碘基圖、70 keV及40 keV的單能量圖像,重建層厚為1.25 mm,并將重建圖像及原始數據傳入GE AW4.6 工作站及影像歸檔和通信系統(tǒng)(picture archiving and communication system,PACS)。
1.2.2 能譜CT參數分析
使用GSI viewer 瀏覽器進行分析,采用最大層面全病灶區(qū)域法放置感興趣區(qū)(region of interest,ROI),盡可能包括整個病灶,同時避開空洞、壞死組織、支氣管、大血管及明顯的鈣化,分別測量ROI 于100、70及40 keV單能量圖像下的CT值、碘濃度(iodine concentration,IC)及有效原子序數值(effective-Z,Zeff),同時測量與ROI 同層面的降主動脈或左鎖骨下動脈的碘濃度(IC0)及有效原子序數值(Zeff0),保證同一層面各ROI的位置及大小完全一致[5]。重復測量3 次,結果取平均值。后續(xù)的計算包括:①100-70 keV、70-40 keV、100-40 keV段的能譜曲線斜率λ,公式如下:λ100-70keV=|CT值100keV-CT值70keV|/(100-70),λ70-40keV=|CT 值70keV-CT 值40keV|/(70-40),λ100-40keV=|CT 值100keV-CT 值40keV|/(100-40)。②標準化碘濃度(normalized iodine concentration,NIC),公式為NIC=IC/IC0。③標準化有序原子序數值(normalized effective-Z,NZeff),公式為NZeff=Zeff/Zeff0。在工作站上測量病灶的軸位最大徑(D),精確到小數點后1位小數,重復測量3次取平均值。
1.2.3 影像組學特征提取
以DICOM 格式從PACS 導出碘基圖,在FireVoxel 軟件中打開,采用最大層面全病灶區(qū)域法手動分割ROI,ROI 的確定方法與1.2.2 所述相同。隨后使用內部軟件平臺提取影像組學特征共107個,包括14個形狀特征,18個一階直方圖特征以及75個紋理特征[24 個灰度共生矩陣(gray level co-occurrence matrix,GLCM)特征、16 個灰度游程矩陣(gray level run-length matrix,GLRLM)特征、16個灰度區(qū)域大小矩陣(gray level size zone matrix,GLSZM)特征、5個鄰域灰度差分矩陣(neighborhood gray-tone differencematrix,NGTDM)特征、14 個灰度相關矩陣(gray level dependence matrix,GLDM)特征]。
1.2.4 數據分析
使用基于Python(3.6.8,https://www.python.org/)的開源組學分析平臺FeAture Explorer(FAE,v0.2.5,https://github.com/salan668/FAE)進行特征分析[6]。由于各特征間數量級差異較大,對數據進行Z-score標準化處理,計算公式為Z=(x-x)/std(x),其中x為某特征在所有樣本中的均值,std(X)為相應的標準差。以7∶3 拆分訓練集和測試集,訓練集86 例(良性組/惡性組=27/59),測試集37例(良性組/惡性組=11/26)。由于惡性組病例較多,采用少數類樣本合成過采樣技術(synthetic minority over-sampling technique,SMOTE)使數據均衡化,采樣倍率為2.19,采樣后的訓練集正負樣本量達1∶1(良性組/惡性組=59/59)。首先使用皮爾森相關系數法(Pearson correlation coefficients,PCC)降維,移除PCC值高于0.86的冗余特征。隨后通過遞歸特征消除(recursive feature elimination,RFE)進一步篩選特征,最終使用線性判別式分類器(linear discriminant analysis,LDA)建立預測模型,并采用5 折交叉驗證法驗證分類器的性能。
使用SPSS 21.0 軟件進行統(tǒng)計學分析,計量資料滿足正態(tài)性檢驗則采用t檢驗或校正t檢驗,并以均數±標準差()進行統(tǒng)計描述,否則采用Mann-WhitneyU檢驗,并以中位數及四分位數[M(P25,P75)]進行統(tǒng)計描述,多因素分析使用二元Logistic 回歸,使用MedCalc15.2.2 軟件繪制受試者特征(receiver operating characteristic,ROC)曲線,評估模型的診斷效能,以曲線下面積(area under curve,AUC)作為評判標準。P<0.05 為差異有統(tǒng)計學意義。
惡性組CT值70keV、Zeff、NZeff及兩組的D不滿足正態(tài)性檢驗(P<0.05),故采用Mann-WhitneyU檢驗。惡性組與炎性組比較,除CT值70 keV外,CT值40keV、λ100-70keV、λ70-40keV、λ100-40keV、IC、NIC、Zeff、NZeff、D 差異均有統(tǒng)計學意義(表1、圖1~2)。
圖1 腺鱗癌能譜CT圖像(惡性組)Figure 1 Spectral CT images of a patient diagnosed pulmonary adenosquamous carcinoma(malignant group)
表1 兩組間能譜CT參數比較Table 1 Comparison of spectral CT parameters between the two groups
經PCC降冗后剩余91個特征,經RFE特征選擇后最終共篩選出10 個影像組學特征用于建立預測模型,包括1 個一階直方圖特征(firstorder_Maximum)、2 個GLCM 特征(glcm_Autocorrelation、glcm_JointAverage)、5 個GLDM 特征(gldm_SmallDependenceHighGrayLevelEmphasis、gldm_LargeDependenceLowGrayLevelEmphasis、gldm_LowGrayLevel -Emphasis、gldm_HighGrayLevelEmphasis、gldm_DependenceVariance)、1 個GLRLM 特征(glrlm_Run-LengthNonUniformity)、1 個 GLSZM 特 征(glszm_SmallAreaEmphasis),各特征在模型中的系數詳見表2。其中glcm_Autocorrelation、gldm_SmallDependenceHighGr-ayLevelEmphasis、glrlm_RunLength-NonUniformity、firstorder_Maximum 的特征系數為負值,其余為正值。對預測模型進行ROC 曲線分析,以評估其診斷效能(表3)。
表2 特征在預測模型中的系數Table 2 The coefficients of features in the model
表3 ROC曲線分析預測模型在訓練集、驗證集及測試集下的性能Table 3 Performance of the model on training set,validation set and test set in ROC analysis
圖2 肉芽腫性炎能譜CT圖像(炎性組)Figure 2 Spectral CT images of a patient diagnosed pulmonary granulomatous inflammation(inflammatory group)
將具有統(tǒng)計學意義的能譜CT 參數納入二元Logsitic回歸分析,NIC為獨立影響因素(P<0.001)。分別繪制NIC和影像組學預測模型的ROC曲線(圖3)并進行比較,預測模型的診斷效能明顯優(yōu)于NIC(Z=2.121,P=0.034,表4)。
表4 ROC曲線分析NIC和預測模型鑒別肺內炎性及惡性病變的性能Table 4 Performance of NIC and the model in identifying inflammatory and malignant pulmonary lesions in ROC analysis
圖3 預測模型的ROC曲線分析Figure 3 ROC curve analysis of the model
能譜CT 為采用單球管瞬時切換技術的雙能量CT成像設備,可以在一次掃描內獲取兩組完全匹配的高低能量圖像,同時生成40~140 keV 連續(xù)的101組單能量圖像。由于不同物質存在特定的能譜曲線,根據基物質進行物質分離,可一定程度上實現物質成分的定量評估[7]。碘-水分離生成的碘基圖可量化碘相關衰減,通過碘濃度反映病變的血供情況,與真實的增強程度相當[8]。目前已有大量研究使用能譜CT圖像及碘基圖,鑒別良惡性病變、評估腫瘤的生物學行為與預后、評估淋巴結轉移情況等[9-11]。
本研究使用能譜CT定量參數鑒別肺內炎性及惡性病變。炎性組的CT值40keV、λ100-70keV、λ70-40keV、λ100-40keV、IC、NIC、Zeff、NZeff 均高于惡性組,與既往研究結果一致[3,12]。70 keV 的單能量圖像可用于模擬管電壓120 kVp的CT掃描圖像,CT值70 keV沒有統(tǒng)計學差異,提示炎性組與惡性組病變難以直接通過常規(guī)增強CT 圖像的CT 值區(qū)分。能譜CT 可以通過ROI 的碘濃度反映血供情況,碘濃度越高,能譜曲線斜率增大、在低能級下的X衰減量增高,從而反映出病變血供之間的差異。病灶動脈期的強化程度主要與血供情況與血流有關。炎性病變主要由增生的肉芽組織構成,毛細血管網豐富,在炎性因子的刺激下,小動脈和毛細血管網明顯擴張,血管通透性增高,對比劑可快速進入病灶內,而腫瘤不成熟的血管生成以及癌組織對管壁的浸潤會導致血管形態(tài)、功能的異常,因此炎性病變較惡性病變呈現更早而明顯的均勻強化。本研究使用同層面主動脈或左鎖骨下動脈對ROI 碘濃度進行標準化,可以最小化患者循環(huán)狀況以及掃描時間產生的干擾,使用NIC 更準確地反映病變的血供情況[13]。
在此基礎上,本研究基于碘基圖提取影像組學特征,建立肺內炎性及惡性病變的預測模型。使用1 個一階直方圖特征以及9 個紋理特征,以LDA 分類器建立模型,其診斷效能較NIC明顯提高,ROC曲線存在統(tǒng)計學差異。在預測模型中權重前3的特征分別為glcm_Autocorrelation 以及glcm_JointAverage、gldm_HighGrayLevelEmphasis,其中glcm_Autocorrelation 用于度量紋理的粗細程度,glcm_JointAverage為聯合概率的灰度加權和,gldm_HighGrayLevelEmphasis反映高灰度值的分布情況。碘基圖通過顯示碘對比劑的分布情況,著重反映病變血供的異質性。既往已有學者嘗試使用基于碘基圖的影像組學特征判斷肺癌預后及病理分級,不同惡性程度的病變之間碘基圖的組學特征存在顯著差異[14-15]。本文為首次探討碘基圖影像組學特征對于肺炎性及惡性病變鑒別價值的研究,預測模型取得明顯優(yōu)于傳統(tǒng)能譜CT定量參數的診斷效能。
本研究探討并比較能譜CT 定量參數以及碘基圖影像組學特征對于肺內炎性及惡性病變的預測價值,存在幾項局限性:①本研究采用動脈期GSI,未評估靜脈期的能譜CT 定量參數以及碘基圖組學特征的預測價值;②病例數有限,樣本量不足,后續(xù)有待于大樣本的進一步研究;③本研究采用最大層面全病灶區(qū)域法,基于最大層面而非全容積進行分析,不能反映病變的全貌,可能會存在一定的偏差,有待今后大樣本、基于全容積的研究進一步完善。