何俊林,路 青,徐 昕,胡曙東
1. 江蘇大學(xué)醫(yī)學(xué)院,鎮(zhèn)江 212013;2. 上海市金山區(qū)亭林醫(yī)院放射科,上海 201505;3. 上海交通大學(xué)醫(yī)學(xué)院附屬仁濟醫(yī)院放射科,上海200127;4.上海市皓樺科技股份有限公司,上海 200010;5.江南大學(xué)附屬醫(yī)院放射科,無錫 214062
近年來,甲狀腺癌(thyroid carcinoma,TC)的發(fā)病率呈明顯的上升趨勢[1]。甲狀腺乳頭狀癌(papillary thyroid carcinoma,PTC)是其中最常見的組織學(xué)類型,占TC的90%以上[2]。大多數(shù)PTC生長緩慢且患者預(yù)后良好,治療后復(fù)發(fā)或死亡的病例占總數(shù)的1.4%~13.3%[3]。頸部淋巴結(jié)轉(zhuǎn)移(cervical lymph node metastasis,CLNM)被認為是PTC 患者局部復(fù)發(fā)和總體生存率降低的重要因素[4]。研究[5-6]表明PTC 有較高的頸部淋巴結(jié)轉(zhuǎn)移率,為40%~70%。臨床上外科預(yù)防性頸部淋巴結(jié)清掃易導(dǎo)致感染、神經(jīng)損傷及甲狀旁腺功能減退等并發(fā)癥。因此,術(shù)前明確PTC 患者頸部淋巴結(jié)狀態(tài)對于指導(dǎo)治療和判斷預(yù)后有重要意義。然而,臨床醫(yī)師的主觀影像診斷對CLNM 的敏感度不高或差異較大,如超聲(ultrasound,US)的敏感度為63%[7],CT 的敏感度為62%[8], 磁共振成像(magnetic resonance imaging,MRI)敏感度為33%~95%[9-10]。由于正電子發(fā)射體層成像的空間分辨力低[11],小的轉(zhuǎn)移淋巴結(jié)難以被發(fā)現(xiàn)。雖然細針穿刺活檢是確認淋巴結(jié)轉(zhuǎn)移最準確的方法,但臨床上不可能對每個區(qū)域的淋巴結(jié)進行穿刺,因此易發(fā)生漏診[12]。
影像組學(xué)通過計算機高通量抽取影像資料中的高維特征,量化分析這些特征與病變的相關(guān)性,并可通過機器學(xué)習(xí)建立預(yù)測模型,用于診斷和預(yù)測預(yù)后和療效[13],彌補了傳統(tǒng)影像診斷依靠人眼識別征象和經(jīng)驗判斷的不足。而CT 圖像的甲狀腺病變影像組學(xué)分析,不但彌補了US 對甲狀腺病變顯示的諸多局限(如鈣化病灶顯示差、胸內(nèi)甲狀腺顯示困難、操作者依賴性強、圖像重復(fù)性差等),還可提供多個掃描期相的圖像,如平掃期、增強動脈期和靜脈期。本研究探索PTC 多期CT 圖像的影像組學(xué)特征在預(yù)測CLNM 中的價值,以期為臨床診斷及治療提供參考。
選擇2017 年1 月—2020 年6 月在上海市金山區(qū)亭林醫(yī)院行甲狀腺外科治療的197 例PTC 患者,收集其臨床資料。納入標準:①經(jīng)過甲狀腺全切除或次全切除,或者單側(cè)切除+頸部淋巴結(jié)清掃。②術(shù)后病理學(xué)檢查證實為PTC。③術(shù)前2 周內(nèi)在醫(yī)院行CT 掃描(平掃+動脈期+靜脈期)。④術(shù)前未經(jīng)任何與PTC 相關(guān)的治療。⑤PTC為單發(fā)結(jié)節(jié),或多發(fā)結(jié)節(jié)中病理學(xué)檢查證實為單發(fā)PTC,其余結(jié)節(jié)為良性。排除標準:①CT 圖像中的PTC長徑<5 mm。②因人為因素或其他非病變本身原因造成的圖像模糊。③多發(fā)結(jié)節(jié)中,PTC 無法確定為唯一。④同時患有其他惡性腫瘤。研究獲得醫(yī)院倫理委員會批準[倫理批號為倫研批第(2020-77)號]。所有患者均簽署知情同意書。
所有患者的甲狀腺CT 平掃及增強掃描均在BrightSpeed 16 排螺旋CT 機(GE,美國)上完成。掃描時患者采用仰臥位,頸部盡量仰伸,兩肩盡量下垂。掃描范圍從咽部至鎖骨上緣。掃描參數(shù):管電壓120 kV、自動管電流、螺距0.938、矩陣512×512、掃描層厚5 mm、層間距5 mm。首先進行平掃,其次進行動脈期與靜脈期掃描,分別在注射對比劑后的25 s與50 s掃描。對比劑為碘海醇注射液(35 g/100 mL,揚子江藥業(yè)集團有限公司),經(jīng)高壓注射器肘部靜脈團注,劑量1.5 mL/kg,注射速率3 mL/s。掃描結(jié)束后,所有圖像均進行1.0 mm薄層重建,重建間距1.0 mm,采用標準重建算法(standard deviation,STD)進行。
1.3.1 圖像處理 由1 名高年資頭頸部腫瘤診斷醫(yī)師(觀察者1)對197 例PTC 患者的3 期CT 圖像進行觀察,剔除存在偽影干擾的圖像,篩選出512 幀CT 圖像(193幀平掃期、131 幀動脈期、188 幀靜脈期),具有全部3 期CT 圖像的患者為124 例,其CT 圖像數(shù)占總數(shù)的72.6%。選取512 幀CT 圖像中顯示PTC 病灶最大長徑的層面用于影像組學(xué)分析。再由觀察者1和另一名高年資頭頸部腫瘤診斷醫(yī)師(觀察者2)共同閱讀124例患者的372幀CT圖像,觀察PTC 的位置、大小、形態(tài)、鈣化情況、增強后邊界、甲狀腺包膜侵犯和周圍組織侵犯等征象(以下稱為影像征象)。
1.3.2 圖像提取 觀察者1 對選取的512 幀CT 圖像運用ITK-SNAP 軟件(www. itksnap. org) 圈選感興趣區(qū)(region of interest,ROI)并分割提取(圖1)。圈選時ROI 盡量覆蓋整個瘤體,避免周圍正常甲狀腺組織被納入,記錄病灶的位置并測量其最大長徑。為了評估ROI圈選的可重復(fù)性,在圈選結(jié)束2 周后,隨機選擇20 幀已圈選過的CT 圖像,由2 位觀察者再次圈選。評價觀察者1 前后2 次圈選的ROI 及2 位觀察者分別圈選的ROI 是否具有一致性,評價標準為組內(nèi)相關(guān)系數(shù)(intra-class correlation coefficient,ICC)。
圖1 PTC的ROI圈選示意Fig1 Demonstration of segmentation to ROI of PTC
1.3.3 特征提取 使用Python 中開源的Pyradiomics 軟件包對512 幀CT 圖像中分割的病灶ROI(CT 數(shù)據(jù))進行特征提取。每個ROI 提取107 個影像組學(xué)特征,由Pyradiomics 軟件包自動計算得出[14],包括一階特征、基于形狀的特征和二階特征。一階特征為基于單一像素或體素的特征;基于形狀的特征主要為腫瘤的大小和形狀,包括最大3D 長徑等;二階特征又稱紋理特征,主要包括灰度共生矩陣(gray level co-occurrence matrix,GLCM)、灰度游程矩陣(gray level run length matrix,GLRLM)、灰度大小區(qū)域矩陣(gray level size zone matrix,GLSZM)灰度相關(guān)矩陣(gray level dependence matrix,GLDM),以及鄰域灰度調(diào)差矩陣(neighboring gray tone difference matrix,NGTDM)等。
1.3.4 特征選擇 為避免模型的過擬合以及噪聲對模型表現(xiàn)的影響,采用Python 中SelectKBest 開源軟件對提取的107個影像組學(xué)特征進行特征選擇,以獲取預(yù)測CLNM的最佳影像組學(xué)特征。SelectKBest法計算107個特征中表現(xiàn)最佳的k個特征,進行分類構(gòu)建模型的受試者操作特征曲線(receiver operator characteristic curve,ROC curve)的曲線下面積(area under the curve,AUC)為評價標準,最高AUC對應(yīng)的k個特征組合稱為top(k)。
1.3.5 分類模型參數(shù)選擇 使用Python 中開源的GridSearchCV 軟件,設(shè)置交叉驗證值為5 折,對512 幀圖像的CT 數(shù)據(jù)進行隨機劃分(訓(xùn)練集∶測試集=4∶1);根據(jù)有無CLNM,用提取的107 個影像組學(xué)特征為分類模型RandomForestClassifier 中幾個重要參數(shù)選擇最佳參數(shù)值。參數(shù)及其取值范圍設(shè)置為'max_depth':(10,20…100),'max_features':('sqrt' or "auto"),'min_samples_leaf ':(1,2…10),'n_estimators':(10,20…100)。結(jié)果發(fā)現(xiàn)參數(shù)為{'max_depth':60,'max_features':'sqrt','min_samples_leaf':8,'n_estimators':20}時,模型在測試集上的AUC 最高,為0.683。這些參數(shù)及相應(yīng)的取值用于后續(xù)分類模型的構(gòu)建。
1.3.6 模型構(gòu)建 對124 例PTC 患者的平掃期、動脈期和靜脈期的CT 數(shù)據(jù)分別按訓(xùn)練集∶測試集=9∶1 隨機劃分,使用最佳分類模型參數(shù){'max_depth':60,'max_features':'sqrt','min_samples_leaf ':8,'n_estimators':20}和SelectKBest 算法獲得的top(k),根據(jù)頸部淋巴結(jié)有無轉(zhuǎn)移構(gòu)建3 期的隨機森林(random forest,RF)分類模型,并進行10 折交叉驗證,獲取每期107 個模型的10 折ROC曲線及相應(yīng)模型的top(k)值。模型優(yōu)劣的評價指標為10折ROC 曲線的平均AUC 和準確度。
使用Python 中的開源軟件包進行影像組學(xué)研究,采用SPSS 19.0 軟件進行統(tǒng)計分析。符合正態(tài)分布的定量資料用±s表示,檢驗方法為t檢驗;定性資料用頻數(shù)(百分率)表示,檢驗方法為Pearsonχ2檢驗或Fisher 精確檢驗。所有的統(tǒng)計檢驗均為雙側(cè)檢驗,P<0.05 為差異有統(tǒng)計學(xué)意義。ICC>0.75表示ROI圈選有較好的可靠性[15]。
124 例PTC 患者中,年齡為21~79 歲,平均年齡為(50.3±13.4)歲。無CLNM 69 例,有CLNM 55 例,CLNM的發(fā)生率為44.4%。PTC的最大長徑范圍為0.50~4.00 cm,平均最大長徑為[(0.998±0.567)]cm。甲狀腺周圍侵犯(P=0.004)、甲狀腺包膜侵犯(P=0.025)以及年齡≥50 歲(P=0.044)的組間差異具有統(tǒng)計學(xué)意義(表1)。
表1 PTC患者的基線及臨床特征(N=124)Tab1 Baseline and clinical information of PTC patients(N=124)
平掃期、動脈期和靜脈期的CT 圖像預(yù)測CLNM 的RF 分類模型中,最大平均AUC 對應(yīng)的10 折交叉驗證的ROC 曲線分別見圖2。平掃期107 個模型中當(dāng)top(k)為56 時,分類模型預(yù)測CLNM 的平均AUC 達到最大值(0.843),準確度0.767;動脈期107 個模型中當(dāng)top(k)為94 時,分類模型預(yù)測CLNM 的平均AUC 達到了最大值(0.775),準確度0.695;靜脈期107 個模型中當(dāng)top(k)為47 時,分類模型預(yù)測CLNM 的平均AUC 達到了最大值(0.783),準確度0.726(表2)。比較3 期的分類模型獲得的107 個平均AUC,平掃期圖像特征預(yù)測CLNM 獲得的AUC 明顯高于動脈期(P=0.000)與靜脈期(P=0.000),而動脈期與靜脈期間差異無統(tǒng)計學(xué)意義(圖3)。
圖2 PTC患者的平掃期(A)、動脈期(B)、靜脈期(C)的RF分類模型中最大平均AUC的10折ROC曲線Fig 2 10-fold ROC curve of the maximum AUC in RF classification models of the pre-contrast phase(A),arterial phase(B)and venous phase(C)of patients with PTC
表2 PTC患者CT平掃期、動脈期、靜脈期RF分類模型10折交叉驗證的結(jié)果Tab 2 Results of 10-fold cross-validation of RF classification model in pre-contrast phase,arterial phase and venous phase of patients with PTC
在124 例患者平掃期、動脈期和靜脈期3 個期相的影像組學(xué)特征中,預(yù)測性能最佳的前10 位特征見表3,表現(xiàn)最好的特征多數(shù)為紋理特征,分別屬于GLCM、GLRLM、GLSZM、GLDM、NGTDM等。
表3 PTC患者平掃期、動脈期和靜脈期RF分類模型中預(yù)測性能最佳的10個影像組學(xué)特征(N=124)Tab 3 Top 10 radiomic features in RF classification model of pre-contrast,arterial and venous phase of PTC patients(N=124)
基于邏輯回歸(logistics regression,LR)算法的影像征象中的危險因素(年齡≥50歲,甲狀腺周圍侵犯和甲狀腺包膜侵犯)建立模型的ROC 曲線,結(jié)果顯示AUC 為0.629,而平掃期影像組學(xué)特征LR 模型AUC 為0.718(P=0.011,圖4A);聯(lián)合平掃期影像組學(xué)特征、影像征象及臨床因素(≥50 歲)構(gòu)建的模型具有更好的預(yù)測能力(P=0.009,圖4B)。
圖4 PTC患者的影像組學(xué)特征、聯(lián)合特征與影像征象的預(yù)測價值比較的ROC曲線Fig 4 ROC curve for comparison of predictive value of imaging omics,associative features and imaging signs of PTC patients
臨床上對于PTC 患者的外科治療,是否必須行預(yù)防性頸部淋巴結(jié)清掃一直存在爭議[16]。頸部淋巴結(jié)的盲目清掃不僅增加了治療成本,也增加了術(shù)后感染及神經(jīng)損傷等風(fēng)險。基于傳統(tǒng)診斷模式下的US、CT、MRI術(shù)前探查CLNM 的敏感性不高,無法滿足臨床上術(shù)前治療決策的需要。多項研究[17-18]表明,基于PTC 原發(fā)灶的影像組學(xué)特征可以預(yù)測CLNM。
研究PTC的CT影像組學(xué)特征對于CLNM 預(yù)測價值的文獻不多。Lu 等[17]用支持向量機算法研究了221 例PTC患者的CT平掃期和靜脈期的影像組學(xué)特征對于CLNM 的預(yù)測,取得了較好的結(jié)果(AUC=0.759)。本研究基于RF算法研究了PTC 的CT 增強多期掃描,發(fā)現(xiàn)平掃期、動脈期和靜脈期圖像的影像組學(xué)特征都可以預(yù)測CLNM;進一步比較發(fā)現(xiàn),平掃期影像組學(xué)特征的預(yù)測性能明顯優(yōu)于動脈期和靜脈期。
腫瘤的異質(zhì)性是惡性腫瘤的重要特征,直接影響腫瘤的生長速度、侵襲能力、對藥物的敏感性以及預(yù)后[19]。腫瘤異質(zhì)性很難通過單一的方法進行描述,但可通過影像組學(xué)紋理分析進行量化研究[20]。圖像紋理分析通過定量提取肉眼無法識別的反映灰度值分布模式及變化規(guī)律的紋理特征,反映腫瘤內(nèi)潛在的異質(zhì)性[21]。紋理特征最常用來評價腫瘤的異質(zhì)性[22]。某些特定結(jié)構(gòu)的PTC 亞型易發(fā)生CLNM 是由腫瘤內(nèi)分子間異質(zhì)性或成分異質(zhì)性決定的,這些異質(zhì)性決定了腫瘤內(nèi)的灰度分布和構(gòu)成,這也解釋了雖然通過碘劑增強檢查增加了腫瘤在血流動力學(xué)方面的差異,這些差異可能會影響腫瘤的分期或其他生物學(xué)行為如甲狀腺外侵犯等評價,但同時也改變了腫瘤內(nèi)原有的紋理分布,進而影響了模型預(yù)測CLNM 的能力。
為了保證數(shù)據(jù)的可比性,在模型構(gòu)建時只使用了含有全部3 期的124 位患者的CT 數(shù)據(jù)。但在選擇模型最佳參數(shù)時,考慮到樣本數(shù)量較少,我們采用全部197例患者的512 幀圖像的CT 數(shù)據(jù)。應(yīng)用交叉驗證法評估模型泛化能力最關(guān)鍵的因素是選擇劃分訓(xùn)練集和測試集的比例,K折交叉驗證法可以使用數(shù)據(jù)集中的所有樣本進行預(yù)測,通過平均的評價指標來降低奇異的訓(xùn)練集和測試集劃分方式對預(yù)測結(jié)果的影響。研究[23-24]表明,K 值的選取對最終結(jié)果也有一定的影響,K 值越大,評估的準確性越高;而當(dāng)K 為5 或10 時,評估在準確性和計算復(fù)雜性下綜合性能最優(yōu)。因此,本研究在選擇最佳模型參數(shù)時,采用了5 折交叉驗證法,在構(gòu)建RF 分類模型時采用了10折交叉驗證法。
我們還比較了影像組學(xué)特征與醫(yī)師主觀診斷的影像征象的預(yù)測價值,結(jié)果顯示平掃期影像組學(xué)特征優(yōu)于影像征象構(gòu)建的模型;聯(lián)合平掃期影像組學(xué)特征、影像征象以及臨床因素(≥50 歲)構(gòu)建的模型具有更好的預(yù)測能力。
本研究的局限性在于:①人工圈選的ROI 腫瘤區(qū)域不可避免會存在偏差。②樣本量較少,可能會引起模型的過擬合[25-26]。③單中心研究的所有樣本來自同一批次,缺少外部驗證,模型泛化能力弱。④PTC 原發(fā)灶與CLNM 之間的映射關(guān)系只是基于統(tǒng)計學(xué)的假設(shè),并非明確的一一對應(yīng)關(guān)系。⑤直徑<5 mm 的腫瘤被排除,研究的樣本缺乏全面性。