胡栩晟 郭藝帆 李魯 陳曉珺*
2021 年WHO 對(duì)肺腺癌進(jìn)行重新分類,取消了2015 年浸潤(rùn)前病變和浸潤(rùn)性病變的概念,將不典型腺瘤增生(atypical adenoma hyperplasia,AAH)、原位腺癌(adenocarcinoma in situ,AIS)歸類為腺體前驅(qū)病變,腺癌則包括微浸潤(rùn)腺癌(minimally invasive adenocarcinoma,MIA)和侵襲性腺癌(invasive adenocarcinoma,IAC)[1]。MIA 病理表現(xiàn)為腫瘤組織穿透基底膜,浸潤(rùn)纖維間質(zhì),腫瘤細(xì)胞分層表現(xiàn)[2-4],應(yīng)歸為肺腺癌。臨床實(shí)踐中,通過肺結(jié)節(jié)超高分辨率CT(ultra high resolution computed tomography,UHRCT)靶掃描能夠細(xì)致觀察磨玻璃結(jié)節(jié)(ground-glass nodule,GGN)結(jié)節(jié)外觀形態(tài)特征,進(jìn)而診斷肺結(jié)節(jié)良惡性。該檢查技術(shù)具有小視野、多矩陣、小間距等特點(diǎn)[5],但目前在獨(dú)立鑒別AIS 和MIA 中的價(jià)值有限[6]。影像組學(xué)可定量分析并提取醫(yī)學(xué)圖像中肉眼無法識(shí)別的潛在定量特征,通過機(jī)器學(xué)習(xí)方法構(gòu)建相關(guān)預(yù)測(cè)模型以達(dá)到疾病診斷、療效或預(yù)后預(yù)測(cè)等目的[7]。在本研究基于肺結(jié)節(jié)UHRCT 靶掃描,從GGN中提取影像組學(xué)特征,構(gòu)建Logistic 回歸(LR)和支持向量機(jī)(SVM)模型用于鑒別AIS 和MIA。
1.1 臨床資料 回顧性分析2018 年1~12 月198 例經(jīng)手術(shù)治療并病理證實(shí)為AIS 或MIA 的GGN 患者。納入標(biāo)準(zhǔn):①胸部CT 發(fā)現(xiàn)孤立性GGN(包括純GGN 和部分實(shí)性結(jié)節(jié)),并接受肺結(jié)節(jié)UHRCT 靶掃描;②術(shù)前無化療、放療或遠(yuǎn)處轉(zhuǎn)移;③無其他惡性腫瘤病史;④肺結(jié)節(jié)UHRCT 靶掃描DICOM 格式數(shù)據(jù)完整。排除標(biāo)準(zhǔn):①同一肺葉存在多個(gè)GGN;②GGN 伴有空洞或?qū)嵭越Y(jié)節(jié);③CT 檢查前行肺惡性腫瘤活檢;④肺結(jié)節(jié)UHRCT 靶掃描圖像中存在呼吸運(yùn)動(dòng)偽影。根據(jù)分層抽樣,以7 ∶3 將所有患者劃分為訓(xùn)練組和驗(yàn)證組。
1.2 圖像采集 應(yīng)用飛利浦Brilliance 64 CT 機(jī)進(jìn)行肺結(jié)節(jié)UHRCT 靶掃描成像。患者取仰臥位,掃描時(shí)保持深吸氣。掃描參數(shù)如下:探測(cè)器準(zhǔn)直0.625 mm×6 mm;螺距0.64;管電壓120 kV;管電流300 mA;重建層厚、層間距均為0.67 mm;FOV 250 mm;矩陣=1,024×1,024;重構(gòu)卷積函數(shù)為A。
1.3 GGN 標(biāo)注 GGN 感興趣區(qū)域(ROI)分割在ITKSNAP 3.6.0(www.itksnap.org)上完成。在軸位圖像上,沿著GGN 的輪廓進(jìn)行手動(dòng)描繪(見圖1),最終獲得整個(gè)GGN 的3D-ROI。由1 名具有5 年胸部CT 診斷經(jīng)驗(yàn)的放射科醫(yī)師經(jīng)培訓(xùn)后完成所有GGN 的ROI 標(biāo)注。在1 個(gè)月后,由上述醫(yī)師和另一名具有10 年胸部CT 診斷經(jīng)驗(yàn)的放射科醫(yī)師再次對(duì)所有患者進(jìn)行標(biāo)注,用于評(píng)估觀察者內(nèi)和觀察者間的一致性。若影像組學(xué)特征的組內(nèi)和組間相關(guān)系數(shù)(ICC)均>0.75 則認(rèn)為具有較好的可信度。
圖1 肺結(jié)節(jié)勾畫示意圖
1.4 影像組學(xué)特征提取 將GGN 的CT 圖像和相應(yīng)標(biāo)注導(dǎo)入AK 軟件(Analysis Kit,GE Healthcare,US)進(jìn)行特征提取,可分為以下幾大類:一階特征,形狀特征,灰度共生矩降,灰度尺寸區(qū)域矩陣,灰度游程度矩陣,鄰域灰度差矩陣,灰度相關(guān)矩陣。見PyRadiomics文檔(http://pyradiomics.readthedocs.io)。
1.5 特征選擇和模型構(gòu)建 篩選出組內(nèi)和組間ICC 均> 0.75 的影像組學(xué)特征。采用最小冗余度和最大相關(guān)性(mRMR)算法對(duì)這些特征進(jìn)行排序,獲取相關(guān)度最高的前20 個(gè)特征。采用套索(LASSO)算法進(jìn)一步篩選剩余影像組學(xué)特征。采用LR 和SVM 從中選擇與分類結(jié)果最相關(guān)的特征并計(jì)算相應(yīng)的系數(shù),構(gòu)建用以鑒別AIS和MIA 的機(jī)器學(xué)習(xí)模型。
1.6 統(tǒng)計(jì)學(xué)分析 采用R 軟件(版本3.5.0)。計(jì)量資料以(±s)表示,用Mann-Whitney U 檢驗(yàn),計(jì)數(shù)資料以n(%)表示,用χ2檢驗(yàn)。對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行受試者操作特征(ROC)分析,并計(jì)算曲線下面積(AUC)?;赮ouden 指數(shù)計(jì)算模型的準(zhǔn)確性、敏感性、特異性、陽性預(yù)測(cè)值(PPV)和陰性預(yù)測(cè)值(NPV)。P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
2.1 一般資料 見表1。
表1 患者一般資料
2.2 影像學(xué)特征選擇和機(jī)器學(xué)習(xí)模型構(gòu)建 采用AK軟件從GGN 的ROI 中提取396 個(gè)影像組學(xué)特征。組內(nèi)ICC>0.75 的影像組學(xué)特征有295,在此基礎(chǔ)上組間ICC>0.75 的特征有204 個(gè)。經(jīng)mRMR 和LASSO 進(jìn)行特征降維后,分別用采LR 和SVM 從中選出與分類對(duì)象最相關(guān)的特征集以構(gòu)建模型。篩選用于構(gòu)建模型的影像組學(xué)特征列見圖2。
圖2 Logistic回歸(A)和支持向量機(jī)(B)構(gòu)建影像組學(xué)模型的特征及相應(yīng)系數(shù)
2.3 機(jī)器學(xué)習(xí)模型的鑒別能力分析 在訓(xùn)練組中,LR模型的AUC 為0.787(95%CI:0.712~0.863),SVM 模型的AUC 為0.896(95%CI:0.842~0.951);在驗(yàn)證組中,LR 模型的AUC 為0.824(95%CI:0.713~0.936),SVM 模型的AUC 為0.839(95%CI:0.734~0.945)。見表2、圖3。
表2 訓(xùn)練組和驗(yàn)證組機(jī)器學(xué)習(xí)模型的鑒別能力
圖3 訓(xùn)練組(A)和驗(yàn)證組(B)中LR和SVM模型的ROC曲線
在早期肺腺癌研究領(lǐng)域中,較多研究者聚焦于區(qū)分IAC、AIS 和MIA,部分研究將AIS 和MIA 歸為一類[8]。事實(shí)上,區(qū)分AIS 與MIA 在臨床上具有重要意義。AIS 尚不具有侵襲性,規(guī)律的定期隨訪不會(huì)降低患者的生存率。一項(xiàng)前瞻性觀察研究發(fā)現(xiàn),純玻璃結(jié)節(jié)或混合磨玻璃結(jié)節(jié)的ⅠA 期肺癌的生存率明顯高于實(shí)性結(jié)節(jié),且不管磨玻璃結(jié)節(jié)中實(shí)性成分的比例,其5 年生存率較高[9]。故此類患者可避免手術(shù)帶來的潛在傷害。MIA 則已穿透基底膜,浸潤(rùn)纖維間質(zhì),需要手術(shù)治療避免進(jìn)一步發(fā)展為IAC。本研究基于肺結(jié)節(jié)UHRCT 靶掃描,影像組學(xué)結(jié)合兩種常用的機(jī)器學(xué)習(xí)方法(LR 和SVM)鑒別AIS 和MIA。將精密掃描技術(shù)與高通量定量特征相結(jié)合,有助于早期腫瘤侵襲性的識(shí)別、AIS 與MIA 的鑒別,輔助臨床醫(yī)師制定個(gè)體化臨床決策。
既往研究大多集中在GGN 的形態(tài)學(xué)上進(jìn)行定性分析,如腫瘤直徑、分葉征、毛刺征、空泡征、血管集束征、胸膜凹陷征、空洞征等[10-12]。然而,不同分化程度的腫瘤在形態(tài)學(xué)上常表現(xiàn)為征象重疊,不具備較高的特異性。影像組學(xué)是一種可以客觀挖掘復(fù)雜生物信息學(xué)的潛在工具,可改善診斷、療效和預(yù)后的準(zhǔn)確性,從而促進(jìn)更好臨床決策。目前,影像組學(xué)常用于鑒別肺結(jié)節(jié)的浸潤(rùn)程度,而不根據(jù)肺腺癌的病理學(xué)分類進(jìn)行分組[13-14]。另外,基于病理學(xué)分類的影像組學(xué)研究又大多是基于常規(guī)胸部CT 檢查。WU 等[15]收集121 例病理證實(shí)的肺腺癌GGN,分析在HRCT 圖像上從結(jié)節(jié)內(nèi)和結(jié)節(jié)周圍提取的影像組學(xué)特征是否能夠有效鑒別IA、MIA 和AIS。
在基于胸部CT 影像組學(xué)特征的LR 和SVM 模型中,本研究發(fā)現(xiàn)某些特征在鑒別AIS 和MIA 的能力方面表現(xiàn)出色。可以明顯觀察到紋理特征如ClusterProminence、GLCMEntropy 和GLCMEnergy 在兩種模型中均被賦予重要性,提示這些特征可能對(duì)揭示AIS與MIA 之間微小差異具有關(guān)鍵意義。此外,像素強(qiáng)度特征(如Range 和MaxIntensity)以及圖像結(jié)構(gòu)性特征(如SurfaceVolumeRatio、VolumeMM 和SurfaceArea)也被證明對(duì)區(qū)分AIS 與MIA 過程至關(guān)重要。這些發(fā)現(xiàn)突顯了紋理、像素強(qiáng)度和圖像結(jié)構(gòu)特征在區(qū)分AIS 與MIA時(shí)的重要性,且這些影像組學(xué)特征可能為提供關(guān)于AIS和MIA 之間微觀差異以及宏觀差異的信息,深入探究這些特征所代表的病理生理學(xué)意義有助于準(zhǔn)確診斷。
由于UHRCT 采用的矩陣為1024×1024,故其圖像分辨率較高,單位面積有效像素是普通CT 的4 倍左右[16]。此外,目標(biāo)掃描采用小視場(chǎng)、高矩陣、小間距技術(shù),顯著提高圖像的空間分辨率,有助于顯示肺小結(jié)節(jié)更多的影像特征。因此,相比常規(guī)CT,UHRCT 單個(gè)體素內(nèi)包含的組織病理學(xué)信息更細(xì)致化,或有助于提高影像組學(xué)模型的預(yù)測(cè)性能。本研究結(jié)果提示基于肺結(jié)節(jié)UHRCT 靶掃描的兩種機(jī)器學(xué)習(xí)模型均能較好鑒別AIS和MIA 這兩種相近病理亞型。
綜上,基于肺結(jié)節(jié)UHRCT 靶掃描,從GGN 中提取影像組學(xué)特征構(gòu)建LR和SVM模型能較好鑒別AIS和MIA,為GGN 的臨床決策提供一種潛在的無創(chuàng)性方法。