王顯棋,羅浩然,李 可,楊 靖,敬 洋,陳 偉
1.陸軍軍醫(yī)大學(xué)第一附屬醫(yī)院放射科,重慶 400030;
2.武警四川省總隊醫(yī)院醫(yī)學(xué)影像科,四川 樂山 614000;
3.慧影醫(yī)療科技(北京)股份有限公司,北京 100089
目前肺癌仍是全球癌癥相關(guān)死亡的主要原因,非小細胞肺癌(non-small cell lung cancer,NSCLC)是其最常見的類型。根據(jù)中國國家癌癥中心發(fā)布的《2022年全國癌癥報告》,2016年度全國肺癌總體發(fā)病率和死亡率均居全國首位,其中新發(fā)病例約82.8萬,死亡病例約65.7萬,男性多于女性[1]。多數(shù)患者出現(xiàn)癥狀時已屬晚期,晚期患者的總體5年生存率不高,其預(yù)后隨腫瘤分期的不同而有顯著差異,是否發(fā)生遠處轉(zhuǎn)移對預(yù)后有重要影響[2]。早期預(yù)測發(fā)現(xiàn)NSCLC遠處轉(zhuǎn)移,有希望實現(xiàn)臨床對患者進行個體化精準(zhǔn)治療。
影像組學(xué)是近10年來快速發(fā)展的新技術(shù),影像組學(xué)采用高通量計算機技術(shù)從各種醫(yī)學(xué)影像中提取海量定量特征,將其轉(zhuǎn)換為可挖掘的數(shù)據(jù),通過機器學(xué)習(xí)方法從中提取關(guān)鍵信息,從而全面、無創(chuàng)地觀察腫瘤的時間、空間異質(zhì)性[3-5]。影像組學(xué)目前已廣泛應(yīng)用于肺癌、乳腺癌、肝癌、消化道腫瘤等,對腫瘤的預(yù)測、分型、分期及預(yù)后分析均有一定作用[6-11]。之前的研究主要集中在對腫瘤本身的影像組學(xué)特征進行分析,而對于腫瘤周圍微浸潤的影像組學(xué)特征分析相對較少。腫瘤微浸潤擴散到周圍組織是影響腫瘤復(fù)發(fā)、轉(zhuǎn)移及患者生存率的主要原因[12]。有研究[13]顯示,結(jié)合瘤周影像組學(xué)特征和腫瘤影像組學(xué)特征可提高預(yù)測肺腺癌淋巴結(jié)轉(zhuǎn)移的準(zhǔn)確度。另有研究者[14-15]利用治療前計算機體層成像(computed tomography,CT)上腫瘤周圍3 mm組織和正電子發(fā)射體層成像(positron emission tomography,PET)上腫瘤周圍組織的影像組學(xué)特征分別預(yù)測局部晚期和早期NSCLC患者的遠處轉(zhuǎn)移。瘤周影像組學(xué)特征具有潛在價值,本文主要對含瘤周影像組學(xué)特征、腫瘤影像組學(xué)特征及其分別聯(lián)合臨床特征建立的綜合模型進行對比分析,并探討其對NSCLC遠處轉(zhuǎn)移的預(yù)測價值。
回顧并分析2014—2019年陸軍軍醫(yī)大學(xué)第一附屬醫(yī)院經(jīng)病理學(xué)檢查證實為NSCLC的患者資料。納入標(biāo)準(zhǔn):① 病理學(xué)類型為NSCLC;② 治療方案為非手術(shù)治療;③ 治療前無轉(zhuǎn)移;④ 治療前1個月內(nèi)進行過胸部CT檢查[16]。排除標(biāo)準(zhǔn):① 臨床病理學(xué)隨訪資料不完整;② 合并其他系統(tǒng)腫瘤;③ CT圖像質(zhì)量不佳或腫瘤邊界無法識別。遠處轉(zhuǎn)移的定義是腫瘤轉(zhuǎn)移到胸部以外,胸部內(nèi)的轉(zhuǎn)移如肺內(nèi)轉(zhuǎn)移、胸膜轉(zhuǎn)移、心包轉(zhuǎn)移等歸為無遠處轉(zhuǎn)移組[14]。遠處轉(zhuǎn)移的時間被定義為從確診開始到第1次發(fā)現(xiàn)轉(zhuǎn)移性病變的時間;在無遠處轉(zhuǎn)移的患者中,最后1次陰性掃描的間隔時間認定為遠處轉(zhuǎn)移的時間[14,17-18]。
根據(jù)納入、排除標(biāo)準(zhǔn)最終納入140例患者,其中男性83例,女性57例;腺癌110例,鱗癌21例,其他病理學(xué)檢查無法準(zhǔn)確分型NSCLC 9例;無遠處轉(zhuǎn)移組74例,遠處轉(zhuǎn)移組66例。所有入選患者病理學(xué)檢查結(jié)果均為穿刺活檢所得,部分患者因為嚴重的心、肝、腎疾病或嚴重傳染病不能耐受手術(shù),多數(shù)患者因為疾病晚期失去手術(shù)機會,因此采取的治療措施均為非手術(shù)治療,如放化療、靶向治療、免疫治療等。本研究得到陸軍軍醫(yī)大學(xué)第一附屬醫(yī)院倫理委員會的批準(zhǔn)(批件號:KY2020216)。
采用德國Siemens公司的Sensation 16、Somatom Definition AS 64排螺旋CT機或Somatom Definition Flash雙源螺旋CT機掃描。掃描前有語音提示患者屏氣配合,以抑制呼吸運動偽影。掃描參數(shù):管電壓100~120 kV,管電流為自動設(shè)置,螺距為1.2~1.5。增強掃描采用非離子型對比劑碘海醇(含碘300 mg/mL),注射劑量80~100 mL,注射速度3.5~4.0 mL/s,于升主動脈內(nèi)取約1 cm2大小的圓形感興趣區(qū)(region of interest,ROI),對比劑開始注射10 s后進行連續(xù)軸向掃描,在實時重建圖像上當(dāng)其CT值達到觸發(fā)閾值(120 HU)后延遲5 s進行動脈期掃描,順延15~20 s進行靜脈期掃描。重建參數(shù):卷積核=I70 f,肺窗窗位-450~-600 HU,窗寬1 200~1 500 HU,層間距2 mm,層厚2 mm,部分圖像加做冠狀位、矢狀位。
將數(shù)據(jù)上傳至慧影醫(yī)療科技(北京)股份有限公司的大數(shù)據(jù)人工智能科研平臺,采用半自動的方法,在肺窗薄層圖像上勾畫出原發(fā)腫瘤的輪廓(記為tumor,圖1A),腫瘤涉及的每個層面均需要勾畫,然后均勻向外擴展10 mm[19-20],勾畫出腫瘤的微浸潤區(qū)域(記為ME),在此區(qū)域中手動排除支氣管、大血管、骨骼和縱隔等非肺組織區(qū)域[21](圖1B)。在圖像勾畫過程中,當(dāng)腫瘤邊界不容易識別時,使用增強圖像盡可能明確腫瘤邊界,但勾畫工作的完成全部在薄層肺窗圖像上進行。所有的勾畫工作由具有3年胸部CT影像學(xué)診斷經(jīng)驗的醫(yī)師完成(放射科醫(yī)師1),然后,從整個樣本中隨機選擇30例患者,由1名具有10年胸部CT影像學(xué)診斷經(jīng)驗的醫(yī)師(放射科醫(yī)師2)獨立重新分割,以評估2名醫(yī)師之間的一致性。
圖1 典型患者ROI勾畫
對于每個人工標(biāo)注的ROI(ME、tumor),使用Radcloud平臺(http://mics.radcloud.cn/#/project)提取1 409個影像組學(xué)特征。1 409個特征可分為4類:一階統(tǒng)計特征、形狀特征、紋理特征和高階統(tǒng)計特征。一階統(tǒng)計量描述了CT圖像ROI的強度信息,如均值、標(biāo)準(zhǔn)差、方差、最大值、中值等特征。形狀特征反映了區(qū)域的形狀和大小,如體積、表面積、密實度、最大直徑等特征。紋理特征可以量化區(qū)域異質(zhì)性差異。高階統(tǒng)計特征包括從原始圖像的小波變換中得到的一階統(tǒng)計特征和紋理特征,包括指數(shù)、平方、平方根、對數(shù)和小波等特征。
使用計算機生成的隨機數(shù)據(jù)集將70%的數(shù)據(jù)集分配給訓(xùn)練隊列,30%的數(shù)據(jù)集分配到驗證隊列。我們從訓(xùn)練隊列中選擇最優(yōu)特征。在進行特征選擇之前,對所有的影像組學(xué)特征進行標(biāo)準(zhǔn)化處理,去除均值,除以其標(biāo)準(zhǔn)差,將每組特征值轉(zhuǎn)換為均值為0,方差為1。當(dāng)我們比較2名放射科醫(yī)師的診斷結(jié)果時,通過計算組內(nèi)相關(guān)系數(shù)(intra-class correlation coefficient,ICC)來檢驗特征勾畫的一致性,保留了影像組學(xué)特征重現(xiàn)性較高(ICC≥0.8)的特征,刪除了不令人滿意的特征(ICC<0.8)。
雖然去掉了ICC<0.8的放射組學(xué)特征,但仍有大量特征存在,為了避免模型過擬合和多重共線性的問題,采用以下3種方法對提取的CT影像組學(xué)特征進行降維:首先,采用方差閾值法進行特征降維,ICC≥0.8的特征被篩選下來;其次,利用單變量選擇法,篩選不顯著的特征(P>0.05則刪除);最后,通過最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸,選出與遠處轉(zhuǎn)移最相關(guān)的指標(biāo),并得到這些指標(biāo)的權(quán)重。使用以下公式⑴計算每例患者的放射評分,放射評分作為影像組學(xué)特征的綜合體現(xiàn),納入后續(xù)模型構(gòu)建。
公式⑴中feature_1-n為經(jīng)過特征篩選出來的最優(yōu)特征;coefficient_1-n為對應(yīng)特征由LASSO回歸擬合得到的特征系數(shù);Intercept為LASSO回歸擬合得到的截距項。通過最優(yōu)特征的組學(xué)提取值(feature_n)和擬合得到的特征系數(shù)(cofficient_n)結(jié)合截距可以算出每例患者的放射評分。
在遠處轉(zhuǎn)移的預(yù)測中,選取與遠處轉(zhuǎn)移顯著相關(guān)的特征和臨床因素作為構(gòu)建NSCLC遠處轉(zhuǎn)移鑒別診斷模型的輸入。采用logistic回歸方法建立模型,分別包括腫瘤(tumor)影像組學(xué)模型、含瘤周(tumor+ME)影像組學(xué)模型及其分別聯(lián)合臨床特征的綜合模型。所有模型性能通過受試者工作特征(receiver operating characteristic,ROC)曲線的曲線下面積(area under curve,AUC)量化,同時構(gòu)建含瘤周(tumor+ME)影像組學(xué)聯(lián)合臨床特征綜合模型的諾模圖,并評價諾模圖的校準(zhǔn)和鑒別能力。
采用R語言軟件3.6.5對放射組學(xué)特征進行統(tǒng)計學(xué)分析。在臨床因素的有無轉(zhuǎn)移分組統(tǒng)計中,連續(xù)性變量采用正態(tài)分布檢驗和獨立t檢驗,分類變量采用χ2檢驗或Fisher精確概率檢驗。采用ROC曲線分析計算AUC、靈敏度、特異度及準(zhǔn)確度等指標(biāo),評價模型的診斷性能。采用DeLong檢驗對不同模型的診斷能力進行顯著性檢驗。P<0.05為差異有統(tǒng)計學(xué)意義。
本次研究共納入140例患者,其中男性83例,女性57例;腺癌110例,鱗癌21例,其他病理學(xué)檢查無法準(zhǔn)確分型NSCLC 9例;無轉(zhuǎn)移組74例,轉(zhuǎn)移組66例,遠處轉(zhuǎn)移多發(fā)生在腦、肝、骨、腎上腺器官,其他器官的轉(zhuǎn)移少見。將患者數(shù)據(jù)按照7∶3分成訓(xùn)練組(無轉(zhuǎn)移組vs轉(zhuǎn)移組為52例vs46例)和驗證組(無轉(zhuǎn)移組vs轉(zhuǎn)移組為22例vs20例),NSCLC遠處轉(zhuǎn)移和無遠處轉(zhuǎn)移患者的癌胚抗原(carcinoembryonic antigen,CEA)差異有統(tǒng)計學(xué)意義(P<0.05),而年齡、性別、吸煙史、神經(jīng)元特異性烯醇化酶(neuron specific enolase,NSE)、組織學(xué)亞型、T分期、N分期、M分期及臨床分期差異無統(tǒng)計學(xué)意義(P>0.05,表1)。將差異有統(tǒng)計學(xué)意義的臨床因素納入高危臨床影響因素,進入后續(xù)模型構(gòu)建。
表1 NSCLC遠處轉(zhuǎn)移和無遠處轉(zhuǎn)移患者的臨床特征n(%)
在特征提取中,從每例患者的tumor和ME上各提取1 409個定量放射組學(xué)特征,包括270個一階特征、14個形狀特征、360個灰度共生矩陣特征、210個灰度相關(guān)矩陣特征、240個灰度游程矩陣特征、75個鄰域灰度差矩陣特征和240個灰度大小區(qū)域矩陣特征。對提取的特征進行ICC,刪除ICC<0.8的特征。采用方差閾值法、單變量選擇法和LASSO對影像組學(xué)特征進行降維,在單獨的腫瘤(tumor)影像組學(xué)模型中篩選出9個組學(xué)特征,在含瘤周(tumor+ME)影像組學(xué)模型中篩選出13個組學(xué)特征。特征選擇采用的LASSO方法見圖2、3。
圖2 腫瘤(tumor)影像組學(xué)特征提取LASSO回歸圖
圖3 含瘤周(tumor+ME)影像組學(xué)特征提取LASSO回歸圖
基于篩選得到的兩個ROI的組學(xué)特征以及臨床高危因素建立多個邏輯回歸模型,分別為腫瘤(tumor)影像組學(xué)模型、含瘤周(tumor+ME)影像組學(xué)模型及其分別聯(lián)合臨床特征的綜合模型。利用含瘤周(tumor+ME)影像組學(xué)特征聯(lián)合臨床高危因素構(gòu)建多因素邏輯回歸模型,并繪制諾模圖(圖4)。結(jié)果顯示,腫瘤(tumor)影像組學(xué)模型在訓(xùn)練集中的AUC為0.779(95%CI 0.693~0.849),在驗證集中的AUC為0.648(95% CI 0.578~0.800,圖5A);腫瘤(tumor)影像組學(xué)聯(lián)合臨床模型在訓(xùn)練集中的AUC為0.795(95% CI 0.709~0.865),在驗證集中的AUC為0.674(95% CI 0.556~0.823,圖5B);含瘤周(tumor+ME)影像組學(xué)模型在訓(xùn)練集中的AUC為0.854(95% CI 0.787~0.906),在驗證集中的AUC為0.804(95% CI 0.685~0.919,圖5C);含瘤周(tumor+ME)影像組學(xué)聯(lián)合臨床綜合模型在訓(xùn)練集中的AUC為0.858(95% CI 0.793~0.908),在驗證集中的AUC為0.828(95% CI 0.720~0.939,圖5D)。多個模型結(jié)果比較見表2。結(jié)果表明,含瘤周的模型在NSCLC遠處轉(zhuǎn)移的預(yù)測中具有較好的診斷性能,同時,含瘤周(tumor+ME)影像組學(xué)特征聯(lián)合臨床高危因素的多因素邏輯回歸模型在NSCLC遠處轉(zhuǎn)移的預(yù)測中具有最優(yōu)的診斷性能。含瘤周(tumor+ME)影像組學(xué)聯(lián)合臨床綜合模型與其他3個模型的DeLong檢驗結(jié)果如表3所示,檢驗結(jié)果顯示,含瘤周的模型與不含瘤周的模型在訓(xùn)練集和驗證集上差異均有統(tǒng)計學(xué)意義(P<0.0 5),這進一步說明了含瘤周(tumor+ME)影像組學(xué)模型可以提高NSCLC遠處轉(zhuǎn)移的預(yù)測能力。
表2 多個模型分析結(jié)果比較
表3 多個模型診斷能力顯著性檢驗結(jié)果
圖4 多因素邏輯回歸構(gòu)建的諾模圖
圖5 4個邏輯回歸模型的ROC曲線
對模型繪制校準(zhǔn)曲線,校準(zhǔn)曲線可以反映模型的預(yù)測結(jié)果與實際結(jié)果的具體情況。本研究校準(zhǔn)曲線(圖6)表明模型用于預(yù)測NSCLC遠處轉(zhuǎn)移與臨床實際符合度高,準(zhǔn)確度及可靠性較好。
圖6 預(yù)測模型的校準(zhǔn)曲線
影像組學(xué)是一種利用醫(yī)學(xué)圖像分析和數(shù)據(jù)挖掘方法的新型非侵入性技術(shù),近年來已被應(yīng)用于癌癥診治領(lǐng)域。通過高通量提取量化特征的方法,提供肉眼無法辨識的圖像信息,將圖像信息轉(zhuǎn)換為可挖掘的數(shù)據(jù),然后對數(shù)據(jù)進行分析,與患者臨床信息相結(jié)合,建立可能提高診斷、預(yù)測和預(yù)后分析準(zhǔn)確度的模型,助力臨床的個性化精準(zhǔn)醫(yī)療[22-24]。
目前影像組學(xué)在胸部疾病的診斷中應(yīng)用廣泛,從肺結(jié)節(jié)的良惡性判斷,到肺癌的分型、分期、基因表達均有相關(guān)研究[25-27],但這些研究基本都是針對腫瘤原發(fā)病灶進行分析,對于腫瘤周圍的微浸潤研究甚少。有學(xué)者[14]定義了腫瘤邊緣與腫瘤外部的肺組織,通過原發(fā)腫瘤邊緣向內(nèi)外均擴張3 mm構(gòu)成的區(qū)域定義為腫瘤邊緣,而腫瘤外部定義為原發(fā)腫瘤邊緣3~9 mm的區(qū)域。Wang等[21]通過提取肺腺癌周圍15 mm肺組織的影像組學(xué)特征來預(yù)測T1期肺腺癌的淋巴結(jié)轉(zhuǎn)移。而有研究[28]根據(jù)臨床安全的手術(shù)切緣為距腫瘤組織20 mm,提取包含腫瘤周圍20 mm肺組織的影像組學(xué)特征預(yù)測NSCLC術(shù)后復(fù)發(fā)風(fēng)險。Wu等[29]通過分別勾畫腫瘤邊緣5、10、15 mm來檢驗瘤周影像組學(xué)特征對小于2 cm肺部實性結(jié)節(jié)惡性程度的預(yù)測能力。這些研究都證實隨著腫瘤邊緣外擴距離的增大,模型的預(yù)測效能會降低,這可能是由于越往外包含的正常肺組織越多。Grills等[20]為了盡可能地覆蓋病理學(xué)上的腫瘤體積,而又減少對正常肺組織的傷害,研究了影像學(xué)上可見的腫瘤大小與病理學(xué)微浸潤之間的關(guān)系,他們認為在90%的情況下,覆蓋病理學(xué)微浸潤所需要的距離為9 mm。所以本文在對腫瘤周圍微浸潤的研究中,提取的是原發(fā)腫瘤邊緣向外擴展10 mm的影像組學(xué)特征。
癌癥生物學(xué)研究為腫瘤如何通過與周圍正常組織的相互作用而擴散提供了新的見解,腫瘤侵襲周圍正常組織的細胞可以轉(zhuǎn)化為組織形態(tài)的變化,這反過來可能告訴我們轉(zhuǎn)移活動的水平[30-32]。腫瘤周邊有多種腫瘤侵襲和轉(zhuǎn)移活動,如上皮-間質(zhì)轉(zhuǎn)化[33]、腫瘤相關(guān)巨噬細胞[34]和血管淋巴管侵犯[35]等,這些活動具有重要的生物學(xué)意義,腫瘤周圍微環(huán)境的改變對臨床評估腫瘤侵襲性生物學(xué)行為具有一定的價值[36-37]。然而,這些改變在目前常規(guī)CT圖像上只能觀察到極少一部分,如腫瘤周圍毛刺、血管增生等,這些征象對于腫瘤周圍微浸潤的識別及預(yù)警作用有限,傳統(tǒng)的影像學(xué)方法觀察到的腫瘤周圍的正常肺組織,由于腫瘤的侵襲性生物學(xué)行為,可能已經(jīng)受到腫瘤細胞的浸潤[19-20]。因此,在分析腫瘤本身的影像組學(xué)特征的基礎(chǔ)上,本研究著重關(guān)注了瘤周影像組學(xué)特征的診斷價值。
本研究結(jié)果表明,含瘤周(tumor+ME)影像組學(xué)特征相對腫瘤(tumor)影像組學(xué)特征而言,明顯提高了對NSCLC遠處轉(zhuǎn)移的預(yù)測能力,而當(dāng)兩種模型分別聯(lián)合臨床高危因素后,其預(yù)測效能分別高于單純影像組學(xué)模型。關(guān)于局部晚期NSCLC遠處轉(zhuǎn)移的預(yù)測,有研究[14]定義了腫瘤邊緣與腫瘤外部的肺組織,通過原發(fā)腫瘤邊緣向內(nèi)外均擴張3 mm構(gòu)成的區(qū)域定義為腫瘤邊緣,而腫瘤外部定義為原發(fā)腫瘤邊緣3~9 mm的區(qū)域,研究結(jié)果證實腫瘤邊緣影像組學(xué)聯(lián)合臨床特征模型預(yù)測效能高于腫瘤外部影像組學(xué)聯(lián)合臨床特征模型,說明越往外其腫瘤微浸潤的趨勢越弱。也有學(xué)者[27]利用瘤周影像組學(xué)研究了NSCLC的組織學(xué)分型,得到了含瘤周影像組學(xué)的預(yù)測效能明顯高于腫瘤本身的結(jié)論。Wang等[21]通過比較腫瘤及瘤周(腫瘤外擴15 mm)肺組織的影像組學(xué)特征來預(yù)測T1期肺腺癌的淋巴結(jié)轉(zhuǎn)移,證實瘤周影像組學(xué)特征聯(lián)合臨床參數(shù)的綜合特征預(yù)測效能更好。這些研究都證實了腫瘤周圍影像組學(xué)特征的潛在作用,對腫瘤周圍微浸潤提供了一種可能的預(yù)測指標(biāo)。本研究結(jié)果證明了腫瘤周圍微浸潤與NSCLC患者的遠處轉(zhuǎn)移有一定的關(guān)系,含瘤周影像組學(xué)特征有可能是一種無創(chuàng)的獨立預(yù)測因子。這一研究成果有望輔助臨床對NSCLC患者的治療、隨訪及預(yù)后分析,幫助臨床實現(xiàn)患者的個體化精準(zhǔn)醫(yī)療。
本研究存在一定的局限性:首先,作為回顧性研究存在選擇偏倚;其次,本研究的數(shù)據(jù)量偏少;最后,我們的樣本數(shù)據(jù)都來自單中心醫(yī)療機構(gòu),對模型的泛化性有一定的影響。在以后的科研工作中,需要開展前瞻性、大樣本、多中心的研究,以提高模型的準(zhǔn)確度及泛化性。
總之,本研究結(jié)果證實影像組學(xué)模型對于NSCLC患者遠處轉(zhuǎn)移有一定的預(yù)測作用,并且含瘤周(tumor+ME)影像組學(xué)特征模型明顯優(yōu)于腫瘤(tumor)影像組學(xué)特征模型。本研究將引起臨床醫(yī)師對腫瘤微浸潤的重視,含瘤周影像組學(xué)特征有望成為NSCLC患者遠處轉(zhuǎn)移的早期無創(chuàng)性預(yù)測指標(biāo),對NSCLC患者的預(yù)后預(yù)測、臨床治療有一定的參考意義。