黃鈺迅,李瑞,張寶騰,牛猛,劉釗,郭順林
胃癌是全球癌癥死亡的主要原因之一,是僅次于結直腸癌的消化道第二大常見腫瘤[1]。早期胃癌癥狀不明顯,大多數患者在就診時已為進展期。外科手術是胃癌主要的治療方式,但預后較差,在我國,約42.5%的患者在根治性切除術后兩年內復發(fā)[2],腫瘤復發(fā)已成為胃癌患者主要的死亡原因[3]。一系列研究表明周圍神經侵犯(perineural invasion,PNI)與進展期胃癌(advanced gastric cancer,AGC)的復發(fā)和不良預后有關[4-6]。PNI是指腫瘤周圍的神經束膜或神經束被癌細胞侵襲的過程,是腫瘤發(fā)生轉移的途徑之一[7],只能在術中和術后進行評估。若能術前無創(chuàng)性預測PNI,經術中擴大手術切除及淋巴結清掃范圍(包括腹主動脈旁淋巴結清掃)以及術前、術后使用5-氟尿嘧啶聯合順鉑輔助化療(FP方案),可有效改善AGC患者的預后[8-9]。目前,還沒有結合臨床和影像組學特征的列線圖模型對AGC患者進行術前預測PNI的相關報道。本文擬探討基于增強CT影像組學特征和臨床獨立危險因素構建的列線圖模型術前預測AGC患者發(fā)生PNI的價值,旨在優(yōu)化術前決策,改善AGC患者的預后。
搜集2018年6月-2021年8月本院收治的符合本研究要求的171例AGC患者的病例資料。納入標準:①術前行腹部增強CT檢查;②行胃癌根治性切除術,術后病理確診為AGC且伴有PNI;③臨床資料完整。排除標準:①術前已接受過AGC相關治療;②CT圖像質量較差或病灶太小,影響ROI的勾畫;③有其它腫瘤病史。按7∶3的比例將所有病例隨機分為訓練集(119例)和驗證集(52例),訓練集的數據用于構建模型,驗證集的數據用于驗證模型。
記錄患者的術前臨床資料,包括年齡、性別、血清白蛋白、中性粒細胞與淋巴細胞比值(NLR)、糖類抗原19-9(carbohydrate antigen 19-9,CA19-9)和癌胚抗原(carcinoembryonic antigen,CEA)、病理結果、以及CT報告的T、N分期、腫瘤最大徑和腫瘤部位。病理檢查是由兩位資深的病理科醫(yī)師對所有標本的HE染色和S-100染色切片進行分析,S-100染色陽性判斷為PNI陽性[10]。S-100染色陽性是指在顯微鏡下,細胞質和細胞核的抗原位點出現黃色或棕黃色著色。
使用Siemens Somatom go.Top 64排螺旋CT機。掃描參數:120 kV,110 mAs,層厚1.0 mm,矩陣512×512,視野350 mm×350 mm,球管旋轉一周時間0.5 s,螺距0.8。掃描前經肘靜脈注射碘佛醇(320 mg I/mL),注射流率2.5~3.5 mL/s,劑量1.0 mL/kg,于注射后60 s行靜脈期增強掃描。
勾畫ROI和提取影像組學特征:使用ITK-SNAP3.8.0軟件,由兩位資深放射科醫(yī)師獨立在每例患者的橫軸面靜脈期CT圖像上沿著腫瘤邊緣逐層勾畫ROI,避開肉眼可見的壞死區(qū)和血管,軟件自動生成病灶全容積ROI(volume of interest,VOI)的三維圖像(圖1)。然后將VOIs導入3D-Slicer 4.10.2軟件,提取直方圖、形態(tài)、灰度相關矩陣(gray level dependence matrix,GLDM)、灰度共生矩陣(gray level co-occurrence matrix,GLCM)、灰度游程矩陣(gray level run length matrix,GLRLM)、灰度大小區(qū)域矩陣(gray level size zone matrix,GLSZM)和鄰域灰度差矩陣(neighbouring gray tone difference matrix,NGTDM)參數共1037個影像組學特征。使用 Z-scores[=(x-μ)/σ;其中x表示特征值,μ表示所有患者該特征值的平均值,σ表示對應的標準差]對所有特征進行歸一化處理,采用組內相關系數(interclass correlation coefficient,ICC)評價基于2位醫(yī)師勾畫ROI所提取的各項影像組學特征的一致性,并選取ICC大于0.75的特征用于后續(xù)分析[11-12]。
圖1 腫瘤ROI勾畫示意圖。a)橫軸面圖像;b)矢狀面重組圖像;c)冠狀面重組圖像;d)病灶分割后獲得的VOI三維圖像。ROI勾畫主要在橫軸面上進行,矢狀面及冠狀面重組圖像供參考和調整使用。當病灶邊界及其范圍不太確定時,需要多個方位觀察病灶,進行綜合判定,此時可以參考其它2個方位的圖像,對所畫ROI進行調整。此處勾畫ROI用到的軟件ITK-SNAP,在橫軸位勾畫ROI后,會自動把其它兩個方位圖像的ROI也顯示出來。
依次使用Spearman相關性分析(系數ρ為0.9)和最小絕對收縮與選擇算子(least absolute shrinkage and selection operator,LASSO)進行特征降維,篩選出最具預測價值的影像組學特征,然后將篩選出的特征納入多因素logistic回歸并構建影像組學模型(V)。然后根據各項特征的回歸系數,計算每個患者的影像組學標簽(Radscore)值,計算公式為:
(1)
其中αi表示回歸系數, Xi表示特征值,β表示截距。
對納入的臨床資料先后進行單因素和多因素logistic回歸分析,將篩選出的臨床獨立危險因素構建臨床預測模型(C),然后結合V-Radscore來構建組合模型(V+C),并構建列線圖。然后將驗證集數據代入列線圖模型進行驗證。
使用SPSS 25.0軟件進行統計分析,以P<0.05為差異具有統計學意義。分類變量和不符合正態(tài)分布的連續(xù)變量分別用數量(百分比)和M(Q1~Q3)表示,組間比較分別采用χ2檢驗和Mann-WhitneyU檢驗。使用Hosmer-Lemeshow檢驗和校準曲線評估列線圖模型的擬合程度,采用ROC曲線下面積(AUC)和決策曲線分析(decision curve analysis,DCA)衡量模型的鑒別效能和臨床應用價值,利用DeLong檢驗進行各模型間AUC差異的比較。
PNI組和無PNI組患者各項臨床資料的單因素分析結果見表1。
表1 患者臨床資料單因素分析結果
圖2 LASSO回歸的變量解析路徑圖。每條線代表一個變量,圖片上方的數字是剩余非零系數變量的個數。圖3十折交叉驗證圖。圖中紅點及所在線段上下端之間分別表示每個log(λ)值對應的二項式偏差的均值及其范圍,黑色實線對應的log(λ)值為通過十折交叉驗證確定的最優(yōu)懲罰系數(-2.59),對應的變量數為8個。 圖4影像組學標簽值直方圖,顯示2個數據集中,PNI組的Radscore值顯著高于無PNI組。a)訓練集;b)驗證集。
腫瘤最大徑、NLR、腫瘤部位、T分期及N分期在兩組間的差異均有統計學意義(P<0.05),而的年齡、性別及術前白蛋白、CEA和CA199水平的組間差異均無統計學意義(P>0.05)。
基于每位醫(yī)師在增強CT靜脈期圖像病灶得到的VOIs,共提取了1037個影像組學特征。對兩位醫(yī)師勾畫ROI獲得的組學特征進行一致性分析,結果顯示一致性均較好,ICC值的中位數為0.861(95%CI:0.758~0.920)。對ICC值>0.75的927個組學特征進行篩選和降維(圖2~3),最終篩選出8個最佳組學特征。
將這8個特征納入多因素logistic回歸分析并構建組學模型,得到回歸方程的截距和特征對應的回歸系數,截距為1.2795,特征對應的系數見表2。同時根據構建的影像組學模型,計算每例患者的V-Radscore值,詳見圖4。無論是在訓練集還是驗證集中,PNI組的Radscore值[1.53(0.72,2.48);1.74(0.64,3.44)]均高于無PNI組[0.16(-0.70,0.97);1.02(0.06,1.35)],差異均有統計學意義(Z=5.328,P<0.001;Z=2.030,P<0.05)。
表2 篩選出的8個組學特征的回歸分析結果
然后,將P<0.05的臨床指標和V-Radscore納入多因素logistic回歸分析,結果見圖5。各項臨床指標中僅CT報告的T、N分期和腫瘤部位是PNI的獨立危險因素(P<0.05);此外,V-Radscore也是PNI的獨立危險因素。獲得的臨床預測模型(C)和聯合模型(C+V)的表達式:
(2)
(3)
其中,a=0.830×site2+1.452×site3+1.622×T3+2.203×T4+1.022×N1-1.883;b=0.561×site2+1.108×site3+1.669×T3+1.855×T4+1.259×N1+0.769×Radscore-2.611(公式中site代表腫瘤部位,site1代表胃下部,site2代表胃中部,site3代表胃上部;N1~N3分期的分值相應為1~3,T1~T4分期的分值相應為1~4)。隨即,根據C+V公式中各變量的權重系數,繪制聯合模型的列線圖(圖6)。
采用ROC曲線分析臨床、影像組學模型和列線圖模型在訓練集和驗證集中預測PNI的效能,結果見表3和圖7。三個模型中,列線圖模型在訓練集和驗證集中都具有最大的AUC(0.881、0.865)。DeLong檢驗顯示,列線圖模型與臨床、影像組學模型之間AUC的差異均具有統計學意義(訓練集:P值分別為0.003和0.026;驗證集:P值分別為0.035和0.037),表明列線圖模型為最佳預測模型,診斷效能最高。
表3 各個模型預測效能指標值
采用Hosmer-Lemeshow檢驗評估列線圖模型的診斷效能,結果顯示列線圖模型擬合良好,在訓練集和驗證集中的卡方值分別為5.846(P=0.664)和8.170(P=0.417)。繪制列線圖模型在訓練集和驗證集中的校準曲線(圖8)。在訓練集和驗證集中,列線圖的理論校準曲線和實際校準曲線與參考線基本重合,表明預測概率與實際概率一致性良好。
圖5 多因素logistic回歸分析森林圖,OR為比值比。 圖6基于臨床特征和V-Radscore構建的術前預測進展期胃癌PNI的列線圖。計算方法:將每個變量對應的值垂直投射到最上方的評分標尺(Points),可得到一個評分值,把所有指標的評分值相加得到的總分投射到總評分標尺(Total Points),最后定位到概率(Possibility)軸,得到的值即為存在PNI的概率。
圖7各模型的ROC曲線,2個數據集中均以聯合模型的AUC值最大。a)訓練集;b)驗證集。 圖8列線圖模型的校準曲線。縱軸為實際存在PNI的概率,橫軸為列線圖模型預測存在PNI的概率。Apparent指理論校準曲線,Bias-corrected指實際校準曲線,Ideal指參考線,理論校準曲線和實際校準曲線越接近參考線說明列線圖的預測結果與實際結果的一致性就越好。a)訓練集中,理論校準曲線和實際校準曲線與參考線基本重合,表明列線圖的預測概率與實際概率一致性良好;b)驗證集中,理論校準曲線和實際校準曲線與參考線基本重合,表明列線圖的預測概率與實際概率一致性良好。 圖9三個模型術前預測PNI的DCA曲線。橫坐標為閾值概率,縱坐標為凈效益。橫線為所有患者均不干預,凈效益為0;灰線為所有患者均進行干預,凈效益為斜率為負值的反斜線。圖中顯示在大部分的閾值概率范圍內,列線圖模型比臨床模型和影像組學模型具有更高的凈效益。
采用DCA方法評估3個模型的臨床價值。與臨床和影像組學模型相比,列線圖模型在大部分閾值概率范圍內凈獲益最高(圖9),表明其臨床應用價值最大。
近年來有研究顯示PNI是胃癌潛在的轉移方式[6-7],與胃癌的生物學行為密切相關,且被證實為胃癌術后復發(fā)和預后的獨立危險因素[13-14]。既往研究多探討PNI對胃癌預后的影響,而關于PNI術前預測的報道較少[15-16],本研究構建了臨床與影像組學特征相結合、用于術前預測PNI的列線圖模型,該模型基于患者的術前資料,具有較好的臨床應用普適性。
在模型納入的臨床獨立危險因素中,PNI的發(fā)生與腫瘤部位有顯著相關性(P=0.045),可能是由于胃靠近腹腔神經叢的原因,其中胃上部腫瘤發(fā)生PNI的風險最大(OR=3.788),與既往研究結果基本一致[17];在CT報告的T分期中,PNI陽性率從T2期的25.81%增加到了T3和T4期的76.92%和82.67%,表明PNI與腫瘤浸潤深度之間也存在顯著相關性(P=0.012),這可能是因為腫瘤浸潤深度越深,越容易侵犯腹腔神經叢;此外,CT報告的N分期方面,N1~N3期患者的PNI陽性率顯著高于N0期(P=0.019),Yang等[18]的研究也表明T、N分期與胃癌PNI關系密切。因此對于浸潤深度較大、有淋巴結轉移且位于胃上部的胃癌患者,可在圍手術期行FP化療方案,術中擴大切除及淋巴結清掃范圍,術后密切隨訪,可提高生存率。本研究中PNI的發(fā)生與腫瘤最大徑無顯著相關性(P=0.902),與De等[19]的研究結果不同,可能與樣本量較少或本組病例中腫瘤最大徑較小[(4.84±2.12)cm]有關。
本研究中列線圖模型納入的靜脈期影像組學標簽與PNI陽性密切相關(P<0.001)。為避免多重共線性及過擬合等問題,本研究中采用LASSO回歸共篩選出延伸率等共8個特征。延伸率顯示ROI形狀中兩個最大主成分之間的關系;平坦度顯示ROI形狀中最大和最小主成分之間的關系,它們與腫瘤浸潤深度密切相關;高灰度依賴程度衡量圖像中灰度值的相關性和聯合分布,可表現腫瘤在多尺度上的空間異質性[20];偏度可度量直方圖關于均值的不對稱程度;最大值指最大灰度強度,用于描述ROI內體素強度的分布[21];相關信息測度1評估兩目標體素概率分布之間的相關性,可量化紋理的復雜性;最大概率指聯合出現的一對最大相鄰灰度的強度值,它們可衡量腫瘤區(qū)域間的異質性差異[22]。
目前,構建列線圖模型進行胃癌術前PNI預測的報道較少。Liu等[15]報道患者術前體質指數、IgA水平以及CT報告的T、N分期是胃癌PNI的獨立預測因子,但該研究中沒有納入影像組學特征進行綜合分析。劉等[16]納入Lauren分型和淋巴結轉移情況等指標建立的列線圖模型能較好地在術前預測胃癌PNI,然而胃癌的Lauren分型為胃鏡檢查結果,胃鏡檢查不僅有創(chuàng),且由于活檢點較局限易導致分型結果不準確; Yardmc等[8]使用基于CT紋理分析的機器學習方法進行PNI預測,但結果并不理想(AUC的95%CI為0.482~0.754),且他們采用的是二維圖像分割。有研究表明VOIs能更全面地反映腫瘤內部的異質性[23]。另外有研究者將多期動態(tài)增強CT測量的病灶定量參數用于PNI術前預測,雖有較好的診斷效能,但其樣本量(48例)較小,易導致結果出現假陽性[24]。針對以上不足,本研究納入了171例病例,對腫瘤采用三維分割方法,將臨床和影像組學特征相結合構建列線圖模型,具有良好的診斷效能,有望輔助臨床醫(yī)師優(yōu)化術前決策。
本研究存在一定的局限性:①本研究為單中心回顧性研究,雖然列線圖模型在訓練組和驗證組有較好的診斷效能,但尚需大樣本、前瞻性和多中心研究進一步驗證;②本研究僅在靜脈期增強掃描圖像上勾畫ROI,后期研究如能在平掃、動脈期及延遲期圖像上勾畫ROI進行影像組學分析并構建聯合模型,可有望提高模型的診斷效能。③本研究納入分析的臨床指標中腫瘤最大徑、T分期和N分期都來自CT診斷報告,一定程度上可能受到放射科醫(yī)師的經驗和主觀因素的影響。
總之,我們構建了用于術前預測AGC患者PNI的列線圖模型,為臨床醫(yī)師術前識別PNI(可疑)陽性的胃癌患者提供一種新的策略。