崔達華,劉愛連*,郭 妍,田士峰,牛雅欣,李 昕,宋清偉,莊麗娜
(1.大連醫(yī)科大學附屬第一醫(yī)院放射科,遼寧 大連 116011;2.通用電氣藥業(yè)(上海)有限公司,上海 201203;3.通用電氣(中國)有限公司,上海 200000)
子宮內膜癌(endometrial cancer, EC)占女性生殖系統(tǒng)惡性腫瘤的20%~30%[1],其中80%為子宮內膜樣腺癌(endometrioid adenocarcinoma, EA)[2-3]。相比低分化(病理分級G3)EA和透明細胞癌、漿細胞癌等其他類型內膜癌,中、高分化(病理分級G2、G1)EA侵襲性更弱,較少發(fā)生淋巴管間隙浸潤,患者預后更好[2,4]。最新美國國立綜合癌癥網絡(national comprehensive cancer network, NCCN)指南[5]提出,對國際婦產科聯(lián)盟(Federation International of Gynecology and Obstetrics, FIGO)ⅠA期且病理G1、G2級EA患者不建議行系統(tǒng)淋巴結清掃。目前MRI是評估腫瘤分級、淋巴結轉移和患者生存期的最有效的方法,其中彌散加權成像(diffusion weighted imaging, DWI)逐漸用于診斷婦科惡性腫瘤[6]。影像組學可定量提取圖像的高通量特征,以獲取反映腫瘤異質性的信息[7]。腫瘤全域表觀彌散系數(shù)(apparent diffusion coefficient, ADC)定量參數(shù)有助于判斷EA病理分級,但部分參數(shù)的診斷效能較低[4]。本研究觀察基于ADC圖的影像組學評價EA病理分級的價值。
1.1 研究對象 回顧性收集2012年1月—2019年12月97例于大連醫(yī)科大學附屬第一醫(yī)院經術后病理診斷EA的女性患者,年齡34~84歲,中位年齡58歲;其中65例為中、高分化EA,32例為低分化EA。納入標準:①無MR檢查禁忌證;②術前2周內接受MR檢查(包括DWI);③術前未接受放射、化學或其他治療。排除標準:①MRI偽影嚴重;②子宮病灶最大直徑<1.0 cm。檢查前患者均簽署知情同意書。
1.2 儀器與方法 采用GE Signa HDxt 1.5T MR掃描儀,體部8通道相控陣線圈。囑患者檢查前禁食4~6 h,檢查前1 h飲水約500 ml。囑患者仰臥,頭先進,行盆腔CT掃描,范圍為髂前上棘至恥骨聯(lián)合水平,重點觀察子宮內膜和子宮結合帶、宮腔內病變大小、范圍、是否累及宮頸或宮旁及有無淋巴結轉移。參數(shù):軸位T1W,采用快速擾相梯度回波序列,TR 400 ms,TE 8.0 ms,矩陣 320×192,NEX 2.0,掃描時間100 s;軸位 T2W,采用快速自旋回波序列,TR 4 000 ms,TE 125 ms,矩陣 320×192,NEX 4.0,掃描時間143 s;軸位DWI,采用單次激發(fā)自旋平面回波序列,TR 4 000 ms,TE 71.1 ms,矩陣 128×128,NEX 6.0,b值0、600 s/mm2,掃描時間88 s;層厚均為5.0 mm,層間隔均為1.0 mm,F(xiàn)OV均為32 cm×32 cm。
1.3 提取影像組學特征 于GE ADW 4.6工作站重建ADC圖,并以DICOM格式導出。由具有2年MRI診斷經驗的醫(yī)師1采用ITK-SNAP軟件在ADC圖像上逐層手動勾畫腫瘤邊緣,合成三維ROI(three-dimensional ROI, 3D-ROI),見圖1;由具有10年MRI診斷經驗的醫(yī)師2復核并導入A.K.分析軟件,提取402個高維影像組學特征,包括一階特征、形狀特征、灰度共生矩陣特征、灰度大小區(qū)域矩陣特征和游程矩陣特征。
圖1 患者女,52歲,中-低分化EA(FIGO ⅠA期) A.軸位ADC圖示子宮內膜腫塊樣增厚,呈低信號;B.軸位ADC圖示ROI(紅色區(qū)域);C、D.腫塊于軸位(C)和矢狀位FS T2WI(D)呈稍高信號
1.4 構建影像組學模型 采用合成少數(shù)類過采樣技術(synthetic minority oversampling technique, SMOTE)使低分化樣本量達65,以與中、高分化病例數(shù)相同。按7∶3比例將患者分為訓練集(n=90,中、高分化45例,低分化45例)和驗證集(n=40,中、高分化20例,低分化20例)。對自訓練集樣本中提取的402個影像組學特征進行降維(圖2):首先采用最小絕對收縮和選擇算子(least absolute shrinkage and selection operator, LASSO)算法,基于十折交叉驗證方法篩選得到最優(yōu)懲罰因子,并在該條件下篩選得到系數(shù)非零的特征;再以方差分析剔除變異度方差小于1的特征;通過Spearman相關性分析進行特征降維,剔除與其他特征相關性高于0.9的冗余特征;最后基于上述篩選得到有意義的組學特征,在訓練集內構建多變量Logistic回歸模型,通過對上述特征進行不同權重的線性加和計算得到影像組學評分:影像組學評分=-0.322×特征2-1.687×特征3+0.331×特征4+0.055×特征5+1.889×特征6-0.873×特征7-0.952×特征8-0.908×特征1+0.0918(表1),用于判斷EA病理分級及驗證驗證集數(shù)據(jù)。
表1 提取并降維后得到的訓練集的8個影像組學特征
圖2 提取訓練集影像組學特征 A.經LASSO篩選得到30個系數(shù)非零的特征,最優(yōu)懲罰因子alpha為0.03;B.剔除與其他特征相關性高于0.9的冗余特征,剩余8個影像組學特征,相關性熱圖顯示去冗余后特征之間無強相關性
1.5 統(tǒng)計學分析 采用R studio(Version 1.0.143)軟件包進行處理。繪制受試者工作特征(receiver operating characteristic, ROC)曲線、校準曲線和臨床決策曲線,以Delong檢驗比較Logistic回歸模型在訓練集和驗證集中的診斷效能。P<0.05為差異有統(tǒng)計學意義。
影像組學模型在訓練集與驗證集中評價EA病理分級的準確率、曲線下面積(area under the curve, AUC)、敏感度、特異度、陽性預測值(positive prediction value, PPV)及陰性預測值(negative prediction value, NPV)分別為77.78%、0.87、73.33%、82.22%、80.49%及75.51%和77.50%、0.84、80.00%、75.00%、76.19%及78.95%;其ROC曲線、校準曲線和決策曲線見圖3、4。Delong檢驗結果顯示該模型在訓練集與驗證集的診斷效能差異無統(tǒng)計學意義(Z=-0.44,P=0.66)。
圖3 影像組學模型預測訓練集EA病理分級 A.ROC曲線;B.校準曲線(y軸表示低分化EA所占真實比例,x軸表示影像組學模型預測低分化EA的概率,灰色虛線表示理想預測結果,藍色實線表示實際預測結果);C.決策曲線(黑色實線表示所有EA均被識別為低分化時的凈收益,黑色虛線表示所有EA均被識別為中高分化時的凈收益,紅線代表影像組學模型帶來的凈收益)
圖4 影像組學模型預測驗證集EA病理分級 A.ROC曲線;B.校準曲線(y軸表示低分化EA所占真實比例,x軸表示影像組學模型預測低分化EA的概率,灰色虛線表示理想預測結果,藍色實線表示實際預測結果);C.決策曲線(黑色實線表示所有EA均被識別為低分化時的凈收益,黑色虛線表示所有EA均被識別為中高分化時的凈收益,紅線代表影像組學模型帶來的凈收益)
EA組織學表現(xiàn)為類正常的內膜腺體,但正常子宮內膜間質消失,伴癌旁內膜腺體增生。中、高分化EA腺管排列擁擠、紊亂,結構類似增生的內膜腺體;而低分化EA較少形成腺樣結構,多呈實性板狀分布,核異型性明顯,核分裂象多見。不同病理分級腫瘤的微環(huán)境(包括細胞增殖狀態(tài)、細胞計數(shù)和微血管密度)各異,侵襲性亦不同[5],圖像灰度強度、像素位置、體素強度的排列和相互關系隨之發(fā)生變化。
對于常規(guī)ADC定量參數(shù)與EC病理分級的關系存在爭議[2]。NOUGARET等[8]以ADC預測EC病理分級和淋巴管及血管浸潤中的腫瘤全域,發(fā)現(xiàn)分化程度高(G1、G2)的EC的ADC明顯高于分化程度較低(G3)者。KISHIMOTO等[9]選取腫瘤病灶的3個代表區(qū)域測量其ADC,發(fā)現(xiàn)ADC與EA病理分級無明顯關聯(lián)。上述研究結論之所以相悖,可能與腫瘤壞死程度不同有關[10]。也有研究[4,11]認為僅于病灶某一層面設置ROI不能真實地反映腫瘤的異質性。
本研究采用SMOTE對少數(shù)類樣本進行擴增,首先對少數(shù)類樣本進行分析,然后根據(jù)其分布在鄰近樣本中人工合成新樣本,并添加到數(shù)據(jù)集中,以避免樣本過擬合而影響建模結果。該方法是隨機過采樣算法的改進方案,可在一定程度上解決生成樣本重疊所致模型過擬合的問題,已廣泛用于處理醫(yī)學影像數(shù)據(jù)[12-13]。一般多因素Logistic回歸對樣本和特征數(shù)量的要求為10∶1,而本研究樣本量為97,剩余影像組學特征數(shù)量為8,基本符合要求,且模型針對訓練集與驗證集表現(xiàn)出的診斷效能差異無統(tǒng)計學意義,提示過擬合風險偏低。
本研究最終納入預測模型的8個影像組學特征包括灰度共生矩陣特征、游程矩陣特征和形狀特征?;叶裙采仃囂卣?熵和Haralick特征)反映病灶的復雜性和紋理的粗細程度[14],病灶越復雜,圖像紋理越混亂,腫瘤異質性越大。游程矩陣(短游程突出、長游程高灰度級突出、長游程低灰度級突出)主要描述病灶的復雜性、層級變化及紋理粗細程度等,該值越大則病灶越復雜,腫瘤異質性越大[15]。形狀特征則可定量反映圖像中的病灶形狀。決策曲線分析結果表明,本研究構建的模型無論在何種診斷閾值下均可為患者帶來較高的凈收益;其在驗證集中鑒別低分化與中、高分化EA的準確率為77.50%,AUC為0.84,敏感度為80.00%,特異度為75.00%,PPV和NPV分別為76.19%和78.95%。
本研究的局限性:①低分化EA樣本量少,未來將擴大樣本量以檢測模型的魯棒性和普適性;②回顧性單中心研究,今后將進一步開展多中心、大樣本量影像組學研究加以完善;③未檢測觀察者間一致性。
綜上所述,基于ADC圖的影像組學模型對評價EA病理分級有一定價值,可輔助臨床制定治療方案。