張?zhí)炱?,王芊婷,李明洋,苗政,付宇,劉統(tǒng)
結(jié)直腸癌(colorectal cancer,CRC)是常見的高死亡率癌癥之一[1],其中直腸癌患者約占27%~58%[2]。影響直腸癌預(yù)后的主要因素包括原發(fā)腫瘤分期、淋巴結(jié)轉(zhuǎn)移狀態(tài)、環(huán)周切緣狀態(tài)等[3]。我國結(jié)直腸癌診療指南及歐洲腫瘤學(xué)會(huì)直腸癌指南指出[4,5],未突破肌層外(T1-T2期)與已突破肌層外(T3-T4期)的直腸癌應(yīng)采取不同的治療方案,對(duì)于未突破肌層外的直腸癌僅需切除原發(fā)腫瘤,保證足夠切緣,切除直腸系膜內(nèi)淋巴脂肪組織及可疑陽性的側(cè)方淋巴結(jié);而已經(jīng)突破肌層外的直腸癌則應(yīng)擴(kuò)大切除范圍并進(jìn)行區(qū)域淋巴結(jié)清掃。因此,術(shù)前準(zhǔn)確鑒別直腸癌T1-T2期與T3-T4期,對(duì)制定患者個(gè)性化診療方案具有重要臨床意義。
影像組學(xué)作為圖像分析的一種新方法,目的是從傳統(tǒng)影像檢查所獲得的圖像數(shù)據(jù)中提取高通量的影像組學(xué)特征,并從中找到可以反映底層組織生物學(xué)信息的特征,通過分析和建模后達(dá)到預(yù)測(cè)患者臨床終點(diǎn)、病理類型、基因表達(dá)、腫瘤行為等目的[16],建立了圖像與精準(zhǔn)醫(yī)療的“橋梁”。基于影像組學(xué)方法建立直腸癌精準(zhǔn)診斷模型已成為研究熱點(diǎn)之一[17,18],為直腸癌的臨床診治決策提供了新的思路和方法。目前,基于IVIM功能圖像建立影像組學(xué)模型進(jìn)行術(shù)前直腸癌T分期方面的研究鮮有報(bào)道。因此,本研究擬建立基于術(shù)前IVIM功能圖像和高分辨T2WI圖像的多參數(shù)影像組學(xué)模型,旨在探討其對(duì)直腸癌術(shù)前T分期的預(yù)測(cè)價(jià)值。
1.研究對(duì)象
回顧性納入2019年1月至2020年1月共113例直腸癌患者。病例納入標(biāo)準(zhǔn):①術(shù)前2周內(nèi)進(jìn)行了包含IVIM序列的高分辨率直腸MRI掃描;②術(shù)后病理結(jié)果證實(shí)為直腸癌。病例排除標(biāo)準(zhǔn):①有其他腫瘤病史(2例);②術(shù)前高分辨率MRI圖像質(zhì)量不佳(22例);③術(shù)前行放療或化療(5例);④臨床信息缺失(1例)。最終有83例患者納入本研究(T1:T2:T3:T4=6:16:47:14),同時(shí)搜集患者臨床信息以進(jìn)行后續(xù)分析。將患者分為腫瘤未突破肌層外組(T1+T2)與腫瘤已突破肌層外(T3+T4)組,兩組比例為(T1+T2):(T3+T4)=22:61。本研究獲得我院倫理委員會(huì)的批準(zhǔn),由于是回顧性研究,因而未進(jìn)行患者知情同意書的簽署。
2.MRI檢查方法
所有患者在檢查前禁食4 h以上,檢查前1 h使用開塞露清潔腸道。MRI檢查均采用3.0T MRI掃描儀(Discovery MR750,General Electric Company),采用自旋回波序列,掃描參數(shù): TR 2800 ms,TE 59.8 ms,層厚4.0 mm,層間距1.0 mm,矩陣256×256,視野34 cm×34 cm,翻轉(zhuǎn)角90°,b值分別取0、25、75、125、150、175、200、400、600、800、1000 s/mm2。
3.影像組學(xué)研究流程
圖1 根據(jù)美國癌癥聯(lián)合委員會(huì)(AJCC)的腫瘤分期系統(tǒng)(第八版)繪制的直腸癌T分期示意圖。Tis:原位癌,腫瘤只存在于上皮或固有層中,未侵及黏膜層;T1:腫瘤已侵及黏膜下層,但未侵及固有肌層;T2:腫瘤已侵及固有肌層,但未侵及漿膜下層;T3:腫瘤侵及漿膜下層,但未突破漿膜層;T4a:腫瘤突破漿膜層;T4b:腫瘤侵及鄰近器官或結(jié)構(gòu)。 圖2 病灶分割示意圖。a) 高分辨率T2WI序列病灶勾畫;b) DWI(b=1000s/mm2)序列病灶勾畫。
感興趣區(qū)的分割:由兩位放射科醫(yī)師(醫(yī)師A有4年腹部影像診斷經(jīng)驗(yàn),醫(yī)師B有6年腹部影像診斷經(jīng)驗(yàn))對(duì)腫瘤原發(fā)灶進(jìn)行二維圖像的逐層勾畫,在勾畫圖像時(shí)兩位醫(yī)師對(duì)于患者最終的病理結(jié)果均不知曉。使用ITK-SNAP(V3.6.0,www.itksnap.org)軟件進(jìn)行感興趣區(qū)(regions of interest,ROI)勾畫,具體方法如下:①IVIM功能序列ROI勾畫:在DWI(b=1000 s/mm2)圖像上逐層沿腫瘤邊緣(高信號(hào))進(jìn)行勾畫,并將ROI映射到ADCmap、Dmap、fmap功能圖像中;②T2WI序列ROI勾畫:逐層勾畫腫瘤的輪廓(高或稍高信號(hào),圖2)。
使用RIAS(www.riascloud.com)[19, 20]軟件進(jìn)行影像組學(xué)特征提取和分析建模,在ADCmap、Dmap、fmap、T2WI、DWI(b=1000 s/mm2)圖像中分別提取了1427個(gè)影像組學(xué)特征,最后每例患者的圖像都提取了7135個(gè)影像組學(xué)特征。提取所得的影像組學(xué)特征分為以下兩類:①基于特征類,包括一階統(tǒng)計(jì)量特征、形狀特征、紋理特征等;②基于過濾器類,包括小波變換、拉普拉斯變換、對(duì)數(shù)特征、指數(shù)特征、分形維數(shù)特征等。
通過對(duì)組內(nèi)相關(guān)系數(shù)(intra-class correlation coefficient,ICC)的計(jì)算來評(píng)估組學(xué)特征的穩(wěn)定性。從每個(gè)序列中隨機(jī)選擇20例患者用于ROI的穩(wěn)定性評(píng)價(jià)。采用觀察者內(nèi)ICC評(píng)估同一位醫(yī)師間隔一周的兩次分割計(jì)算的一致性,采用觀察者間ICC評(píng)估兩位醫(yī)生的第一次分割計(jì)算的一致性。當(dāng)ICC不低于0.75時(shí),則認(rèn)為被分析的組學(xué)特征具有較好的再現(xiàn)性和可重復(fù)性。影像組學(xué)特征進(jìn)行特征篩選前,在訓(xùn)練組中進(jìn)行特征標(biāo)準(zhǔn)化后映射到驗(yàn)證組,以保證驗(yàn)證組特征的獨(dú)立。
特征篩選和模型的構(gòu)建:將上述單序列中的每組影像組學(xué)特征采用最小絕對(duì)收縮算子算法(least absolute shrinkage and selection operator,LASSO)進(jìn)行降維,以選擇對(duì)診斷直腸癌T分期最有價(jià)值的特征,得到T2WI序列特征11個(gè)、DWI序列特征7個(gè)、ADCmap序列特征32個(gè)、Dmap序列特征2個(gè)、fmap序列特征23個(gè)。隨機(jī)選取70%的病例作為訓(xùn)練組用于建立模型,剩下30%的病例作為驗(yàn)證組進(jìn)行模型驗(yàn)證。每個(gè)序列(T2WI、DWI、ADCmap、Dmap、fmap)均采用邏輯回歸(logistic regression,LR)作為機(jī)器學(xué)習(xí)模型,分別建立T分期預(yù)測(cè)的單序列R評(píng)分(單序列模型)。再將每個(gè)單序列降維后得到的影像組學(xué)特征進(jìn)行融合,再次使用LASSO進(jìn)行降維,最終得到多序列融合后的最有價(jià)值的影像組學(xué)特征32個(gè),同樣采用邏輯回歸模型構(gòu)建多序列融合的T分期預(yù)測(cè)R評(píng)分(聯(lián)合模型)。
圖3 特征的篩選及評(píng)價(jià)。a)用10折交叉驗(yàn)證的方法尋找LASSO的超參數(shù)lambda, 模型偏差最低點(diǎn)對(duì)應(yīng)的橫坐標(biāo)為最優(yōu)的lambda值(虛線); b)圖像每條彩色的線代表特征的系數(shù)隨lambda值的變化曲線,通過圖3a尋找到的lambda值(虛線)來確定系數(shù)不為0的參數(shù),并將該參數(shù)用于最后的模型構(gòu)建;c)模型特征權(quán)重系數(shù)柱狀圖,表示每一個(gè)特征在邏輯回歸模型中的系數(shù)值,系數(shù)為負(fù)表示特征與模型負(fù)相關(guān),系數(shù)為正表示特征與模型正相關(guān),且系數(shù)絕對(duì)值越大,相關(guān)程度越大;d)SHAP圖中的每一個(gè)點(diǎn)可以反映出每一個(gè)樣本中代表特征對(duì)模型的貢獻(xiàn)程度。每個(gè)點(diǎn)代表1例患者(紅色為陽性,藍(lán)色為陰性),SHAP value中0左側(cè)的點(diǎn)表示該患者所代表特征對(duì)模型影響為負(fù),0右側(cè)的點(diǎn)表示該患者所代表特征對(duì)模型影響為正。
4.統(tǒng)計(jì)學(xué)分析
采用RIAS軟件進(jìn)行統(tǒng)計(jì)學(xué)分析。對(duì)于人口學(xué)信息中的數(shù)值變量首先進(jìn)行正態(tài)分布檢驗(yàn),符合正態(tài)分布的數(shù)據(jù)采用t檢驗(yàn)進(jìn)行組間比較,而不符合正態(tài)分布的數(shù)據(jù)采用曼-惠特尼U檢驗(yàn)進(jìn)行組間比較。對(duì)于分類變量,均使用卡方檢驗(yàn)進(jìn)行組間比較。影像組學(xué)模型的診斷效能采用受試者工作特征(receiver operating characteristic,ROC)曲線、敏感度、特異度等共同評(píng)價(jià)。使用臨床決策(decision curve analysis,DCA)曲線評(píng)估影像組學(xué)模型的臨床應(yīng)用價(jià)值。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
患者的一般臨床信息及病理特征見表1。在訓(xùn)練組中(T1+T2)與(T3+T4)患者的所有臨床信息差異均無統(tǒng)計(jì)學(xué)意義(P>0.05),但在驗(yàn)證組中CEA(P=0.049)及腫瘤原發(fā)灶位置(P=0.026)在(T1+T2)與(T3+T4)兩組間差異有統(tǒng)計(jì)學(xué)意義,筆者考慮這可能是由于驗(yàn)證組中患者量較少導(dǎo)致的偏倚,進(jìn)一步分析訓(xùn)練組與驗(yàn)證組間的各項(xiàng)臨床信息,結(jié)果顯示差異無統(tǒng)計(jì)學(xué)意義。
通過LASSO算法選擇單序列中預(yù)測(cè)價(jià)值最高的影像組學(xué)特征,再將每個(gè)單序列降維后得到的影像組學(xué)特征進(jìn)行融合,再次使用LASSO算法進(jìn)行降維,最終得到多序列中最有價(jià)值的影像組學(xué)特征32個(gè),聯(lián)合模型特征的篩選過程及評(píng)價(jià)結(jié)果見圖3。
使用邏輯回歸方法建立聯(lián)合模型,聯(lián)合模型中所有患者的Rad評(píng)分及驗(yàn)證組中患者的Rad評(píng)分見圖4。在訓(xùn)練組及驗(yàn)證組中,分別繪制了高分辨率T2WI、DWI、ADCmap、Dmap、fmap各單序列模型及聯(lián)合模型的ROC曲線(圖5),各模型訓(xùn)練組與驗(yàn)證組的敏感度、特異度、準(zhǔn)確率、F1分?jǐn)?shù)等見表2,其中聯(lián)合模型在驗(yàn)證組中的敏感度為0.810,特異度為0.750,準(zhǔn)確度為0.800,陽性預(yù)測(cè)值為0.944,F(xiàn)1分?jǐn)?shù)為0.872。
通過ROC曲線分析各模型預(yù)測(cè)T分期的效能(圖5),其中聯(lián)合序列模型在驗(yàn)證組中的曲線下面積(area under curve,AUC)為0.929 (95%CI:0.78~1.00),高于其他單序列模型的AUC,表明聯(lián)合模型的診斷效能高于其他單序列模型。DCA曲線顯示在0.61~1.0的閾值范圍內(nèi)(圖6),聯(lián)合模型的凈收益較大。
直腸癌的發(fā)病率、死亡率均較高,給家庭和社會(huì)帶來沉重負(fù)擔(dān)[21],術(shù)前對(duì)直腸癌進(jìn)行準(zhǔn)確的分期,制定個(gè)性化診療方案,對(duì)提高患者生存率、改善疾病預(yù)后、降低社會(huì)醫(yī)療負(fù)擔(dān)具有重要意義。相關(guān)指南推薦使用高分辨率MRI檢查用于直腸癌的分期[4],但由于影像科醫(yī)生閱片經(jīng)驗(yàn)差異和圖像質(zhì)量等方面的原因,術(shù)前T分期診斷準(zhǔn)確性仍有待提高。影像組學(xué)方法從醫(yī)學(xué)影像中全面深入地挖掘高維度、深層次信息,分析影像特征與臨床數(shù)據(jù)等信息的關(guān)聯(lián),以建立疾病的預(yù)測(cè)模型,進(jìn)一步深化了醫(yī)學(xué)影像檢查的臨床作用,作為一種非侵入的檢查手段,可以在一定程度上降低醫(yī)療成本,更有可能成為臨床決策輔助工具[22]。近年來,影像組學(xué)技術(shù)在結(jié)直腸癌診療中的應(yīng)用覆蓋了結(jié)直腸癌診療的各個(gè)階段,體現(xiàn)了影像組學(xué)方法在結(jié)直腸癌精準(zhǔn)診斷方面的巨大潛力[22,23]。
表1 患者臨床及病理特征 (n,%)
表2 相關(guān)模型在訓(xùn)練組及驗(yàn)證組中的診斷效能
圖4 聯(lián)合模型中所有患者的Rad評(píng)分及驗(yàn)證組患者的Rad評(píng)分,label0表示陰性(T1+T2),label1表示陽性(T3+T4)。a) 所有患者的Rad評(píng)分;b) 驗(yàn)證組患者的Rad評(píng)分。 圖5 訓(xùn)練組及驗(yàn)證組的ROC曲線。a) 訓(xùn)練組中各單序列模型及聯(lián)合模型的ROC曲線;b) 驗(yàn)證組中各單序列模型及聯(lián)合模型的ROC曲線。 圖6 DCA曲線。
本研究將IVIM功能圖和高分辨T2WI進(jìn)行融合,建立了影像組學(xué)模型,聯(lián)合了多序列的組學(xué)模型在驗(yàn)證組中的敏感度為0.810,特異度為0.750,準(zhǔn)確度為0.800,陽性預(yù)測(cè)值為0.944,F(xiàn)1分?jǐn)?shù)為0.872,AUC達(dá)到0.929(95%CI:0.78~1.00),表明本研究所構(gòu)建的多參數(shù)MRI組學(xué)模型在直腸癌T分期術(shù)前評(píng)估方面具有較高的應(yīng)用價(jià)值。
由于IVIM包含ADCmap、Dmap、fmap等多個(gè)功能圖像,對(duì)于功能圖像ROI的勾畫方式,筆者做了如下考慮:IVIM功能圖像糅合了11組b值的病灶信息,是經(jīng)過后處理所獲得的功能圖像,在后處理過程中為實(shí)現(xiàn)其反映灌注、擴(kuò)散信息的目的,導(dǎo)致解剖信息的丟失,不利于觀察及對(duì)病灶的手動(dòng)分割。DWI(b=1000 s/mm2)序列所采集的圖像,能夠提供較為清晰的解剖信息,更利于觀察和分割病灶[10,24]。同時(shí),ADCmap、Dmap、fmap圖像是經(jīng)軟件處理后同步生成的,所以這三種圖像上的位置信息均可以與DWI圖像中的位置實(shí)現(xiàn)對(duì)應(yīng)。綜上考慮,筆者選擇了將DWI序列中所勾畫的ROI映射至IVIM功能圖像中的方法。在既往有關(guān)IVIM序列的大多數(shù)研究中,在后處理軟件中勾畫病灶后,由軟件得出相應(yīng)測(cè)量值,將此測(cè)量值作為一項(xiàng)預(yù)測(cè)因素,這種研究模式并沒有完全挖掘IVIM序列圖像中蘊(yùn)含的信息。而影像組學(xué)方法可以將圖像信息最大化利用,以挖掘更多價(jià)值。同時(shí),相較于在后處理軟件上勾畫病灶,本研究中病灶ROI的勾畫并沒有將研究過程過度復(fù)雜化。在分析了使用不同序列建立的模型后,筆者發(fā)現(xiàn)使用T2WI序列建立的模型與最終的融合模型的敏感度、特異度比較接近,且本研究中T2WI模型的評(píng)價(jià)結(jié)果與既往文獻(xiàn)報(bào)道的報(bào)道結(jié)果相近[25,26],但T2WI模型的AUC低于融合模型。在Sun等[26]的研究中,從T2WI序列中提取了256個(gè)影像組學(xué)特征并建立了評(píng)估直腸癌T分期的模型,所建立的預(yù)測(cè)模型AUC值為0.852(95% CI:0.677~1),低于本研究建立聯(lián)合模型的診斷效能。同時(shí),相較于完全依賴影像醫(yī)師人工進(jìn)行評(píng)價(jià)的T分期研究[27](準(zhǔn)確度為78%,敏感度為86%,特異度為65%),本研究聯(lián)合模型的診斷效能較高。相較于傳統(tǒng)僅選擇T2WI序列或DWI序列的直腸癌T分期研究,本研究構(gòu)建的聯(lián)合模型中既保留了T2WI及DWI序列中的腫瘤形態(tài)學(xué)信息,同時(shí)通過IVIM功能圖像增加了模型對(duì)腫瘤灌注和擴(kuò)散的分析,從更多層面反映了腫瘤內(nèi)部的異質(zhì)性及腫瘤的行為、特點(diǎn)[28],這可能是本研究建立的聯(lián)合模型較既往研究中其他模型診斷效能有所提高的原因之一。
本研究存在以下局限性:①本研究僅搜集了本院檢查的83例直腸癌患者,樣本量較小,導(dǎo)致了驗(yàn)證組可能的偏倚,在后續(xù)研究中筆者將進(jìn)一步擴(kuò)大樣本量并搜集更豐富的臨床信息,從而確定他們之間的相關(guān)性;②所有患者的MRI圖像均來源于同一生產(chǎn)廠商(GE),模型的泛化能力可能受限,其他設(shè)備廠商的數(shù)據(jù)代入到我們所構(gòu)建的模型內(nèi),效能未知;③在IVIM相關(guān)研究中,有研究者指出較低的b值范圍(<100~200 s/mm2)所得到的圖像至關(guān)重要[29],但對(duì)于臨床工作中應(yīng)使用b值的數(shù)量和數(shù)值還沒有相關(guān)的共識(shí)或規(guī)范公布,因此本研究中選取的b值可能并非最佳值。在未來的研究中,筆者將擴(kuò)大樣本量并改良實(shí)驗(yàn)設(shè)計(jì),進(jìn)一步探究相關(guān)問題。