詹鵬超,劉珂衍,邱慶雅,沈佳寧,劉娜娜,王會霞,呂培杰,李臻,高劍波
膽管癌是一種起源于膽管上皮細(xì)胞的惡性腫瘤,約占消化系統(tǒng)惡性腫瘤的3%[1,2],根據(jù)解剖部位可分為三種亞型,其中肝門部膽管癌(perihilar cholangiocarcinoma,pCCA)最為常見。pCCA患者總體預(yù)后偏差[3],神經(jīng)侵犯(perineural invasion,PNI)是導(dǎo)致其預(yù)后差、總生存期短的重要危險因素,PNI狀態(tài)的評估對于指導(dǎo)患者治療和預(yù)后分層有重要臨床價值[4,5]。然而,目前PNI的診斷主要依賴有創(chuàng)的病理標(biāo)本的組織學(xué)檢查,亟待開發(fā)術(shù)前無創(chuàng)性評估PNI狀態(tài)的檢測手段。近年來,作為一種新興工具,影像組學(xué)在腫瘤的鑒別診斷、療效評估和預(yù)后評價等方面展現(xiàn)了巨大潛力[6],既往文獻(xiàn)已證明CT影像組學(xué)評估腫瘤PNI狀態(tài)的價值[7-10]。然而,目前國內(nèi)未見CT影像組學(xué)預(yù)測pCCA患者PNI的相關(guān)報道。因此,本研究旨在基于術(shù)前CT構(gòu)建預(yù)測pCCA患者PNI的影像組學(xué)模型,并評價其效能。
本研究為回顧性研究,已獲得鄭州大學(xué)第一附屬醫(yī)院倫理委員會批準(zhǔn)(2021-KY-0778-001),并豁免簽署知情同意書。回顧性分析2013年2月-2021年2月149例經(jīng)病確診的pCCA患者的臨床資料,其中PNI組患者108例,無PNI組患者41例。納入標(biāo)準(zhǔn):①接受根治性手術(shù)或姑息性手術(shù)切除并經(jīng)病理診斷為肝門部膽管癌;②術(shù)前2周內(nèi)在本院接受了CT增強掃描檢查。排除標(biāo)準(zhǔn):①病理報告中無PNI診斷結(jié)果;②患者CT掃描前接受過其他抗腫瘤治療或膽道引流;③CT圖像厚度大于3 mm。使用R語言將所有患者按3:1比例隨機分為訓(xùn)練集(n=112)和驗證集(n=37)。納入研究指標(biāo)包括年齡、性別、臨床癥狀、CA19-9(≤40或>40 U/mL)、CEA(≤5或>5 ng/mL)、CA125(≤35或>35 U/mL)、Bismuth分型、臨床T分期(cT)和N分期(cN)。
所有患者接受腹部三期增強掃描,掃描儀采用:GE Revolution CT,管電壓120 kVp,管電流50~500 mA,螺距0.992:1,旋轉(zhuǎn)時間0.5 s,探測器寬度80 mm,STAND重建算法,掃描層厚和層間距5 mm,重建層厚0.625 mm;Aquilion ONE,管電壓120 kVp,管電流350 mA,旋轉(zhuǎn)時間0.5 s,掃描層厚和層間距5 mm,重建層厚2 mm。經(jīng)肘靜脈以3.0~4.0 mL/s流率注射碘普羅胺(1.5 mL/kg),在注射后延遲20~30 s和55~70 s獲得動脈期(AP)和靜脈期(VP)CT 圖像。
①病灶分割和特征提取:將所有患者的靜脈期圖像上傳至開源圖像處理軟件3D Slicer 4.13.0(https://www.Slicer.org/),由兩名具有5年以上腹部疾病診斷經(jīng)驗的放射科醫(yī)師進行圖像分析[3,11],評估Bismuth分型,cT和cN分期,意見不一致時協(xié)商解決。在所有層面上沿腫瘤邊緣手動進行病灶感興趣區(qū)(ROI)的勾畫(圖1),為了確保提取影像組學(xué)特征的可重復(fù)性,隨機選擇50例患者的CT圖像由兩名放射科醫(yī)生共同勾畫進行一致性分析,獲取組內(nèi)相關(guān)系數(shù)(intraclass correlation coefficient,ICC),剩余CT圖像ROI勾畫由其中一名醫(yī)生完成。
圖1 肝門部膽管癌ROI示意圖。a)靜脈期CT圖像;b)沿腫瘤邊緣逐層手動勾畫ROI;c)融合后的3D ROI示意圖。
為降低掃描方案的影響,在特征提取前進行圖像預(yù)處理:首先將其體素重采樣為3 mm×3 mm×3 mm,然后以組距(Bin Width)25進行灰度值離散化處理,最后用3D Slicer中的插件PyRadiomics (https://www.radiomics.io/pyradiomics.html)提取原始特征和小波轉(zhuǎn)化特征[12]。
②特征篩選:按照以下三個步驟進行:①選擇ICC>0.75的特征;②排除冗余特征:采用Pearson相關(guān)性分析剔除高度相關(guān)(Pearson相關(guān)系數(shù)≥0.9)的特征對中平均絕對相關(guān)系數(shù)更大者[13];③采用隨機森林算法(RF)對所有特征進行重要性排序,經(jīng)過10折交叉驗證,得出平均診斷錯誤率最低時的特征數(shù)量n,選取前n個最重要的特征構(gòu)建模型。
③模型建立及評估:根據(jù)篩選出的特征在訓(xùn)練集中建立隨機森林模型,并在驗證集進行驗證,將模型預(yù)測概率作為影像組學(xué)評分(Radiomics Score)[14,15],采用準(zhǔn)確率、敏感度、特異度及受試者操作特征(receiver operator characteristic,ROC)曲線等評估模型效能。
采用Graphpad prism 9 軟件進行臨床資料統(tǒng)計,計量資料以平均值±標(biāo)準(zhǔn)差表示,采用t檢驗或Wilcoxon秩和檢驗比較組間差異;計數(shù)資料以頻數(shù)表示,采用Fisher's精確檢驗比較組間差異?;赗語言統(tǒng)計分析軟件(4.0.3)進行特征篩選和模型構(gòu)建及評價,以P<0.05為差異有統(tǒng)計學(xué)意義。
本研究共納入149名pCCA患者,其中男83例,女66例,平均年齡(61.3±9.3)歲,腫瘤的組織學(xué)類型均為腺癌。訓(xùn)練集和測試集的臨床基線數(shù)據(jù)之間差異無統(tǒng)計學(xué)意義。在訓(xùn)練集中,PNI組和無PNI組對比,Bismuth分型及Radiomics Score差異具有統(tǒng)計學(xué)意義,其他臨床特征差異無統(tǒng)計學(xué)意義。而在驗證集中,兩組患者對比,僅Radiomics Score差異具有統(tǒng)計學(xué)意義。所有患者的基線資料見表1。
表1 所有患者基線資料比較 (例)
從靜脈期圖像中共提取851個影像學(xué)特征,包括14個形狀特征,18個一階特征,75個紋理特征和744個小波特征?;贗CC和相關(guān)性分析共篩選出361個特征,基于隨機森林算法對包括臨床特征、影像組學(xué)特征在內(nèi)的所有特征進行重要性排序,經(jīng)過10折交叉驗證,當(dāng)特征數(shù)量為18時,診斷錯誤率最低(圖2)。篩選出前18個最重要的特征建立模型(圖3)。
圖2 模型診斷錯誤率與特征數(shù)量的關(guān)系示意圖。采用隨機森林算法經(jīng)10折交叉驗證,當(dāng)特征數(shù)量為18時,診斷錯誤率最低。 圖3 特征重要性排序示意圖。隨機森林算法根據(jù)平均降低準(zhǔn)確率篩選出來的前18個重要特征。
基于所篩選特征建立RF模型,訓(xùn)練集及驗證集中PNI組和無PNI組患者的Radiomics score差異具有統(tǒng)計學(xué)意義(圖4)。在訓(xùn)練集中,RF模型的準(zhǔn)確率、敏感度、特異度均為100%,AUC為1;在驗證集中,RF模型的準(zhǔn)確率為70.3%,敏感度為59.3%,特異度為100%,AUC為0.846(0.713~0.979)。RF模型在訓(xùn)練集和驗證集中的診斷效能見表2,ROC曲線見圖5。該模型對pCCA患者PNI狀態(tài)具有良好的預(yù)測效能,可用于術(shù)前預(yù)測肝門部膽管癌患者的神經(jīng)侵犯狀態(tài)。
表2 RF模型在訓(xùn)練集和驗證集中的診斷效能對比
圖4 影像組學(xué)評分分布圖。a)訓(xùn)練集中影像組學(xué)評分分布圖,神經(jīng)侵犯組(PNI=1)和無神經(jīng)侵犯組(PNI=0)差異具有統(tǒng)計學(xué)意義;b)驗證集中影像組學(xué)評分分布圖,神經(jīng)侵犯組(PNI=1)和無神經(jīng)侵犯組(PNI=0)差異具有統(tǒng)計學(xué)意義。 圖5 隨機森林模型預(yù)測PNI的ROC曲線。
pCCA惡性程度高,預(yù)后差,據(jù)文獻(xiàn)報道,其中位總生存期只有5~10個月[1,16],R0切除術(shù)可顯著延長患者總生存期甚至達(dá)到臨床治愈,然而只有13%~32%的患者有機會接受手術(shù)切除,并且一年內(nèi)復(fù)發(fā)率高于50%[1,17,18]。PNI是膽道pCCA的組織學(xué)特征之一,發(fā)生率高達(dá)56%~88%[19]。既往文獻(xiàn)報道PNI是pCCA患者預(yù)后差、總生存期短的重要危險因素[20],PNI陰性患者5年總生存率約為63.7% ,PNI陽性患者5年總生存率約為34.9%[21,22],差異具有統(tǒng)計學(xué)意義。此外,PNI亦是導(dǎo)致R0切除術(shù)后腫瘤復(fù)發(fā)的獨立危險因素,因此對PNI的術(shù)前診斷對于指導(dǎo)患者治療和預(yù)后至關(guān)重要[22-24]。
傳統(tǒng)影像學(xué)工具如CT和MRI是診斷和評估pCCA的重要手段,可進行良惡性鑒別和臨床分期等,但其對PNI的診斷價值有限。目前,PNI主要通過手術(shù)標(biāo)本病理組織學(xué)檢查確診,不能提供及時有效的診斷信息,并且不適用于無手術(shù)機會的患者。近年來,影像組學(xué)研究得到了蓬勃發(fā)展,通過影像圖像提取海量定量特征來量化腫瘤的生物學(xué)特點[25,26],對于疾病的精準(zhǔn)診療和預(yù)后預(yù)測具有重要臨床價值[27,28]。已有研究表明影像組學(xué)在腫瘤PNI的術(shù)前預(yù)測中具有潛在價值[29,30],Li等[31]結(jié)合CT和MRI圖像開發(fā)的多模態(tài)影像組學(xué)模型預(yù)測直腸癌PNI達(dá)到了良好的效能,訓(xùn)練數(shù)據(jù)集AUC為0.906 (0.833~0.979);測試數(shù)據(jù)集AUC為0.884(0.761~1.000)。Huang等[32]基于MRI圖像構(gòu)建的影像組學(xué)模型在預(yù)測肝外膽管癌的PNI方面亦表現(xiàn)良好的性能和潛力,但其患者數(shù)量偏少(n=101),并且同時納入了了肝門和遠(yuǎn)端膽管癌患者。
目前國內(nèi)尚未見使用影像組學(xué)預(yù)測肝外膽管腫瘤PNI的相關(guān)報道。本研究基于治療前靜脈期CT圖像,通過隨機森林算法率先構(gòu)建了可預(yù)測pCCA PNI的RF模型,結(jié)果顯示,在訓(xùn)練集和驗證集中,PNI組和無PNI組的Radiomics score差異具有統(tǒng)計學(xué)意義,并且AUC分別達(dá)到了1和0.846,證明該模型診斷效能良好。既往研究[33]報道了使用術(shù)前能譜CT預(yù)測胃腺癌PNI的臨床價值,基于cT分期聯(lián)合標(biāo)準(zhǔn)化延遲期碘濃度建立的臨床模型AUC達(dá)到了0.832,但其診斷效能仍低于RF影像組學(xué)模型,且缺乏進一步驗證。值得注意的是,本研究中篩選的影像組學(xué)特征均為小波特征,表明小波特征可能對PNI診斷更為敏感,既往文獻(xiàn)亦有相關(guān)報道,小波特征可提供更多的圖像信息,診斷價值可能優(yōu)于其他特征[34]。此外,在臨床特征方面,Guo等發(fā)現(xiàn)直腸癌術(shù)前PNI的獨立危險因素包括CT報告中的T分期、N分期以及癌胚抗原(CEA)水平等臨床因素[35]。然而,本研究并未得出類似的結(jié)果,可能是由于腫瘤類型不同、樣本量較小導(dǎo)致數(shù)據(jù)偏差等原因所致。既往研究表明,pCCA的PNI與腫瘤的浸潤深度等病理學(xué)指標(biāo)密切相關(guān)[36]。然而,本研究的目的是建立手術(shù)切除前的非侵入性預(yù)測模型,因此并沒有考慮病理學(xué)因素的影響。此外,考慮到臨床因素對于腫瘤預(yù)測的重要性,筆者未來將進一步探討pCCA發(fā)生PNI的相關(guān)臨床因素。
本研究存在以下局限性:①本研究屬于回顧性研究,可能存在數(shù)據(jù)偏倚;②樣本數(shù)量有限,并且存在數(shù)據(jù)類別不均衡的問題(PNI組108例,無PNI組41例),這可能間接導(dǎo)致了模型在測試集中特異度偏高(100%),而敏感度偏低(59.3%),未來有待繼續(xù)開展多中心大樣本研究,并均衡納入不同患者以完善模型;③CT掃描協(xié)議不統(tǒng)一,不過已通過多種圖像預(yù)處理降低其影響。
總之,本研究基于CT建立的影像組學(xué)模型具有良好的診斷效能,為術(shù)前評估pCCA患者的PNI狀態(tài)提供了無創(chuàng)性預(yù)測工具,有助于指導(dǎo)pCCA患者的預(yù)后,優(yōu)化治療策略。