焦凱劍,楊波,陳文,方鈺輝,陳亞琳,吳磊
膠質(zhì)母細(xì)胞瘤(glioblastoma, GBM)是最具侵襲性和致死性的原發(fā)腦腫瘤[1-2]。目前,GBM 主流治療方法仍為手術(shù)治療及術(shù)后化療,化療藥物通常使用烷化劑替莫唑胺(temozolomide, TMZ)[3]。O6-甲基鳥(niǎo)嘌呤-DNA甲基轉(zhuǎn)移酶(O6-methylguanine-DNA methyltransferase,MGMT)基因啟動(dòng)子的甲基化狀態(tài)可以評(píng)價(jià)神經(jīng)GBM患者對(duì)TMZ 的敏感性,并預(yù)測(cè)TMZ 的療效[4-5]。這成為選擇特異性個(gè)體治療的重要依據(jù)。對(duì)于對(duì)TMZ 無(wú)效的患者,可以避免進(jìn)行化療,從而減少過(guò)度治療和化療帶來(lái)的毒副作用。目前,評(píng)判MGMT 基因啟動(dòng)子甲基化狀態(tài)仍依賴于有創(chuàng)的免疫組織化學(xué)方法,需基于手術(shù)標(biāo)本[6]。
然而,近年來(lái),影像組學(xué)(Radiomics)的興起為術(shù)前非侵入性評(píng)估GBM MGMT啟動(dòng)子的甲基化狀態(tài)提供了新的方法[7]。已有多項(xiàng)研究探討利用紋理特征來(lái)預(yù)測(cè)MGMT 甲基化狀態(tài)的有效性[8-10]。相關(guān)研究表明,相較于腫瘤區(qū)域,水腫區(qū)域也包含腫瘤微環(huán)境的信息[11-12]。先前的關(guān)于GBM 的工作中,沒(méi)有系統(tǒng)性地理解腫瘤生境棲息地不同亞區(qū)(增強(qiáng)區(qū)域、壞死區(qū)域和水腫區(qū)域)的放射組學(xué)特征與腫瘤病理生理信息的相關(guān)性。多數(shù)研究仍是以整體腫瘤為感興趣區(qū)進(jìn)行研究,對(duì)于GBM在空間上不同區(qū)域的圖像價(jià)值未進(jìn)行完善的研究。彌散技術(shù)相較于結(jié)構(gòu)MRI除了能夠提供腫瘤位置形態(tài)之外,還能提供與腫瘤基因相關(guān)的更全面的信息。此外先前研究多使用來(lái)自單中心的研究隊(duì)列,無(wú)法進(jìn)一步確保模型的泛化能力和魯棒性。
因此,在本項(xiàng)回顧性多中心研究中,我們基于自動(dòng)分割將GBM 分為三個(gè)生境亞區(qū)(壞死、增強(qiáng)和瘤周水腫),對(duì)比了不同腫瘤生境亞區(qū)下多模態(tài)MRI 圖像的放射組學(xué)特征,以評(píng)估其對(duì)預(yù)測(cè)GBM 中MGMT 啟動(dòng)子甲基化狀態(tài)的能力和有效性,旨在構(gòu)建一個(gè)具有較高魯棒性和準(zhǔn)確性的多生境區(qū)域多模態(tài)MRI 放射組學(xué)模型,術(shù)前無(wú)創(chuàng)預(yù)測(cè)GBM 患者的MGMT 啟動(dòng)子甲基化狀態(tài)。
本研究回顧性分析的數(shù)據(jù)來(lái)自湖北醫(yī)藥學(xué)院附屬太和醫(yī)院(Taihe Hospital, the Affiliated Hospital of Hubei University of Medicine, HBMUTH)、賓法尼西亞大學(xué)(University of Pennsylvania,UPENN)以及加州大學(xué)弗朗西斯科分校(University of California San Francisco, UCSF)[13-14]。HBMUTH數(shù)據(jù)收集通過(guò)湖北醫(yī)藥學(xué)院附屬太和醫(yī)院倫理委員會(huì)批準(zhǔn),免除受試者知情同意,批準(zhǔn)文號(hào):2023KS11,收集日期為2014 年10 月至2023 年7 月。UPENN 和UCSF 數(shù)據(jù)為公共數(shù)據(jù)庫(kù)資源,二者的完整數(shù)據(jù)已分別獲得UPENN 和UCSF 的倫理委員會(huì)批準(zhǔn)且均可在癌癥影像檔案(The Cancer Imaging Archive, TCIA)獲得,免除受試者知情同意。此外,UPENN 數(shù)據(jù)收集日期為2006 年至2018 年,UCSF 數(shù)據(jù)收集日期為2015 年至2021 年。本研究的納入標(biāo)準(zhǔn):(1)符合2016、2021 WHO 中樞神經(jīng)系統(tǒng)腫瘤分級(jí)為GBM 的患者;(2)術(shù)前MRI 圖像包括對(duì)比增強(qiáng)T1 加權(quán)成像(contrast enhanced T1-weighted imaging,T1WI-CE)序列、T2 液體衰減反轉(zhuǎn)恢復(fù)(T2 fluid attenuation inversion recovery, T2-FLAIR)序列和彌散張量成像(diffusion tensor imaging, DTI)的各向異性分?jǐn)?shù)(fractional anisotropy, FA)參數(shù)圖,并且序列完整、圖像清晰;(3)完整的MGMT分子信息及臨床信息。排除標(biāo)準(zhǔn):排除低級(jí)別膠質(zhì)瘤。最終,600 例患者病例符合納入標(biāo)準(zhǔn),其中HBMUTH、UPENN和SPPH數(shù)據(jù)集分別有13、214和373例。
HBMUTH 數(shù)據(jù)采用48 通道陣列線圈的3.0 T Scanner (Discovery 750W, SIGNA Architect; GE Healthcare)進(jìn)行MRI 掃描。采集協(xié)議具體采用T1WI-CE 序列(TR/TE 2000-2600 ms/20-22 ms,F(xiàn)OV 240 mm×240 mm,層厚5.0 mm,矩陣512×512)、T2-FLAIR 序列(TR/TE 9000-9900 ms/130-150 ms,F(xiàn)OV 240 mm×240 mm,層厚5.0 mm,矩陣512×512)和DTI序列(TR/TE 9500 ms/98 ms,F(xiàn)OV 240 mm×240 mm,層厚5.0 mm,矩陣256×256),由GE 后處理工作站對(duì)DTI圖像進(jìn)行后處理得到FA圖。注射0.1 mmol/kg的釓噴替酸葡甲胺(Gd-DPTA)后獲得T1WI-CE 圖像。UPENN 術(shù) 前MRI 圖 像 使 用1.5 T 和3.0 T 掃 描 儀(Siemens)獲得,所有患者術(shù)前均掃描T1WI-CE 序列(矩陣192×256×192,分辨率0.98×0.98×1.00;TR/TE 1760 ms/3.1 ms),T2-FLAIR 序列(矩陣192×256×60,分辨率0.94×0.94×3.00,TR/TE 9420 ms/141 ms)和DTI 序列(矩陣128×128×40,分辨率1.72×1.72×3.00,TR/TE 3100-8000 ms/104 ms)。注射0.3 mL/kg 釓貝酸二葡甲胺后獲得T1WI-CE 圖像。由Siemens 后處理工作站對(duì)DTI 圖像進(jìn)行后處理得到FA 圖。UCSF 術(shù)前MRI 圖像均使用3.0 T 掃描儀(Discovery 750, GE Healthcare)和專(zhuān)用的8 通道頭部線圈(Invivo,Gainesville),掃描T2-FLAIR序列(TR/TE 5700 ms/115 ms,層厚1.2 mm,矩陣256×256)、T1WI-CE 序列(TR/TE 6 ms/2.3 ms,層厚1.0 mm,矩陣256×256)、DTI 序列(TR/TE 8400 ms/73 ms,層厚2 mm,矩陣128×128);在研究期間,使用兩種釓基對(duì)比劑:0.1 mL/kg 釓布醇(gadobutrol,Gadovist, Bayer)和0.2 mL/kg 釓 特 酸 葡 胺(gadoterate, Dotarem, Guerbet)。DTI 數(shù)據(jù)經(jīng)渦流校正并使用來(lái)自FSL版本6.0.2(FMRIIB,https://fsl.fmrib.ox.ac.uk/fsl/fslwiki)的渦流和DTIFIT 模塊處理,產(chǎn)生FA圖像。
在預(yù)處理過(guò)程中,包括去除顱骨、配準(zhǔn)、重采樣以及圖像強(qiáng)度歸一化處理等步驟。針對(duì)經(jīng)過(guò)預(yù)處理后的圖像,我們使用先前多模態(tài)腦腫瘤分割挑戰(zhàn)賽(Multimodal Brain Tumor Segmentation Challenges,BraTS)中的先進(jìn)分割算法集成模型進(jìn)行自動(dòng)分割[15-17]。然后,由一位具有15年神經(jīng)放射科工作經(jīng)驗(yàn)的醫(yī)生利用ITK-SNAP 軟件(http://www.itksnap.org)進(jìn)行手動(dòng)校正。圖像的分割結(jié)果涵蓋了三個(gè)主要腫瘤區(qū)域:增強(qiáng)腫瘤、中心非增強(qiáng)和/或壞死腫瘤以及周?chē)鶩LAIR異常(由非增強(qiáng)腫瘤和相關(guān)水腫區(qū)域組成),如圖1所示。
圖1 腫瘤生境亞區(qū)分割圖。第一行為79 歲男性膠質(zhì)母細(xì)胞瘤O6-甲基鳥(niǎo)嘌呤-DNA 甲基轉(zhuǎn)移酶(MGMT)啟動(dòng)子甲基化患者,第二行為52 歲男性膠質(zhì)母細(xì)胞瘤非甲基化患者。上下兩行從左到右依次為對(duì)比增強(qiáng)T1WI序列(T1WI-CE)、液體衰減反轉(zhuǎn)恢復(fù)(FLAIR)序列和各向異性分?jǐn)?shù)(FA)參數(shù)圖。紅色亞區(qū)為壞死區(qū)域,黃色亞區(qū)為增強(qiáng)區(qū)域,綠色亞區(qū)為水腫區(qū)域。Fig.1 Diagram of tumor habitat subsegmentation.The first line is a 79-year-old male glioblastoma O6-methylguanine-DNA methyltransferase(MGMT) promoter methylation patient, and the second line is a 52-year-old male glioblastoma non-methylated patient.The upper and lower rows, from left to right, are the contrast-enhanced T1-weighted imaging (T1WI-CE)sequence, fluid attenuation inversion recovery sequence (FLAIR), and fractional anisotropy (FA) map.The red subregion is necrotic region, the yellow subregion is the enhanced region, and the green subregion is the edema region.
為了從MRI 圖像中高通量地提取腫瘤部分的影像組學(xué)特征,我們將使用Python 3.10 來(lái)調(diào)用PyRadiomic 包。該包可以從T1WI-CE、FLAIR 和FA 三個(gè)序列的3 個(gè)亞區(qū)域中提取影像組學(xué)特征,總共有9 種區(qū)域進(jìn)行特征提取。這些特征可以分為三組:幾何形狀、強(qiáng)度和紋理。幾何特征描述了腫瘤的三維形狀特征。強(qiáng)度特征描述了腫瘤內(nèi)體素強(qiáng)度的一階統(tǒng)計(jì)(Firstorder)分布。紋理特征描述了強(qiáng)度的模式或二階和高階空間分布。我們將使用多種方法來(lái)提取紋理特征,包括灰度共現(xiàn)矩陣(gray level co-occurrence matrix, GLCM)、灰度運(yùn)行長(zhǎng)度矩陣(gray level run length matrix, GLRLM)、灰度大小區(qū)域矩陣(gray level size zone matrix, GLSZM)、灰度依賴矩陣(gray level dependence matrix,GLDM)和鄰域灰度差異矩陣(neighborhood gray tone difference matrix, NGTDM)。對(duì)于每個(gè)患者的MRI單序列中的每個(gè)區(qū)域,我們將提取2153個(gè)特征:14個(gè)形狀特征、18個(gè)一階特征、75個(gè)紋理特征以及基于多種濾波變換所獲得的一階特征和紋理特征。這些特征可以對(duì)腫瘤的不同維度進(jìn)行量化分析,以提取其特征和特性。更詳細(xì)的特征介紹請(qǐng)參考PyRadiomic官網(wǎng)(https://pyradiomics.readthedocs.io/en/latest/features.html#)。
本研究將HBMUTH 數(shù)據(jù)、UPENN 數(shù)據(jù)和UCSF 數(shù)據(jù)整合,并以7∶3比例隨機(jī)分為訓(xùn)練集和測(cè)試集。在進(jìn)行特征篩選之前,對(duì)訓(xùn)練集特征進(jìn)行了歸一化處理,將不同特征縮放到相同數(shù)量級(jí)。接著,對(duì)訓(xùn)練集進(jìn)行了特征篩選,具體分為以下四步:(1)采用Pearson相關(guān)性分析來(lái)衡量特征與甲基化狀態(tài)的相關(guān)性,并排除相關(guān)性絕對(duì)值小于0.05的特征。(2)采用最小冗余最大相關(guān)算法(minimum redundancy maximum relevance, MRMR)將復(fù)雜的變量系統(tǒng)分解成一組最相關(guān)的變量,以減少冗余。(3)通過(guò)對(duì)變量之間的相關(guān)性進(jìn)行分析,選擇了TOP 100 特征,并確保這些特征之間沒(méi)有重疊。(4)采用Boruta 算法來(lái)選擇“confirm”特征。Boruta是一種用于選擇相關(guān)特征的包裝器算法,它通過(guò)比較原始特征的重要性和隨機(jī)特征的重要性來(lái)自上而下地搜索相關(guān)特征。在每次迭代中檢查當(dāng)前真實(shí)特征是否比最好的陰影特征具有更高的重要性,并逐步剔除那些被視為不重要的特征,以最大程度地減少誤差[18]?;谶@些步驟,我們選擇了XGBoost來(lái)構(gòu)建預(yù)測(cè)模型。XGBoost是一種強(qiáng)大的梯度提升算法,以其出色的預(yù)測(cè)性能、準(zhǔn)確的分類(lèi)能力以及對(duì)不平衡數(shù)據(jù)的有效管理而備受青睞。同時(shí),該算法還應(yīng)用了L1 和L2 正則化,以避免過(guò)擬合[19]。目前,它在許多分類(lèi)競(jìng)賽中得到廣泛應(yīng)用。根據(jù)各區(qū)域的影像學(xué)特征,我們使用XGBoost開(kāi)發(fā)組學(xué)模型,以預(yù)測(cè)GBM中MGMT基因啟動(dòng)子甲基化的有效性。以受試者工作特征(receiver operating characteristic,ROC)曲線及其曲線下面積(area under the curve,AUC)、準(zhǔn)確度、敏感度和特異度等指標(biāo)評(píng)價(jià)模型診斷效能,DeLong檢驗(yàn)對(duì)比模型差異性。
進(jìn)行卡方檢驗(yàn)以確定兩組間性別的差異性,使用獨(dú)立樣本t檢驗(yàn)評(píng)估年齡分布的差異,P<0.05 認(rèn)為差異具有統(tǒng)計(jì)學(xué)意義。本研究特征篩選部分采用R軟件4.1.3版本(www.R-project.org),模型構(gòu)建采用Python 中的scikit-learn 包(scikit-learn 版本0.23,Python 版本3.10),統(tǒng)計(jì)分析采用 SPSS 軟件27.0版本(https://www.ibm.com/analytics/spssstatistics-software)實(shí)現(xiàn)。
MGMT 基因啟動(dòng)子的兩種分子亞型在訓(xùn)練集和測(cè)試集中的臨床資料統(tǒng)計(jì)描述如表1 所示。在訓(xùn)練集及測(cè)試集中,兩種分子亞型在年齡和性別方面P均>0.05,表示在訓(xùn)練集和測(cè)試集上兩種分子亞型之間的差異沒(méi)有統(tǒng)計(jì)學(xué)意義。
表1 訓(xùn)練集和測(cè)試集臨床資料的比較Tab.1 Comparison of clinical data in training set and validation set
2.2.1 特征篩選結(jié)果
通過(guò)Pearson 相關(guān)性分析、MRMR 和Boruta 進(jìn)行降維處理后,我們篩選出了每組的最佳特征。在增強(qiáng)區(qū)域FA+FLAIR+T1WI-CE 序列得到了8 個(gè)特征。在壞死區(qū)域FA+FLAIR+T1WI-CE 序列得到了7 個(gè)特征。在瘤周水腫區(qū)域中FA+FLAIR+T1WI-CE 序列得到了10 個(gè)特征。最終,多模態(tài)多區(qū)域的特征集上得到10 個(gè)特征,其中2 個(gè)屬于增強(qiáng)區(qū)域,3 個(gè)屬于水腫區(qū)域,5個(gè)屬于壞死區(qū)域,具體結(jié)果見(jiàn)表2和圖2。
表2 Brouta降維處理后影像組學(xué)特征及其重要性平均值Tab.2 Important features and importance mean values in each group after Brouta dimensionality reduction
圖2 Brouta特征篩選圖。Fig.2 Features selection map of Brouta.
2.2.2 模型診斷效能評(píng)估
GBM 三個(gè)腫瘤生境亞區(qū)(壞死,水腫,增強(qiáng))的影像組學(xué)模型對(duì)MGMT基因啟動(dòng)子甲基化狀態(tài)的預(yù)測(cè)中均表現(xiàn)出較優(yōu)的性能(圖3)。在每個(gè)區(qū)域中,多模態(tài)(T1WI-CE_FA_FLAIR)組合構(gòu)建影像組學(xué)模型是優(yōu)于單一序列模型及結(jié)構(gòu)序列組合(T1WI-CE_FLAIR)。所構(gòu)建的具有3 個(gè)模態(tài)和3 個(gè)區(qū)域的多模態(tài)多區(qū)域聯(lián)合模型在訓(xùn)練集上的AUC為0.874(0.841-0.906),在測(cè)試集上的AUC 為0.899 (0.853-0.944)(表3)。經(jīng)DeLong 檢驗(yàn),測(cè)試集上多區(qū)域多模態(tài)組合模型與增強(qiáng)和水腫的聯(lián)合模型存在顯著差異(Z=2.65,P<0.05),與其他模型間不存在顯著差異(P>0.05)。
圖3 訓(xùn)練集和測(cè)試集多模態(tài)多區(qū)域影像組學(xué)模型受試者工作特征曲線。Fig.3 Receiver operating characteristic curves of the multi-region multi-modal radiomics model for the training and validation sets.
在本研究中,我們利用多模態(tài)預(yù)處理MRI 圖像(T1WI-CE、FLAIR和FA)從腫瘤生境的不同亞區(qū)(增強(qiáng)腫瘤、瘤周水腫和非增強(qiáng)腫瘤區(qū)域以及腫瘤壞死區(qū)域)獲得的放射組學(xué)特征,建立一個(gè)用于預(yù)測(cè)GBM的MGMT甲基化狀態(tài)的多模態(tài)多區(qū)域影像組學(xué)模型。結(jié)果顯示模型具有良好的預(yù)測(cè)性能(訓(xùn)練集和測(cè)試集的AUC分別為0.874 和0.899)。本研究在GBM 層面使用常規(guī)MRI和彌散MRI參數(shù)FA結(jié)合的影像組學(xué)方法,預(yù)測(cè)MGMT甲基化狀態(tài)為國(guó)內(nèi)外首次被提出。MGMT甲基化狀態(tài)的準(zhǔn)確預(yù)測(cè)為GBM患者分子分型的精準(zhǔn)診斷、TMZ的臨床治療決策及生存期預(yù)測(cè)提供了重要的臨床輔助價(jià)值。
生境一般指物種或物種群體賴以生存的自然生態(tài)環(huán)境。腫瘤本身作為一個(gè)復(fù)雜的類(lèi)似于自然生態(tài)系統(tǒng)的生態(tài)部落,其內(nèi)部的異質(zhì)性亞區(qū)類(lèi)似于自然生態(tài)系統(tǒng)的棲息地,每個(gè)亞區(qū)遵循適者生存原則,在各種壓力作用下進(jìn)行生長(zhǎng)增殖和治療抵抗,與腫瘤的進(jìn)展和預(yù)后息息相關(guān)。先前通過(guò)反復(fù)穿刺活檢以證實(shí)腫瘤內(nèi)部異質(zhì)性,但小樣本組織并不能全面揭示,且受限于患者的配合程度,操作者的熟練程度等條件。生境成像根據(jù)放射組學(xué)理念,基于病理學(xué)和生物學(xué)等差異,利用定量影像學(xué)標(biāo)志可以全面非侵入性地表征腫瘤環(huán)境,可視化和量化腫瘤內(nèi)部異質(zhì)性。對(duì)于GBM,放射組學(xué)的能力已經(jīng)擴(kuò)展到捕獲腫瘤棲息地中的疾病異質(zhì)性。先前常用無(wú)監(jiān)督算法識(shí)別腫瘤生境亞區(qū),我們根據(jù)Brats腦腫瘤分割比賽的排名top分割算法,將腫瘤自動(dòng)劃分為三個(gè)具有可能導(dǎo)致不同生物學(xué)行為區(qū)域:水腫區(qū)域、增強(qiáng)區(qū)域和壞死區(qū)域[17,20-22]。水腫區(qū)域通常位于腫瘤周邊,反映腫瘤正常組織對(duì)腫瘤的生物學(xué)反應(yīng)。增強(qiáng)區(qū)域反映腫瘤的血供情況,其形狀和分布可以提供關(guān)于腫瘤邊緣和邊界的信息。壞死區(qū)域常由于血供不足導(dǎo)致缺血和壞死,對(duì)腫瘤的生長(zhǎng)和擴(kuò)散產(chǎn)生影響。
我們基于多模態(tài)MRI 圖像每個(gè)亞區(qū)可獲取6000 多個(gè)高維特征。因此,特征篩選是構(gòu)建影像組學(xué)模型前的關(guān)鍵步驟。本研究中所采取的三步法從不同方面進(jìn)行特征篩選。基于隨機(jī)森林的Boruta算法篩選出所有與因變量具有相關(guān)性的特征集合,幫助我們更全面理解因變量的影響因素,得到更優(yōu)的影像組學(xué)特征[23]。經(jīng)過(guò)特征篩選我們得到10 個(gè)特征以描述腫瘤異質(zhì)性:2個(gè)特征來(lái)自FA序列增強(qiáng)區(qū)域;3個(gè)水腫區(qū)域的特征分別來(lái)自于本研究所納入的三個(gè)序列;5 個(gè)壞死區(qū)域的特征來(lái)自于FA 和FLAIR 序列。所獲取的特征以濾波處理后的圖像強(qiáng)度和紋理特征為主,通過(guò)濾波變換挖掘圖像更深層次與腫瘤生物學(xué)變化相關(guān)信息。VERMA等[21]從腫瘤的增強(qiáng)、壞死、水腫生境中提取影像組學(xué)特征,特征篩選后所保留的紋理特征和強(qiáng)度特征與腫瘤細(xì)胞浸潤(rùn)及血管增生、壞死增強(qiáng)交界的缺氧區(qū)域密切相關(guān)。此外,來(lái)自于DTI參數(shù)圖FA的特征占大多數(shù)提示功能序列可能包含更多的與GBM MGMT 甲基化等相關(guān)的分子標(biāo)記物的狀態(tài)變化的特征信息,在之后要增加這一部分的研究。
結(jié)合多序列多模態(tài)MRI 和生境成像技術(shù)可以幫助我們更好地理解GBM 的病理生理變化。在本研究中從多模態(tài)MRI 序列(T1WI-CE、FLAIR、FA)提取腫瘤三個(gè)生境亞區(qū)的影像組學(xué)特征,建立用于預(yù)測(cè)MGMT甲基化狀態(tài)的影像組學(xué)模型。結(jié)果顯示在訓(xùn)練集中的AUC 為0.874,在測(cè)試集中的AUC 為0.899,多模態(tài)多區(qū)域聯(lián)合的影像組學(xué)模型更具有魯棒性。先前幾項(xiàng)進(jìn)行影像組學(xué)的研究多是基于結(jié)構(gòu)序列進(jìn)行膠質(zhì)瘤MGMT 甲基化狀態(tài)預(yù)測(cè)的研究。SHA 等[24]基于498 名異檸檬酸脫氫酶突變型膠質(zhì)瘤患者的T1CE 和FLAIR圖像預(yù)測(cè)MGMT啟動(dòng)子甲基化狀態(tài),在測(cè)試集和獨(dú)立驗(yàn)證集中AUC 分別為0.916 和0.866。此外,兩位學(xué)者基于T1CE 的組學(xué)模型在預(yù)測(cè)MGMT 啟動(dòng)子甲基化狀態(tài)方面的AUC 為0.9 以上[25-26]。XI 等[27]研究證明T1、T2 以及T1CE 序列放射組學(xué)特征作為預(yù)測(cè)GBM中MGMT 啟動(dòng)子甲基化潛在影像學(xué)標(biāo)記,訓(xùn)練集準(zhǔn)確度為0.86,測(cè)試集準(zhǔn)確度為0.80。部分研究在多參數(shù)多序列組合時(shí)選擇納入功能序列相關(guān)圖像(如ADC)對(duì)MGMT 甲基化的表達(dá)進(jìn)行預(yù)測(cè),也表現(xiàn)出優(yōu)于結(jié)構(gòu)序列的性能[28-30]。這些研究多是以整個(gè)腫瘤作為高通量信息的獲得區(qū)域,這樣就無(wú)法與潛在的腫瘤微環(huán)境相聯(lián)系起來(lái)。不同模態(tài)的MRI 序列所擁有的信息是不相同的,每個(gè)生境都包含了獨(dú)特的微環(huán)境信息,結(jié)合二者在GBM患者的腫瘤病理生理變化評(píng)估和幫助新輔助治療等方面具有廣闊前景。
多模態(tài)MR 生境成像研究相較于以往傳統(tǒng)結(jié)構(gòu)MRI 不僅表征了腫瘤解剖結(jié)構(gòu),還進(jìn)一步評(píng)估了患者的病理生理情況和潛在的腫瘤微環(huán)境相聯(lián)系。Brats分割算法相較于手動(dòng)分割能提供更為準(zhǔn)確的生境亞區(qū),更準(zhǔn)確地描述膠質(zhì)瘤復(fù)雜的空間異質(zhì)性。因此在此基礎(chǔ)上所構(gòu)建的影像組學(xué)模型能夠獲取到更多的信息層面以及更全面地了解GBM 特征,有助于改進(jìn)GBM的治療和診斷策略。此外,特征選擇方面,特征組合帶來(lái)的非線性關(guān)系更適合于Boruta算法以獲取魯棒特征。XGBoost在許多機(jī)器學(xué)習(xí)競(jìng)賽和實(shí)際應(yīng)用中表現(xiàn)出更高的魯棒性,同時(shí)減少了過(guò)擬合的風(fēng)險(xiǎn)。
當(dāng)然,本研究依然屬于回顧性研究,樣本量雖然整體較多并來(lái)自于多個(gè)中心,但是當(dāng)?shù)氐膰?guó)內(nèi)的患者樣本量與公開(kāi)數(shù)據(jù)庫(kù)中的樣本量處于極不平衡的狀態(tài),下一步還需多與國(guó)內(nèi)的其他研究中心或醫(yī)院合作,開(kāi)展多中心研究,進(jìn)一步增加病例數(shù)。此外,MRI中其他具有臨床意義的功能序列如灌注成像、彌散成像相關(guān)的其他參數(shù)及更高級(jí)的彌散技術(shù)也將被納入研究。除了機(jī)器學(xué)習(xí)外,深度學(xué)習(xí)也越來(lái)越火熱,在膠質(zhì)瘤分割分類(lèi)方面也可進(jìn)行這方面的研究[31-34]。
綜上所述,本研究通過(guò)構(gòu)建多模態(tài)生境亞區(qū)影像組學(xué)模型術(shù)前無(wú)創(chuàng)預(yù)測(cè)GBM 的MGMT 啟動(dòng)子甲基化狀態(tài),該模型能夠帶來(lái)魯棒性更高的預(yù)測(cè)性能,為GBM 患者的精確診斷、化療使用決策及生存狀況預(yù)測(cè)提供臨床輔助價(jià)值。
作者利益沖突聲明:全體作者均聲明無(wú)利益沖突。
作者貢獻(xiàn)聲明:吳磊設(shè)計(jì)本研究的方案,對(duì)稿件重要內(nèi)容進(jìn)行了修改,獲得了吳階平臨床科研專(zhuān)項(xiàng)基金的資助;焦凱劍起草和撰寫(xiě)稿件,獲取、分析或解釋本研究的數(shù)據(jù);楊波、陳文、方鈺輝、陳亞琳獲取、分析或解釋本研究的數(shù)據(jù),對(duì)稿件重要內(nèi)容進(jìn)行了修改,其中楊波獲得了湖北省自然科學(xué)基金的資助;全體作者都同意發(fā)表最后的修改稿,同意對(duì)本研究的所有方面負(fù)責(zé),確保本研究的準(zhǔn)確性和誠(chéng)信。