盧明君,屈耀銘,馬安東,朱建彬,鄒 霞,林耕耘,李榆欣,劉昕孜,溫志波
南方醫(yī)科大學(xué)珠江醫(yī)院影像診斷科,廣東 廣州 510282
膠質(zhì)瘤是中樞神經(jīng)系統(tǒng)最常見(jiàn)的惡性腫瘤,是原發(fā)性腦腫瘤患者死亡的主要原因。彌漫性較低級(jí)別膠質(zhì)瘤(Ⅱ/Ⅲ級(jí))占所有膠質(zhì)瘤的43.2%[1]。一部分彌漫性較低級(jí)別膠質(zhì)瘤可在幾月內(nèi)發(fā)展為多形性膠質(zhì)母細(xì)胞瘤[2]。早期檢測(cè)膠質(zhì)瘤1p/19q共缺失狀態(tài)與預(yù)后水平有關(guān),對(duì)化療敏感,并且可以識(shí)別少突膠質(zhì)細(xì)胞瘤[3]。通常,使用熒光原位雜交(FISH)可以識(shí)別1p/19q的狀態(tài),包括測(cè)量1p36/1q21和19q13/19p13的含量。但是,由于部分患者年齡較大、神經(jīng)系統(tǒng)狀況差和腫瘤的位置等原因,并不適合手術(shù)或活檢,因此需要一種非侵入性的方法來(lái)預(yù)測(cè)膠質(zhì)瘤1p/19q的狀態(tài)。
1p/19q共缺失與少突膠質(zhì)細(xì)胞瘤高度相關(guān)。一些常規(guī)的CT或MRI影像學(xué)特征可用于診斷及區(qū)分少突膠質(zhì)細(xì)胞瘤與星形細(xì)胞瘤。其中,T2-FLAIR錯(cuò)配征是IDH突變型星形細(xì)胞瘤的一個(gè)重要的影像學(xué)特征,具有高特異性和低敏感性[4,5]。少突膠質(zhì)細(xì)胞瘤的鈣化發(fā)生率達(dá)到43%~80%[6]。然而,當(dāng)膠質(zhì)瘤無(wú)鈣化或T2-FLAIR錯(cuò)配征時(shí),傳統(tǒng)的放射學(xué)鑒別少突膠質(zhì)膠質(zhì)瘤和星形細(xì)胞瘤的效果有限。
影像組學(xué)作為一種高通量方法,可以預(yù)測(cè)腫瘤表型、基因組學(xué)和生存水平。已有研究使用影像組學(xué)模型預(yù)測(cè)1p/19q狀態(tài)[7-11],但是采用單一序列或者缺少功能序列,組學(xué)信息較少,而且構(gòu)建機(jī)器學(xué)習(xí)模型類型單一,尚未進(jìn)行不同機(jī)器學(xué)習(xí)模型診斷效能的比較。本研究主要目的是構(gòu)建基于多模態(tài)MRI的影像組學(xué)模型來(lái)預(yù)測(cè)1p/19q共缺失狀態(tài),并且建立多個(gè)組學(xué)模型進(jìn)行比較,同時(shí)與影像醫(yī)師診斷效能作比較。
本研究通過(guò)南方醫(yī)科大學(xué)珠江醫(yī)院倫理委員會(huì)批準(zhǔn)(批件號(hào):2020-KY-058-01)。收集從2015年10月~2022年9月本院292例接受手術(shù)并且病理證實(shí)為彌漫性較低級(jí)別膠質(zhì)瘤患者的資料,包括患者年齡、性別、腫瘤位置、MRI圖像以及病理資料。納入標(biāo)準(zhǔn):患者年齡≥18 歲;病理證實(shí)為Ⅱ或Ⅲ級(jí)膠質(zhì)瘤;均經(jīng)過(guò)FISH檢測(cè)1p/19q狀態(tài);MR檢查前未接受過(guò)放療和化療;排除標(biāo)準(zhǔn):T1WI、T2WI、FLAIR、對(duì)比增強(qiáng)T1WI(CET1WI)、DWI序列不完整或缺失;圖像質(zhì)量較差;曾經(jīng)接受過(guò)放化療和復(fù)發(fā)的膠質(zhì)瘤患者。最終本研究共納入已知1p/19q狀態(tài)的彌漫性較低級(jí)別膠質(zhì)瘤104例患者,其中Ⅱ級(jí)膠質(zhì)瘤70例,Ⅲ級(jí)膠質(zhì)瘤34例,年齡為42.7±12.5歲(18~75歲),男性60例。
在3.0T Philip MR掃描儀上進(jìn)行顱腦MRI掃描,包括Achieva、Ingenia和Ingenia Eltion X(Philips Medical System,Best,The Netherlands)。本研究流程圖見(jiàn)圖1。
圖1 本研究的影像組學(xué)流程圖Fig.1 Radiomics workflow of the study.
使用SPM 12 軟件將T1WI、FLAIR、CE-T1WI 和DWI 序列配準(zhǔn)到T2WI 序列中(https://www.fil.ion.ucl.ac.uk/spm/software/spm12/)。一位影像醫(yī)師(具有3年神經(jīng)腫瘤影像學(xué)診斷經(jīng)驗(yàn))使用ITK-SNAP軟件(www.ITK-SNAP.org)手動(dòng)描繪了三維感興趣體積(VOI)。主要根據(jù)FLAIR 序列描繪腫瘤邊緣,然后使用T2WI 和CE-T1WI序列交叉檢查腫瘤邊緣的精細(xì)程度,并去除了腫瘤內(nèi)壞死、囊變和出血部分,另一位影像醫(yī)師(具有8年神經(jīng)腫瘤影像學(xué)診斷經(jīng)驗(yàn))隨機(jī)選擇了30例患者的MR數(shù)據(jù),并對(duì)腫瘤區(qū)域進(jìn)行了勾畫(huà),對(duì)ROI勾畫(huà)不一致的進(jìn)行討論,最終意見(jiàn)達(dá)成一致。兩位影像醫(yī)師對(duì)患者的臨床特征和腫瘤分子狀態(tài)并不知情。
使用FAE軟件(0.5.3 version)從MRI圖像的VOI中提取影像組學(xué)特征[12]。對(duì)所有體素進(jìn)行重新采樣后,提取特征,包括:(1)70個(gè)基于形狀的特征;(2)90個(gè)一階統(tǒng)計(jì)量;(3)120個(gè)灰度共生矩陣(GLCM);(4)80個(gè)灰度大小區(qū)域(GLSZM);(5)80 個(gè)灰級(jí)游程長(zhǎng)度矩陣(GLRLM);(6)25個(gè)相鄰灰度差矩陣(NGTDM);(7)70個(gè)灰度相關(guān)性矩陣(GLDM),從多參數(shù)MRI 中提取535個(gè)特征,包括T2WI、T1WI、FLAIR、CE-T1WI和DWI序列。
在FAE軟件中刪除無(wú)效的特征和病例。104例患者根據(jù)其臨床特征(年齡和性別)按照7:3的比例分成訓(xùn)練集和驗(yàn)證集。
為了消除不相關(guān)和冗余的特征并且避免數(shù)據(jù)的過(guò)度擬合,挖掘特征是一個(gè)必要的過(guò)程。在特征選擇之前,使用上采樣來(lái)消除訓(xùn)練集和驗(yàn)證集的不平衡。我們?cè)谔卣骶仃嚿蠎?yīng)用了Z分?jǐn)?shù)和均值歸一化。由于特征空間的維數(shù)很高,我們比較了每個(gè)特征對(duì)的相似度。如果特征對(duì)的PCC值大于0.990,刪除其中一個(gè)特征。遞歸特征消除(RFE)、方差分析(ANOVA)、KW和Relief用于特征選擇,特征選擇數(shù)量范圍為0~21。使用邏輯回歸(LR)、支持向量機(jī)(SVM)、基于邏輯回歸的最小絕對(duì)收縮和選擇算子(LRlasso)和線性判別分析(LDA)作為分類器來(lái)構(gòu)建模型。最后,為了確定模型的超參數(shù)(例如特征數(shù)量),對(duì)訓(xùn)練集進(jìn)行10折交叉驗(yàn)證。
一名住院醫(yī)師(在神經(jīng)腫瘤影像學(xué)方面具有3年診斷經(jīng)驗(yàn))和一名主治醫(yī)師(在神經(jīng)腫瘤影像學(xué)方面具有7年診斷經(jīng)驗(yàn))根據(jù)T2WI、T1WI、FLAIR、CE-T1WI和DWI圖像來(lái)對(duì)彌漫性較低級(jí)別膠質(zhì)瘤患者1p/19q共缺失狀態(tài)進(jìn)行預(yù)測(cè),主要觀察腫瘤是否出現(xiàn)鈣化、位置深淺和T2-FLAIR錯(cuò)配征。影像組學(xué)模型和影像醫(yī)師獲得圖像信息是相同的,對(duì)患者的臨床特征和分子狀態(tài)都不知情。影像醫(yī)師使用5分法來(lái)預(yù)測(cè)1p/19q共缺失狀態(tài)。1分(可信度:0%~20%),2分(可信度:20%~40%),3分(可信度:40%~60%),4分(可信度:60%~80%:,5分(可信度:80%~100%)。
本研究使用SPSS 27.0 和MedCalc 20.1.4軟件進(jìn)行統(tǒng)計(jì)分析,所有連續(xù)變量表示為均數(shù)±標(biāo)準(zhǔn)差,分類變量表示為計(jì)數(shù)(百分比)。采用Shapiro-Wilk檢驗(yàn)對(duì)連續(xù)變量進(jìn)行正態(tài)檢驗(yàn),符合正態(tài)分布的連續(xù)變量采用兩獨(dú)立樣本t檢驗(yàn),否則采用Mann-Whitney檢驗(yàn)。分類變量采用卡方檢驗(yàn)。使用受試者工作特性曲線下面積(AUC)來(lái)評(píng)估影像組學(xué)模型和影像醫(yī)師的預(yù)測(cè)效能。不同影像組學(xué)模型和醫(yī)生的AUC值對(duì)比采用DeLong檢驗(yàn)。P<0.05(雙側(cè))為差異具有統(tǒng)計(jì)學(xué)意義。
訓(xùn)練集包括73例患者,驗(yàn)證集包括31例患者。訓(xùn)練集和驗(yàn)證集在年齡、性別、組織學(xué)分型和WHO分級(jí)方面的分布差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05,表1)。
表1 訓(xùn)練集和驗(yàn)證集描述Tab.1 Description of the training and validation datasets
從T2WI、T1WI、FLAIR、CE-T1WI和DWI圖像中共提取535個(gè)特征。應(yīng)用10折交叉驗(yàn)證,選擇8個(gè)特征構(gòu)建最優(yōu)的4個(gè)模型(表2),LR模型訓(xùn)練集和驗(yàn)證集的AUC為0.923和0.833,LRlasso模型訓(xùn)練集和驗(yàn)證集的AUC 為0.915 和0.819,SVM 模型訓(xùn)練集和驗(yàn)證集的AUC達(dá)到0.920和0.824,LDA模型訓(xùn)練集和驗(yàn)證集的AUC達(dá)到0.912和0.819。這4組模型的驗(yàn)證集AUC值比較接近(P>0.1,表3、4)。
表2 8個(gè)特征構(gòu)建LR、LRlasso、SVM、LDA影像組學(xué)模型Tab.2 Eight features for constructing the LR,LRlasso,SVM,and LDAmodels
表3 4組影像組學(xué)模型在訓(xùn)練集的分類性能Tab.3 Classification performance of the 4 radiomics models on the training dataset
表4 4組影像組學(xué)模型在驗(yàn)證集的分類性能Tab.4 Classification performance of the 4 radiomics models on the validation dataset
影像科住院醫(yī)師的AUC=0.645(95%CI: 0.441~0.849)低于4 組影像組學(xué)模型(AUC=0.833、0.819、0.824、0.819;P=0.011,0.022,0.016,0.030),但是影像科主治醫(yī)師的AUC=0.838(95%CI:0.692-0.985)稍高于4組影像組學(xué)模型(P>0.05,圖2)。
圖2 LR、LRlasso、SVM和LDA模型以及影像醫(yī)師的ROC曲線分析Fig.2 ROC curve analysis of the prediction results by LR,LRlasso,SVM,and LDA models and by the neuroradiologists.
本研究從T2WI、T1WI、FLAIR、CE-T1WI和DWI圖像中提取影像組學(xué)特征,并且構(gòu)建了LR、LRlasso、SVM、LDA 4個(gè)影像組學(xué)模型用于預(yù)測(cè)較低級(jí)別膠質(zhì)瘤1p/19q的共缺失狀態(tài)。研究結(jié)果顯示LR、LRlasso、SVM和LDA模型的AUC分別為0.833、0.819、0.824和0.819,但這4組模型之間的診斷效能差異無(wú)統(tǒng)計(jì)學(xué)意義(P均>0.1)。4組影像組學(xué)模型的AUC均高于住院醫(yī)師,但和主治醫(yī)師診斷效能相仿。本研究證明多模態(tài)MRI影像組學(xué)模型可以非侵入性地預(yù)測(cè)彌漫性較低級(jí)別膠質(zhì)瘤1p/19q共缺失狀態(tài)。
本研究構(gòu)建4組不同的組學(xué)模型,其中篩選特征都相同,可能說(shuō)明這些特征比較穩(wěn)定。篩選的特征包括從CE-T1WI提取的original_firstorder_Skewness特征,偏度表示腫瘤內(nèi)部體素信號(hào)不一致,有研究顯示1p/19q共缺失膠質(zhì)瘤更容易發(fā)生囊變、水腫和鈣化等[13,14],所以腫瘤內(nèi)部信號(hào)差異較大,即偏度相對(duì)越大。從T1WI序列中提取original_ngtdm_Busyness 特征,Busyness 稱為繁忙度,是像素到相鄰區(qū)域變化的度量,與腫瘤內(nèi)部信號(hào)不均勻有關(guān)。
1p/19q是膠質(zhì)瘤最重要的分子之一,1p/19q共缺失不僅可以識(shí)別少突膠質(zhì)細(xì)胞瘤,而且對(duì)化療敏感。除了對(duì)輔助治療敏感外,1p/19q也是指導(dǎo)手術(shù)切除的重要分子。有研究發(fā)現(xiàn),星形細(xì)胞瘤的全部切除有利于患者的預(yù)后,但是對(duì)少突膠質(zhì)細(xì)胞瘤的患者沒(méi)有受益[15]。據(jù)報(bào)道,全切和非全切對(duì)IDH突變和1p/19q共缺失型WHOⅢ級(jí)膠質(zhì)瘤患者的預(yù)后無(wú)差異,但是對(duì)IDH突變和1p/19q非共缺失膠質(zhì)瘤患者有顯著影響[16]。因此,識(shí)別1p/19q狀態(tài)對(duì)于外科醫(yī)師選擇手術(shù)方式非常重要。目前在臨床中,主要通過(guò)手術(shù)或者穿刺這種侵入性方式來(lái)識(shí)別1p/19q共缺失狀態(tài),非侵入性地預(yù)測(cè)1p/19q共缺失狀態(tài)仍然是一項(xiàng)挑戰(zhàn)。
有研究發(fā)現(xiàn)當(dāng)T2-FLAIR錯(cuò)配比例大于50%時(shí)可以非常準(zhǔn)確地預(yù)測(cè)1p/19q非共缺失(特異度為100%),而腫瘤內(nèi)部出現(xiàn)鈣化可以高度預(yù)測(cè)1p/19q共缺失(特異度為97%)[17]。在臨床中有些患者缺少CT資料,所以腫瘤內(nèi)部的鈣化有時(shí)并不容易判斷,同時(shí)T2-FLAIR錯(cuò)配癥和鈣化的敏感度較低(敏感度分別為37%和29%),且這項(xiàng)研究樣本量較小,所以我們并不能完全依賴這些特征來(lái)預(yù)測(cè)1p/19q的狀態(tài)。Yang等[18]發(fā)現(xiàn)使用常規(guī)序列和先進(jìn)的功能序列(DWI、SWI、DSC-PWI)可以預(yù)測(cè)膠質(zhì)瘤1p/19q共缺失狀態(tài),當(dāng)把所有常規(guī)序列和功能序列結(jié)合預(yù)測(cè)1p/19q共缺失狀態(tài)時(shí),其敏感度、特異度和AUC分別為80.36%、78.57%、0.88。有研究顯示使用功能序列DWI、PWI和MRS雖然可以預(yù)測(cè)腫瘤的分級(jí)[19],但是無(wú)法區(qū)分1p/19q的狀態(tài)。
影像組學(xué)由于其無(wú)創(chuàng)性和重復(fù)性強(qiáng)等特點(diǎn),被用來(lái)預(yù)測(cè)腫瘤分級(jí)、分子分型以及預(yù)后。影像組學(xué)可以識(shí)別我們?nèi)庋蹮o(wú)法識(shí)別的特征,而這些特征與腫瘤異質(zhì)性有一定的相關(guān)性。較多學(xué)者使用常規(guī)MRI序列的影像組學(xué)模型來(lái)預(yù)測(cè)1p/19q共缺失狀態(tài),但是使用較先進(jìn)功能序列的影像組學(xué)模型來(lái)預(yù)測(cè)1p/19q共缺失的研究相對(duì)較少[20-23]。有研究發(fā)現(xiàn)DWI可以非侵入性地反映腫瘤細(xì)胞和細(xì)胞外空間[24],且有研究認(rèn)為1p/19q共缺失膠質(zhì)瘤比1p/19q非共缺失膠質(zhì)瘤強(qiáng)化比例更高[25,26],因此,我們最終選擇將CE-T1WI、DWI與其他常規(guī)序列結(jié)合來(lái)預(yù)測(cè)較低級(jí)別膠質(zhì)瘤1p/19q共缺失狀態(tài),并和影像醫(yī)師的診斷效能做比較。
有研究使用基于T2WI序列的影像組學(xué)模型預(yù)測(cè)1p/19q 共缺失,顯示AUC 為0.760(0.663~0.857)[8]。Sun等[7]使用1.5T和3T磁共振獲取常規(guī)MRI和DWI圖像,提取MRI影像組學(xué)特征后,構(gòu)建隨機(jī)森林(RF)模型來(lái)預(yù)測(cè)1p/19q共缺失狀態(tài),AUC值為0.7579。相比之下,本研究構(gòu)建的4 組影像組學(xué)模型(AUC=0.833、0.819、0.824、0.819)診斷效能更優(yōu),可能原因是:(1)使用多模態(tài)磁共振圖像;(2)勾畫(huà)三維ROI;(3)RF不是最優(yōu)模型;(4)MRI磁場(chǎng)強(qiáng)度不一致。有研究提取T2WI和CE-T1WI 圖像中特征,在構(gòu)建的7 組影像組學(xué)模型(Adaptive boosting、k-nearest neighbours、stochastic gradient descent、RF、SVM、Naive Bayes、Neural network),AUC范圍為0.7179~0.869[23]。本研究4個(gè)組學(xué)模型的AUC 比Adaptive boosting,k-nearest neighbours、stochastic gradient descent 模型較高,與RF、SVM、Naive Bayes和Neural network模型相仿,可能原因是:(1)我們使用了多模態(tài)的MRI序列;(2)可能Adaptive boosting、k-nearest neighbours 和stochastic gradient descent并不是最優(yōu)模型。此外,我們將影像醫(yī)師的預(yù)測(cè)性能和影像組學(xué)模型進(jìn)行了比較,發(fā)現(xiàn)4個(gè)影像組學(xué)模型預(yù)測(cè)1p/19q共缺失的診斷效能高于住院醫(yī)師,而且達(dá)到了主治醫(yī)師的診斷級(jí)別。
本研究仍有一定的局限性:首先,樣本量較少,未來(lái)將收集更多樣本并使用深度學(xué)習(xí)方法來(lái)預(yù)測(cè)膠質(zhì)瘤的分子狀態(tài)。其次,這是一項(xiàng)單中心研究,沒(méi)有使用外部數(shù)據(jù)來(lái)驗(yàn)證模型有效性和重復(fù)性,未來(lái)需與其他中心合作。第三,本研究使用常規(guī)序列和DWI序列來(lái)預(yù)測(cè)1p/19q共缺失,計(jì)劃應(yīng)用一些其他的功能MRI序列,比如灌注加權(quán)成像、磁共振波譜、酰胺質(zhì)子轉(zhuǎn)移加權(quán)、擴(kuò)散張量成像等,這些序列其與腫瘤的微觀結(jié)構(gòu)相關(guān)。第四,1p/19q非共缺失和共缺失的彌漫性較低級(jí)別膠質(zhì)瘤患者比例不均衡。
綜上所述,基于多模態(tài)MRI(T2WI、T1WI、FLAIR、CE-T1WI、DWI)的影像組學(xué)模型可以在術(shù)前無(wú)創(chuàng)性地預(yù)測(cè)彌漫性較低級(jí)別膠質(zhì)瘤1p/19q共缺失狀態(tài),對(duì)患者進(jìn)行個(gè)性化治療提供可靠依據(jù)。本研究4個(gè)影像組學(xué)模型的診斷效能高于住院醫(yī)師,并且達(dá)到了主治醫(yī)師的診斷級(jí)別,將有助于臨床醫(yī)生提高診斷及預(yù)測(cè)效能,輔助臨床決策。