南海燕,張欣,顏林楓,楊洋,韓宇,王文,崔光彬
作者單位:
空軍軍醫(yī)大學(xué)唐都醫(yī)院放射診斷科,西安 710038
膠質(zhì)瘤是危害人類健康的主要惡性腫瘤之一[1]。世界衛(wèi)生組織根據(jù)病理組織學(xué)標(biāo)準(zhǔn)將其分為Ⅰ~Ⅳ四個(gè)級(jí)別,其中Ⅰ級(jí)和Ⅱ級(jí)為低級(jí)別膠質(zhì)瘤(low grade glioma,LGG),Ⅲ級(jí)和Ⅳ級(jí)為高級(jí)別腫瘤(high grade glioma,HGG)。膠質(zhì)瘤分級(jí)與治療和預(yù)后密切相關(guān),但病理組織學(xué)檢查是有創(chuàng)的,且不能全面反映腫瘤的異質(zhì)性及惡性程度,亟需開(kāi)發(fā)一種無(wú)創(chuàng)、高效的膠質(zhì)瘤術(shù)前診斷技術(shù)[2]。
磁共振成像(magnetic resonance imaging,MRI)以無(wú)創(chuàng)性、高組織分辨力等優(yōu)勢(shì)成為腫瘤診斷常用技術(shù),但常規(guī)MRI檢查難以明確膠質(zhì)瘤的級(jí)別。研究表明,HGG血管內(nèi)皮細(xì)胞增生明顯,瘤內(nèi)新生微血管生成速率更快,新生不成熟的微血管較LGG增多,通透性更高。動(dòng)態(tài)對(duì)比增強(qiáng)磁共振成像(dynamic contrast-enhanced MRI,DCEMRI)技術(shù)通過(guò)動(dòng)態(tài)監(jiān)測(cè)對(duì)比劑在體內(nèi)的吸收、代謝等藥代動(dòng)力學(xué)過(guò)程,可以獲得反映組織微循環(huán)通透性的定量參數(shù),因此,在膠質(zhì)瘤分級(jí)診斷中具有重要的應(yīng)用潛力[3-8]。然而,現(xiàn)有的DCEMRI影像診斷研究多采用受試者工作曲線(receiver operating characteristic curve,ROC)方法,對(duì)各參數(shù)的診斷性能進(jìn)行評(píng)估,難以對(duì)腫瘤進(jìn)行個(gè)體化預(yù)測(cè)[9]。隨著人工智能技術(shù)的快速發(fā)展,基于機(jī)器學(xué)習(xí)技術(shù)的計(jì)算機(jī)輔助診斷日益受到重視[10-11]。機(jī)器學(xué)習(xí)能自動(dòng)挖掘數(shù)據(jù)內(nèi)在的差異化模式,篩選與分類目標(biāo)相關(guān)的特征信息,得到自適應(yīng)的分類預(yù)測(cè)模型。因此,基于DCE-MRI定量參數(shù)信息,結(jié)合高效的機(jī)器學(xué)習(xí)分類技術(shù),構(gòu)建膠質(zhì)瘤術(shù)前自動(dòng)分級(jí)診斷系統(tǒng),對(duì)于膠質(zhì)瘤診斷、治療具有很大的指導(dǎo)意義[12]。
本研究共搜集了98例在我院經(jīng)手術(shù)病理證實(shí)的膠質(zhì)瘤患者,其中,LGG患者28例(Ⅰ級(jí)3例,Ⅱ級(jí)25例),HGG 患者70例(Ⅲ級(jí)20例,Ⅳ級(jí)50例)。所有患者均在病灶穿刺或手術(shù)切除前行常規(guī)MRI掃描及DCE-MRI檢查。該研究經(jīng)唐都醫(yī)院倫理委員會(huì)批準(zhǔn)同意,所有患者檢查前均被告知檢查內(nèi)容,自愿參與掃描,并簽署知情同意書(shū)。
1.2.1 研究方案
本研究主要分析流程見(jiàn)圖1。首先,基于DCE-MRI圖像進(jìn)行定量參數(shù)的計(jì)算;然后,在每一幅參數(shù)圖像上,對(duì)整個(gè)腫瘤區(qū)域進(jìn)行基于像素水平的直方圖統(tǒng)計(jì),得到各參數(shù)的特征信息;接著,采用特征選擇方法對(duì)特征集進(jìn)行篩選,挑選與膠質(zhì)瘤分級(jí)相關(guān)的最優(yōu)特征組合,并使用支持向量機(jī)(support vector machine,SVM)分類和10-fold交叉驗(yàn)證的方式,對(duì)定量參數(shù)的分類性能進(jìn)行評(píng)估與比較。
1.2.2 MRI數(shù)據(jù)采集
本實(shí)驗(yàn)掃描采用GE公司的Discovery MR750 3.0 T超導(dǎo)型磁共振儀,頭顱8通道相控陣線圈,均行常規(guī)MRI和DCE-MRI序列掃描。常規(guī)序列包括:T1WI及T1WI增強(qiáng)圖像(contrast-enhanced T1WI,T1ce),T1ce掃描在DCE-MRI掃描之后進(jìn)行。其掃描參數(shù)如下:TR 1750 ms,TE 24 ms,層厚5 mm,層間距1.5 mm,矩陣大小為256×256,視野240 mm×240 mm,激勵(lì)次數(shù)為1。DCE-MRI掃描采用動(dòng)態(tài)梯度回波T1,其成像參數(shù)為:TR 2.9 ms,TE 1.3 ms,反轉(zhuǎn)角12°,視野240 mm×240 mm,層厚2.5 mm,層間距為0 mm,矩陣大小為128×128,時(shí)間分辨率為4 s,連續(xù)掃描50個(gè)時(shí)相,第1~4個(gè)時(shí)相位蒙片,第5個(gè)時(shí)相開(kāi)始經(jīng)肘靜脈由高壓注射器以2 ml/s的速度注入釓雙胺對(duì)比劑(0.2 ml/kg),對(duì)比劑注射完畢后,即刻以同樣速度注入15 ml生理鹽水沖洗導(dǎo)管,以減少團(tuán)注后對(duì)比劑的殘留,總掃描時(shí)長(zhǎng)為3 min 20 s。
1.2.3 圖像處理
將DCE-MRI圖像數(shù)據(jù)導(dǎo)入NordicICE軟件(版本號(hào)4.0,NordicNeuroLab,Bergen,Norway),使用DCE模塊進(jìn)行定量參數(shù)的計(jì)算[9]。計(jì)算中,在動(dòng)態(tài)增強(qiáng)序列圖像由時(shí)間亮度信號(hào)轉(zhuǎn)換到時(shí)間濃度信號(hào)時(shí),使用固定T1值(1000 ms)。在評(píng)估動(dòng)脈輸入函數(shù)(arterial input function,AIF)時(shí),使用軟件自帶的基于群組水平(population-based)的AIF曲線。這里,選用Extended Tofts雙室模型模擬對(duì)比劑在血管(血漿)空間與血管外細(xì)胞外空間(extravascular extracellular space,EES)之間的交換過(guò)程[13]。共得到5個(gè)定量參數(shù),分別為:AIF曲線下面積(AUCAIF)、容積轉(zhuǎn)運(yùn)系數(shù)(Ktrans)、返流系數(shù)(Kep)、血管外細(xì)胞外間隙容積分?jǐn)?shù)(Ve)和血漿容積分?jǐn)?shù)(Vp)(圖2)。
接著,進(jìn)行腫瘤感興趣區(qū)域的分割。為了得到更為準(zhǔn)確的腫瘤參數(shù)信息,將層數(shù)較少的T1ce圖像(20層)配準(zhǔn)到層數(shù)較多的DCE-MRI圖像(64層)上,在配準(zhǔn)后的T1ce圖上手工逐層勾勒感興趣區(qū)域,并避開(kāi)明顯的壞死和水腫區(qū)域。
1.2.4 機(jī)器學(xué)習(xí)分類
(1)特征提?。夯贛atlab軟件平臺(tái),采用基于像素水平的直方圖統(tǒng)計(jì)分析方法對(duì)腫瘤區(qū)域內(nèi)的各參數(shù)信息進(jìn)行統(tǒng)計(jì),計(jì)算各參數(shù)的均值、中位數(shù)、眾數(shù)、標(biāo)準(zhǔn)差、方差、標(biāo)準(zhǔn)誤、峰度、偏度、最小值、最大值、上百分位數(shù)、下百分位數(shù)、四分位數(shù)、第5、10、90、95百分位數(shù)、上百分之五均值、下百分之五均值、能量、熵、峰值高度、峰值對(duì)應(yīng)X軸坐標(biāo)等23個(gè)統(tǒng)計(jì)指標(biāo),作為相應(yīng)參數(shù)圖的特征集合。(2)特征選擇:這里采用SVM遞歸剔除特征(support vector machine recursive feature elimination,SVM-RFE)方法,基于Weka (版本號(hào)3.8.0)軟件平臺(tái)實(shí)現(xiàn)[14]。具體地,根據(jù)SVM訓(xùn)練時(shí)生成的權(quán)重構(gòu)造特征排序系數(shù),每次迭代去掉排序系數(shù)最小的一個(gè)特征,最后得到所有特征的遞減排序結(jié)果,根據(jù)分類性能選擇最優(yōu)特征個(gè)數(shù)。(3)數(shù)據(jù)均衡化和歸一化:本實(shí)驗(yàn)的LGG和HGG樣本存在嚴(yán)重的不均衡,這會(huì)使得訓(xùn)練的SVM分類模型明顯地偏向于大樣本所屬類別,模型的泛化能力很差,需要對(duì)數(shù)據(jù)進(jìn)行均衡化。本實(shí)驗(yàn)采用合成少數(shù)類過(guò)采樣技術(shù)(synthetic minority oversampling technique,SMOTE),對(duì)樣本數(shù)少的一類(即LGG)進(jìn)行擴(kuò)增。歸一化操作是將每一特征根據(jù)其所有樣本的變化范圍線性變換到“0、1”區(qū)間,進(jìn)一步提高模型的訓(xùn)練速度和泛化能力。(4)SVM分類:SVM方法是基于統(tǒng)計(jì)學(xué)習(xí)理論的一種機(jī)器學(xué)習(xí)方法,能夠在統(tǒng)計(jì)樣本量少的情況下獲得數(shù)據(jù)良好的統(tǒng)計(jì)規(guī)律。將上述各參數(shù)的特征數(shù)據(jù)集作為輸入樣本,使用SVM分類器進(jìn)行學(xué)習(xí)、訓(xùn)練。采用10-fold交叉驗(yàn)證方法,對(duì)各分類模型的性能進(jìn)行評(píng)估,主要統(tǒng)計(jì)以下評(píng)價(jià)指標(biāo):正確率(accuracy)和ROC曲線下面積(area under the curve,AUC)。
首先,使用每一參數(shù)的原始特征數(shù)據(jù)集(未均衡化)及五種參數(shù)特征數(shù)據(jù)集合分別作為輸入樣本,進(jìn)行SVM學(xué)習(xí)訓(xùn)練;然后,采用SMOTE技術(shù)對(duì)少類樣本擴(kuò)增(LGG:70,HGG:70)后,再進(jìn)行SVM模型的訓(xùn)練。兩組數(shù)據(jù)構(gòu)建的分類模型其性能見(jiàn)表1。
可以看到,當(dāng)使用原始未經(jīng)過(guò)均衡化的特征數(shù)據(jù)集進(jìn)行分類訓(xùn)練時(shí),由于樣本分布的不平衡性(LGG:28,HGG:70),各分類模型的accuracy雖然都大于0.7,但AUC非常低(接近0.5),說(shuō)明建立起來(lái)的分類模型幾乎沒(méi)有任何意義,無(wú)法對(duì)膠質(zhì)瘤進(jìn)行準(zhǔn)確分級(jí)。對(duì)數(shù)據(jù)進(jìn)行SMOTE處理后,訓(xùn)練得到的各參數(shù)模型的AUC都有顯著提升。除Vp參數(shù)的分類性能較差外,其他四種參數(shù)的分類性能都相對(duì)較高(accuracy和AUC都在0.75左右)。此外,當(dāng)將五種參數(shù)的特征集合并在一起進(jìn)行學(xué)習(xí)訓(xùn)練時(shí),其分類模型的accuracy和AUC都明顯增加(0.821)。這說(shuō)明綜合利用各參數(shù)的特征表達(dá)信息,可以構(gòu)建更為準(zhǔn)確的膠質(zhì)瘤分級(jí)模型。
圖1 本研究主要流程圖Fig. 1 Flow chart of this study.
根據(jù)SVM-RFE特征遞減排序結(jié)果,步長(zhǎng)為1,依次選擇前1,2,…,n個(gè)(特征總數(shù))特征用于SVM分類訓(xùn)練,得到的分類模型accuracy隨特征數(shù)目的變化情況分別如圖3(a)~(f)所示。其中,橫軸代表特征個(gè)數(shù),縱軸代表accuracy,紅色圓球表示使用最優(yōu)特征組合分類accuracy,藍(lán)色圓球代表使用所有特征的分類accuracy。比較發(fā)現(xiàn),經(jīng)SVMRFE特征選擇后,除AUCAIF參數(shù)的分類性能沒(méi)有變化外,其他參數(shù)(Ktrans、Kep、Ve、Vp)分類模型的accuracy都有顯著提高(0.771、0.786、0.779、0.621)。使用五種參數(shù)特征組合訓(xùn)練得到的分類模型accuracy仍然是最高的,其accuracy也明顯增加,即從0.821增加到0.864。此外,這些模型的AUC也同步增加(表2)。
圖2 1例27歲女性低級(jí)別膠質(zhì)瘤患者(Ⅱ級(jí))和1例64歲男性高級(jí)別膠質(zhì)瘤患者(Ⅳ級(jí))的定量參數(shù)示意圖Fig. 2 The parameter maps from a 27-year-old female with low grade glioma (Grade Ⅱ) and a 64-year-old male with high grade glioma.
圖3 經(jīng)SVM-RFE特征遞減排序后,使用不同數(shù)目的參數(shù)特征SVM分類的正確率。A~F依次為:AUCAIF參數(shù)特征、Ktrans參數(shù)特征、Kep參數(shù)特征、Ve參數(shù)特征、Vp參數(shù)特征、五種參數(shù)組合特征Fig. 3 The classification accuracy of SVM using different number of features after SVM-RFE feature decrement sorting. A—F represents: AUCAIF, Ktrans, Kep,Ve, Vp and the combination of these 5 parameters.
表1 使用各參數(shù)的原始特征與SMOTE特征數(shù)據(jù)集進(jìn)行LGG與HGG分類性能Tab.1 Classification of LGG and HGG using original features and features applied SMOTE
表2 經(jīng)SVM-RFE特征選擇后,LGG與HGG (70和70)分類模型性能Tab. 2 The performance of LGG and HGG classification model after SVM-RFE feature selection
與2.1中結(jié)果類似,使用五種參數(shù)特征組合構(gòu)建的分類模型的性能最高,其正確率以及AUC值都達(dá)到0.864(表2),說(shuō)明聯(lián)合五種參數(shù)構(gòu)建的膠質(zhì)瘤分級(jí)模型效果更佳。該模型共使用13種參數(shù)特征,分別包括:Ktrans參數(shù)的下百分位數(shù)/四分位數(shù)/標(biāo)準(zhǔn)誤、Kep參數(shù)的標(biāo)準(zhǔn)誤、四分位數(shù)、最小值、峰值對(duì)應(yīng)X軸坐標(biāo)、Ve參數(shù)的偏度第95百分位數(shù)、Vp參數(shù)的標(biāo)準(zhǔn)誤、峰值高度、標(biāo)準(zhǔn)差和AUCAIF參數(shù)的熵。
膠質(zhì)瘤是顱內(nèi)最常見(jiàn)的原發(fā)性惡性腫瘤,級(jí)別不同,治療方式及預(yù)后差別很大。在組織學(xué)分級(jí)中,膠質(zhì)瘤血管內(nèi)皮增殖程度是診斷腫瘤惡性程度的標(biāo)準(zhǔn),但是病理檢查具有創(chuàng)傷性和采樣誤差,尋找一種無(wú)創(chuàng)的術(shù)前準(zhǔn)確診斷腫瘤級(jí)別的方法尤為重要。
DCE-MRI技術(shù)能夠定量測(cè)算腫瘤血管的滲透性參數(shù),真實(shí)反映膠質(zhì)瘤血管的血腦屏障破壞程度,進(jìn)一步反映腫瘤的惡性程度以及生物學(xué)行為,在膠質(zhì)瘤分級(jí)診斷中具有重要價(jià)值[4]。另一方面,采用先進(jìn)的機(jī)器學(xué)習(xí)技術(shù),能夠自動(dòng)挖掘數(shù)據(jù)內(nèi)在的聯(lián)系,訓(xùn)練高效、自動(dòng)化的分類預(yù)測(cè)模型。因此,本研究提出了一種基于DCE-MRI定量參數(shù)的術(shù)前膠質(zhì)瘤自動(dòng)分級(jí)技術(shù)。實(shí)驗(yàn)結(jié)果表明:(1)除Vp參數(shù)外,使用AUCAIF、Ktrans、Kep、Ve等參數(shù)直方圖特征構(gòu)建的SVM分類模型,可以較好地對(duì)膠質(zhì)瘤進(jìn)行分級(jí);(2)聯(lián)合使用腫瘤的AUCAIF、Ktrans、Kep、Ve、Vp等參數(shù)信息,可以有效地提高分級(jí)模型的準(zhǔn)確度;(3)聯(lián)合腫瘤的多參數(shù)特征信息,結(jié)合SVM-RFE特征選擇和SVM分類器,其分級(jí)模型的性能有顯著的提升。
本研究尚有一定的局限性:(1)膠質(zhì)瘤分級(jí)樣本的不均衡。雖然本實(shí)驗(yàn)采用了SMOTE處理,并不能完全代表少類樣本數(shù)據(jù)的真實(shí)分布,須引入更多真實(shí)LGG樣本進(jìn)行測(cè)試;(2)定量參數(shù)的計(jì)算采用的是Extended Tofts模型,后續(xù)將嘗試其他模型進(jìn)行綜合比較,尋求適用于膠質(zhì)瘤分級(jí)的最優(yōu)計(jì)算模型;(3)對(duì)參數(shù)圖像僅提取了直方圖特征[15],考慮到腫瘤的異質(zhì)性特點(diǎn),后續(xù)引入圖像的紋理分析[16]、小波分析等提取更多特征信息,尋求膠質(zhì)瘤分級(jí)的最優(yōu)特征組合。
總之,本研究利用DCE-MRI定量參數(shù)提供的腫瘤血管生成及破壞方面的特征信息,采用高效的機(jī)器學(xué)習(xí)技術(shù),構(gòu)建了一套較為準(zhǔn)確的膠質(zhì)瘤分級(jí)診斷技術(shù),為臨床準(zhǔn)確判定膠質(zhì)瘤術(shù)前級(jí)別提供了新思路。