南海燕,楊洋,顏林楓,張欣,王文,崔光彬
膠質(zhì)瘤是最常見的中樞神經(jīng)系統(tǒng)腫瘤且死亡 率高,世界衛(wèi)生組織(World Health Organization,WHO)標準將其分為Ⅰ、Ⅱ、Ⅲ、Ⅳ級,不同級別膠質(zhì)瘤手術(shù)方案和預(yù)后情況不同,因此術(shù)前精準診斷膠質(zhì)瘤級別非常重要[1-2]。病理診斷是目前膠質(zhì)瘤診斷的金標準,但是存在時間滯后性和采樣誤差[2]。隨著科技的發(fā)展,磁共振技術(shù)已經(jīng)成為膠質(zhì)瘤術(shù)前診斷的主要技術(shù)手段[3-4],不斷有先進的功能序列被研發(fā)出來,可以從結(jié)構(gòu)、血流、細胞代謝等方面反映腫瘤的不同信息,其中動態(tài)對比增強磁共振(dynamic contrast enhanced magnetic resonance imaging,DCE-MRI)序列通過動態(tài)監(jiān)測對比劑在體內(nèi)的吸收和代謝等藥代動力學(xué)過程,獲得血流動力學(xué)定量參數(shù),觀察腫瘤組織血管分布與血流灌注信息,包括轉(zhuǎn)運常數(shù)(volume transfer constant,Ktrans)、部分細胞外血管外間隙容量(volume fraction of extravascular extracellular space,Ve)、血液回流常數(shù)(reflux constant,Kep)及血漿容積(fractional plasma volume,Vp)等。已經(jīng)有研究證明DCE-MRI在膠質(zhì)瘤分級問題上存在診斷價值[5-6],同時越來越多的研究開始使用紋理分析方法[7-9]。紋理分析不僅僅關(guān)注圖像的灰度值,還對圖像灰度空間分布模式情況提取和分析,得到相應(yīng)紋理參數(shù),可以量化腫瘤內(nèi)部的異質(zhì)性[10]。不同的紋理模型反映了灰度空間分布模式的不同特征,常見的紋理模型包括灰度共生矩陣(gray-level co-occurrence matrix,GLCM)、灰度游程長度矩陣(gray-level run-length matrix,GLRLM)和灰度區(qū)域大小矩陣(gray-level size-zone matrix,GLSZM)等[11-13]。但是,基于DCE-MRI數(shù)據(jù)的膠質(zhì)瘤分級問題首先需要解決的是選擇哪一種紋理模型。因此,本研究利用不同紋理模型提取DCEMRI參數(shù)圖的紋理特征,通過支持向量機遞歸特征消除(support vector machine recursive feature elimination,SVM-RFE)算法選擇特征后,使用SVM對膠質(zhì)瘤自動分級[14],來探究DCE-MRI圖像紋理提取方法對SVM膠質(zhì)瘤自動分級效能的影響,從而建立優(yōu)化后的分級模型。
收集本院首次發(fā)現(xiàn)未經(jīng)手術(shù)、放療和化療的疑似腦膠質(zhì)瘤患者行磁共振掃描,后經(jīng)術(shù)后病理證實為膠質(zhì)瘤患者共120例。依據(jù)2007年WHO標準病理診斷為Ⅰ級3例,Ⅱ級25例,Ⅲ級29例,Ⅳ級63例。本研究已獲得空軍軍醫(yī)大學(xué)唐都醫(yī)院倫理委員會批準(TDLL-20151013),并且臨床試驗已經(jīng)注冊(NCT02622620,https://www.clinicaltrials.gov/)。由于I級膠質(zhì)瘤樣本量過小,為避免樣本量不均引起的偏倚,排除Ⅰ級后共剩余117例。
采用美國GE公司Discovery MR750 3.0 T超導(dǎo)型磁共振儀,頭部8通道線圈,傳統(tǒng)結(jié)構(gòu)像掃描序列包括:(1)橫軸位快速反轉(zhuǎn)恢復(fù)擾相梯度回波T1加權(quán)像:重復(fù)時間1750 ms,回波時間24 ms,層厚5 mm,層間距1.5 mm,視野24 cm×24 cm,矩陣256×256;(2)快速自旋回波T2加權(quán)像:重復(fù)時間4247 ms,回波時間93 ms,層厚5 mm,層間距1.5 mm,視野24 cm×24 cm,矩陣512×512;(3)長T1反轉(zhuǎn)恢復(fù)像(fluid attenuated inversion recovery,F(xiàn)LAIR):重復(fù)時間8000 ms,回波時間65 ms,層厚5 mm,層間距1.5 mm,視野24 cm×24 cm,矩陣256×256;(4) DCE-MRI:重復(fù)時間2.9 ms,回波時間1.3 ms,層厚5 mm,層間距0 mm,視野24 cm×24 cm,矩陣128×128,翻轉(zhuǎn)角12°,單次掃描4 s,共50期。動態(tài)增強掃描第5個時相結(jié)束后采用高壓注射器同步靜脈注射小分子量釓雙胺對比劑歐乃影(Omniscan,GE Healthcare),注射速率2 ml/s,注射劑量0.2 ml/kg,并以相同速率注射生理鹽水15 ml沖洗導(dǎo)管;(5)增強后T1加權(quán)像(T1Ce):在動態(tài)增強序列后采集,序列參數(shù)與增強前T1加權(quán)成像相同。
1.3.1 腫瘤分割
利用磁共振灌注圖像分析軟件NordicICE(Version 4.0;NordicNeuroLab,Bergen,Norway)中重采樣模塊,將增強后T1加權(quán)成像和FLAIR圖像通過最近鄰法上采樣至與DCE圖像相同層數(shù)和大小。參考T1加權(quán)像、FLAIR、增強后T1加權(quán)像在重采樣后的增強后T1加權(quán)像或FLAIR圖像上逐層劃取腫瘤區(qū)域,盡量避開囊變、壞死及正常血管,得到分割后三維腫瘤區(qū)域。
1.3.2 DCE圖像處理
將所有動態(tài)增強圖像導(dǎo)入NordicICE,通過DCE模塊計算相應(yīng)灌注參數(shù)圖。其中動脈輸入函數(shù)(arterial input function,AIF)選擇軟件自帶通用函數(shù),T1值固定為1000 ms,利用藥代動力學(xué)模型Extended Tofts Linear兩室模型擬合計算灌注參數(shù)圖,參數(shù)圖示例見圖1。
1.3.3 紋理特征提取
利用MATLAB開源代碼“Radiomics”計算相應(yīng)紋理特征。獲得三維腫瘤區(qū)域后,選取包含整個三維病灶的最小立方體并標準化至各向同性,在灰階分別為32、64、128和256時計算每個患者4種參數(shù)圖病灶區(qū)域的13個GLCM(沿空間均勻分布的13個方向)、1個GLRLM和1個GLSZM矩陣。最終在不同灰階下,每個患者得到32個GLCM特征、52個GLRLM特征和52個GLSZM矩陣。
將各模型提取的紋理特征輸入到開源數(shù)據(jù)挖掘平臺WEKA (Waikato Environment for Knowledge Analysis),由于各級別樣本量不同,為不造成因樣本量不同而引起的分類偏倚,首先采用SMOTE(Synthetic Minority Over-sampling Technique)算法將Ⅱ、Ⅲ級別腫瘤分別上采樣至與Ⅳ級相同數(shù)量。通過SVM-RFE特征選擇算法依據(jù)特征權(quán)重對紋理特征從大到小排序,依次選擇權(quán)重排序前1~n的特征組,分類采用線性SVM及留一法交叉驗證(leave-one-out cross-validation,LOOCV)。
所有分類結(jié)果使用Graphpad Prism 6統(tǒng)計軟件分析,比較不同紋理模型和不同灰階對分類效能的影響采用多因素方差分析和Bonferroni校正。P<0.05為差異有統(tǒng)計學(xué)意義。
圖1 兩例膠質(zhì)瘤患者DCE-MRI參數(shù)圖表現(xiàn),紅色表示腫瘤區(qū)域。其中第一行為Ⅱ級膠質(zhì)瘤患者,女,78歲;第二行為Ⅳ級膠質(zhì)瘤患者,女,45歲Fig. 1 DCE-MRI parameter maps from two patients with glioma, the red region represents tumor. The first line is grade Ⅱ, female, 78-year-old; second line is grade Ⅳ, female, 45-year-old.
圖2 不同特征數(shù)時分類效能變化(灰階=32),橫坐標表示所選特征數(shù)(間隔=1),縱坐標為正確率,各模型下分類正確率最高的點用紅色表示Fig. 2 Classi fication performance of GLCM, GLRLM and GLSZM with gray-level 32 using different feature subsets. Feature number (interval=1) on the horizontal axis and accuracy on the vertical. Red dot represents best performance.
表1 不同紋理模型不同灰階時所有特征組正確率Tab.1 All feature subsets of different textural models with different gray-levels
表1 不同紋理模型不同灰階時所有特征組正確率Tab.1 All feature subsets of different textural models with different gray-levels
灰階 GLCM GLRLM GLSZM 32 0.73±0.04 0.73±0.03 0.71±0.03 64 0.73±0.03 0.71±0.03 0.69±0.07 128 0.74±0.04 0.72±0.02 0.69±0.09 256 0.71±0.05 0.71±0.03 0.73±0.05
不同紋理模型下不同灰階時,每組特征組輸入支持向量機后得到相應(yīng)正確率,將結(jié)果統(tǒng)計如表1所示。多因素方差分析結(jié)果顯示,(1)灰階對分類效能的影響差異無統(tǒng)計學(xué)意義(P=0.1589);(2)紋理模型對分類效能的影響差異存在統(tǒng)計學(xué)意義(P<0.0001),其中,灰階為64和128時,GLCM和GLRLM、GLSZM存在顯著差異。從表1可以看到,GLCM整體平均正確率最高,GLSZM效能相對較差。
由于灰階對分類效能的影響差異無統(tǒng)計學(xué)意義,圖2顯示了灰階為32時,選擇不同特征數(shù)對分類效能的影響。GLCM在選擇前22個特征時效能最高,正確率為0.79;GLRLM在選擇前42個特征時效能最高,正確率為0.77;GLSZM在前9個、11個、17個、35個和42個特征時效能最高,正確率為0.75。
實驗結(jié)果發(fā)現(xiàn):(1)灰階對分類效能的影響差異無統(tǒng)計學(xué)意義;(2)紋理模型的選擇對分類效能的影響差異存在統(tǒng)計學(xué)意義,其中GLCM相比較效能最佳。在使用GLCM提取紋理特征并且灰階為32和256時,分別選取前22個和前17個特征所得分類正確率最高(正確率=0.79,AUC=0.89)。因此,在使用DCE圖像紋理特征對支持向量機膠質(zhì)瘤自動分級時,建議選擇GLCM紋理提取模型并結(jié)合特征選擇技術(shù)。因為灰階越大,相應(yīng)的運算量和運算時間越大,而從本實驗中得出灰階對SVM膠質(zhì)瘤分級效能的影響差異無統(tǒng)計學(xué)意義,因此優(yōu)先選擇小的灰階值。
已經(jīng)有研究使用紋理分析方法診斷膠質(zhì)瘤,但是產(chǎn)生的結(jié)果不一致。一部分原因是使用的紋理模型和MRI序列不同,Eliat 等[13]使用灰階直方圖(gray-level histogram,GLH)、GLCM和GLRLM鑒別惡性膠質(zhì)神經(jīng)元腫瘤和其他惡性膠質(zhì)瘤,使用GLRLM時陽性預(yù)測值為0.58,GLCM陽性預(yù)測值為0.75。Skogen等[7]則使用軟件TexRAD提取灰階直方圖特征來區(qū)分低級別和高級別膠質(zhì)瘤,正確率達0.93。想要將計算機輔助診斷系統(tǒng)應(yīng)用于臨床,必須達到穩(wěn)定可靠的分類效能,然而在多種紋理模型中選擇一種適用于膠質(zhì)瘤分級的模型比較困難。本實驗僅選擇了3種常用的二階紋理模型,其他模型(如灰度差分矩陣、局部共生矩陣的游程矩陣)也存在各自的優(yōu)勢,因此,今后的研究需要綜合比較更多的紋理模型,從而更加深入地理解腫瘤異質(zhì)性,以期得到適用于膠質(zhì)瘤分級的模型。
另一方面,本實驗所涉及的樣本量相對不均衡,所采用的SMOTE算法的思想是合成新的少數(shù)類樣本,合成的策略是對每個少數(shù)類樣本a,從它的最近鄰中隨機選一個樣本b,然后在a、b之間的連線上隨機選一點作為新合成的少數(shù)類樣本[8]。雖然SMOTE消除了樣本量不均衡引起的偏倚問題,但是部分用于分類的數(shù)據(jù)并非真實值,后期需要納入更加均衡的樣本或納入多中心實驗數(shù)據(jù)進一步驗證結(jié)果。本研究未采用測試組數(shù)據(jù)驗證分類器,而是使用LOOCV技術(shù)代替是研究的另一局限性,后期研究仍需持續(xù)納入患者作為測試組驗證分類器效能。
綜上,本研究建立和優(yōu)化了基于DCE圖像紋理特征的支持向量機膠質(zhì)瘤自動分級系統(tǒng),發(fā)現(xiàn)灰階對分類效能無影響,紋理模型GLCM在灰階為32時結(jié)合特征選擇是膠質(zhì)瘤分級的最優(yōu)方案。