吳 聰,黃中勇,殷 浩,劉 罡,李江浩
基于卷積神經(jīng)網(wǎng)絡的腦膠質瘤分級
吳 聰,黃中勇,殷 浩,劉 罡,李江浩
(湖北工業(yè)大學計算機學院,湖北武漢430068)
針對腦膠質瘤人工分級難度大、費時費力的情況,提出一種改進的卷積神經(jīng)網(wǎng)絡方法來對腦膠質瘤進行分級。在傳統(tǒng)的卷積神經(jīng)網(wǎng)絡結構上增加一層卷積層和采樣層,同時使用支持向量機作為分類器;依據(jù)大腦結構自動定位腫瘤區(qū)域并輸入網(wǎng)絡進行分類。根據(jù)實驗結果得出,網(wǎng)絡的訓練準確率為85.27%,測試準確率為83.79%,均優(yōu)于傳統(tǒng)的網(wǎng)絡結構。
卷積神經(jīng)網(wǎng)絡;特征提??;腦膠質瘤分級;磁共振成像
腫瘤是對人體傷害巨大的多發(fā)性疾病,是危害神經(jīng)系統(tǒng)的顱內腫瘤。通常顱內腫瘤發(fā)生于腦組織、腦膜、顱神經(jīng)等,除此之外也可能從身體其他組織的惡性腫瘤轉移而形成。根據(jù)世界衛(wèi)生組織的分類[1],病理級為Ⅰ~Ⅱ級的少枝細胞膠質瘤、星型細胞瘤等為低級別膠質瘤;Ⅲ~Ⅳ級的成髓細胞瘤、星型細胞瘤等為高級別膠質瘤。最常見的顱內腫瘤為腦膠質瘤。低級別膠質瘤一般發(fā)展遲緩,容易治愈,但是高級別膠質瘤發(fā)病較快,難以治愈且復發(fā)率高。
磁共振成像(MRI,Magnetic Resonance Imaging)可用于對病人的檢查,因其在人體內部器官成像清晰的優(yōu)越性,常用于腦膠質瘤的檢查。根據(jù)Provenzale[2]與Greene[3]等研究表明,MRI圖像具有能反映膠質瘤級數(shù)的特征?,F(xiàn)如今對于腦膠質瘤分級,絕大部分依靠富有經(jīng)驗的醫(yī)生憑借肉眼來觀察患者的MRI圖像特征。但依靠人力來區(qū)分級數(shù),不僅費力耗時,而且受醫(yī)生主觀影響較大,容易發(fā)生誤診情況。
卷積神經(jīng)網(wǎng)絡(CNN,Convolutional Neural Networks)[4]對識別扭曲復雜的幾何形變有比較強的不變性,而且識別準確率相對于其他神經(jīng)網(wǎng)絡來說具有比較明顯的優(yōu)勢。提出一種基于CNN的腦膠質瘤分級方法,克服了傳統(tǒng)分級需要大量人力的缺點,把經(jīng)過一定處理的MRI圖像輸入網(wǎng)絡,讓網(wǎng)絡學習圖片特征并準確分類。
近些年來,卷積神經(jīng)網(wǎng)絡發(fā)展迅速,并逐漸成為一些研究領域的熱點,如:李健等[5]人把多尺度卷積神經(jīng)網(wǎng)絡應用于磁共振成像腦腫瘤分割中,分割精度優(yōu)于傳統(tǒng)的支持向量機模型;Sermanet等[6]人在交通信號識別中應用卷積神經(jīng)網(wǎng)絡模型取得了不錯的效果;Chen等[7]人在改進CNN結構后,提高了網(wǎng)絡的運算速度和魯棒性,并在人臉識別中驗證了其方法的有效性;Syafeeza等[8]人為了提高車牌識別的準確率,使用并優(yōu)化了CNN,取得了98%的識別準確率。
典型的CNN結構有五層(圖1),分別為卷積層C1,下采樣層S2,卷積層C3,下采樣層S4,全連接層(不包含輸入層和輸出層)[4]。其中K1×K1,K2× K2,K3×K3,K4×K4為各層間所使用的核。
圖1 典型的五層CNN結構圖
使用K×K的卷積核對前一層特征圖進行卷積操作,所得到的數(shù)值經(jīng)過一個激活函數(shù)后輸出此層特征圖的為卷積層,也稱為特征提取層。一個卷積層可以由多個特征圖組成,且一個特征圖可以和前一層的多個特征圖相連接。卷積層的神經(jīng)元提取前一層局部特征,由于共享權值,大大減少了網(wǎng)絡需要訓練的參數(shù)個數(shù),從而降低了CNN的復雜度。卷積層運算可由式(1)表達。
其中,F(xiàn)(x)為激活函數(shù),通常有兩種:雙曲正切函數(shù)F(x)=tanh(x)和Sigmoid函數(shù)F(x)=。Clj為第l層的第j個特征圖,Ml為
第l層輸入數(shù)據(jù)集,Kijl為卷積核,bjl為第l層的第j個特征圖所對應的偏置值。
一般地,特征提取層會后接特征映射層,也稱作采樣層。由卷積層輸出的特征圖經(jīng)過采樣層采樣后,特征圖數(shù)量一樣,但每個特征圖會變小。采樣層通常有兩種計算方式:最大值采樣(式(2))和均值采樣(式(3))。
其中,F(xiàn)(x)為激活函數(shù),Sjl為第l層的第j個特征圖,k(n,n)為輸入窗口矩陣,通常取2×2窗口。函數(shù)D(x)表示均值抽樣函數(shù),ajl和bjl為每個輸出特征圖所對應的可訓練參數(shù)和偏置值。
基于卷積神經(jīng)網(wǎng)絡的腦膠質瘤分級方法主要分為腫瘤區(qū)域定位和分級兩個步驟。醫(yī)療診斷中,醫(yī)生為了能較好地觀察病人的腦腫瘤情況,往往需要比較大的MRI圖像,而實際上腦腫瘤在整個圖像中只占了很小一部分(圖2)。
圖2 腦膠質瘤示意圖(腫瘤為圖中右上角)
如果直接把原始MRI圖輸入到CNN中進行訓練,勢必會造成網(wǎng)絡負擔過重,運行時間過長,分級準確率過低的情況產(chǎn)生。為了防止以上情況,需要對MRI圖中的腦腫瘤區(qū)域進行定位并分割出腫瘤所在的區(qū)域,如可選擇定位窗口為32×32大小或者44×44大小。腫瘤區(qū)域確認后,可將其輸入到網(wǎng)絡中進行訓練;并且同時進行分類測試。圖3為基于CNN的腦膠質瘤分級整體流程圖。
圖3 腦膠質瘤分級整體流程圖
CNN輸入層接收處理后的圖片數(shù)據(jù),多次通過卷積層和采樣層提取特征,之后進入分類器得出圖片的分級結果。網(wǎng)絡的學習過程為有監(jiān)督的,依據(jù)腦膠質瘤病情由輕到重的程度,分為Ⅰ、Ⅱ、Ⅲ和Ⅳ級,共四種分類。由于單次迭代并不能取得較好的分類準確度,所以卷積神經(jīng)網(wǎng)絡往往需要進行多次迭代并反饋結果以尋找最優(yōu)參數(shù)。
如圖2所示,未經(jīng)處理的MRI圖包含腦、顱骨和其他一些無關特征,在進行實驗之前需要對其進行處理。顱骨和其他一些無關特征為冗余信息,進行網(wǎng)絡訓練無意義且會加重網(wǎng)絡負擔,需要進行分割處理。腦和顱骨的灰度值相差不大,而且相互還有粘膜相連接,所以使用無交互分割算法會導致分割結果不太理想。使用Grabcut算法[10],此方法需人工畫出少量輔助節(jié)點,進而算法依靠節(jié)點來對目標圖像進行精確分割。圖4為分割前后對比圖,可以明顯看出,分割有效地保留了大腦部分。
圖4 分割前后對比圖
分割前后腫瘤周圍區(qū)域也可作為特征反映腫瘤的級數(shù),所以相對于單獨分割腫瘤與分割腫瘤所在區(qū)域來說,后者是理想的選擇。定位腫瘤在大腦中的位置可以根據(jù)左右腦半球的對稱性[11]。通常左右腦具有很高的對稱性,而且腦膠質瘤一般位于其中一個腦半球。根據(jù)這一特性,以腦中軸線為基準,對比左右腦的灰度情況,假若某一區(qū)域灰度值相差太大,則可以確定此區(qū)域為腫瘤所在。定位窗口為44×44像素大小(圖5),已經(jīng)囊括腫瘤,此區(qū)域可輸入卷積神經(jīng)網(wǎng)絡進行訓練和測試。
圖5 腦膠質瘤定位示意圖(白框區(qū)域為44×44像素)
此次實驗中,腦膠質瘤MRI圖來自相關醫(yī)院,經(jīng)分割、歸一化和定位處理后的MRI圖像為128×128像素灰度圖,均為橫斷面圖,總共860張。
前期處理后,將圖片轉化成44×44大小的二維矩陣,并標記每個矩陣所屬的膠質瘤級數(shù)。網(wǎng)絡的輸入層特征矩陣為44×44(圖6),經(jīng)過卷積操作后,C1層產(chǎn)生8張?zhí)卣鲌D,大小是40×40,卷積核的大小為5×5;采樣層為2×2均值采樣,共有8張?zhí)卣鲌D,其大小是20×20。C2層產(chǎn)生16張?zhí)卣鲌D,大小是16×16,卷積核為5×5;均值采樣層為16張?zhí)卣鲌D,其大小是8×8。C3層產(chǎn)生16張?zhí)卣鲌D,大小是4×4,卷積核為5×5;下接的均值采樣層有16張?zhí)卣鲌D,其大小是2×2。
F4層為全連接層,其與前一層為全連接結構,類似于BP(Back Propagation)神經(jīng)網(wǎng)絡[12]結構中的隱層。F4層的神經(jīng)元個數(shù)可由柯爾莫哥洛夫(Kolmogorov)定理得出,即神經(jīng)元個數(shù)=2a+1,a為F4層的輸入,a=16×2×2+1;由此可得出神經(jīng)元個數(shù)為131個,為方便計算,可令其為132個。
傳統(tǒng)的CNN分類器使用Softmax,可用于對手寫字符這類比較清晰明顯特征的分類,但對于腦膠質瘤分類效果不太理想。因此,本方法使用SVM(Support Vector Machine)分類器[13]。在解決“過擬合”問題上,SVM優(yōu)于Softmax模型,因為其在多維模式識別與非線性識別中具有比較大的優(yōu)勢。
圖6 膠質瘤分級網(wǎng)絡結構
對于反向傳播調整卷積核參數(shù),傳統(tǒng)的CNN使用的是批量梯度下降算法。雖然有助于尋找全局最優(yōu)的解,但是訓練耗時,網(wǎng)絡負擔也重。對此,本文方法使用了隨機梯度下降算法(SGD,Stochastic Gradient Descent)[14]。卷積核參數(shù)調整公式為(4)和(5):
F*(x)為激活函數(shù)的導數(shù),ax和bx為偏置值,Cx為采樣層Sx-1所對應的上一卷積層; 代表元素相乘,U(x)表示上采樣,D(x)表示下采樣;δx為靈敏度,η是學習率;Δax代表本層的參數(shù)更新。
由此,基于卷積神經(jīng)網(wǎng)絡的腦膠質瘤分級算法可如下表述:
1)原始MRI圖分割、定位等處理得到44×44大小含有腫瘤區(qū)域的二維圖;
2)給二維圖標簽,并建立訓練和測試數(shù)據(jù)集;
3)網(wǎng)絡初始化(參數(shù)賦值,設置迭代數(shù)等);
4)隨機抽取20個訓練樣本進行訓練,計算相應的誤差;
5)根據(jù)誤差值,反向傳播調整對應的參數(shù);
6)判斷網(wǎng)絡是否已經(jīng)收斂,是則往下一步,否則跳到4);
7)判斷是否完成全部迭代,是則往下一步,否則跳到4);
8)把測試集輸入訓練好的網(wǎng)絡進行測試,輸出測試準確率。
實驗所用的平臺是Matlab 2014a,系統(tǒng)是Windows 10,硬件為Core I7CPU,8GB內存。經(jīng)過前期處理后的圖片共860張,其中作為訓練集有680張,測試集為180張,均被處理為方便Matlab讀取的“.mat”數(shù)據(jù)包。表1為網(wǎng)絡迭代次數(shù)分別為1、10、20、30、40、50次的時候,訓練準確率和測試準確率數(shù)據(jù)。從表中可以看出,迭代數(shù)1~40次時,訓練和測試的分級準確率均逐漸提高;這說明了各層參數(shù)逐步收斂于最優(yōu)值,網(wǎng)絡也趨于成熟。但到第50次迭代時,訓練準確率下降,測試準確率也有小幅度的滑落。由此可得出,網(wǎng)絡的最佳迭代次數(shù)為40次,少則會導致網(wǎng)絡沒有充分訓練,多則導致準確率下降而且費時。
表1 腦膠質瘤分級準確率
為了探究網(wǎng)絡對膠質瘤四種級數(shù)的識別情況,從測試集中隨機抽取出Ⅰ、Ⅱ、Ⅲ和Ⅳ級圖各20張,經(jīng)處理后分別輸入已經(jīng)訓練好的網(wǎng)絡中進行測試,得出結果見表2。
表2 四種級數(shù)分級準確率
由表2可知,本網(wǎng)絡對腦膠質瘤級數(shù)為Ⅰ級和Ⅳ級的樣本識別準確率高;但是對Ⅱ級和Ⅲ級的識別的準確率低,Ⅲ級準確率甚至剛達到65%。這是由于Ⅱ級與Ⅲ級膠質瘤在外形上相差不大,易于與其他級數(shù)混淆。
前文提到分類器使用SVM比Softmax更有效,為了證實這一觀點,進行以下實驗。使用本文算法所用到的網(wǎng)絡,分類器分別使用SVM(記為CNN-SVM)與Softmax(記為CNN-SM),并用訓練集80張,200張,320張,440張和560張圖片進行訓練,迭代40次后使用80張測試集圖片進行測試,得到的測試準確率見圖7。
圖7 SVM分類器與Softmax分類器對比
由圖7可知,本文所使用的SVM分類器測試準確率好于Softmax分類器。在訓練集圖片達到560張的時候,使用SVM分類器對測試集圖片的準確率達到了80%。
典型的CNN網(wǎng)絡結構各有兩層卷積層與采樣層(記為算法一),而本文算法為了更好的識別腫瘤的特征采用了三層卷積層和三層采樣層。為了對比兩者方法的區(qū)別,使用相同的腫瘤訓練集和測試集圖片進行參照實驗,并迭代40次,記錄下準確率和所需時間(表3)。
表3 算法一與本文對比
表3說明:本文算法所用的網(wǎng)絡結構在訓練準確率與測試準確率均比算法一所用的網(wǎng)絡結構高,但是在所需時間上,算法一所用的時間較少。這說明了,三層的卷積層和采樣層有利于對腦膠質瘤特征進行提取,同時由于增加了層數(shù),使網(wǎng)絡更為復雜,把網(wǎng)絡訓練至收斂所花的時間也越多。
基于CNN的腦膠質瘤分級使用了三層卷積層和采樣層,并采用SVM分類器進行分類,同時增加了腫瘤的定位和分割,相對于典型的CNN結構有了一定的優(yōu)化。在對比實驗中,本文算法的準確率比典型的CNN結構有了提高,給以后的實際應用提供了參考。
因為網(wǎng)絡結構的改變,訓練所需的時間比較長。在往下的研究中,將著重優(yōu)化網(wǎng)絡,減少訓練所需的時間。同一病人腦膠質瘤的MRI圖片在不同層次顯示的腫瘤大小不同,如何針對不同大小的腫瘤進行識別也是下一步重點研究內容。
[1] Kleihues P,Burger PC,Scheithauer BW.Histological typing of the central nervous system:World Health Organization international histological classification of tumours[M].Berlin:Springer,1993.
[2] Provenzale J M,Wang G R,Brenner T,et al.Comparison of permeability in high-grade and low-grade brain tumors using dynamic susceptibility contrast MR imaging[J].AJR,2002,178(3):711-716.
[3] Greene G M,Hitchon P W,Shelper R L,et al.Diagnostic yield in CT-Guided stereotactic biopsy of gliomas[J].Neurosurg,1989,71(28):494-497.
[4] LeCun Y,Bottou L,Bengio Y,et al.Gradient-based learning applied to document recognition[J].Proceedings of the IEEE,1998,86(11):2278-2324.
[5] 李健,羅蔓,羅曉,等.基于多尺度卷積神經(jīng)網(wǎng)絡的磁共振成像腦腫瘤分割研究[J].中國醫(yī)學裝備,2016,13(2):25-28.
[6] Sermanet P,LeCun Y.Traffic sign recognition with multi-scale convolutional Networks[C].Proceedings of the 2011International Joint Conference on Neural Networks.San Jose:IEEE,2011:2809-2813.
[7] Chen Y,Han C,Wang C,et al.A CNN-based face detector with a simple feature map and a coarse-to-fine classifier[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31(3):1-12.
[8] Syafeeza Ahmad Radzi,Mohamed Khalil-Hani.Character recognition of license plate number using convolutional neural Network[J].IVIC 2011,Part I,LNCS 7066,2011:45-55.
[9] LeCun Y,Bottou L,Orr G B,et al.Efficient Back-Prop[J].Lecture Notes in Computer Science 1524,1998:9-50.
[10]Tang M,Gorelick L,Veksler O,et al.GrabCut in one cut[C].2013IEEE Internatonal Conference on Computer Vision.Sydney,VIC:IEEE,2013:1769-1776.
[11]Gering D T,Grimson W E L,Kikinis R.Recognizing deviations from normalcy for brain tumor segmentation[M].Springer Berlin Heidelberg,2002.
[12]Zhou W,Xiong S,Optimization of BP neural network classifier using genetic algorithm[J].Intelligence Computation and Evolutionary Computation,2013:599-605.
[13]Chu J L,Krzyzak A.Application of support vector machines,convolutional neural networks and deep belief networks to recognition of partially occluded objects[C].Artificial Intelligence and Soft Computing.Springer International Publishing,2014:34-46.
[14]Bottou L.Large-scale machine learning with stochastic gradient descent[C].Physica-Verlag HD,2010:177-186.
Brain Glioma Grading Based on Convolutional Neural Networks
WU Cong,HUANG Zhongyong,YIN Hao,LIU Gang,LI Jianghao
(School of Computer Science,Hubei Univ.of Tech.,Wuhan 430068,China)
Putting forward an improved convolution neural network method for classification of glioma since the glioma artificial classification is difficult and time consuming.In the traditional convolution,neural network structure adds a layer of convolution and sampling,using support vector machine as classifier at the same time.Classification is based on the automatically locating tumor area of the brain structure and the entering network.According to the experimental results it is concluded that,the network training accuracy is 85.27%,the test accuracy is 83.79%,which both were superior to the traditional network structure.
CNN;feature extraction;glioma grading;MRI
TP391.4
A
[責任編校:張巖芳]
1003-4684(2017)04-0060-05
2016-06-30
湖北省自然科學基金項目(2012FFB00701)
吳 聰(1982-),男,湖北武漢人,工學博士,湖北工業(yè)大學計算機學院副教授,研究方向為醫(yī)學圖像處理
黃中勇(1991-),男,廣西南寧人,湖北工業(yè)大學碩士研究生,研究方向為圖像處理