王新穎,王婉秋,王 慧
?
基于改進(jìn)的L-BFGS稀疏降噪自編碼網(wǎng)絡(luò)的MRI腦圖像識(shí)別方法
王新穎,王婉秋,王 慧
(長春工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,吉林 長春 130012)
隨著人類科技的飛速發(fā)展以及醫(yī)學(xué)影像設(shè)備的不斷更新,醫(yī)學(xué)影像技術(shù)在腦部病變的輔助診斷中起到了越來越重要的作用,為此,提出一種基于改進(jìn)的L-BFGS稀疏降噪自編碼網(wǎng)絡(luò)模型(ILSDAE),并將其應(yīng)用于MRI腦圖像的阿爾茨海默病的識(shí)別與腦部疾病的輔助診斷。實(shí)驗(yàn)數(shù)據(jù)源取自ADNI數(shù)據(jù)集,經(jīng)過校正、配準(zhǔn)、分割、平滑等操作,獲得腦部灰質(zhì)圖像,隨后將改進(jìn)的無監(jiān)督貪婪預(yù)訓(xùn)練方法和L-BFGS算法相結(jié)合,對深度自編碼網(wǎng)絡(luò)進(jìn)行訓(xùn)練并通過Softmax回歸訓(xùn)練學(xué)習(xí)特征,從而實(shí)現(xiàn)對病癥患者腦部圖像的識(shí)別。ILSDAE網(wǎng)絡(luò)模型具有很好的魯棒性,與堆棧式自編碼和自學(xué)習(xí)方法相比,實(shí)驗(yàn)結(jié)果證明了所提方法的有效性。
阿爾茨海默氏癥;L-BFGS;稀疏降噪自編碼;MRI腦圖像
老年癡呆癥又名阿爾茨海默病(Alzheimer’s disease,AD),是老年人中最為常見的腦神經(jīng)性疾病,并且成為了美國第六大死亡原因[1]。據(jù)統(tǒng)計(jì),2010年年齡大于60歲的老人當(dāng)中平均有4.7%的人被診斷為具有AD[2]。這種原發(fā)性退行性腦部病變疾病起病隱匿且不可逆,由發(fā)病到死亡的平均病程大約需要8~10年。醫(yī)學(xué)界認(rèn)為腦神經(jīng)細(xì)胞的損傷和死亡具有不可逆性,很難找到有效治愈該病的方法,也是多數(shù)研究人員對AD的早期診斷和預(yù)測關(guān)注的原因。
AD由于灰質(zhì)部分的萎縮加快了神經(jīng)系統(tǒng)的機(jī)能衰退,是一個(gè)神經(jīng)退化的不可逆過程,目前對該疾病的早期診斷主要包括心理學(xué)量表測試[3]、生物標(biāo)志物檢測[4]、神經(jīng)影像學(xué)檢測和基因檢測[5]等。其中核磁共振成像(magnetic resonance imaging,MRI)是較為廣泛的神經(jīng)影像診斷方法,其能夠以多方位、多序列的方式對腦組織進(jìn)行成像,分辨率高,能清楚地區(qū)分灰質(zhì)和白質(zhì),并且對人體沒有放射性危害,在所有的影像學(xué)檢測中,具有明顯優(yōu)勢。
隨著人們對該疾病的不斷認(rèn)識(shí),使得近年來基于磁共振(magnetic resonance,MR)成像的AD輔助診斷算法受到了廣大研究者的關(guān)注。陳斯鵬等[6]提出了一種基于MR圖像紋理特征的AD的分類模型,從MR圖像中提取腦部海馬區(qū)域紋理特征參數(shù),進(jìn)而建立AD的早期分類預(yù)測模型。KAMATHE和JOSHI[7]提出了一種基于獨(dú)立成分分析(independent component analysis,ICA)的腦脊液MR圖像分類方法。ALTAF等[8]提出了一種AD檢測與分類算法,該方法使用一種基于視覺詞的方法提高灰度共生矩陣(gray-level co-occurrence matrix,GLCM)、尺度不變特征變換(scale invariant feature transformation,SIFT)、局部二值模式和梯度直方圖等紋理特征的有效性,并將圖像數(shù)據(jù)與提供的臨床數(shù)據(jù)相結(jié)合從而輔助對疾病的診斷。
本文針對ADNI (Alzheimer’s disease neuroimaging initiative database)腦圖像數(shù)據(jù),提出了一種基于改進(jìn)的LBFGS (limited-memory Broyden fletcher Goldfarb Shanno,L-BFGS)稀疏降噪自編碼網(wǎng)絡(luò)模型(improved L-BFGS sparse denoising autoencoder, ILSDAE),并將其應(yīng)用于MRI腦圖像的AD識(shí)別。通過對MRI腦圖像灰質(zhì)特征的提取及深層次的訓(xùn)練,論證了本文的方法具有很好的魯棒性,提高了AD早期診斷分類的準(zhǔn)確率。
自編碼神經(jīng)網(wǎng)絡(luò)屬于無監(jiān)督學(xué)習(xí)算法,主要用于數(shù)據(jù)降維或特征抽取,其使用反向傳播算法,最小化重構(gòu)誤差項(xiàng),自編碼神經(jīng)網(wǎng)絡(luò)代價(jià)函數(shù)
其中,為樣本的訓(xùn)練集;()=s(W+)為編碼函數(shù);()=s(?+)為解碼函數(shù),s和s為激活函數(shù)[9]。
稀疏降噪自編碼神經(jīng)網(wǎng)絡(luò)是在自編碼神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,給待訓(xùn)練的數(shù)據(jù)加入噪聲,讓自動(dòng)編碼器去學(xué)習(xí)如何去除噪聲以獲得沒被污染的數(shù)據(jù),這樣做就使得編碼器的泛化能力增強(qiáng)且能夠獲得對輸入數(shù)據(jù)更加魯棒性的表達(dá)。再基于稀疏性的思想,對抽象出的特征稀疏表示,抑制了大部分的輸出神經(jīng)元,使用較少的激活單元表示特征,有效的用于對數(shù)據(jù)的分類[10]。
稀疏降噪自編碼神經(jīng)網(wǎng)絡(luò)(sparse denoising auto-encoder,SDAE)的總體代價(jià)函數(shù)為
實(shí)驗(yàn)采用標(biāo)準(zhǔn)數(shù)據(jù)集ADNI[11]提供的腦圖像數(shù)據(jù)。ADNI數(shù)據(jù)庫于2003年啟動(dòng),由美國加利福尼亞大學(xué)放射學(xué)和生物醫(yī)學(xué)成像中心創(chuàng)建,主要目標(biāo)是為了更早的識(shí)別AD患病的高危人群并盡快的找到治療該病的有效措施。有關(guān)ADNI研究和患者納入/排除標(biāo)準(zhǔn)的詳細(xì)信息,請參閱ADNI通用程序手冊[11]。本研究使用的數(shù)據(jù)下載于2018年2月至2018年4月。
本文選取55名AD患者和63名正常對照組(NL)的MRI腦圖像數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。表1列出了本文選擇的測試數(shù)據(jù)的基本資料信息。
表1 被試者資料信息(均值±標(biāo)準(zhǔn)差)
本次實(shí)驗(yàn)使用的MR圖像是由Wyman提出的標(biāo)準(zhǔn)化數(shù)據(jù)集中的“ADNI1 standardized 1.5T:screening 1.5T”,實(shí)驗(yàn)中所用圖像為T1加權(quán)圖像,所有數(shù)據(jù)都經(jīng)過一系列預(yù)處理,包括Gradwarp (由于梯度非線性導(dǎo)致的圖像幾何失真的系統(tǒng)特定校正),B1非均勻性強(qiáng)度校正,N3 (減少由于波或介電效應(yīng)引起的強(qiáng)度不均勻性)和尺度縮放。關(guān)于圖像的協(xié)議以及這部分預(yù)處理流程的詳細(xì)介紹可以參看ADNI網(wǎng)站(http://adni.loni.usc.edu/data-samples/ mri/)。使用Signa1.5T MRI系統(tǒng)進(jìn)行三維快速梯度回波翻轉(zhuǎn)恢復(fù)(FSPGRIR)脈沖序列(T1W1)進(jìn)行掃描,行結(jié)構(gòu)像橫段位掃描,掃描范圍從顱頂至枕骨大孔,翻轉(zhuǎn)角FA=8,射頻重復(fù)時(shí)間TR=1 000 ms,TI=3 000 ms,回波時(shí)間TE=3.6 ms,層厚1.2 mm,無間隔連續(xù)掃描,矩陣=192×192,層數(shù)160。
本文采用SPM12[12]與MRIcron[13]共同處理MR圖像數(shù)據(jù)。首先將從ADNI標(biāo)準(zhǔn)數(shù)據(jù)庫中獲得的數(shù)據(jù)用SPM12進(jìn)行預(yù)處理,其步驟如下:
步驟1.時(shí)間層校正(Slice Timing)。其用來校正1個(gè)掃描幀中層與層之間采集時(shí)間的差異;Number of Slices:輸入每禎圖像的層數(shù)(如本文使用的圖像Dimensions:192×192×160, 160即為層數(shù));TR:為2 s;TA:每禎圖像獲取第一層開始到獲取最后一層圖像的時(shí)間間隔,公式為TR-TR/nslice,本實(shí)驗(yàn)中為”2-2/160”;Slice order:輸入[1:2:159, 2:2:160](圖像是隔層掃描所得到的),采用的是交叉掃描模式(Interleaved),在交叉EPI掃描中,先采集所有奇數(shù)圖層,再采集所有偶數(shù)圖層;Reference Slice:輸入”159”,選擇參考層,其他圖層校正時(shí)以此為對照,通常選擇nslice/2,這樣能使數(shù)據(jù)的時(shí)間校正最小化。
步驟2. 頭動(dòng)校正(Realignment)。其主要為了處理被試在做檢測時(shí)的一些微小的晃動(dòng),盡管是微小的晃動(dòng)和一些細(xì)小的情況,也會(huì)對實(shí)驗(yàn)造成影響。實(shí)驗(yàn)中使用特定的一些算法將所有的MR圖像數(shù)據(jù)均與選中的第一個(gè)的MR圖像對齊。
步驟3. 配準(zhǔn)(Coregister)。其功能采用剛體變換以匹配不同模態(tài)掃描所得的圖像。
Reference Image:選擇新生成的mean*.nii文件;Source Image:基于Reference Image進(jìn)行處理的圖像;Other images:執(zhí)行與Source Image相同處理的圖像。
步驟4. 分割(Segment)。其功能用于分辨解剖圖像中的組織類型,可分割為5部分:灰質(zhì)、白質(zhì)、腦脊液、頭骨和軟組織。
圖1是正常對照組022_S_0014分割后所對應(yīng)的5部分。
(a) 灰質(zhì)(b) 白質(zhì)(c) 腦脊液(d) 頭骨(e) 軟組織
步驟5. 標(biāo)準(zhǔn)化(Normalise)。將不同容積和形狀被試者的大腦放置在標(biāo)準(zhǔn)空間中,并使用共同的坐標(biāo)系描述特定位置??臻g標(biāo)準(zhǔn)化通過生成”deformation field” (變形項(xiàng))來實(shí)現(xiàn)。變形項(xiàng)是在3D空間中對每個(gè)位置的位移程度進(jìn)行定量描述的圖像。
步驟6.平滑(Smooth)。其功能用于對圖像進(jìn)行模糊處理來減少噪聲和失真。以對不同受試者的解剖/功能圖像的輕微殘余差異進(jìn)行校正。MR圖像由于像素點(diǎn)數(shù)較大的原因經(jīng)過平滑處理后能夠得到較多的特征數(shù)據(jù)。
圖2是經(jīng)過處理后,灰質(zhì)正常圖像與異常圖像對比。
導(dǎo)出本文用SPM12預(yù)處理過后的MR腦圖像,再用MRIcron對圖像進(jìn)行切片處理,從而獲得更大的輸入數(shù)據(jù)集和更多的特征信息。為了更準(zhǔn)確的對圖像進(jìn)行識(shí)別,切片時(shí)盡量保留特征較為明顯的部分。圖3是AD病人和正常對照組的切片后的圖像示例。
(a) 樣本082_S_0761的正常對照組圖像 (b) 樣本141_S_1152的阿爾茨海默癥患者圖像
本文提出的ILSDAE方法包含2部分:稀疏降噪自編碼器和softmax分類器。為了防止數(shù)據(jù)量少引起處理時(shí)的過度擬合問題,本文采用改進(jìn)的L-BFGS算法計(jì)算J和隱含層權(quán)重,即
將參數(shù)更新為
步驟1. 選擇腦圖像的初始節(jié)點(diǎn)0,誤差>0,設(shè)置最近幾次的迭代次數(shù)(實(shí)驗(yàn)取6)。
步驟2.計(jì)算
步驟4.此次迭代的可行性方向?yàn)?/p>
步驟6.對權(quán)重進(jìn)行更新
步驟7.若>,保存近幾次的次的矢量值,刪除(s-,y-)。
步驟8.計(jì)算
步驟9.遞歸得到
若=+1,執(zhí)行步驟3。
為減小代價(jià)函數(shù)J的值,不斷重復(fù)以上算法的迭代步驟,訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型。模型中參數(shù)的更新可以作為softmax分類器的輸入,最終達(dá)到分類的目的。
模型的網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示,根據(jù)MRI腦圖像的灰質(zhì)特征,首先獲取網(wǎng)絡(luò)結(jié)構(gòu)中的隱藏層參數(shù)1,同時(shí)得到隱藏層的特征表示。并將作為softmax分類器的輸入,然后利用有污染的或插入噪聲的原始信息來獲得softmax分類器的參數(shù)0。將權(quán)值參數(shù)0和1作為網(wǎng)絡(luò)模型的初始化參數(shù),通過網(wǎng)絡(luò)模型,最終得到整個(gè)模型的代價(jià)函數(shù)J微調(diào)過程。采用受限的擬牛頓法神經(jīng)網(wǎng)絡(luò)調(diào)整函數(shù)J,輸出層和隱含層權(quán)重參數(shù)。
圖4 基于ILSDAE的網(wǎng)絡(luò)結(jié)構(gòu)
實(shí)驗(yàn)中選取了118個(gè)ADNI腦圖像的數(shù)據(jù),其數(shù)據(jù)分為2組:AD患者組和正常對照組。將實(shí)驗(yàn)數(shù)據(jù)分為測試集(59人)和訓(xùn)練集(59人)。對于ADNI數(shù)據(jù),先經(jīng)過SPM預(yù)處理,獲取到經(jīng)過平滑后的特征明顯的灰質(zhì)圖像,再將得到的MR灰質(zhì)圖像導(dǎo)入MRIcron軟件中進(jìn)行切片處理可獲得大量輸入數(shù)據(jù),得到了灰質(zhì)圖像為88×88像素圖片,可視化特征如圖5所示。
圖5 特征的可視化表示
將實(shí)驗(yàn)數(shù)據(jù)分別放入堆棧式自編碼神經(jīng)網(wǎng)絡(luò)(stacked autoencoder,SAE)[14]、自學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)(self-taught learning,SL)[15]和本文提出的ILSDAE方法中進(jìn)行訓(xùn)練,最后得出分類結(jié)果。表2列出了幾種方法的識(shí)別效果,其中每類實(shí)驗(yàn)6次,取平均值。
表2 被圖像識(shí)別效果比較(%)
由表2可見,本文方法優(yōu)于傳統(tǒng)的SAE和SL。
下面對于多種灰質(zhì)圖像特征提取方法,與本文所提直接使用數(shù)據(jù)源進(jìn)行實(shí)驗(yàn)。
圖6顯示了當(dāng)前灰質(zhì)腦圖像,經(jīng)過基本像素點(diǎn)組成的特征,與LBP特征[16],HOG[17]特征分別經(jīng)過SAE、 SL和ILSDAE對數(shù)據(jù)的分類識(shí)別準(zhǔn)確率比較的結(jié)果。由圖6可見,本文模型在LBP特征及HOG特征下也優(yōu)于其他模型。
圖6 不同圖像特征提取方法識(shí)別率比較
本文提出了一種基于改進(jìn)的ILSDAE的稀疏降噪自編碼方法,構(gòu)造了一個(gè)深度網(wǎng)絡(luò)模型。首先,利用無監(jiān)督貪婪預(yù)訓(xùn)練方法和ILBFGS方法對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練;然后,使用Softmax訓(xùn)練所學(xué)習(xí)的有關(guān)腦圖像灰質(zhì)的特征;最后,將構(gòu)建好的分類器應(yīng)用于腦圖像的識(shí)別。實(shí)驗(yàn)結(jié)果表明,與SAE和SL相比,該方法具有更好的識(shí)別性能。如何縮短特征學(xué)習(xí)的時(shí)間,調(diào)整算法的相關(guān)參數(shù),實(shí)現(xiàn)并行處理是本文的下一步工作。
[1] PRINCE M, WIMO A, GUERCHET M, et al. World Alzheimer Report 2015: The global impact of dementia [R]. London: ABI, 2015: 6-9.
[2] ASSOCIATION A. 2013 Alzheimer’s disease facts and figures [J]. Alzheimers and Dementia. 2013, 9(2): 208-245.
[3] PETRELLA J R, COLEMAN R E, DORAISWAMY P M. Neuroimaging and early diagnosis of Alzheimer disease: A look to the future. [J]. Radiology, 2003, 226(2): 315-336.
[4] FJELL A M, WALHOVD K B, FENNEMANOT ESTINE C, et al. CSF biomarkers in prediction of cerebral and clinical change in mild cognitive impairment and Alzheimer’s disease [J]. Journal of Neuroscience, 2010, 30(6): 2088-2101.
[5] BUIZZA L, CENINI G, LANNI C, et al. conformational altered p53 as an early marker of oxidative stress in Alzheimer’s disease [EB/OL].[2018-10-30].http://med. wanfangdata.com.cn/Paper/Detail/PeriodicalPaper_PM22242180.
[6] 陳斯鵬, 高妮, 田思佳, 等. 基于MR圖像紋理特征的阿爾茨海默病分類模型[J]. 北京生物醫(yī)學(xué)工程, 2017, 36(2): 134-138.
[7] KAMATHE R S, JOSHI K R. A novel method based on independent component analysis for brain MR image tissue classification into CSF, WM and GM for atrophy detection in Alzheimer’s disease [J]. Biomedical Signal Processing and Control, 2018, 40: 41-48.
[8] ALTAF T, ANWAR S M, GUL N, et al. Multi-class Alzheimer’s disease classification using image and clinical features [J]. Biomedical Signal Processing and Control, 2018, 43: 64-74.
[9] LIOU C Y, CHENG W C, LIOU J W, et al. Autoencoder for words [J]. Neurocomputing, 2014, 139: 84-96.
[10] NG A. CS294A lecture notes sparse autoencoder. stanford university, 1-19 [EB/OL]. [2018-06-15]. https://doi.org/10.1371/journal.pone.0006098.
[11] JR C R J, BERNSTEIN M A, FOX N C, et al. The Alzheimer’s disease neuroimaging initiative (ADNI): MRI methods [J]. Alzheimers and Dementia, 2010, 27(4): 685-691.
[12] ASHBURNER J. SPM12 Manual. [EB/OL]. [2018-06-15]. https://www.fil.ion.ucl.ac.uk/spm/doc/manual.pdf.
[13] RORDEN C. MRIcron [EB/OL]. [2018-06-15]. https://www.nitrc.org/projects/mricron.
[14] SHIN H C, ORTON M R, COLLINS D J, et al. Stacked auto-encoders for unsupervised feature learning and multiple organ detection in a pilot study using 4D patient data [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(8): 1930-1943.
[15] RAINA R, BATTLE A, LEE H, et al. Self-taught learning: Transfer learning from unlabeled data [C]// Proceedings of the 24th International Conference on Machine Learning. New York: ACM Press, 2007: 759-766.
[16] AHONEN T, HADID A, PIETIK?INEN M. Face description with local binary patterns: application to face recognition [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2006, 28(12): 2037-2041.
[17] NAVNEET D, TRIGGS B. Histograms of oriented gradients for human detection [C]//IEEE Computer Society Conference on Computer Vision and Pattern Recognition. New York: IEEE Press, 2005: 886-893.
MRI Brain Image Recognition Method Based on Improved L-BFGS Sparse Denoising Autoencoder
WANG Xin-ying, WANG Wan-qiu, WANG Hui
(College of Computer Science and Engineering, Changchun University of Technology, Changchun Jilin 130012,China)
With the rapid development of human science and technology and the continuous updating of medical imaging equipment, medical imaging technology plays an increasingly important role in the auxiliary diagnosis of brain lesions. An improved L-BFGS (limited memory Broyden-Fletcher- Goldfarb-Shanno) sparse denoising self-coding network model is proposed and applied to the recognition of Alzheimer’s disease (AD) in MRI brain images. The experimental data source is taken from the ADNI data set, and the original data is corrected, registered, segmented, smoothed, etc. to obtain gray matter images of the brain. Then, the improved unsupervised greedy pre-training method and L-BFGS algorithm are combined to train the deep self-coding network as well as the learning features through Softmax regression training, so as to realize the brain mapping of patients with symptoms image recognition. ILSDAE network model is of good robustness, and compared with the stack self-coding and self-learning methods, the experimental results show the effectiveness of the proposed method.
Alzheimer’s disease (AD); L-BFGS; sparse denoising autoencoder; MRI brain image
TP 391
10.11996/JG.j.2095-302X.2019020261
A
2095-302X(2019)02-0261-06
2018-09-03;
2018-10-30
國家自然科學(xué)基金項(xiàng)目(61303132);吉林省教育廳“十三五”科學(xué)技術(shù)項(xiàng)目(JJKH20170574KJ)
王新穎(1979-),女,吉林長春人,副教授,博士,碩士生導(dǎo)師。主要研究方向?yàn)閳D形圖像處理、數(shù)據(jù)挖掘等。 E-mail:wang_xinying1979@163.com