張柏雯, 林 嵐, 吳水才
(北京工業(yè)大學(xué)生命科學(xué)與生物工程學(xué)院, 北京 100124)
阿爾茲海默癥(Alzheimer’s disease,AD)是最為常見(jiàn)的神經(jīng)退行性疾病. 隨老齡化趨勢(shì),預(yù)計(jì)到2050年,全球AD患者將達(dá)到1.6億[1]. 目前AD的發(fā)病機(jī)制尚不明確,一經(jīng)發(fā)現(xiàn)難以逆轉(zhuǎn). 但AD一般具有較長(zhǎng)的臨床前期,若能在AD早期發(fā)現(xiàn)并及時(shí)做出正向的治療干預(yù),將有可能延緩AD的發(fā)病時(shí)間[2]. 輕度認(rèn)知障礙(mild cognitive impairment,MCI)是介于AD與正常老化(normal control,NC)的一種中間狀態(tài),MCI患者被認(rèn)為是AD患病的高危人群[3]. 但老年人的認(rèn)知退化程度與臨床表現(xiàn)常存在特異性[4],單憑認(rèn)知量表測(cè)量難以準(zhǔn)確區(qū)分. 結(jié)構(gòu)磁共振圖像(structural magnetic resonance imaging,sMRI)因其對(duì)腦部組織解剖結(jié)構(gòu)顯像的高分辨率,且具有無(wú)創(chuàng)、圖像易獲取等優(yōu)勢(shì),被廣泛用于AD的早期診斷中.
深度卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)近年來(lái)在圖像識(shí)別領(lǐng)域表現(xiàn)突出,逐漸被運(yùn)用于醫(yī)學(xué)圖像領(lǐng)域的研究中[5]. 相比于傳統(tǒng)機(jī)器學(xué)習(xí)算法需要手工特征提取,深度學(xué)習(xí)的方法不但能夠發(fā)現(xiàn)一些潛在的疾病特征,同時(shí)減少了手工提取感興趣區(qū)的人為因素,避免或減少了模型構(gòu)建前的預(yù)處理步驟,提高了工作效率[6]. 由于sMRI是三維的影像模態(tài),最合適的研究方法是直接建立三維的CNN模型. 但總體來(lái)說(shuō),三維的CNN模型目前還不是特別成熟. 在深度學(xué)習(xí)時(shí)代,數(shù)據(jù)至少與算法一樣重要,CNN需要大量的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練. 神經(jīng)影像的樣本數(shù)目遠(yuǎn)小于自然圖像的數(shù)目. 三維的CNN模型必須在模型復(fù)雜度和訓(xùn)練收斂性之間做一個(gè)權(quán)衡,難以充分發(fā)揮三維模型的優(yōu)勢(shì). Hosseini-Asl等[7]運(yùn)用自編碼器與三維CNN結(jié)合的方法進(jìn)行AD分類(lèi)預(yù)測(cè),在AD與NC中取得了97.6%的分類(lèi)準(zhǔn)確率. 盡管該模型取得了優(yōu)異的性能,但它需要將三維體素塊輸入自編碼器進(jìn)行大量訓(xùn)練,得到預(yù)訓(xùn)練好的卷積核后再輸入三維的CNN模型中. 這種網(wǎng)絡(luò)訓(xùn)練的方式,存在訓(xùn)練復(fù)雜度高、模型深度較淺的問(wèn)題. 另一種可行的方法是借鑒在ImageNet舉辦的大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽(ImageNet Large Scale Visual Recognition Challenge,ILSVRC)中脫穎而出的經(jīng)典網(wǎng)絡(luò),如AlexNet[8]、GoogleNet[9]等,來(lái)進(jìn)行AD、MCI與NC的分類(lèi)研究[10]. Sarraf等[11]將功能磁共振成像(function MRI,fMRI)和sMRI轉(zhuǎn)換為二維的圖像切片后分別輸入LeNet-5[12]和GoogleNet中,通過(guò)對(duì)經(jīng)典網(wǎng)絡(luò)模型的遷移訓(xùn)練實(shí)現(xiàn)對(duì)AD與NC分類(lèi). 該方法在fMRI中獲得了94.32%的準(zhǔn)確率,在sMRI分類(lèi)準(zhǔn)確率中最高一組達(dá)到98.7%. 但該方法的一個(gè)嚴(yán)重缺陷是沒(méi)有考慮到同一受試者的二維sMRI切片間存在很高的空間相關(guān)性,同時(shí)fMRI二維切片也存在時(shí)間和空間相關(guān)性. 這樣,預(yù)測(cè)集和驗(yàn)證集圖像間有很高的相關(guān)性,實(shí)際的分類(lèi)模型并不能很好地解釋AD的分類(lèi)結(jié)果. 呂鴻蒙等[13]運(yùn)用AlexNet及增強(qiáng)AlexNet網(wǎng)絡(luò)模型,在AD與NC、AD與MCI、MCI與NC的分類(lèi)中分別取得了94.70%、97.10%、80.62%的準(zhǔn)確率. 但該研究同樣也存在沒(méi)有考慮sMRI空間相關(guān)性的問(wèn)題.
在ILSVRC出現(xiàn)的經(jīng)典模型中學(xué)習(xí)的權(quán)重可用于初始化其他數(shù)據(jù)集的模型,并顯著提高性能. 本文基于NC、MCI和AD的sMRI和CNN中的經(jīng)典模型AlexNet,運(yùn)用遷移學(xué)習(xí)的方法提取圖像特征,再進(jìn)行三維特征重組,之后結(jié)合機(jī)器學(xué)習(xí)的方法建立分類(lèi)模型,實(shí)現(xiàn)AD、MCI及NC的分類(lèi).
本研究受試對(duì)象為422名年齡在55~90歲的老年人,數(shù)據(jù)均來(lái)自于阿爾茲海默癥神經(jīng)影像學(xué)計(jì)劃(Alzheimer’s Disease Neuroimaging Initiative,ADNI)數(shù)據(jù)庫(kù)(http:∥adni.loni.usc.edu/). 采用的是ADNI-1階段的延續(xù)“ADNI重大計(jì)劃項(xiàng)目”(ADNI Grand Opportunities,ADNI-GO)與ADNI-2階段的AD、晚期MCI(late MCI,LMCI)與NC受試者的基線(xiàn)(baseline,即第0個(gè)月)sMRI數(shù)據(jù)[14]. 受試者均無(wú)抑郁等精神疾病,并根據(jù)ADNI的要求接受跟蹤隨訪(fǎng)的數(shù)據(jù)采集,每次受試均接受簡(jiǎn)易精神量表(mini-mental state examination,MMSE)及臨床癡呆評(píng)測(cè)表(clinical dementia rating,CDR)評(píng)測(cè). 實(shí)驗(yàn)對(duì)象具體特征如表1所示.
表1 實(shí)驗(yàn)對(duì)象特征
數(shù)據(jù)集采集設(shè)備均為Philips 3.0T MRI掃描設(shè)備,研究所需圖像為三維磁化快速梯度回波成像MPRAGE,TR=6.8 mm,TE=3.1 mm,F(xiàn)OV:RL=204 mm;AP=240 mm;FH=256 mm,掃描層厚為1.2 mm,層數(shù)為170,體素為1 mm×1 mm×1.2 mm.
本研究中特征遷移學(xué)習(xí)使用的基礎(chǔ)網(wǎng)絡(luò)模型為AlexNet,結(jié)構(gòu)如圖1所示. AlexNet為8層網(wǎng)絡(luò)結(jié)構(gòu),前5層為卷積層,后3層為全連接層,其中前2層卷積和第5層卷積后均跟隨池化層,每一個(gè)卷積層均采用ReLU激活函數(shù)[8]. 大小為227×227的RGB三通道圖像輸入AlexNet,分別經(jīng)過(guò)了卷積、ReLU、池化、歸一化過(guò)程. 其中第1層卷積過(guò)程的卷積核大小為11×11,步長(zhǎng)為4;池化采用為重疊池化,設(shè)置步幅為2、池寬為3的滑動(dòng)窗口. 第2層卷積過(guò)程的卷積核為5×5,步長(zhǎng)為1,池化方式與第1層一致. 經(jīng)過(guò)上述過(guò)程,在第2層的輸出大小變?yōu)榱?3×13×256. 之后的3個(gè)卷積層均采用卷積核大小為3×3,步長(zhǎng)為1. 在第5層卷積后跟隨1次池化,池化方式與前2層相同. 經(jīng)過(guò)5次卷積計(jì)算,可將圖像的特征進(jìn)行抽象,往往能表達(dá)出具有分類(lèi)特征的信息. 各層具體的網(wǎng)絡(luò)參數(shù)如表2所示.
表2 AlexNet網(wǎng)絡(luò)參數(shù)
前人研究顯示灰質(zhì)萎縮是早期AD與NC區(qū)分的重要依據(jù)[15],本研究中應(yīng)用體素形態(tài)學(xué)(voxel-base morphometry,VBM)的方法,基于受試者全腦的灰質(zhì)密度圖而進(jìn)行分析[16]. 全腦的灰質(zhì)密度圖在Matlab2015b(the mathworks,Sherborn,US)中運(yùn)行通用工具包SPM-12(statistical parametric mapping,London,UK)完成[17]. 主要步驟有:DICOM至img+hdr的格式轉(zhuǎn)化;將所有受試者的圖像空間標(biāo)準(zhǔn)化到統(tǒng)一模板;再將腦組織進(jìn)行分割,提取灰質(zhì)信息;運(yùn)用Dartel工具箱[18]將每位受試者圖像依次迭代,與前一次生成的灰質(zhì)模板進(jìn)行配準(zhǔn),之后將所有配準(zhǔn)后的圖像平均得到新的模板,直到得到最優(yōu)模板. 再將所有灰質(zhì)圖像標(biāo)準(zhǔn)化到最優(yōu)模板,灰質(zhì)平滑設(shè)置半高寬為8 mm的高斯平滑核. 經(jīng)過(guò)調(diào)制后的灰質(zhì)密度圖,體素值就反映了相應(yīng)的灰質(zhì)密度信息.
AlexNet的輸入圖像尺寸為227×227的RGB三通道. 經(jīng)過(guò)上述灰質(zhì)密度圖的生成步驟后,對(duì)每位受試者圖像均進(jìn)行插值、剪切與填充等步驟,以符合AlexNet的網(wǎng)絡(luò)輸入需求. 本文采用的是橫斷位圖像輸入網(wǎng)絡(luò)模型的方式,考慮到AD與LMCI多發(fā)生于海馬、內(nèi)嗅皮質(zhì)區(qū)、顳中回等區(qū)域,由于SPM-12生成灰質(zhì)密度圖的過(guò)程中,預(yù)處理過(guò)的圖像在z軸橫斷面上、下均存在著空白區(qū)域,靠近z軸上端保留著少部分腦皮層區(qū)域、下端保留著小腦邱體,這些區(qū)域?qū)D與LMCI分類(lèi)并不敏感. 為了降低后續(xù)分類(lèi)中特征維度遠(yuǎn)遠(yuǎn)大于特征數(shù)對(duì)分類(lèi)模型精度帶來(lái)的影響,將這些空白區(qū)域與不敏感區(qū)域舍去,最終保留每位受試者在橫斷面的65層圖像信息,再將所有圖像分別轉(zhuǎn)換為RGB三通道的偽彩圖.
特征提取運(yùn)行環(huán)境為:Ubuntu14.04,CAFFE深度學(xué)習(xí)平臺(tái),配置CUDA 8.0環(huán)境,GPU為T(mén)esla k20c,內(nèi)存為64 GB. 將圖像輸入預(yù)先訓(xùn)練好AlexNet模型,設(shè)置相對(duì)應(yīng)的參數(shù),進(jìn)行逐層特征提取. 如圖2為一幅灰質(zhì)圖像輸入AlexNet模型后提取特征可視化后的示意圖. 根據(jù)特征遷移學(xué)習(xí)的原理[19],靠近輸入層的前端卷積層一般反映出的是圖像的邊緣、紋理等信息,如圖2(a);靠近全連接層的后端卷積層一般反映的是圖像細(xì)節(jié)信息,這些信息中能抽象出具有代表性的分類(lèi)特征. 在AlexNet中一般認(rèn)為conv3、conv4、conv5三個(gè)卷積層能用作之后的分類(lèi)提取[18],如圖2(b)~(d). 將每位受試者的圖像按照z軸從上到下的順序依次輸入AlexNet提取特征,根據(jù)AlexNet模型的參數(shù),如表2所示,即每一層圖像在conv3、conv4的特征維度為13×13×384,conv5特征維度為13×13×256,將每位受試者的特征變量按照原65層排列順序重新組成一組三維特征.
經(jīng)過(guò)重組后的特征,每位受試者在conv3和conv4的特征維度都達(dá)到140萬(wàn)維以上(65幅13×13×384),而在后續(xù)分類(lèi)中,每組的樣本總量不足400例,這樣的特征維度不但遠(yuǎn)遠(yuǎn)大于樣本總量,而且存在過(guò)多的冗余信息,無(wú)疑會(huì)對(duì)后續(xù)分類(lèi)造成維度災(zāi)難[20]. 因此對(duì)特征選用與AlexNet中一樣尺寸的池化方法.
需要對(duì)AD與NC、AD與LMCI、LMCI與NC三組分別進(jìn)行二分類(lèi). conv3、conv4和conv5雖然都能反映出輸入圖像的細(xì)節(jié)信息,但是具體在哪一層有更好的表現(xiàn),在不同研究中并無(wú)定論,所以本研究將conv3、conv4和conv5的特征均作為下一步的分類(lèi)特征. 在上述重疊池化降維后,雖然維度相較提取時(shí)的已有大幅降低,但相對(duì)于每個(gè)分類(lèi)組的個(gè)數(shù)仍處于特征數(shù)遠(yuǎn)遠(yuǎn)大于分類(lèi)樣本數(shù)量,因此本研究分類(lèi)模型構(gòu)建首先進(jìn)行了特征降維,再經(jīng)過(guò)特征選擇,最后構(gòu)建分類(lèi)器分類(lèi).
具體方法步驟如下.
步驟1運(yùn)用主成分分析(principal component analysis,PCA)對(duì)各個(gè)分類(lèi)組的原始特征進(jìn)行降維. PCA能通過(guò)線(xiàn)性或非線(xiàn)性組合的方法構(gòu)造相關(guān)特征,使原始的高維特征映射到低維,保留最重要的特征信息,可以從多元事物中更好地解析出主要的影響因素[21]. PCA主要計(jì)算過(guò)程有:讀取各分類(lèi)集數(shù)據(jù);去均值、計(jì)算協(xié)方差矩陣;計(jì)算特征向量及特征值,并按照特征值大小排序;再根據(jù)各個(gè)主成分累計(jì)的貢獻(xiàn)率大小選取主成分,從而得到降維后的矩陣.
步驟2運(yùn)用序列前向搜索(sequential forward search,SFS)特征選擇. 雖然經(jīng)上一步驟所保留的特征已按照貢獻(xiàn)率大小排名,但并不能說(shuō)明貢獻(xiàn)率高的特征對(duì)于接下來(lái)的分類(lèi)器訓(xùn)練最佳. 因此接下來(lái)選用SFS的方法在每個(gè)PCA后的分類(lèi)組的訓(xùn)練集中分別進(jìn)行特征選擇. SFS通過(guò)自上而下的搜索找到最佳特征,是一種“只出不進(jìn)”的貪心算法[22]. 根據(jù)各組別受試者的實(shí)際個(gè)數(shù),選擇每組別隨機(jī)化后合適數(shù)量的受試者作為SFS特征選擇及之后分類(lèi)器的訓(xùn)練集. SFS主要計(jì)算過(guò)程有:首先從空集開(kāi)始;當(dāng)遇到最佳分類(lèi)特征時(shí)更新特征子集;重復(fù)上述過(guò)程,直到目標(biāo)子集數(shù)量達(dá)到設(shè)定的個(gè)數(shù)為止;在實(shí)際選擇特征時(shí),能通過(guò)最終的特征目標(biāo)子集的誤分比率的最低值來(lái)確定哪些特征及多少個(gè)特征個(gè)數(shù)作為后續(xù)特征分類(lèi)的訓(xùn)練集最佳.
步驟3運(yùn)用支持向量機(jī)(support vector machines,SVM)構(gòu)建特征分類(lèi)器. 使用LIBSVM工具包[23],設(shè)置線(xiàn)性核函數(shù)對(duì)各分類(lèi)組分別進(jìn)行分類(lèi). 每組選用與上述SFS算法一致的子集作為訓(xùn)練集,其余受試者均為測(cè)試集. 最后,統(tǒng)計(jì)SVM的分類(lèi)結(jié)果,對(duì)整體模型設(shè)計(jì)進(jìn)行評(píng)估.
首先,將conv3、conv4和conv5的各分類(lèi)組進(jìn)行PCA降維,保留貢獻(xiàn)度在前95%的特征. 經(jīng)過(guò)PCA后,所有分類(lèi)組的特征個(gè)數(shù)均小于受試者的個(gè)數(shù). 但是貢獻(xiàn)度的排名并不能等同于分類(lèi)信息的排名,如圖3所示,在conv3中AD與LMCI分類(lèi)組,圖3(a)顯示第一主成分的貢獻(xiàn)率也只占到13%,排名的前50個(gè)主成分占到的主成分貢獻(xiàn)率也不足50%. 由圖3(b)可以看出,AD與LMCI并無(wú)明顯的分界,說(shuō)明即便第一主成分與第二主成分也不具有較強(qiáng)的分類(lèi)敏感性. 所以需要在訓(xùn)練集進(jìn)行SFS的特征選擇,AD、LMCI與NC每組分別選擇隨機(jī)化后的75例受試者作為訓(xùn)練集,其余均作為測(cè)試集,各組分類(lèi)集與測(cè)試集的個(gè)數(shù)如表3所示. 根據(jù)各分類(lèi)組的SFS錯(cuò)誤分類(lèi)比率,大約在第20個(gè)特征時(shí),錯(cuò)誤分類(lèi)率達(dá)到最低,且誤分比率相對(duì)穩(wěn)定. conv3中AD與LMCI分類(lèi)組中SFS錯(cuò)誤分類(lèi)比率的統(tǒng)計(jì)圖如圖4所示. 所以對(duì)3個(gè)分類(lèi)組SFS均選取20個(gè)特征作為下一步分類(lèi)器構(gòu)建.
表3 訓(xùn)練集與測(cè)試集
將SFS選擇出的各分類(lèi)組的特征作為SVM分類(lèi)器的輸入,得到conv3、conv4和conv5的各個(gè)分類(lèi)組的分類(lèi)結(jié)果,如表4所示. 實(shí)驗(yàn)結(jié)果評(píng)價(jià)采用準(zhǔn)確率(Accuracy)、靈敏度(Sensitivity)與特異性(Specificity)3項(xiàng)作為模型評(píng)價(jià)指標(biāo). 其定義為
(1)
(2)
(3)
式中:nTP為真陽(yáng)性(true positive)在AD與NC、AD與LMCI的分類(lèi)中,為被準(zhǔn)確識(shí)別出的AD樣本個(gè)數(shù);在LMCI與NC的分類(lèi)中,表示準(zhǔn)確識(shí)別的LMCI樣本個(gè)數(shù).
表4 各組二分類(lèi)結(jié)果
nFP為假陽(yáng)性(false positive)在AD與NC、AD與LMCI的分類(lèi)中,為AD受試者被劃分為了NC或LMCI組的樣本個(gè)數(shù);在LMCI與NC的分類(lèi)中,為L(zhǎng)MCI劃分到了NC組的樣本個(gè)數(shù).
nFN為假陰性(false negative)在AD與NC、AD與LMCI的分類(lèi)中,為NC或LMCI受試者被劃分為了AD組的樣本個(gè)數(shù);在LMCI與NC的分類(lèi)中,為NC劃分到了LMCI組的樣本個(gè)數(shù).
nTN為真陰性(true negative)在AD與NC、LMCI與NC的分類(lèi)中,為被準(zhǔn)確識(shí)別出的NC樣本個(gè)數(shù),在AD與LMCI的分類(lèi)中為準(zhǔn)確識(shí)別出的LMCI樣本個(gè)數(shù).
1) 由表4的二分類(lèi)結(jié)果表明,通過(guò)遷移學(xué)習(xí)提取圖像特征再進(jìn)行三維重組的方式,對(duì)于AD、LMCI與NC之間的分類(lèi)是一種可行的方法. 對(duì)conv3、conv4與conv5三個(gè)卷積層分別進(jìn)行了分類(lèi),經(jīng)方差分析,得到p=0.97(p>0.05),說(shuō)明conv3、conv4與conv5三層在分類(lèi)結(jié)果的差異不具有統(tǒng)計(jì)學(xué)意義.
2) sMRI本身是三維圖像,任何一個(gè)掃描層都可能與其上下層的掃描信息存在著重要的關(guān)聯(lián). 將三維圖像轉(zhuǎn)成二維,再使用深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練的方法,并不會(huì)將每位受試者的信息作為一個(gè)整體. 這樣訓(xùn)練集和測(cè)試集間存在高度相關(guān),結(jié)果并不具有實(shí)際意義. 三維卷積網(wǎng)絡(luò)由于神經(jīng)影像數(shù)量的限制,并不能充分發(fā)揮三維卷積網(wǎng)絡(luò)的特性,而且訓(xùn)練比較復(fù)雜. 本研究中,基于經(jīng)典的二維卷積網(wǎng)絡(luò)模型,通過(guò)三維特征組合的方式,將每位受試者看作一個(gè)整體而構(gòu)建分類(lèi)模型,取得了較好的分類(lèi)結(jié)果.
3) 研究中也還存在一些缺陷. 更深、更廣的深度模型是近期CNN領(lǐng)域研究的方向. 與AlexNet相比,VGG-16、ResNet、GoogleNet等網(wǎng)絡(luò)模型在網(wǎng)絡(luò)寬度更寬、在網(wǎng)絡(luò)深度上更深、模型結(jié)構(gòu)更加復(fù)雜[24],它們非??赡軙?huì)為AD分類(lèi)提供更好的結(jié)果. 與前人用深度學(xué)習(xí)方法在AD、MCI與NC分類(lèi)研究中的結(jié)果對(duì)比,本研究的方法并未在實(shí)驗(yàn)結(jié)果中有明顯的改進(jìn). 一個(gè)可能的原因可能是采用了遷移學(xué)習(xí)的算法來(lái)提取圖像的通用特征,特征并沒(méi)有為神經(jīng)影像進(jìn)行優(yōu)化,后續(xù)的研究中將通過(guò)對(duì)經(jīng)典網(wǎng)絡(luò)進(jìn)行微調(diào)訓(xùn)練來(lái)進(jìn)一步提高模型性能.