姚麗麗,范炤
阿爾茨海默病(Al zheimer's disease,AD)是一種具有記憶障礙和認(rèn)知衰退特征的神經(jīng)退行性疾病[1]。現(xiàn)有的治療只能暫時幫助緩解記憶和認(rèn)知問題,不能根治。為了獲得疾病的控制治療,迫切需要對AD病程進行分類,以便早期準(zhǔn)確診斷,及時治療。國內(nèi)外大量研究人員通過研究AD患者腦神經(jīng)影像學(xué)結(jié)構(gòu)和功能的變化[2],試圖尋找能夠有助于AD臨床診斷的生物標(biāo)志物,為早期診斷提供價值。結(jié)構(gòu)磁共振成像(structural magnetic resonance imaging,sMRI)由于其無創(chuàng)性和高普及性的優(yōu)點,廣泛應(yīng)用于AD早期診斷。近年來,隨著科學(xué)技術(shù)的發(fā)展,大量結(jié)合機器學(xué)習(xí)的醫(yī)學(xué)圖像數(shù)據(jù)被用于AD的分類預(yù)測[3],如何選擇特征選擇算法對疾病預(yù)測至關(guān)重要。目前,在影像學(xué)的AD研究中常采用主成分分析法、偏最小二乘法等進行降維[4],使用支持向量機(suppor t vect or machine,SVM)、邏輯回歸(l ogistic regression,LR)、隨機森林(random f orest,RF)等各種分類模型[5-7]來驗證和評估提取的特征是否具有良好的分類性能。這些研究證實,基于圖像結(jié)構(gòu)信息的疾病分類技術(shù)對臨床診斷更有幫助。然而,MRI原始圖像維數(shù)高,早期AD結(jié)構(gòu)變化不明顯以及研究樣本總數(shù)的限制使得AD早期評估和診斷的發(fā)展受到限制,并且由于不同的實驗條件導(dǎo)致研究結(jié)果的不同,至今很難有高效準(zhǔn)確的算法能夠應(yīng)用于臨床。因此,本研究基于sMRI數(shù)據(jù)和患者臨床信息特征[年齡、性別、教育水平、簡易智力狀態(tài)檢查(Mini-Mental State Examination,MMSE)評分]提出一種L1-SVM特征選擇法,通過與SVM、RF、LR、誤差逆?zhèn)鞑?back pr opagat ion,BP)神經(jīng)網(wǎng)絡(luò)這4種分類算法結(jié)合建立并選出最合適的預(yù)測模型,并創(chuàng)造性地針對每一階段病程轉(zhuǎn)化給出具體的生物標(biāo)志物。
本研究數(shù)據(jù)來自AD神經(jīng)成像倡議(Al zheimer's Disease Neuroimaging Initiative,ADNI)數(shù) 據(jù) 庫(http://adni.l oni.usc.edu/),回顧性分析編號為4018~5210的符合標(biāo)準(zhǔn)的受試對象543例。根據(jù)ADNI標(biāo)準(zhǔn),接受教育(或參加工作)不得少于6年的60~90歲老年人,經(jīng)倫理委員會批準(zhǔn),所有對象均簽署知情同意書。共分為4組:139名正常認(rèn)知者(normal control s,NC)、220例早期輕度認(rèn)知障礙患者(earl y mil d cognitive impairment,EMCI)、108例晚期輕度認(rèn)知障礙患者(l ate mil d cognitive impairment,LMCI)和76例AD患者。各組納入標(biāo)準(zhǔn)如下:(1)NC組:年齡、性別及教育水平均匹配;無記憶力下降;MMSE評分為24~30分;臨床癡呆評定量表(cl inical dementia rat ing,CDR)0分;認(rèn)知功能正常,基本日?;顒記]有障礙。(2)EMCI組:教育水平達到初中畢業(yè)水平及以上;MMSE評分為24~30分;邏輯記憶量表進行測試:教育水平為16年以上得分9~11分,8~15年得分5~9分,7年以下得分3~6分;CDR為0.5 且沒有其他認(rèn)知障礙;基本日?;顒訜o障礙。(3)LMCI組:同EMCI,區(qū)別是教育水平16年以上為≤8分,8~15年得分≤4分,0~7年得分≤2分。(4)AD組:MMSE評分為20~26分;CDR為0.5 或1.0 ;根據(jù)NINCDS/ADRDA新標(biāo)準(zhǔn)診斷為AD。
收集這些研究對象的sMRI圖像數(shù)據(jù),數(shù)據(jù)集由Phil ips 3.0 T磁共振掃描設(shè)備采集,采集參數(shù)為:射頻TR為6.8 ms,TE為3.1 ms,翻轉(zhuǎn)角為9°,視野大小 為:RL=204 mm/AP=240 mm/FH=256 mm,層 厚 為1.2 mm,層 數(shù) 為170,體 素 為1.0 mm×1.0 mm×1.2 mm。利用Free sur f er 3.4 .0 軟件將sMRI三維圖像經(jīng)過空間標(biāo)準(zhǔn)化、圖像平滑、圖像分割等一系列預(yù)處理后得到272項結(jié)構(gòu)形態(tài)學(xué)指標(biāo)包括70項皮層表面積(sur f ace ar ea,SA)、68項皮層厚度(cor t i cal t hi cknesses,TA)、16項海馬亞區(qū)體積(hippocampal subf iel d,HS)、49項 皮 層 下 體 積(subcortical vol ume,SV)和69項皮層體積(cor t ical vol ume,CV)。除此之外還獲得了對應(yīng)4項臨床統(tǒng)計數(shù)據(jù),包括性別、年齡、教育水平和MMSE評分(見表1)。
表1 研究對象人口統(tǒng)計臨床信息Tab.1 Demographic and clinical information of study subjects
本研究首先通過特征選擇獲得與分類相關(guān)的重要特征來增強學(xué)習(xí)算法的泛化能力,但是不再沿用傳統(tǒng)統(tǒng)計學(xué)方法來進行,而是希望與分類模型一樣,也通過機器學(xué)習(xí)算法能夠智能化選擇最優(yōu)特征。SVM在分類領(lǐng)域里得到了廣泛的研究和應(yīng)用且適合本研究數(shù)據(jù)的分類問題,而其本身不具備特征選擇能力,因此在SVM模型中引入正則化懲罰項來使特征個數(shù)最小化并且解決過擬合問題[8]。L1和L2正則化都可以達到這種目的,但L1比L2更容易獲得稀疏解[9]。L1正則化是損失函數(shù)的懲罰項,可以對某些參數(shù)作一定的限制。因此得到損失函數(shù):
針對272項數(shù)據(jù)集和加入4項臨床信息后的276項數(shù)據(jù)集這兩種進行特征選擇。根據(jù)特征選擇后排名順序決定預(yù)測相關(guān)度大小,各組得到的特征中排名越靠前說明對該階段病程的影響越大。本研究數(shù)據(jù)由Pyt hon 3.7 實現(xiàn),包括分類模型算法的運行。
1.4.1 SVM模型
SVM可以利用結(jié)構(gòu)風(fēng)險最小化的原理將輸入樣本映射到高位特征空間,在此空間上構(gòu)造最優(yōu)分類超平面,使分類問題獲得良好的泛化能力[5]。給定訓(xùn)練樣本(xi,yi),每一個樣本點xi對應(yīng)一個類別標(biāo)簽y i,yi∈{-1,1}。SVM的最優(yōu)分類函數(shù)為:
其中,n是樣本總數(shù),參數(shù)γ是決策面位置的截距,ω為控制方向的行向量,當(dāng)xi為決策面ωTx+γ=0所對應(yīng)的支持向量樣本點時,ωTxi+γ為-1或1。
1.4.2 BP神經(jīng)網(wǎng)絡(luò)模型
1.4.3 LR模型
1.4 .4 RF模型
RF屬于集成學(xué)習(xí)的一種,由許多決策樹組成。通過構(gòu)建并結(jié)合多個學(xué)習(xí)器來完成學(xué)習(xí)任務(wù)。算法的本質(zhì)是通過集合樹型分類器,構(gòu)造不同的訓(xùn)練集來增加分類模型間的差異并通過投票進行分類和預(yù)測[7]。RF的決策函數(shù)為:
其中,H(x)為組合模型函數(shù),hi(x)表示單個決策樹,Y表示目標(biāo)變量,經(jīng)過k輪訓(xùn)練得出最多決策樹支持的一類。
本研究采用最小偏差和方差的十折交叉驗證方法對各個分類模型進行評估。將數(shù)據(jù)集分成10份,隨機抽取9份作為訓(xùn)練樣本構(gòu)建分類模型,另一份作為測試集對模型性能進行檢驗,獲得分類結(jié)果,重復(fù)10次訓(xùn)練和測試后得到的10個測試結(jié)果均值即為該模型算法的準(zhǔn)確率,針對本研究數(shù)據(jù)類別分布的不平衡,除了準(zhǔn)確率這項評價指標(biāo)外,還考慮了敏感度和特異度。此外,AUC也用作評估分類器性能的指標(biāo)。
2.1 .1 272項特征選擇結(jié)果
通過L1-SVM特征選擇模型提取后,在識別NC與EMCI組時,有133項特征被提取并進入分類模型。其他NC-LMCI、NC-AD、EMCI-LMCI、EMCI-AD和LMCI-AD組中,分別有86、58、112、78和78項被提取。特征選擇的結(jié)果根據(jù)它們對該分類組的重要程度來排列,本研究只顯示各組前10項(見表2)。從整體來看,最主要的10項特征分別為TA-左顳橫回、SA-左顳下回、SV-右杏仁核、CV-右額眶回內(nèi)側(cè)、TA-左顳中回、HS-右海馬前下托、SA-左顳極、CV-右額上回、CV-左扣帶回后部、SA-左額眶回內(nèi)側(cè)。
表2 272項特征中貢獻最大的前10項特征Tab.2 Top 10 important features of 272 features
2.1 .2 276項特征選擇結(jié)果
將4項臨床人口學(xué)指標(biāo)加入到272個形態(tài)學(xué)指標(biāo)后,各指標(biāo)在區(qū)分每一組時的重要程度發(fā)生改變。在區(qū)分NC和EMCI組時,從276項特征中提取到的最優(yōu)特征子集有121項。同樣,對于NC-LMCI、NC-AD、EMCI-LMCI、EMCI-AD以及LMCI-AD這些組,分別有82、22、113、39和53項特征被提取到BP神經(jīng)網(wǎng)絡(luò)及其他模型。同樣只顯示貢獻最大的前10項。從整體來看,最主要的10項特征分別為TA-左顳橫回、MMSE評分、SA-左額眶回內(nèi)側(cè)、CV-右額眶回內(nèi)側(cè)、SA-左顳下回、SV-左腹側(cè)間腦、TA-左顳中回、年齡、TA-右眶回、HS-右海馬前下托。
從表3可看出,MMSE評分在AD病程的各個階段表現(xiàn)出非常明顯的變化。在識別NC-LMCI、EMCI-AD、LMCI-AD這3組分類時,年齡有很大影響。性別的重要性微乎其微。值得一提的是,在本研究中,針對疾病病程的各個階段特征的重要程度都展示出來。其中,在區(qū)分NC-EMCI組時,年齡排名第14位,性別排名第31位,文化程度排名第70位。對于NC-AD組,教育水平表現(xiàn)出顯著差異,年齡和性別沒有出現(xiàn)在最優(yōu)特征的子集中;對于EMCI和LMCI組,年齡排在第11位,性別排在第28位,教育水平排在第63位;對于EMCI和AD組,教育水平排在第23位,對于LMCI和AD組,性別排在第14位。
表3 276項特征中貢獻最大的前10項特征Tab.3 Top 10 important features of 276 features
本研究基于兩種數(shù)據(jù)集提取特征后進入BP神經(jīng)網(wǎng)絡(luò)模型進行分類,并與RF、SVM、LR 3種常用預(yù)測模型進行對比。結(jié)果發(fā)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測效果高于其他3種模型(見圖1、2),而且從整體來看,在276項數(shù)據(jù)集下分類預(yù)測結(jié)果更高,尤其識別NC-AD組時準(zhǔn)確率最高,為98.9 0%,而LR、SVM、RF 3種模型在識別該組時準(zhǔn)確率分別為90.6 6%、92.0 2%、96.7 7%。在272項數(shù)據(jù)集下BP神經(jīng)網(wǎng)絡(luò)、LR、SVM、RF模型在識別NC-AD組時準(zhǔn)確率分別為95.3 9%、89.4 2%、91.6 3%、92.1 8%。除此之外,BP神經(jīng)網(wǎng)絡(luò)分類模型基于276項數(shù)據(jù)集在NC-EMCI、NC-LMCI、EMCI-LMCI、EMCI-AD、LMCI-AD組的準(zhǔn)確率分別為83.5 3%、95.0 4%、93.0 1%、96.9 3%、92.4 1%。除了準(zhǔn)確率,各組在兩種數(shù)據(jù)集下的特異度、敏感度也比較高,AUC值更是高達1.0 0(見表4),且增加人口統(tǒng)計學(xué)指標(biāo)前后模型的泛化能力有所提高。
圖1 272項特征選擇下4種分類模型結(jié)果 圖2 276項特征選擇下4種分類模型結(jié)果Fig.1 The results of four classification models were selected for 272 features.Fig.2 The resultsof four classification modelswere selected for 276 features.
表4 BP神經(jīng)網(wǎng)絡(luò)在兩種特征數(shù)據(jù)集下的分類結(jié)果Tab.4 Classification results of BPneural network under two characteristic data sets
本研究發(fā)現(xiàn)了區(qū)分各分組時的關(guān)鍵病變部位,并按重要程度排名,更有助于預(yù)測病程進展。從272項sMRI形態(tài)學(xué)指標(biāo)特征選擇結(jié)果來看,最優(yōu)特征子集集中分布在邊緣系統(tǒng)和顳葉,海馬、海馬亞區(qū)、以及杏仁核隸屬于邊緣系統(tǒng)的組成結(jié)構(gòu)[12]。這些結(jié)構(gòu)都可以單獨被作為研究AD病程發(fā)展的指標(biāo)。
除了與已有研究一致的腦部形態(tài)學(xué)變化之外,本研究還發(fā)現(xiàn)僅在某個分組中的特征變化有助于預(yù)測病程判斷。TA-左顳橫回在識別NC-EMCI、NC-LMCI、EMCI-AD、LMCI-AD分組的各個病程中都尤為重要,顳橫回為聽覺皮質(zhì)區(qū),可見在AD疾病進程中聽覺的不斷弱化是判斷病程的重要依據(jù),與已有研究[13]一致。而在NC-AD組中SV-左海馬貢獻最大,說明海馬在正常人和AD患者之間的差異非常明顯,海馬主要負(fù)責(zé)學(xué)習(xí)和記憶,其萎縮情況反映AD病情的嚴(yán)重程度[14]。并且左側(cè)大腦比右側(cè)大腦嚴(yán)重,這與之前報道[13]一致。而HS-右海馬前下托在識別NC-LMCI組、NC-AD組以及LMCI-AD組時排名在最優(yōu)特征的前十,表明海馬亞區(qū)也可被用來反映或預(yù)測疾病病程的發(fā)展,甚至有研究表明海馬亞區(qū)可能更適合預(yù)測AD[15]。在區(qū)分NC-EMCI、NC-LMCI和EMCI-LMCI這3組時,SA-左顳下回對分類決策起重要作用,顳下回負(fù)責(zé)學(xué)習(xí)和記憶,在進展為LMCI的時候,患者的學(xué)習(xí)記憶表現(xiàn)出更多差異;由此可見,顳葉萎縮可以用來預(yù)測AD疾病的進展情況。
本研究將MCI分成EMCI和LMCI兩個階段,對NC、EMCI、LMCI、AD 4組進行兩兩分類,通過具體化分類更早識別MCI階段進而能夠?qū)D進行早期診斷,而以往的研究[16]只對NC、MCI、AD 3組進行兩兩分類,也涉及BP神經(jīng)網(wǎng)絡(luò)以及其他模型,然而在NC-AD組的分類準(zhǔn)確率一般在80%~95%。
在sMRI基礎(chǔ)上增加年齡、性別、教育水平3項人口統(tǒng)計學(xué)指標(biāo)和MMSE評分后在疾病病程各階段的準(zhǔn)確率均高于只有272項sMRI指標(biāo)的準(zhǔn)確率,可以實現(xiàn)最優(yōu)分類精度。無論是272項特征還是276項特征,BP神經(jīng)網(wǎng)絡(luò)分類器的整體預(yù)測效果都優(yōu)于其他3種分類器。尤其在NC轉(zhuǎn)化為AD的過程中,BP神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確率高達98.9 0%,而已有研究在引入性別、年齡后對NC-AD組的預(yù)測準(zhǔn)確率達91.0 7%[17]。
本文方法對病程分類的準(zhǔn)確率由高到低依次為NC-AD、EMCI-AD、NC-LMCI、EMCI-LMCI、LMCI-AD、NC-EMCI組。當(dāng)同樣的數(shù)據(jù)集采用傳統(tǒng)統(tǒng)計學(xué)方法進行特征選擇后用SVM分類研究[18]時準(zhǔn)確率達90.9 0%,而本研究L1-SVM特征選擇下該模型準(zhǔn)確率為91.6 3%。傳統(tǒng)統(tǒng)計學(xué)方法識別NC-AD組時準(zhǔn)確率最高為96.4 5%,而本研究為98.9 0%,總體預(yù)測效果高于傳統(tǒng)統(tǒng)計法,不同組別中結(jié)果略有差異。
本研究順應(yīng)當(dāng)下人工智能時代,提出的BP神經(jīng)網(wǎng)絡(luò)模型在L1-SVM特征選擇下對NC-EMCI-LMCI-AD兩兩分類的預(yù)測效果較好,這種聯(lián)合算法可以作為臨床輔助診斷AD的有效工具。綜合考慮影像數(shù)據(jù)與臨床特征信息有利于精準(zhǔn)預(yù)測AD病程,希望能夠為后續(xù)的研究提供參考。同時,本研究存在局限性,后續(xù)也會增加樣本量,嘗試用其他影像數(shù)據(jù),比如DTI、PET、f MRI或其他生物標(biāo)志物,進一步提高比較難區(qū)分的病程分類組識別率,從而及時進行干預(yù),阻礙病程進展,為國家和社會減輕負(fù)擔(dān)。
作者利益沖突聲明:全體作者均聲明無利益沖突。