亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        用于阿爾茨海默病診斷的權(quán)值分布特征學(xué)習(xí)*

        2019-05-20 06:56:24張道強(qiáng)
        軟件學(xué)報(bào) 2019年4期
        關(guān)鍵詞:特征選擇阿爾茨海默權(quán)值

        程 波,丁 毅,張道強(qiáng)

        1(重慶三峽學(xué)院 智能信息處理與控制重點(diǎn)實(shí)驗(yàn)室,重慶 404020)

        2(南京航空航天大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,江蘇 南京 210016)

        阿爾茨海默病(Alzheimer’s disease,簡稱 AD),又稱為老年癡呆癥,是當(dāng)前危害老年人健康的重要疾病之一.根據(jù)阿爾茨海默病的病理,盡早發(fā)現(xiàn)并治療能有效延緩疾病發(fā)展進(jìn)程.在醫(yī)學(xué)上,通常將阿爾茨海默病的病程劃分成3個階段:首先是癥狀前AD,然后發(fā)展為輕度認(rèn)知功能障礙(mild cognitive impairment,簡稱MCI),最后逐步發(fā)展成AD.因此,對早期阿爾茨海默病(MCI或者癥狀前AD階段)做出診斷將十分有助于治療或延緩AD的發(fā)展進(jìn)程.近年來,基于機(jī)器學(xué)習(xí)的腦圖像分析方法與技術(shù)被越來越多地應(yīng)用于早期阿爾茨海默病的診斷中[1-12].這些腦圖像通常有結(jié)構(gòu)磁共振成像(magnetic resonance imaging,簡稱 MRI)、正電子發(fā)射型計(jì)算機(jī)斷層成像(positron emission tomography,簡稱PET)等等.除了腦圖像,生物標(biāo)志物檢測對早期阿爾茨海默病的診斷也具有較高的靈敏度和特異性,其中,典型的生物標(biāo)志物有腦脊液(cerebrospinal fluid,簡稱CSF)中的生化標(biāo)記物水平檢測.研究認(rèn)為,綜合使用腦圖像與生物標(biāo)志物能夠有效提高早期阿爾茨海默病診斷的準(zhǔn)確度與敏感度.所以,越來越多的多模態(tài)機(jī)器學(xué)習(xí)方法被應(yīng)用于早期阿爾茨海默病的診斷中[4,5,7,9,11-16].

        在醫(yī)學(xué)實(shí)踐中,收集大量腦圖像來訓(xùn)練機(jī)器學(xué)習(xí)算法是一件費(fèi)時且代價昂貴的任務(wù).所以,通常情況下只有少量訓(xùn)練樣本可以使用,但是,為了獲得較好的診斷性能,很多研究采用了多模態(tài)腦圖像與生物標(biāo)志物來提高學(xué)習(xí)算法的性能[4,5,7,9,11,12,14,16],然而這樣又增加了特征維數(shù).面對高維小樣本的多模態(tài)學(xué)習(xí)問題,大量研究設(shè)計(jì)了特征選擇來避免過學(xué)習(xí)[4,5,7,9,13].其中,有一些研究采用稀疏學(xué)習(xí)來設(shè)計(jì)多模態(tài)特征選擇模型.例如,Zhang等人[14]根據(jù)多模態(tài)腦圖像與生物標(biāo)志物特征之間對 AD診斷具有互補(bǔ)性原理,提出一種多模態(tài)多任務(wù)學(xué)習(xí)方法,能從分類與回歸學(xué)習(xí)任務(wù)中學(xué)習(xí)出共同的最優(yōu)特征子集;Jie等人[4]提出一種半監(jiān)督多模態(tài)稀疏學(xué)習(xí)方法,可從標(biāo)記和未標(biāo)記的MRI與PET圖像上學(xué)習(xí)出共同的最優(yōu)特征子集;Zhu等人[9]提出一種基于矩陣相似性度量的多任務(wù)學(xué)習(xí)方法,可同時從多模態(tài)多任務(wù)訓(xùn)練集中學(xué)習(xí)出最優(yōu)特征子集.此外,Ye等人[13]提出一種基于 Lasso(least absolute shrinkage and selection operator)模型的穩(wěn)定特征選擇算法,可從串聯(lián)的多模態(tài)腦圖像與生物標(biāo)志物上學(xué)習(xí)出穩(wěn)定的最優(yōu)特征子集.雖然以上研究都能獲得判別性較好的特征子集,并能完成較好的分類性能,但是這些研究并未深入挖掘多模態(tài)特征之間的數(shù)據(jù)分布信息.

        在當(dāng)前基于神經(jīng)圖像的早期 AD診斷中,現(xiàn)存很多研究通過設(shè)計(jì)稀疏特征學(xué)習(xí)模型以獲取最優(yōu)特征子集,其中有不少研究利用Lasso模型進(jìn)行特征選擇[4,5,10,13,14,16],其原理是根據(jù)Lasso模型優(yōu)化學(xué)到的權(quán)值進(jìn)行特征篩選,大多數(shù)研究都是選擇非零權(quán)值對應(yīng)的特征,而無法獲取多模態(tài)特征之間的數(shù)據(jù)分布信息.由于傳統(tǒng) Lasso模型只包含權(quán)值的L1范數(shù)正則化項(xiàng),而它通常用于選擇那些能降低分類器泛化誤差的特征,無法獲取多模態(tài)特征的數(shù)據(jù)分布信息.實(shí)際上,針對分類問題,Lasso模型中的權(quán)值可以理解為調(diào)整特征貢獻(xiàn)度的權(quán)重值,若對傳統(tǒng)Lasso模型進(jìn)行改進(jìn),便可獲取特征的數(shù)據(jù)分布信息.此外,一些研究認(rèn)為,多模態(tài)腦圖像與生物標(biāo)志物特征之間對AD的診斷具有互補(bǔ)性[4,5,7,9,11,12,14,16].獲取多模態(tài)特征的數(shù)據(jù)分布信息,就是為了保持從多模態(tài)特征中選出的特征子集仍具有良好的互補(bǔ)性.

        傳統(tǒng)支持向量機(jī)(support vector machine,簡稱SVM)以其優(yōu)良的分類性能,被廣泛應(yīng)用于基于神經(jīng)圖像的早期AD診斷中[12,14,16,17],其核心思想是最大化“最小間隔”,以解決機(jī)器學(xué)習(xí)中“過學(xué)習(xí)”問題.然而現(xiàn)有一些研究表明,相比于最小間隔,“間隔分布”能夠更好地降低分類器的泛化誤差[18-20].因此,大間隔分布學(xué)習(xí)機(jī)(large margin distribution machine,簡稱LDM)受此啟發(fā),提出通過同時最大化間隔均值并最小化間隔方差來優(yōu)化間隔分布.另一方面,Lasso模型中的“權(quán)值”與SVM中的“間隔”對學(xué)習(xí)器的泛化性能起著相似的作用.此外,充分利用數(shù)據(jù)分布或變量分布先驗(yàn)信息能夠有效提高學(xué)習(xí)算法的性能,比如Geng提出的標(biāo)記分布學(xué)習(xí)[21]能夠解決除了單標(biāo)記與多標(biāo)記學(xué)習(xí)之外更多標(biāo)記學(xué)習(xí)問題.因此,為了保持多模態(tài)特征之間的互補(bǔ)性,應(yīng)充分利用多模態(tài)特征之間的分布信息.為了從多模態(tài)特征獲得泛化性能更好的特征子集,受大間隔分布學(xué)習(xí)[18-20]與標(biāo)記分布學(xué)習(xí)[21]的共同啟發(fā),對傳統(tǒng) Lasso模型進(jìn)行改進(jìn),通過增加同時最小化權(quán)值均值并最大化權(quán)值方差來優(yōu)化權(quán)值分布,以獲取多模態(tài)特征之間的分布信息,提出了基于權(quán)值分布的 Lasso特征選擇模型(weight-distribution based Lasso,簡稱WDL).

        此外,由于多模態(tài)腦圖像與生物標(biāo)志物特征之間對AD診斷具有互補(bǔ)性,設(shè)計(jì)權(quán)值分布Lasso特征選擇方法就是為了使選出的最優(yōu)特征子集不但具有良好的泛化性與可分性,還要盡量保持多模態(tài)特征之間的互補(bǔ)性.相比于支持向量機(jī) SVM,大間隔分布學(xué)習(xí)機(jī) LDM 能夠利用樣本數(shù)據(jù)分布的先驗(yàn)信息,所以能夠更有效地利用多模態(tài)特征之間的互補(bǔ)性.因此,LDM 更適合基于多模態(tài)特征的早期 AD診斷.綜合以上研究動機(jī),本文提出了基于權(quán)值分布的稀疏特征學(xué)習(xí)框架,由于該框架結(jié)合了WDL特征選擇模型和LDM分類器,因此將該分類學(xué)習(xí)模型表示為 WDL-LDM.為了驗(yàn)證本文提出的學(xué)習(xí)框架用于早期阿爾茨海默病診斷的有效性,采用國際老年癡呆癥數(shù)據(jù)庫(Alzheimer’s disease neuroimaging initiative,簡稱ADNI)上的MRI、PET和CSF多模態(tài)特征數(shù)據(jù),并與一些相關(guān)方法進(jìn)行比較.實(shí)驗(yàn)結(jié)果表明,WDL-LDM方法能夠有效地提高分類性能.

        1 方法概述

        為了獲得泛化性較好且分類精度較高的分類模型,本文根據(jù) Lasso特征選擇模型以及大間隔分布學(xué)習(xí)模型,提出了基于權(quán)值分布稀疏特征學(xué)習(xí)的早期阿爾茨海默病診斷框架.圖 1給出了該學(xué)習(xí)框架用于早期阿爾茨海默病診斷流程圖.具體來說,使用該學(xué)習(xí)框架進(jìn)行早期阿爾茨海默病診斷包括以下3個步驟.

        (1) 首先,分別對采集的MRI和PET腦圖像進(jìn)行預(yù)處理,其中,預(yù)處理方法采用文獻(xiàn)[12]中的方法.通過預(yù)處理,分別從MRI和PET圖像上提取了93維感興趣區(qū)域體積(volume)特征;

        (2) 將提取的MRI、PET特征以及CSF檢測值串聯(lián)成183維的多模態(tài)特征矩陣X,再結(jié)合類別標(biāo)記向量y,設(shè)計(jì)出基于權(quán)值分布的 Lasso特征選擇模型,用于從多模態(tài)特征中尋找最優(yōu)特征子集以解決高維小樣本學(xué)習(xí)問題;

        (3) 將第(2)步求解的最優(yōu)特征子集訓(xùn)練數(shù)據(jù)以及類別標(biāo)記向量y輸入到大間隔分布分類器.

        Fig.1 The system diagram of weight-distribution based sparse feature learning framework for early diagnosis of AD圖1 基于權(quán)值分布稀疏特征學(xué)習(xí)的早期阿爾茨海默病診斷框架示意圖

        2 基于權(quán)值分布稀疏特征學(xué)習(xí)的早期AD診斷方法

        2.1 腦圖像預(yù)處理

        對來自ADNI數(shù)據(jù)庫上的MRI和PET腦圖像采用文獻(xiàn)[12]中的預(yù)處理方法進(jìn)行預(yù)處理.具體過程為:首先采用N3算法[22]對所有圖像進(jìn)行前連合與后連合校正,再使用BSE(brain extraction tool)工具包[23]將顱骨剝離,去除小腦.然后使用FSL工具[24]把MRI圖像分割成3個不同的組織:灰質(zhì)、白質(zhì)、腦脊髓液.然后使用HAMMER算法[25]對所有MRI和PET圖像進(jìn)行配準(zhǔn),并標(biāo)注出所有圖像的93個感興趣區(qū)域.接著,再計(jì)算每個被試者M(jìn)RI圖像的93個感興趣區(qū)域的灰質(zhì)體積(volume)值.而對PET圖像計(jì)算各個感興趣區(qū)域的圖像平均強(qiáng)度值.經(jīng)過預(yù)處理后得到的特征是:來自MRI圖像的93個特征、來自PET圖像的93個特征和來自非圖像數(shù)據(jù)CSF的3個特征(分別是CSF Aβ42、CSFt-tau和CSFp-tau水平檢測值).

        2.2 基于權(quán)值分布的Lasso特征學(xué)習(xí)模型

        在基于機(jī)器學(xué)習(xí)的多模態(tài)阿爾茨海默病診斷領(lǐng)域里,通常面臨著高維小樣本學(xué)習(xí)問題.為了克服高維小樣本容易導(dǎo)致的“過學(xué)習(xí)”問題,本文采用權(quán)值L1范數(shù)來限制模型復(fù)雜性以獲得稀疏特征子集.另外,為了充分利用多模態(tài)腦圖像與生物標(biāo)志物特征之間對AD診斷的互補(bǔ)性,本文通過獲取多模態(tài)特征的數(shù)據(jù)分布信息來加以實(shí)現(xiàn).大間隔分布學(xué)習(xí)通過增加“間隔分布”正則化項(xiàng),深入挖掘出支持向量機(jī)中間隔分布方面先驗(yàn)信息,可有效降低支持向量機(jī)的泛化誤差.而傳統(tǒng) Lasso模型中的權(quán)值與特征存在——對應(yīng)關(guān)系,獲取多模態(tài)特征的數(shù)據(jù)分布信息,可以通過獲取權(quán)值分布信息來實(shí)現(xiàn).綜合以上動機(jī),本文提出基于權(quán)值分布的 Lasso特征學(xué)習(xí)模型 WDL.實(shí)際上,WDL就是在傳統(tǒng)Lasso模型中同時增加最小化權(quán)值均值與最大化權(quán)值方差正則化項(xiàng).由于在本文中大間隔分布學(xué)習(xí)一方面作為引出基于權(quán)值分布的 Lasso特征學(xué)習(xí)模型的鋪墊,另一方面也直接作為分類的分類器,所以在第2.2.1節(jié)中將加以介紹.

        2.2.1 大間隔分布學(xué)習(xí)機(jī)

        在基于神經(jīng)圖像的阿爾茨海默病輔助診斷領(lǐng)域里,大量研究采用支持向量機(jī)(SVM)作為分類器,且能獲得較好的分類性能,其核心思想是通過最大化“最小間隔”來優(yōu)化模型復(fù)雜度,以獲得泛化誤差較小的分類模型.實(shí)際上,間隔理論不僅在支持向量機(jī)中起著重要作用,還可以用于解釋其他優(yōu)秀學(xué)習(xí)算法的推廣性能,例如boosting集成學(xué)習(xí)[18].此外,根據(jù)間隔學(xué)習(xí)原理,近年來發(fā)展出代價敏感大間隔分布學(xué)習(xí)[20]與大間隔分布學(xué)習(xí)[19].其中的大間隔分布學(xué)習(xí)機(jī)(LDM)[19]是近年來發(fā)展起來的學(xué)習(xí)模型,該模型認(rèn)為優(yōu)化“間隔分布”比優(yōu)化“最小間隔”更加重要,提出同時增加最大化間隔均值并最小化間隔方差正則化項(xiàng),以降低分類器的泛化誤差.通過引入間隔分布正則化項(xiàng),研究結(jié)果顯示,LDM能夠獲得優(yōu)于SVM的分類性能與推廣性能[19].

        給定一組訓(xùn)練樣本集S={(x1,y1),(x2,y2),…,(xn,yn)},其中,n為訓(xùn)練樣本的數(shù)量.為了解決線性不可分的問題,支持向量機(jī) SVM需要將原始特征空間的任意一個訓(xùn)練樣本xi通過φ映射到高維空間.此外,支持向量機(jī)是傳統(tǒng)的大間隔學(xué)習(xí)方法,核心思想是最大化“最小間隔”以降低分類器的泛化誤差.其中,支持向量機(jī)y=ωTφ(x)中樣本(xi,yi)的間隔定義為[26]

        其中,最小間隔是所有訓(xùn)練樣本中樣本間隔的最小值.

        大間隔分布學(xué)習(xí)機(jī)LDM通過同時最大化間隔均值并最小化間隔方差來優(yōu)化間隔分布,以進(jìn)一步降低分類器的泛化誤差.那么最能表示間隔分布的統(tǒng)計(jì)量就是間隔均值和間隔方差了.為了方便公式表達(dá)和推導(dǎo),設(shè)X=[φ(x1),φ(x2),… ,φ(xn)],y= [y1,y2,…,yn]T.這樣,根據(jù)式(1)則可以計(jì)算得到間隔均值與方差分別為

        實(shí)際上,LDM就是在原SVM優(yōu)化問題基礎(chǔ)之上增加了間隔均值和間隔方差正則化項(xiàng),其形式化目標(biāo)函數(shù)[19]為

        其中,β1≥0和β2≥0分別是用于調(diào)節(jié)模型復(fù)雜度與間隔方差和間隔均值的正則化參數(shù),懲罰參數(shù)C>0用于調(diào)節(jié)分類模型的誤差.式(3)的優(yōu)化問題通過文獻(xiàn)[19]提出的平均隨機(jī)梯度下降(average stochastic gradient descent,簡稱ASGD)算法進(jìn)行求解.

        2.2.2 基于權(quán)值分布的Lasso特征選擇模型

        為了從串聯(lián)的 183維多模態(tài)特征向量中尋找泛化性能更好的特征子集,并獲取特征分布信息以保持多模態(tài)特征之間的互補(bǔ)性,受大間隔分布學(xué)習(xí)啟發(fā),本文提出了基于權(quán)值分布的 Lasso特征選擇模型.與傳統(tǒng) Lasso特征選擇模型不同的是,基于權(quán)值分布的 Lasso模型增加了權(quán)值分布正則化項(xiàng),亦即權(quán)值均值和權(quán)值方差.與大間隔分布學(xué)習(xí)不同的是,一方面通過最小化權(quán)值均值使優(yōu)化的權(quán)值向量更稀疏,另一方面最大化權(quán)值方差可以使判別性好的特征具有較大權(quán)重,從而更有利于從高維小樣本上學(xué)習(xí)最優(yōu)特征子集.

        對式(4)目標(biāo)函數(shù)的優(yōu)化問題,可以采用近端梯度下降(PGD)法[27,28]進(jìn)行求解.具體來說,式(4)的目標(biāo)函數(shù)J(w)可以分成兩個部分:平滑可求導(dǎo)部分G(w)和不可求導(dǎo)部分H(w),它們分別為

        則式(4)的目標(biāo)函數(shù)J(w)又可表示為

        由于H(w)不可導(dǎo),因此不能采用傳統(tǒng)梯度下降法進(jìn)行求解,但是根據(jù)文獻(xiàn)[27,28],可以采用式(4)目標(biāo)函數(shù)的近鄰梯度來求解.由于G(w)可導(dǎo),若G(w)梯度函數(shù)?G(w)滿足Lipschitz條件,即存在常數(shù)L>0,又根據(jù)泰勒公式對進(jìn)行G(w)展開,使得式(4)目標(biāo)函數(shù)J(w)在wk上基于近鄰梯度迭代的求解等式為

        令wj表示w的第j個分量,其中,w的各分量互不影響,于是式(9)有閉式解:

        3 實(shí)驗(yàn)分析

        3.1 ADNI數(shù)據(jù)庫

        本文實(shí)驗(yàn)數(shù)據(jù)均來自于國際阿爾茨海默病(ADNI)數(shù)據(jù)庫(http://adni.loni.usc.edu/).ADNI由國際老年研究所(National Institute on Aging,簡稱 NIA)、生物醫(yī)學(xué)成像和生物工程研究所(National Institute of Biomedical Imaging and Bioengineering,簡稱NIBIB)、美國食品和藥物管理局(Food and Drug Administration,簡稱FDA)、民營醫(yī)藥企業(yè)和非營利組織在 2003年啟動建立,其主要目標(biāo)是測試能否通過組合 MRI、PET、其他生物標(biāo)志物以及臨床神經(jīng)心理學(xué)評估來測定MCI和早期AD的進(jìn)展(progression).該數(shù)據(jù)庫包含的數(shù)據(jù)模態(tài)有:基于時間序列的MRI圖像數(shù)據(jù)、PET圖像數(shù)據(jù)以及其他類型生物標(biāo)記值,例如:CSF,還包括一些臨床的神經(jīng)心理學(xué)評估評分值,例如:簡易精神狀態(tài)檢查量表(mini-mental state examination,簡稱 MMSE)和老年癡呆癥評定量表(Alzheimer’s disease assessment scale-cognitive,簡稱ADAS-Cog).這些數(shù)據(jù)類別主要為:早期阿爾茨海默病患者(AD)、輕度認(rèn)知障礙患者(MCI)和認(rèn)知正常對照組(NC).ADNI數(shù)據(jù)庫的被試者從橫跨美國與加拿大50個網(wǎng)站招募而來.他們的最初目標(biāo)是招募800個成年志愿者,年齡段是55歲~90歲;其中有200人是連續(xù)3年跟蹤測試認(rèn)知正常的老人,有400人是連續(xù)3年跟蹤測試的輕度認(rèn)知障礙患者,還有200人是連續(xù)2年跟蹤測試的阿爾茨海默病患者.這些被試者的個人基本信息可從ADNI官網(wǎng)上獲得.

        本文同時選擇了具有MRI、PET和CSF模態(tài)的被試者樣本數(shù)據(jù)進(jìn)行實(shí)驗(yàn),并只選擇這些被試者的基準(zhǔn)時間點(diǎn)采集的數(shù)據(jù).在國際阿爾茨海默病數(shù)據(jù)庫中,同時具有以上3個模態(tài)數(shù)據(jù)的被試者為202個,更多詳情請參考文獻(xiàn)[12].表1列出這些被試者的人口統(tǒng)計(jì)資料信息.

        Table 1 Subject information (mean±std)表1 被試者樣本信息(均值±標(biāo)準(zhǔn)差)

        3.2 實(shí)驗(yàn)設(shè)置

        為了測試分布學(xué)習(xí)模型性能,本文采用 10折交叉驗(yàn)證策略來評價算法的分類性能.具體來說,將樣本集平均劃分成 10份,逐一地選擇其中 1份作為測試集,剩余 9份作為訓(xùn)練集.計(jì)算這 10次實(shí)驗(yàn)的平均精度(ACCuracy)、敏感度(SENsitivity)、特異度(SPEcificity)、受試者工作特征(receiver operating characteristic,簡稱ROC)曲線下面積(area under curve,簡稱AUC)值,以作為1次劃分的實(shí)驗(yàn)結(jié)果.然后隨機(jī)地交換樣本排列順序,再進(jìn)行1次10折交叉驗(yàn)證的劃分,并計(jì)算平均精度、敏感度、特異度、AUC值.重復(fù)10次劃分,并計(jì)算這10次劃分的平均精度ACC、敏感度SEN、特異度SPE和AUC值.

        另外,傳統(tǒng)支持向量機(jī)SVM以及其他需要采用支持向量機(jī)分類的比較方法,均采用LIBSVM(a Library for Support Vector Machine,簡稱LIBSVM)工具箱[29]仿真實(shí)現(xiàn).其中,所有使用SVM分類的方法都采用線性核,其他參數(shù)均采用系統(tǒng)缺省值.在基于權(quán)值分布的 Lasso特征選擇步驟中,正則化參數(shù)λ1,λ2,λ3通過網(wǎng)格搜索方法進(jìn)行優(yōu)化,其搜索范圍為 0~1,步長為 0.01.在采用大間隔分布學(xué)習(xí)機(jī)進(jìn)行分類的步驟中,采用文獻(xiàn)[19]中提出的大間隔分布學(xué)習(xí)機(jī)工具包(http://lamda.nju.edu.cn/code_LDM.ashx),參數(shù)β1,β2,C也通過網(wǎng)格搜索方法進(jìn)行優(yōu)化,其搜索范圍為 0~100,步長為 1.Lasso特征選擇模型采用 Zhou等人提出的 MALSAR工具包(http://www.yelab.net/software/MALSAR/),正則化參數(shù)同樣也通過網(wǎng)格搜索方法進(jìn)行優(yōu)化,其搜索范圍為 0~1,步長為 0.01.值得注意的是,本文所有方法的參數(shù)優(yōu)化都是在訓(xùn)練集上通過內(nèi)嵌的10折交叉驗(yàn)證優(yōu)化得到的.此外,采用文獻(xiàn)[12]中的歸一化方法進(jìn)行數(shù)據(jù)歸一化.

        3.3 實(shí)驗(yàn)結(jié)果

        3.3.1 不同方法分類性能比較

        為了驗(yàn)證本文提出的分布學(xué)習(xí)模型(WDL-LDM)用于早期阿爾茨海默病診斷的性能,分別和與之相關(guān)性較強(qiáng)的4種分類方法進(jìn)行比較.這4種分類方法分別是:傳統(tǒng)支持向量機(jī)(SVM)、大間隔分布分類機(jī)(LDM)、基于t-檢驗(yàn)(t-test)的特征選擇方法結(jié)合支持向量機(jī)分類器以及基于Lasso特征選擇方法結(jié)合支持向量機(jī)分類器.表2給出了WDL-LDM方法與其他4種方法在串聯(lián)的多模態(tài)數(shù)據(jù)上分別分類AD/NC、MCI/NC、pMCI/sMCI的性能比較實(shí)驗(yàn)結(jié)果.在表2中,SVM表示只采用SVM分類模型進(jìn)行分類實(shí)驗(yàn);LDM表示只采用LDM分類模型進(jìn)行分類實(shí)驗(yàn);t-test表示先采用 t-檢驗(yàn)進(jìn)行特征選擇,再使用 SVM 分類模型進(jìn)行分類實(shí)驗(yàn);Lasso表示先采用Lasso模型進(jìn)行特征選擇,再使用 SVM 分類模型進(jìn)行分類實(shí)驗(yàn);SLasso-LDM 表示先采用文獻(xiàn)[30,31]提出的Lasso-path方法進(jìn)行特征選擇,再使用LDM分類模型進(jìn)行分類實(shí)驗(yàn).其中,表2中列出的所有實(shí)驗(yàn)結(jié)果都是通過10次10折交叉驗(yàn)證劃分的平均值.此外,為了進(jìn)一步比較各種分類方法的性能,圖2繪制了表2中所有方法對應(yīng)的ROC曲線.

        Table 2 For three binary classification problems (AD/NC,MCI/NC,and pMCI/sMCI),our proposed method (WDL-LDM) compare with other state-of-the-art methods(SVM,Lasso,LDM,SLasso-LDM and t-test) using multimodal data表2 不同方法在多模態(tài)數(shù)據(jù)上分別分類AD/NC、MCI/NC、pMCI/sMCI的性能比較

        表2和圖2的實(shí)驗(yàn)結(jié)果表明,采用特征選擇步驟能夠改進(jìn)分類模型診斷早期阿爾茨海默病的性能.其中,在AD/NC分類實(shí)驗(yàn)中,采用本文提出的基于權(quán)值分布的Lasso(WDL)特征選擇方法能夠明顯提高僅采用LDM分類器的分類性能.然而,相比于僅采用SVM分類器,采用t-test和Lasso特征選擇方法只是輕微提高了分類精度、敏感度和特異度,而AUC值并未改變,這表明,采用以上兩種特征選擇方法不能有效改進(jìn)分類模型的性能.其次,在 MCI/NC分類實(shí)驗(yàn)中,采用特征選擇步驟能夠較明顯地改進(jìn)分類模型的性能.其中,采用本文提出的 WDL特征選擇方法能夠顯著提高LDM分類器的分類性能;采用t-test和Lasso特征選擇方法也能改進(jìn)一些SVM分類器的分類性能;而僅采用LDM分類器的性能不如僅采用SVM分類器的性能.最后,在pMCI/sMCI分類實(shí)驗(yàn)中,采用特征選擇步驟能夠顯著改進(jìn)分類模型的性能.其中,采用 t-test特征選擇方法只能輕微提高分類性能,然而分別采用WDL和Lasso特征選擇方法能夠顯著改進(jìn)LDM與SVM分類器的分類性能;尤其是WDL特征選擇方法能夠十分顯著地改進(jìn)LDM分類器性能;此外,僅采用LDM分類器的性能也明顯優(yōu)于僅采用SVM分類器的性能.同時,為了進(jìn)一步驗(yàn)證 WDL-LDM 的性能,實(shí)驗(yàn)中也采用文獻(xiàn)[30,31]提出的 Lasso-path方法來替換WDL-LDM中的WDL特征選擇方法,亦即表2中的SLasso-LDM方法;實(shí)驗(yàn)結(jié)果顯示,在3組分類實(shí)驗(yàn)中,WDL仍優(yōu)于Lasso-path方法.綜合以上表2和圖2的實(shí)驗(yàn)分析結(jié)果可以得出以下結(jié)論:本文提出的WDL特征選擇方法能夠有效地改進(jìn)分類器性能,其中,對pMCI/sMCI分類性能的改進(jìn)尤其顯著,并結(jié)合LDM分類器能夠完成較高的分類性能,因此本文提出的WDL-LDM方法能夠很好地應(yīng)用于早期阿爾茨海默病的診斷.

        Fig.2 ROC curves of different methods for three binary classification problems(AD/NC,MCI/NC,and pMCI/sMCI)圖2 不同方法在多模態(tài)數(shù)據(jù)上分別分類AD/NC、MCI/NC、pMCI/sMCI的ROC曲線

        3.3.2 多模態(tài)與單模態(tài)數(shù)據(jù)上的分類性能比較

        為了驗(yàn)證本文提出的分布學(xué)習(xí)模型(WDL-LDM)在多模態(tài)與單模態(tài)數(shù)據(jù)上的分類性能,分別將多模態(tài)特征數(shù)據(jù)(MRI+PET+CSF,簡稱MPC)和單模態(tài)特征數(shù)據(jù)(MRI、PET、CSF)輸入到WDL-LDM.表3就是WDL-LDM方法分別運(yùn)行在多模態(tài)特征和單模態(tài)特征數(shù)據(jù)上分類AD/NC、MCI/NC、pMCI/sMCI的實(shí)驗(yàn)結(jié)果.為了更直觀、更全面地比較這些方法的差異性,圖3繪制了表3中所有方法對應(yīng)的ROC曲線.表3和圖3的實(shí)驗(yàn)結(jié)果表明,采用多模態(tài)特征數(shù)據(jù)能夠獲得更好的分類性能,這是因?yàn)?這些多模態(tài)特征數(shù)據(jù)之間存在互補(bǔ)性的診斷信息.這也說明,WDL-LDM方法能夠有效融合多模態(tài)特征數(shù)據(jù).在3組都采用單模態(tài)特征數(shù)據(jù)的分類實(shí)驗(yàn)中,采用MRI模態(tài)特征能夠獲得最好的分類性能,這表明,早期阿爾茨海默病患者在腦組織的結(jié)構(gòu)形態(tài)上逐漸發(fā)生了萎縮.此外,除了使用MRI,采用PET或CSF模態(tài)特征也能獲得不錯的診斷性能,這說明,早期阿爾茨海默病患者不僅在腦組織結(jié)構(gòu)上出現(xiàn)了變化,也在腦組織功能上出現(xiàn)了變化.然而,單獨(dú)使用某一種模態(tài)特征都無法獲得同時使用這些多模態(tài)特征的分類性能,這也再次驗(yàn)證了 WDL-LDM 方法能從多模態(tài)特征中找到那些具有互補(bǔ)性的特征子集,從而避免多模態(tài)特征易引起的過學(xué)習(xí)問題,達(dá)到有效提高分類模型性能的目的.

        Table 3 Comparison of performances that the WDL-LDM method performs on multimodal and single modality data表3 分布學(xué)習(xí)模型分別在多模態(tài)數(shù)據(jù)與單模態(tài)上分類性能的比較

        Fig.3 ROC curves of the WDL-LDM method with multi-modality and single-modality data,respectively圖3 WDL-LDM分別在多模態(tài)數(shù)據(jù)與單模態(tài)上分類AD/NC、MCI/NC、pMCI/sMCI的ROC曲線

        3.3.3 判別性腦區(qū)檢測

        為了驗(yàn)證本文提出的分布學(xué)習(xí)模型(WDL-LDM)用于特征選擇與排序的有效性,表4~表6列出了在3組分類實(shí)驗(yàn)中 WDL方法選出的穩(wěn)定特征子集,然后根據(jù)選出特征對應(yīng)的平均權(quán)值進(jìn)行了排序,最后為了驗(yàn)證這個排序的準(zhǔn)確性,表中列出了這些特征在不同分類實(shí)驗(yàn)中的P值.表4~表6中穩(wěn)定特征就是在10次10折交叉驗(yàn)證實(shí)驗(yàn)中都被 WDL方法選中的特征,這些特征具有很好的泛化性和判別性.類似地,平均權(quán)值也就是 10次 10折交叉驗(yàn)證實(shí)驗(yàn)權(quán)值的均值.本文提出的WDL特征選擇方法與傳統(tǒng)Lasso最大的區(qū)別就是可利用權(quán)值分布信息進(jìn)行多模態(tài)特征選擇,這歸因于最小化權(quán)值向量均值與L1范數(shù)保證特征的稀疏性,同時最大化權(quán)值向量方差保持最優(yōu)特征子集的有序性.表 4~表 6中根據(jù)權(quán)值進(jìn)行的穩(wěn)定特征排序與P值排序保持一致,這證實(shí)了 WDL方法進(jìn)行最優(yōu)特征子集排序的有效性.此外,在表4~表6中,從MRI模態(tài)上選出的穩(wěn)定腦區(qū)特征均多于PET和CSF模態(tài),這也表明,單獨(dú)MRI模態(tài)在早期阿爾茨海默病的診斷性能優(yōu)于單獨(dú)采用PET或CSF模態(tài).在表4~表6的3組分類實(shí)驗(yàn)中,選出的穩(wěn)定特征子集均包含了3個模態(tài)的特征,這驗(yàn)證了多模態(tài)腦圖像與生物標(biāo)志物特征對AD診斷具有互補(bǔ)性.表4~表6中還有一個值得注意的現(xiàn)象,就是除了那些P值小于0.05的特征被選出以外,還有一些P值大于0.05的特征也被選中,這表明,t-test方法采用P值進(jìn)行特征選擇的局限性,也解釋了表2中WDL-LDM 方法分類性能明顯優(yōu)于 t-test方法的原因.WDL方法選出的穩(wěn)定腦區(qū)在其他相關(guān)文獻(xiàn)中都有報(bào)道[4,12-14,32,33],例如:hippocampal、amygdala、temporal lobe、precuneus、insula等等,這些腦區(qū)在醫(yī)學(xué)上被證實(shí)與早期阿爾茨海默病的診斷密切相關(guān).

        Table 4 Selected stable features ranking using the WDL-LDM method on AD/NC classification表4 在AD/NC分類實(shí)驗(yàn)中WDL-LDM選出的穩(wěn)定特征排序

        Table 5 Selected stable features ranking using the WDL-LDM method on MCI/NC classification表5 在MCI /NC分類實(shí)驗(yàn)中WDL-LDM選出的穩(wěn)定特征排序

        3.3.4 正則化參數(shù)對分類性能的影響

        表2的實(shí)驗(yàn)結(jié)果表明,增加WDL特征選擇步驟能夠明顯改進(jìn)LDM的分類性能,這也驗(yàn)證了本文提出WDL特征選擇方法的有效性.在WDL特征選擇模型中,通過添加權(quán)重分布正則化項(xiàng)到傳統(tǒng)Lasso模型中以提高模型泛化性能,這是由于權(quán)重分布對應(yīng)于特征分布,然而傳統(tǒng) Lasso模型沒有考慮特征分布信息,所以本文提出在傳統(tǒng) Lasso模型引入權(quán)重分布先驗(yàn)信息,亦即最小化權(quán)值均值并最大化權(quán)值方差.為了驗(yàn)證這個假設(shè)的有效性,在WDL-LDM模型中通過對WDL進(jìn)行不同正則化參數(shù)設(shè)置來探討分類性能的變化,以此來驗(yàn)證引入權(quán)重分布先驗(yàn)信息的有效性,表7給出了WDL特征選擇方法采用不同正則化參數(shù)設(shè)置時的WDL-LDM分類性能.

        Table 6 Selected stable features ranking using the WDL-LDM method on pMCI/sMCI classification表6 在pMCI/sMCI分類實(shí)驗(yàn)中WDL-LDM選出的穩(wěn)定特征排序

        Table 7 Classification performance comparison of our proposed method (WDL-LDM)using different setting of regularization parameters on the step of WDL feature selection表7 WDL特征選擇方法采用不同正則化參數(shù)設(shè)置的WDL-LDM分類性能比較

        在表 7中,正則化參數(shù)設(shè)置為“λ2,λ3=0”,表示沒有權(quán)重分布正則化項(xiàng),此時,WDL特征選擇模型就是傳統(tǒng)的Lasso;若設(shè)置為“λ2=0”,則表示沒有最小化權(quán)值均值正則化項(xiàng);若設(shè)置為“λ3=0”,則表示沒有最大化權(quán)值方差正則化項(xiàng);另外,若設(shè)置為“λ1,λ2,λ3>0”,則表示同時存在權(quán)重L1范數(shù)和權(quán)重分布正則化項(xiàng).表 7 的實(shí)驗(yàn)結(jié)果表明,在3組分類實(shí)驗(yàn)中同時采用權(quán)重L1范數(shù)和權(quán)重分布正則化項(xiàng)的WDL-LDM分類性能都優(yōu)于其他3種正則化參數(shù)設(shè)置方案.其中,不采用權(quán)重分布正則化項(xiàng),WDL-LDM 分類性能明顯不如“λ1,λ2,λ3>0”參數(shù)設(shè)置方案;單獨(dú)采用最小化權(quán)值均值或者最大化權(quán)值方差正則化項(xiàng),WDL-LDM 分類性能也明顯差于“λ1,λ2,λ3>0”參數(shù)設(shè)置方案.綜合以上實(shí)驗(yàn)結(jié)論表明,在傳統(tǒng)Lasso模型中同時加入最小化權(quán)值均值和最大化權(quán)值方差正則化項(xiàng)能夠有效改進(jìn)分類模型的性能.

        4 結(jié)束語

        為了獲得泛化性較好且分類精度較高的分類模型,本文根據(jù) Lasso特征選擇模型以及大間隔分布學(xué)習(xí)模型,提出了基于權(quán)值分布稀疏特征學(xué)習(xí)的早期阿爾茨海默病診斷框架.具體來說,該診斷框架包含3個部分:首先對采集的 MRI和 PET腦圖像進(jìn)行一系列預(yù)處理并提取特征;然后根據(jù)傳統(tǒng) Lasso模型提出基于權(quán)值分布的Lasso特征選擇模型(WDL),可用于從多模態(tài)特征中尋找性能更好的特征子集;最后采用大間隔分布分類機(jī)(LDM)訓(xùn)練分類模型.在國際老年癡呆癥數(shù)據(jù)庫(ADNI)上,采用 MRI、PET和 CSF多模態(tài)數(shù)據(jù)進(jìn)行實(shí)驗(yàn)驗(yàn)證,并與一些相關(guān)的方法進(jìn)行比較.實(shí)驗(yàn)結(jié)果表明,WDL-LDM 方法能夠有效提高分類性能,并能有效利用多模態(tài)特征分布信息.

        盡管本文取得了較好的結(jié)果,但仍有改進(jìn)空間.一方面,本文只針對數(shù)量有限的標(biāo)記訓(xùn)練數(shù)據(jù)設(shè)計(jì)了監(jiān)督學(xué)習(xí)算法,而臨床上存在許多未標(biāo)記的多模態(tài)數(shù)據(jù)還可利用,考慮將當(dāng)前的模型擴(kuò)展為半監(jiān)督學(xué)習(xí)方式是未來的發(fā)展方向之一.另一方面,臨床上也存在大量不完全的多模態(tài)數(shù)據(jù),充分利用這些不完全的多模態(tài)標(biāo)記數(shù)據(jù),不但可以增加訓(xùn)練樣本數(shù)量,針對不完全的多模態(tài)數(shù)據(jù)設(shè)計(jì)學(xué)習(xí)算法,還可以提高模型推廣性能.

        猜你喜歡
        特征選擇阿爾茨海默權(quán)值
        阿爾茨海默病的預(yù)防(下)
        中老年保健(2022年2期)2022-08-24 03:21:24
        阿爾茨海默病的預(yù)防(上)
        中老年保健(2022年1期)2022-08-17 06:14:36
        一種融合時間權(quán)值和用戶行為序列的電影推薦模型
        CONTENTS
        睡眠不當(dāng)會增加阿爾茨海默風(fēng)險(xiǎn)
        奧秘(2018年9期)2018-09-25 03:49:56
        基于權(quán)值動量的RBM加速學(xué)習(xí)算法研究
        Kmeans 應(yīng)用與特征選擇
        電子制作(2017年23期)2017-02-02 07:17:06
        聯(lián)合互信息水下目標(biāo)特征選擇算法
        CH25H與阿爾茨海默病
        基于特征選擇和RRVPMCD的滾動軸承故障診斷方法
        亚洲 高清 成人 动漫| 精品午夜一区二区三区| 色综合色综合久久综合频道| 亚洲欧美日韩一区在线观看| 国产蜜桃传媒在线观看| 国内自拍速发福利免费在线观看| 色噜噜久久综合伊人一本| 亚洲av成人一区二区三区| 欧美 国产 日产 韩国 在线 | 国产精品国产午夜免费看福利| 五月天亚洲av优女天堂| 亚洲av推荐网站在线观看| 羞羞色院99精品全部免| 国产综合精品| 97人妻碰碰视频免费上线| 美女自卫慰黄网站| 欧美 亚洲 国产 日韩 综AⅤ| 女同成片av免费观看| 国产一区二区视频在线看| 欧美精品欧美人与动人物牲交| 亚洲av无码一区二区三区人| av无码久久久久不卡网站下载| 亚洲产国偷v产偷v自拍色戒| 日韩有码中文字幕第一页| 大香蕉av一区二区三区| 国产精品毛片va一区二区三区| 亚洲国产高清在线一区二区三区| 亚洲AV日韩AV高潮喷潮无码| 成熟妇女毛茸茸性视频| 成人片黄网站a毛片免费| 成人精品综合免费视频| 亚洲AV日韩AV无码A一区| av在线不卡一区二区三区| 一区二区三区四区在线观看日本 | 亚洲成av人影院| 国产肉体ⅹxxx137大胆| 91极品尤物国产在线播放| 偷拍美女一区二区三区视频| 久久精品国产亚洲av性瑜伽| 国产农村妇女精品一二区| 国产乱沈阳女人高潮乱叫老|