亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多模態(tài)多標(biāo)記遷移學(xué)習(xí)的早期阿爾茨海默病診斷

        2016-09-29 19:08:54程波朱丙麗熊江
        計(jì)算機(jī)應(yīng)用 2016年8期
        關(guān)鍵詞:遷移學(xué)習(xí)阿爾茨海默病特征選擇

        程波 朱丙麗 熊江

        摘要:針對(duì)當(dāng)前基于機(jī)器學(xué)習(xí)的早期阿爾茨海默?。ˋD)診斷中訓(xùn)練樣本不足的問(wèn)題,提出一種基于多模態(tài)特征數(shù)據(jù)的多標(biāo)記遷移學(xué)習(xí)方法,并將其應(yīng)用于早期阿爾茨海默病診斷。所提方法框架主要包括兩大模塊:多標(biāo)記遷移學(xué)習(xí)特征選擇模塊和多模態(tài)多標(biāo)記分類回歸學(xué)習(xí)器模塊。首先,通過(guò)稀疏多標(biāo)記學(xué)習(xí)模型對(duì)分類和回歸學(xué)習(xí)任務(wù)進(jìn)行有效結(jié)合;然后,將該模型擴(kuò)展到來(lái)自多個(gè)學(xué)習(xí)領(lǐng)域的訓(xùn)練集,從而構(gòu)建出多標(biāo)記遷移學(xué)習(xí)特征選擇模型;接下來(lái),針對(duì)異質(zhì)特征空間的多模態(tài)特征數(shù)據(jù),采用多核學(xué)習(xí)技術(shù)來(lái)組合多模態(tài)特征核矩陣;最后,為了構(gòu)建能同時(shí)用于分類與回歸的學(xué)習(xí)模型,提出多標(biāo)記分類回歸學(xué)習(xí)器,從而構(gòu)建出多模態(tài)多標(biāo)記分類回歸學(xué)習(xí)器。在國(guó)際老年癡呆癥數(shù)據(jù)庫(kù)(ADNI)進(jìn)行實(shí)驗(yàn),分類輕度認(rèn)知功能障礙(MCI)最高平均精度為79.1%,預(yù)測(cè)神經(jīng)心理學(xué)量表測(cè)試評(píng)分值最大平均相關(guān)系數(shù)為0.727。實(shí)驗(yàn)結(jié)果表明,所提多模態(tài)多標(biāo)記遷移學(xué)習(xí)方法可以有效利用相關(guān)學(xué)習(xí)領(lǐng)域訓(xùn)練數(shù)據(jù),從而提高早期老年癡呆癥診斷性能。

        關(guān)鍵詞:多模態(tài)學(xué)習(xí);多標(biāo)記學(xué)習(xí);遷移學(xué)習(xí);阿爾茨海默病;特征選擇

        中圖分類號(hào):TP181

        0引言

        阿爾茨海默?。ˋlzheimers Disease, AD),又稱老年癡呆癥,是一種腦神經(jīng)元以及神經(jīng)元之間連接的漸進(jìn)性損傷,而引起的認(rèn)知和記憶功能減退的中樞神經(jīng)系統(tǒng)退行性腦部疾病。65歲以上老人中約有八分之一患有AD,隨著年齡增長(zhǎng)患病率明顯增加。研究預(yù)測(cè)2050年AD患者將達(dá)到1.15億[1],因此,盡早發(fā)現(xiàn)并治療能有效延緩疾病發(fā)展進(jìn)程,那么,AD早期階段診斷,也就是輕度認(rèn)知功能障礙(Mild Cognitive Impairment, MCI)診斷對(duì)延緩并治療AD具有十分重要的意義。近年來(lái),大量基于多模態(tài)特征的機(jī)器學(xué)習(xí)方法被應(yīng)用于早期AD診斷[2-8]。這些多模態(tài)特征,通常有結(jié)構(gòu)磁共振成像(Magnetic Resonance Imaging, MRI)、正電子發(fā)射型計(jì)算機(jī)斷層成像(Positron Emission Tomography, PET)、腦脊液(Cerebrospinal Fluid, CSF)以及其他模態(tài)腦圖像特征。這些基于多模態(tài)方法的研究[2-8]表明,采用多模態(tài)特征的方法能獲得比單模態(tài)方法更好的分類性能,因?yàn)椴煌B(tài)特征之間的互補(bǔ)性判別信息通過(guò)多模態(tài)方法能有效融合。

        最近,一些研究除了單純預(yù)測(cè)疾病類別之外,也開(kāi)始關(guān)注估計(jì)患者神經(jīng)心理學(xué)量表測(cè)試評(píng)分值[3,9-10]。其中有不少研究關(guān)注估計(jì)簡(jiǎn)易精神狀態(tài)檢查量表(Mini-Mental State Examination, MMSE)、阿爾茨海默病評(píng)定量表(Alzheimers Disease Assessment Scale-Cognitive subscale, ADAS-Cog)評(píng)分值[2,10-11]。相比分類方法預(yù)測(cè)疾病類別,回歸方法估計(jì)神經(jīng)心理學(xué)量表測(cè)試評(píng)分值能更加精細(xì)地診斷疾病的臨床階段;但是,有一些學(xué)者發(fā)現(xiàn)預(yù)測(cè)疾病類別與估計(jì)神經(jīng)心理學(xué)量表測(cè)試評(píng)分值是非常相關(guān)的學(xué)習(xí)任務(wù)[3,12-13],于是出現(xiàn)了一些學(xué)者開(kāi)始研究結(jié)合分類與回歸方法。其中:Zhang等[3]提出了一種多模態(tài)多任務(wù)學(xué)習(xí)方法,能從分類與回歸學(xué)習(xí)任務(wù)中學(xué)習(xí)出共同的最優(yōu)特征子集;Zhu等[12]提出了一種基于矩陣相似性度量的多任務(wù)學(xué)習(xí)方法,能同時(shí)從多模態(tài)多任務(wù)訓(xùn)練集中學(xué)習(xí)出最優(yōu)特征子集;此外,Wang等[13]提出了一種結(jié)構(gòu)稀疏多任務(wù)學(xué)習(xí)模型,能從分類與回歸學(xué)習(xí)任務(wù)中學(xué)習(xí)對(duì)AD疾病敏感的神經(jīng)圖像特征。以上研究表明,結(jié)合具有相關(guān)性的異質(zhì)多學(xué)習(xí)任務(wù)能明顯改進(jìn)單一學(xué)習(xí)任務(wù)的性能。

        然而,現(xiàn)有大多數(shù)結(jié)合分類與回歸學(xué)習(xí)任務(wù)的研究中,訓(xùn)練集數(shù)據(jù)都來(lái)自同一學(xué)習(xí)領(lǐng)域。在基于腦圖像疾病診斷的臨床實(shí)際中,存在許多相關(guān)學(xué)習(xí)領(lǐng)域的數(shù)據(jù)可利用。例如,最近一些研究發(fā)現(xiàn),診斷AD與診斷MCI是非常相關(guān)的兩個(gè)學(xué)習(xí)領(lǐng)域,并且利用分類任務(wù)AD與正常對(duì)照組(Normal Control, NC)能有效改進(jìn)診斷MCI的分類(也就是MCI轉(zhuǎn)化為AD表示為MCI-C;MCI不轉(zhuǎn)化為AD表示為MCI-NC)性能[7,14-15]。另外,引入相關(guān)學(xué)習(xí)領(lǐng)域數(shù)據(jù)能有效緩解小樣本問(wèn)題。在機(jī)器學(xué)習(xí)領(lǐng)域里,一些學(xué)者提出遷移學(xué)習(xí)來(lái)有效利用相關(guān)學(xué)習(xí)領(lǐng)域數(shù)據(jù),并在計(jì)算機(jī)視覺(jué)應(yīng)用領(lǐng)域獲得了較好的性能。在本文中,為了有效利用多模態(tài)相關(guān)學(xué)習(xí)領(lǐng)域(也即是診斷AD)數(shù)據(jù),提出了多模態(tài)多標(biāo)記遷移學(xué)習(xí)模型(Multimodal Multi-Label Transfer Learning, M2LTL)。具體來(lái)講,多模態(tài)多標(biāo)記遷移學(xué)習(xí)框架主要包括兩個(gè)模塊:1)多標(biāo)記遷移學(xué)習(xí)特征選擇模型,從多個(gè)學(xué)習(xí)領(lǐng)域訓(xùn)練集上尋找最具判別性的特征子集;2)多模態(tài)多標(biāo)記分類回歸學(xué)習(xí)器,同時(shí)進(jìn)行疾病分類診斷和神經(jīng)心理學(xué)量表測(cè)試評(píng)分值估計(jì)。為了驗(yàn)證本文提出方法的有效性,采用國(guó)際老年癡呆癥數(shù)據(jù)庫(kù)(Alzheimers Disease Neuroimaging Initiative, ADNI)上的MRI、PET和CSF多模態(tài)數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。

        1多模態(tài)多標(biāo)記遷移學(xué)習(xí)模型

        臨床上醫(yī)生通常結(jié)合多種診斷方式來(lái)確診早期阿爾茨海默病。鑒于此,本文要結(jié)合當(dāng)前機(jī)器學(xué)習(xí)診斷早期阿爾茨海默病的兩大主流方法,也即是分類、回歸。另外,有研究表明:分類方法預(yù)測(cè)疾病類別與回歸方法估計(jì)神經(jīng)心理學(xué)量表測(cè)試評(píng)分值是非常相關(guān)的學(xué)習(xí)任務(wù)?;谝陨蟿?dòng)機(jī),本文采用多標(biāo)記學(xué)習(xí)的方式來(lái)結(jié)合分類與回歸學(xué)習(xí)任務(wù)。另一方面,當(dāng)前大多數(shù)研究采用的訓(xùn)練集數(shù)據(jù)來(lái)源比較單一,且訓(xùn)練樣本有限。其實(shí),臨床上有很多相關(guān)領(lǐng)域數(shù)據(jù)(也稱為相關(guān)學(xué)習(xí)領(lǐng)域)以及其他模態(tài)的數(shù)據(jù)可利用,因此,本文提出要在多模態(tài)多領(lǐng)域訓(xùn)練數(shù)據(jù)上設(shè)計(jì)多標(biāo)記學(xué)習(xí)算法,也就是多模態(tài)多標(biāo)記遷移學(xué)習(xí)模型。

        具體來(lái)講,多模態(tài)多標(biāo)記遷移學(xué)習(xí)模型應(yīng)用于早期阿爾茨海默病診斷包含以下幾個(gè)方面:首先對(duì)MRI、PET圖像進(jìn)行預(yù)處理,并提取特征;然后采用多標(biāo)記遷移學(xué)習(xí)特征選擇方法分別從提取出的MRI、PET特征上選出最優(yōu)特征子集;最后將選出的有效特征子集輸入到多模態(tài)多標(biāo)記分類回歸學(xué)習(xí)器,以完成疾病類別的預(yù)測(cè)和神經(jīng)心理學(xué)量表測(cè)試評(píng)分值的估計(jì)。

        1.1多標(biāo)記遷移學(xué)習(xí)特征選擇

        從臨床上采集的MRI、PET圖像上提取出特征,一般情況下不能直接用于分類器進(jìn)行分類。因?yàn)樘崛〉奶卣魍ǔ>S數(shù)還比較高,而且其中包含有一部分不相關(guān)的特征。為了從提取的MRI或PET圖像特征中找出有效的決策性特征子集,文獻(xiàn)[16]提出基于穩(wěn)定特征選擇的稀疏Lasso(Least absolute shrinkage and selection operator)模型,實(shí)驗(yàn)表明該方法能獲得更有效地判別性特征子集。然而,該研究的稀疏Lasso模型不能用于多標(biāo)記組的目標(biāo)變量。鑒于此,本文提出稀疏多標(biāo)記Lasso模型。

        通過(guò)優(yōu)化式(1),得到的W中被選中特征對(duì)應(yīng)的行向量不全是非零值,這樣便可實(shí)現(xiàn)同時(shí)選擇對(duì)所有標(biāo)記組都有用的特征,也可保持自身標(biāo)記組內(nèi)有用的特征。采用ML-Lasso模型進(jìn)行特征選擇的工作過(guò)程為:首先輸入訓(xùn)練集數(shù)據(jù)矩陣X,以及其對(duì)應(yīng)的多標(biāo)記矩陣Y(本文采用了3組標(biāo)記,分別是疾病類別標(biāo)記向量y1、MMSE評(píng)分值標(biāo)記向量y2和ADAS-Cog評(píng)分值標(biāo)記向量y3);然后采用式(1)的ML-Lasso模型進(jìn)行優(yōu)化,從而得到稀疏權(quán)值矩陣W;最后挑選W的各個(gè)列權(quán)值向量非零值下標(biāo)對(duì)應(yīng)的特征。

        采用傳統(tǒng)基于單一領(lǐng)域訓(xùn)練集的機(jī)器學(xué)習(xí)腦圖像分析方法進(jìn)行腦疾病診斷,通常不能完成令人滿意的性能;但在最近的研究中發(fā)現(xiàn),多領(lǐng)域?qū)W習(xí)逐步被應(yīng)用于多模態(tài)腦圖像分析研究中[7,14],并能完成比單一領(lǐng)域?qū)W習(xí)更好的性能,因此,本文引入相關(guān)學(xué)習(xí)領(lǐng)域作為輔助領(lǐng)域知識(shí),

        擴(kuò)展前面的稀疏多標(biāo)記Lasso模型,并提出稀疏多標(biāo)記遷移學(xué)習(xí)Lasso模型。

        另一方面,稀疏多標(biāo)記Lasso模型,只適用于基于單一領(lǐng)域的多標(biāo)記學(xué)習(xí)問(wèn)題。如果要處理多領(lǐng)域數(shù)據(jù),只能分別使用該模型,通過(guò)式(1)優(yōu)化,分別得到各個(gè)領(lǐng)域里的優(yōu)化權(quán)值矩陣集合為{W1,W2,…,WD},D為學(xué)習(xí)領(lǐng)域總個(gè)數(shù)。由于這些權(quán)值矩陣分別在各自領(lǐng)域數(shù)據(jù)上單獨(dú)優(yōu)化得到,無(wú)法獲得多領(lǐng)域之間的相關(guān)性知識(shí)。為了充分挖掘多領(lǐng)域之間相關(guān)性先驗(yàn)信息,加入了各個(gè)領(lǐng)域之間的權(quán)值系數(shù)列向量wl,d局部平滑正則化項(xiàng)(d表示領(lǐng)域個(gè)數(shù)索引變量),也就是∑Ll=1∑D-1d=1‖wl,d-wl,d+1‖22,其作用是使各領(lǐng)域里同一類型的標(biāo)記組盡量相似,那么,擴(kuò)展式(1)的目標(biāo)函數(shù),提出的稀疏多標(biāo)記遷移學(xué)習(xí)Lasso模型的目標(biāo)函數(shù)為:

        其中:優(yōu)化變量三維矩陣W^∈RF×L×D是由各個(gè)領(lǐng)域的權(quán)值矩陣Wd組成的三維權(quán)值矩陣,Wd表示第d學(xué)習(xí)領(lǐng)域的權(quán)值矩陣;Xd第d學(xué)習(xí)領(lǐng)域的訓(xùn)練集;Yd為該領(lǐng)域訓(xùn)練集對(duì)應(yīng)的多標(biāo)記組矩陣;λ1,λ2,λ3>0為正則化參數(shù),用以控制式(2)中各項(xiàng)的貢獻(xiàn)度;‖·‖F(xiàn)運(yùn)算表示矩陣的Frobenius范數(shù)。目標(biāo)函數(shù)式(2)的最優(yōu)化問(wèn)題可以通過(guò)文獻(xiàn)[17]提出的快速梯度法求解。采用稀疏多標(biāo)記遷移學(xué)習(xí)Lasso模型進(jìn)行特征選擇的工作過(guò)程為:首先輸入所有學(xué)習(xí)領(lǐng)域訓(xùn)練集數(shù)據(jù)矩陣Xd(本文只采用了兩個(gè)學(xué)習(xí)領(lǐng)域,也即是一個(gè)輔助領(lǐng)域(AD和NC)與一個(gè)目標(biāo)領(lǐng)域(MCI-C和MCI-NC),故D=2),以及多領(lǐng)域訓(xùn)練集對(duì)應(yīng)的多標(biāo)記組矩陣Yd(每個(gè)領(lǐng)域都有3組標(biāo)記);然后采用式(2)的稀疏多標(biāo)記遷移學(xué)習(xí)Lasso模型進(jìn)行優(yōu)化,從而得到三維稀疏權(quán)值矩陣W^;最后挑選W^中的目標(biāo)領(lǐng)域權(quán)值矩陣非零值下標(biāo)對(duì)應(yīng)的最優(yōu)特征子集。

        1.2多模態(tài)多標(biāo)記分類回歸學(xué)習(xí)器

        對(duì)于提取的MRI、PET特征集合,分別采用前面提出的多標(biāo)記遷移學(xué)習(xí)特征學(xué)習(xí)算法,借助相關(guān)輔助領(lǐng)域數(shù)據(jù),獲得目標(biāo)領(lǐng)域用于分類與回歸的最優(yōu)特征子集。接下來(lái),采用多核學(xué)習(xí)技術(shù)來(lái)融合多模態(tài)特征數(shù)據(jù),該方法在一些研究[2-3]中多次被使用且很有效。首先,各個(gè)模態(tài)特征數(shù)據(jù)被轉(zhuǎn)化核矩陣。然后,采用多核學(xué)習(xí)技術(shù)融合這些多模態(tài)核矩陣。那么,對(duì)于第m模態(tài)上任意樣本x(m)i和x(m)j,其多模態(tài)合成核函數(shù)k為:

        k(xi,xj)=∑Mm=1cmk(m)(x(m)i,x(m)j)(3)

        其中:k(m)為第m模態(tài)上任意樣本x(m)i和x(m)j之間定義的核函數(shù);cm為第m模態(tài)上核函數(shù)的權(quán)值,需要在訓(xùn)練集上采用交叉驗(yàn)證的網(wǎng)格搜索方法來(lái)優(yōu)化確定。通過(guò)式(3),融合后目標(biāo)領(lǐng)域核矩陣為:K=∑Mm=1cmK(m),它被用于下一步的分類與回歸學(xué)習(xí)器中。

        為了有效融合多標(biāo)記組以用于同時(shí)分類與回歸學(xué)習(xí)任務(wù),采用式(1)稀疏多標(biāo)記Lasso的變形優(yōu)化問(wèn)題,那么多標(biāo)記分類回歸學(xué)習(xí)器目標(biāo)函數(shù)為:

        minV12‖KV-Y‖2F+β∑L-1l=1‖vl-vl+1‖22(4)

        其中:K∈RN×N是多模態(tài)特征融合的核矩陣;權(quán)值矩陣V=[v1,v2,…,vL]∈RN×L表示各個(gè)訓(xùn)練樣本在多標(biāo)記組上的權(quán)值,其任意一個(gè)列向量為vl;正則化項(xiàng)∑Ll=1‖vl-vl+1‖22的作用是使各個(gè)標(biāo)記組之間權(quán)值列向量盡量相似; β>0用于控制(4)中各項(xiàng)的貢獻(xiàn)度。目標(biāo)函數(shù)式(4)的最優(yōu)化問(wèn)題也可以通過(guò)文獻(xiàn)[17]提出的快速梯度法求解。采用多標(biāo)記分類回歸學(xué)習(xí)器進(jìn)行同時(shí)分類與回歸的工作過(guò)程為:首先將通過(guò)特征選擇后的多模態(tài)目標(biāo)領(lǐng)域訓(xùn)練集映射到核空間,得到多模態(tài)核矩陣K(m),然后采用式(3)方法得到核矩陣K;接下來(lái)將K和目標(biāo)領(lǐng)域多標(biāo)記組矩陣Y(仍是3組標(biāo)記)輸入到式(4)的多標(biāo)記分類回歸學(xué)習(xí)模型進(jìn)行優(yōu)化,從而得到權(quán)值矩陣V;最后將測(cè)試集數(shù)據(jù)矩陣乘以權(quán)值矩陣V,從而得到預(yù)測(cè)的標(biāo)記組矩陣。

        通過(guò)多標(biāo)記遷移學(xué)習(xí)特征選擇方法可以獲得對(duì)疾病敏感的特征子集,緊接著多模態(tài)多標(biāo)記分類回歸學(xué)習(xí)方法緊密結(jié)合了多模態(tài)和多標(biāo)記先驗(yàn)信息,從而實(shí)現(xiàn)了充分利用了多標(biāo)記先驗(yàn)信息。與傳統(tǒng)機(jī)器學(xué)習(xí)方法單純使用多模態(tài)數(shù)據(jù)、多領(lǐng)域數(shù)據(jù)、或者多標(biāo)記信息不同,本文提出的多模態(tài)多標(biāo)記遷移學(xué)習(xí)模型能同時(shí)結(jié)合多模態(tài)、多領(lǐng)域和多標(biāo)記信息,多層次利用它們來(lái)改進(jìn)學(xué)習(xí)器的性能。

        2實(shí)驗(yàn)數(shù)據(jù)與結(jié)果分析

        2.1實(shí)驗(yàn)數(shù)據(jù)

        本文實(shí)驗(yàn)數(shù)據(jù)均來(lái)自于國(guó)際老年癡呆癥數(shù)據(jù)庫(kù)(http://www.loni.ucla.edu/ADNI)。本文選擇了同時(shí)具有MRI、PET和CSF模態(tài)的被試者樣本數(shù)據(jù)進(jìn)行實(shí)驗(yàn),并只選擇這些被試者的基準(zhǔn)時(shí)間點(diǎn)采集的數(shù)據(jù)。在國(guó)際老年癡呆癥數(shù)據(jù)庫(kù)中,同時(shí)具有以上3個(gè)模態(tài)數(shù)據(jù)的被試者為202個(gè),更多詳情請(qǐng)參考文獻(xiàn)[3]。表1列出這些被試者的人口統(tǒng)計(jì)資料信息。

        以上所有被試者樣本的MRI和PET圖像,首先需要通過(guò)預(yù)處理并提取特征,然后才能用于分類或回歸。本文采用文獻(xiàn)[3]相同的圖像預(yù)處理與特征提取方法。通過(guò)預(yù)處理,最終每個(gè)被試者提取特征為:來(lái)自于MRI圖像的93維特征,來(lái)自于PET圖像的93維特征,以及來(lái)自于CSF生物標(biāo)記的3維特征。

        2.2實(shí)驗(yàn)設(shè)置

        為了驗(yàn)證本文提出的多模態(tài)多標(biāo)記遷移學(xué)習(xí)模型(M2LTL)性能,本文采用10折交叉驗(yàn)證策略來(lái)評(píng)價(jià)算法的分類性能。具體來(lái)說(shuō),對(duì)于MCI分類實(shí)驗(yàn),將99個(gè)MCI病人樣本平均劃分成10份,逐一地選擇其中1份作為測(cè)試集,剩余9份作為訓(xùn)練集。

        計(jì)算這10次實(shí)驗(yàn)的平均精度(ACCuracy)、敏感度(SENsitivity)、特異度(SPEcificity)、受試者工作特征(Receiver Operating Characteristic, ROC)曲線下面積(Area Under Curve, AUC)值,以作為1次劃分的實(shí)驗(yàn)結(jié)果。然后隨機(jī)地交換99個(gè)MCI病人樣本的順序,再進(jìn)行1次10折交叉驗(yàn)證的劃分,并計(jì)算平均精度、敏感度、特異度、AUC值。重復(fù)10次劃分,并計(jì)算這10次劃分的平均精度ACC、敏感度SEN、特異度SPE和AUC值。對(duì)于回歸實(shí)驗(yàn),直接對(duì)202個(gè)多模態(tài)特征樣本進(jìn)行10折交叉驗(yàn)證策略來(lái)評(píng)價(jià)算法的回歸性能。同樣地重復(fù)10次劃分,然后計(jì)算平均相關(guān)系數(shù)(CORRelation coefficient, CORR)值和均方誤差的平方根(Root Mean Square Error, RMSE)值。此外,本文只采用了兩個(gè)學(xué)習(xí)領(lǐng)域,分別是:輔助領(lǐng)域AD和NC、目標(biāo)領(lǐng)域MCI-C和MCI-NC。

        另外,傳統(tǒng)的支持向量機(jī)(Support Vector Machine, SVM)以及其他需要采用支持向量機(jī)分類的比較方法,均采用LIBSVM(a Library for Support Vector Machine, LIBSVM)工具箱[18]仿真實(shí)現(xiàn)。其中所有使用SVM分類的方法都采用線性核,其他參數(shù)均采用系統(tǒng)缺省值。為了驗(yàn)證M2LTL方法的回歸性能,引入相關(guān)向量機(jī)回歸方法(Relevance Vector Regression machine, RVR),仿真實(shí)驗(yàn)采用稀疏貝葉斯工具包(http://www.miketipping.com/index.htm)。在實(shí)驗(yàn)中,均采用高斯核函數(shù)。其中高斯核函數(shù)帶寬σ采用網(wǎng)格搜索優(yōu)化,其搜索范圍為:{2,4,8,16,32,64,128,256,512},其他參數(shù)均采用默認(rèn)值。此外,稀疏學(xué)習(xí)工具包[19]被用于Lasso、ML-Lasso和M2LTL優(yōu)化問(wèn)題的仿真實(shí)現(xiàn),其中正則化參數(shù)λ1、λ2、λ3和β需要在訓(xùn)練集上通過(guò)內(nèi)嵌的10折交叉驗(yàn)證策略優(yōu)化來(lái)獲得。所有要優(yōu)化的正則化參數(shù),它們的搜索空間為:{0.00001,0.0001,0.0005,0.001,0.004,0.007,0.01,0.02,0.03,0.05,0.06,0.08,0.1,0.2,0.4,0.6,0.8},通過(guò)網(wǎng)格搜索方法進(jìn)行優(yōu)化。值得注意的是,本文所有方法的參數(shù)優(yōu)化都是在訓(xùn)練集上通過(guò)內(nèi)嵌的10折交叉驗(yàn)證優(yōu)化得到的。在使用多模態(tài)特征數(shù)據(jù)時(shí),采用文獻(xiàn)[20]基于網(wǎng)格搜索方法優(yōu)化多核學(xué)習(xí)參數(shù)。此外,本文所有實(shí)驗(yàn)數(shù)據(jù)采用文獻(xiàn)[20]的相同特征歸一化方法。

        2.3實(shí)驗(yàn)結(jié)果與分析

        為了驗(yàn)證本文提出多模態(tài)多標(biāo)記遷移學(xué)習(xí)模型用于識(shí)別MCI轉(zhuǎn)化為AD病人的性能,分別在多模態(tài)(MRI+CSF+PET)和單模態(tài)(MRI、CSF、PET)數(shù)據(jù)上進(jìn)行測(cè)試,并與其他四種方法(Baseline、Lasso、ML-Lasso、MTFS(Multi-Task Feature Selection)[3])進(jìn)行比較,表2是這些方法在多模態(tài)和單模態(tài)數(shù)據(jù)上的分類性能。Baseline表示傳統(tǒng)的支持向量機(jī)(SVM)分類方法,且只在目標(biāo)領(lǐng)域里(也即是只有MCI樣本),并且沒(méi)有使用任何特征選擇方法,所以把它當(dāng)作基準(zhǔn)方法(Baseline)。Lasso則表示只在目標(biāo)領(lǐng)域里,先采用基本Lasso模型選擇有效特征子集,再使用SVM分類;ML-Lasso則表示也只在目標(biāo)領(lǐng)域里,再加上多標(biāo)記組,先采用ML-Lasso模型(式(1))選擇有效特征子集,再使用SVM分類。MTFS表示采用文獻(xiàn)[3]方法僅在目標(biāo)領(lǐng)域里進(jìn)行特征選擇,然后使用SVM方法分類。其中,表1中的所有實(shí)驗(yàn)結(jié)果都是通過(guò)10次10折交叉驗(yàn)證的劃分的平均值。此外,為了進(jìn)一步比較各個(gè)分類方法的性能,圖1繪制了表2中所有多模態(tài)方法對(duì)應(yīng)的ROC曲線。

        表2中給出了四種分類指標(biāo)(分類精度ACC、敏感度SEN、特異度SPE、ROC曲線面積AUC值)數(shù)據(jù)來(lái)驗(yàn)證MDML方法的有效性。表2的實(shí)驗(yàn)結(jié)果表明,無(wú)論是使用多模態(tài)還是單模態(tài)數(shù)據(jù),所有采用了特征選擇的方法都能提高分類器的性能,這也說(shuō)明了采用特征選擇改進(jìn)診斷性能的可行性。從表2的分類結(jié)果和圖1的ROC曲線來(lái)看,采用了M2LTL特征選擇方法能獲得比MTFS、ML-Lasso和Lasso模型更好的分類性能。此外,這些實(shí)驗(yàn)結(jié)果還表明,使用多模態(tài)數(shù)據(jù)能明顯改善只使用單模態(tài)數(shù)據(jù)的分類性能??傊?,以上實(shí)驗(yàn)結(jié)果說(shuō)明了,M2LTL方法能同時(shí)并且有效地使用多標(biāo)記組與相關(guān)輔助領(lǐng)域知識(shí),并顯著地改善診斷MCI轉(zhuǎn)化為AD病人的性能。

        為了進(jìn)一步評(píng)價(jià)M2LTL特征選擇方法對(duì)于診斷早期老年癡呆的性能,本文使用M2LTL方法選出的特征子集去估計(jì)MMSE和ADAS-Cog評(píng)分值,以此來(lái)預(yù)測(cè)AD或MCI病人的疾病階段。M2LTL和其他三種特征選擇方法(Lasso、MTFS、mLasso),以及無(wú)特征選擇的基準(zhǔn)方法(Baseline),分別估計(jì)MMSE和ADAS-Cog評(píng)分值的回歸性能結(jié)果如表3所示。其中:Baseline方法是基于相關(guān)向量機(jī)的回歸算法(Relevance Vector Regression machine, RVR),沒(méi)有使用任何特征選擇方法;Lasso表示先采用基本Lasso模型選擇有效特征子集,再使用RVR方法回歸;mLasso表示先采用變形的ML-Lasso模型(也就是式(1)沒(méi)有λ1‖W‖1,1懲罰項(xiàng),這樣選出的特征在所有標(biāo)記組上均有效)選擇有效特征子集,再使用RVR方法回歸;MTFS表示采用文獻(xiàn)[3]方法在目標(biāo)領(lǐng)域里進(jìn)行特征選擇,再使用RVR方法回歸。值得注意的是,由于回歸實(shí)驗(yàn)在202個(gè)被試者樣本上進(jìn)行,故沒(méi)有輔助領(lǐng)域數(shù)據(jù),那么M2LTL模型就等效于式(1)的ML-Lasso模型。

        表3的實(shí)驗(yàn)結(jié)果表明,相比Baseline方法,無(wú)論從相關(guān)系數(shù)還是估計(jì)誤差來(lái)看,特征選擇方法能明顯改進(jìn)學(xué)習(xí)器的回歸性能。其次,相比采用單標(biāo)記組的Lasso方法,多標(biāo)記特征選擇(M2LTL和mLasso)與多任務(wù)特征選擇方法(MTFS)能完成更好的回歸性能;而采用了組稀疏懲罰的M2LTL方法,能進(jìn)一步改進(jìn)mLasso模型的回歸性能,并且優(yōu)于多任務(wù)方法(MTFS)。最后,所有多模態(tài)方法也都明顯優(yōu)于單模態(tài)方法。所有這些實(shí)驗(yàn)結(jié)果都表明,采用多標(biāo)記組與多模態(tài)的先驗(yàn)信息能提高回歸模型預(yù)測(cè)AD或MCI病人疾病階段的有效性。

        3結(jié)語(yǔ)

        為充分利用多標(biāo)記相關(guān)學(xué)習(xí)領(lǐng)域的先驗(yàn)知識(shí),本文提出多模態(tài)多標(biāo)記(M2LTL)遷移學(xué)習(xí)模型。針對(duì)多模態(tài)腦圖像與生物標(biāo)記數(shù)據(jù),本文提出的學(xué)習(xí)模型能綜合利用基于多標(biāo)記的相關(guān)輔助領(lǐng)域知識(shí)。首先根據(jù)傳統(tǒng)稀疏Lasso特征學(xué)習(xí)框架,構(gòu)建稀疏多標(biāo)記Lasso特征選擇模型;接下來(lái),再根據(jù)遷移學(xué)習(xí)與多任務(wù)學(xué)習(xí)思想,構(gòu)建多標(biāo)記遷移學(xué)習(xí)特征學(xué)習(xí)模型;最后,構(gòu)建多模態(tài)多標(biāo)記分類回歸學(xué)習(xí)器。在國(guó)際老年癡呆癥數(shù)據(jù)庫(kù)上進(jìn)行實(shí)驗(yàn)測(cè)試,驗(yàn)證了M2LTL模型的有效性。實(shí)驗(yàn)結(jié)果表明,采用M2LTL方法能有效利用相關(guān)輔助學(xué)習(xí)領(lǐng)域訓(xùn)練數(shù)據(jù),從而提高了學(xué)習(xí)模型的分類性能和回歸估計(jì)性能。

        盡管本文取得了較好的結(jié)果,但仍有改進(jìn)的空間:首先,本文只采用了單一輔助領(lǐng)域數(shù)據(jù),而在臨床上,還有其他相關(guān)數(shù)據(jù)可利用,比如大量的無(wú)標(biāo)簽圖像數(shù)據(jù);

        可以考慮擴(kuò)展當(dāng)前的模型,使之能處理無(wú)標(biāo)簽數(shù)據(jù);完整的多模態(tài)數(shù)據(jù)往往不易獲取,易導(dǎo)致訓(xùn)練樣本不足,但其中某個(gè)模態(tài)數(shù)據(jù)卻比較充足,所以也可以考慮擴(kuò)展當(dāng)前模型,使之能處理不完全多模態(tài)數(shù)據(jù)。

        參考文獻(xiàn):

        [1]ASSOCIATION A. 2013 Alzheimers disease facts and figures [J]. Alzheimers Dement, 2013, 9(2): 208-245.

        [2]CHENG B, ZHANG D, CHEN S, et al. Semi-supervised multimodal relevance vector regression improves cognitive performance estimation from imaging and biological biomarkers [J]. Neuroinformatics, 2013, 11(3): 339-353.

        [3]ZHANG D, SHEN D. Multi-modal multi-task learning for joint prediction of multiple regression and classification variables in Alzheimers disease [J]. NeuroImage, 2012, 59(2): 895-907.

        [4]YOUNG J, MODAT M, CARDOSO M J, et al. Accurate multimodal probabilistic prediction of conversion to Alzheimers disease in patients with mild cognitive impairment [J]. NeuroImage: Clinical, 2013, 2: 735-745.(無(wú)期)

        [5]WESTMAN E, MUEHLBOECK J S, SIMMONS A. Combining MRI and CSF measures for classification of Alzheimers disease and prediction of mild cognitive impairment conversion [J]. NeuroImage, 2012, 62(1): 229-238.

        [6]CHENG B, LIU M, SUK H, et al. Multimodal manifold-regularized transfer learning for MCI conversion prediction [J]. Brain Imaging and Behavior, 2015, 9(4): 913-926.

        [7]CHENG B, LIU M, ZHANG D, et al. Domain transfer learning for MCI conversion prediction [J]. IEEE Transactions on Biomedical Engineering, 2015, 62(7): 1805-1817.

        [8]JIE B, ZHANG D, CHENG B, et al. Manifold regularized multitask feature learning for multimodality disease classification [J]. Human Brain Mapping, 2015, 36(2): 489-507.

        [9]ZHOU J, LIU J, NARAYAN V A, et al. Modeling disease progression via multi-task learning [J]. NeuroImage, 2013, 78(1): 233-248.

        [10]WANG Y, FAN Y, BHATT P, et al. High-dimensional pattern regression using machine learning: from medical images to continuous clinical variables [J]. NeuroImage, 2010, 50(4): 1519-1535.

        [11]ZHANG D, SHEN D. Predicting future clinical changes of MCI patients using longitudinal and multimodal biomarkers [J]. PLoS One, 2012, 7(3): e33182.

        [12]ZHU X, SUK H, SHEN D. A novel matrix-similarity based loss function for joint regression and classification in AD diagnosis [J]. NeuroImage, 2014, 100(1): 91-105.

        [13]WANG H, NIE F, HUANG H, et al. Identifying AD-sensitive and cognition-relevant imaging biomarkers via joint classification and regression [C]// MICCAI 2011: Proceedings of the 2011 International Conference on Medical Image Computing and Computer-Assisted Intervention. Berlin: Springer, 2011: 115-123.

        [14]CHENG B, ZHANG D, SHEN D. Domain transfer learning for MCI conversion prediction [C]// MICCAI 2012: Proceeding of the 2012 International Conference on Medical Image Computing and Computer-Assisted Intervention. Berlin: Springer, 2012: 82-90.

        [15]FILIPOVYCH R, DAVATZIKOS C. Semi-supervised pattern classification of medical images: application to Mild Cognitive Impairment (MCI) [J]. NeuroImage, 2011, 55(3): 1109-1119.

        [16]YE J, FARNUM M, YANG E, et al. Sparse learning and stability selection for predicting MCI to AD conversion using baseline ADNI data [J]. BMC Neurology, 2012, 12: 1412-1446.

        [17]NEMIROVSKI A. Efficient methods in convex programming [J]. Mathematical Programming, 2009, 26(1): 85-89.

        [18]CHANG C, LIN C. LIBSVM: a library for support vector machines [EB/OL]. [2015-10-09]. http://wwwcsientuedutw/~cjlin/libsvm.

        [19]LIU J, JI S, YE J. SLEP: sparse learning with efficient projections [EB/OL]. [2015-10-25]. http://wwwpublicasuedu/~jye02/Software/SLEP.

        [20]ZHANG D, WANG Y, ZHOU L, et al. Multimodal classification of Alzheimers disease and mild cognitive impairment [J]. NeuroImage, 2011, 55(3): 856-867.

        猜你喜歡
        遷移學(xué)習(xí)阿爾茨海默病特征選擇
        基于多特征融合的跨域情感分類模型研究
        奇異值分解與移移學(xué)習(xí)在電機(jī)故障診斷中的應(yīng)用
        Kmeans 應(yīng)用與特征選擇
        電子制作(2017年23期)2017-02-02 07:17:06
        基于內(nèi)容分析法對(duì)阿爾茨海默病患者居家照護(hù)概念的解析
        瑣瑣葡萄多糖對(duì)阿爾茨海默病模型大鼠行為學(xué)和形態(tài)學(xué)的影響
        HSP70敲低對(duì)AD轉(zhuǎn)基因果蠅的神經(jīng)保護(hù)作用
        功能磁共振成像在輕度認(rèn)知障礙患者中的應(yīng)用研究進(jìn)展
        聯(lián)合互信息水下目標(biāo)特征選擇算法
        一種基于遷移極速學(xué)習(xí)機(jī)的人體行為識(shí)別模型
        大數(shù)據(jù)環(huán)境下基于遷移學(xué)習(xí)的人體檢測(cè)性能提升方法
        欧美大胆性生话| 一区二区久久精品66国产精品| 精品亚洲国产亚洲国产| 本道天堂成在人线av无码免费| 任你躁国产自任一区二区三区| 日韩国产欧美| 女人一级特黄大片国产精品| 极品一区二区在线视频| 青青青爽在线视频观看| 国产精品熟妇视频国产偷人| 美女黄频视频免费国产大全| 国产亚洲综合另类色专区 | 久久精品亚洲熟女九色| 中文字幕在线乱码一区| 乱人伦人妻中文字幕无码| 国产精品乱一区二区三区| 久久深夜中文字幕高清中文 | 东京热东京道日韩av| 欧美高清精品一区二区| 国产精品无码av天天爽| 国产亚洲精品国产福利在线观看| 国产盗摄一区二区三区av| 十八禁视频在线观看免费无码无遮挡骂过| a级毛片100部免费看| 国产精品自产拍在线观看中文| 国产激情小视频在线观看 | 亚洲一区二区三区在线最新| 玩弄放荡人妇系列av在线网站| 中文字幕亚洲无线码| 美女被射视频在线观看91| av在线免费观看网站,| 插b内射18免费视频| 亚洲AV无码资源在线观看| 亚洲中文字幕国产剧情| 美女内射毛片在线看免费人动物| 亚洲乱码日产精品bd在线观看| 国产激情一区二区三区在线蜜臀| 亚洲国产精品中文字幕久久| 少妇久久久久久被弄到高潮| 欧美精品一区二区精品久久| 久久久精品国产av麻豆樱花|