劉 寧 楊 劍(北京工業(yè)大學(xué)信息學(xué)部 北京 100124)(磁共振成像腦信息學(xué)北京市重點(diǎn)實(shí)驗(yàn)室 北京 100124)(腦信息智慧服務(wù)北京市國際科技合作基地 北京 100124)
抑郁癥是一種的精神障礙疾病,輕度抑郁癥患者與有抑郁情緒的正常人表現(xiàn)很接近,不易診斷,且嚴(yán)重者會(huì)采取一些極端行為。目前,抑郁癥難以有效診斷,這與其主要根據(jù)醫(yī)師臨床經(jīng)驗(yàn)診斷的診斷方式有關(guān)。近年來,功能磁共振成像fMRI技術(shù)被廣泛用于大腦的功能和結(jié)構(gòu)研究,尤其在精神疾病的輔助診斷方面得到了研究者的高度關(guān)注,取得了很多成果[1-3]。但是,抑郁癥研究仍面臨fMRI數(shù)據(jù)難采集、樣本少的問題,對(duì)此本文采用生成式對(duì)抗網(wǎng)絡(luò)解決這個(gè)問題。
fMRI技術(shù)通過血氧水平依賴信號(hào)測(cè)量腦活動(dòng)并推斷不同腦區(qū)間的功能作用[1],是當(dāng)前研究腦功能連接的主要手段。分析靜息態(tài)fMRI數(shù)據(jù)的功能連接,常用的兩種方法是: 1)基于種子的分析方法[2];2)純數(shù)據(jù)驅(qū)動(dòng)的方法,例如:獨(dú)立成分分析ICA(Independent Component Analysis)[3]。ICA是一種無需借助先驗(yàn)?zāi)X圖模板,直接分離出相互獨(dú)立信號(hào)源的多元模式分析方法[4]。以它為基礎(chǔ)得到的功能連接網(wǎng)絡(luò)更合理、有效,因此本研究以組ICA分離出的獨(dú)立成分構(gòu)建動(dòng)態(tài)功能連接網(wǎng)絡(luò)。
目前,在探究抑郁癥的發(fā)病原因和構(gòu)建抑郁癥的輔助診斷方法方面已取得了很多成果,如Sikora等[5]發(fā)現(xiàn)前扣帶回凸顯網(wǎng)絡(luò)的功能連接增強(qiáng)、Kang等[6]通過多屬性相關(guān)圖構(gòu)建區(qū)域功能連接網(wǎng)絡(luò)并采用基于網(wǎng)絡(luò)的分類器進(jìn)行抑郁癥預(yù)測(cè)、Perti等[7]對(duì)多種功能連接方法做了全面的分析[7]。然而,fMRI數(shù)據(jù)難采集、可用樣本數(shù)遠(yuǎn)小于特征數(shù),導(dǎo)致一些機(jī)器學(xué)習(xí)算法無法使用。例如,線性判別分析算法,由于樣本維度遠(yuǎn)小于特征維度,導(dǎo)致該算法無法求出逆矩陣。在圖像研究中常通過旋轉(zhuǎn)、放縮、對(duì)折等操作增加圖像樣本,這樣增加的樣本實(shí)際上未出現(xiàn)新的樣本,無法有效解決我們的問題。
深度學(xué)習(xí)領(lǐng)域中熱門的生成式對(duì)抗網(wǎng)絡(luò)GAN(Generative Adversarial Networks)是一種基于數(shù)據(jù)分布的生成模型,能夠生成與訓(xùn)練數(shù)據(jù)同分布的樣本[8],因此受到圖像領(lǐng)域研究者廣泛關(guān)注。通過GAN生成的樣本保留了訓(xùn)練數(shù)據(jù)的屬性,但GAN本身存在模型不可控和網(wǎng)絡(luò)不穩(wěn)定的問題。針對(duì)這些問題,研究者在GAN上做了一些改進(jìn)以構(gòu)成更強(qiáng)的網(wǎng)絡(luò):1) 增加限制條件構(gòu)成條件生成式對(duì)抗網(wǎng)絡(luò)CGAN(Conditional Generative Adversarial Networks)[9]以解決模型不可控的問題;2) 引入神經(jīng)網(wǎng)絡(luò)優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)成深度卷積生成式對(duì)抗網(wǎng)絡(luò)DCGAN(Deep Convolutional Generative Adversarial Networks)[10]以解決網(wǎng)絡(luò)不穩(wěn)定問題。在DCGAN的基礎(chǔ)上,對(duì)其增加條件限制構(gòu)成條件卷積生成式對(duì)抗網(wǎng)絡(luò)(CDCGAN),這種網(wǎng)絡(luò)相對(duì)容易訓(xùn)練、模型可控且生成的樣本更符合研究者的預(yù)期。因此,本文采用CDCGAN解決fMRI可用樣本少的問題,同時(shí)需要說明的是目前還未有人將CDCGAN應(yīng)用于fMRI數(shù)據(jù)分析,本文是首次應(yīng)用此方法。
本文采用基于CDCGAN的分類方法研究了抑郁癥分類問題,主要包括以下四個(gè)步驟:1)采用組ICA提取靜息態(tài)fMRI數(shù)據(jù)的獨(dú)立成分,以其中可以體現(xiàn)自發(fā)神經(jīng)活動(dòng)的獨(dú)立成分為節(jié)點(diǎn)構(gòu)建全腦的動(dòng)態(tài)功能連接網(wǎng)絡(luò)并提取特征;2)采用肯德爾排序相關(guān)系數(shù)法選取辨別能力強(qiáng)的前100維特征作為初始數(shù)據(jù)集,并使用CDCGAN擴(kuò)充樣本;3)構(gòu)建擴(kuò)充數(shù)據(jù)集,并采用我們提出的混合特征選擇方法進(jìn)行特征選擇;4)應(yīng)用多元模式分析法對(duì)抑郁癥患者和正常被試進(jìn)行分類。擴(kuò)充數(shù)據(jù)集(采用CDCGAN)的最高正確率達(dá)92.68%遠(yuǎn)高于初始數(shù)據(jù)集(未采用CDCGAN)的最高正確率68.29%,說明了把CDCGAN應(yīng)用于抑郁癥分類是一種有效的探索,同時(shí)說明了本文提出的混合特征選擇法更有效。
本研究使用的數(shù)據(jù)包括來自北京安定醫(yī)院的20名抑郁癥患者(平均年齡35.25±9.54歲,8名男性)和21名正常人(平均年齡34.19±9.01歲,8名男性),所有被試均簽署了實(shí)驗(yàn)知情書。正常被試均未曾患過神經(jīng)紊亂病且滿足精神衛(wèi)生篩選表和神經(jīng)癥篩選表的量化標(biāo)準(zhǔn),抑郁癥患者均符合美國精神障礙診斷與統(tǒng)計(jì)學(xué)手冊(cè)(DSM-IV)和17項(xiàng)漢密爾頓評(píng)定量表(HAMD)的抑郁癥診斷標(biāo)準(zhǔn)。
本研究使用德國Siemens Trio Tim 3T磁共振掃描儀采集fMRI數(shù)據(jù)。采用平面回波成像進(jìn)行序列掃描,在掃描過程中被試頭部采用海綿墊固定,且要求保持閉眼、全身放松、盡量不進(jìn)行思維活動(dòng)。儀器掃描參數(shù)如下:重復(fù)時(shí)間TR=2 000 ms、回波時(shí)間TE=31 ms、旋轉(zhuǎn)角FA=90°、視野FOV=24 cm×24 cm、矩陣大小Matrix=64×64、層間距Gap=0.8 mm、體素Voxel=3.75 mm×3.75 mm×4 mm。所有被試的掃描時(shí)長均為310 s,采集了152幀功能像數(shù)據(jù)。為了消除設(shè)備磁場(chǎng)初始不穩(wěn)定性對(duì)數(shù)據(jù)采集的影響,剔除前10幀功能像數(shù)據(jù),對(duì)剩余的142幀功能像數(shù)據(jù)進(jìn)行預(yù)處理。本研究采用DPARSF軟件對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,主要步驟包括時(shí)間層校正和頭動(dòng)校正、空間標(biāo)準(zhǔn)化、空間平滑。
對(duì)預(yù)處理后的數(shù)據(jù),采用組ICA提取獨(dú)立成分,選擇其中噪聲相對(duì)小的成分構(gòu)建動(dòng)態(tài)功能連接網(wǎng)絡(luò)并提取特征構(gòu)建初始數(shù)據(jù)集,再通過CDCGAN構(gòu)建擴(kuò)充數(shù)據(jù)集,最后應(yīng)用多元模式分析法進(jìn)行分類?;贒CGAN的分類流程圖如圖1所示。
圖1 基于DCGAN的分類流程圖
ICA是一種多元數(shù)據(jù)驅(qū)動(dòng)的分析方法,從數(shù)據(jù)出發(fā),提取數(shù)據(jù)的特征,抽象出數(shù)據(jù)的模型,這些特性十分有利于fMRI數(shù)據(jù)的分析研究。本文采用空間ICA算法分析fMRI,通過GIFT工具箱中的組ICA算法提取經(jīng)過預(yù)處理的數(shù)據(jù)的組水平空間獨(dú)立成分。提取組獨(dú)立成分的主要步驟:1) 對(duì)數(shù)據(jù)進(jìn)行中心化和白化處理;2) 采用主成分分析對(duì)數(shù)據(jù)進(jìn)行兩次降維;3) 采用信息極大化算法(Infomax)進(jìn)行空間獨(dú)立成分的估計(jì)與分離;4) 數(shù)據(jù)反重構(gòu)。
根據(jù)以往的研究經(jīng)驗(yàn)[11],設(shè)定大腦fMRI信號(hào)獨(dú)立成分的個(gè)數(shù)為70,且在ICASSO軟件中重復(fù)了50次Infomax算法。采用組ICA所提取的70個(gè)獨(dú)立成分的一部分是我們需要的腦網(wǎng)絡(luò)成分,另一部分則是噪聲信號(hào)。依據(jù)獨(dú)立成分選擇標(biāo)準(zhǔn)[11]采用視覺觀察法,我們剔除了31個(gè)噪聲較多的獨(dú)立成分,并且通過匹配典型腦網(wǎng)絡(luò)成分[11],最終確定這些獨(dú)立成分分別為視覺網(wǎng)絡(luò)、默認(rèn)網(wǎng)絡(luò)、感覺運(yùn)動(dòng)網(wǎng)絡(luò)、聽覺網(wǎng)絡(luò)、注意網(wǎng)絡(luò)、前額葉網(wǎng)絡(luò)和基底核網(wǎng)絡(luò)。
對(duì)每個(gè)被試所提取的39個(gè)獨(dú)立成分的時(shí)間序列進(jìn)行后處理以消除掃描儀漂移和高頻生理噪聲的影響。具體操作包括:1) 去除時(shí)間序列的線性、二次、三次趨勢(shì);2) 多元線性回歸頭動(dòng)參數(shù);3) 對(duì)時(shí)間序列異常值進(jìn)行三階樣條插值;4) 高頻截止頻率為0.15 Hz的低通濾波。
對(duì)每個(gè)被試,首先采用滑動(dòng)時(shí)間窗技術(shù)構(gòu)建其全腦動(dòng)態(tài)功能連接網(wǎng)絡(luò),主要步驟如下:1) 用滑動(dòng)時(shí)間窗(窗寬w=30,步長s=5)對(duì)經(jīng)過后處理的39個(gè)獨(dú)立成分的時(shí)間序列進(jìn)行切割,得到23個(gè)窗;2) 對(duì)每個(gè)窗,以39個(gè)獨(dú)立成分作為網(wǎng)絡(luò)節(jié)點(diǎn),以獨(dú)立成分時(shí)間序列之間的Pearson相關(guān)系數(shù)作為連接邊構(gòu)建39×39的功能連接網(wǎng)絡(luò);3) 連接23個(gè)功能連接網(wǎng)絡(luò)形成39×39×23的動(dòng)態(tài)功能連接網(wǎng)絡(luò)。Pearson相關(guān)系數(shù)計(jì)算公式:
(1)
提取到的特征維度大且可能含有一些噪聲,通過特征選擇去除冗余特征進(jìn)而加快運(yùn)算速度、增強(qiáng)模型泛化能力。本文應(yīng)用了兩種特征選擇方法:肯德爾排序相關(guān)系數(shù)法[4]和本文提出的混合特征選擇法。
肯德爾排序相關(guān)系數(shù)法KTRCC(Kendall Tau Rank Correlation Coefficient)是一種基于非參數(shù)檢驗(yàn)的度量方法,能夠通過組間信息選出具有較強(qiáng)辨別能力的特征,但其沒有考慮組內(nèi)信息的影響。而基于Fisher準(zhǔn)則的特征選擇算法根據(jù)辨別能力越強(qiáng)的特征具有組內(nèi)距離越小、組間距離越大的特性,以單個(gè)特征的Fisher比(組間離差和組內(nèi)離差的比值)作為度量準(zhǔn)則,對(duì)特征進(jìn)行排序[12]。這種特征選擇方法可以同時(shí)兼顧組內(nèi)和組間信息,但由于它的度量準(zhǔn)則采取比值的方式,可能會(huì)出現(xiàn)判別能力不同的特征有相同的Fisher比值。對(duì)此,本文提出了一種基于KTRCC和Fisher的混合特征選擇方法,其能夠兼顧組內(nèi)和組間信息選出判別能力強(qiáng)的特征。混合特征選擇法使用基于Fisher準(zhǔn)則的特征選擇算法對(duì)KTRCC選出的具有較強(qiáng)辨別能力的特征進(jìn)行重排序。混合特征選擇的具體步驟如下:1) 預(yù)選出由KTRCC得到的前N維具有較強(qiáng)辨別能力的特征;2) 用基于Fisher準(zhǔn)則的特征選擇方法對(duì)預(yù)選出的N維特征進(jìn)行降序排序;3) 選取最前面一定數(shù)目(小于N)的特征作為分類預(yù)測(cè)樣本的特征。
我們通過CDCGAN擴(kuò)充數(shù)據(jù)。首先,采用KTRCC特征選擇法對(duì)41×23×741的數(shù)據(jù)集進(jìn)行特征排序,并選取具有較強(qiáng)辨別能力的前100維特征作為初始數(shù)據(jù)集(41×23×100),這樣可以去除冗余特征進(jìn)而加快運(yùn)算速度。然后,采用CDCGAN生成與初始數(shù)據(jù)具有相同分布的樣本(生成樣本的數(shù)目和初始數(shù)據(jù)中樣本的數(shù)目相同)。最后,對(duì)同一被試的生成數(shù)據(jù)集和初始數(shù)據(jù)集進(jìn)行連接,構(gòu)成(41×46×100)擴(kuò)充數(shù)據(jù)集。
DCGAN是GAN在卷積神經(jīng)網(wǎng)絡(luò)(CNN)上的擴(kuò)展,由生成網(wǎng)絡(luò)D與判別網(wǎng)絡(luò)G構(gòu)成。DCGAN的網(wǎng)絡(luò)G增加約束條件y構(gòu)成CDCGAN,且CDCGAN的網(wǎng)絡(luò)G和網(wǎng)絡(luò)D同樣是經(jīng)過結(jié)構(gòu)調(diào)整的CNN,具體的結(jié)構(gòu)調(diào)整如下:1) 取消所有的池化層,網(wǎng)絡(luò)G中采用反卷積進(jìn)行上采樣,D網(wǎng)絡(luò)中使用加入步幅的卷積代替池化;2) 網(wǎng)絡(luò)G和網(wǎng)絡(luò)D均采用batch normalization;3) 去掉全連接層,使網(wǎng)絡(luò)變成全卷積網(wǎng)絡(luò);4) 網(wǎng)絡(luò)G的最后一層使用tanh函數(shù)作為激活函數(shù),而其他層均采用ReLU函數(shù)作為激活函數(shù);5) 網(wǎng)絡(luò)D的最后一層采用softmax函數(shù),其他層采用LeakyReLU函數(shù)作為激活函數(shù)。CDCGAN結(jié)構(gòu)圖如圖2,其中z表示服從某一分布的隨機(jī)噪聲,y表示約束條件,x表示真實(shí)訓(xùn)練數(shù)據(jù),G(z|y)表示模型G生成的數(shù)據(jù),D(x|y)表示模型D的判別結(jié)果。
圖2 CDCGAN結(jié)構(gòu)圖
生成網(wǎng)絡(luò)G用于捕捉生成數(shù)據(jù)的分布,其與訓(xùn)練數(shù)據(jù)具有相同的分布,由服從某一分布的噪聲z生成;判別網(wǎng)絡(luò)D是一個(gè)二分類器,用于判別其輸入是訓(xùn)練數(shù)據(jù)還是生成數(shù)據(jù)。CDCGAN的優(yōu)化過程是一個(gè)“二元極小極大博弈”問題,訓(xùn)練時(shí)固定一方,更新另一方的網(wǎng)絡(luò)權(quán)重,交替迭代,使對(duì)方錯(cuò)誤最大化,最終雙方達(dá)到納什均衡。此時(shí)生成模型G估測(cè)出訓(xùn)練數(shù)據(jù)的分布,判別模型D的準(zhǔn)確率保持50%。上述優(yōu)化過程可表述為式(2):
Εz~pz(z)[log(1-D(G(z|y)))]
(2)
實(shí)驗(yàn)中CDCGAN的詳細(xì)構(gòu)件如下:1) 生成網(wǎng)絡(luò)G和判別網(wǎng)絡(luò)D采用了carpedm20提供的網(wǎng)絡(luò);2) y是被試的ID編號(hào)(1,…,41),且同一被試的所有窗擁有相同的ID編號(hào);3) 噪聲z是服從標(biāo)準(zhǔn)高斯分布的100維隨機(jī)數(shù);4) x為初始數(shù)據(jù)集。
在本研究中,我們采用線性支持向量機(jī)(LSVM)和線性判別分類器(LDC)對(duì)抑郁癥患者和正常被試進(jìn)行分類。LSVM對(duì)解決高維小樣本問題有著良好的性能,其采用最小間隔最大化的思想通過訓(xùn)練集尋找最優(yōu)分類決策面,并用此決策面預(yù)測(cè)測(cè)試樣本的標(biāo)簽。LDC具有理論簡單、速度快的優(yōu)點(diǎn),其將Bayes統(tǒng)計(jì)理論應(yīng)用于判別分析,通過訓(xùn)練集學(xué)習(xí)出數(shù)據(jù)的后驗(yàn)概率分布并根據(jù)Bayes判據(jù)預(yù)測(cè)測(cè)試樣本的標(biāo)簽。在分類時(shí),由于每名被試的數(shù)據(jù)由多個(gè)時(shí)間窗對(duì)應(yīng)的數(shù)據(jù)樣本構(gòu)成,因此每名被試的分類標(biāo)簽根據(jù)其所包含數(shù)據(jù)樣本的分類結(jié)果按照投票機(jī)制確定(即少數(shù)服從多數(shù))。
這一節(jié)展示了采用不同組合方法的最優(yōu)結(jié)果、多次實(shí)驗(yàn)的平均結(jié)果以及分類正確率的平均增長率,并且對(duì)其中一組數(shù)據(jù)進(jìn)行具體分析、比較了特征選擇方法,也比較了不同數(shù)據(jù)生成方法的分類結(jié)果。在分類時(shí),訓(xùn)練集為擴(kuò)充數(shù)據(jù)集,而測(cè)試集為擴(kuò)充數(shù)據(jù)集或初始數(shù)據(jù)集,分類器為LSVM或LDC,因此有四種采用了CDCGAN的組合(測(cè)試集- 分類器)方法:擴(kuò)充數(shù)據(jù)集-LSVM(M-LSVM)、擴(kuò)充數(shù)據(jù)集-LDC(M-LDC)、初始數(shù)據(jù)集-LSVM(O-LSVM)和初始數(shù)據(jù)集-LDC(O-LDC)。訓(xùn)練集和測(cè)試集均是初始數(shù)據(jù)集,采用LSVM和LDC分類器的組合方法分別為(T-LSVM)和(T-LDC)。
應(yīng)用混合特征選擇法,采用T-LSVM和T-LDC組合方法的最佳分類正確率分別為0.658 5和0.682 9。這兩種沒有采用CDCGAN的組合方法,作為實(shí)驗(yàn)的基線對(duì)照。
對(duì)擴(kuò)充數(shù)據(jù)集,本文采用混合特征選擇方法進(jìn)行特征選擇,并利用LSVM分類器和LDC分類器進(jìn)行分類。在采用留一交叉驗(yàn)證法分類時(shí),訓(xùn)練集為40個(gè)被試的擴(kuò)充數(shù)據(jù)集,測(cè)試集分別為剩余1個(gè)被試的初始數(shù)據(jù)集和擴(kuò)充數(shù)據(jù)集。在兩種測(cè)試集上采用不同的分類器都可以達(dá)到92.68%的分類正確率。由于CDCGAN中的噪聲z與網(wǎng)絡(luò)權(quán)重W的初始值采用隨機(jī)值,這會(huì)影響生成的數(shù)據(jù),因此我們運(yùn)行了10輪CDCGAN實(shí)驗(yàn),且每輪實(shí)驗(yàn)迭代1 000次,每迭代50次提取一次生成樣本,共提取了20組生成樣本,也就構(gòu)造了10×20組擴(kuò)充數(shù)據(jù)集。圖3所示為其中4組擴(kuò)充數(shù)據(jù)集在不同方法下的最優(yōu)分類結(jié)果。
圖3 采用CDCGAN及未采用CDCGAN的分類結(jié)果
由圖3可看出,在采用相同的特征選擇和分類器情況下,采用CDCGAN的最佳分類結(jié)果明顯高于未采用CDCGAN的最佳分類結(jié)果。圖中拐點(diǎn)是三角形的折線代表沒有采用CDCGAN的基線對(duì)照分類結(jié)果,拐點(diǎn)為菱形和正方形的折線代表采用了CDCGAN的分類結(jié)果。實(shí)線表示采用LSVM分類器的分類結(jié)果,虛線表示采用LDC分類器的分類結(jié)果。
由于實(shí)驗(yàn)中的CDCGAN有隨機(jī)初始值,為了評(píng)估采用CDCGAN模型的性能,對(duì)10×20組擴(kuò)充數(shù)據(jù)集的總體情況做了匯總。圖4表示參數(shù)N變化時(shí),擴(kuò)充數(shù)據(jù)集采用四種組合方法的最佳分類正確率相對(duì)于基線對(duì)照最佳分類正確率的平均增長率(均值±方差)結(jié)果。
圖4 關(guān)于N的最佳正確率的平均增長率
由圖4可以看出,四種組合方法的最佳分類正確率的平均增長率均為正值。這說明CDCGAN方法有助于fMRI數(shù)據(jù)分類。為了進(jìn)一步分析不同特征組合對(duì)分類的影響,我們?cè)趫D5中展示了N=85時(shí),不同特征維數(shù)的分類正確率的平均增長率。
圖5 不同特征維數(shù)的分類結(jié)果
以上實(shí)驗(yàn)結(jié)果表明了應(yīng)用CDCGAN可以顯著地提高抑郁癥分類正確率,也表明了抑郁癥fMRI數(shù)據(jù)應(yīng)用CDCGAN的可行性。
分類過程中,采用留一交叉驗(yàn)證法對(duì)每名被試進(jìn)行特征選擇與分類,由于每次交叉驗(yàn)證中的訓(xùn)練集存在微小的差異,這將導(dǎo)致每次通過特征選擇選出來的特征很可能不同。我們對(duì)圖3中的(c)組數(shù)據(jù)進(jìn)行了具體分析,比較了兩種特征選擇方法采用不同組合方法的最佳分類正確率。具體結(jié)果如表1所示。
表1 采用不同特征選擇法和不同組合方法的最佳分類結(jié)果以及相應(yīng)的參數(shù)取值
由表1可以看出,相同的訓(xùn)練集和測(cè)試集,采用混合特征選擇法可以取得更高的分類正確率。采用混合特征選擇法和M-LSVM組合方法,在表1中給出的最佳參數(shù)下,整個(gè)交叉驗(yàn)證過程共出現(xiàn)了59個(gè)功能連接特征,涉及34個(gè)獨(dú)立成分。為了評(píng)估不同獨(dú)立成分對(duì)分類的貢獻(xiàn),首先統(tǒng)計(jì)了整個(gè)交叉驗(yàn)證中每個(gè)功能連接特征出現(xiàn)的次數(shù)(即統(tǒng)計(jì)了每個(gè)特征所連接的兩個(gè)獨(dú)立成分組合所出現(xiàn)的次數(shù)),再統(tǒng)計(jì)每個(gè)獨(dú)立成分在整個(gè)過程中出現(xiàn)的次數(shù),然后對(duì)獨(dú)立成分出現(xiàn)的次數(shù)進(jìn)行歸一化,并以此作為獨(dú)立成分在分類過程中的貢獻(xiàn)權(quán)重。圖6給出了貢獻(xiàn)權(quán)重最大的前10個(gè)獨(dú)立成分,其中貢獻(xiàn)最高的前4個(gè)獨(dú)立成分分別為視覺網(wǎng)絡(luò)、視覺網(wǎng)絡(luò)、默認(rèn)網(wǎng)絡(luò)、默認(rèn)網(wǎng)絡(luò)。通過分析獨(dú)立成分的貢獻(xiàn),可得視覺網(wǎng)絡(luò)和默認(rèn)網(wǎng)絡(luò)內(nèi)部節(jié)點(diǎn)之間的連接存在異常,這與前人的研究成果基本一致[13-14]。
圖6 貢獻(xiàn)權(quán)重最大的10個(gè)獨(dú)立成分
目前常用的數(shù)據(jù)生成方法有對(duì)數(shù)據(jù)增加高斯噪聲生成新數(shù)據(jù)、使用GAN及其變形生成數(shù)據(jù)、使用自編碼及其變形生成數(shù)據(jù),并且據(jù)我們了解還未有人把數(shù)據(jù)生成方法應(yīng)用于fMRI領(lǐng)域。表2對(duì)比了由CDCGAN、自編碼、增加高斯噪聲這三種數(shù)據(jù)生成方法構(gòu)建的擴(kuò)充數(shù)據(jù)集,采用不同組合方法的最佳分類結(jié)果(特征選擇方法均為混合特征選擇法,且通過自編碼和增加高斯噪聲的方法均構(gòu)建了50組擴(kuò)充數(shù)據(jù)集)。
表2 采用不同數(shù)據(jù)生成方法和不同組合方法的最佳分類結(jié)果
CDCGAN能夠生成與訓(xùn)練數(shù)據(jù)具有相同分布的樣本。本文實(shí)驗(yàn)結(jié)果表明,我們提出的方法可以得到較高的分類正確率,這說明了抑郁癥fMRI數(shù)據(jù)采用CDCGAN方法擴(kuò)充數(shù)據(jù)樣本的可行性,同時(shí)說明了通過CDCGAN生成的數(shù)據(jù)有利于分類研究。另外,由于CDCGAN生成圖片數(shù)據(jù)時(shí)可通過視覺觀察法選取高質(zhì)量的生成樣本,因此CDCGAN在圖像研究中可能會(huì)有較理想的效果。本文提出的混合特征選擇法可選擇出有助于提高分類精度的特征,CDCGAN和混合特征選擇法在圖像分類中的應(yīng)用是我們下一步的探索目標(biāo)。
[1] 張兵,董云云,鄧紅霞,等.基于體素的fMRI數(shù)據(jù)分類研究及其應(yīng)用[J].計(jì)算機(jī)應(yīng)用與軟件,2015,32(2):138- 142.
[2] Hale J R, Mayhew S D, Mullinger K J, et al. Comparison of functional thalamic segmentation from seed-based analysis and ICA[J]. Neuroimage, 2015, 114:448- 465.
[3] 馬士林, 梅雪, 李微微,等. fMRI動(dòng)態(tài)功能網(wǎng)絡(luò)構(gòu)建及其在腦部疾病識(shí)別中的應(yīng)用[J]. 計(jì)算機(jī)科學(xué), 2016, 43(10):317- 321.
[4] Zeng L L, Shen H, Liu L, et al. Identifying major depression using whole-brain functional connectivity: a multivariate pattern analysis[J]. Brain A Journal of Neurology, 2012, 135(5): 1498- 1507.
[5] Sikora M, Heffernan J, Avery E T, et al. Salience Network Functional Connectivity Predicts Placebo Effects in Major Depression[J]. Biological Psychiatry Cognitive Neuroscience & Neuroimaging, 2016, 1(1):68- 76.
[6] Kang J, Bowman F D, Mayberg H, et al. A depression network of functionally connected regions discovered via multi-attribute canonical correlation graphs[J]. Neuroimage, 2016, 141:431- 441.
[7] Preti M G,Bolton T A W,Ville D V D.The dynamic functional connectome: state-of-the-art and perspectives[J].NeuroImage,2017,160:41- 45.
[8] Goodfellow I J, Pouget-Abadie J,Mirza M,et al.Generative adversarial nets[C]//International Conference on Neural Information Processing Systems.MIT Press,2014:2672- 2680.
[9] Mirza M, Osindero S.Conditional generative adversarial nets[DB]. arXiv:1411.1784, 2014.
[10] Radford A,Metz L,Chintala S.Unsupervised representation learning with deep convolutional generative adversarial networks[C]//International Conference on Learning Representations,2016.
[11] Allen E A, Erhardt E B, Damaraju E, et al. A baseline for the multivariate comparison of resting-state networks[J]. Frontiers in Systems Neuroscience, 2015, 5(5):2.
[12] 胡洋,李波.基于Fisher準(zhǔn)則和多類相關(guān)矩陣分析的腫瘤基因特征選擇方法[J].計(jì)算機(jī)應(yīng)用與軟件,2016,33(7):76- 78.
[13] 皇甫浩然,楊劍,楊陽.基于fMRI動(dòng)態(tài)連接的抑郁癥患者分類研究[J].計(jì)算機(jī)應(yīng)用研究,2017,34(3):678- 682.
[14] 朱雪玲, 袁福來. 基于區(qū)域的抑郁癥默認(rèn)網(wǎng)絡(luò)內(nèi)部功能連接研究[J]. 中國臨床心理學(xué)雜志, 2016, 24(2):218- 220.