李 瑤,趙云芃,李欣蕓,劉志芬,陳俊杰,郭 浩
(1.太原理工大學(xué) 信息與計(jì)算機(jī)學(xué)院,山西 晉中030600; 2.太原理工大學(xué) 藝術(shù)學(xué)院,山西 晉中 030600;3.山西醫(yī)科大學(xué)第一醫(yī)院 精神衛(wèi)生科,太原 030000)
近年來(lái),神經(jīng)影像學(xué)技術(shù)用于探索腦區(qū)間的交互作用已經(jīng)得到了越來(lái)越多的關(guān)注。低頻血氧水平依賴(Blood Oxygenation Level Dependent,BOLD)信號(hào)存在顯著的低頻相關(guān),可作為神經(jīng)生理學(xué)指標(biāo)用于靜息狀態(tài)功能磁共振成像(Resting-State functional Magnetic Resonance Imaging, RS-fMRI)來(lái)檢測(cè)靜息狀態(tài)下的腦自發(fā)活動(dòng)[1]。該自發(fā)活動(dòng)可通過(guò)BOLD信號(hào)的時(shí)間相關(guān)性來(lái)量化,進(jìn)而將其表征為腦網(wǎng)絡(luò)。復(fù)雜的腦網(wǎng)絡(luò)研究有助于闡明神經(jīng)精神疾病的機(jī)制,并有可能提供相關(guān)的成像標(biāo)記,為臨床腦疾病的診斷和評(píng)估提供新的視角[2],因此,腦功能網(wǎng)絡(luò)已成功地用于研究腦疾病的研究,包括癲癇、抑郁癥、阿爾茨海默癥、精神分裂癥等。
傳統(tǒng)的網(wǎng)絡(luò)模型大多都是捕捉兩個(gè)腦區(qū)間的信息。然而,已有研究表明在人腦交互活動(dòng)中,不僅兩個(gè)腦區(qū)間存在聯(lián)系,多個(gè)腦區(qū)間也同樣存在直接交互信息[3]。為了彌補(bǔ)傳統(tǒng)網(wǎng)絡(luò)的不足,超網(wǎng)絡(luò)被提出[4]。超網(wǎng)絡(luò)基于超圖理論,區(qū)別于傳統(tǒng)網(wǎng)絡(luò),其節(jié)點(diǎn)表示腦區(qū),超邊表示多個(gè)腦區(qū)間的直接交互,是對(duì)傳統(tǒng)的延伸。近年來(lái),超圖已成功地應(yīng)用于各種各樣的醫(yī)療影像領(lǐng)域包括圖像分割以及分類[5-6]。Liu等[5]使用視圖對(duì)齊超圖學(xué)習(xí)方法對(duì)阿爾茲海默癥中得到的不完整的多模態(tài)數(shù)據(jù)進(jìn)行分類診斷。彭瑤等[6]提出一種基于超圖的多模態(tài)特征選擇算法來(lái)改善原有方法對(duì)腦疾病的診斷。一些最近的研究給出了神經(jīng)科學(xué)和超圖之間的聯(lián)系[4,7-9]。Jie等[4]通過(guò)超圖技術(shù)創(chuàng)建腦功能超網(wǎng)絡(luò),來(lái)進(jìn)行腦疾病診斷。靳研藝等[7]考慮到腦區(qū)間的組效應(yīng),進(jìn)一步對(duì)Jie等[4]創(chuàng)建的超網(wǎng)絡(luò)進(jìn)行改進(jìn)。張帆等[8]考慮到全局的拓?fù)湫畔?,提出了基于腦功能超網(wǎng)絡(luò)的多特征融合分類方法。Gu等[9]提出了基于BOLD磁共振影像數(shù)據(jù)的超圖表示方法,且將超邊分成具體的三類:橋、星型以及聚類,來(lái)分別代表二分:焦點(diǎn)和空間分布式架構(gòu)。進(jìn)一步地,一個(gè)新的基于學(xué)習(xí)的超網(wǎng)絡(luò)最近也被提出來(lái)表示多個(gè)腦區(qū)間的復(fù)雜連接模式[10]。Zu等[10]采用基于超圖學(xué)習(xí)的方法來(lái)識(shí)別自閉癥譜系障礙和注意力缺陷多動(dòng)障礙疾病中子網(wǎng)絡(luò)中的生物標(biāo)記物。除此之外,其余感興趣的超圖應(yīng)用也被發(fā)現(xiàn)在蛋白質(zhì)功能預(yù)測(cè)和模式識(shí)別中[11],Gallagher等[11]將聚類系數(shù)擴(kuò)展到超網(wǎng)絡(luò)中,并從蛋白質(zhì)相互作用的角度來(lái)看待這些指標(biāo)的物理意義。
在最近的研究中,Jie等[4]利用Lasso(Least absolute shrinkage and selection operator)的方法求解稀疏回歸模型進(jìn)行超網(wǎng)絡(luò)的構(gòu)建,但Lasso方法由于本身的局限性,導(dǎo)致構(gòu)建的超網(wǎng)絡(luò)缺乏解釋分組效應(yīng)的能力[12]。然而,多個(gè)研究表明腦區(qū)間經(jīng)常存在組結(jié)構(gòu),腦區(qū)結(jié)構(gòu)傾向于共同參與以實(shí)現(xiàn)某種功能[13],因此,考慮到組結(jié)構(gòu)的問(wèn)題,之前的研究中,提出使用基于group Lasso(gLasso)方法來(lái)改善超網(wǎng)絡(luò)的創(chuàng)建[14],但group Lasso方法是在組級(jí)別上進(jìn)行變量選擇,這樣構(gòu)建的超網(wǎng)絡(luò)過(guò)于寬松,可能包含一些錯(cuò)誤的連接。
為了解決上述問(wèn)題,考慮到腦區(qū)間存在著潛能的組結(jié)構(gòu),本文對(duì)Guo等文章[14]進(jìn)行了延伸,進(jìn)一步提出sparse group Lasso(sgLasso)[15-17]方法來(lái)求解稀疏回歸模型進(jìn)行超網(wǎng)絡(luò)的創(chuàng)建從而解決組結(jié)構(gòu)問(wèn)題。sparse group Lasso方法是混合了Lasso與group Lasso方法,既選擇組間變量也選擇組內(nèi)的變量,是一個(gè)雙級(jí)選擇方法。該方法能夠有效地去除不重要的組以及重要組內(nèi)的不重要的單個(gè)變量[15-16]。
除此之外,多個(gè)研究證明真實(shí)網(wǎng)絡(luò)鄰域之間存在顯著的重疊,不僅單個(gè)頂點(diǎn)間的鄰居節(jié)點(diǎn)更容易重疊,而且單一的邊也有更大的鄰居凝聚力[11,18-19],因此為了更加準(zhǔn)確闡明神經(jīng)精神疾病的機(jī)制以及全面地評(píng)估疾病的性能,本研究又引入超網(wǎng)絡(luò)中廣泛使用的幾個(gè)成對(duì)節(jié)點(diǎn)間的相互聚類系數(shù)作為另一種特征提取方法。
本文主要工作包括:1)使用sparse group Lasso方法來(lái)創(chuàng)建腦功能超網(wǎng)絡(luò);2)通過(guò)使用兩組超網(wǎng)絡(luò)聚類系數(shù)計(jì)算方式提取特征使其更全面地表達(dá)腦功能網(wǎng)絡(luò)拓?fù)淝沂褂梅菂?shù)檢驗(yàn)來(lái)選擇具有差異的特征;3)使用多核支持向量機(jī)(Support Vector Machine,SVM)對(duì)選擇的特征進(jìn)行分類。
對(duì)于基于sparse group Lasso方法來(lái)創(chuàng)建超網(wǎng)絡(luò)來(lái)進(jìn)行腦網(wǎng)絡(luò)分析的流程框架主要包括數(shù)據(jù)收集及預(yù)處理,基于sparse group Lasso方法的功能超網(wǎng)絡(luò)創(chuàng)建,特征提取,特征選擇及分類。具體來(lái)說(shuō),這個(gè)框架由下列幾個(gè)步驟組成。
1)數(shù)據(jù)收集及預(yù)處理。
2)超網(wǎng)絡(luò)的創(chuàng)建:對(duì)于每個(gè)被試,使用稀疏線性回歸模型來(lái)創(chuàng)建超網(wǎng)絡(luò),即通過(guò)sparse group Lasso方法優(yōu)化目標(biāo)函數(shù),將選定區(qū)域由其他區(qū)域的時(shí)間序列的線性組合來(lái)表示。
3)特征提取與選擇。
a)使用超網(wǎng)絡(luò)中獨(dú)有的局部聚類系數(shù)的定義,計(jì)算成對(duì)節(jié)點(diǎn)間的聚類系數(shù)。也就是一對(duì)節(jié)點(diǎn)共享了多少條邊。
b)使用聚類系數(shù)在傳統(tǒng)圖中的定義,即一個(gè)頂點(diǎn)的鄰居也互相是鄰居的比例。將其概念應(yīng)用至超網(wǎng)絡(luò)中來(lái)定義聚類系數(shù),進(jìn)而求得每個(gè)節(jié)點(diǎn)的局部聚類系數(shù)。
4)使用非參數(shù)檢驗(yàn)來(lái)分別對(duì)兩種不同類型的局部聚類系數(shù)選取腦區(qū)特征。
5)分類模型構(gòu)建:
a)將兩種不同類型的局部聚類系數(shù)選取出的具有顯著差異的特征作為分類特征融合至一起來(lái)構(gòu)建對(duì)應(yīng)的分類器。
b)使用交叉驗(yàn)證方法來(lái)測(cè)試創(chuàng)建的分類器以及獲得最后分類結(jié)果。
按照山西醫(yī)學(xué)倫理委員會(huì)(reference number: 2012013)的建議征得所有參與者的同意,并參照Helsinki宣言與所有被試達(dá)成書面協(xié)議。本次實(shí)驗(yàn)中,一共招募66名被試,分別包括38名首發(fā),無(wú)用藥抑郁癥(Major Depressive Disorder, MDD)患者(15名男性;平均年齡:28.4±9.68歲,區(qū)間:17~49歲)和28名健康被試(13名男性;平均年齡:26.6±9.4歲,區(qū)間:17~51歲),所有被試者均為右利手。他們的影像數(shù)據(jù)通過(guò)3T磁共振掃描儀(Siemens Trio 3-Tesla scanner, Siemens, Erlangen, Germany)進(jìn)行收集來(lái)獲得。詳細(xì)被試信息參考表1。本文所用數(shù)據(jù)集已存至網(wǎng)盤,其鏈接為https://pan.baidu.com/s/11Ae-Qm9WX4MqwwobYjPP7g,提取碼為964a。
表1 被試基本特征 Tab. 1 Basic characteristics of subjects
參與者的影像數(shù)據(jù)由山西醫(yī)科大學(xué)第一附屬醫(yī)院中熟悉磁共振的放射科醫(yī)師來(lái)完成采集以及掃描工作。掃描過(guò)程中,所有參與者要求閉眼保持靜止,不去想其他事情。每次掃描得到248個(gè)連續(xù)的EPI功能圖像(volumes),且設(shè)置具體的掃描參數(shù)如下:33 axial slices, repetition time (TR)=2 000 ms,echo time (TE)=30 ms,thickness/skip=4/0 mm,field of view (FOV)=192 mm×192 mm,matrix=64 mm×64 mm,flip angle=90°。由于初始數(shù)據(jù)信號(hào)的不穩(wěn)定性,將功能圖像的前十個(gè)時(shí)間序列丟棄。
應(yīng)用SPM8(http://www.fil.ion.ucl.ac.uk/spm)進(jìn)行磁共振圖像數(shù)據(jù)預(yù)處理,主要通過(guò)時(shí)間層校正、頭動(dòng)校正、MNI空間標(biāo)準(zhǔn)化、帶通濾波器(0.01~0.10 Hz)和去線性漂移。首先對(duì)圖像進(jìn)行時(shí)間層校正和頭動(dòng)校正。將頭動(dòng)大于3 mm或轉(zhuǎn)動(dòng)超過(guò)3°的被試丟棄,使其不包括在最后的66例被試中;圖像校正后,接著進(jìn)行12維度放射變換,將校正后的圖像標(biāo)準(zhǔn)化到蒙特利爾神經(jīng)學(xué)研究所(Montreal Neurological Institute,MNI)標(biāo)準(zhǔn)空間中;最后進(jìn)行去線性漂移和帶通濾波來(lái)避免低頻漂移及高頻生物噪聲所造成的影響。
1.3.1 超圖論
圖論已經(jīng)被廣泛用于計(jì)算和腦研究成像,因?yàn)樗捎糜诹炕竽X連接,通過(guò)圖來(lái)表示感興趣對(duì)象之間的關(guān)系,且圖中的節(jié)點(diǎn)表示的是對(duì)象,邊即節(jié)點(diǎn)之間的連接來(lái)可以描繪對(duì)象之間的關(guān)系[20]。之前的許多研究都采用簡(jiǎn)單圖來(lái)創(chuàng)建網(wǎng)絡(luò)模型,節(jié)點(diǎn)作為腦區(qū),兩個(gè)節(jié)點(diǎn)間的連接作為一條邊,但這個(gè)只能僅僅表達(dá)成對(duì)腦區(qū)間的成對(duì)關(guān)系,但在腦區(qū)間的功能互動(dòng)中,越來(lái)越多的研究證明腦區(qū)間互動(dòng)存在高階關(guān)系,因此為了克服這個(gè)局限性,引入超網(wǎng)絡(luò)。
1.3.2 稀疏線性回歸模型
預(yù)處理完成后,按照自動(dòng)解剖標(biāo)記 (Anatomical Automatic Labeling, AAL)[22]模板將大腦劃分為90個(gè)感興趣區(qū)域(Region Of Interest,ROI),包括左右半腦各45個(gè)ROI,每個(gè)ROI作為功能腦網(wǎng)絡(luò)中的一個(gè)節(jié)點(diǎn)。需要注意的是90個(gè)ROI指的是大腦區(qū)域,小腦除外。每個(gè)腦區(qū)的平均時(shí)間序列通過(guò)執(zhí)行回歸來(lái)排除大腦中平均腦脊液(Cerebro-Spinal Fluid,CSF)、白質(zhì)信號(hào)以及頭動(dòng)校正的影響。這里需要注意的是,全腦平均信號(hào)是否回歸在該領(lǐng)域內(nèi)意見(jiàn)還不一致,因此為了避免爭(zhēng)議,本研究在數(shù)據(jù)預(yù)處理的過(guò)程中并未作全腦信號(hào)。利用rs-fMRI時(shí)間序列基于線性回歸方法構(gòu)建功能連接超網(wǎng)絡(luò)[4],具體來(lái)說(shuō),就是通過(guò)該方法將選定的腦區(qū)通過(guò)其他腦區(qū)的線性組合來(lái)表示,以此獲得該腦區(qū)與其他腦區(qū)的交互作用,同時(shí)迫使與無(wú)意義腦區(qū)的交互作用為零。
稀疏線性回歸模型具體表示如下:
xm=Amαm+τm
(1)
其中:xm表示第m個(gè)ROI的平均時(shí)間序列;Am=[x1,x2,…,xm+1,xm+2,…,xM]表示第m個(gè)ROI的數(shù)據(jù)矩陣(除了第m個(gè)腦區(qū)的所有平均時(shí)間序列,且對(duì)應(yīng)第m個(gè)ROI的平均時(shí)間序列設(shè)置為0);αm表示系數(shù)向量,其量化了從其他ROI到第i個(gè)ROI的影響程度;τm表示噪聲項(xiàng)。αm中非零元素表示的是與特定ROI有著交互作用的ROIs,零元素表示與特定ROI的交互作用是無(wú)意義的ROIs。
1.3.3 基于sparse group Lasso的超網(wǎng)絡(luò)創(chuàng)建
在之前的研究中,通過(guò)Lasso方法來(lái)求解稀疏回歸模型來(lái)創(chuàng)建腦網(wǎng)絡(luò)[4],但Lasso方法缺少解釋分組效應(yīng)的能力[12]。也就是說(shuō),如果一個(gè)特定的變量與一組變量的成對(duì)相關(guān)性都很高時(shí),那么Lasso方法通常只選擇一組變量中的一個(gè),且不關(guān)乎哪一個(gè),因此選取的方法過(guò)于嚴(yán)格,會(huì)丟失一些有用的連接。為了解決這一問(wèn)題,考慮到腦區(qū)之間的組結(jié)構(gòu),已有的研究通過(guò)引入group Lasso(后面用gLasso表示)方法來(lái)進(jìn)行超網(wǎng)絡(luò)的創(chuàng)建,主要是在事先定義的組級(jí)上進(jìn)行有效的變量選擇[23]。也就是說(shuō),gLasso將整個(gè)組視為一個(gè)整體,并確定它是否對(duì)問(wèn)題重要。雖然組套索給出了一組稀疏組,但如果在該模型中包含一個(gè)組,那么該組中的所有系數(shù)都將是非零的。有時(shí)希望同時(shí)包括組稀疏性和組內(nèi)稀疏性,例如,如果預(yù)測(cè)因子是腦區(qū),希望在多個(gè)腦區(qū)相互作用中識(shí)別特別“重要”的腦區(qū);然而,這種方法不能在一個(gè)組內(nèi)產(chǎn)生稀疏度。也就是在功能腦網(wǎng)絡(luò)中具有組結(jié)構(gòu)的多個(gè)腦區(qū)中有幾個(gè)腦區(qū)與選定腦區(qū)具有高度相關(guān)作用,gLasso則認(rèn)為該組中的所有腦區(qū)非零,也就是所有腦區(qū)均與選定腦區(qū)均具有高度相關(guān)作用。這樣構(gòu)建的網(wǎng)絡(luò)過(guò)于寬松,或者存在許多虛假的連接,或者丟失一些有用的連接。
因此引入sparse group Lasso(后面用sgLasso表示)[15]方法來(lái)改善超網(wǎng)絡(luò)的創(chuàng)建,這個(gè)方法仍然是基于線性回歸模型,但是既可以在組級(jí)上進(jìn)行變量選擇,又可以在單個(gè)變量級(jí)上進(jìn)行變量選擇,也就是說(shuō),可以在自由地選擇組間或組中的單個(gè)變量。在功能腦網(wǎng)絡(luò)中,如果存在組效應(yīng)的多個(gè)腦區(qū)中有一個(gè)或幾個(gè)腦區(qū)均與選定腦區(qū)相關(guān),則該方法不會(huì)只選擇該組,而是選擇該組中與它相關(guān)的一個(gè)或多個(gè)腦區(qū),當(dāng)然如果該組均高度相關(guān),則會(huì)選擇整組,這樣便能過(guò)濾掉一些虛假且保留一些有用的連接。因?yàn)閟gLasso方法是選擇出重要的組,在重要的組里再選擇重要的變量,因此在利用sgLasso方法進(jìn)行超網(wǎng)絡(luò)創(chuàng)建之前,需要通過(guò)聚類算法先依據(jù)90個(gè)腦區(qū)的平均時(shí)間序列進(jìn)行聚類得到分組,再基于該方法進(jìn)行超網(wǎng)絡(luò)構(gòu)建。本研究中采用k中心點(diǎn)聚類法[24]來(lái)進(jìn)行聚類從而對(duì)腦區(qū)進(jìn)行分組,通過(guò)設(shè)置不同的k值,則會(huì)獲得不同的超網(wǎng)絡(luò)拓?fù)浼胺诸愋阅堋T诒狙芯恐?,?dāng)聚類數(shù)目k設(shè)置為30時(shí),該方法實(shí)現(xiàn)最高的分類準(zhǔn)確率(詳細(xì)分析在3.1節(jié)涉及)。接著使用sgLasso方法來(lái)創(chuàng)建超網(wǎng)絡(luò),式(2)是優(yōu)化目標(biāo)函數(shù):
min(‖xm-Amαm‖2+λ1‖αm‖1+
(2)
其中:αm通過(guò)聚類被分成了k個(gè)非重疊的樹(shù)組(αmG1,αmG2,…,αmGk),而G1有樹(shù)結(jié)構(gòu)的節(jié)點(diǎn);λ1,λ2均是回歸參數(shù),λ1被用來(lái)調(diào)整模型組內(nèi)稀疏性,即控制非零組中非零系數(shù)的數(shù)量,λ2被用來(lái)調(diào)整組級(jí)稀疏性[25-26],即控制具有至少一個(gè)非零系數(shù)的組的數(shù)量。該模型是Lasso與gLasso的結(jié)合:λ1=0得到gLasso估計(jì),λ2=0即得到Lasso估計(jì)。需要注意的是,該模型看起來(lái)與elastic net模型有點(diǎn)相似,但卻是不同的,因?yàn)閘2范式在0處不可微分,因此一些組完全歸零;然而,在每個(gè)非零組中,它給出了彈性網(wǎng)絡(luò)擬合[27]?;谠摲椒▉?lái)構(gòu)建每個(gè)被試的超網(wǎng)絡(luò),ROI作為節(jié)點(diǎn),第m個(gè)ROI以及在αm中非零元素對(duì)應(yīng)的ROIs作為超邊。對(duì)于每一個(gè)ROI,固定λ2值,通過(guò)變化λ1值從0.1~0.9,增量為0.1,則會(huì)產(chǎn)生一組超邊。在該實(shí)驗(yàn)中,將λ2設(shè)置為0.4,得到了該模型中最高的準(zhǔn)確率,為87.88%。本實(shí)驗(yàn)中,通過(guò)SLEP包[28]來(lái)優(yōu)化求解(詳細(xì)的分析描述見(jiàn)3.2節(jié))。
功能連接超網(wǎng)絡(luò)創(chuàng)建之后,需要選取具有代表性、能夠識(shí)別目標(biāo)的特征集合,這就需要特征定義。在腦功能超網(wǎng)絡(luò)分析中,有多項(xiàng)指標(biāo)可以反映節(jié)點(diǎn)及整個(gè)網(wǎng)絡(luò)的特性,但在醫(yī)學(xué)影像領(lǐng)域中,大多數(shù)研究都是將聚類系數(shù)作為網(wǎng)絡(luò)局部特性指標(biāo)來(lái)改善疾病診斷性能。在之前的研究中,只涉及到單個(gè)節(jié)點(diǎn)的聚類系數(shù)作為特征提取方法;然而依據(jù)多個(gè)研究證明真實(shí)網(wǎng)絡(luò)鄰域之間存在顯著的重疊,不僅單個(gè)頂點(diǎn)間的鄰居節(jié)點(diǎn)更容易重疊,而且單一的邊也有更大的鄰居凝聚力(neighborhood cohesiveness around individual edges)[11,18-19],因此為了盡可能更加準(zhǔn)確且全面地評(píng)估疾病的性能,本研究又引入超網(wǎng)絡(luò)中廣泛使用的幾個(gè)成對(duì)節(jié)點(diǎn)間的相互聚類系數(shù)作為另一種特征提取方法。
1.4.1 單一節(jié)點(diǎn)的聚類系數(shù)的特征提取
超網(wǎng)絡(luò)構(gòu)建完成后,需對(duì)其執(zhí)行特征提取計(jì)算。本研究中,從不同角度引入了超圖中三種不同定義的單一節(jié)點(diǎn)的聚類系數(shù)(HCC1、HCC2、HCC3)來(lái)描述超網(wǎng)絡(luò)的局部聚合[11]。單一節(jié)點(diǎn)的聚類系數(shù)與傳統(tǒng)圖中聚類系數(shù)定義相同,即一個(gè)節(jié)點(diǎn)其鄰居的緊密程度。從連接超網(wǎng)絡(luò)中依據(jù)這三個(gè)基于單一節(jié)點(diǎn)的聚類系數(shù)提取特征。表2表示了定義及這些屬性的計(jì)算。
表2 基于單個(gè)節(jié)點(diǎn)的聚類系數(shù)的定義與公式 Tab. 2 Definitions and calculation formulas of clustering coefficients based on single node
表2中:u,t,v指的是某一節(jié)點(diǎn);N(v)={u∈V:?e∈E,u,v∈e}指的是節(jié)點(diǎn)集,E指的是超邊集,e指的是某條超邊,N(v)表示包含節(jié)點(diǎn)的所在超邊含有的其他節(jié)點(diǎn)的集合;若?ei∈E,且u,t∈e,但v?ei,則I(u,t,v)=1,否則I(u,t,v)=0;S(v)={ei∈E:v∈ei},v表示節(jié)點(diǎn),ei表示超邊,S(v)表示包含節(jié)點(diǎn)的超邊的集合。
1.4.2 成對(duì)節(jié)點(diǎn)間的相互聚類系數(shù)的特征提取
多個(gè)研究證明真實(shí)網(wǎng)絡(luò)可以被小世界網(wǎng)絡(luò)表示,其鄰域之間存在顯著的重疊,不僅單個(gè)頂點(diǎn)間的鄰居節(jié)點(diǎn)更容易重疊,而且單一的邊也有更大的鄰居凝聚力(neighborhood cohesiveness around individual edges)[11,18-19],因此對(duì)傳統(tǒng)的聚類系數(shù)進(jìn)行擴(kuò)展,產(chǎn)生節(jié)點(diǎn)對(duì)間的聚類系數(shù),而且該計(jì)算聚類系數(shù)的方式已被廣泛用于超網(wǎng)絡(luò)中[11]。在這種定義形式下,聚類系數(shù)則指的是一對(duì)節(jié)點(diǎn)共享了多少條邊。在整個(gè)超圖研究中,已經(jīng)有多種方法計(jì)算了節(jié)點(diǎn)對(duì)的聚類系數(shù)[11,18-19]。在本文研究中,則引入了5種廣泛使用的節(jié)點(diǎn)對(duì)的聚類系數(shù)從不同的角度反映通過(guò)單一的邊的鄰居凝聚力,從而更全面地表達(dá)超網(wǎng)絡(luò)中的拓?fù)鋵傩?。從連接超網(wǎng)絡(luò)中依據(jù)單一的邊的聚類系數(shù)定義分別提取特征。表3表示了定義及這些屬性的公式。
表3 基于一對(duì)節(jié)點(diǎn)的聚類系數(shù)的定義與公式 Tab. 3 Definitions and calculation formulas of clustering coefficients based on a pair of nodes
表3中:u,v指的是腦區(qū)節(jié)點(diǎn),S(v)={ei∈E:v∈ei},v表示節(jié)點(diǎn),ei表示超邊,S(v)表示包含節(jié)點(diǎn)v的超邊的集合,Total指的是超邊的總數(shù)量。
通過(guò)計(jì)算成對(duì)節(jié)點(diǎn)的聚類系數(shù)之后,單一節(jié)點(diǎn)的聚類系數(shù)則是通過(guò)平均該節(jié)點(diǎn)與其所有鄰居節(jié)點(diǎn)的聚類系數(shù)來(lái)得到[19]:
(3)
COMHCC(u,v)指的是通過(guò)任何方法計(jì)算求得的超圖中成對(duì)節(jié)點(diǎn)間的聚類系數(shù)。N(v)={u∈V:?e∈E,u,v∈e},V指的是節(jié)點(diǎn)集,E指的是超邊集,e表示某一條超邊,N(v)表示包含節(jié)點(diǎn)v的所在超邊含有的其他節(jié)點(diǎn)的集合。
這5組指標(biāo)是從不同的角度反映通過(guò)單一的邊的鄰居凝聚力,來(lái)進(jìn)一步地計(jì)算每個(gè)節(jié)點(diǎn)的聚類系數(shù),從而更全面得表達(dá)超網(wǎng)絡(luò)的局部聚類屬性。從連接超網(wǎng)絡(luò)中依據(jù)單一的邊的聚類系數(shù)定義分別提取特征。
1.4.3 特征選擇
特征提取完后的特征有著一些冗余或無(wú)關(guān)的特征,需要對(duì)其進(jìn)行特征選擇,去掉無(wú)關(guān)或冗余的數(shù)據(jù),這樣便于建立更準(zhǔn)確的預(yù)測(cè)模型,因此對(duì)于MDD患者和正常人,分別對(duì)使用兩種不同方式提取的聚類系數(shù)產(chǎn)生的270個(gè)以及450個(gè)節(jié)點(diǎn)屬性進(jìn)行組間ks非參數(shù)檢驗(yàn)[29],已通過(guò)錯(cuò)誤發(fā)現(xiàn)率(False-Discovery Rate,F(xiàn)DR)(q=0.05)校正[30]。將選取出的具有顯著組間差異的兩組特征作為分類特征通過(guò)多核學(xué)習(xí)融合至一起進(jìn)行預(yù)測(cè)模型構(gòu)建。
通過(guò)本文選取的超網(wǎng)絡(luò)中兩組具有顯著差異的腦區(qū)特征作為輸入特征來(lái)構(gòu)建分類模型。通過(guò)兩種不同類型的聚類系數(shù)彼此提供互補(bǔ)信息來(lái)進(jìn)行MDD分類,采用多核學(xué)習(xí)來(lái)分別通過(guò)兩種不同類型的聚類系數(shù)估計(jì)的內(nèi)核的最佳線性組合來(lái)有效地融合特征。核的整合是通過(guò)多個(gè)核的線性結(jié)合[31]:
(4)
其中:ki(x,y)是第i組的聚類系數(shù)中被試x和y間的內(nèi)核矩陣;M是需融合的核矩陣的數(shù)量;αi是權(quán)重參數(shù)。接著,利用基于LIBSVM分類包(http://www.csie.ntu.edu.tw/~cjlin/libsvm/)的高斯內(nèi)核的SVM分類器對(duì)復(fù)雜核進(jìn)行分類。
留一交叉驗(yàn)證(Leave One Out Cross Validation, LOOCV)被用來(lái)評(píng)估分類性能,即若樣本數(shù)量為N時(shí),則每次實(shí)驗(yàn)取1個(gè)樣本當(dāng)作測(cè)試集,其余樣本作為訓(xùn)練集。此外,為了得到更好的分類模型,本實(shí)驗(yàn)加入?yún)?shù)尋優(yōu)過(guò)程,主要是對(duì)訓(xùn)練集進(jìn)行k折交叉驗(yàn)證,將訓(xùn)練驗(yàn)證分類準(zhǔn)確率最高的(c,g)作為最優(yōu)參數(shù),參與模型的構(gòu)建,從而得到最好的分類模型。本次過(guò)程重復(fù)N次,得到N個(gè)分類模型進(jìn)行分類測(cè)試,最后選取N次實(shí)驗(yàn)的分類準(zhǔn)確率的平均值作為最后分類結(jié)果。本研究中,(c,g)參數(shù)取值的變化范圍設(shè)置為[2-5,25],步進(jìn)大小為1。另外,需要對(duì)分類特征進(jìn)行標(biāo)準(zhǔn)化再進(jìn)行分類模型構(gòu)建。需要注意的是,在基于sgLasso方法中由于聚類時(shí)初始種子點(diǎn)隨機(jī)選取會(huì)影響最終的分類結(jié)果,在實(shí)驗(yàn)中,通過(guò)執(zhí)行50次實(shí)驗(yàn)來(lái)計(jì)算其分類結(jié)果平均值作為最后分類結(jié)果。
利用sgLasso方法進(jìn)行超網(wǎng)絡(luò)構(gòu)建并提取特征。對(duì)提取的每一個(gè)特征,均進(jìn)行非參數(shù)置換檢驗(yàn)且對(duì)所有被試評(píng)估MDD和CON之間的差異,特征已通過(guò)FDR校正。
表4和表5列出了通過(guò)兩種不同類型的聚類系數(shù)得到的顯著差異的大腦區(qū)域。通過(guò)兩組聚類系數(shù)得到的重疊區(qū)域較少,主要集中于右側(cè)中央溝蓋、部分邊緣系統(tǒng)區(qū)域(右側(cè)后扣帶回)以及雙側(cè)丘腦。如圖1所示,因此可說(shuō)明能從兩組聚類系數(shù)中得到全面評(píng)估疾病診斷性能以及識(shí)別與疾病病理學(xué)相關(guān)的生物標(biāo)記物。
表4 基于單一節(jié)點(diǎn)的聚類系數(shù)得到的顯著差異腦區(qū) Tab. 4 Significantly different brain regions obtained by clustering coefficients based on single node
表5 基于一對(duì)節(jié)點(diǎn)的聚類系數(shù)得到的顯著差異腦區(qū) Tab. 5 Significantly different brain regions obtained by clustering coefficients based on pairs of nodes
圖1 使用BrainNet軟件將所有異常腦區(qū)域映射到皮質(zhì)表面Fig. 1 All abnormal brain regions mapped onto cortical surfaces using BrainNet software
基于sgLasso方法構(gòu)建超網(wǎng)絡(luò),對(duì)兩組不同類型的聚類系數(shù)利用統(tǒng)計(jì)分析計(jì)算方法分別得到13個(gè)異常腦區(qū)以及11個(gè)異常腦區(qū)(包括重疊區(qū)域),包括右側(cè)額蓋區(qū)、右側(cè)補(bǔ)充運(yùn)動(dòng)區(qū)、雙側(cè)丘腦、額葉區(qū)域(左側(cè)內(nèi)側(cè)額上回、雙側(cè)額中回、左側(cè)眶部額下回)、邊緣系統(tǒng)(左側(cè)內(nèi)側(cè)和旁扣帶腦回、右側(cè)內(nèi)側(cè)和旁扣帶腦回、右側(cè)海馬旁回、右側(cè)后扣帶回、右側(cè)嗅皮質(zhì)、右側(cè)距狀裂周圍皮層)、枕葉區(qū)域(左側(cè)楔葉、左側(cè)舌回、左側(cè)枕上回、左側(cè)中央旁小葉)、顳葉區(qū)域(左側(cè)顳極:顳上回、左側(cè)顳極:顳中回)。這些腦區(qū)已經(jīng)在之前的文獻(xiàn)中被證明與抑郁癥的病理研究存在著顯著的關(guān)聯(lián),并將該方法取得的差異腦區(qū)與其他文獻(xiàn)所得到的結(jié)果一致。Zhu等[32]證明右側(cè)額蓋區(qū)的模塊度與抑郁嚴(yán)重程度呈負(fù)相關(guān)。Liu等[33]證明在右側(cè)補(bǔ)充運(yùn)動(dòng)區(qū),抑郁癥患者與正常人存在差異。Jin等[34]使用圖論來(lái)評(píng)估抑郁癥青少年腦功能網(wǎng)絡(luò)的拓?fù)涮卣鲿r(shí),發(fā)現(xiàn)抑郁癥青少年中的左側(cè)內(nèi)側(cè)額上回等腦區(qū)受到嚴(yán)重破壞。Guo等[35]使用機(jī)器學(xué)習(xí)對(duì)抑郁癥分類,其中異常腦區(qū)包括內(nèi)側(cè)和旁扣帶腦回,右側(cè)后扣帶回和雙側(cè)額中回等。Qiu等[36]使用結(jié)構(gòu)磁共振成像證明抑郁癥異常腦區(qū)包括右側(cè)海馬旁回以及左側(cè)顳級(jí):顳中回等。Lord等[37]研究單極性抑郁癥靜息態(tài)功能連接社區(qū)結(jié)構(gòu)的變化時(shí),發(fā)現(xiàn)左側(cè)舌回等腦區(qū)發(fā)生變化。Liu等[38]通過(guò)使用回波平面成像序列獲得靜息態(tài)fMRI,從而計(jì)算低頻振幅以研究靜息狀態(tài)下的低頻(0.01~0.08 Hz)振蕩的振幅時(shí),發(fā)現(xiàn)與正常人相比,抑郁癥患者在左側(cè)枕上回等腦區(qū)的低頻振幅明顯降低。Rolls等[39]發(fā)現(xiàn)左側(cè)中央旁小葉等腦區(qū)在研究抑郁癥的有效連接時(shí)與正常被試存在差異。Lui等[40]發(fā)現(xiàn)頑固性抑郁組患者主要在雙側(cè)丘腦區(qū)等的功能連接受損。Guo等[41]基于最小生成樹(shù)的多特征融合方法進(jìn)行分類時(shí),表明右側(cè)嗅皮質(zhì)在兩組被試間存在差異。Zhang等[42]發(fā)現(xiàn)在右側(cè)距壯裂周圍皮層抑郁癥的節(jié)點(diǎn)中心性指標(biāo)明顯下降。使用不同成像方法識(shí)別的大腦區(qū)域之間的覆蓋腦區(qū)有限,最一致的區(qū)域包括左側(cè)顳級(jí):顳上回等[43]。
評(píng)估了基于sgLasso方法創(chuàng)建的超網(wǎng)絡(luò)模型的分類性能,并且與傳統(tǒng)的超網(wǎng)絡(luò)創(chuàng)建方法(Lasso方法與gLasso方法)進(jìn)行比較。分別使用兩種不同類型的聚類系數(shù)作為特征提取,非參數(shù)置換檢驗(yàn)用來(lái)特征選擇,SVM用來(lái)分類,LOOCV用來(lái)評(píng)估分類性能,得到其準(zhǔn)確率、敏感性(可準(zhǔn)確識(shí)別病人的比例)、特異度(可準(zhǔn)確識(shí)別正常被試的比例)和平衡準(zhǔn)確率(Balanced ACcuracy,BAC)(敏感性和特異度的均值,為了保證數(shù)據(jù)之間的平衡)。這里需要注意的是,這三種方法提取出來(lái)的用于分類的特征所對(duì)應(yīng)的腦區(qū)是不同的腦區(qū),假若使用相同的腦區(qū),則會(huì)導(dǎo)致存在非差異性特征參與分類模型的構(gòu)建,從而并不能創(chuàng)建最優(yōu)的分類模型,以致不能得到最好的分類準(zhǔn)確率;同時(shí),利用這三種方法創(chuàng)建超網(wǎng)絡(luò)所使涉及的參數(shù)也是不一致的,均是根據(jù)分類結(jié)果,從而選出每種方法中最優(yōu)的參數(shù)。分類結(jié)果在表6中表示。結(jié)果表明,sgLasso得到了最高的準(zhǔn)確率,為87.88%,優(yōu)于基于Lasso創(chuàng)建的超網(wǎng)絡(luò)及基于gLasso創(chuàng)建的超網(wǎng)絡(luò)?;贚asso創(chuàng)建的超網(wǎng)絡(luò)低于sgLasso方法,其潛在的原因主要是Lasso只能選擇存在組結(jié)構(gòu)中的一個(gè)腦區(qū),且無(wú)論哪一個(gè),這將導(dǎo)致Lasso構(gòu)建的網(wǎng)絡(luò)過(guò)于嚴(yán)格或者失去一些重要的連接。這一結(jié)果暗示著不考慮組結(jié)構(gòu)的存在則不能創(chuàng)建更合適的超網(wǎng)絡(luò)。基于gLasso的超網(wǎng)絡(luò)構(gòu)建方法進(jìn)行分類最后得到的分類結(jié)果不如sgLasso方法所得的結(jié)果,其潛在的原因主要是它不具有組內(nèi)變量選擇的靈活性,僅選擇相關(guān)組,以使每組內(nèi)的估計(jì)系數(shù)全部為零或全部為非零,這將導(dǎo)致gLasso構(gòu)建的網(wǎng)絡(luò)過(guò)于寬松或者加入一些錯(cuò)誤的連接。這結(jié)果暗示著若為了改善超網(wǎng)絡(luò)的創(chuàng)建,需要考慮到組信息,但不能逼迫使用整組信息,可以適當(dāng)?shù)貙?duì)組結(jié)構(gòu)進(jìn)行擴(kuò)展。
表6 不同方法的分類性能 單位:%Tab. 6 Classification performance of different methods unit:%
除此之外,本研究也與關(guān)于抑郁癥研究的其他文獻(xiàn)在分類結(jié)果上進(jìn)行比較,從分類結(jié)果上看,本研究結(jié)果令人滿意。使用皮爾遜相關(guān)或者稀疏逆協(xié)方差[44-45]來(lái)創(chuàng)建腦網(wǎng)絡(luò),這樣僅能捕捉到兩個(gè)腦區(qū)間的交互作用,忽略了腦區(qū)間的高階交互。靳研藝等[7]利用Lasso方法和elastic net方法分別創(chuàng)建腦功能超網(wǎng)絡(luò),但是Lasso方法缺乏解釋組效應(yīng)的能力,從而導(dǎo)致丟失一些有用的連接,致使不能構(gòu)建更加精確的超網(wǎng)絡(luò);因此提出elastic net方法來(lái)改善超網(wǎng)絡(luò)的創(chuàng)建,雖然該方法能解決組效應(yīng)問(wèn)題。但需要注意的是該方法并不能使高度相關(guān)的變量均屬于組中的活躍集中,而且本研究?jī)H將單一節(jié)點(diǎn)的聚類系數(shù)作為腦區(qū)特征,僅考慮到單個(gè)頂點(diǎn)的鄰居節(jié)點(diǎn)的重疊性,并未考慮腦區(qū)間鄰域之間顯著的重疊。本文的新方法使用sgLasso方法結(jié)合多特征融合來(lái)進(jìn)行腦疾病的分類,既考慮到了多腦區(qū)間的交互,又考慮到超網(wǎng)絡(luò)的組結(jié)構(gòu)問(wèn)題,同時(shí)將兩組聚類系數(shù)結(jié)合,較好地彌補(bǔ)以上研究的不足之處。
為了判斷兩種方法中所選特征對(duì)分類的貢獻(xiàn)程度,本文采用Relief算法計(jì)算每種方法中對(duì)應(yīng)特征值的分類權(quán)重,Relief作為一種特征權(quán)重算法,可以判斷特征對(duì)于分類的重要性,若權(quán)重越大,則表明分類能力越強(qiáng),反之亦然。在本次實(shí)驗(yàn)中,將sgLasso方法中的單節(jié)點(diǎn)聚類系數(shù)特征、雙節(jié)點(diǎn)聚類系數(shù)特征、多特征分別計(jì)算的差異特征利用Relief算法計(jì)算對(duì)應(yīng)特征值的分類權(quán)重并進(jìn)行比較,結(jié)果顯示在圖2中,結(jié)果表明,多特征得到的分類權(quán)重均高于單個(gè)特征的分類權(quán)重。通過(guò)Relief算法來(lái)評(píng)估特征的重要性。潛在的原因是基于多特征的方法有效地融合了兩個(gè)不同的信息,單個(gè)節(jié)點(diǎn)的聚類系數(shù)特征以及雙節(jié)點(diǎn)聚類系數(shù)特征,可以更加全面地表達(dá)腦區(qū)域間的交互信息。這一結(jié)果暗示著,表明多特征方法更適合評(píng)估特征的重要性,更適合分類抑郁癥患者與正常人。
圖2 腦區(qū)特征對(duì)應(yīng)的分類權(quán)重Fig. 2 Classification weight corresponding to brain region feature
功能超網(wǎng)絡(luò)的不同構(gòu)建,會(huì)對(duì)分類性能產(chǎn)生影響。在現(xiàn)有研究中使用Lasso進(jìn)行超網(wǎng)絡(luò)創(chuàng)建[4],該方法中,通過(guò)使用l1范數(shù)來(lái)控制網(wǎng)絡(luò)的稀疏度,僅僅是對(duì)單個(gè)變量的選擇,未考慮到腦區(qū)間的組效應(yīng),導(dǎo)致一些相關(guān)的腦區(qū)無(wú)法選擇出來(lái),使得超網(wǎng)絡(luò)過(guò)于嚴(yán)格,從而缺失重要的連接??紤]到組結(jié)構(gòu)問(wèn)題,Guo等[14]引入group Lasso方法進(jìn)行超網(wǎng)絡(luò)的創(chuàng)建,但group Lasso僅僅是在組級(jí)上進(jìn)行變量選擇,將整組作為整體,使得超網(wǎng)絡(luò)又過(guò)于寬松,從而導(dǎo)致包含一些錯(cuò)誤的連接。本文提出sgLasso方法來(lái)進(jìn)行超網(wǎng)絡(luò)創(chuàng)建,基于sgLasso方法是引入l1、l2范數(shù)懲罰項(xiàng),即該方法范式是混入Lasso與gLasso懲罰項(xiàng),可以進(jìn)行組間選擇以及組內(nèi)變量選擇,即雙級(jí)選擇,區(qū)別于簡(jiǎn)單組選擇,變量可以在組級(jí)上以及單個(gè)變量間進(jìn)行選擇,不僅可以選出重要的組,而且可以選出這些重要組中重要的變量。
除此之外,本文所提出的方法中的一些參數(shù)同樣也會(huì)影響分類性能,例如聚類數(shù)k,超網(wǎng)絡(luò)構(gòu)建模型正則化參數(shù)λ1和λ2,優(yōu)化權(quán)重參數(shù)αi。為了探討這個(gè)問(wèn)題,本文對(duì)基于sgLasso方法的多特征融合方法進(jìn)行了實(shí)驗(yàn)。
k指的是sgLasso方法中的聚類數(shù)目,設(shè)置不同的k值會(huì)獲得不同的超網(wǎng)絡(luò)拓?fù)浜头诸愋阅?,本研究中,為了分析不同k值對(duì)于超網(wǎng)絡(luò)拓?fù)浼胺诸惤Y(jié)果的影響,設(shè)置k值取值范圍為[6,90],其中步長(zhǎng)為6。對(duì)每一個(gè)k值基于sgLasso方法進(jìn)行超網(wǎng)絡(luò)構(gòu)建,特征提取,特征選擇,分類及評(píng)估驗(yàn)證。由于第一個(gè)初始種子點(diǎn)的隨機(jī)選擇的影響,對(duì)于每個(gè)k值則分別進(jìn)行50次實(shí)驗(yàn),最后取50次實(shí)驗(yàn)的平均值作為最后的結(jié)果。圖3展示了sgLasso方法的實(shí)驗(yàn)結(jié)果,結(jié)果表明當(dāng)k=30時(shí),sgLasso方法表現(xiàn)出最高準(zhǔn)確率87.88%。
圖3 基于sgLasso方法中不同k值的分類準(zhǔn)確率Fig. 3 Classification accuracy based on sgLasso method under different k values
以前的研究已經(jīng)表明參數(shù)λ影響超網(wǎng)絡(luò)的拓?fù)?。正則化參數(shù)λ決定了網(wǎng)絡(luò)的稀疏以及規(guī)模。本研究中,參數(shù)λ1是l1范數(shù)項(xiàng)的正則化參數(shù),偏向于控制模型組間稀疏,步長(zhǎng)設(shè)置為0.1。參數(shù)λ2是l2范數(shù)項(xiàng)的正則化參數(shù),偏向于控制模型組級(jí)稀疏,同λ1,步長(zhǎng)設(shè)置為0.1。不同的λ1和λ2的設(shè)置會(huì)得到不同的網(wǎng)絡(luò)拓?fù)?,?huì)使模型選擇不同的組變量,從而導(dǎo)致產(chǎn)生不同的組結(jié)構(gòu),同時(shí)也會(huì)影響分類性能。在基于sgLasso方法的超網(wǎng)絡(luò)的創(chuàng)建中,本文固定λ2值,通過(guò)變化特定范圍內(nèi)的λ1值產(chǎn)生一組超邊;同時(shí),為了探討λ1,λ2對(duì)分類性能的影響,λ2分別設(shè)置為0.1,0.2,…,0.9,λ1使用了一系列升序組合,{0.1},{0.1,0.2},{0.1,0.2,0.3},…,{0.1,0.2,…,0.9},以此來(lái)進(jìn)行不同的超網(wǎng)絡(luò)創(chuàng)建。進(jìn)而提取特征來(lái)進(jìn)行分類,判斷分類性能。分類結(jié)果展示在圖4中。結(jié)果顯示在sgLasso方法中,當(dāng)λ2=0.4,λ1使用{0.1,0.2,…,0.9}時(shí),表現(xiàn)出最高正確率達(dá)到87.88%。當(dāng)λ1使用{0.1}時(shí),準(zhǔn)確率低于60%,主要是因?yàn)橐粋€(gè)腦區(qū)節(jié)點(diǎn)可能只包含在一條超邊中,導(dǎo)致HCC3計(jì)算無(wú)意義。
圖4 基于sgLasso方法中參數(shù)(λ1,λ2)的分類準(zhǔn)確率Fig. 4 Classification accuracy based on sgLasso method under different parameters (λ1,λ2)
在多核學(xué)習(xí)中,重要的一步是選擇權(quán)重參數(shù)αi,這直接影響數(shù)據(jù)融合的方式,對(duì)分類性能有很大影響。在獲取權(quán)重參數(shù)αi之后,多個(gè)內(nèi)核集成混合內(nèi)核,然后可以通過(guò)傳統(tǒng)的SVM分類器來(lái)解決該模型。本文采用了shogun工具箱(http://www.shogun-toolbox.org),來(lái)獲得優(yōu)化權(quán)重。當(dāng)α1=0.121 9和α2=0.878 1時(shí),sgLasso方法的精度達(dá)到最大值87.88%。
本文研究考慮到現(xiàn)有研究中存在的組結(jié)構(gòu)的問(wèn)題,引入sparse group Lasso方法來(lái)進(jìn)行超網(wǎng)絡(luò)創(chuàng)建;同時(shí),考慮到真實(shí)網(wǎng)絡(luò)不僅單個(gè)頂點(diǎn)的鄰居節(jié)點(diǎn)更容易重疊,鄰域之間也存在顯著地重疊,引入一組雙節(jié)點(diǎn)的聚類系數(shù)也作為特征提取。最后特征經(jīng)過(guò)多核學(xué)習(xí)融合成一個(gè)混合核進(jìn)行分類診斷。通過(guò)分類結(jié)果分析,顯示基于sgLasso方法的多特征分類表現(xiàn)(87.88%)優(yōu)于現(xiàn)有的關(guān)于超網(wǎng)絡(luò)創(chuàng)建方法。由此暗示著不存在組結(jié)構(gòu)或僅存在組結(jié)構(gòu),均不能得到令人滿意的效果,若對(duì)組結(jié)構(gòu)進(jìn)行適當(dāng)?shù)臄U(kuò)展,則可獲得更為有效的分類特征;同時(shí),通過(guò)兩組聚類系數(shù)選取的差異特征評(píng)估,多特征的分類權(quán)重均優(yōu)于單組特征的分類權(quán)重。這表明基于多特征的方法有效地融合了兩個(gè)不同的信息,可以更有效地分類抑郁癥患者和正常對(duì)照組。
在目前的研究中,有兩個(gè)主要的問(wèn)題。首先,基于sgLasso方法中由于k中心點(diǎn)聚類法本身的影響,即初始種子點(diǎn)的隨機(jī)選取以及k值的不同設(shè)置從而導(dǎo)致網(wǎng)絡(luò)拓?fù)浼胺诸惤Y(jié)果不唯一,因此在未來(lái)的研究中可以采取不同的聚類方法來(lái)進(jìn)行分組,以此建立更加穩(wěn)定的超邊來(lái)進(jìn)一步改善超網(wǎng)絡(luò)。其次,可以采用不同分配腦區(qū)的模板,探究不同模板創(chuàng)建的超網(wǎng)絡(luò)對(duì)于分類性能的影響。