溫旭云,聶梓宇,曹曲美,張道強(qiáng)
南京航空航天大學(xué) 計算機(jī)科學(xué)與技術(shù)學(xué)院,南京 211106
大腦作為當(dāng)前現(xiàn)實(shí)世界中最復(fù)雜的生命系統(tǒng),其結(jié)構(gòu)和功能均可以借助神經(jīng)影像的技術(shù)手段和復(fù)雜網(wǎng)絡(luò)理論進(jìn)行分析,表征為不同大腦區(qū)域間錯綜復(fù)雜的大腦連接網(wǎng)絡(luò)。結(jié)構(gòu)網(wǎng)絡(luò)可以幫助人們理解不同腦區(qū)的物理連接模式,而功能網(wǎng)絡(luò)則描述了大腦神經(jīng)系統(tǒng)快速、實(shí)時的信息整合能力。借助于網(wǎng)絡(luò)分析理論,大量研究已經(jīng)證明大腦網(wǎng)絡(luò)具備大部分與其他復(fù)雜網(wǎng)絡(luò)相似的拓?fù)鋵傩?,比如:小世界屬性、無標(biāo)度屬性以及社區(qū)結(jié)構(gòu)等[1-3]。小世界屬性保證大腦以最少的消耗完成最有效的信息處理;無標(biāo)度屬性則證明大腦節(jié)點(diǎn)功能連接的異質(zhì)性,即存在高度連接或集中式的功能腦區(qū);相比于小世界屬性和無標(biāo)度特性,社區(qū)結(jié)構(gòu)所隱藏的生物學(xué)意義更為復(fù)雜,它不僅有助于促進(jìn)網(wǎng)絡(luò)的可進(jìn)化性,增加網(wǎng)絡(luò)的抗干擾能力,同時也節(jié)省了網(wǎng)絡(luò)布線成本,因此研究該領(lǐng)域?qū)τ诮沂敬竽X連接規(guī)律具有重要的意義[4]。
近年來,針對大腦社區(qū)結(jié)構(gòu)的相關(guān)研究逐年增加,特別是在功能網(wǎng)絡(luò)研究領(lǐng)域。如圖1(a)所示,以“brain network+community”和“brain network+module”作為關(guān)鍵詞,在web of science 檢索2013—2022 年的相關(guān)研究,發(fā)現(xiàn)論文數(shù)量在10 年內(nèi)呈指數(shù)上升的趨勢。大腦網(wǎng)絡(luò)社區(qū)化是指神經(jīng)單元在結(jié)構(gòu)或功能上以社區(qū)為單元相互連接,直觀地說,社區(qū)化是系統(tǒng)的一種架構(gòu)設(shè)計特性,它允許系統(tǒng)實(shí)現(xiàn)信息的局部集成,同時保持系統(tǒng)的全局通信能力。對于功能網(wǎng)絡(luò)來說,每個社區(qū)代表集體參與一個或多個認(rèn)知功能的大腦區(qū)域組,即相同社區(qū)內(nèi)的腦區(qū)具有相似的功能特性,不同社區(qū)的腦區(qū)則與不同的大腦功能相關(guān)聯(lián),比如,Yeo 等人[5]借助于社區(qū)檢測算法,以腦區(qū)功能屬性作為特征,將成年人的大腦分割為7個功能系統(tǒng),包括視覺、感知運(yùn)動、腹側(cè)注意、背側(cè)注意、控制、默認(rèn)和邊緣系統(tǒng),不同功能系統(tǒng)負(fù)責(zé)特定的認(rèn)知功能(圖1(b))。此外,基于檢測所得的社區(qū)結(jié)構(gòu),利用網(wǎng)絡(luò)分析方法,可進(jìn)一步評估大腦不同空間尺度拓?fù)浣Y(jié)構(gòu)的統(tǒng)計特性,包括局部尺度不同腦區(qū)在大腦系統(tǒng)中的拓?fù)涔δ?,中觀尺度不同功能系統(tǒng)的連接規(guī)律和全局尺度大腦的分離度、整合度和rich club組織等(如圖1(c)所示)。社區(qū)化的拓?fù)鋵傩詾檠芯拷】岛图膊〉拇竽X網(wǎng)絡(luò)提供了強(qiáng)有力的工具,目前已取得豐富的成果。例如,如圖1(d)所示,Cole 等人首先利用社區(qū)檢測獲取大腦功能系統(tǒng)(左側(cè)圖片),然后基于該功能系統(tǒng)將腦區(qū)分為核心(紫色圓圈)和非核心(黑色圓圈)連接節(jié)點(diǎn),最后對比了這兩種節(jié)點(diǎn)的平均功能活動水平(血氧動力學(xué)水平,右側(cè)圖片),結(jié)果發(fā)現(xiàn)在健康的年輕人中核心和非核心節(jié)點(diǎn)在與語義分類處理需求相關(guān)的系統(tǒng)(即控制系統(tǒng))中表現(xiàn)出不同的激活,而老年人的這種差別則很小。該研究借助于社區(qū)檢測方法,證明了相比于年輕人,老年人的系統(tǒng)分離降低了核心連接腦區(qū)(connector hub)和非核心連接腦區(qū)(non-connector hub)功能活動水平的差異[6]。另外的研究也發(fā)現(xiàn)疾病會導(dǎo)致大腦不同系統(tǒng)連接模式的變化,比如,阿爾茲海默癥可導(dǎo)致功能網(wǎng)絡(luò)和結(jié)構(gòu)網(wǎng)絡(luò)社區(qū)內(nèi)和社區(qū)間連接的變化[7](圖1(e))。
圖1 大腦網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)研究的重要性Fig.1 Importance of brain network community structure research
社區(qū)檢測算法是大腦網(wǎng)絡(luò)社區(qū)化研究的關(guān)鍵[8]。雖然過去20 年大量的社區(qū)檢測算法被提出,但如何將這些方法應(yīng)用于大腦系統(tǒng)識別需要格外注意,因?yàn)橄啾绕渌I(lǐng)域(比如社交網(wǎng)絡(luò)),由大腦系統(tǒng)抽象出的網(wǎng)絡(luò)更加復(fù)雜,檢測獲得準(zhǔn)確、穩(wěn)定和具有生理意義的社區(qū)結(jié)構(gòu)難度更大。首先,腦網(wǎng)絡(luò)的節(jié)點(diǎn)表示大腦的特定區(qū)域或神經(jīng)元區(qū)域,邊表示區(qū)域之間的連接強(qiáng)度,所構(gòu)建的網(wǎng)絡(luò)通常具有很高的網(wǎng)絡(luò)連接密度,而且存在由影像噪聲導(dǎo)致的虛假連接,后期社區(qū)檢測中需添加網(wǎng)絡(luò)稀疏和噪聲抑制步驟;其次,與其他領(lǐng)域只需處理單個網(wǎng)絡(luò)不同,腦網(wǎng)絡(luò)研究通常涉及多個被試的數(shù)據(jù),以獲得可靠的生物標(biāo)記和統(tǒng)計結(jié)果,如何處理被試間差異性,獲得穩(wěn)定、準(zhǔn)確的社區(qū)檢測結(jié)果是該領(lǐng)域社區(qū)檢測算法面臨的難點(diǎn)問題;最后,大腦作為自然界最為復(fù)雜的系統(tǒng),具有最豐富的網(wǎng)絡(luò)連接模式,研究者需設(shè)計多種任務(wù)揭示其網(wǎng)絡(luò)拓?fù)鋵傩?,比如通過多層次社區(qū)檢測揭示大腦功能系統(tǒng)自上而下的分層連接模式,通過動態(tài)社區(qū)檢測理解腦連接對于外界刺激的動態(tài)響應(yīng)方式等,使得面向腦網(wǎng)絡(luò)的社區(qū)化研究需要不同種類的社區(qū)檢測算法的支撐。基于以上原因,越來越多的研究開始關(guān)注腦網(wǎng)絡(luò)社區(qū)化研究中社區(qū)檢測算法的選擇和設(shè)計問題。
2016年,Sporns和Betzel發(fā)表了首篇關(guān)于腦網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)研究的綜述論文[4]。該論文全面回顧了大腦社區(qū)檢測在網(wǎng)絡(luò)神經(jīng)科學(xué)中的應(yīng)用,總結(jié)了大腦結(jié)構(gòu)和功能網(wǎng)絡(luò)中社區(qū)化研究的主要發(fā)現(xiàn),并簡要考慮了它們在大腦進(jìn)化、布線最小化以及功能專門化和復(fù)雜動力學(xué)的出現(xiàn)中的潛在功能作用,闡述了社區(qū)結(jié)構(gòu)研究對揭示大腦連接模式的重要性。2018年,Garcia 等人[8]聚焦基于模塊最大化的社區(qū)檢測算法,詳細(xì)介紹了該類方法在復(fù)雜腦網(wǎng)絡(luò)中的應(yīng)用以及面臨的問題。2019 年,Vangimalla 等人[9]對比了不同網(wǎng)絡(luò)預(yù)處理方法對社區(qū)檢測結(jié)果的影響。然而,以上論文主要從神經(jīng)科學(xué)的角度論述了社區(qū)結(jié)構(gòu)研究的重要性,方法學(xué)的描述較為簡單,主要聚焦于靜態(tài)腦功能網(wǎng)絡(luò)的分離社區(qū)結(jié)構(gòu)和基于模塊最大化的社區(qū)檢測方法。本文則從計算機(jī)科學(xué)的角度出發(fā),致力于提供全面、完整的面向復(fù)雜大腦功能網(wǎng)絡(luò)社區(qū)檢測方法的描述,涵蓋了當(dāng)前所有針對腦網(wǎng)絡(luò)社區(qū)化研究的場景任務(wù),以期為今后腦網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)研究中的算法選擇提供方法學(xué)指導(dǎo)。
目前,大腦功能網(wǎng)絡(luò)通常是利用功能磁共振成像(functional magnetic resonance imaging,fMRI),通過計算神經(jīng)元或腦區(qū)時間序列數(shù)據(jù)之間的統(tǒng)計依存關(guān)系而建立[10],其高空間分辨率使其在生物標(biāo)記物識別方面具有突出優(yōu)勢。本文聚焦fMRI 數(shù)據(jù),全面綜述面向三種場景任務(wù)的大腦網(wǎng)絡(luò)社區(qū)檢測算法,分別為“單層次社區(qū)檢測”“多層次社區(qū)檢測”和“動態(tài)社區(qū)檢測”,具體流程如圖2所示。
圖2 基于社區(qū)檢測的大腦功能系統(tǒng)識別流程圖Fig.2 Flowchart for brain functional system identification based on community detection
如圖2所示,大腦連接模式分為靜態(tài)功能網(wǎng)絡(luò)和動態(tài)功能網(wǎng)絡(luò)兩種,靜態(tài)連接假設(shè)不同大腦區(qū)域之間信號的統(tǒng)計相互依賴性在整個實(shí)驗(yàn)記錄期內(nèi)是恒定的,動態(tài)連接則認(rèn)為腦連接存在潛在的瞬時性變化。多種證據(jù)表明,研究靜態(tài)[11]和動態(tài)[12]連接均有助于促進(jìn)人們對大型功能性腦組織如何變化以支持不同的基本功能和行為的理解。
對于靜態(tài)網(wǎng)絡(luò),基于fMRI 的腦網(wǎng)絡(luò)構(gòu)建通常包括以下三個步驟:首先根據(jù)組織解剖、大腦結(jié)構(gòu)或者功能區(qū)域的分割模板,將整個大腦劃分為多個腦區(qū),每個腦區(qū)作為網(wǎng)絡(luò)的一個節(jié)點(diǎn);其次確定各個腦區(qū)的時間序列,一般通過平均該區(qū)域所包含的所有體素的血氧依賴水平信號(blood-oxygen-level-dependent,BOLD)獲得;最后計算任意一對腦區(qū)之間的功能連接,比如皮爾森相關(guān)系數(shù)、偏相關(guān)系數(shù)等。
動態(tài)網(wǎng)絡(luò)的構(gòu)建則首先利用滑窗對時間軸進(jìn)行分割,其中每個窗代表一個時間周期,窗長則表示時間周期的長短,通過改變該值的設(shè)定實(shí)現(xiàn)不同尺度下的時間切割,即不同的時間尺度;然后,針對每個時間尺度,基于每個滑窗內(nèi)的所有時間點(diǎn),采用與靜態(tài)網(wǎng)絡(luò)相同的步驟構(gòu)建其對應(yīng)的功能連接矩陣集。
如圖2 所示,當(dāng)前大腦功能社區(qū)結(jié)構(gòu)化研究中社區(qū)檢測面臨的場景任務(wù)大體分為三種:單尺度社區(qū)檢測、多層次社區(qū)檢測和動態(tài)社區(qū)檢測。前兩種面向靜態(tài)功能網(wǎng)絡(luò),后一種則針對動態(tài)功能網(wǎng)絡(luò)。在第一種場景中,社區(qū)檢測根據(jù)社區(qū)結(jié)構(gòu)種類進(jìn)一步分為分離社區(qū)和重疊社區(qū),其中分離社區(qū)只允許單個節(jié)點(diǎn)屬于單個社區(qū),而重疊社區(qū)則允許一個節(jié)點(diǎn)同時屬于多個社區(qū),雖然單尺度社區(qū)檢測有一定程度上的局限性,但是其對網(wǎng)絡(luò)結(jié)構(gòu)的探索有重大的推動意義[13]。近年來,隨著對大腦網(wǎng)絡(luò)性質(zhì)的深入研究,越來越多的研究者開始關(guān)注復(fù)雜大腦系統(tǒng)社區(qū)結(jié)構(gòu)的層次性和動態(tài)性。層次社區(qū)結(jié)構(gòu)研究用來探討不同空間尺度下大腦功能系統(tǒng)的交互方式,比如研究發(fā)現(xiàn),人腦功能連接模式隨著老化在低空間尺度上內(nèi)變得更整合,而在高空間尺度上變得更分離[14]。動態(tài)社區(qū)結(jié)構(gòu)可以揭示人類大腦如何根據(jù)環(huán)境的要求產(chǎn)生動態(tài)的適應(yīng)并且短時間改變功能系統(tǒng)通信模式,從而進(jìn)行各種復(fù)雜的認(rèn)知行為。
如圖2所示,社區(qū)檢測方法主要分為基于優(yōu)化和基于模型的方法?;趦?yōu)化的算法將社區(qū)檢測問題抽象為優(yōu)化問題,通過最大化/最小化某個社區(qū)劃分質(zhì)量評價指標(biāo),來搜索最優(yōu)的網(wǎng)絡(luò)劃分結(jié)果,其中目標(biāo)函數(shù)的選擇和解集搜索方式都會影響算法的社區(qū)發(fā)現(xiàn)能力,基于優(yōu)化的方法是社區(qū)檢測算法中最常用的算法,但其性能易受社區(qū)劃分指標(biāo)定義的影響,如基于模塊度的譜優(yōu)化、極值優(yōu)化等?;谀P偷纳鐓^(qū)檢測方法主要有貝葉斯框架下的社區(qū)檢測方法、基于隨機(jī)塊的生成模型等方法,該類方法引入概率統(tǒng)計適應(yīng)社區(qū)概念的不確定性,不僅使社區(qū)結(jié)構(gòu)不再受限于社區(qū)劃分指標(biāo),同時也為貝葉斯等復(fù)雜統(tǒng)計學(xué)知識的引入提供了框架。除了以上兩類方法,不同的研究者從其他的角度或受其他領(lǐng)域的啟發(fā)提出了新的方法,如模糊聚類和派系過濾方法等。為了提高本文可讀性,表1給出了本文涉及主要符號和其對應(yīng)的意義。
表1 本文主要符號說明Table 1 Explanation of main symbols of this paper
單尺度社區(qū)結(jié)構(gòu)是最早、最廣泛用于探討腦網(wǎng)絡(luò)連接模式的圖論方法。2009 年,Meunier 等人[15]首次將社區(qū)檢測應(yīng)用到腦網(wǎng)絡(luò)研究中,證實(shí)了大腦功能網(wǎng)絡(luò)社區(qū)化結(jié)構(gòu)隨年齡呈現(xiàn)顯著的變化模式,之后該領(lǐng)域得到廣泛關(guān)注,越來越多的社區(qū)檢測算法被提出或被應(yīng)用到各類腦科學(xué)研究中。根據(jù)社區(qū)結(jié)構(gòu)特性,單尺度社區(qū)檢測分為分離社區(qū)檢測和重疊社區(qū)檢測,分離社區(qū)檢測中單個腦區(qū)只允許屬于一個社區(qū),而重疊社區(qū)檢測則允許單個腦區(qū)同時屬于多個社區(qū)。
表2 總結(jié)了目前用于靜態(tài)腦功能網(wǎng)絡(luò)分離社區(qū)檢測的算法,其中大部分為基于優(yōu)化的方法,以模塊度(modularity)、多層模塊度(multi-layer modularity)、surprise、編碼長度(code length)和分割率(cut cost)等作為目標(biāo)函數(shù),采用貪心、模擬退火、極值優(yōu)化和譜聚類等搜索最優(yōu)解。此外,算法還被進(jìn)一步分類為應(yīng)用型和新方法,應(yīng)用型為其他領(lǐng)域所提出的社區(qū)檢測算法用于腦網(wǎng)絡(luò)分析,新方法則是專門針對腦網(wǎng)絡(luò)特性設(shè)計的算法。
表2 靜態(tài)腦功能網(wǎng)絡(luò)分離社區(qū)檢測算法Table 2 Separated community detection algorithms for static brain functional network
在基于優(yōu)化的社區(qū)檢測算法中,模塊度Q是目前社區(qū)檢測最廣泛使用的目標(biāo)函數(shù),其定義如下:
其中,m為邊的數(shù)目,Aij為連接節(jié)點(diǎn)i和j邊的權(quán)重,ki表示節(jié)點(diǎn)i的度,δ(i,j)為指示函數(shù),當(dāng)節(jié)點(diǎn)i和j處于同一社區(qū)時取1,否則取0。模塊度評估了當(dāng)前社區(qū)劃分與隨機(jī)網(wǎng)絡(luò)之間社區(qū)內(nèi)部邊數(shù)占總邊數(shù)比例的差異,其值越大表明社區(qū)劃分結(jié)果較好。值得注意的是,模塊度優(yōu)化是一個NP 難問題(nondeterministic polynomial hard problems),為了獲得最好的解集,基于不同搜索策略的各類社區(qū)檢測算法被提出,包括基于貪心方法的Louvain算法[16]、譜優(yōu)化(spectral optimization)[17]和層次聚類(hierarchical agglomeration)[18],以及基于啟發(fā)式的模擬退火(simulated annealing)[19]和極值優(yōu)化(extremal optimization)[20]等方法。在三種貪心搜索算法中,Louvain 算法在腦功能網(wǎng)絡(luò)社區(qū)化研究中的使用最為廣泛,其通過“構(gòu)造新網(wǎng)絡(luò)和優(yōu)化目標(biāo)”的反復(fù)迭代,實(shí)現(xiàn)了簡單、高效、準(zhǔn)確的社區(qū)檢測,適用于各種規(guī)模的網(wǎng)絡(luò);譜優(yōu)化和層次聚類主要針對大規(guī)模的網(wǎng)絡(luò)設(shè)計,在小規(guī)模網(wǎng)絡(luò)的表現(xiàn)較差。在啟發(fā)式算法中,模擬退火算法魯棒性較強(qiáng),可以獲得全局最優(yōu)解,但所得結(jié)果受參數(shù)影響較大;極值優(yōu)化通過局部優(yōu)化節(jié)點(diǎn)對模塊度的貢獻(xiàn)達(dá)到全局優(yōu)化的效果,具有持續(xù)搜索和跳出局部最優(yōu)解的能力,但不適用于大規(guī)模網(wǎng)絡(luò)。雖然基于模塊度優(yōu)化的社區(qū)檢測算法在各領(lǐng)域均獲得良好的性能,但該類方法面臨分辨率限制問題,無法識別較小規(guī)模的社區(qū)。
為了解決模塊度的分辨率問題,各類新的評價指標(biāo)和社區(qū)檢測算法被相繼提出,其中基于編碼長度優(yōu)化的Infomap 算法[21]和基于surprise 的FAGSO(fast algorithm based on greedy surprise optimization)算法[22]在腦功能網(wǎng)絡(luò)社區(qū)研究的應(yīng)用較多。Infomap算法[21]由Bergstrom 和Rosvall 提出,將網(wǎng)絡(luò)社區(qū)檢測問題轉(zhuǎn)換為一個尋找最短編碼的隨機(jī)游走問題,其目標(biāo)是尋找具有最短隨機(jī)游走描述長度的網(wǎng)絡(luò)社區(qū)劃分。FAGSO 算法由Jiang 等人[22]提出,該方法以surprise作為目標(biāo)函數(shù),計算了給定社區(qū)劃分下,網(wǎng)絡(luò)社區(qū)中節(jié)點(diǎn)和邊累積的超幾何分布的概率。此外,概率圖模型也可以解決社區(qū)分辨率問題,比如Bryant等人[23]基于隨機(jī)塊模型(stochastic block model,SBM)提出適用于靜態(tài)功能網(wǎng)絡(luò)社區(qū)檢測的RGMM(Bayesian random graph mixture model)算法,識別出不同被試者之間的共同潛在結(jié)構(gòu)以及異質(zhì)結(jié)構(gòu),該方法引入?yún)?shù)的共軛先驗(yàn)實(shí)現(xiàn)對未知參數(shù)的有效估計,并采用MCMC(Markov chain Monte Carlo)計算后驗(yàn),提高計算效率和準(zhǔn)確性。
值得注意的是,腦網(wǎng)絡(luò)社區(qū)檢測通常面臨多被試問題,傳統(tǒng)方法通過構(gòu)建組水平代表性連接矩陣實(shí)現(xiàn)社區(qū)檢測,但該類方法無法獲取個體特定的社區(qū)化結(jié)構(gòu)。為了解決該問題,Zhang 等人[24]基于傳統(tǒng)模塊度優(yōu)化方法,提出一種新的多層被試間約束模塊化分析方法(multi-layer intersubject-constrained modularity analysis,MLISMA)。如圖3所示,該方法首先通過超參數(shù)ω在每個被試對之間添加不同層的連接邊,創(chuàng)建了“超連接矩陣”的多層網(wǎng)絡(luò),然后利用傳統(tǒng)基于模塊度優(yōu)化的社區(qū)檢測算法獲得不同被試的社區(qū)結(jié)構(gòu)。多層網(wǎng)絡(luò)的構(gòu)建不僅保證了被試間穩(wěn)健和一致的社區(qū)檢測,而且可以保留單個被試的獨(dú)特化社區(qū)結(jié)構(gòu),用于個體變異性分析,實(shí)現(xiàn)了被試間社區(qū)結(jié)構(gòu)的一致性和差異性的有效平衡。Gupta等人[25]則采用多類譜聚類方法,考慮被試者之間的差異性,結(jié)合一致性聚類,提出一種迭代優(yōu)化方法ICSC(iterative consensus spectral clustering),使共同潛在的功能網(wǎng)絡(luò)結(jié)構(gòu)與各被試盡可能相似,從而提取出能夠代表不同被試的共有功能網(wǎng)絡(luò)結(jié)構(gòu),同時也能得到不同被試者之間的模塊結(jié)構(gòu)。該方法適用于高連接密度的腦功能網(wǎng)絡(luò)模塊檢測,且在不同的情況下均能得到較好的結(jié)果,既適用于群體功能模塊檢測也適用于個體的相關(guān)檢測。
總之,目前面向靜態(tài)網(wǎng)絡(luò)的分離社區(qū)檢測主要采用已開發(fā)的算法進(jìn)行模塊識別與檢測,其中基于模塊度的社區(qū)檢測算法使用簡單方便,可取得穩(wěn)定的社區(qū)檢測結(jié)果,而且具有多種變體,是使用最廣泛的方法。但是值得注意的是,在算法選擇過程中,需根據(jù)網(wǎng)絡(luò)規(guī)模和連接屬性選擇對應(yīng)的搜索策略,或同時采用多種方法進(jìn)行迭代搜索[26],以保證社區(qū)檢測結(jié)果的準(zhǔn)確性和穩(wěn)定性。該方向新算法的開發(fā)則主要關(guān)注多被試腦網(wǎng)絡(luò)的社區(qū)檢測問題,集中于解決如何同時有效識別群體共有的社區(qū)結(jié)構(gòu)和單個被試特有的功能系統(tǒng),這也是未來面向腦網(wǎng)絡(luò)社區(qū)檢測算法研究的重點(diǎn)方向之一。
隨著對復(fù)雜網(wǎng)絡(luò)研究的深入,很多真實(shí)世界的網(wǎng)絡(luò)存在單個節(jié)點(diǎn)與多個社區(qū)同時聯(lián)系緊密的情況,比如社交網(wǎng)絡(luò)中的個體同時隸屬于學(xué)校、家庭和朋友等多個社區(qū)。最近大量的神經(jīng)影像學(xué)研究表明,人腦功能網(wǎng)絡(luò)也表現(xiàn)出重疊化社區(qū)組織[27-28],其中一個大腦區(qū)域可以參與多個功能模塊,以保證人腦與認(rèn)知功能之間靈活多變的關(guān)系,研究重疊區(qū)域的拓?fù)涮卣骱凸δ茏饔脤τ诮沂救四X連接模式具有重要的意義。表3 總結(jié)了當(dāng)前腦功能網(wǎng)絡(luò)重疊社區(qū)檢測算法。
表3 靜態(tài)腦功能網(wǎng)絡(luò)重疊社區(qū)檢測算法Table 3 Overlapping community detection algorithms for static brain functional network
非負(fù)矩陣分解(nonnegative matrix factorization,NMF)在提取高維數(shù)據(jù)中隱含模式和結(jié)構(gòu)方面具有良好性能,是挖掘網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)的一種重要方法。基于NMF的社區(qū)檢測要求給定網(wǎng)絡(luò)是稀疏的非負(fù)連接矩陣,然而傳統(tǒng)基于相關(guān)性方法構(gòu)建的腦功能連接矩陣通常包含負(fù)連接,而且網(wǎng)絡(luò)連接密度較大。針對該問題,Li等人[29]提出一種非負(fù)自適應(yīng)稀疏表示方法(non-negative adaptive sparse representation,NASR),在傳統(tǒng)目標(biāo)函數(shù)基礎(chǔ)上添加非負(fù)和稀疏約束,保證所構(gòu)建網(wǎng)絡(luò)的非負(fù)性和稀疏化。具體公式如下:
其中,xi為腦區(qū)i的 BOLD 時間序列,Xi=(x1,x2,…,xi-1,xi+1,…,xn) 表示xi的字典,為腦區(qū)i的編碼向量,每個元素代表腦區(qū)j與腦區(qū)i的依賴關(guān)系,λ為正則化參數(shù)。在獲得所有節(jié)點(diǎn)的wi之后,腦功能連接矩陣定義為A=(W+WT)/2,W={w1,w2,…,wn}。由該方法所構(gòu)建的腦功能網(wǎng)絡(luò)非負(fù)對稱,而且物理意義明確,可直接用于NMF 的輸入?;谠摼W(wǎng)絡(luò)構(gòu)建方法,Li 等人先后提出各類基于NMF的社區(qū)檢測算法,包括sNMF(symmetric non-negative matrix factorization)[29]和ssNMF(sparse symmetric non-negative matrix factorization)[30],對應(yīng)優(yōu)化函數(shù)分別如式(3)和式(4)所示:
H表征組水平社區(qū)結(jié)構(gòu),表征個體信息,每個元素為第i個被試社區(qū)j的連接強(qiáng)度。借助于H和S,cssNMF 可同時準(zhǔn)確識別腦功能網(wǎng)絡(luò)組水平社區(qū)結(jié)構(gòu)和個體差異化信息。雖然cssNMF 解決了sNMF和ssNMF無法檢測個體差異的缺陷,但由于其在被試上執(zhí)行統(tǒng)一的稀疏約束,無法保證個體特定的稀疏模式。針對該問題,Mirzaei等人[32]提出兩種基于非負(fù)張量分解(non-negative tensor factorization,NTF)的框架(即Beta-NTF 和Bayesian non-negative canonical decomposition),用于尋找跨被試可復(fù)制的重疊社區(qū)結(jié)構(gòu),該方法無需后處理步驟即可實(shí)現(xiàn)對主體間可變性的建模,同時貝葉斯建模能夠完成最佳社區(qū)數(shù)目的自動選擇。相比cssNMF,該方法可獲得更魯棒的社區(qū)檢測結(jié)果。
此外,Wen 等人提出的基于多目標(biāo)優(yōu)化的MCMOEA(maximal clique based multiobjective evolutionary algorithm)也被用于腦功能網(wǎng)絡(luò)重疊社區(qū)檢測中[33-34]。該方法首先通過引入極大派系圖,將重疊社區(qū)檢測問題轉(zhuǎn)換為分離社區(qū)檢測,不僅降低了問題復(fù)雜度,而且實(shí)現(xiàn)了網(wǎng)絡(luò)壓縮;然后采用多目標(biāo)優(yōu)化方法,同時最大化社區(qū)內(nèi)連接強(qiáng)度(kernelk-means,KKM)和最小化社區(qū)間連接強(qiáng)度(ratio cut,RC),最終從帕累托面上選擇模塊度最大的社區(qū)劃分結(jié)果作為最終結(jié)果。Yoldemir 等人[35]基于生物進(jìn)化中的復(fù)制動態(tài)理論設(shè)置優(yōu)化目標(biāo),提出適用于有權(quán)網(wǎng)絡(luò)的SORD(stable overlapping replicator dynamics)模型,該方法通過引入圖增強(qiáng)方法獲得多個不同社區(qū)劃分結(jié)果,各劃分之間具有重疊性,從而實(shí)現(xiàn)了重疊社區(qū)檢測的目標(biāo)。
總之,在重疊社區(qū)檢測方向,基于NMF的社區(qū)檢測算法實(shí)現(xiàn)簡單,獲得的社區(qū)結(jié)構(gòu)具有較高的魯棒性和穩(wěn)定性,使用較為廣泛,例如被用于阿爾茲海默癥標(biāo)記物檢測[36]和年齡預(yù)測[37]等任務(wù)的重疊社區(qū)檢測中。然而,目前就腦網(wǎng)絡(luò)的重疊社區(qū)結(jié)構(gòu)研究而言,仍然存在相對較少的研究,因此需要開發(fā)更多相應(yīng)的社區(qū)檢測算法。此外,還需要更多研究明確和探討不同社區(qū)之間重疊腦區(qū)所包含的生理意義和神經(jīng)機(jī)制。
現(xiàn)實(shí)世界很多復(fù)雜系統(tǒng)的社區(qū)結(jié)構(gòu)都表現(xiàn)出分層結(jié)構(gòu),即大規(guī)模社區(qū)可以細(xì)分為更精細(xì)的較小社區(qū),保證網(wǎng)絡(luò)信息傳輸效率、魯棒性和適應(yīng)性。在腦網(wǎng)絡(luò)中,層次社區(qū)結(jié)構(gòu)有助于支持大腦應(yīng)對外界刺激的快速響應(yīng),是揭示腦機(jī)制的一種重要途徑[38]。表4 總結(jié)了目前應(yīng)用于腦功能網(wǎng)絡(luò)中層次社區(qū)檢測算法。
表4 腦功能網(wǎng)絡(luò)中層次社區(qū)檢測算法Table 4 Hierarchical community detection algorithms of brain functional network
在腦網(wǎng)絡(luò)研究中,最常用的層次社區(qū)檢測算法是通過改進(jìn)傳統(tǒng)的模塊度最大化方法實(shí)現(xiàn)的,主要分為兩種,具體流程如圖4所示。第一種方法利用了Louvain算法[39]搜索過程中的迭代聚類產(chǎn)生網(wǎng)絡(luò)的層次社區(qū)劃分。以圖4(a)為例,該方法首先將網(wǎng)絡(luò)中的每個節(jié)點(diǎn)初始化為一個獨(dú)立社區(qū),通過不斷合并社區(qū)得到最優(yōu)社區(qū)劃分結(jié)果(4 個社區(qū)),以此作為層次1的社區(qū)檢測結(jié)果;接下來基于上一步網(wǎng)絡(luò)劃分的結(jié)果構(gòu)建新的網(wǎng)絡(luò)(即元網(wǎng)絡(luò)),該網(wǎng)絡(luò)中的節(jié)點(diǎn)為所得社區(qū)結(jié)構(gòu)中的社區(qū),邊為不同社區(qū)間的相互關(guān)系,然后采用步驟1的方法檢測新構(gòu)建網(wǎng)絡(luò)的社區(qū)劃分結(jié)構(gòu)(2 個社區(qū)),以此作為層次2 的結(jié)果。通過反復(fù)迭代,直到網(wǎng)絡(luò)無法進(jìn)一步分割,輸出各個層次的結(jié)果即可獲得所檢測網(wǎng)絡(luò)的層次社區(qū)結(jié)構(gòu)。第二種方法則是通過改變模塊度函數(shù)Q實(shí)現(xiàn)多層次社區(qū)檢測。如圖4(b)所示,Ashourvan 等人[40]提出多層次模塊度函數(shù),具體公式如下:
圖4 基于模塊最大化層次社區(qū)檢測算法的經(jīng)典方法Fig.4 Classic methods of module maximization hierarchical community detection algorithms
其中,m為邊的數(shù)目,Aij為連接節(jié)點(diǎn)i和j邊的權(quán)重,ki表示節(jié)點(diǎn)i的度;γx為第x層的分辨率參數(shù),γ值越大,社區(qū)個數(shù)越多;τjxy為不同層之間的連接強(qiáng)度;δ(gix,giy)為指示函數(shù),當(dāng)?shù)趚層中的節(jié)點(diǎn)i與第y層的節(jié)點(diǎn)j屬于同一個社區(qū)時為1,否則為0。該目標(biāo)函數(shù)通過參數(shù)γ控制網(wǎng)絡(luò)層次性,參數(shù)τ保證層次間節(jié)點(diǎn)的對應(yīng)關(guān)系。雖然實(shí)驗(yàn)證明該方法能夠有效檢測網(wǎng)絡(luò)的層次社區(qū)結(jié)構(gòu),但是面臨復(fù)雜的超參數(shù)設(shè)置問題,如何根據(jù)先驗(yàn)信息選擇合適的γ和τ需要進(jìn)一步的研究。
此外,Vangimalla 等人[41]將探索性因子分析法(exploratory factor analysis,EFA)應(yīng)用于腦功能網(wǎng)絡(luò)社區(qū)劃分,通過對功能網(wǎng)絡(luò)關(guān)系矩陣進(jìn)行不同因子參數(shù)下的因子分析,實(shí)現(xiàn)層次社區(qū)檢測。Sanchez-Rodriguez 等人[42]則將經(jīng)驗(yàn)因子分解(empirical mode decomposition,EMD)與隨機(jī)游走相結(jié)合提出一種多時間尺度的社區(qū)檢測方法。該方法首先基于游走在每個時間點(diǎn)碰到的其他游走的數(shù)量占總數(shù)量的比例構(gòu)造時間序列,標(biāo)準(zhǔn)化后利用EMD 得到若干反映不同時間尺度的本征模函數(shù)(intrinsic mode function,IMF)及單調(diào)殘差;然后根據(jù)IMF 構(gòu)建的特征進(jìn)行聚類,并使用一致性聚類進(jìn)行結(jié)果整合,達(dá)到層次社區(qū)檢測的效果。該方法角度新穎,考慮了時間尺度上的信息流,可在中等規(guī)模的網(wǎng)絡(luò)中找到可信的社區(qū)結(jié)構(gòu),但所識別的層次個數(shù)不超過兩個。
近年來研究者提出一種基于邊的功能連接網(wǎng)絡(luò)構(gòu)建方法,即eFC(edge functional connectivity)網(wǎng)絡(luò),該網(wǎng)絡(luò)以原始網(wǎng)絡(luò)的邊作為節(jié)點(diǎn),評估了不同邊之間功能的相互關(guān)系[43]。將基于eFC 的社區(qū)檢測結(jié)果映射回其相應(yīng)的大腦區(qū)域時,就可以獲得重疊的社區(qū)檢測結(jié)果。通過利用eFC 的該特征,F(xiàn)an 等人[44]采用嵌套譜分區(qū)方法(nested spectral partition,NSP),該方法基于特征模式將腦網(wǎng)絡(luò)分區(qū)為不同層次的多個模塊,使其能夠在層次水平上跟蹤重疊模塊組織的詳細(xì)變化。
總之,層次社區(qū)檢測是一個具有挑戰(zhàn)性的任務(wù),因?yàn)楝F(xiàn)實(shí)網(wǎng)絡(luò)的社區(qū)層級可能是連續(xù)的,而且是不明確的,極大增加了層次社區(qū)定義與識別的難度。目前,面向腦網(wǎng)絡(luò)層次社區(qū)檢測方法主要以應(yīng)用型為主,其中基于多層模塊度的方法應(yīng)用較多,因?yàn)樗鼘?shí)現(xiàn)方便簡單,而且可以保證節(jié)點(diǎn)在不同層次社區(qū)結(jié)構(gòu)之間的對應(yīng)性,便于后續(xù)討論該層次結(jié)構(gòu)背后的生理意義。在未來研究工作中,需針對腦網(wǎng)絡(luò)連接特性,開發(fā)相應(yīng)的層次社區(qū)檢測算法。
大量證據(jù)表明人腦功能連接是一個動態(tài)變化的過程,研究這種時間動力學(xué)可極大提升對人類大腦的理解,其中追蹤人腦網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)隨時間的變化不僅有助于揭示大腦功能系統(tǒng)對外界響應(yīng)的模式,而且可作為刻畫腦區(qū)功能特征的指標(biāo)[45]。表5 總結(jié)了目前面向腦功能網(wǎng)絡(luò)的動態(tài)社區(qū)檢測方法。
表5 動態(tài)腦功能網(wǎng)絡(luò)社區(qū)檢測算法Table 5 Community detection algorithms on dynamic brain functional network
在動態(tài)社區(qū)檢測算法中,多層模塊度最大化算法是最早被引入到動態(tài)腦網(wǎng)絡(luò)社區(qū)檢測研究中,并得到廣泛應(yīng)用[46-48],其原理與上一章中多尺度模塊最大化基本相同,但賦予每一層不同的含義。具體來說,該方法首先通過層間連接將大腦所有時間點(diǎn)的功能網(wǎng)絡(luò)聚合為一個大型多層網(wǎng)絡(luò),然后通過優(yōu)化多層目標(biāo)函數(shù),同時識別所有時間點(diǎn)的社區(qū)結(jié)構(gòu),其中利用超參數(shù)γ控制檢測到的動態(tài)社區(qū)結(jié)構(gòu)的時間平滑度。基于該算法框架,Ting等人[49]結(jié)合隨機(jī)塊模型(SBM),進(jìn)一步提出一種適用于多被試的動態(tài)社區(qū)檢測算法,該方法構(gòu)建了一個多層SBM 來表征多個被試動態(tài)腦功能網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu),同時引入多尺度模塊度優(yōu)化,獲取不同被試間的共同劃分結(jié)構(gòu),該方法不僅可以實(shí)現(xiàn)動態(tài)網(wǎng)絡(luò)的一致社區(qū)劃分,而且可捕捉個體間差異。
此外,Al-Sharoa 等人基于張量分解的框架[50],提出適用于單被試(3D-windowed tensor approach,3DWTA)和多被試動態(tài)社區(qū)檢測算法(4D-windowed tensor approach,4D-WTA)。該方法借助譜聚類思想將Tucker 張量分解的框架進(jìn)行擴(kuò)展,通過在某個時間點(diǎn)考慮歷史信息構(gòu)建新的張量,提出3D-WTA 和4D-WTA的優(yōu)化目標(biāo),分別如式(7)和式(8)所示:
然而,上述動態(tài)社區(qū)檢測算法均為全局尺度的社區(qū)發(fā)現(xiàn),其性能隨著網(wǎng)絡(luò)規(guī)模的增大以及時間點(diǎn)的增加而降低。針對此問題,Wen等人[51]提出基于隨機(jī)游走的局部動態(tài)社區(qū)檢測算法MLRW(multi-layer random walk),該方法通過選擇感興趣的查詢節(jié)點(diǎn),并同時發(fā)出多個隨機(jī)游走對所有時間的社區(qū)結(jié)構(gòu)進(jìn)行同步檢測,游走過程中的概率矩陣根據(jù)相鄰時間點(diǎn)的訪問節(jié)點(diǎn)序列進(jìn)行實(shí)時調(diào)整,從而保證社區(qū)劃分隨時間變化的一致性和連續(xù)性。該方法為純數(shù)據(jù)驅(qū)動算法,無需引入任何先驗(yàn)信息,而且計算復(fù)雜度較低,為研究腦功能網(wǎng)絡(luò)的局部結(jié)構(gòu)提供了思路。
總之,腦網(wǎng)絡(luò)動態(tài)社區(qū)結(jié)構(gòu)的繪制有助于揭示人腦對于外界刺激任務(wù)的響應(yīng)方式,是理解人類大腦神經(jīng)機(jī)制的重要途徑。然而,目前相關(guān)的研究工作還處于起步階段,其主要原因一方面來源于網(wǎng)絡(luò)動態(tài)社區(qū)檢測的難度較大,不僅要保證單個時間點(diǎn)社區(qū)檢測質(zhì)量,同時還要保證社區(qū)結(jié)構(gòu)的時間平滑性,如何根據(jù)先驗(yàn)信息選擇合適的時間平滑度度量指標(biāo)需要進(jìn)一步的研究和探討;另一方面來源于動態(tài)社區(qū)結(jié)構(gòu)生理意義的解析難度大,特別是靜息狀態(tài)下,很難將不同的社區(qū)分布模式與人類行為建立關(guān)系。因此,在未來研究工作中,不僅要聚焦于動態(tài)腦網(wǎng)絡(luò)社區(qū)檢測算法的開發(fā),而且需關(guān)注腦網(wǎng)絡(luò)動態(tài)社區(qū)分析范式的建立。
近年來,針對腦網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)的研究吸引了很多研究者的關(guān)注并取得了豐富的成果,雖然各種社區(qū)檢測算法不斷被提出,但仍有一些問題需要進(jìn)一步探索。
第一,開發(fā)不同場景任務(wù)下的多被試腦網(wǎng)絡(luò)社區(qū)檢測算法,包括分離社區(qū)、重疊社區(qū)、層次社區(qū)和動態(tài)社區(qū)。多被試是腦網(wǎng)絡(luò)社區(qū)化研究領(lǐng)域的特有問題,通過對多個被試進(jìn)行社區(qū)檢測,可以揭示個體之間的腦網(wǎng)絡(luò)差異,幫助人們更好地理解腦社區(qū)結(jié)構(gòu)在個體水平上的多樣性和個體特定的特征,并獲得可靠的生物標(biāo)記和統(tǒng)計結(jié)果。多被試腦網(wǎng)絡(luò)社區(qū)面臨的難點(diǎn)主要是數(shù)據(jù)的異質(zhì)性和個體差異性,導(dǎo)致數(shù)據(jù)的多樣性和復(fù)雜性增加。同時,數(shù)據(jù)收集過程中的噪聲、運(yùn)動偽影等因素也會影響結(jié)果的準(zhǔn)確性。因此,如何在考慮多個被試的數(shù)據(jù)異質(zhì)性和差異的基礎(chǔ)上,有效地提取出共性的網(wǎng)絡(luò)社區(qū)結(jié)構(gòu),是該領(lǐng)域的關(guān)鍵挑戰(zhàn)之一,需要未來更多的研究和討論。
第二,針對腦網(wǎng)絡(luò)社區(qū)檢測算法魯棒性和可重復(fù)性的研究工作較少。在臨床環(huán)境中,需要確保腦網(wǎng)絡(luò)分析結(jié)果的一致性和穩(wěn)定性,以便做出準(zhǔn)確的診斷和治療決策。因此,魯棒性和可重復(fù)性的研究對于將腦網(wǎng)絡(luò)分析應(yīng)用于臨床實(shí)踐至關(guān)重要。特別地,社區(qū)檢測屬于NP 難問題,每次運(yùn)行均無法獲得唯一的結(jié)果,這種情況在連接密度高、存在虛假連接的大規(guī)模腦網(wǎng)絡(luò)中尤其嚴(yán)重,而且社區(qū)檢測結(jié)果還會受到腦網(wǎng)絡(luò)構(gòu)建過程不同流程選擇的影響,比如大腦分區(qū)模板、功能連接評估方法和網(wǎng)絡(luò)稀疏化等。目前該領(lǐng)域已有一些初步探討性的研究工作,比如Wen等人[52]和Dimitriadis等人[53]利用成年健康人的檢測-重測(test-retest)數(shù)據(jù)集分別針對功能網(wǎng)絡(luò)和結(jié)構(gòu)網(wǎng)絡(luò),評估了不同社區(qū)檢測算法、不同網(wǎng)絡(luò)構(gòu)建方法以及不同網(wǎng)絡(luò)規(guī)模下的腦網(wǎng)絡(luò)社區(qū)分析結(jié)果的魯棒性,結(jié)果發(fā)現(xiàn)腦網(wǎng)絡(luò)社區(qū)化研究的可重復(fù)性處于中等水平,而且社區(qū)檢測算法的選擇對結(jié)果的影響很大。然而,當(dāng)前對于這一領(lǐng)域的研究仍然相對有限,不僅缺乏關(guān)于疾病患者腦網(wǎng)絡(luò)社區(qū)差異可重復(fù)性的研究,而且在重疊社區(qū)檢測、多層次社區(qū)檢測以及動態(tài)社區(qū)檢測等方面的研究也尚未展開。
第三,針對多模態(tài)腦網(wǎng)絡(luò)社區(qū)檢測的研究是未來的重要研究方向之一。多模態(tài)研究可以結(jié)合不同類型神經(jīng)影像數(shù)據(jù),從多個角度探索腦的結(jié)構(gòu)和功能,揭示大腦結(jié)構(gòu)和功能連接之間的關(guān)聯(lián)性,幫助人們理解腦區(qū)域的解剖連接是如何與其功能聯(lián)系在一起的,是近年來的研究熱點(diǎn)。目前大部分結(jié)構(gòu)-功能關(guān)聯(lián)研究主要專注于網(wǎng)絡(luò)邊緣權(quán)重之間的統(tǒng)計關(guān)系,但對結(jié)構(gòu)和功能網(wǎng)絡(luò)社區(qū)之間的依賴關(guān)系了解甚少。Puxeddu等人[54]首次基于多層次模塊最大化的社區(qū)檢測算法,提出新的框架,通過同時將從不同受試者估計的結(jié)構(gòu)和功能網(wǎng)絡(luò)映射到社區(qū),實(shí)現(xiàn)了對大腦模塊化組織進(jìn)行多受試者和多模態(tài)的同步分析。利用該方法,研究者發(fā)現(xiàn)了腦結(jié)構(gòu)和功能網(wǎng)絡(luò)存在模態(tài)獨(dú)特和模態(tài)共享的連接模式。深入研究多模態(tài)腦網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu),將極大擴(kuò)展人們對大腦的理解,同時也有望改善疾病的診斷和治療方法,因此需要未來的進(jìn)一步研究探索。
本文聚焦于復(fù)雜腦網(wǎng)絡(luò),從分離社區(qū)檢測、重疊社區(qū)檢測、層次社區(qū)檢測和動態(tài)社區(qū)檢測四方面進(jìn)行全面系統(tǒng)的調(diào)研,同時側(cè)重于針對腦網(wǎng)絡(luò)連接稠密、多被試、復(fù)雜動態(tài)性、含噪聲等特性而提出的方法,試圖為腦網(wǎng)絡(luò)社區(qū)檢測研究提供一份全面完整的研究綜述,為今后腦網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)研究選擇提供方法學(xué)指導(dǎo)。