摘 要:針對LASSO方法構(gòu)建腦功能超網(wǎng)絡模型缺乏組效應解釋能力和網(wǎng)絡有偏性問題,提出了兩種基于組變量選擇的近似無偏稀疏腦功能超網(wǎng)絡模型來改善超網(wǎng)絡的構(gòu)建,分別為組最小最大凹懲罰方法和組平滑剪裁的絕對值偏差方法,并將其分別應用于抑郁癥的分類研究中。分類結(jié)果顯示,兩種方法的分類表現(xiàn)均優(yōu)于傳統(tǒng)超網(wǎng)絡模型,且組最小最大凹懲罰方法的分類準確率最高,達到86.36%。結(jié)果表明若想構(gòu)建有效的腦功能超網(wǎng)絡模型,不僅需要考慮腦區(qū)間組效應的解釋能力,還需考慮模型變量選擇的有偏性問題。而且在考慮到超網(wǎng)絡有偏性的基礎(chǔ)上,選取較為寬松的懲罰方式來選取目標變量,則可更精確地表征人腦的復雜高階多元交互信息。
關(guān)鍵詞:近似無偏稀疏模型; 超網(wǎng)絡; 組最小最大凹懲罰; 組平滑剪裁的絕對值偏差; 機器學習
中圖分類號:TP181 文獻標志碼:A
文章編號:1001-3695(2022)03-017-0744-07
doi:10.19734/j.issn.1001-3695.2021.08.0363
基金項目:國家自然基金資助項目(61672374,61876124,61472270,61741212,61976150,61873178);山西省重點研發(fā)計劃項目(201803D31043);山西省科技廳應用基礎(chǔ)研究項目青年面上項目(201801D121135,201803D31043);山西省研究生教育創(chuàng)新項目(2020BY131)
作者簡介:李瑤(1996-),女,山西運城人,博士研究生,主要研究方向為智能信息處理、腦影像學;周子淏(2000-),男,山西太原人,本科生,主要研究方向為人工智能;梁家瑞(2000-),男,山西運城人,本科生,主要研究方向為智能影像處理;Ibegbu Nnamdi Julian(1993-),男,尼日利亞人,碩士研究生,主要研究方向為腦影像學;郭浩(1981-),男(通信作者),山西太原人,教授,碩導,博士,主要研究方向為人工智能、腦影像學與醫(yī)療大數(shù)據(jù)研究(feiyu_guo@sina.com);陳俊杰(1956-),男,山西太原人,教授,博導,博士,主要研究方向為數(shù)據(jù)挖掘、人工智能與腦影像學.
Construction and classification research of approximately unbiased sparse
brain functional hypernetwork model based on group selection
Li Yaoa, Zhou Zihaob, Liang Jiaruic, Ibegbu Nnamdi Juliana, Guo Haoa?, Chen Junjiea
(a.College of Information amp; Computer, b.College of Mathematics, c.College of Software, Taiyuan University of Science amp; Technology, Jinzhong Shanxi 030600, China)
Abstract:Aiming at the problem of the lack of group effecting explanation ability and network bias in the brain functional hyper-network model based on the LASSO method, this paper proposed two approximate unbiased sparse brain function hypernetwork models based on group variable selection to improve the construction of hypernetworks, such as the group minimax con-cave penalty (gMCP) method and the group smoothly clipped absolute deviation method (gSCAD). Then it applied them to the classification research of depression. Classification results show that the classification performance of the two proposed methods are better than the traditional hyper network model, and the classification accuracy of gMCP is the highest, reaching 86.36%. These results indicate that in order to build an effective brain functional hypernetwork model, not only the group effecting should be considered, the bias in the selection of model variables should also be considered. Moreover, taking into account the bias of the hypernetwork, it can more accurately represent the complex and high-order multivariate interactive information of the human brain that choose a more relaxed punishment method for the selection the target variable.
Key words:approximate unbiased sparse model; hyper-network; group minimax concave penalty; group smoothly clipped absolute deviation; machine learning
0 引言
近些年來,功能磁共振技術(shù)已被廣泛用于腦網(wǎng)絡的研究中。靜息態(tài)功能磁共振影像(resting-state functional magnetic resonance imaging, rs-fMRI)技術(shù)利用血氧水平依賴(blood oxygen level-dependent,BOLD)信號來檢測內(nèi)源性或自發(fā)性大腦神經(jīng)元活動[1]?;贐OLD信號,可將人腦以網(wǎng)絡的形式表征從而探索腦精神疾病的病理機制。目前已被成功應用于腦精神疾病的診斷中[2, 3]。
在現(xiàn)有的腦功能網(wǎng)絡研究中,大多數(shù)研究人員均基于相關(guān)的方法來表征腦區(qū)間的功能關(guān)系[4]。然而,這些方法僅僅能夠捕獲成對的信息,不能有效反映多個腦區(qū)間充分且完整的多元信息交互[5]。研究發(fā)現(xiàn),人腦中的一個腦區(qū)往往與神經(jīng)系統(tǒng)中的多個腦區(qū)直接交互[6]。同時,最近的神經(jīng)科學研究表明,在神經(jīng)元的真實活動中存在重要的空間多元交互,例如在皮質(zhì)動態(tài)、局部場電位以及神經(jīng)元同位素示蹤中[7]?;诖?,超網(wǎng)絡理論引入人腦網(wǎng)絡中[8],其超邊包含多個節(jié)點,可用于表征多個腦區(qū)間信息的交互。
目前,人腦功能超網(wǎng)絡模型主要通過星型擴展[9]和稀疏表示方法[8]兩種來構(gòu)建。研究表明星型擴展缺乏數(shù)據(jù)自適應能力,同時對噪聲敏感[10]。而稀疏表示方法能夠克服星型擴展的局限性,具有數(shù)據(jù)自適應以及噪聲魯棒性的特性[11],因此已經(jīng)得到研究人員的認可,被廣泛應用于基于腦功能超網(wǎng)絡模型的腦精神疾病診斷中。稀疏表示方法主要是通過引入不同的懲罰項求解線性回歸模型來實現(xiàn)。引入懲罰項不同,則求解線性回歸模型的方法不同。傳統(tǒng)基于稀疏表示構(gòu)建超網(wǎng)絡的方法通常是引入LASSO方法[8, 12, 13]或?qū)ASSO方法進行延伸求解線性回歸模型來創(chuàng)建腦功能超網(wǎng)絡,如彈性網(wǎng)方法[14]、功能加權(quán)LASSO方法[15]等。
雖然LASSO方法已成功用于腦精神疾病的分類診斷研究中,但仍然具有局限性。首先,LASSO方法在計算回歸系數(shù)(權(quán)重向量)時,對噪聲變量回歸系數(shù)(與選定腦區(qū)相互獨立的腦區(qū),即不產(chǎn)生交互的腦區(qū))壓縮的同時,一定程度上也對目標變量回歸系數(shù)(與選定腦區(qū)相互依賴的腦區(qū),即產(chǎn)生交互的腦區(qū))進行了相應的壓縮,導致了方法的有偏性[16];其次,若一組變量彼此間的成對相關(guān)比較高時,LASSO方法趨向于選擇一組高度相關(guān)中的一個變量且不關(guān)心組中的哪一個變量被選中[17],也就是不具備組效應的解釋能力。這些局限性將導致所構(gòu)建的腦功能超網(wǎng)絡有可能失去一些重要的具有明顯神經(jīng)學意義解釋的連接。
因此,考慮到以上問題,本文引入組最小最大凹懲罰(group minimax concave penalty,gMCP) [16, 18]和組平滑剪裁的絕對值偏差(group smoothly clipped absolute deviation,gSCAD)兩種方法[19, 20]從不同角度構(gòu)建基于組選擇的近似無偏稀疏腦功能超網(wǎng)絡模型。在文中,將其分別定義為gMCP-HN和gSCAD-HN方法。gMCP-HN和gSCAD-HN方法是應用不同的懲罰函數(shù)進行變量選擇,兩種方法的優(yōu)勢為:a)保證變量選擇連續(xù)性;b)減少懲罰函數(shù)對目標變量系數(shù)壓縮的問題,即通過減小壓縮程度以實現(xiàn)近似無偏性。同時考慮到腦區(qū)間組效應的解釋問題。
本文主要工作包括:a) 對數(shù)據(jù)集進行采集和預處理;b)利用gMCP和gSCAD方法進行超網(wǎng)絡的構(gòu)建;c)計算超網(wǎng)絡的聚類系數(shù)(hypernetwork cluster coefficient, HCC)作為表征超網(wǎng)絡的拓撲屬性特征;d)通過非參數(shù)置換檢驗選擇差異特征,并采用支持向量機(support vector machine,SVM)進行差異特征的分類模型構(gòu)建;e)此外,分析了文中所涉及到的參數(shù)對于最終分類性能的影響。
1 材料和方法
1.1 數(shù)據(jù)采集和預處理
本文共有66例被試參與,分為抑郁組和正常對照組。抑郁組由38例首發(fā)且沒有使用任何藥物的抑郁癥(major depressive disorder,MDD)患者組成,正常對照組(normal control,NC)由28例年齡性別匹配的健康右利志愿者組成。被試的詳細信息如表1所示。執(zhí)行研究之前,依據(jù)山西醫(yī)學倫理委員會(參考編號:2012013)的標準,征得所有受試者及相關(guān)參與者(抑郁者的家屬)知情同意,受試者依據(jù)赫爾辛基(Helsinki)宣言簽署書面協(xié)議。
表1中的a值為經(jīng)過雙值雙尾t檢驗計算的P值;b值為經(jīng)過雙尾Pearson卡方檢驗計算的P值。山西醫(yī)科大學第一醫(yī)院完成數(shù)據(jù)采集任務,并且由精通磁共振技術(shù)的放射科醫(yī)師通過3T磁共振掃描儀(Siemens Trio 3-Tesla scanner,Siemens,Erlangen,Germany)完成掃描任務。被試在進行掃描時也有相應的要求,即被試需要在放松的狀態(tài)下不能入睡,閉眼不考慮任何事情。具體的掃描參數(shù)設(shè)置為:射頻重復時間為2 s,回波時間設(shè)為30 ms,層厚設(shè)為4 mm,成像視野設(shè)為192 mm×192 mm,存儲矩陣設(shè)為64 mm×64 mm,偏轉(zhuǎn)角度設(shè)為90°,連續(xù)的回波平面成像序列功能圖像設(shè)為248個??紤]到被試的適應性和初始數(shù)據(jù)信號的不穩(wěn)定性,本文將前十個時間序列剔除。
接著利用SPM8(http://www.fil. ion.ucl.ac.uk/spm)對影像數(shù)據(jù)執(zhí)行預處理。首先,對掃描的圖像進行時間層校正及頭動校正,校正規(guī)則為:丟棄頭動大于3 mm或轉(zhuǎn)動大于3°的受試者。其次,利用蒙特利爾神經(jīng)病學研究所(Montreal Neurological Institute,MNI)的平面回波成像(echo planer imaging,EPI)模板,將校正后的圖像標準化,其體素大小設(shè)置為3 mm。最終執(zhí)行線性降維和帶通濾波(0.01~0.10 Hz)處理,以減小低頻漂移和高頻生物噪聲信號。由于全局腦信號在神經(jīng)影像學領(lǐng)域內(nèi)仍存在爭論,所以本文預處理過程中并未對其進行處理。
預處理完成后,利用自動解剖標記(anatomical automatic labeling,AAL)[21]模板進行大腦劃分,這一模板已廣泛應用在同類研究中[22]。具體為,利用AAL模板將大腦劃分為左右半腦各45個感興趣區(qū)域(region of interest,RoI),總共90個感興趣解剖區(qū)域,表示網(wǎng)絡中的節(jié)點。多個時間點中節(jié)點所對應全部體素BOLD的算術(shù)平均值得到該節(jié)點的平均時間序列。
1.2 超網(wǎng)絡構(gòu)建
現(xiàn)有的研究中通常利用LASSO方法以及對LASSO方法進行延伸來構(gòu)建腦功能超網(wǎng)絡。但LASSO方法本身存在相應的局限性,即呈現(xiàn)有偏性[16]及無法表征腦區(qū)間存在的天然組結(jié)構(gòu)能力[17]。這將導致人腦也許會丟失一些重要的具有明顯神經(jīng)生物學意義的連接。因此本文提出gMCP和gSCAD方法完成基于組選擇的近似無偏稀疏腦功能超網(wǎng)絡的構(gòu)建。
具體來說,基于功能磁共振的時間序列數(shù)據(jù),利用gMCP和gSCAD方法進行基于組選擇的近似無偏稀疏超網(wǎng)絡的構(gòu)建,即gMCP-HN和gSCAD-HN方法。通過以上兩種方法將選定腦區(qū)通過其余腦區(qū)的線性組合來表示,同時將不產(chǎn)生交互的與選定腦區(qū)相互獨立的大部分腦區(qū)懲罰為0,保留與之相互依賴的腦區(qū),從而選定腦區(qū)與保留相互依賴的腦區(qū)生成一條超邊。所有超邊組成一個腦功能超網(wǎng)絡。
1.2.1 基于gMCP方法構(gòu)建腦功能超網(wǎng)絡
gMCP是在組選擇的基礎(chǔ)上引入MCP罰函數(shù),而MCP罰函數(shù)可以降低懲罰函數(shù)對于目標變量回歸系數(shù)的壓縮問題,即在有效壓縮噪聲變量回歸系數(shù)的前提下,充分保留目標變量的回歸系數(shù),來減弱其壓縮變量時有偏估計的特點。換句話說,利用gMCP方法生成特定腦區(qū)的超邊時,MCP罰函數(shù)在與選定腦區(qū)相互獨立的腦區(qū)(即不產(chǎn)生交互的腦區(qū))壓縮的基礎(chǔ)上,減少與選定腦區(qū)相互依賴腦區(qū)的懲罰,從而盡可能保留一些有用的腦區(qū)交互信息。所以gMCP是在組級的基礎(chǔ)上進行腦功能超網(wǎng)絡的構(gòu)建,首先使用聚類算法基于所有腦區(qū)的時間序列對所有腦區(qū)進行聚類獲得每個腦區(qū)的分組信息。本文利用K-means++算法[23]將相關(guān)性較強的腦區(qū)歸為一組。接著利用gMCP方法[19]進行腦功能超網(wǎng)絡的構(gòu)建。具體定義為
其中:θ=αpk;γgt;1表示調(diào)整參數(shù)。若γ→∞時,與組LASSO估計相同;若γ→1時,收斂至組硬閾值懲罰;λ≥0表示懲罰參數(shù)。具體的實現(xiàn)過程為,若|θ|≤γλ時,對噪聲變量的權(quán)重向量進行壓縮。相反,若|θ|gt;γλ時,則目標變量的權(quán)重向量保持原值,不再對其壓縮。由此可知,組MCP模型主要是降低權(quán)重變量的壓縮程度來達成模型的近似無偏性[16]。
基于gMCP方法腦功能超網(wǎng)絡構(gòu)建具體如下:對于每一個被試,基于時間序列數(shù)據(jù),將被試中的腦區(qū)作為超網(wǎng)絡的節(jié)點。基于超網(wǎng)絡中的每個腦區(qū),在特定的γ值下,變化λ的值,生成一組權(quán)重向量αk。每個權(quán)重向量αk中的非零項生成一條超邊。所以一個腦區(qū)生成一組超邊。對于每一個腦區(qū),重復以上步驟,生成對應的超邊。進而將所有超邊組成一個被試的腦功能超網(wǎng)絡,具體為90個節(jié)點和810條超邊。γ采用默認值3[24]。組MCP通過grpreg工具包來求解[24]。具體的構(gòu)建流程框架如圖1所示。
1.2.2 基于gSCAD方法構(gòu)建腦功能超網(wǎng)絡
gSCAD是在組選擇的基礎(chǔ)上引入SCAD罰函數(shù)。SCAD與MCP罰函數(shù)在定義和表現(xiàn)上均是比較類似的,即通過設(shè)置不同的閾值水平,來不同程度地降低或消除懲罰估計量的偏差,也就是減弱罰函數(shù)對于目標變量回歸系數(shù)(權(quán)重向量)的壓縮問題,從而盡可能改善LASSO方法及對其進行延伸方法的有偏性問題。在腦網(wǎng)絡中,利用gSCAD方法生成超邊時,SCAD罰函數(shù)將與選定腦區(qū)不產(chǎn)生交互的腦區(qū)懲罰為0的同時,減少或避免與選定腦區(qū)交互的腦區(qū)的懲罰,即構(gòu)建近似無偏稀疏腦功能超網(wǎng)絡。
與基于gMCP方法構(gòu)建腦功能超網(wǎng)絡類似,在利用gSCAD方法構(gòu)建超網(wǎng)絡之前,首先利用K-means++算法[23]對腦區(qū)進行分組。接著使用gSCAD方法[19, 20]進行腦功能超網(wǎng)絡的構(gòu)建。
gSCAD方法的定義與gMCP方法類似,如式(1)所示。xk,Ak,αk,αpk的含義與gMCP方法中類似,但φ(·)表示的為SCAD懲罰。具體表示為
其中:θ=αpk;γgt;2表示調(diào)整參數(shù),該取值與gMCP方法不同,當γgt;2時,仍為軟閾值懲罰[25],λ≥0表示懲罰參數(shù)。當0≤|θ|≤λ時,得到組LASSO估計[20],即側(cè)重于將該范圍的權(quán)重向量全部壓縮為零;當λlt;|θ|lt;γλ時,|θ|越大,則壓縮程度降低;當|θ|≥γλ時,則權(quán)重向量保持原值,不再壓縮。此外,當λ→∞時,同樣與組LASSO相似。
構(gòu)建方法如下:同樣,基于每個被試的時間序列數(shù)據(jù),將被試中的腦區(qū)作為超網(wǎng)絡的節(jié)點,通過變化λ的值生成一組權(quán)重向量αk,每個αk中非零項生成超邊。每個腦區(qū)重復以上步驟,組成最終的腦功能超網(wǎng)絡。相似地,γ采用默認值4[24]。gSCAD通過grpreg工具包來求解[24]。具體的構(gòu)建流程和算法參照gMCP方法,在此不作贅述。
1.3 特征提取
完成超網(wǎng)絡構(gòu)建后,需要選取特征量化超網(wǎng)絡進行分類研究。本文采用廣泛用于超網(wǎng)絡的局部拓撲屬性,聚類系數(shù)(HCC)作為可量化指標表征腦功能超網(wǎng)絡的拓撲信息。主要包括三種不同的定義[26]。具體的計算公式為
式(4)表示第一類聚類系數(shù),是不包含節(jié)點v的鄰居節(jié)點互為鄰居的比例,用HCC1表示。其中:u、t、v表示超網(wǎng)絡中的節(jié)點;N(v)表示所有包含節(jié)點v的超邊中含有其他節(jié)點的集合,用N(v)={u∈V:e∈ζ,u,v∈e}來表示;ζ指的是超邊集;e代表一條超邊。若ei∈ζ,當且僅當u,t∈ei,vei,則I(u,t,v)=1;否則當且僅當v,u,t∈ei時,I(u,t,v)=0,該定義的優(yōu)勢是在這個集合中發(fā)現(xiàn)的任何交互都代表了鄰居節(jié)點間的真實連接,且不會存在由于與節(jié)點v交互引起的數(shù)據(jù)偽影[26]。
式(5)表示第二類聚類系數(shù),用HCC2表示,是包含節(jié)點v的鄰居節(jié)點互為鄰居的比例。u、v、t、N(v)均與HCC1中參數(shù)含義相同;若ei∈ζ,當v,u,t∈ei,I′(u,t,v)=1;否則當u,t∈ei,且vei,I′(u,t,v)=0,該定義的優(yōu)勢是更有可能發(fā)現(xiàn)節(jié)點v與鄰居節(jié)點間的真實連接。但通過這種方式發(fā)現(xiàn)的交互可能只是由于與節(jié)點v的共享交互而產(chǎn)生的數(shù)據(jù)偽影[26]。
式(6)表示第三類聚類系數(shù),用HCC3表示,是節(jié)點v的鄰接超邊重疊的比例。v、e、N(v)同樣與HCC1中參數(shù)含義相同。其中:S(v)={ei∈ζ:v∈ei};v表示節(jié)點;e表示超邊;S(v)表示含有節(jié)點v的所有超邊。
這三種聚類系數(shù)從不同層面反映了超網(wǎng)絡的局部聚類屬性?;谌N不同聚類系數(shù)定義,分別從兩種方法構(gòu)建的腦功能超網(wǎng)絡中提取作為對應的局部屬性特征。
1.4 特征選擇和分類
通過聚類系數(shù)提取的局部屬性特征也許會包含一些冗余的、不相關(guān)的特征,從而影響分類模型的有效性。因此,本文采用了廣泛用于腦網(wǎng)絡研究中的統(tǒng)計分析方法——Kolmogorov-Smirnov[27]非參數(shù)置換檢驗作為本文的特征選擇方法,依照統(tǒng)計學上的差異性分析去除無關(guān)或冗余的特征來獲得最具有判別性的組間差異特征,從而進行更有效的分類。具體來說,針對MDD患者和正常人,將計算聚類系數(shù)屬性產(chǎn)生的270個節(jié)點屬性進行組間KS非參數(shù)置換檢驗,并依據(jù)統(tǒng)計顯著性plt;0.05選取具有顯著組間差異的局部屬性參與分類模型構(gòu)建,該結(jié)果已通過FDR校正(q=0.05)。
現(xiàn)有研究中已經(jīng)提出多種分類器進行分類模型的構(gòu)建,如SVM、決策樹、邏輯回歸、線性回歸、隨機森林、K近鄰等。其中,SVM最常用于腦精神疾病分類診斷研究中。其主要原因是該算法的計算復雜度取決于樣本數(shù)目而不是特征維度,這將使得該模型更適用于小樣本數(shù)據(jù)集和高維特征中[28, 29]。而在腦精神疾病研究中,無法避免的問題就是樣本數(shù)目較少。必須面對的就是數(shù)據(jù)采集困難,尤其對于患者來說,較難得到其完全的信息。因此,本文使用LibSVM(http://www.csie.ntu.edu.tw/~cjlin/libsvm)工具包中的徑向基核函數(shù)(radial basis function,RBF)進行SVM分類模型的構(gòu)建。
留一交叉驗證(leave one out cross validation,LOOCV)評估分類性能。具體為,若存在S個樣本,則1個樣本作為測試集,其余S-1個樣本作為訓練集。接著訓練集利用K折交叉驗證(K-fold cross validation,K-CV)進行參數(shù)尋優(yōu)(c,g),最后選取訓練集驗證分類準確率最高的參數(shù)組(c,g)參與模型的訓練[30]。在此基礎(chǔ)上建立S個不同的訓練模型,并分別使用其剩余測試集預測其模型的有效性。注意,分類模型構(gòu)建前,需要標準化分類特征。
2 結(jié)果和分析
2.1 網(wǎng)絡拓撲屬性的回歸分析
首先,本文從網(wǎng)絡拓撲屬性角度驗證了兩種方法構(gòu)建網(wǎng)絡拓撲的關(guān)聯(lián)程度?;诿總€大腦區(qū)域,在每種不同方法的超網(wǎng)絡中,分別平均每組受試者的HCC值,并標準化該數(shù)值,接著基于兩種方法進行回歸分析。結(jié)果表明,gMCP和gSCAD方法所構(gòu)建的網(wǎng)絡在存在差異的基礎(chǔ)上,關(guān)聯(lián)性較強,分別在正常組以及抑郁組被試中達到0.844和0.890,如圖2所示。其潛在的原因是兩種方法對于變量的相似懲罰度產(chǎn)生的,即不是對不存在交互的腦區(qū)以及存在交互的腦區(qū)同時進行壓縮,而是一定程度上均減少或避免對于產(chǎn)生交互的腦區(qū)的壓縮。
2.2 差異性腦區(qū)
基于gMCP和gSCAD方法,分別構(gòu)建超網(wǎng)絡,并計算局部聚類系數(shù)提取網(wǎng)絡局部特征,利用非參數(shù)置換檢驗進行組間差異分析,選取具有顯著差異的腦區(qū)特征。兩種方法下,具體所得到的顯著差異腦區(qū)如表2所示。兩種方法重疊的腦區(qū)如圖3所示。結(jié)果表明,組MCP和組SCAD方法下的重疊腦區(qū)較多,分別是左側(cè)背外側(cè)額上回、左側(cè)內(nèi)側(cè)額上回、右側(cè)腦島、左側(cè)海馬旁回、左側(cè)舌回、左側(cè)梭狀回、左側(cè)角回、左側(cè)中央旁小葉,以及左側(cè)顳極:顳中回。該結(jié)果同樣暗示了兩種方法所構(gòu)建的腦功能超網(wǎng)絡拓撲較為相似。
此外,通過以下兩種方法所得到的分類表現(xiàn)層面來看,gMCP方法得出了最高的分類準確率。因此,本文重點將gMCP方法所得的異常腦區(qū)與之前抑郁癥腦網(wǎng)絡研究進行對比,結(jié)果表明所得腦區(qū)與其他文獻中出現(xiàn)的異常腦區(qū)一致,如表3所示。
2.3 分類表現(xiàn)
本文通過分類準確率、敏感性、特異性和平衡準確率(ba-lanced accuracy,BAC)來綜合評估gMCP-HN和gSCAD-HN方法的分類性能。BAC表示敏感性和特異性的均值,以避免不平衡數(shù)據(jù)集所導致的膨脹影響[41]。
首先本文分別評估了兩種所提方法的分類性能,其次與現(xiàn)有LASSO方法以及對其進行延伸的方法所得到的分類性能進行了相關(guān)對比,包括LASSO方法、組LASSO以及稀疏組LASSO方法。此外,為了增強本文實驗結(jié)果的可對比性,同樣引入MCP和SCAD方法構(gòu)建腦功能超網(wǎng)絡,并進行分類性能的對比。以上兩種方法的求解通過ncvreg工具包[42]來實現(xiàn)。具體的比較結(jié)果如表4所示。
結(jié)果表明gMCP和gSCAD方法的分類結(jié)果均達85%以上,高于現(xiàn)有研究所提超網(wǎng)絡構(gòu)建方法以及MCP和SCAD方法,而且gMCP方法的分類準確率最高,達到86.36%。分析其潛在原因,相比于傳統(tǒng)LASSO方法,本文兩種方法在組級層面上進行變量選擇,解決了組效應問題,同時考慮到了LASSO方法的有偏性問題。相比于MCP和SCAD方法,雖然有偏性問題得以一定程度上的解決,但組效應問題卻未考慮,因此同樣導致分類結(jié)果低于gMCP和gSACD方法。而組LASSO和稀疏組LASSO方法,雖然考慮到了腦區(qū)間所存在的組效應問題,但模型均為有偏性,使得對于權(quán)重向量的壓縮程度過于嚴格,也就是同時壓縮與選定腦區(qū)相互獨立的腦區(qū)以及產(chǎn)生交互的腦區(qū),導致會失去一些重要的連接。這一結(jié)果暗示了若要構(gòu)建更加有效的腦功能超網(wǎng)絡以更加精確地表征人腦復雜的交互信息,則不僅需體現(xiàn)人腦中固有的組結(jié)構(gòu),還需選擇合適的模型對權(quán)重向量進行適度的壓縮,實現(xiàn)網(wǎng)絡結(jié)構(gòu)的無偏性。
此外,由于gMCP和gSCAD方法的分類表現(xiàn)稍有不同,需要進一步研究它們對分類的貢獻程度。使用Relief算法[44]對特征的有效性進行驗證。該方法會根據(jù)每個類別和功能相關(guān)性分配不同的權(quán)重,特征的分類能力越強,分配的權(quán)重越大(反之亦然)。結(jié)果表明,gMCP方法所得的分類權(quán)重高于gSCAD方法,如圖4所示。其潛在的原因可能是兩種方法對于無偏性的不同解釋程度造成的。在gSCAD方法中,當λlt;|αpk|lt;γλ時,目標變量的權(quán)重向量是隨著權(quán)重向量αpk的增大而不進行壓縮(懲罰),因此這暗示了一些目標變量的權(quán)重向量一定程度也許會被壓縮至0,相較于gMCP方法來說,壓縮較為嚴格,從而導致其所構(gòu)建的腦功能超網(wǎng)絡仍不能完全保留目標變量的權(quán)重向量,也就是仍會丟失一些重要的具有神經(jīng)學意義的連接,因此導致所提取的特征相較于gMCP方法來說,分類權(quán)重較低。
3 參數(shù)影響
在本文中,一些重要的參數(shù)選取也會對分類結(jié)果產(chǎn)生影響,主要包括,腦功能超網(wǎng)絡構(gòu)建模型中分組參數(shù)p、SVM模型參數(shù)c和g,分別對每個參數(shù)展開詳細的討論。
3.1 分組參數(shù)p
兩種方法都在預定義組下進行超網(wǎng)絡構(gòu)建,實驗中使用了K-means++[23]聚類算法,P表示分組大小,可以將數(shù)據(jù)預先分成p個組,是預定義分組的重要基礎(chǔ)。本實驗定義p∈[3,90],以3為步長,進行腦區(qū)間的分組??紤]到聚類算法中初始種子節(jié)點的隨機性,本文基于特定的p值,在兩種方法中,分別進行50次實驗并將平均50次實驗的分類結(jié)果作為最后的分類結(jié)果。圖5為兩種方法在不同p值下的正確率。結(jié)果顯示組MCP方法中組數(shù)p=24時,最高正確率達到86.36%;組SCAD方法中組數(shù)p=39時,表現(xiàn)出的最高正確率達到85.71%。
3.2 SVM模型參數(shù)(c,g)的影響
SVM分類器適用于高維特征以及小樣本數(shù)據(jù)集中,因此被廣泛用于腦疾病的研究中。在SVM分類模型中,包括多種核函數(shù)來進行分類模型的構(gòu)建,但考慮到其余核函數(shù)的局限性,本文選取RBF核函數(shù)構(gòu)建分類器。在基于RBF的SVM分類模型中,主要涉及懲罰因子c和核參數(shù)g兩個參數(shù)。c用來控制誤差的容忍度,以衡量結(jié)構(gòu)風險和經(jīng)驗風險。當c越大時,則易發(fā)生過擬合;當c越小時,易發(fā)生欠擬合。無論是過擬合還是欠擬合,均會影響分類器的泛化性能,而影響分類性能。g是徑向基核函數(shù)中的參數(shù),即核參數(shù),改變該參數(shù),可使原始的特征數(shù)據(jù)映射至高維特征數(shù)據(jù)的分布不同。g越大,易發(fā)生過擬合;g越小,易發(fā)生欠擬合。因此,選取合適的(c,g)對于分類模型的構(gòu)建是非常關(guān)鍵的。在本文中,固定(c,g)的區(qū)間范圍,基于網(wǎng)格搜索方法,將訓練集作為原始數(shù)據(jù)集,在特定的(c,g)中利用K折交叉驗證方法得到每組(c,g)下的分類準確率,最終選擇分類準確率最高的(c,g)作為最優(yōu)參數(shù)參與訓練集分類模型的構(gòu)建。本文設(shè)置(c,g)參數(shù)組在[2-8,28]內(nèi)變化,步長為1。圖6表示參數(shù)(c,g)的尋優(yōu)結(jié)果。結(jié)果顯示,分類準確率最高時的c、g參數(shù)的值分別為2和0.5,最高準確率是92.307 7%。
4 結(jié)束語
現(xiàn)有超網(wǎng)絡構(gòu)建大多是基于稀疏表示方法,傳統(tǒng)基于LASSO的稀疏表示方法缺乏解釋腦區(qū)之間的組效應的能力,而且懲罰函數(shù)對目標變量權(quán)重向量有一定程度的壓縮,使得模型呈現(xiàn)有偏性??紤]到這些問題,本文提出近似無偏稀疏模型的超網(wǎng)絡構(gòu)建方法有g(shù)MCP-HN和gSCAD-HN兩種方法。
研究結(jié)果表明,在拓撲層面,gMCP-HN和gSCAD-HN模型在存在差異的基礎(chǔ)上,網(wǎng)絡拓撲相關(guān)性較強。在分類結(jié)果層面,本文兩種網(wǎng)絡模型均優(yōu)于傳統(tǒng)LASSO模型以及其擴展的超網(wǎng)絡模型。而在所提兩種方法中,gMCP-HN模型的分類結(jié)果優(yōu)于gSCAD-HN模型。這表明若想改善腦功能超網(wǎng)絡模型,更為精確地表征人腦復雜的多元交互信息,不僅需考慮腦區(qū)間組結(jié)構(gòu)的信息,還需考慮模型變量選擇間的有偏性問題。而在考慮超網(wǎng)絡有偏性的基礎(chǔ)上,則需選取較為寬松的懲罰方式對目標變量(與選定腦區(qū)產(chǎn)生交互的腦區(qū))進行有效的選擇。
在目前的研究中,共存在兩個局限性:a)本文的功能超網(wǎng)絡構(gòu)建方法主要從非重疊要素組上進行超網(wǎng)絡構(gòu)建,然而在人腦的復雜交互中,同一腦區(qū)可以參與多種功能的實現(xiàn),而且,也許在同一時間中,同一腦區(qū)便同時參與多種特定功能的實現(xiàn),因此,未來的研究可以在此基礎(chǔ)上引入組間的重疊性以進一步完善超網(wǎng)絡的構(gòu)建;b)本文的超網(wǎng)絡構(gòu)建是在對腦區(qū)聚類完成后進行的超網(wǎng)絡構(gòu)建,這便暗示了所構(gòu)建的超網(wǎng)絡以及分類結(jié)果無法消除初始隨機種子點的影響。盡管本文通過選取不同的k值,以及基于特定的k值,執(zhí)行多次實驗來防止其影響,因此之后的研究中可以采用更加穩(wěn)定的聚類方法來生成穩(wěn)定的超邊,以進一步改善超網(wǎng)絡。
參考文獻:
[1]Burrows K, Stewart J L, Kuplicki R, et al. Elevated peripheral inflammation is associated with attenuated striatal reward anticipation in major depressive disorder[J].Brain,Behavior,and Immunity,2021,93:214-225.
[2]Steardo L, Carbone E A, Filippis R D, et al. Application of support vector machine on fMRI data as biomarkers in schizophrenia diagnosis: a systematic review[J/OL].Frontiers in Psychiatry.(2020-07-23).https://doi.org/10.3389/fpsyt.2020.00588.
[3]Porta-Casteràs D, Cano M, Camprodon J A, et al. A multimetric systematic review of fMRI findings in patients with MDD receiving ECT[J].Progress in Neuro-Psychopharmacology and Biological Psychiatry,2021,108:110178.
[4]Qiao Lishan, Zhang Limei, Chen Songcan, et al. Data-driven graph construction and graph learning:a review[J].Neurocomputing,2018,312:336-351.
[5]Zhang Yu, Zhang Han, Chen Xiaobo, et al. Strength and similarity guided group-level brain functional network construction for mci diagnosis[J].Pattern Recognition,2019,88:421-430.
[6]張道強,朱旗,郝小可,等.腦影像智能分析[J].中國科學:信息科學,2018,48(5):109-122.(Zhang Daoqiang, Zhu Qi, Hao Xiaoke, et al. Intelligent analysis of brain images[J].Scientia Sinica:Informationis,2018,48(5):109-122.)
[7]Cayco-Gajic N, Joel Z, Eric S B. A moment-based maximum entropy model for fitting higher-order interactions in neural data[J].Entropy,2018,20(7):article No.489.
[8]Jie Biao, Wee C Y, Shen Dinggang, et al. Hyper-connectivity of functional networks for brain disease diagnosis[J].Medical Image Analysis,2016,32:84-100.
[9]Li Yang, Gao Xinqiang, Jie Biao, et al. Multimodal hyper-connectivity networks for MCI classification[C]//Proc of International Confe-rence on Medical Image Computing and Computer-Assisted Intervention.Berlin:Springer,2017:433-441.
[10]Zhang Zizhao, Lin Haojie, Gao Yue. Dynamic hypergraph structure learning[C]//Proc of the 27th International Joint Conference on Artificial Intelligence.2018:3162-3169.
[11]Liu Qingshan, Sun Yubao, Wang Cantian, et al. Elastic net hyper-graph learning for image clustering and semi-supervised classification[J].IEEE Trans on Image Processing,2016,26(1):452-463.
[12]Wang Meiling, Hao Xiaoke, Huang Jiashaung, et al. Discovering network phenotype between genetic risk factors and disease status via diagnosis-aligned multi-modality regression method in Alzheimer’s disease[J].Bioinformatics,2019,35(11):1948-1957.
[13]Xiao Li, Stephen J M, Wilson T W, et al. A hypergraph learning method for brain functional connectivity network construction from fMRI data[C]//Proc of Biomedical Applications in Molecular,Structural,and Functional Imaging Conference.2020.
[14]Guo Hao, Li Yao, Xu Yong, et al. Resting-state brain functional hyper-network construction based on elastic net and group LASSO methods[J].Frontiers in NeuroInformatics,2018,12:article No.25.
[15]Li Yang, Liu Jingyu, Gao Xinqiang, et al. Multimodal hyper-connectivity of functional networks using functionally-weighted LASSO for MCI classification[J].Medical Image Analysis,2019,52:80-96.
[16]Zhang Cunhui. Nearly unbiased variable selection under minimax concave penalty[J].The Annals of Statistics,2010,38(2):894-942.
[17]Zou Hui, Trevor H. Regularization and variable selection via the ela-stic net[J].Journal of the Royal Statistical Society,2005,67(2):301-320.
[18]Zhang Cuihui. Penalized linear unbiased selection,2007-003[R].New Brunswick,NJ:Rutgers University,2007.
[19]李鵬翔,葉萬洲.基于兩種非凸懲罰函數(shù)的稀疏組變量選擇[J].應用數(shù)學與計算數(shù)學學報,2018(3):437-446.(Li Pengxiang, Ye Wanzhou. Sparse group variable selection based on two non-convex penalty functions[J].Journal of Applied Mathematics and Computation,2018(3):437-446.)
[20]Fan Jiangqing, Li Runze. Variable selection via nonconcave penalized likelihood and its oracle properties[J].Journal of the American Statistical Association,2001,96(456):1348-1360.
[21]Chen Qiang, Ursini G, Romer A L, et al. Schizophrenia polygenic risk score predicts mnemonic hippocampal activity[J].Brain,2018,141(4):1218-1228.
[22]胡穎,王麗嘉,聶生東.靜息態(tài)功能磁共振成像的腦功能分區(qū)綜述[J].中國圖像圖形學報,2017,22(10):1325-1334.(Hu Ying, Wang Lijia, Nie Shengdong. Review on brain functional parcellation based on resting-state functional magnetic resonance imaging data[J].Journal of Image and Graphics,2017,22(10):1325-1334.)
[23]Arthur D, Vassilvitskii S. K-means++: the advantages of careful seeding[C]//Proc of the 18th ACM-SIAM Symposium on Discrete Algorithms.2006.
[24]Breheny P, Huang Jian. Group descent algorithms for nonconvex penalized linear and logistic regression models with grouped predictors[J].Statistics and Computing,2015,25(2):173-187.
[25]Huang Jian, Breheny P, Ma S. A selective review of group selection in high-dimensional models[J].Statistical Science: a Review Journal of the Institute of Mathematical Statistics,2012,27(4):481-499.
[26]Gallagher S R, Goldberg D S. Clustering coefficients in protein interaction hypernetworks[C]//Proc of International Conference on Bioinformatics, Computational Biology and Biomedical Informatics.2013:552-560.
[27]Zhang Binbin, Wang Liping, Wu Jun, et al. Spindle radial accuracy evaluation and fault diagnosis based on a normal distribution[C]//Proc of the 12th International Conference on Reliability,Maintainability,and Safety.Piscataway,NJ:IEEE Press,2018:307-311.
[28]Yu Wei, Liu Tiebin, Valdez R, et al. Application of support vector machine modeling for prediction of common diseases: the case of diabetes and pre-diabetes[J].BMC Medical Informatics and Decision Making,2010,10(1):1-7.
[29]Dasgupta S, Goldberg Y, Kosorok M. Feature elimination in kernel machines in moderately high dimensions[J].Annals of Statistics,2019,47:497-526.
[30]Mishra S K, Deepthi V H. Brain image classification by the combination of different wavelet transforms and support vector machine classification[J].Journal of Ambient Intelligence Humanized Computing,2020,12(6):6741-6749.
[31]李鵬,王長明,李峰,等.早發(fā)抑郁患者功能磁共振成像對下腦區(qū)靜息態(tài)自發(fā)活動與疾病嚴重程度的相關(guān)性研究[J].中國醫(yī)學裝備,2018,15(6):61-66.(Li Peng, Wang Changming, Li Feng, et al. Study on the correlation between the resting state of the lower brain area and the severity of the disease by functional magnetic resonance imaging in patients with early-onset depression[J].China Medical Equipment,2018,15(6):61-66.)
[32]Kandilarova S, Stoyanov D, Sirakov N, et al. Reduced grey matter volume in frontal and temporal areas in depression:contributions from voxel-based morphometry study[J].Acta Neuropsychiatrica,2019,31(5):252-257.
[33]康嘉慧,孔令韜.磁共振低頻振幅對青少年與成年抑郁癥患者靜息態(tài)功能變化的研究[J].中華全科醫(yī)學,2020,18(2):269-272.(Kang Jiahui, Kong Lingtao. The study of low-frequency magnetic resonance amplitude on resting state function changes in adolescents and adults with depression[J].Chinese General Practice,2020,18(2):269-272.)
[34]Cheng Bochao, Wang Xiuli, Zhou Yushan, et al. Regional cerebral activity abnormality in pregnant women with antenatal depression[J].Journal of Affective Disorders,2020,274:381-388.
[35]Lord A, Horn D, Breakspear M, et al. Changes in community structure of resting state functional connectivity in unipolar depression[J].PLoS One,2012,7(8):e41282.
[36]Suffel A, Nagels A, Steines M, et al. Feeling addressed! The neural processing of social communicative cues in patients with major depression[J].Human Brain Mapping,2020,41(13):3541-3554.
[37]李玉婷.首發(fā)未治療抑郁癥患者腦結(jié)構(gòu)和功能連接改變研究[D].南京:南京師范大學,2019.(Li Yuting. Study on the changes of brain structure and functional connection in the first untreated depression patients[D].Nanjing:Nanjing Normal University,2019.)
[38]Chen Ben, Zhong Xiaomei, Zhang Min, et al. The additive effect of late-life depression and olfactory dysfunction on the risk of dementia was mediated by hypersynchronization of the hippocampus/fusiform gyrus[J].Translational Psychiatry,2021,11(1):1-12.
[39]鄔小平,劉春英,張宏,等.靜息態(tài)磁共振下重度抑郁癥帶狀蓋腦網(wǎng)絡功能連接的研究[J].臨床醫(yī)學研究與實踐,2018,3(12):5-7.(Wu Xiaoping, Liu Chunying, Zhang Hong, et al. Study on functional connection of the banded brain network in major depression under resting state MRI [J].Clinical Medical Research and Practice,2018,3(12):5-7.)
[40]Rolls E T, Cheng W, Gilson M, et al. Effective connectivity in depression[J].Biological Psychiatry: Cognitive Neuroscience and NeuroImaging,2018,3(2):187-197.
[41]Velez D R, White B C, Motsinger A A, et al. A balanced accuracy function for epistasis modeling in imbalanced datasets using multifa-ctor dimensionality reduction[J].Genetic Epidemiology,2007,31(4):306-315.
[42]Breheny P. NCVREG: regularization paths for SCAD and MCP penali-zed regression models[EB/OL].(2021-03-30).http://cran.pau.edu.tr/web/packages/ncvreg/index.html.
[43]李瑤,趙云芃,李欣蕓,等.基于sparse group LASSO方法的腦功能超網(wǎng)絡構(gòu)建與特征融合分析[J].計算機應用,2020,40(1):62-70.(Li Yao, Zhao Yunpeng, Li Xinyun, et al. Construction of brain function hyper-network and feature fusion analysis based on sparse group LASSO method[J].Journal of Computer Applications,2020,40(1):62-70.)
[44]Palma-Mendoza R J, Rodriguez D, De-Marcos L. Distributed ReliefF based feature selection in spark[J].Knowledge and Information Systems,2018,57(1):1-20.