曹敏娜,陳俊杰,郭 浩
(太原理工大學 計算機科學與技術學院,山西 晉中 030600)
為了輔助抑郁癥的臨床診斷,通過使用腦網絡對功能磁共振成像(functional magnetic resonance imaging,fMRI)得到的影像數(shù)據進行處理并分類作為其中一種診斷方式被廣泛使用?,F(xiàn)有對腦網絡中節(jié)點的定義,包括神經元、神經元集群、腦區(qū)[1]等不同粒度。使用的節(jié)點粒度不同會得到不同尺度的腦網絡,進而影響最后的分類診斷結果。然而現(xiàn)有研究中,將抑郁癥影像數(shù)據結合復雜網絡的知識處理為腦網絡數(shù)據的過程,往往是在單一大規(guī)模腦網絡的空間尺度下進行的[2-4];Jiaolong Qin等[5]雖然細分了腦區(qū),但并沒有將空間尺度作為重點進行分類比較;少數(shù)使用了多尺度腦網絡來分類對比的研究,也沒有探索抑郁癥[6-8]。
針對先前的臨床分類研究中對腦網絡空間尺度劃分上考慮的不足,本文從多個腦網絡空間尺度的角度入手,對腦網絡局部特征的抑郁癥分類進行了研究。根據預定義腦圖譜將抑郁癥患者的靜息態(tài)磁共振影像數(shù)據處理為不同空間尺度下的腦網絡數(shù)據,使用統(tǒng)計分析對不同尺度網絡下的局部屬性進行特征選擇,采取支持向量機(support vector machine,SVM)方法來實現(xiàn)分類,進一步分析分類結果來判斷腦網絡的空間尺度對使用腦網絡特征進行抑郁癥分類診斷的影響。
本次研究總共收集被試66名,包括無用藥首發(fā)的抑郁癥患者38名,以及對照組中年齡與性別匹配的28名健康人。被試都是具有中國國籍的漢族人,抑郁組被試全部由山西醫(yī)科大第一附屬醫(yī)院精神科確診,并且為美國精神障礙診斷與統(tǒng)計學手冊第四版(DSM-IV)和24項漢密爾頓抑郁量表(hamilton depressive rating scale,HAMD)為依據評定的重度抑郁癥患者,無神經紊亂史。把人格障礙的定式訪談(SCID-II)作為健康組被試的判定依據,該組被試亦無神經紊亂史。實驗采用嚴格的標準排除其它疾病及異常情況,并與每位被試均達成了書面協(xié)議。被試信息見表1。
表1 被試基本信息
表1使用最小數(shù)值-最大數(shù)值(平均數(shù)±標準差)的數(shù)據形式表示年齡范圍,HAMD是漢密爾頓24項抑郁表的英文縮寫。帶有上標a的P值由雙尾雙樣本的T檢驗的方式獲取,帶有上標b的P值是通過雙尾皮爾遜卡方檢驗的方式獲取。
本文中的數(shù)據采集工作是和山西醫(yī)科大學第一醫(yī)院共同完成的,并由具有豐富磁共振掃描經驗的放射科醫(yī)生對所有被試的腦部進行掃描。靜息態(tài)功能核磁共振的腦部掃描任務全是使用德國強度為3T的核磁共振掃描設備(siemens trio 3-tesla scanner, erlangen, germany)操作的。過程中,為了防止被試主觀進行頭部運動,采取海綿固定頭部,以減少垃圾數(shù)據。靜息態(tài)的限定則需要參與者在掃描全過程閉眼放松,要求大腦不進行思考活動的同時又不能進入睡眠。還需要對設備的掃描參數(shù)進行以下配置:
射頻重復時間(repetition time,TR)為2 s,存儲矩陣為64*64,回波時間(echo time,TE)為30 ms,層間間隔(slice gap)為0,層厚(slice thickness)為4.0 mm,成像視野(field of view,F(xiàn)OV)為192*192 mm。
研究中的數(shù)據預處理是通過MATLAB平臺的SPM(statistical parametric mapping) 工具對采到的圖像進行時間層校正、頭動校正、聯(lián)合配準、空間標準化、低頻濾波。
腦網絡是使用圖論的知識構建的,定義與屬性與圖論中的理論相統(tǒng)一。針對每個被試構建腦網絡,涉及網絡中節(jié)點和邊的定義。
便于研究,節(jié)點的定義多根據某一預定義模板進行,常用的是AAL(automated anatomical labeling)腦圖譜。首先根據AAL模板對腦部影像區(qū)域進行分割,共劃分出90個腦區(qū)(包括左半腦45個區(qū)域和右半腦對應的45個區(qū)域)。每個腦區(qū)定義為腦網絡中的一個節(jié)點,各節(jié)點的值是通過計算各腦區(qū)全部體素的血氧含量濃度時間序列的算術平均值得到的,以此完成90個節(jié)點的定義。
節(jié)點的規(guī)模會決定空間尺度的大小,腦網絡中節(jié)點規(guī)模定義的越大,即空間尺度越大,整個腦網絡中的節(jié)點個數(shù)就越少。本文定義了5個不同尺度的節(jié)點個數(shù),分別是90、256、497、1003、1501[1]。90個節(jié)點對應90的尺度,對于256,497,1003,1501這4個不同小尺度的節(jié)點定義,是基于AAL模板的獨立腦區(qū)進一步劃分得到的。具體方法為:
設置預期節(jié)點定義數(shù)為250、500、1000、1500,按AAL模板中每個腦區(qū)占所有腦區(qū)的體素比例計算得到AAL原有腦區(qū)在相應的小尺度下應細分的子區(qū)域個數(shù)。使用動態(tài)隨機種子點[1]的設置方法形成子區(qū)域,即對每個子區(qū)域隨機設置種子體素,對所有剩余體素與種子體素的距離進行順序計算,接下來需要選出和目前體素最近距離的體素,并把該體素和種子體素進行合并,組成一個新的子區(qū)域,該新子區(qū)域內含此新體素。接下來計算得出此新子區(qū)域的物理中心位置,把該點設置成新的種子體素,然后計算得到各體素和新種子體素間距。重復循環(huán)此過程,一直到此區(qū)域中全部的無歸屬體素被劃至其中。至全部AAL獨立腦區(qū)劃分完畢就可以得出一個小的尺度。由于子區(qū)域個數(shù)不是整數(shù),故四舍五入,最后得到256、497、1003、1501這4個節(jié)點個數(shù)對應的空間尺度。
2.2.1 皮爾遜相關
本文使用皮爾遜相關(Pearson correlation)計算得到兩個腦區(qū)之間的無向功能連接。皮爾遜相關系數(shù)用于計算兩個變量間的線性相關,針對5個不同節(jié)點規(guī)模的空間尺度,分別計算該尺度下腦區(qū)平均時間序列兩兩之間的皮爾遜相關系數(shù),得到不同尺度下的相關系數(shù)矩陣,即加權腦網絡。該系數(shù)矩陣為對稱方陣,階數(shù)分別為90,256,497,1003,1501。皮爾遜相關系數(shù)計算方式如下
(1)
2.2.2 閾值選擇
為便于分析與計算,設置閾值將網絡轉化為二值網絡,即把不同尺度下關聯(lián)矩陣中的權值轉化為無權二值鄰接矩陣中的值。若關聯(lián)矩陣中的元素值rij大于該閾值,則元素值設為1,表示節(jié)點i與節(jié)點j之間有邊,否則設為0,表示節(jié)點i與節(jié)點j間無邊。
由于閾值的大小會影響腦網絡中連接的密度,本文使用稀疏度來進行閾值選擇。稀疏度描述的是在當前腦網絡中存在邊的數(shù)目與該腦網絡對應的完全圖中全部邊的數(shù)目的比值。當稀疏度的值大于0.5時,腦網絡會變?yōu)殡S機網絡[1]。故為了得到有小世界屬性的腦網絡,設置稀疏度范圍為0.05到0.4,以0.05為步長,以此對于每個被試得到8個不同稀疏度下的二值網絡。
本文針對不同尺度下的二值網絡,計算網絡中常見的3個局部屬性作為分類的特征,分別為度,中間中心度,節(jié)點效率[9]。
二值網絡里一個節(jié)點的度是與此節(jié)點能通過一條線直連的節(jié)點個數(shù),衡量此節(jié)點和網絡中剩余節(jié)點的連通性。網絡中節(jié)點i的度k(i)定義[9]為
(2)
式中:aij為二值網絡對應的二值矩陣中第i行第j列元素,表示i節(jié)點與j節(jié)點之間的邊。
一個節(jié)點中間中心度的值越大,此節(jié)點越處在中心位置,其對于網絡中其余節(jié)點間傳遞的消息會產生關鍵影響。在二值網絡中,節(jié)點i的中間中心度bi定義[9]為
(3)
網絡中,節(jié)點m到達n有許多途徑,上式中σmn是這許多途徑里的最短路徑條數(shù),σmn(i)是m到n中的最短路徑會經過某節(jié)點i的路徑條數(shù)。
節(jié)點效率衡量了節(jié)點和網絡中其它節(jié)點間的信息傳遞能力,二值網絡中任一節(jié)點i的節(jié)點效率ei可描述[9]為
(4)
式中:N表示腦網絡中總的節(jié)點數(shù)量,dij代表節(jié)點i距離j的最短路徑長度。對于二值網絡,最短路徑長度等于兩節(jié)點間各不同途徑里距離最短的一條中所含元素1的個數(shù)。
由于不同尺度下每個被試有8個不同稀疏度的二值網絡,故不同尺度網絡的每個局部屬性可以得到8個稀疏度下的值。為了衡量網絡的局部屬性在不同稀疏度下總的變化強度[9],使用AUC值來將不同稀疏度下的各局部屬性值進行統(tǒng)一。對于每一個被試,90空間尺度下得到270個AUC值(一個節(jié)點對應一個屬性的AUC值,則90個節(jié)點90個局部屬性,3個局部屬性即270個),同理,256尺度得到768個AUC值,497尺度得到1491個AUC值,1003尺度得到3009個AUC值,1501尺度得到4503個AUC值。
AUC的計算方式如下
(5)
其中,YAUC表示AUC值,Y(Sk)是閾值Sk對應的局部屬性值,ΔS是兩個閾值之間的間隔。
本文使用特征選擇的傳統(tǒng)方法統(tǒng)計分析對3種局部屬性進行特征選擇,然后使用SVM對正常組被試和抑郁癥患者進行分類。
為從特征全集中找到最優(yōu)特征子集,進一步防止過度擬合現(xiàn)象發(fā)生、優(yōu)化模型性能、高效訓練分類器[10],分類開始前做特征選擇是很有必要的。特征選擇有很多種方法,本文采用特征選擇方法之一的過濾方法,并選取其中最常見的統(tǒng)計分析法[11]進行特征選擇。對兩組被試的所有AUC值做雙樣本T檢驗,選取具有統(tǒng)計顯著性(即P<0.05)的AUC值作為有效特征。
在眾多分類算法中,SVM在解決小樣本二分類、非線性及高維模式識別,特別是在fMRI數(shù)據分析中很有優(yōu)勢[9],并得到了廣泛的應用[2,6,7]。本文通過MATLAB平臺下導入臺灣大學林智仁博士等開發(fā)的LIBSVM工具包來用SVM完成分類。訓練分類器時,使用徑向基核函數(shù)(radial basis function,RBF)進行10次10折交叉驗證。對于其中每一次的分類,決策函數(shù)中懲罰因子與核參數(shù)的參數(shù)尋優(yōu)使用基于網格的搜索算法來實現(xiàn)[12]。
為了確定有效特征數(shù)量對最終的分類結果是否有影響,驗證腦網絡空間尺度、有效特征數(shù)與分類結果三者之間的關系,設計在有效特征數(shù)量不變的情況下,比較不同尺度腦網絡的分類結果。具體實驗從各個小尺度腦網絡的有效特征中隨機抽取與大尺度腦網絡有效特征相同數(shù)量的特征,隨機抽取10次,對每次抽取出的特征進行分類,每次的分類都進行10次10折交叉驗證,得到每個小尺度下相應特征數(shù)的平均分類準確率后,比較不同尺度下相同數(shù)量的特征分類后的準確率。
在特征選擇后,具有統(tǒng)計顯著性的特征在90空間尺度下有16個(270個AUC值中選出16個),256尺度下有48個,497尺度下有95個,1003尺度下有186個,1501尺度下有240個。不同尺度與局部屬性對應的特征數(shù)如圖1所示。
圖1 各尺度下不同局部屬性的有效特征數(shù)
從圖1中可以看出,特征選擇得到的每個局部屬性的特征數(shù)隨腦網絡空間尺度減小而增長,總的有效特征數(shù)也隨之增長,即不同的空間尺度能影響特征選擇得到的有效特征數(shù)量。
對每個尺度的兩組被試使用特征選擇后得到的有效特征進行分類,分類結果如圖2所示。
圖2 不同尺度下有效特征的分類結果
從圖2中可以看出,伴隨腦網絡空間尺度減小,分類效果明顯上升,結合圖1對空間尺度與有效特征數(shù)的分析結果,可以推論不同的空間尺度是通過影響有效特征數(shù)量而影響最后分類結果的。由于90的節(jié)點數(shù)為傳統(tǒng)用AAL模板分割腦區(qū)的方法,故本實驗結果表明細分AAL模板中腦區(qū)得到小空間尺度的分類準確率顯然優(yōu)于傳統(tǒng)根據AAL模板分割腦區(qū)方法的分類。
對90尺度下對應的有效特征數(shù)的值16,實驗中分別從較小尺度256對應的48個有效特征,以及尺度497對應的95個、1003對應的186個、1501對應的240個有效特征里邊隨機抽取和尺度90對應有效特征數(shù)值(即16)相同的特征數(shù)量,每個較小的尺度都隨機抽取10次并對這些有效特征訓練分類并比較結果[13]。用這種方法,對256尺度下對應的有效特征數(shù)值48,分別從比256尺度小的尺度497的有效特征里隨機抽48個分類,尺度1003的有效特征里亦隨機抽48個分類,尺度1501的有效特征里也隨機抽48個分類,得出分類結果后將三者與圖2中初始256尺度下48個有效特征的分類結果相互比較;對497對應的數(shù)95,從比其相對小的尺度1003、尺度1501分別對應的不同數(shù)量有效特征里邊都隨機抽95個訓練分類、比較結果;對1003對應的數(shù)186,從比其相對小的尺度1501對應的有效特征里邊隨機抽186個訓練分類、比較結果[13]。每個尺度都選擇比其相對小的尺度比較,在對各尺度下數(shù)目一樣的特征分類后,其分類準確率如圖3所示。
圖3 各有效特征數(shù)下不同尺度的分類準確率注:每個尺度下的準確率為當前尺度下隨機抽取10次特征后的平均值
通過對圖3的分析能夠看出在相同特征數(shù)量的維度下,分類準確率基本不受腦網絡的空間尺度變化的影響,并且準確率的值與5.2節(jié)中相應尺度下的初始分類結果的值相似。此處特征數(shù)指的是有效特征,顯然,只有增加有效特征數(shù),才能提升分類效果,說明分類準確率的提升本質上是由有效特征數(shù)的遞增帶來的。綜合對圖1關于空間尺度與有效特征數(shù)間關系和圖2關于空間尺度與分類準確率間關系的分析,更加體現(xiàn)出隨腦網絡的空間尺度縮小而引發(fā)的有效特征數(shù)量增多,是導致最終分類準確率變化的根本原因,闡明了腦網絡空間尺度對分類結果的影響因素。
本文針對先前研究中對于空間尺度劃分方面考慮的不足,用分類的方法來分析空間尺度對于使用腦網絡分析精神疾病的研究?;趥鹘y(tǒng)AAL模板,將AAL模板對應的腦區(qū)繼續(xù)拆分,以小尺度構建腦網絡,分類比較。本次研究的實驗結果表明,和傳統(tǒng)AAL模板定義的節(jié)點相比,細分后的腦區(qū)節(jié)點對于分類結果有明顯提升;在特征選擇方面,特征選擇后的有效特征數(shù)隨空間尺度的減小而增加,而有效特征數(shù)的增加會提升分類準確率,進一步說明空間尺度在使用腦網絡屬性進行分類研究中的重要性,也為以后使用腦網絡對精神疾病進行分類診斷提供了新思路。然而,空間尺度是否越小越好?分類準確率提升的同時,可能引起其它方面的變化還有待進一步研究。