戴和譜,劉 剛,何妍妍
(上海電力學院 自動化工程學院,上海 200090)
基于一般線性模型的功能磁共振成像回歸量正交化
戴和譜,劉 剛*,何妍妍
(上海電力學院 自動化工程學院,上海 200090)
(*通信作者電子郵箱lukelg@gmail.com)
針對功能磁共振成像(fMRI)模型回歸量之間存在共線性的問題,提出了一種正交化的方法。首先,確定感興趣以及待正交的回歸量;其次,從待正交回歸量中減去與感興趣回歸量相關的部分,使模型中共線的回歸量正交分解為相互獨立的部分,以此來消除共線性的影響。此外,還討論和分析了正交化對一般線性模型的影響。最后,分別使用一些合成數(shù)據(jù)和當前一個流行的fMRI數(shù)據(jù)分析軟件包——腦功能磁共振圖像軟件包(FSL)進行實驗。實驗結(jié)果表明,正交化方法可以消除模型中的共線性,并且提高感興趣回歸量的顯著性,從而實現(xiàn)準確的腦功能定位,可以應用于對腦的基礎研究和臨床治療。
功能磁共振成像;共線性;一般線性模型;正交化;腦功能磁共振圖像軟件包
近年來隨著醫(yī)學影像技術的迅速發(fā)展,在磁共振成像技術基礎上發(fā)展起來的功能磁共振成像(functional Magnetic Resonance Imaging, fMRI)[1-3]技術,由于其能夠無創(chuàng)傷性地對腦功能進行準確的定位, 并且具有較好的可重復性和可行性,因此得到了廣泛的關注和研究。fMRI主要是基于核磁共振成像信號的血氧水平依賴性(Blood Oxygenation Level Dependence, BOLD)[4],通過改變局部脫氧血紅蛋白和氧合血紅蛋白的相對含量引起磁共振信號的變化,從而可以有效地檢測到大腦皮層不同功能區(qū)域的激活信息,獲得準確的空間定位,有助于對腦的基礎研究和臨床治療[5-7]。因此,對fMRI數(shù)據(jù)進行準確的分析是實現(xiàn)腦功能精確定位的基礎和前提。
常見的一種分析fMRI時間序列的方法是采用一般線性模型(General Linear Model, GLM)[8-9]。簡單地說,它是將觀測信號通過單個或者多個解釋變量的線性組合來構成的模型,這種方法給研究人員進行數(shù)據(jù)分析提供了極大的靈活性和豐富的選擇性。然而,即使在最簡單的fMRI實驗模型中,回歸量之間也往往存在一定的關聯(lián),即共線性[10]。例如在一個fMRI實驗中,反饋總是緊隨刺激2 s之后出現(xiàn),由于血流動力學反應的模糊效應,刺激和反饋的回歸量將會高度相關。這會影響后續(xù)模型中回歸量的參數(shù)估計,從而得到不確定甚至錯誤的結(jié)論。因此,消除模型回歸量的共線性成為一個亟待解決的問題。
Andrade等[11]針對fMRI數(shù)據(jù)分析中回歸模型協(xié)變量相關的問題,提出移除協(xié)變量之間冗余的部分。具體地說是從其中一個回歸量減去與之相關且乘以一個特定系數(shù)的回歸量,但是最終所得到的參數(shù)估計結(jié)果是不明確的。之后,Erdeniz等[12]針對決策變量:獎勵預測誤差(Reward Prediction Error, RPE)和獎勵結(jié)果(Reward Outcomes, RO)之間內(nèi)在的共線性問題,提出采用正交化的方法來解決。利用統(tǒng)計參數(shù)圖(Statistical Parametric Mapping, SPM)軟件自帶的正交化方法對RPE和RO信號進行正交化處理,得到它們對應的表示合成BOLD信號的腦區(qū)激活。最近, Mumford等[13]也指出正交化可以解決fMRI模型中的回歸量共線性問題,并闡述了正交化可能對一般線性模型回歸量參數(shù)估計的影響,但沒有給出具體的正交化方法,只是通過均值中心化來說明正交化的作用,這對于一些復雜的模型不太適用。此外,上述研究主要是從理論上介紹,缺乏真實的數(shù)據(jù)實驗。
基于上述研究存在的不足,本文具體提出了一種正交化方法,通過將fMRI時間序列的一般線性模型中共線的回歸量正交,消除其中一個回歸量對另一個回歸量在結(jié)果變量中的影響。當執(zhí)行正交化后,共線的部分將分配給特定的回歸量,從而提高該回歸量的顯著性,其結(jié)果也更符合真實情況。最后,本文分別采用一些合成數(shù)據(jù)和當前一個流行的fMRI數(shù)據(jù)分析軟件包——腦功能磁共振圖像軟件包(Functional magnetic resonance imaging of the brain Software Library, FSL)進行實驗,實驗結(jié)果表明,正交化可以消除一般線性模型的共線性,并提高感興趣回歸量的顯著性。
在對fMRI時間序列進行分析時,通常采用一般線性模型,它假設體素k上同一任務的時間序列或不同任務序列的實驗數(shù)據(jù)是一些未知參數(shù)βi的線性組合:
(1)
Yk=Xβk+εk
(2)
其中:Yk是數(shù)據(jù)組成的列向量;βk是未知參數(shù)組成的列向量;εk是誤差項組成的列向量。經(jīng)過這樣的轉(zhuǎn)換后,原本對Yk作統(tǒng)計分析,現(xiàn)在改為擬合出βk后,得到了許多關于的圖像,然后再對它們進行統(tǒng)計分析,腦功能激活圖實際上就是根據(jù)對參數(shù)的統(tǒng)計推斷而得到的。一般線性模型主要用來解決兩個問題:一是對模型的未知參數(shù)進行估計;二是對估計得到的參數(shù)作假設檢驗,以此來判斷回歸量的顯著性。下文對此進行具體的介紹。
1.1 模型參數(shù)的估計
建立一般線性模型的方程(2)后,通常采用最小二乘法來求解參數(shù)β的估計值。β^滿足等式:
Se=min{(Y-Xβ^)T(Y-Xβ^) }
(3)
XTXβ^=XTY
(4)
如果X滿秩,那么XTX可逆,則參數(shù)β的估計為:
β^=(XTX)-1XTY
(5)
其誤差為:
(6)
(7)
式中:Se是方程(2)最小二乘法擬合后得到的殘差;n是X的行數(shù);p是X的列數(shù),也即X的秩。
1.2 假設檢驗
(8)
其中,tn-p是自由度為n-p的t分布。例如,對于假設H:cTβ=d,可以通過式(9)計算t值或p值來檢驗。
(9)
一般顯著性檢驗的原假設形式為H0:cTβ=0。當檢驗某個變量的顯著性時,首先計算其具體觀測值的統(tǒng)計量t值,然后再通過比較選定的顯著性水平和計算得到的t值的大小來判斷是否顯著。若t>tα(n-p)(其中α為顯著性水平),則拒絕原假設,表明該變量對結(jié)果有顯著效應;若t≤tα(n-p),則接受原假設,此時β=0,表明該變量對結(jié)果沒有影響。
對于X不滿秩的情況,XTX無法直接求出,此時需要用求偽逆的方法計算,但上述方法仍然適用。
對fMRI時間序列的一般線性模型進行分析時,模型的回歸量之間往往存在一定的共線性,這會對后面的參數(shù)估計產(chǎn)生不良的影響,甚至導致出現(xiàn)錯誤的統(tǒng)計推斷。例如,如果模型中兩個解釋變量X1和X2具有共線性,那么它們中的一個變量就可以由另外一個變量表征。這時X1和X2的參數(shù)并不反映各自與結(jié)果變量之間的結(jié)構關系,而是反映它們對結(jié)果變量的共同影響,所以各自的參數(shù)已失去了原來的意義,甚至可能會表現(xiàn)出反常的現(xiàn)象,比如估計參數(shù)結(jié)果本來應該是正的,但實際結(jié)果卻是負的。其次,對于存在共線性的模型,其參數(shù)估計量方差會變大,根據(jù)式(8)計算可知其顯著性檢驗統(tǒng)計量t變小,從而檢驗接受原假設H0:cTβ=0的可能性增大,這樣會使本來影響很大的因素誤判為不顯著,使模型失去可靠性。此外,由于參數(shù)估計量的方差變大,因而對樣本值的反應十分敏感,即當樣本觀測值稍有變化時,模型參數(shù)就有很大差異,致使模型難以應用。因此,消除模型共線性對于正確理解fMRI數(shù)據(jù)參數(shù)估計的解釋有重要的影響。
圖1 正交化示意圖
通過計算推導得到規(guī)范后正交化的公式為:
(10)
對于一般線性模型,它具有這樣的一個基本性質(zhì):只有僅屬于該回歸量的部分才會影響該回歸量的參數(shù)估計值。利用維恩圖表示上述正交化的過程,如圖2所示。兩個共線的回歸量X1和X2,當檢驗模型回歸量的顯著性時,僅屬于X1的部分決定估計參數(shù)β1,僅屬于X2的部分決定估計參數(shù)β2。當把X2關于X1正交化后,X1和X2之間共享的部分全部分配給X1,此時等效于處理兩個獨立的部分X1和X2,如圖2(c)所示,對于X2來說,正交化前后模型僅屬于X2的部分是相同的,因此其參數(shù)估計值不變,而對于X1,由于正交化后X1和X2之間共享的部分全部分配給X1,即屬于X1的部分發(fā)生變化,其參數(shù)估計值也會隨之改變。
圖2 正交化維恩示意圖
實驗環(huán)境設置如下:電腦選用i5- 4460,3.2GHz處理器,12GB內(nèi)存,Linux發(fā)行版CentOS6.5系統(tǒng),編程語言為Matlab。為了驗證本文提出的正交化方法的有效性,分別采用合成數(shù)據(jù)以及真實數(shù)據(jù)來進行實驗。
4.1 合成數(shù)據(jù)
合成數(shù)據(jù)主要通過建模一個刺激過程和主體的反應來驗證正交化的作用。由于刺激和響應這兩個事件發(fā)生得極為相近,因此一般線性模型中刺激和響應的回歸量將會高度相關。
圖3所示為一個共線性的例子(縱坐標僅表示數(shù)值大小,無量綱單位),根據(jù)第一章假設檢驗相關理論知識,分別計算出模型的檢驗統(tǒng)計量t值,如表1所示。其中帶三角形的實線表示刺激,帶正方形的實線表示模擬主體刺激2s后的響應。圖3(a)為創(chuàng)建的合成BOLD信號,它包含刺激和響應相關的效應。將圖3(a)中的刺激和響應分別與血流動力學響應函數(shù)進行卷積,得到卷積后的信號曲線,如圖3(b)所示。從圖3(b)中可以看出,刺激和響應之間存在嚴重的共線性。因此盡管信號與刺激和響應都相關,但根據(jù)表1可知,實際上只有刺激的檢驗統(tǒng)計量t值顯著,這顯然是不符合真實情況的。
回歸量原始(Original)正交化刺激量(Stim⊥Resp)正交化響應量(Resp⊥Stim)單獨測刺激量(Stim)單獨測響應量(Resp)刺激量(Stim)4.314.319.689.46—響應量(Resp)2.408.992.40—8.29
當對信號中的響應量感興趣時,就要消除刺激量的共線性影響,如圖3(c)所示,它表示刺激量與響應量正交后的圖形。由于只是對刺激量進行正交化,響應量的曲線沒有變化,它的解釋也不發(fā)生改變,但是顯然刺激量曲線和響應量不再相關。此外,由表1可以看出,正交后響應量的統(tǒng)計量t值增大,而刺激量的t值保持不變,究其原因主要是正交后,兩個共線回歸量之間共享的部分已經(jīng)全部分配給響應量,其單獨表示信號的部分較正交之前增多,而對于刺激量,由于正交化前后僅屬于刺激量的部分不變,其統(tǒng)計量t值也保持不變,但此時它的解釋發(fā)生改變。
圖3(d)表示與圖3(c)相同的情況,僅僅只改變刺激量和響應量正交的順序,即將響應量關于刺激量正交,此時刺激量的檢驗統(tǒng)計量t增大,而響應量則不變。此外,由表1可知,正交化后刺激和響應回歸量的顯著性t值與單獨檢驗其中一種回歸量顯著性t值基本相同,說明正交化后的結(jié)果更加符合真實情況。
4.2 真實數(shù)據(jù)
實驗數(shù)據(jù)由SiemensTrioTim3.0T磁共振機器掃描獲得,采用標準正交頭線圈,先進行常規(guī)掃描,掃描序列包括T1加權像(T1WeightedImaging,T1WI)、T2加權像(T2WeightedImaging,T2WI)、磁共振血管造影(MagneticResonanceAngiography,MRA)、解剖像(對腦組織的容積掃描,層數(shù)為160,層厚度lmm)。功能序列采用平面回波掃描序列,基本的掃描參數(shù)有:TR(Repetition Time)為重復時間;TE(Echo Time)為回波時間;Slices為層數(shù);FOV(Field Of View)為掃描視野,根據(jù)需要掃描的范圍確定其值。相應掃描的具體參數(shù)取值為:TR=2 000 ms,TE=50 ms,Slices=35,F(xiàn)OV為280 mm×280 mm,這些都是自下而上間隔掃描。功能掃描分為靜息、左手指運動、右手指運動三部分完成。首先進行靜息掃描,掃描過程中受試者平躺于掃描床上,不做任何任務,閉眼休息。之后為運動掃描,運動任務為左、右手指運動,實驗范式采用組塊(Block)設計,為靜息—左手指運動—右手指運—靜息—左手指運動—右手指運動,每個Block持續(xù)80s,一共4個Block。在掃描的過程中,受試者閉上雙眼,肘部伸直,雙手平放于掃描臺上,配合操作者的口令完成靜息—運動交替的過程,整個掃描過程中受試者頭部保持不動。
FSL[14-15](http://fsl.fmrib.ox.ac.uk/fsl/fslwiki/)是一種常見的處理fMRI數(shù)據(jù)的軟件,它能夠允許用戶指定回歸量進行正交化。利用FSL對采集的圖像進行處理,經(jīng)過一系列的頭動校正、與標準模板配準、標準化、高斯平滑等預處理過程以及統(tǒng)計分析后,最終得到與左、右手指運動對應的腦激活區(qū)域。由于左、右手指運動任務彼此之間存在一定的相關性,因此,當檢測左手指運動任務的腦激活區(qū)域時,將右手指運動任務關于其進行正交化;同理,檢測右手指運動的腦激活區(qū)域時,則將左手指運動任務與其正交,然后再分別與之前未作正交化的結(jié)果進行對比分析。
左、右手指運動任務及分別正交化后的實驗結(jié)果如圖4~6所示,表2~4分別為對應圖4~6左、右手指運動任務主要激活區(qū)域的定位。
圖4 左手指運動任務和右手指運動任務腦激活圖
圖5 左手指運動任務關于右手指運動任務正交化后腦激活圖
圖6 右手指運動任務關于左手指運動任務正交化后腦激活圖
根據(jù)實驗結(jié)果圖4可知,左手指運動任務激活區(qū)域主要對應大腦的右半部分,右手指運動激活區(qū)域主要對應大腦的左半部分。在實驗過程中,左、右手指運動任務之間相互影響,當只對其中一種任務的激活區(qū)域感興趣時,就需要消除另一種任務對它的影響,即通過正交化來消除二者之間的相關性。圖5、6中的黑色圓圈部分分別表示執(zhí)行正交化后與未做正交化腦激活區(qū)域的不同。從表2~3可以看出,將左手指運動任務關于右手指運動任務正交化后,右手指運動的激活區(qū)域與之前相比發(fā)生變化,激活體素數(shù)增多,而左手指運動的激活體素數(shù)保持不變。這是因為經(jīng)過正交化后,左、右手指運動任務變成兩個獨立的回歸量,原來由左、右手指運動共同表示的激活區(qū)域現(xiàn)在全部由右手指運動表示。雖然左手指運動回歸量的估計參數(shù)保持不變,但它現(xiàn)在表示減去兩者共線之后的部分,其解釋發(fā)生改變。
同樣地根據(jù)表2、4可以知道,當檢驗右手指運動激活的區(qū)域時,改變回歸量正交化的順序,此時左手指運動的激活體素數(shù)發(fā)生變化,而右手指運動的激活體素數(shù)保持不變。正交化只是改變其中一個任務回歸量的參數(shù)估計,而對另一個回歸量的參數(shù)估計沒有影響,但值得注意的是,此時模型中該回歸量的參數(shù)解釋發(fā)生改變。
表2 左手指運動任務和右手指運動任務
表3 左手指運動任務關于右手指運動任務正交化
表4 右手指運動任務關于左手指運動任務正交化
共線性的出現(xiàn)會降低基于功能磁共振成像的一般線性模型結(jié)果的效力,甚至產(chǎn)生不可靠的參數(shù)估計。實驗結(jié)果和數(shù)據(jù)分析表明,本文提出的正交化方法能夠有效地消除共線性的影響,得到更加準確的結(jié)果。通過正交分解共線的回歸量,并把它們之間共享的部分分配給感興趣的回歸量,從而提高該回歸量的顯著性。然而,本文研究中還存在一些需要進一步深入探討的地方,譬如正交化的順序會影響顯著性檢驗的結(jié)果,因此,對于兩個以上的回歸量如何采取合適的方法消除共線性等需進一步研究。
)
[1]RAICHLEME.Abriefhistoryofhumanbrainmapping[J].TrendsinNeurosciences, 2009, 32(2): 118-126.
[2]BANDETTINIPA.What’snewinneuroimagingmethods? [J].AnnalsoftheNewYorkAcademyofSciences, 2009, 1156: 260-293.
[3]VANEIJSDENP,HYDERF,ROTHMANDL,etal.Neurophysiologyoffunctionalimaging[J].Neuroimage, 2009, 45(4): 1047-1054.
[4]KIMSG,OGAWAS.Biophysicalandphysiologicaloriginsofbloodoxygenationlevel-dependentfMRIsignals[J].JournalofCerebralBloodFlow&Metabolism, 2012, 32(7): 1188-1206.
[5] 蘇春秋,邱小紅,馬蔚吟,等.腦功能磁共振成像原理及其在神經(jīng)外科學中的應用[J].中國醫(yī)學裝備,2015,12(3):57-60.(SUCQ,QIUXH,MAWY,etal.Researchontheprinciplesoffunctionalmagneticresonanceimaginganditsapplicationintheneurosurgery[J].ChinaMedicalEquipment, 2015, 12(3): 57-60.)
[6] 麥筱莉,儲成鳳.手運動相關腦功能皮層功能磁共振成像原理及臨床應用[J].中國醫(yī)學影像技術,2004,20(2):294-297.(MAIXL,CHUCF.Handmotionrelatedcerebralcortex:basisandclinicalapplicationoffunctionalMRI[J].ChineseJournalofMedicalImagingTechnology, 2004, 20(2): 294-297.)[7] WAGER T D, ATLAS L Y, LINDQUIST M A, et al. An fMRI-based neurologic signature of physical pain [J]. New England Journal of Medicine, 2013, 368(15): 1388-1397.
[8] FRISTON K J, HOLMES A P, WORSLEY K J, et al. Statistical parametric maps in functional imaging: a general linear approach [J]. Human Brain Mapping, 1994, 2(4):189-210.
[9] POLDRACK R A, MUMFORD J A, NICHOLS T E. Handbook of Functional MRI Data Analysis [M]. Cambridge: Cambridge University Press, 2011: 191-200.
[10] 魯茂,賀昌政.對多重共線性問題的探討[J].統(tǒng)計與決策,2007(8):6-9.(LU M, HE C Z. Discussion on the problem of multicollinearity [J]. Statistics and Decision, 2007(8): 6-9.)
[11] ANDRADE A, PARADIS A L, ROUQUETTE S, et al. Ambiguous results in functional neuroimaging data analysis due to covariate correlation [J]. Neuroimage, 1999, 10(4): 483-486.
[12] ERDENIZ B, ROHE T, DONE J, et al. A simple solution for model comparison in bold imaging: the special case of reward prediction error and reward outcomes [J]. Frontiers in Neuroscience, 2013, 7: Article 116.
[13] MUMFORD J A, POLINE J B, POLDRACK R A. Orthogonalization of regressors in fMRI models [J]. PloS One, 2015, 10(4): e0126255.
[14] JENKINSON M, BECKMANN C F, BEHRENS T E, et al. FSL [J]. Neuroimage, 2012, 62(2): 782-790.
[15] SMITH S, BANNISTER P R, BECKMANN C, et al. FSL: new tools for functional and structural brain image analysis [J]. Neuroimage, 2001, 13(6): 249.
This work is partially supported by the National Natural Science Foundation of China (61203224), the Innovation Program of Shanghai Municipal Education Commission (13YZ101).
DAI Hepu, born in 1989, M. S. candidate. His research interests include medical image processing.
LIU Gang, born in 1977, Ph. D., professor. His research interests include image segmentation and image registration, pattern recognition, machine learning.
HE Yanyan, born in 1992, M. S. candidate. Her research interests include medical image processing.
Orthogonalization of regressors in functional magnetic resonance imaging based on general linear model
DAI Hepu, LIU Gang*, HE Yanyan
(CollegeofAutomationEngineering,ShanghaiUniversityofElectricPower,Shanghai200090,China)
Concerning the collinearity problem between the regressors in functional Magnetic Resonance Imaging (fMRI) model, a method of orthogonalization was proposed. Firstly, the regressors of interest and the regressors to be orthogonalized were determined. Then, the related part with regressos of interest was removed from the regressors to be orthogonalized, and the collinear regressors of the model were orthogonally decomposed into independent parts to eliminate the effect of collinearity. The influence of orthogonalization on General Linear Model (GLM) was also discussed and analysed. Finally, the experiments were carried out through some synthetic data and a current popular fMRI data analysis software package — Functional magnetic resonance imaging of the brain Software Library (FSL).The experimental results show that, the method of orthogonalization can eliminate the collinearity in the model and improve the significance of the regressors of interest to achieve accurate brain functional localization. The proposed method of orthogonalization can be used for the basic research and clinical treatment of brain.
functional Magnetic Resonance Imaging (fMRI); collinearity; General Linear Model (GLM); orthogonalization; Functional magnetic resonance imaging of the brain Software Library (FSL)
2016- 11- 25;
2016- 12- 23。
國家自然科學基金資助項目(61203224);上海市教委科技創(chuàng)新項目(13YZ101)。
戴和譜(1989—),男,湖北黃岡人,碩士研究生,主要研究方向:醫(yī)學圖像處理; 劉剛(1977—),男,山東聊城人,教授,博士,主要研究方向:圖像配準與分割、模式識別、機器學習; 何妍妍(1992—),女,浙江義烏人,碩士研究生,主要研究方向:醫(yī)學圖像處理。
1001- 9081(2017)06- 1793- 05
10.11772/j.issn.1001- 9081.2017.06.1793
TP391.4
A