董珊,曾衛(wèi)明,石玉虎
(上海海事大學(xué)信息工程學(xué)院,上海 201306)
最近,Eklund等人研究發(fā)現(xiàn),過去最常用的fMRI軟件SPM、FSL和AFNI存在重大瑕疵,導(dǎo)致誤報(bào)率高達(dá)70%,可能造成約有4萬份論文的研究成果存在疑慮[1]。這其實(shí)涉及到一直存在于統(tǒng)計(jì)學(xué)中的問題,即顯著性檢驗(yàn)中多重校正問題[2]。假設(shè)全腦由10萬個(gè)體素組成,為了得到與某個(gè)認(rèn)知功能相關(guān)的腦區(qū)定位,通常要對(duì)每一個(gè)體素進(jìn)行一次統(tǒng)計(jì)分析,按p=0.05計(jì)算,但這可能會(huì)得到5000個(gè)假陽(yáng)性的體素,從而出現(xiàn)統(tǒng)計(jì)學(xué)上的多重校正問題。
在以往的研究中,一般使用參數(shù)統(tǒng)計(jì)方法,例如Bonferroni校正[3]、FDR校正[4]以及隨機(jī)場(chǎng)理論。例如SPM基于高斯隨機(jī)場(chǎng)理論,假設(shè)數(shù)據(jù)在空間變異上有著確定的模式,統(tǒng)計(jì)量的分布可以用平滑后的隨機(jī)場(chǎng)來模擬[5]。通過計(jì)算真實(shí)的統(tǒng)計(jì)圖的平滑度,估計(jì)腦內(nèi)體素(或團(tuán)塊)在特定的統(tǒng)計(jì)水平下隨機(jī)產(chǎn)生的可能性。而Eklund等研究表明,如果數(shù)據(jù)不符合高斯隨機(jī)場(chǎng)理論的潛在假設(shè),即fMRI信號(hào)的空間平滑在大腦中一致,或者空間自相關(guān)函數(shù)符合特定曲線(二次指數(shù)),則非參數(shù)檢驗(yàn)方法比傳統(tǒng)的參數(shù)檢驗(yàn)方法更可靠[1]。這意味著非參數(shù)檢驗(yàn)方法在fMRI上關(guān)于減少假陽(yáng)性率方面具有重要的研究意義。
由Nochols Holmes等提出的一種非參數(shù)檢驗(yàn)方法——置換檢驗(yàn)[6],可以較為有效地控制假陽(yáng)性錯(cuò)誤率。該方法主要優(yōu)點(diǎn)是檢驗(yàn)對(duì)數(shù)據(jù)本身的特征并不需要前提假設(shè)。置換檢驗(yàn)對(duì)設(shè)計(jì)矩陣中的變量進(jìn)行多次隨機(jī)分配,例如將某個(gè)刺激條件和控制條件對(duì)調(diào),對(duì)照分組之間進(jìn)行對(duì)調(diào)。每次都將得到一張全腦偽彩色圖,該圖中存在一個(gè)最強(qiáng)點(diǎn)值(每個(gè)體素的顯著性不同,顏色代表強(qiáng)弱)。再提取每次隨機(jī)分配后得到的最強(qiáng)點(diǎn)值,得到一個(gè)分布直方圖,稱之為Pmax。通過Pmax即可判斷真實(shí)情況下每個(gè)體素的顯著性。若某體素的統(tǒng)計(jì)值不低于其余95%體素的值,則認(rèn)為它經(jīng)過校正體現(xiàn)為激活狀態(tài)。
Bootstrap檢驗(yàn)也是比較流行的一種非參數(shù)檢驗(yàn)方法,但在fMRI領(lǐng)域中研究較少。在統(tǒng)計(jì)學(xué)中,Bootstrap檢驗(yàn)是從給定訓(xùn)練集中有放回的均勻抽樣。每當(dāng)選中一個(gè)樣本,它等可能地被再次選中并被添加到訓(xùn)練集中。在以往的研究中,如利用Bootstrap處理fMRI數(shù)據(jù)GLM模型中參數(shù)假設(shè)錯(cuò)誤[7],cluster水平顯著性檢測(cè)[8],fMRI組分析腦圖敏感性分析[9]等均是利用Bootstrap本身的特點(diǎn),以此來解決fMRI上出現(xiàn)的統(tǒng)計(jì)學(xué)問題。但遺憾的是,并沒有研究利用Bootstrap提出一種新的非參數(shù)方法應(yīng)用于fMRI研究。本文將基于Bootstrap檢驗(yàn)提出一種新的非參數(shù)體素激活檢測(cè)方法,研究表明,該方法能盡可能地減少體素假陽(yáng)性率。
本文采用Geraint Rees實(shí)驗(yàn)室采集的聽覺數(shù)據(jù)[10],為Block Design任務(wù)態(tài)數(shù)據(jù),block為6次掃描,共由16組block組成。實(shí)驗(yàn)條件從休息狀態(tài)開始,采用休息和聽覺刺激連續(xù)交替,每分鐘呈現(xiàn)60次雙音節(jié)。功能數(shù)據(jù)從圖像4開始采集,且由于T1效應(yīng),將丟棄前幾次掃描這些全腦BOLD/EPI圖像是在修改后的2T西門子MAGNETOM視覺系統(tǒng)上采集的。每次采集由64個(gè)連續(xù)切片組成,掃描分辨率為64×64,片內(nèi)分辨率為3mm×3mm。采集時(shí)間為6.05s,掃描重復(fù)時(shí)間(RT)為7s。
fMRI數(shù)據(jù)具有一定的時(shí)間相關(guān)性,因此實(shí)驗(yàn)將參考數(shù)據(jù)掃描間隔時(shí)間設(shè)定為7秒,以6次掃描為一個(gè)block,以此來確定抽樣時(shí)間間隔,并分為聽覺刺激態(tài)和休息態(tài)。對(duì)一個(gè)體素而言,刺激態(tài)和休息態(tài)體素值存在差異(如圖1),該差異將于最后的激活圖中顯現(xiàn)。
圖1 單個(gè)體素BODL信號(hào)圖,包括休息(A),激活(B)
根據(jù)單個(gè)體素激活圖像特征,刺激態(tài)和根據(jù)單個(gè)體素激活圖特征,刺激態(tài)和休息態(tài)有明顯的BODL信號(hào)差異。理論上來說,一個(gè)體素存在3種情況:(1)該體素在所有抽樣樣本均體現(xiàn)激活狀態(tài);(2)該體素在部分樣本出現(xiàn)激活狀態(tài)(3)該體素在所有抽樣樣本均不體現(xiàn)激活狀態(tài)。設(shè)定閾值,若某一體素出現(xiàn)激活狀態(tài)的頻率大于閾值,則認(rèn)為該體素處于激活狀態(tài),從而減少假陽(yáng)性發(fā)生率。將閾值設(shè)為(1-p)即某體素激活狀態(tài)頻率超過(1-p),則認(rèn)為該體素處于激活狀態(tài)。實(shí)驗(yàn)步驟如下:
(1)將休息態(tài)和刺激態(tài)進(jìn)行分組 A1,A2,A3,A4 和B1,B2,B3,B4;
(2)利用 Bootstrap方法隨機(jī)抽樣,A'∈{A1,A2,A3,A4},B'∈{B1,B2,B3,B4},組成 m 個(gè)新的樣本 A={A'1,A'2,A'3,A'4},B={B'1,B'2,B'3,B'4},同一個(gè)數(shù)據(jù)抽樣頻率均小于50%;
(3)每次統(tǒng)計(jì)出體素值大于2的體素,得到一張激活圖;
(4)設(shè)置p值,統(tǒng)計(jì)激活頻率大于(1-p)的體素,即至少在(1-p)*m張激活圖中呈現(xiàn)激活的體素。
本實(shí)驗(yàn)方法使用Python實(shí)現(xiàn)抽樣、調(diào)用MATLAB預(yù)處理腳本(包括頭動(dòng)校正、配準(zhǔn)、分割、標(biāo)準(zhǔn)化、平滑)以及頻率統(tǒng)計(jì)等功能。在Mac OS系統(tǒng)下運(yùn)行,處理一個(gè)抽樣數(shù)據(jù)需要花費(fèi)5分鐘,運(yùn)行完一個(gè)樣本1000次抽樣需要大約3天時(shí)間。本實(shí)驗(yàn)使用MRIcron軟件中的ch2better模板,得到圖2結(jié)果。從圖2可以看出,與聽覺有關(guān)的腦激活區(qū)域較集中,其他區(qū)域基本沒有小團(tuán)激活體素,實(shí)驗(yàn)結(jié)果理想。
圖2 SPM激活圖像(a)與Bootstrap檢驗(yàn)激活圖像(b)的比較激活圖
上述方法在Mac OS系統(tǒng)下運(yùn)行,處理一個(gè)抽樣數(shù)據(jù)需要花費(fèi)5分鐘,運(yùn)行完一個(gè)樣本1000次抽樣需要大約3天時(shí)間。本方法將在上述基礎(chǔ)上進(jìn)行改進(jìn),以減少計(jì)算量。通過Bootstrap抽樣組成20個(gè)樣本,可以將這些樣本看成獨(dú)立的個(gè)體。又因?yàn)檫@20個(gè)樣本都是從同一個(gè)樣本抽樣而來,消除了由于不同個(gè)體對(duì)實(shí)驗(yàn)刺激的敏感性不同而帶來的差異問題。這種情況下,根據(jù)以往效應(yīng)回歸模型研究結(jié)果[11],可假設(shè)研究樣本都擁有共同的真實(shí)效應(yīng)量,即可以排除由于每個(gè)研究個(gè)體的背景、年齡、教育程度、心理因素等不同而導(dǎo)致的各個(gè)真實(shí)效應(yīng)量不同,適用于固定效應(yīng)模型。具體實(shí)驗(yàn)步驟如下:
(1)將休息態(tài)和刺激態(tài)進(jìn)行分組 A1,A2,A3,A4 和B1,B2,B3,B4;
(2)利用 Bootstrap方法隨機(jī)抽樣,A'∈{A1,A2,A3,A4},B'∈{B1,B2,B3,B4},組成 20個(gè)新的樣本 A={A'1,A'2,A'3,A'4},B={B'1,B'2,B'3,B'4},同一個(gè)數(shù)據(jù)抽樣頻率均小于50%;
(3)結(jié)合 SPM 軟件,使用固定效應(yīng)(Fixed Effect)模型對(duì)于這20個(gè)樣本進(jìn)行組分析。
由于1000個(gè)抽樣樣本過于龐大,過多樣本進(jìn)行組分析仍會(huì)造成運(yùn)行時(shí)間過長(zhǎng),過程過于復(fù)雜等情況。且本研究發(fā)現(xiàn)單樣本組分析過程中,20個(gè)抽樣樣本已可以得到較好的研究結(jié)果。圖3為SPM與Bootstrap test單樣本組分析結(jié)果的腦激活圖像比較。
圖3 SPM激活圖像(a)與Bootstrap檢驗(yàn)組分析圖(b)的比較
通過圖3對(duì)比,可以看出,改善后的方法在激活體素上有一定程度上減少,但體素個(gè)數(shù)減少不明顯。
以下將對(duì)于實(shí)驗(yàn)結(jié)果比較做定量分析。表1為SPM、Bootstrap檢驗(yàn)和Bootstrap檢驗(yàn)組分析對(duì)聽覺數(shù)據(jù)處理得到的腦激活體素情況,其中p=0.001,抽樣總數(shù)m=1000。
從表1中可以看出,Bootstrap檢驗(yàn)沒有明顯的校正閾值。這是因?yàn)樵诓煌某闃訕颖局薪?jīng)過處理后,每個(gè)體素校驗(yàn)值都不同,無法得到一個(gè)確定的閾值,但可以用閾值大于2和頻率大于99.9%相結(jié)合方法來得到校正閾值。此外,為了驗(yàn)證參考信號(hào)的有效性和正確性,本文統(tǒng)計(jì)了SPM和Bootstrap檢驗(yàn)兩種方法增加和較少的體素點(diǎn)與實(shí)驗(yàn)設(shè)計(jì)block塊之間的皮爾森相關(guān)系數(shù)分布直方圖,實(shí)驗(yàn)結(jié)果如圖4所示。增加的體素點(diǎn)與block相關(guān)性較低,減少的體素點(diǎn)與block相關(guān)性較高。其中SPM和Bootstrap檢驗(yàn)兩種方法相同的體素個(gè)數(shù)為649,后者增加的體素個(gè)數(shù)為91,減少的體素個(gè)數(shù)為166。
表1 三種方法結(jié)果比較
圖4 SPM和Bootstrap檢驗(yàn)比較增加和減少體素點(diǎn)的相關(guān)系數(shù)的分布直方圖
本文針對(duì)fMRI研究上的假陽(yáng)性率問題,基于Bootstrap檢驗(yàn)提出一種新的非參數(shù)多重校正方法。研究結(jié)果分析表示,與SPM相比,基于Bootstrap檢驗(yàn)單樣本和單樣本組分析能得到更好的體素激活結(jié)果,一定程度上減少假陽(yáng)性率。同時(shí),也解決了fMRI某些實(shí)驗(yàn)采集樣本過少,數(shù)據(jù)不符合假設(shè)分布而使得研究結(jié)果不理想的問題。當(dāng)然,研究也存在很多不足之處。首先,本研究發(fā)現(xiàn),不同的實(shí)驗(yàn)步驟會(huì)造成部分激活體素的差異,例如先進(jìn)行Bootstrap抽樣再進(jìn)行預(yù)處理和先預(yù)處理再進(jìn)行Bootstrap抽樣相比,就實(shí)驗(yàn)結(jié)果來看,后者實(shí)驗(yàn)結(jié)果明顯好于前者。這給我們帶來一個(gè)新的研究思路,預(yù)處理對(duì)實(shí)驗(yàn)數(shù)據(jù)的影響究竟有哪些,實(shí)驗(yàn)數(shù)據(jù)是否進(jìn)行預(yù)處理等問題都需要進(jìn)一步研究。其次,在進(jìn)行Bootstrap抽樣時(shí),若取得同一個(gè)數(shù)據(jù)頻率越高,實(shí)驗(yàn)結(jié)果往往更差,其中的原因值得令人思考。