黃慶坤 艾斯克爾·米吉提 楊鵬
(1.大理護理職業(yè)學(xué)院 云南省大理市 671000 2.南京財經(jīng)大學(xué) 江蘇省南京市 210000)
腦科學(xué)研究的目的之一是從大腦中“讀出”受試者的感受或他正在經(jīng)歷的視聽情境。該研究基于以下假設(shè):對于被試所受到到的外部特征刺激與他們大腦中某些組織的活動之間存在一定的映射關(guān)系。為了驗證這個假設(shè),我們需要兩個前提:Step1 需要準確定位大腦的活動區(qū)域,并檢測它們的活動變化;Step2 需要通過算法來描述出該映射關(guān)系。對于Step1,功能性磁共振成像(functional magnetic resonance imaging,fMRI)可以檢測到相關(guān)腦激活區(qū)血氧的微小變化進行功能成像,能夠很好地反映大腦的動態(tài)活動,在有限延遲的情況下準確定位不同的活動組織。對于Step2,大多采用fMRI 數(shù)據(jù)研究方法,引入統(tǒng)計學(xué)習(xí)和人工智能原理,結(jié)合深度學(xué)習(xí)和機器學(xué)習(xí)算法,解碼大腦認知狀態(tài)?;诂F(xiàn)階段研究,本文主要對以下兩方面進行討論:
(1)在獲取任務(wù)態(tài)fMRI 數(shù)據(jù)后怎樣對相應(yīng)任務(wù)激活腦區(qū)進行定位研究;
(2)怎樣找到各特征變化率序列以及腦功能圖像序列間的映射關(guān)系,并泛化到數(shù)據(jù)中用來實現(xiàn)分類。
由于fMRI 數(shù)據(jù)存在時序性特征,假設(shè)BOLD 信號沒有任何噪音干擾,能直接顯示神經(jīng)活動,實驗就可通過分析時間序列來建立預(yù)測模型,通過預(yù)測變量與實際fMRI 信號進行統(tǒng)計分析,進而觀察體素對刺激任務(wù)的響應(yīng)狀態(tài)。但是神經(jīng)活動本身存在復(fù)雜多變性,使得fMRI 數(shù)據(jù)存在著噪聲大的特點,導(dǎo)致了fMRI 數(shù)據(jù)存在著有效信息提取困難等問題。因此本文首先在被試間進行一級模型分析(First level model),通過將血液動力學(xué)響應(yīng)函數(shù)(HRF)與設(shè)計矩陣中定義的一組預(yù)測變量進行卷積,將每個體素的時間序列與預(yù)測的BOLD 響應(yīng)進行回歸,提取感興趣區(qū)域(ROI);其次通過機器學(xué)習(xí)算法建立分類模型,在超參數(shù)尋優(yōu)方法下通過交叉驗證(Cross-Validation)來進行算法評估。
分類分析的任務(wù)是建立每個特征的變化率序列與腦功能圖像之間的映射關(guān)系(預(yù)測特征變化率序列的準確性)。給定數(shù)據(jù)集T={(x,y),…(x,y)},其中x∈X表示功能掃描下大腦體素(voxel)特征的活動序列,y∈Y表示具有時間序列的任務(wù)類別,其中tr 時間序列 ,p 是對應(yīng)于特征率體素的個數(shù)。通過尋找X上的決策函數(shù)J(x): X →Y,實現(xiàn)從實現(xiàn)體素到目標任務(wù)的特征映射:
Haxby 數(shù)據(jù)集是一個塊設(shè)計的任務(wù)態(tài)fMRI 數(shù)據(jù)集,來自于對大腦腹側(cè)顳葉皮層中面部和物體表征的研究。在每一次掃描中,被試參與八個物體類別的灰度圖像任務(wù),按24 秒的時間段分組,每幅圖像顯示500ms,1500ms 的刺激間隔,2.5s 的重復(fù)掃描時間(TR)。在實驗之前需要標準的預(yù)處理步驟:圖像格式轉(zhuǎn)換、時間層校正、頭部運動校正、空間歸一化、去線性漂移、帶通濾波(0.01~0.08hz)、回歸獨立信號等。
表1:
由于fMRI 數(shù)據(jù)具有時序性,在被試間可通過與功能掃描(session)下對應(yīng)的任務(wù)刺激類別(events)構(gòu)建設(shè)計矩陣(Design matrix)進行建模分析(一級模型)。在實驗中,通過將血液動力學(xué)響應(yīng)函數(shù)(HRF)與設(shè)計矩陣中定義的預(yù)測變量進行卷積構(gòu)建BOLD 信號,并通過回歸模型預(yù)測大腦體素的時序性(任務(wù)相關(guān)激活體素,例如一組激活體素可能對應(yīng)face 圖像任務(wù),而另一組激活體素可能對應(yīng)cat 圖像任務(wù)),見圖1。
圖1: GLM 實驗圖。圖1(a)為實驗設(shè)計圖,圖1(b)為設(shè)計矩陣,圖1(c)為全腦β 值圖。對每個被試進行一級模型分析,在被試組級進行二級模型分析,設(shè)計矩陣對應(yīng)每個Run 中的圖像任務(wù),通過設(shè)計矩陣來進行GLM 回歸,此時fMRI 數(shù)據(jù)被描述為包含一組回歸變量(X1,X2)的模型(X)的線性組合-E.q(3),結(jié)果是一組β 值的全腦圖(圖1(c)),β 值反映了每組成份與任務(wù)的相關(guān)性大小。
基于上述GLM 建模分析,實驗構(gòu)建subject1 到subject6被試的fMRI 數(shù)據(jù)集。Step1. 提?。╩ask)被試ROI 的激活體素值構(gòu)建特征向量;Step2. 通過機器學(xué)習(xí)算法構(gòu)建決策函數(shù),實現(xiàn)激活體素到類別標簽的特征映射-E.q(4),其中實驗對比了支持向量機、貝葉斯、決策樹和神經(jīng)網(wǎng)絡(luò)分類算法;Step3. 通過通過K-Fold 交叉驗證法來進行分類實驗,為了降低實驗?zāi)P偷膹?fù)雜度,實驗采用了一種集成方法(Method of Pipeline),通過方差分析(anova)與特征選擇(SelectKBest),使用前K 個與標簽最相關(guān)的特征進行實驗,其中對于分類結(jié)采用準確率:acc(f;N)=∫∏(f(x)=y)p(x) dx 來進行模型評估,其中N 為數(shù)據(jù)分布,p(·)為概率密度函數(shù)。在被試組subject1 到subject6,對比不同模型在圖像刺激任務(wù)下的分類結(jié)果,見表2。在支持向量機分類模型中使用三種核函數(shù)進行參數(shù)映射:
表2:
其中γ,θ,d,δ 是核參數(shù)并且γ>0。通過超參數(shù)尋優(yōu)算法得到最佳核參數(shù)“l(fā)inear”:C=0.01;“rbf”:C=100,gamma=0.001;“poly”:C=100,degree=4,gamma=0.001。
從表2 中可以看出通過SMV(rbf)分類準確率值均值最高92%(最佳閾值)。并且SVM(linear)模型也取得不錯的分類結(jié)果。由于神經(jīng)網(wǎng)絡(luò)分類效果受隱藏層個數(shù)與神經(jīng)元節(jié)點數(shù)影響(hidden_layer=5,每層200 個神經(jīng)元節(jié)點,Adam 優(yōu)化算法,learning_rate=0.001),分類效果較差。SVM(poly)、貝葉斯分類器以及決策樹在改組數(shù)據(jù)上分類結(jié)果不理想。實驗通過SVM(linear)和SVM(poly)分類模型在被試組進行對比分析,見圖2,從圖中可看出每個被試針對同一組圖像任務(wù)所得的分類結(jié)果不同,并且泛化到subjects 組間SVM(rbf)分類結(jié)果優(yōu)于SVM(linear)(被試間存在個體差異性)。
圖2: subjects-各外部特征率分類結(jié)果對比。橫坐標為K 值,縱坐標為對應(yīng)K 值的準確率。
通過實驗研究發(fā)現(xiàn),不同的分類模型所得到的準確率不同,其中SVM(rbf)預(yù)測準確率最高(92%),但需要注意的是算法之間并不存在優(yōu)劣性。對于fMRI 數(shù)據(jù)的高維稀疏性使得線性模型具有很強的適應(yīng)能力,盡管fMRI 數(shù)據(jù)通過預(yù)處理后具有較低的信噪比,但是線性疊加有助于抵消大量噪音,并且預(yù)測結(jié)果穩(wěn)定性較好,具有很好的操作性。因此,在實驗中SVM 模型預(yù)測效果優(yōu)于其他分類模型,但不同的是,線性SVM 不直接依賴于數(shù)據(jù)分布,只有少數(shù)幾個代表支持向量的樣本參與了計算,分類平面不受一類點影響,進而SVM 算法在不同圖像任務(wù)下能取得較穩(wěn)定的預(yù)測得分。盡管通過實驗實現(xiàn)對Task-fMRI 數(shù)據(jù)進行分類,但結(jié)果任然存在誤差,這是由于被試間存在個體的差異性(BOLD信號之間差異性等)、算法模型復(fù)雜度(特別地,在實驗中神經(jīng)網(wǎng)絡(luò)模型分類由于受隱藏層個數(shù)、神經(jīng)元節(jié)點等參數(shù)的約束)等問題,加之傳統(tǒng)機器學(xué)習(xí)模型都為淺層模型,對fMRI 數(shù)據(jù)樣本少、維度高的特性仍然存在特征選擇問題(先驗知識):對fMRI 圖像局部特征提取較弱,未能充分處理fMRI 數(shù)據(jù)隱含的時序特征。因此,在下一步研究中,將更充分地挖掘大腦隱藏體素,針對于fMRI 數(shù)據(jù)特性嘗試遞歸特征消除、通過構(gòu)建動態(tài)相關(guān)矩陣并進行非負稀疏矩陣分解等算法更好地進行特征提取,并且針對于分類模型,將嘗試運用深度學(xué)習(xí)算法,并通過遷移學(xué)習(xí)等更好的解決小樣本學(xué)習(xí)帶來的問題。