孟 明,尹 旭,高云園,佘青山,羅志增
(杭州電子科技大學(xué)自動化學(xué)院,浙江杭州 310018)
作為人類與計算機通信的橋梁,腦機接口(braincomputer interface,BCI)可以通過對腦部神經(jīng)活動信號的識別產(chǎn)生控制命令,幫助有運動障礙的患者對輪椅,外骨骼等外部設(shè)備進行控制,從而改善日常生活質(zhì)量[1-2].腦電信號(electroencephalogram,EEG)因具有高時間分辨率,低成本和高便捷等優(yōu)點而被廣泛應(yīng)用,在當(dāng)前BCI控制系統(tǒng)中廣泛使用的EEG范式包括事件相關(guān)電位(event related potential,ERP)[3],穩(wěn)態(tài)視覺誘發(fā)電位(steady-state visually evoked potential,SSVEP)[4]和運動想象(motor imagery,MI)[5-6].與其他范式相比,MI因無需外界的刺激信號,更貼近自然,更具實用性等優(yōu)點得到關(guān)注[7].它通過對四肢或身體不同部位的運動想象引起大腦皮層相關(guān)區(qū)域活動的變化.例如,當(dāng)想象左手或右手運動時,大腦對側(cè)的運動感知區(qū)域代謝和血流變強,出現(xiàn)Alpha和Beta頻段信號的振幅降低的情況,即出現(xiàn)事件相關(guān)去同步(event related desynchronization,ERD)現(xiàn)象;大腦同側(cè)的運動感知區(qū)域呈靜息或惰性狀態(tài),出現(xiàn)Alpha和Beta頻段信號的振幅增加的情況,即出現(xiàn)事件相關(guān)同步(event related synchronization,ERS)現(xiàn)象[8-9].根據(jù)這一規(guī)律,可以通過對想象不同的肢體運動所得到的EEG信號進行分類從而產(chǎn)生不同的控制命令.
由于EEG是一種非平穩(wěn)、低幅值、低信噪比的生物電信號,并且運動想象系統(tǒng)的穩(wěn)定性較差,易受干擾,特征不明顯,給正確識別運動想象意圖帶來很大挑戰(zhàn),因此采用恰當(dāng)?shù)姆椒▉硖崛∮行У奶卣髟贓EG的識別中顯得尤為關(guān)鍵[10].共空間模式(common space pattern,CSP)[11]作為一種空間濾波方法,在基于MI的BCI系統(tǒng)研究中被廣泛使用,但因為其具有對噪聲高度敏感和泛化能力低的缺點,研究者提出了許多改進的CSP方法.為了去除通道之間的冗余信息和噪聲干擾,提出了基于通道選擇的CSP改進方法,比如通過時域特征和相關(guān)系數(shù)進行通道選擇的濾波器組共空間模式方法(channel selection for filter-bank-CSP,SFBCSP)[12],基于多頻帶的濾波器排序進行通道選擇的共空間模式方法(CSP-rank channel selection for multifrequency band,CSP-R-MF)[13]和基于皮爾遜相關(guān)系數(shù)進行通道選擇的正則化共空間模式方法(correlation based channel selection for regularized CSP,CCS-RCSP)[14].這些方法在通道選擇后的濾波中對所選擇的通道進行了相同的頻帶劃分與選擇,未針對不同個體的不同通道選擇最佳頻帶.但是不同的個體進行運動想象時,ERD/ERS現(xiàn)象較為明顯的最佳頻帶往往是不盡相同的,即使同一個體,不同通道的最佳頻帶也未必相同.文獻[15]提出了一種利用巴氏距離分別選擇每個通道最佳頻帶的共空間模式方法(Bhattacharyya distance-based frequency selection for CSP,B-CSP).但是這個方法的頻帶選擇是對所有通道進行的,未針對不同的個體進行通道選擇,仍然存在通道間的冗余信息和噪聲影響分類性能.
針對以上問題,本文提出一種塊選擇共空間模式(block-selection for CSP,BS-CSP)特征提取方法.首先對所有EEG通道劃分頻帶,形成眾多塊,并結(jié)合時頻特征提取與統(tǒng)計量計算來表征每個塊的二分類能力并作為塊選擇的依據(jù);然后采用交叉驗證的方法,根據(jù)驗證集平均分類精度確定最優(yōu)閾值和支持向量機(support vector machine,SVM)的懲罰參數(shù)C,從而進行塊的選擇,CSP特征的提取與SVM模型的訓(xùn)練;最后,求得模型在測試集上的分類結(jié)果.利用BCI Competition III Dataset IVa[16]和BCI Competition IV Dataset I[17]數(shù)據(jù)集對提出的方法進行評估,并與基于通道選擇或頻帶選擇的改進CSP方法進行比較,取得了優(yōu)異的結(jié)果,為運動想象腦電信號分類提供了一種新方法.
大多數(shù)改進CSP方法的基本思想都是通過EEG的頻域信息來選擇最佳頻帶,形成新的輸入矩陣后用共空間模式進行特征提取.由于EEG本質(zhì)上是一個高度非平穩(wěn)的時間序列信號,僅結(jié)合頻域信息的共空間模型仍存在不能充分利用時間信息的不足,本文通過構(gòu)造同時考慮時域和頻域信息的選擇指標(biāo),來改善后續(xù)共空間模式特征在表征運動想象任務(wù)中的準(zhǔn)確性和可靠性.
假設(shè)實驗采集的EEG數(shù)據(jù)具有K個通道,把每個通道EEG進行頻段劃分得到的數(shù)據(jù)稱為塊.每個通道都分成S個等帶寬頻帶,則生成K×S個塊.記第k個通道的第s個頻帶所對應(yīng)塊的數(shù)據(jù)為x(ks)(n),k=1,2,···,K,s=1,2,···,S,n=1,2,···,N,其中N為每個塊的采樣點個數(shù).假設(shè)受試者共進行I次實驗,則第i次實驗的第ks個塊為
其中i=1,2,···,I.在本文中,暫且考慮二分類運動想象(I1,I2),即I1∪I2=1,2,···,I.圖1是本文提出的BS-CSP方法框圖.首先對EEG按通道和頻帶進行塊的劃分;然后在塊的相關(guān)性計算中計算每個塊的功率(power)和功率譜密度(power spectral density,PSD),進而得出每個塊的Fisher比來表征區(qū)分運動想象任務(wù)的能力;接著在塊的選擇中設(shè)置合理的閾值選出M個塊,從而構(gòu)造新的M ×N矩陣作為CSP模型的輸入;再接著對每個塊分別進行空間濾波,并提取了CSP特征,最后采用SVM[18]進行分類.
Fisher比是一種將高維參數(shù)投影成一維來測量類判別屬性的統(tǒng)計量參數(shù)[18],定義如下:
其中:X?和X+為兩個不同類別的參數(shù)集合,var(·)為方差,mean(·)為均值.
本文首先通過計算塊的時域Power特征和頻域PSD特征構(gòu)建二維參數(shù),然后通過Fisher比投影成一維參數(shù)來表征每個塊運動想象分類能力,且以此作為后續(xù)閾值設(shè)置的根據(jù).定義塊的功率功率譜密度
圖1 BS-CSP算法框圖Fig.1 BS-CSP algorithm block diagram
根據(jù)式(1)對Fisher比的定義,通過計算上述功率T和功率譜密度P這兩個特征的類間歐式距離與類內(nèi)方差的比值,定義表征每個塊二分類能力的值為F(ks)[20],具體如式(4)所示:
根據(jù)塊的Fisher比進行選擇,由大于閾值的塊組成新的數(shù)據(jù),作為后續(xù)CSP空間濾波的輸入矩陣.閾值設(shè)置的是否合理將對CSP性能產(chǎn)生顯著影響,若閾值設(shè)置過大,會導(dǎo)致選擇塊的個數(shù)偏少,從而導(dǎo)致模型欠擬合;若閾值設(shè)置過小,會導(dǎo)致選擇塊的個數(shù)偏多,從而導(dǎo)致模型過擬合.本文采用交叉驗證方法,通過驗證集的分類精度來確定最優(yōu)閾值,塊的選擇步驟如下:
通過CSP尋求空間濾波器W以最大化兩個類別之間的差異,后求得每次實驗信號X對應(yīng)的空間濾波信號Z[21],并用log-variances方法提取每次實驗的CSP特征向量f:
其中:Zj為空間濾波信號Z的第j行信號,m為CSP空間濾波器對數(shù),log(·)為對數(shù)運算符.
作為一種著名的分類器算法,SVM旨在找到使兩類支持向量間隔最大的最優(yōu)超平面,目前,CSP及其變體與SVM的結(jié)合已經(jīng)成為了一種MI-EEG分類的先進技術(shù).因此采用上述提取的CSP特征訓(xùn)練SVM模型,假設(shè)訓(xùn)練樣本中對于第i次實驗的特征向量為fi∈?D(D為特征維數(shù)),與之對應(yīng)的標(biāo)簽為yi ∈{+1,?1}.SVM優(yōu)化器旨在解決以下優(yōu)化問題:
其中u∈?D和b ∈?分別是超平面的權(quán)向量和偏置,C是軟間隔的正則化參數(shù),并且ξi是松弛變量[22].本文選用徑向基函數(shù)(radial basis function,RBF)作為SVM的核:
其中γ為核系數(shù).綜合考慮模型性能和運算速度,將γ設(shè)置為默認值,即,而懲罰參數(shù)C通過E折交叉驗證確定.
數(shù)據(jù)集1:第1個數(shù)據(jù)集來自BCI Competition III Dataset IVa.此數(shù)據(jù)集記錄了5名健康受試者(aa,al,av,aw,ay)的118通道EEG數(shù)據(jù),每個受試者被要求完成右手、雙腳兩類運動想象各140次實驗,每次實驗的前3.5 s在電腦屏幕中央持續(xù)顯示帶有方向的箭頭(向左:左手運動;向右:右手運動;向下:雙腳運動)作為提示,在此期間受試者根據(jù)提示來執(zhí)行相應(yīng)的運動想象任務(wù),然后放松1.75 s至2.25 s,具體時間軸如圖2(a)所示.
圖2 單次實驗時間軸Fig.2 Time axis of single experiment
數(shù)據(jù)集2:第2個數(shù)據(jù)集來自BCI Competition IV Dataset I.此數(shù)據(jù)集記錄了4名健康受試者(a,b,f,g)的59通道EEG數(shù)據(jù),每個受試者被要求完成左右手或左手,雙腳的兩類運動想象各100次實驗,每次實驗的前6 s首先會在電腦屏幕中央顯示固定的十字,且2 s~6 s會疊加帶有方向的箭頭(向左:左手運動;向右:右手運動;向下:雙腳運動)作為提示,在此期間受試者根據(jù)提示來執(zhí)行相應(yīng)的運動想象任務(wù),然后6 s~8 s內(nèi)屏幕出現(xiàn)黑屏,具體時間軸如圖2(b)所示.
1) 頻帶處理.
由于腦電信號中通常會出現(xiàn)不同形式的干擾和噪聲,有些可以在EEG數(shù)據(jù)采集時盡量避免甚至消除掉,而有些只能在后續(xù)的預(yù)處理中去除,如工頻干擾等.而運動想象實驗中的ERD/ERS現(xiàn)象又主要出現(xiàn)在Alpha頻段(8 Hz~13 Hz)和Beta頻段(14 Hz~30 Hz),因此采用有限長單位沖激響應(yīng)濾波器(finite impulse response,FIR)對EEG信號進行(8~32)Hz帶通濾波,并且劃分為12個帶寬為2 Hz的頻帶((8~10)Hz,(10~12) Hz,(12~13) Hz,(14~16) Hz,(16~18) Hz,(18~20) Hz,(20~22) Hz,(22~24) Hz,(24~26) Hz,(26~28)Hz,(28~30)Hz,(30~32)Hz)用于塊的構(gòu)建.
圖3 單個通道的ERSP時頻分布圖Fig.3 ERSP time-frequency distribution of single channel
2) 時間窗處理.
原始數(shù)據(jù)中包含了實驗從開始到結(jié)束所有的腦電數(shù)據(jù),需要根據(jù)實驗要求選取合適的時間窗對原始數(shù)據(jù)進行截取,以便后續(xù)處理.在一次運動想象中提示出現(xiàn)后的0 s~1 s內(nèi)被普遍稱作想象的準(zhǔn)備階段,而3.5 s~4 s內(nèi)被稱作后想象階段[21].本文通過分析與運動想象相關(guān)的大腦區(qū)域信號的事件相關(guān)譜擾動(event-related spectral perturbation,ERSP)[23]來確定截取數(shù)據(jù)的時間窗.圖3是兩個數(shù)據(jù)集中受試者一個通道的ERSP時頻分布圖,可以看出在0時刻視覺提示出現(xiàn)后會有一小段長短因人而異的運動想象反應(yīng)時間,所以為考慮數(shù)據(jù)質(zhì)量,將時間窗設(shè)置為視覺提示后的0.5 s~2.5 s.
實驗中,采用4×5折交叉驗證方法,即將原始EEG數(shù)據(jù)集按4:1劃分訓(xùn)練集和測試集,并重復(fù)4次實驗,減少因偶然性對模型評估造成不良影響.其中,訓(xùn)練集用于塊的相關(guān)性計算與選擇,CSP模型的訓(xùn)練和SVM模型的訓(xùn)練,另外為避免過擬合,采用10折交叉驗證方法,根據(jù)驗證集平均分類精度確定最優(yōu)閾值和SVM模型的懲罰參數(shù)C,即取E=10.測試集則用選擇的塊,訓(xùn)練的共空間模型和支持向量機模型得到分類結(jié)果,用于評價模型的分類性能,整體框架如圖4所示.
圖4 整體框架圖Fig.4 Overall frame
以數(shù)據(jù)集1中的aa,av受試者為例,對劃分的12×118個塊進行運動想象相關(guān)性計算,并用色差表示塊的Fisher比.由于該數(shù)據(jù)集原始通道個數(shù)過多,為便于顯示挑選包含最優(yōu)塊所屬通道的20個運動感知區(qū)通道,如圖5所示.
圖5 不同受試者的塊選擇比較Fig.5 Comparison of block selection among different subjects
可知,對于aa受試者第3個頻段(12 Hz~14 Hz)和第9個頻段(24 Hz~26 Hz)的塊具有較高的Fisher比,即具有較好的運動想象二分類能力,而對于av受試者第2個頻段(10 Hz~12 Hz)和第7個頻段(20 Hz~22 Hz)具有較高的Fisher比,即具有較好的運動想象二分類能力.由此說明通過提出的此方法可以很好地減少個體間和通道間的差異性對分類性能的不利影響.
根據(jù)第2.2節(jié)所述的具體流程,找出使驗證集分類精度最高的閾值進行設(shè)置,從而選出最優(yōu)的塊及這些塊所屬的通道.以數(shù)據(jù)集1中的av受試者為例,得到驗證集分類精度隨所選通道個數(shù)的變化趨勢圖,如圖6所示.
圖6 驗證集分類精度隨通道個數(shù)的變化趨勢圖Fig.6 Change trend of classification accuracy of validation set with number of channels
隨著閾值設(shè)置逐漸變小,所選的塊個數(shù)增多,即相應(yīng)的通道選擇個數(shù)也增多,驗證集分類精度隨之增大,但當(dāng)閾值設(shè)置超過一定大小后,系統(tǒng)出現(xiàn)了過擬合,驗證集分類精度開始降低.所以由此可設(shè)置使驗證集分類精度達到最大值的閾值,選出此時大于閾值的所有塊,即得到這些塊所屬的通道,用于后期的測試集,最終得到分類精度,對系統(tǒng)進行性能評估.
根據(jù)ERD/ERS現(xiàn)象,當(dāng)在做右手運動想象時,大腦左側(cè)運動皮層區(qū)域出現(xiàn)明顯的ERD現(xiàn)象;相反當(dāng)在做左手運動想象時,大腦右側(cè)運動皮層區(qū)域出現(xiàn)明顯的ERD現(xiàn)象;當(dāng)在做雙腳運動想象時,大腦中央運動皮層區(qū)域出現(xiàn)明顯的ERD現(xiàn)象.為驗證該方法選擇最優(yōu)塊的合理性,對最優(yōu)塊所屬的通道進行標(biāo)記顯示,圖7是兩個受試者對應(yīng)的最優(yōu)塊所屬通道的標(biāo)記圖.
可知,對于做右手和雙腳運動想象的aa受試者,對應(yīng)的最優(yōu)塊所屬通道分布在左側(cè)和中央運動皮層區(qū)域;而對于做左手和雙腳運動想象的f受試者,對應(yīng)的最優(yōu)塊所屬通道大都分布在右側(cè)和中央運動皮層區(qū)域.這一定程度上驗證了該方法的合理性.
圖7 塊所屬通道的標(biāo)記圖Fig.7 Marking diagram of the channel to which the block belongs
用提出的方法對第3.1節(jié)中兩個數(shù)據(jù)集進行實驗,并且與引言中所述的SFBCSP,CSP-R-MF和CCS-RCSP這3種方法進行比較,4×5折交叉驗證的測試集平均分類精度和方差如表1-2所示.
表1 數(shù)據(jù)集1分類精確度比較Table 1 Comparison of classification accuracy of Dataset 1
表2 數(shù)據(jù)集2分類精確度比較Table 2 Comparison of classification accuracy of Dataset 2
針對上述兩個公共數(shù)據(jù)集,改進的共空間模型算法(BS-CSP)在測試集上表現(xiàn)出了最佳的分類性能.來自數(shù)據(jù)集1的5位受試者:BS-CSP方法在aa,av,aw和ay4位受試者上獲得了最高的分類精度,而SFBCSP方法在al受試者上獲得了最高的分類精度.
來自數(shù)據(jù)集2的4位受試者:BS-CSP方法在a,b,g受試者上獲得了最高的分類精度,而SFBCSP方法在f受試者上獲得了最高的分類精度.SFBCSP作為一種通過時域特征及Fisher比來選擇通道并用FBCSP作特征提取的方法在個別受試者上表現(xiàn)出了一定的優(yōu)越性,但通過此方法選出來的通道并不像BS-CSP方法選出來的通道那樣帶有權(quán)重,即在不同的通道獲得不同數(shù)量的塊.而CSP-R-MF方法缺少對通道的選擇,CCS-RCSP方法缺少對頻帶的選擇,這都導(dǎo)致部分分類精度的損失.綜上所述,本文提出的BS-CSP方法具有一定的可行性和優(yōu)越性.
根據(jù)第4.3節(jié)所述,得到每個受試者對應(yīng)的最優(yōu)塊所屬通道,并對最優(yōu)塊所屬通道的完整頻帶數(shù)據(jù)進行特征提取與分類.與其他只進行通道選擇的方法進行比較,如基于C3,Cz,C4這3個通道的共空間模式方法(3C-CSP),基于空間濾波器排序進行選擇通道的共空間模式方法(CSP-Rank)[24]和基于遺傳算法的Rayleigh系數(shù)最大化來選擇通道的方法(Rayleigh-coefficient based genetic algorithm,RC-GA)[25].以數(shù)據(jù)集1的5名受試者為例,具體比較結(jié)果如表3所示.
表3 不同方法的分類精度和通道選擇數(shù)量比較Table 3 Comparison of classification accuracy and channel selection quantity of different methods
從表中可以看出,提出的BS-CSP方法除了在ay受試者的分類精度上低于CSP-Rank方法外,其余受試者的分類精度和平均分類精度都優(yōu)于其他3種方法.比起CSP-Rank和RC-GA方法,BS-CSP方法雖然多使用了10個左右通道,但分類精度提高了5個左右的百分點,提升了BCI系統(tǒng)的分類性能,表明該方法能夠更有效地去除冗余,選擇出最佳的通道組合.另外,結(jié)合圖5所示,并對比表1經(jīng)塊選擇得到的aa和av受試者分類精度可以發(fā)現(xiàn),aa受試者選擇的最佳塊基本集中在12 Hz~14 Hz和24 Hz~26 Hz兩個頻段,從而導(dǎo)致了當(dāng)選擇整個頻帶進行分類時冗余信息較多,精度下降了10%左右;而av受試者選擇的最佳塊分布的頻帶較廣,這就避免了當(dāng)選擇整個頻帶進行分類時,精度損失過多,這也充分說明了基于不同個體,不同通道進行頻帶選擇的必要性.
本文提出了一種塊選擇共空間模型特征提取方法(BS-CSP),用于基于運動想象的BCI系統(tǒng)的任務(wù)分類.通過對每個通道劃分頻帶來構(gòu)建數(shù)據(jù)塊,利用每個塊的時頻特征計算得到的Fisher比選出最優(yōu)塊,實現(xiàn)了對通道和頻帶的同時選擇,減少了通道間和頻帶間的冗余信息,然后分別用CSP和SVM對最優(yōu)塊組成的數(shù)據(jù)進行特征提取與分類.對BCI競賽數(shù)據(jù)集的分類實驗結(jié)果表明BS-CSP方法選出來的塊能有效地避免不同個體以及不同通道間的差異性,且塊所屬的通道分布合理,數(shù)量適中,該方法一定程度上提高了BCI系統(tǒng)的分類性能.另外,與其他先通道選擇后分頻帶的改進CSP方法想比,該方法選出來的通道均帶有不同的權(quán)重,即每個通道所包含的塊的個數(shù)不同,這也為后續(xù)通道選擇方法的改進提供了思路.