馬麗英,張洪杰,羅天洪,鄭訊佳
(1.重慶交通大學(xué)機(jī)電與車輛工程學(xué)院,重慶 400074;2.重慶文理學(xué)院智能制造工程學(xué)院,重慶 402160)
腦-機(jī)接口(Brain-Computer Interface,BCI)技術(shù)能夠?qū)⑷说囊鈭D轉(zhuǎn)換為腦電信號(hào)(Electroencephalogram,EEG),不依賴肌肉和外周神經(jīng),在外部設(shè)備與人腦之間建立起通道,直接進(jìn)行信息交流[1-3]。BCI技術(shù)使得人們可以通過(guò)大腦直接控制智能假肢、智能輪椅、康復(fù)外骨骼機(jī)器人等設(shè)備。因此,BCI技術(shù)在醫(yī)療康復(fù)等領(lǐng)域得到了廣泛的應(yīng)用,而在自動(dòng)化駕駛以及通信娛樂(lè)等方面也具有廣闊的應(yīng)用前景[4-8]。
EEG信號(hào)具有非平穩(wěn)性、信噪比低等特性,傳統(tǒng)的信號(hào)分析方法不能夠?qū)ζ溥M(jìn)行完全有效的處理[9-11]。如何有效的提取出EEG信號(hào)的特征以及提高腦電信號(hào)的分類準(zhǔn)確率是當(dāng)下BCI技術(shù)的核心難題[12-15]。目前,國(guó)內(nèi)外研究者提出了各種EEG信號(hào)特征提取方法以及分類方法。Kwon-Woo Ha等[16]提出了一種基于膠囊網(wǎng)絡(luò)(CapsNet)的EEG信號(hào)分類方法,首先通過(guò)短時(shí)傅里葉變換算法將EEG信號(hào)轉(zhuǎn)換成2D圖像,然后在使用膠囊網(wǎng)絡(luò)進(jìn)行識(shí)別分類,但該方法的分類準(zhǔn)確率較低。孫會(huì)文等[17]提出了一種基于希爾伯特黃變換(Hilbert-Huang Transform,HHT)的EEG信號(hào)識(shí)別方法,提取腦電信號(hào)前三階本征模態(tài)函數(shù)的平均瞬時(shí)能量以及前6階AR模型的系數(shù)作為特征,將其輸入到支持向量機(jī)進(jìn)行分類識(shí)別,但該方法側(cè)重于提取EEG信號(hào)中具有分類特征信息的瞬時(shí)幅值而忽略其他特征。Park Y等[18]提出了一種基于局部區(qū)域共空間模式(Local Region CSP,LRCSP)的EEG信號(hào)分類方法。劉寶等[19]提出了一種基于PS0-CSP-SVM的EEG信號(hào)分類方法,利用粒子群優(yōu)化算法得到EEG信號(hào)的最佳時(shí)段,并采用CSP對(duì)最佳時(shí)段進(jìn)行特征提取,最后通過(guò)支持向量機(jī)對(duì)提取的特征進(jìn)行分類。汲繼躍等[20]提出了一種基于最優(yōu)區(qū)域共空間模式(Optimal Region CSP,ORCSP)的EEG信號(hào)分類識(shí)別方法,該方法通過(guò)計(jì)算方差比來(lái)選取通道附近的最優(yōu)區(qū)域進(jìn)行特征提取,并通過(guò)支持向量機(jī)進(jìn)行分類識(shí)別。徐建等[21]提出了一種基于人工蜂群(Artificial Bee Colony,ABC)算法和反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)的EEG信號(hào)分類方法,通過(guò)引入交叉運(yùn)算增強(qiáng)ABC算法的全局搜索能力,并通過(guò)該算法進(jìn)一步優(yōu)化BP神經(jīng)網(wǎng)絡(luò),從而提高對(duì)EEG信號(hào)的分類識(shí)別。谷學(xué)靜等[22]提出了一種將CSP和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)相結(jié)合的EEG信號(hào)分類方法,通過(guò)CSP提取到EEG信號(hào)的空域特征,并將其輸入到CNN網(wǎng)絡(luò)進(jìn)行分類識(shí)別。
綜上所述,針對(duì)腦電信號(hào)因?yàn)榫哂蟹瞧椒€(wěn)性、時(shí)變性以及非線性等特性而導(dǎo)致分類準(zhǔn)確率低的問(wèn)題,本文提出一種基于LMD-CSP和隨機(jī)森林的EEG信號(hào)分類方法。LMD是一種具有很強(qiáng)自適應(yīng)性的非線性分析方法,能夠?qū)⒎瞧椒€(wěn)、非線性的EEG信號(hào)分解為多個(gè)更平穩(wěn)的PF分量,而對(duì)于EEG信號(hào)的時(shí)變性,利用CSP分別對(duì)PF分量進(jìn)行空域特征的提取,將EEG信號(hào)的特征進(jìn)行差異最大化,最后利用隨機(jī)森林算法對(duì)CSP特征進(jìn)行分類識(shí)別,獲得更高的分類準(zhǔn)確率。
現(xiàn)代神經(jīng)電生理學(xué)研究表明:當(dāng)人進(jìn)行單側(cè)肢體運(yùn)動(dòng)想象時(shí),大腦對(duì)側(cè)運(yùn)動(dòng)感覺(jué)區(qū)域中EEG信號(hào)相應(yīng)頻段的幅值降低,頻帶能量也降低;相反,大腦同側(cè)的運(yùn)動(dòng)感覺(jué)區(qū)域中EEG信號(hào)相應(yīng)頻段的幅值增大,頻帶能量升高,這種現(xiàn)象分別稱為事件相關(guān)去同步(Event Related Desynchronization,ERD)和事件相關(guān)同步(Event Related Synchronization,ERS)[23]。例如進(jìn)行右手運(yùn)動(dòng)想象時(shí),大腦右半球區(qū)域產(chǎn)生的腦電波幅值降低,出現(xiàn)ERD現(xiàn)象;同時(shí),大腦左半球區(qū)域產(chǎn)生的腦電波幅值增加,出現(xiàn)ERS現(xiàn)象。此外,ERD/ERS現(xiàn)象還具有頻段特性。EEG信號(hào)按頻率的不同分為四個(gè)波段,分別為8 Hz~13 Hz的α波、13 Hz~30 Hz的β波、4 Hz~8 Hz的θ波以及0.5 Hz~4 Hz的δ波,而在進(jìn)行肢體運(yùn)動(dòng)想象時(shí),ERD/ERS現(xiàn)象主要出現(xiàn)在頻率范圍為8 Hz~30 Hz[24-27]。因此,ERD/ERS現(xiàn)象的空間特性和頻段特性為運(yùn)動(dòng)想象的分類提供了理論依據(jù)。利用LMD分解能夠獲取EEG信號(hào)和個(gè)體的運(yùn)動(dòng)想象最想關(guān)的頻段,再利用CSP能夠提取最佳頻段EEG信號(hào)的空間特征,最后將CSP空間特征輸入到隨機(jī)森林分類器中獲得分類準(zhǔn)確率。
為提高EEG信號(hào)分類準(zhǔn)確率,本文提出一種基于LMD-CSP和隨機(jī)森林的分類方法。首先對(duì)原始腦電信號(hào)進(jìn)行濾波、陷波等預(yù)處理,為了獲取EEG信號(hào)的最佳頻段,利用LMD將EEG信號(hào)分解為多個(gè)PF分量,并通過(guò)每個(gè)PF分量頻譜圖選取出符合EEG信號(hào)最佳頻段的PF分量。共空間模式能夠通過(guò)構(gòu)建空間濾波器將兩類數(shù)據(jù)的特征差異最大化,有效進(jìn)行分類,通過(guò)共空間模式對(duì)選取的PF分量進(jìn)行特征提取,得到具有較大區(qū)別度的空間特征,然后將得到的CSP特征輸入到隨機(jī)森林分類器中,經(jīng)過(guò)分類識(shí)別后得到最終分類結(jié)果,算法的流程圖如圖1所示。
圖1 算法流程圖
針對(duì)腦電信號(hào),LMD能夠進(jìn)行自適應(yīng)分解,并且產(chǎn)生PF分量,PF分量具有真實(shí)物理意義,同時(shí)反映出腦電信號(hào)能量在空間尺度上的時(shí)頻發(fā)布。相對(duì)于經(jīng)驗(yàn)?zāi)B(tài)分解,更具有端點(diǎn)效應(yīng)小、迭代次數(shù)少等特點(diǎn)。首先采用LMD對(duì)EEG信號(hào)進(jìn)行處理,其過(guò)程如下。
①求取輸入EEG信號(hào)x(t)的全部局部極值點(diǎn)ni,并求取相鄰極值點(diǎn)ni和ni+1的均值mi,以及包絡(luò)估計(jì)值ai,即:
②將得到的全部均值mi和包絡(luò)估計(jì)值ai分別用直線進(jìn)行連接,然后進(jìn)行平滑處理,分別得到局部均值函數(shù)m11(t)和包絡(luò)估計(jì)函數(shù)a11(t),并將局部均值函數(shù)從EEG信號(hào)剔除,即:
③用h11(t)除以包絡(luò)估計(jì)函數(shù)a11(t),得到調(diào)制信號(hào)s11(t),即:
④計(jì)算s11(t)的包絡(luò)估計(jì)函數(shù)a12(t),如果a12(t)≠1,則s11(t)不是純調(diào)頻信號(hào),重復(fù)上述步驟,直到得到純調(diào)頻信號(hào)s1n(t),即:
式中,
⑤求得純調(diào)頻信號(hào)s1n(t)相應(yīng)的包絡(luò)信號(hào)a1(t),并與之相乘得到第一個(gè)乘積函數(shù)PF1(t),即:
⑥將PF1(t)從EEG信號(hào)x(t)中剔除,得到新的信號(hào)u1(t),再將u1(t)作為原始信號(hào)重復(fù)上述步驟k次,直至uk(t)為一個(gè)常數(shù)或單調(diào)函數(shù)為止,即:
原始EEG信號(hào)x(t)可表示為乘積函數(shù)PFk(t)與殘余分量uk(t)之和,即:
對(duì)腦電信號(hào)進(jìn)行LMD后,再利用CSP算法分別對(duì)最具判別性的PF分量進(jìn)行特征提取。CSP算法主要針對(duì)EEG信號(hào)的空域特性,能有效提取出EEG信號(hào)的空域特征[28]。具體過(guò)程如下。
①將各個(gè)PF分量分為左手運(yùn)動(dòng)想象數(shù)據(jù)X1以及右手運(yùn)動(dòng)想象數(shù)據(jù)X2,并求取對(duì)應(yīng)的協(xié)方差矩陣R1和R2,并求取兩類數(shù)據(jù)的混合空間協(xié)方差矩陣R,即:
式中,i=1,2,表示矩陣的轉(zhuǎn)置,trace()為矩陣的跡。
②對(duì)混合空間協(xié)方差矩陣R進(jìn)行奇異值分解,并求取白化特征矩陣P,即:
式中,U為特征向量矩陣,λ為對(duì)應(yīng)特征值的對(duì)角矩陣,且特征值為降序排列。
③對(duì)協(xié)方差矩陣R1和R2,進(jìn)行以下變換:
④S1、S2具有公共特征向量,且存在兩個(gè)對(duì)角矩陣λ1、λ2和相同的特征向量矩陣B,對(duì)S1、S2進(jìn)行主分量分解,可得:
式中,I為單位矩陣。
⑤計(jì)算投影矩陣W,即:
⑥求取左手運(yùn)動(dòng)想象數(shù)據(jù)X1以及右手運(yùn)動(dòng)想象數(shù)據(jù)X2的特征矩陣以及特征向量,即:
式中,i=1,2,Zi為對(duì)應(yīng)的特征矩陣,fi為對(duì)應(yīng)特征向量。
原始EEG信號(hào)經(jīng)過(guò)LMD-CSP算法后,將獲得一組CSP特征,然后將CSP特征輸入到隨機(jī)森林分類器中進(jìn)行分類識(shí)別。
隨機(jī)森林算法是對(duì)多個(gè)決策樹(shù)分類器的集成,決策樹(shù)得出結(jié)果后,通過(guò)對(duì)不同結(jié)果實(shí)行簡(jiǎn)單投票法來(lái)獲得最終結(jié)果。隨機(jī)森林具有泛化能力強(qiáng)、訓(xùn)練速度快等特點(diǎn),同時(shí)隨機(jī)森林還具有樣本隨機(jī)性以及特征選取隨機(jī)性,降低了每一棵決策樹(shù)的相關(guān)性,保證隨機(jī)森林的分類能力。其算法結(jié)構(gòu)如圖2所示。
圖2 隨機(jī)森林算法結(jié)構(gòu)圖
其算法流程如下:①首先對(duì)給定的訓(xùn)練特征集F進(jìn)行有放回的隨機(jī)抽樣,形成子訓(xùn)練集,即θ;②子訓(xùn)練集θ一共有M個(gè)屬性特征,在決策樹(shù)的每個(gè)節(jié)點(diǎn)需要分裂時(shí),從中任意選出m個(gè)特征做為候選的分裂屬性特征;③計(jì)算所選m個(gè)特征的信息增益,并將其中增益最大作為分裂特征屬性;④每個(gè)節(jié)點(diǎn)都按照上面步驟進(jìn)行分裂,直到生成的決策樹(shù)可以準(zhǔn)確地將訓(xùn)練特征集F中的樣本進(jìn)行分類,或者用完所有屬性特征;⑤重復(fù)上述步驟,建立大量決策樹(shù)并組成隨機(jī)森林模型。
將提取到的CSP特征作輸入到隨機(jī)森林分類器中,得到最后的分類結(jié)果。
本文實(shí)驗(yàn)數(shù)據(jù)來(lái)源于奧地利Graz University of Technology提供的BCI Competition 2008 data sets 2b數(shù)據(jù)集,該實(shí)驗(yàn)中共有9個(gè)受試者(編號(hào)為B01~B09),每個(gè)受試者視力都正常。經(jīng)過(guò)實(shí)驗(yàn)最終獲得9個(gè)受試者的左右手運(yùn)動(dòng)想象腦電數(shù)據(jù)。
實(shí)驗(yàn)過(guò)程如圖3所示,實(shí)驗(yàn)一共持續(xù)8 s~9 s,前兩秒,屏幕上出現(xiàn)一個(gè)“+”,該時(shí)間段內(nèi)受試者放空大腦,不進(jìn)行任何想象。第二秒時(shí),出現(xiàn)一個(gè)持續(xù)時(shí)間為70 ms的蜂鳴聲。從第三秒開(kāi)始,屏幕上出現(xiàn)一個(gè)持續(xù)時(shí)間為1.25 s的提示箭頭,受試者根據(jù)箭頭指示,進(jìn)行持續(xù)時(shí)間為3 s的運(yùn)動(dòng)想象。最后受試者休息1.5 s,為下一次測(cè)試做準(zhǔn)備。每個(gè)受試者進(jìn)行三組測(cè)試,前兩組測(cè)試均進(jìn)行60次左手運(yùn)動(dòng)想象以及60次右手運(yùn)動(dòng)想象,第三組測(cè)試進(jìn)行80次運(yùn)動(dòng)想象,每個(gè)受試者總計(jì)進(jìn)行200次左手及右手運(yùn)動(dòng)想象。
圖3 實(shí)驗(yàn)過(guò)程
該次實(shí)驗(yàn)只記錄了C3、C4以及CZ三個(gè)電極產(chǎn)生的EEG信號(hào)以及三個(gè)眼電通道所記錄的眼電信號(hào),其中采樣頻率為250 Hz,并對(duì)EEG信號(hào)進(jìn)行了50 Hz的陷波處理以及0.5 Hz~100 Hz的帶通濾波處理,電極分布為國(guó)際10-20系統(tǒng),如圖4所示。
圖4 電極分布圖
當(dāng)受試者進(jìn)行實(shí)驗(yàn)時(shí),運(yùn)動(dòng)想象所產(chǎn)生的EEG信號(hào)頻段主要集中在8 Hz~30 Hz,因此采用FIR帶通濾波器對(duì)EEG信號(hào)進(jìn)行8 Hz~30 Hz的帶通濾波處理。由實(shí)驗(yàn)過(guò)程可知,前幾秒數(shù)據(jù)與運(yùn)動(dòng)想象無(wú)關(guān)且考慮到受試者需要反應(yīng)時(shí)間,本文選取每次實(shí)驗(yàn)中的4 s~7 s的數(shù)據(jù)進(jìn)行分析,因此對(duì)濾波后的EEG信號(hào)進(jìn)行事件分段以及偽跡去除。
通過(guò)LMD將EEG信號(hào)分解為多個(gè)PF分量以及一個(gè)殘余分量,并對(duì)最具判別性的PF分量進(jìn)行后續(xù)分析。其中以C3通道一次運(yùn)動(dòng)想象為例,利用LMD對(duì)腦電信號(hào)進(jìn)行分解,結(jié)果如圖5、圖6所示。
圖5 左手運(yùn)動(dòng)想象PF分量波形及頻譜圖
從圖5、圖6均可以看出,PF3以及PF4分量的頻率都在5 Hz以下,而EEG信號(hào)對(duì)應(yīng)的頻段為8 Hz~30 Hz。因此根據(jù)運(yùn)動(dòng)想象腦電信號(hào)的頻帶范圍,選取PF1和PF2分量作為后續(xù)分析對(duì)象。將所有選取出來(lái)的左右手運(yùn)動(dòng)想象的PF分量矩陣分別作為CSP的輸入進(jìn)行特征提取,最后可以得到200組左手及200組右手CSP特征向量,共400組特征向量。
圖6 右手運(yùn)動(dòng)想象PF分量波形及頻譜圖
為了保證分類結(jié)果的準(zhǔn)確性以及有效性,將得到的400組CSP特征向量隨機(jī)選取百分之七十作為訓(xùn)練集,百分之三十作為測(cè)試集,并輸入到隨機(jī)森林分類器中。而隨機(jī)森林分類器最終的分類結(jié)果與隨機(jī)森林中決策樹(shù)的個(gè)數(shù)有關(guān),為了保證最終分類準(zhǔn)確率達(dá)到最高,因此選取不同數(shù)目的決策樹(shù),看其與分類準(zhǔn)確率的關(guān)系,其結(jié)果如圖7所示。
圖7 決策樹(shù)對(duì)分類準(zhǔn)確率影響圖
由圖6可以看出,決策樹(shù)大約在達(dá)到40棵及以后時(shí),腦電信號(hào)的分類準(zhǔn)確率達(dá)到最高,考慮到算法響應(yīng)時(shí)間等因素,決策樹(shù)選取為40棵。將其中一位受試者的測(cè)試集數(shù)據(jù)輸入到隨機(jī)森林分類器中,得到結(jié)果如圖8所示。
圖8 分類結(jié)果圖
上圖中類別1代表左手運(yùn)動(dòng)想象,類別2代表右手運(yùn)動(dòng)想象。當(dāng)“o”與“*”重合時(shí),說(shuō)明分類結(jié)果的類別與實(shí)際類別一樣,從圖中可以看出左右手運(yùn)動(dòng)想象的分類結(jié)果大多與實(shí)際類別相同,其中右手分類準(zhǔn)確率達(dá)到92.4%,左手分類準(zhǔn)確率達(dá)到98.1%,具有較高的分類準(zhǔn)確率。為保證實(shí)驗(yàn)結(jié)果的可靠性以及普遍性,對(duì)每位受試者進(jìn)行了50次實(shí)驗(yàn),得到其每次實(shí)驗(yàn)的分類準(zhǔn)確率,并最終取50次實(shí)驗(yàn)的分類準(zhǔn)確率的平均值為最后的分類準(zhǔn)確率,其結(jié)果如表1所示。
表1 所有受試者分類準(zhǔn)確率
從表中可以看出,受試者B09的分類準(zhǔn)確率最低時(shí),只有81.5%,而受試者B04的分類準(zhǔn)確率最高時(shí),達(dá)到了99.1%。同時(shí)9位受試者中的平均分類準(zhǔn)確率都達(dá)到了90%以上,說(shuō)明LMD-CSP+RF方法運(yùn)用在EEG信號(hào)特征提取以及分類識(shí)別上是有效可行的。
為更好的驗(yàn)證LMD-CSP+RF方法的可行性,將9位受試者的分類準(zhǔn)確率的平均值作為該方法的最終分類準(zhǔn)確率,并將LMD-CSP+RF方法與其他方法得到的結(jié)果進(jìn)行對(duì)比分析,其結(jié)果如表2所示。
表2 本文方法與其他方法分類準(zhǔn)確率比較
由表2可以看出采用LMD-CSP+RF方法對(duì)EEG信號(hào)進(jìn)行分類識(shí)別得到的分類準(zhǔn)確率遠(yuǎn)高于其他文獻(xiàn)方法,相比于其他文獻(xiàn)采用的CapsNet方法、HHT+SVM方法、LRCSP+SVM方法、PS0-CSP+SVM方法、ORCSP+SVM方法對(duì)EEG信號(hào)進(jìn)行分類識(shí)別,分類準(zhǔn)確率分別提高了13.74%、11.1%、10.06%、4.53%、2.4%,進(jìn)行一步證明了本文方法對(duì)腦電信號(hào)特征提取以及分類識(shí)別的有效性。
針對(duì)EEG信號(hào)具有非平穩(wěn)性、非線性等特性而導(dǎo)致特征提取困難、分類準(zhǔn)確率低的問(wèn)題,本文提出一種基于LMD-CSP和隨機(jī)森林的運(yùn)動(dòng)想象腦電信號(hào)分類方法。利用LMD對(duì)BCI Competition 2008 data sets 2b數(shù)據(jù)集中腦電信號(hào)進(jìn)行分解,選取最具判別性的PF分量并通過(guò)CSP進(jìn)行特征提取,之后將CSP特征輸入到隨機(jī)森林分類器,最終分類準(zhǔn)確率達(dá)到了92.18%。為了進(jìn)行一步驗(yàn)證本文方法的有效性以及可行性,對(duì)比了本文方法與其他文獻(xiàn)方法的EEG信號(hào)分類準(zhǔn)確率,結(jié)果表明:相比于其他算法,本文方法的分類準(zhǔn)確率有了明顯的提升,為基于運(yùn)動(dòng)想象EEG信號(hào)的BCI技術(shù)提供一種新方法與思路。