(東南大學(xué) 儀器科學(xué)與工程學(xué)院,江蘇 南京 210096)
腦電信號(Electroencephalogram,EEG)是人類通過大腦在進行想象活動時,大量的腦神經(jīng)細胞主動參與到腦部信息處理過程中產(chǎn)生的一種生物電信號[1]。腦機接口(Brain-Computer Interface,BCI)就是利用大腦產(chǎn)生的腦電信號不經(jīng)過外周神經(jīng)和肌肉組織直接與計算機等外圍控制設(shè)備建立起的信息交流和控制通道[2]。近年來,隨著人口老齡化趨勢的上升,以上肢功能運動障礙最為常見的偏癱患者日益增多,基于腦機接口的康復(fù)醫(yī)療技術(shù)現(xiàn)已成為康復(fù)領(lǐng)域中的研究熱點[3]。
BCI系統(tǒng)如何快速準確地識別出EEG信號所表達的信息,已經(jīng)成為衡量一個BCI系統(tǒng)是否優(yōu)良的重要指標,其中,特征提取和特征分類是BCI研究方向上的重要技術(shù)。在特征提取方面,由于EEG信號是一種非平穩(wěn)隨機信號,且具有時變敏感性和個體差異性大等特點,因此優(yōu)良的特征提取方法對BCI系統(tǒng)至為關(guān)鍵。目前針對EEG信號常用的特征提取方法有:① 針對單一的時頻域特性的方法[4],由于易受噪聲的影響而造成模式的識別率較低。② 自回歸(Auto Regression,AR)模型[5]和自適應(yīng)自回歸(Adaptive Auto Regression,AAR)模型[6]。AR模型主要針對平穩(wěn)的隨機信號,在處理非平穩(wěn)的EEG信號時具有其局限性;AAR模型雖然彌補了AR模型在短信號分析時的局限性,但其更適合平穩(wěn)的隨機信號。③ 快速傅里葉變換(Fast Fourier Transformation,FFT)[7],其在處理平穩(wěn)信號中起到了重要的作用,但在像EEG信號這種非平穩(wěn)隨機信號的處理中受到了許多局限。④ 小波變換[8]。該方法是一種典型的時頻分析算法,具有多分辨率特性,在頻域和時域均保持良好的分辨率,非常適用于處理EEG等非平穩(wěn)信號。
在特征分類方面,目前常采用線性分類LDA[9]、支持向量機SVM[10]等的分類方法。線性分類器LDA在進行一些非線性特征分類任務(wù)時會存在分類準確度不高的問題。支持向量機SVM通過將低維的特征映射到高維空間中,通過構(gòu)建超平面的方式從而達到特征可分,這種分類器的分類性能往往受到多種核函數(shù)和相關(guān)參數(shù)的影響較大,且分類器訓(xùn)練時間一般較長。而梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)分類算法是一種基于梯度提升和分類回歸決策樹相結(jié)合的分類算法,通過多分類器融合決策的方式可以顯著提高分類器的性能,還具有防止過擬合等優(yōu)點[11]。
由于雙樹復(fù)小波變換具有較好頻率抗混疊和抗噪能力的特點,適用于處理具有非平穩(wěn)時變的EEG信號[12]。本文利用雙樹復(fù)小波變換作為EEG信號特征的提取方法,而后采用4個典型的時間分段作為特征提取的時間段,分別計算相應(yīng)時間段內(nèi)信號的能量均值作為GBDT分類器的特征向量進行分類比較。
雙樹復(fù)小波變換(Dual-Tree Complex Wavelet Transform,DTCWT)的概念最初是由Kingsbury[13]提出,而后Selesnick[14]等又在2005年進一步完善了雙樹復(fù)小波變換的分解與重構(gòu)算法。相對于小波包變換(Wavelet Packet Transform,WPT),雙樹復(fù)小波變換通過引入兩路離散小波變換的方式對原始信號進行分解和重構(gòu),其一為實部樹,另一為虛部樹,如圖1所示。由于虛部樹變換相對于實部樹變換的具有延時的特點,使得虛部樹變換采樣恰好能夠采集到實部樹變換采樣時丟失的原始信息,實現(xiàn)信息的有效互補,較為完善地保留原始信號的時頻域信息,從而實現(xiàn)雙樹復(fù)小波變換能夠較為完整地分解重構(gòu)出原始信號。
圖1 雙樹復(fù)小波變換的分解和重構(gòu)
雙樹復(fù)小波變換由兩路離散小波變換組成,實部樹的離散小波變換系數(shù)為
(1)
(2)
式中,j=1,2,3,…,J。
虛部樹的離散小波變換系數(shù)為
(3)
(4)
式中,j=1,2,3,…,J,ψh和ψg為變換的兩個實小波,φh和φg為變換的尺度函數(shù)。
由此可得DTCWT在各層的實小波變換系數(shù)和虛小波變換系數(shù):
(5)
(6)
式中,j=1,2,…,J。
雙樹復(fù)小波變換的細節(jié)系數(shù)和近似系數(shù)重構(gòu)為
(7)
(8)
經(jīng)重構(gòu)后即可得到雙樹復(fù)小波變換在各層下的細節(jié)系數(shù)和近似系數(shù),若設(shè)本文的原始EEG信號的采樣頻率為fs,則原始信號經(jīng)過L層分解和重構(gòu)后的各個分量AL,DL,DL-1,…,D1所對應(yīng)的頻率段分別為[0,fs/2L+1],[fs/2L+1,fs/2L],[fs/2L,fs/2L-1],…,[fs/22,fs/2]。
梯度提升(Gradient Boosting)算法是機器學(xué)習(xí)中的一種算法,常用于處理分類和回歸問題?;谔荻忍嵘姆诸愃惴óa(chǎn)生的預(yù)估模型建立在一個弱分類器的基礎(chǔ)上,在進行訓(xùn)練時,通過不斷地對弱分類器的殘差損失函數(shù)進行迭代和優(yōu)化,其中每次迭代的結(jié)果產(chǎn)生一個新的弱分類器,這個弱分類器將對前一個弱分類器在負梯度方向上的殘差損失進行優(yōu)化,減小上次迭代結(jié)果產(chǎn)生的近似殘差,最終總分類器的結(jié)果就是由每輪迭代的弱分類器加權(quán)和得到,形成較為理想的預(yù)估模型。在實際應(yīng)用中,弱分類器的選取較為典型的就是分類回歸決策樹(Classification and Regression Tree,CART),本文所使用的梯度提升決策樹(Gradient Boosting Decision tree,GBDT)分類算法就是基于梯度提升結(jié)合分類回歸決策樹的一種算法[15]。梯度提升決策樹分類器算法具體訓(xùn)練步驟可總結(jié)如下:
(2) 初始化模型的初始值F0(x)。
(9)
其中,可以通過最小化殘差的方式來求取γ參數(shù)值。
(3) 經(jīng)過對模型賦予初始值,接下來就可以對模型進行M次迭代,設(shè)迭代次數(shù)的變量為m(m=1,2,3,…,M)。則可由下式計算第m次沿負梯度方向的近似殘差:
(10)
式中,i=1,2,3,…,n。
(5) 計算hm(x)分類器的權(quán)重系數(shù)。
(11)
式中,γm為當前樣本殘差下決策樹分類器hm(x)的權(quán)重系數(shù)。
(6) 更新訓(xùn)練模型,可得輸出函數(shù)Fm(x),迭代M次后,即可輸出最終的預(yù)估分類模型FM(x)。
Fm(x)=Fm-1(x)+γmhm(x)
(12)
訓(xùn)練完成后,求得各個決策樹分類器在不同迭代次數(shù)下的權(quán)重系數(shù),梯度提升分類決策樹分類器FM(x)即可對輸入的測試集數(shù)據(jù)進行測試,所得的結(jié)果即為不同決策樹分類器在不同權(quán)重下的最接近于真實標簽的結(jié)果。
本文采用的實驗數(shù)據(jù)是由Graz大學(xué)提供的2003年著名的BCI競賽DataSetⅢ的標準數(shù)據(jù)集。數(shù)據(jù)集采集對象是一位25歲的正常女性,該女性會根據(jù)屏幕上隨機出現(xiàn)的左右手提示進行想象。實驗分為7組進行,每組進行40次實驗,共280次實驗,所有組的實驗都會在同一天內(nèi)完成。每次實驗用時9 s,時序圖如圖2所示。前2 s為靜息時間,2 s后會有一個聲音提示并且屏幕上出現(xiàn)持續(xù)時間為1 s 的‘+’提示符,提示1 s后將開始想象左右手運動。實驗進行到3 s時,屏幕上將隨機出現(xiàn)一個指向左或右的箭頭提示,在3~9 s時間段內(nèi),要求被測試者想象左右手運動。
圖2 實驗時序圖
被測試者的腦電信號由C3、CZ和C4三個腦電導(dǎo)聯(lián)采集,采樣頻率為128 Hz并經(jīng)過0.5~30 Hz的粗略去除噪聲信號的濾波處理。數(shù)據(jù)集中包含140個訓(xùn)練集樣本和140個測試集樣本,其中70次為想象左手運動,70次為想象右手運動,另測試集樣本的真實標簽已在賽后公布。
當人體在進行運動想象時,大腦對側(cè)的運動感知皮層就被激活,該區(qū)域中的代謝及血流量均增加,神經(jīng)元活動加強,腦電信號獨立性增強,同步化程度降低,進而造成μ節(jié)律(8~12 Hz)和β節(jié)律(14~35 Hz)能量減少;而同時大腦同側(cè)的運動感知皮層的神經(jīng)元活動被抑制,進而導(dǎo)致μ節(jié)律和β節(jié)律能量值升高,這種現(xiàn)象被稱為事件相關(guān)去同步(Event-Related Desynchronization,ERD)和事件相關(guān)同步(Event-Related Synchronization,ERS)。ERD/ERS規(guī)律的發(fā)現(xiàn)為腦電信號的運動想象分類提供了一種思路。
雙樹復(fù)小波變換相對于小波包分解在頻域上更具有抗混疊能力,為了驗證這個結(jié)論,本文選取了對非平穩(wěn)腦電信號適應(yīng)性良好的db5小波作為基波函數(shù),對訓(xùn)練集中的一個原始腦電信號分別做雙樹復(fù)小波和小波包的4層分解重構(gòu),由于8~16 Hz包含了μ節(jié)律和部分的β節(jié)律信息,因此本文對8~16 Hz對應(yīng)的近似系數(shù)D3進行重構(gòu)。原始腦電信號波形、小波包分解重構(gòu)的D3波形和雙樹復(fù)小波分解重構(gòu)的D3波形在時域上的對比圖如圖3所示,從圖中可以看出重構(gòu)后的D3波形在時域上相近。
圖3 原始波形、WPT和DTCWT重構(gòu)的D3波形對比
為了進行對比分析,本文對原始信號通過數(shù)字帶通濾波器進行了8~16 Hz的濾波處理,濾波后的原始信號的頻譜分別與DTCWT和WPT的分解重構(gòu)D3波形的頻譜進行對比,如圖4所示。
圖4 DTCWT和WPT重構(gòu)的D3波形頻譜對比
從圖中可以看出DTCWT通過分解重構(gòu)D3波形能夠較為完整地復(fù)現(xiàn)原始腦電信號在8~16 Hz頻段的信息,具有較好的頻率抗混疊能力。相反地,WPT分解重構(gòu)的D3波形造成了頻率混疊,不能完整地復(fù)現(xiàn)原始信號在8~16 Hz頻段的信息。因此,相比于WPT,DTCWT利用實部樹和虛部樹的隔點采樣和信息互補有效抑制了頻率的混疊現(xiàn)象。
為了確定用于腦電信號特征提取的時間段,本文對140個訓(xùn)練集樣本中的70個想象左手運動樣本和70個想象右手樣本分別經(jīng)DTCWT提取8~16 Hz的腦電信號分量并求取能量均值,想象左右手運動的C3和C4導(dǎo)聯(lián)能量均值的對比圖如圖5所示。
圖5 想象左右手運動C3和C4導(dǎo)聯(lián)能量均值對比
從圖中可以看出,在想象左手運動時,C3側(cè)腦部區(qū)域的活動能量增加,而C3對側(cè)的C4側(cè)腦部區(qū)域的活動能量則相應(yīng)減少。在想象右手運動時,則相反。這一現(xiàn)象有效的證實了ERD/ERS現(xiàn)象。
根據(jù)ERD/ERS現(xiàn)象,本文將腦電信號經(jīng)DTCWT提取8~16 Hz腦電信號分量的能量均值作為C3和C4導(dǎo)聯(lián)的特征,以此構(gòu)成二維的特征向量作為樣本的輸入訓(xùn)練集。相同地,測試集的原始C3和C4導(dǎo)聯(lián)腦電信號數(shù)據(jù)也同樣經(jīng)過訓(xùn)練集數(shù)據(jù)的預(yù)處理,構(gòu)成的二維特征向量作為本文GBDT的輸入測試集。其中,能量均值計算表達式為
(13)
觀察想象左右手運動的C3和C4導(dǎo)聯(lián)的能量均值對比圖可以發(fā)現(xiàn),C3和C4導(dǎo)聯(lián)在4~6 s的時間段具有較高的類間區(qū)分度,一般地,在3~9 s想象左右手運動的時間段內(nèi),4~6 s時間段往往具有較好的類間區(qū)分度,所以本文選取了4個時間段4~6 s,4.5~5.5 s,4~5 s和5~6 s作為特征提取的時間段。其中,由于原始腦電信號的采樣頻率為128 Hz,所以4~6 s時間段包含原始腦電信號D3重構(gòu)分量的256個采樣點,其余3個時間段4.5~5.5 s、4~5 s、5~6 s包含原始腦電信號D3重構(gòu)分量的128個采樣點,分別對這些采樣點求取能量均值。最后,通過GBDT對4個時間段內(nèi)腦電信號進行分類,分類結(jié)果如表1所示。
表1 GBDT在各時間段分類準確度
通過比較這4個時間分段的測試集分類準確度可知,在4~6 s時間段訓(xùn)練的GBDT分類器具有較好的分類效果,測試集的分類準確度最高為82.14%,此時訓(xùn)練集的分類準確度為87.86%,測試分類結(jié)果達到了與BCI競賽優(yōu)勝組第3名成績相近的水平(第1名89.29%,第2名84.29%,第3名82.86%)。
針對EEG信號的非平穩(wěn)時變和個體差異性大等特點,本文提出了基于雙樹復(fù)小波變換結(jié)合GBDT的腦電信號模式識別的方法。首先經(jīng)過實驗證明了DTCWT相比于WPT在頻率域上具有更好的抗混疊能力;接著通過DTCWT提取左右手想象運動的能量均值,驗證了ERD/ERS現(xiàn)象;最后通過比較4個時間段的分類準確度,驗證了雙樹復(fù)小波變換結(jié)合GBDT在想象運動腦電信號識別應(yīng)用中的有效性,為GBDT分類算法在腦電信號分類的應(yīng)用中提供了一定的參考價值。