(東南大學(xué) 儀器科學(xué)與工程學(xué)院,江蘇 南京 210096)
腦電信號(hào)(Electroencephalogram,EEG)是人類(lèi)通過(guò)大腦在進(jìn)行想象活動(dòng)時(shí),大量的腦神經(jīng)細(xì)胞主動(dòng)參與到腦部信息處理過(guò)程中產(chǎn)生的一種生物電信號(hào)[1]。腦機(jī)接口(Brain-Computer Interface,BCI)就是利用大腦產(chǎn)生的腦電信號(hào)不經(jīng)過(guò)外周神經(jīng)和肌肉組織直接與計(jì)算機(jī)等外圍控制設(shè)備建立起的信息交流和控制通道[2]。近年來(lái),隨著人口老齡化趨勢(shì)的上升,以上肢功能運(yùn)動(dòng)障礙最為常見(jiàn)的偏癱患者日益增多,基于腦機(jī)接口的康復(fù)醫(yī)療技術(shù)現(xiàn)已成為康復(fù)領(lǐng)域中的研究熱點(diǎn)[3]。
BCI系統(tǒng)如何快速準(zhǔn)確地識(shí)別出EEG信號(hào)所表達(dá)的信息,已經(jīng)成為衡量一個(gè)BCI系統(tǒng)是否優(yōu)良的重要指標(biāo),其中,特征提取和特征分類(lèi)是BCI研究方向上的重要技術(shù)。在特征提取方面,由于EEG信號(hào)是一種非平穩(wěn)隨機(jī)信號(hào),且具有時(shí)變敏感性和個(gè)體差異性大等特點(diǎn),因此優(yōu)良的特征提取方法對(duì)BCI系統(tǒng)至為關(guān)鍵。目前針對(duì)EEG信號(hào)常用的特征提取方法有:① 針對(duì)單一的時(shí)頻域特性的方法[4],由于易受噪聲的影響而造成模式的識(shí)別率較低。② 自回歸(Auto Regression,AR)模型[5]和自適應(yīng)自回歸(Adaptive Auto Regression,AAR)模型[6]。AR模型主要針對(duì)平穩(wěn)的隨機(jī)信號(hào),在處理非平穩(wěn)的EEG信號(hào)時(shí)具有其局限性;AAR模型雖然彌補(bǔ)了AR模型在短信號(hào)分析時(shí)的局限性,但其更適合平穩(wěn)的隨機(jī)信號(hào)。③ 快速傅里葉變換(Fast Fourier Transformation,FFT)[7],其在處理平穩(wěn)信號(hào)中起到了重要的作用,但在像EEG信號(hào)這種非平穩(wěn)隨機(jī)信號(hào)的處理中受到了許多局限。④ 小波變換[8]。該方法是一種典型的時(shí)頻分析算法,具有多分辨率特性,在頻域和時(shí)域均保持良好的分辨率,非常適用于處理EEG等非平穩(wěn)信號(hào)。
在特征分類(lèi)方面,目前常采用線(xiàn)性分類(lèi)LDA[9]、支持向量機(jī)SVM[10]等的分類(lèi)方法。線(xiàn)性分類(lèi)器LDA在進(jìn)行一些非線(xiàn)性特征分類(lèi)任務(wù)時(shí)會(huì)存在分類(lèi)準(zhǔn)確度不高的問(wèn)題。支持向量機(jī)SVM通過(guò)將低維的特征映射到高維空間中,通過(guò)構(gòu)建超平面的方式從而達(dá)到特征可分,這種分類(lèi)器的分類(lèi)性能往往受到多種核函數(shù)和相關(guān)參數(shù)的影響較大,且分類(lèi)器訓(xùn)練時(shí)間一般較長(zhǎng)。而梯度提升決策樹(shù)(Gradient Boosting Decision Tree,GBDT)分類(lèi)算法是一種基于梯度提升和分類(lèi)回歸決策樹(shù)相結(jié)合的分類(lèi)算法,通過(guò)多分類(lèi)器融合決策的方式可以顯著提高分類(lèi)器的性能,還具有防止過(guò)擬合等優(yōu)點(diǎn)[11]。
由于雙樹(shù)復(fù)小波變換具有較好頻率抗混疊和抗噪能力的特點(diǎn),適用于處理具有非平穩(wěn)時(shí)變的EEG信號(hào)[12]。本文利用雙樹(shù)復(fù)小波變換作為EEG信號(hào)特征的提取方法,而后采用4個(gè)典型的時(shí)間分段作為特征提取的時(shí)間段,分別計(jì)算相應(yīng)時(shí)間段內(nèi)信號(hào)的能量均值作為GBDT分類(lèi)器的特征向量進(jìn)行分類(lèi)比較。
雙樹(shù)復(fù)小波變換(Dual-Tree Complex Wavelet Transform,DTCWT)的概念最初是由Kingsbury[13]提出,而后Selesnick[14]等又在2005年進(jìn)一步完善了雙樹(shù)復(fù)小波變換的分解與重構(gòu)算法。相對(duì)于小波包變換(Wavelet Packet Transform,WPT),雙樹(shù)復(fù)小波變換通過(guò)引入兩路離散小波變換的方式對(duì)原始信號(hào)進(jìn)行分解和重構(gòu),其一為實(shí)部樹(shù),另一為虛部樹(shù),如圖1所示。由于虛部樹(shù)變換相對(duì)于實(shí)部樹(shù)變換的具有延時(shí)的特點(diǎn),使得虛部樹(shù)變換采樣恰好能夠采集到實(shí)部樹(shù)變換采樣時(shí)丟失的原始信息,實(shí)現(xiàn)信息的有效互補(bǔ),較為完善地保留原始信號(hào)的時(shí)頻域信息,從而實(shí)現(xiàn)雙樹(shù)復(fù)小波變換能夠較為完整地分解重構(gòu)出原始信號(hào)。
圖1 雙樹(shù)復(fù)小波變換的分解和重構(gòu)
雙樹(shù)復(fù)小波變換由兩路離散小波變換組成,實(shí)部樹(shù)的離散小波變換系數(shù)為
(1)
(2)
式中,j=1,2,3,…,J。
虛部樹(shù)的離散小波變換系數(shù)為
(3)
(4)
式中,j=1,2,3,…,J,ψh和ψg為變換的兩個(gè)實(shí)小波,φh和φg為變換的尺度函數(shù)。
由此可得DTCWT在各層的實(shí)小波變換系數(shù)和虛小波變換系數(shù):
(5)
(6)
式中,j=1,2,…,J。
雙樹(shù)復(fù)小波變換的細(xì)節(jié)系數(shù)和近似系數(shù)重構(gòu)為
(7)
(8)
經(jīng)重構(gòu)后即可得到雙樹(shù)復(fù)小波變換在各層下的細(xì)節(jié)系數(shù)和近似系數(shù),若設(shè)本文的原始EEG信號(hào)的采樣頻率為fs,則原始信號(hào)經(jīng)過(guò)L層分解和重構(gòu)后的各個(gè)分量AL,DL,DL-1,…,D1所對(duì)應(yīng)的頻率段分別為[0,fs/2L+1],[fs/2L+1,fs/2L],[fs/2L,fs/2L-1],…,[fs/22,fs/2]。
梯度提升(Gradient Boosting)算法是機(jī)器學(xué)習(xí)中的一種算法,常用于處理分類(lèi)和回歸問(wèn)題?;谔荻忍嵘姆诸?lèi)算法產(chǎn)生的預(yù)估模型建立在一個(gè)弱分類(lèi)器的基礎(chǔ)上,在進(jìn)行訓(xùn)練時(shí),通過(guò)不斷地對(duì)弱分類(lèi)器的殘差損失函數(shù)進(jìn)行迭代和優(yōu)化,其中每次迭代的結(jié)果產(chǎn)生一個(gè)新的弱分類(lèi)器,這個(gè)弱分類(lèi)器將對(duì)前一個(gè)弱分類(lèi)器在負(fù)梯度方向上的殘差損失進(jìn)行優(yōu)化,減小上次迭代結(jié)果產(chǎn)生的近似殘差,最終總分類(lèi)器的結(jié)果就是由每輪迭代的弱分類(lèi)器加權(quán)和得到,形成較為理想的預(yù)估模型。在實(shí)際應(yīng)用中,弱分類(lèi)器的選取較為典型的就是分類(lèi)回歸決策樹(shù)(Classification and Regression Tree,CART),本文所使用的梯度提升決策樹(shù)(Gradient Boosting Decision tree,GBDT)分類(lèi)算法就是基于梯度提升結(jié)合分類(lèi)回歸決策樹(shù)的一種算法[15]。梯度提升決策樹(shù)分類(lèi)器算法具體訓(xùn)練步驟可總結(jié)如下:
(2) 初始化模型的初始值F0(x)。
(9)
其中,可以通過(guò)最小化殘差的方式來(lái)求取γ參數(shù)值。
(3) 經(jīng)過(guò)對(duì)模型賦予初始值,接下來(lái)就可以對(duì)模型進(jìn)行M次迭代,設(shè)迭代次數(shù)的變量為m(m=1,2,3,…,M)。則可由下式計(jì)算第m次沿負(fù)梯度方向的近似殘差:
(10)
式中,i=1,2,3,…,n。
(5) 計(jì)算hm(x)分類(lèi)器的權(quán)重系數(shù)。
(11)
式中,γm為當(dāng)前樣本殘差下決策樹(shù)分類(lèi)器hm(x)的權(quán)重系數(shù)。
(6) 更新訓(xùn)練模型,可得輸出函數(shù)Fm(x),迭代M次后,即可輸出最終的預(yù)估分類(lèi)模型FM(x)。
Fm(x)=Fm-1(x)+γmhm(x)
(12)
訓(xùn)練完成后,求得各個(gè)決策樹(shù)分類(lèi)器在不同迭代次數(shù)下的權(quán)重系數(shù),梯度提升分類(lèi)決策樹(shù)分類(lèi)器FM(x)即可對(duì)輸入的測(cè)試集數(shù)據(jù)進(jìn)行測(cè)試,所得的結(jié)果即為不同決策樹(shù)分類(lèi)器在不同權(quán)重下的最接近于真實(shí)標(biāo)簽的結(jié)果。
本文采用的實(shí)驗(yàn)數(shù)據(jù)是由Graz大學(xué)提供的2003年著名的BCI競(jìng)賽DataSetⅢ的標(biāo)準(zhǔn)數(shù)據(jù)集。數(shù)據(jù)集采集對(duì)象是一位25歲的正常女性,該女性會(huì)根據(jù)屏幕上隨機(jī)出現(xiàn)的左右手提示進(jìn)行想象。實(shí)驗(yàn)分為7組進(jìn)行,每組進(jìn)行40次實(shí)驗(yàn),共280次實(shí)驗(yàn),所有組的實(shí)驗(yàn)都會(huì)在同一天內(nèi)完成。每次實(shí)驗(yàn)用時(shí)9 s,時(shí)序圖如圖2所示。前2 s為靜息時(shí)間,2 s后會(huì)有一個(gè)聲音提示并且屏幕上出現(xiàn)持續(xù)時(shí)間為1 s 的‘+’提示符,提示1 s后將開(kāi)始想象左右手運(yùn)動(dòng)。實(shí)驗(yàn)進(jìn)行到3 s時(shí),屏幕上將隨機(jī)出現(xiàn)一個(gè)指向左或右的箭頭提示,在3~9 s時(shí)間段內(nèi),要求被測(cè)試者想象左右手運(yùn)動(dòng)。
圖2 實(shí)驗(yàn)時(shí)序圖
被測(cè)試者的腦電信號(hào)由C3、CZ和C4三個(gè)腦電導(dǎo)聯(lián)采集,采樣頻率為128 Hz并經(jīng)過(guò)0.5~30 Hz的粗略去除噪聲信號(hào)的濾波處理。數(shù)據(jù)集中包含140個(gè)訓(xùn)練集樣本和140個(gè)測(cè)試集樣本,其中70次為想象左手運(yùn)動(dòng),70次為想象右手運(yùn)動(dòng),另測(cè)試集樣本的真實(shí)標(biāo)簽已在賽后公布。
當(dāng)人體在進(jìn)行運(yùn)動(dòng)想象時(shí),大腦對(duì)側(cè)的運(yùn)動(dòng)感知皮層就被激活,該區(qū)域中的代謝及血流量均增加,神經(jīng)元活動(dòng)加強(qiáng),腦電信號(hào)獨(dú)立性增強(qiáng),同步化程度降低,進(jìn)而造成μ節(jié)律(8~12 Hz)和β節(jié)律(14~35 Hz)能量減少;而同時(shí)大腦同側(cè)的運(yùn)動(dòng)感知皮層的神經(jīng)元活動(dòng)被抑制,進(jìn)而導(dǎo)致μ節(jié)律和β節(jié)律能量值升高,這種現(xiàn)象被稱(chēng)為事件相關(guān)去同步(Event-Related Desynchronization,ERD)和事件相關(guān)同步(Event-Related Synchronization,ERS)。ERD/ERS規(guī)律的發(fā)現(xiàn)為腦電信號(hào)的運(yùn)動(dòng)想象分類(lèi)提供了一種思路。
雙樹(shù)復(fù)小波變換相對(duì)于小波包分解在頻域上更具有抗混疊能力,為了驗(yàn)證這個(gè)結(jié)論,本文選取了對(duì)非平穩(wěn)腦電信號(hào)適應(yīng)性良好的db5小波作為基波函數(shù),對(duì)訓(xùn)練集中的一個(gè)原始腦電信號(hào)分別做雙樹(shù)復(fù)小波和小波包的4層分解重構(gòu),由于8~16 Hz包含了μ節(jié)律和部分的β節(jié)律信息,因此本文對(duì)8~16 Hz對(duì)應(yīng)的近似系數(shù)D3進(jìn)行重構(gòu)。原始腦電信號(hào)波形、小波包分解重構(gòu)的D3波形和雙樹(shù)復(fù)小波分解重構(gòu)的D3波形在時(shí)域上的對(duì)比圖如圖3所示,從圖中可以看出重構(gòu)后的D3波形在時(shí)域上相近。
圖3 原始波形、WPT和DTCWT重構(gòu)的D3波形對(duì)比
為了進(jìn)行對(duì)比分析,本文對(duì)原始信號(hào)通過(guò)數(shù)字帶通濾波器進(jìn)行了8~16 Hz的濾波處理,濾波后的原始信號(hào)的頻譜分別與DTCWT和WPT的分解重構(gòu)D3波形的頻譜進(jìn)行對(duì)比,如圖4所示。
圖4 DTCWT和WPT重構(gòu)的D3波形頻譜對(duì)比
從圖中可以看出DTCWT通過(guò)分解重構(gòu)D3波形能夠較為完整地復(fù)現(xiàn)原始腦電信號(hào)在8~16 Hz頻段的信息,具有較好的頻率抗混疊能力。相反地,WPT分解重構(gòu)的D3波形造成了頻率混疊,不能完整地復(fù)現(xiàn)原始信號(hào)在8~16 Hz頻段的信息。因此,相比于WPT,DTCWT利用實(shí)部樹(shù)和虛部樹(shù)的隔點(diǎn)采樣和信息互補(bǔ)有效抑制了頻率的混疊現(xiàn)象。
為了確定用于腦電信號(hào)特征提取的時(shí)間段,本文對(duì)140個(gè)訓(xùn)練集樣本中的70個(gè)想象左手運(yùn)動(dòng)樣本和70個(gè)想象右手樣本分別經(jīng)DTCWT提取8~16 Hz的腦電信號(hào)分量并求取能量均值,想象左右手運(yùn)動(dòng)的C3和C4導(dǎo)聯(lián)能量均值的對(duì)比圖如圖5所示。
圖5 想象左右手運(yùn)動(dòng)C3和C4導(dǎo)聯(lián)能量均值對(duì)比
從圖中可以看出,在想象左手運(yùn)動(dòng)時(shí),C3側(cè)腦部區(qū)域的活動(dòng)能量增加,而C3對(duì)側(cè)的C4側(cè)腦部區(qū)域的活動(dòng)能量則相應(yīng)減少。在想象右手運(yùn)動(dòng)時(shí),則相反。這一現(xiàn)象有效的證實(shí)了ERD/ERS現(xiàn)象。
根據(jù)ERD/ERS現(xiàn)象,本文將腦電信號(hào)經(jīng)DTCWT提取8~16 Hz腦電信號(hào)分量的能量均值作為C3和C4導(dǎo)聯(lián)的特征,以此構(gòu)成二維的特征向量作為樣本的輸入訓(xùn)練集。相同地,測(cè)試集的原始C3和C4導(dǎo)聯(lián)腦電信號(hào)數(shù)據(jù)也同樣經(jīng)過(guò)訓(xùn)練集數(shù)據(jù)的預(yù)處理,構(gòu)成的二維特征向量作為本文GBDT的輸入測(cè)試集。其中,能量均值計(jì)算表達(dá)式為
(13)
觀(guān)察想象左右手運(yùn)動(dòng)的C3和C4導(dǎo)聯(lián)的能量均值對(duì)比圖可以發(fā)現(xiàn),C3和C4導(dǎo)聯(lián)在4~6 s的時(shí)間段具有較高的類(lèi)間區(qū)分度,一般地,在3~9 s想象左右手運(yùn)動(dòng)的時(shí)間段內(nèi),4~6 s時(shí)間段往往具有較好的類(lèi)間區(qū)分度,所以本文選取了4個(gè)時(shí)間段4~6 s,4.5~5.5 s,4~5 s和5~6 s作為特征提取的時(shí)間段。其中,由于原始腦電信號(hào)的采樣頻率為128 Hz,所以4~6 s時(shí)間段包含原始腦電信號(hào)D3重構(gòu)分量的256個(gè)采樣點(diǎn),其余3個(gè)時(shí)間段4.5~5.5 s、4~5 s、5~6 s包含原始腦電信號(hào)D3重構(gòu)分量的128個(gè)采樣點(diǎn),分別對(duì)這些采樣點(diǎn)求取能量均值。最后,通過(guò)GBDT對(duì)4個(gè)時(shí)間段內(nèi)腦電信號(hào)進(jìn)行分類(lèi),分類(lèi)結(jié)果如表1所示。
表1 GBDT在各時(shí)間段分類(lèi)準(zhǔn)確度
通過(guò)比較這4個(gè)時(shí)間分段的測(cè)試集分類(lèi)準(zhǔn)確度可知,在4~6 s時(shí)間段訓(xùn)練的GBDT分類(lèi)器具有較好的分類(lèi)效果,測(cè)試集的分類(lèi)準(zhǔn)確度最高為82.14%,此時(shí)訓(xùn)練集的分類(lèi)準(zhǔn)確度為87.86%,測(cè)試分類(lèi)結(jié)果達(dá)到了與BCI競(jìng)賽優(yōu)勝組第3名成績(jī)相近的水平(第1名89.29%,第2名84.29%,第3名82.86%)。
針對(duì)EEG信號(hào)的非平穩(wěn)時(shí)變和個(gè)體差異性大等特點(diǎn),本文提出了基于雙樹(shù)復(fù)小波變換結(jié)合GBDT的腦電信號(hào)模式識(shí)別的方法。首先經(jīng)過(guò)實(shí)驗(yàn)證明了DTCWT相比于WPT在頻率域上具有更好的抗混疊能力;接著通過(guò)DTCWT提取左右手想象運(yùn)動(dòng)的能量均值,驗(yàn)證了ERD/ERS現(xiàn)象;最后通過(guò)比較4個(gè)時(shí)間段的分類(lèi)準(zhǔn)確度,驗(yàn)證了雙樹(shù)復(fù)小波變換結(jié)合GBDT在想象運(yùn)動(dòng)腦電信號(hào)識(shí)別應(yīng)用中的有效性,為GBDT分類(lèi)算法在腦電信號(hào)分類(lèi)的應(yīng)用中提供了一定的參考價(jià)值。