龍佳偉,鄭 威,劉 燕,王 玫
(江蘇科技大學 電子信息學院,江蘇 鎮(zhèn)江 212100)
腦-機接口(brain-computer interface,BCI)是一種人腦與外界環(huán)境通信的人機交互系統(tǒng)[1],對于思維正常但神經(jīng)肌肉系統(tǒng)癱瘓或喪失肢體運動能力患者的康復訓練具有重要意義。
研究腦-機接口的關鍵是腦電信號的特征提取。時頻分析法、空域分析法和非線性分析法是腦電特征提取的常用方法。時頻分析法主要有小波變換(wavelet transform,WT)、經(jīng)驗模態(tài)分解(empirical mode decomposition,EMD)等??沼蚍治龇ㄖ饕泄部臻g模式法(common spatial pattern,CSP)、主成分分析(principal component analysis,PCA)等。非線性分析法主要有近似熵(approximate entropy,AE)、樣本熵(sample entropy,SE)、排列熵(permutation entropy,PE)、模糊熵(fuzzy entropy,F(xiàn)E)等。其中,共空間模式法能夠最大化兩類數(shù)據(jù)之間的方差特征,被廣泛應用于運動想象腦電信號的特征提取。Shi Tianwei等人[2]提出了一種新的自適應回歸與CSP相結合的特征提取法,該方法能夠有效提取腦電信號的特征。Guo Yao等人[3]針對CSP算法的局限性提出了濾波器帶分量正則化的公共空間模式方法(filter band component regularized common spatial patterns,F(xiàn)CCSP),該方法具有顯著的優(yōu)越性,平均分類準確率提高了15.72%。
由于腦電信號具有隨機性、非平穩(wěn)性、非線性等特點,單一的特征無法從多個角度分析腦電信號。近年來,將非線性分析法作用于時頻域和空域成為了一種趨勢。Syed Salman Ali等人[4]提出了一個基于最大熵的CSP算法,該算法在估計基于樣本的協(xié)方差矩陣時結合了最大熵原理,分類效果優(yōu)于傳統(tǒng)的CSP算法。Ji Na等人[5]提出了一種基于離散小波變換(discrete wavelet transform,DWT)、經(jīng)驗模態(tài)分解和近似熵的腦電特征提取方法,解決了寬頻帶覆蓋問題,使得運動想象腦電信號的分類效果更加顯著。Li Yanping等人[6]提出基于局部均值分解(local mean decomposition,LMD)和模糊熵的腦電特征提取方法,結果表明,該方法比經(jīng)驗模態(tài)分解法具有更高的分類精度。張學軍等人[7]針對模糊熵算法的不足,提出一種基于局部均值分解、模糊熵和共空間模式算法的特征提取方法,有效提高了腦電信號的分類識別率。
以上所提出的算法均是將非線性分析法作用于時頻域或者空域,其中模糊熵是在近似熵和樣本熵基礎上提出的一種非線性分析法,雖然可以表現(xiàn)出某一時間段內(nèi)左右手運動想象腦電信號間的差異性,但其性能往往受信號長度等多因素的影響[7]。排列熵作為一種非線性分析法,雖然與近似熵、樣本熵以及模糊熵一樣都是用來表征時間序列的復雜程度,但排列熵獲得特征樣本集的聚類效果更加明顯[8]。2002年,Brandt等人[9]首次提出排列熵(permutation entropy,PE)理論,是一種衡量一維時間序列復雜程度的平均熵參數(shù)。張健釗[10]提出了一種基于S變換和排列熵的癲癇腦電信號自動判別方法,該方法在癲癇疾病的診斷方面有較好的應用前景。劉曉鳳[11]提出基于多尺度排列熵的面部表情識別方法,該方法能夠有效識別與情緒相關的腦電信號。排列熵算法的優(yōu)勢就是用排列的思想來計算重構子序列之間的復雜程度,雖然能夠?qū)r間序列的細微變化最大化,但在計算概率分布時,引入該思想會很難察覺內(nèi)部序列中的異常點。
該文提出了一種基于DWT、并將排列熵算法與共空間模式相融合的特征提取方法(discrete wavelet transform and permutation entropy combined common space pattern,DWT-PECSP)。利用DWT算法分解運動想象腦電信號從而重構出與任務相關的頻帶,使用排列熵算法提取出判別左右手類別明顯的特征向量。針對單一的特征提取方法無法多方面表示腦電信號特征的問題,該文在提取完每段的排列熵特征后,再用CSP提取每段的方差特征,最后將兩個特征相融合作為SVM分類器的輸入以獲得更高的分類精確度。
整個算法流程見圖1。首先對原始信號進行8 Hz~30 Hz的帶通濾波處理,接著采用db4小波對EEG信號進行3層小波分解,重構出包含左右手運動想象特性明顯的μ和β節(jié)律頻段,然后分別提取出該頻段信號的排列熵和CSP方差作為特征量,并將這兩組特征量進行組合。最后,采用支持向量機進行分類識別。
小波變換能夠有效地分析非平穩(wěn)信號,通過改變小波窗口的大小來得到信號的時域和頻域信息[12]。離散小波變換(DWT)是一種通過對母小波函數(shù)進行縮放和移位,將輸入信號分解成小波系數(shù)集的過程[13]。
設x[n]是離散輸出信號,采用Mallat算法對EEG進行小波分解:
(1)
排列熵(permutation entropy,PE)是一種檢測信號突變的非線性方法,可以將以前不能定量描述的復雜系統(tǒng)用一種較為簡潔的方法描述出來[14]。計算過程簡單且具有較高的抗干擾能力和較好的魯棒性。
假設{xi,i=1,2,…,N}是個一維的時間序列,嵌入維數(shù)為m(m>1),時間延遲為τ(τ>0),組成一個能夠使當前序列依次通過的窗口(m,τ),對該一維時間序列進行像空間重構:
(2)
矩陣的每一行作為一個重構分量:
Yj=[xj,xj+τ,…,xj+(m-1)τ],j=1,2,…,k
(3)
按照數(shù)值大小的升序方式對重構分量進行排列,排列方式總共有m!種。將P1,P2,…,Pk表示每一種排列情況出現(xiàn)次數(shù)的概率,排列熵是由 Shannon 的方式來定義的:
(4)
排列熵值Hp(m)的大小可以表示一種時間序列的復雜程度。越有序的時間序列所對應的排列熵的值越小,越復雜的時間序列所對應的排列熵的值越大。
CSP是一種空域分析法,算法的原理是利用矩陣對角化找到一組最大化兩種類型任務方差的最優(yōu)空間濾波器,從而得到具有最大分辨能力的特征向量[15]。該算法主要處理的是兩類問題,是主成分分析法的延伸[2]。
算法具體步驟為:
步驟1:將離散小波變換重構得到的μ節(jié)律和β節(jié)律頻段信號作為CSP算法的輸入向量,記作X1∈RN×T和X2∈RN×T,其中N為通道數(shù),T為采樣點數(shù)。當N (5) (6) (7) 步驟3:對特征值進行降序排列得到白化矩陣P,并對R1和R2進行變換和主分量分解。 (8) (9) λ1+λ2=I (10) 其中,I為單位矩陣。 步驟4:計算投影矩陣W。 W=BTP (11) 步驟5:將原信號X1和X2經(jīng)投影矩陣W濾波得到矩陣Z1和Z2: Z1=W*X1 (12) Z2=W*X2 (13) 實驗采用2003年BCI競賽的Graz數(shù)據(jù)集(data set III) 。實驗受試者為一名25歲的健康女性。實驗范式是受試者以放松的狀態(tài)坐在椅子上,根據(jù)屏幕的隨機提示,通過想象左手或右手的動作來控制目標移動。如圖2(a)所示,實驗的總時長是9 s。t=0 s-2 s受試者處于放松狀態(tài),t=2 s時,屏幕上顯示時長為1 s的“+”提示符表明實驗開始。t=3 s時,會出現(xiàn)一個向左或向右的箭頭,受試者按照箭頭的方向進行對應的運動想象,t=9 s實驗結束。如圖2(b)所示,實驗采集了C3、Cz和C4通道的腦電信號,信號的采樣頻率為128 Hz,并進行了0.5 Hz~30 Hz的帶通濾波。其中,該文只選取了包含左右手運動想象信息最豐富的C3和C4通道,Cz作為參考電極。整個實驗共進行280次,分7組運行,每組40次。實驗數(shù)據(jù)包括訓練樣本和測試樣本各140次。其中,分別想象左右手運動任務各70次。 大腦在做運動想象任務時,大腦同側(cè)運動感知區(qū)μ節(jié)律和β節(jié)律能量或幅度會升高,這就是事件相關同步(event related synchronization,ERS)現(xiàn)象,而對側(cè)μ節(jié)律和β節(jié)律能量或幅度會降低,這就是事件相關去同步(event related synchronization,ERD)現(xiàn)象[16]。因此,ERD/ERS現(xiàn)象可以對運動想象信號進行有效的識別[17]。該文首先對原始信號進行8 Hz~30 Hz的帶通濾波處理,然后對C3和C4通道上的EEG信號進行傅里葉變換得到C3和C4通道想象左右手運動的腦電信號頻譜圖,如圖3所示。通過頻譜分析,選取ERD/ERS最為明顯的頻段信號進行接下來的特征提取和分類。 由圖3可得,受試者在8 Hz~30 Hz頻段范圍的運動想象實驗中,其出現(xiàn)ERD/ERS現(xiàn)象最明顯的是μ節(jié)律(8 Hz~12 Hz)和β節(jié)律(18 Hz~26 Hz)這兩個頻率段。因此,接下來該文將通過離散小波變換分解重構出μ和β節(jié)律的頻段信號進行后續(xù)的特征提取和分類。 表1 小波分解后各層頻帶范圍 由于本實驗采集信號的頻率為128 Hz,因此該文使用db4小波對預處理后的運動想象腦電信號進行3層小波分解與重構。由表1可以看出,μ/β節(jié)律主要包含于小波分解的細節(jié)信號D2和D3中。故該文對第2層、第3層細節(jié)信號進行重構。重構后的C3和C4通道的腦電信號如圖4所示。 2.3.1 排列熵特征提取 使用排列熵算法對重構后C3和C4通道上包含μ/β節(jié)律的頻段信號進行特征提取。該文在提取排列熵特征時,選取的參數(shù)m取值為4,τ取值為1,采用窗口長度為1 s,采樣點數(shù)為128,窗移為1個采樣點來計算各個時間窗的熵值,從而獲得運動想象腦電信號C3和C4通道排列熵的時間序列。由圖5(a)可以看出,在4.5 s~7.5 s期間,發(fā)生ERD/ERS現(xiàn)象。當大腦想象左手運動時,C3通道能量增加,排列熵值變小,產(chǎn)生ERS現(xiàn)象;當大腦想象右手運動時,C3通道能量減少,排列熵值變大,產(chǎn)生ERD現(xiàn)象。由圖5(b)也可以很明顯地看出,在4.5 s~7 s期間,發(fā)生ERD/ERS現(xiàn)象。在想象右手運動時,C4通道能量增加,排列熵值變小,產(chǎn)生ERS現(xiàn)象;在想象左手運動時,C4通道能量減少,排列熵值變大,產(chǎn)生ERD現(xiàn)象。由此可見,提取腦電信號的排列熵作為特征也可以表現(xiàn)出ERD/ERS現(xiàn)象。 2.3.2 CSP特征提取 為了使兩類向量之間的差異度更大,該文也采用共空間模式算法對重構后C3和C4通道上包含μ/β節(jié)律的頻段信號進行共射投影。提取CSP特征時,選取的參數(shù)m取值為1,得到的特征數(shù)目為2,如圖6所示。從圖6中可以很直觀地看出左右手的區(qū)分效果。由此可見,對于兩類的左右手運動想象信號,經(jīng)過CSP處理,左右手任務的區(qū)分效果更加明顯。 2.4.1 支持向量機 支持向量機(support vector machine, SVM)是一種針對二分類問題的機器學習方法。其目的是在結構風險最小化的基礎上保證學習算法具有良好的泛化能力。SVM具有適應性強、分類能力好以及計算效率高的特點[18]。 SVM分類的基本思想是通過一個合適的非線性變換將輸入空間映射到一個高維空間,然后在這個新空間中尋求廣義最優(yōu)分類面,使它能夠?qū)深悩颖緹o錯誤地分開,同時使分開的兩類樣本的分類間隔最大。對于非線性映射,核函數(shù)的選擇尤為重要,不同的核函數(shù)取得的分類效果是不同的。本研究選用的核函數(shù)為徑向基核函數(shù)Rbf,誤差因子C取0.8,實驗總次數(shù)為280,使用前140次作為訓練集輸入SVM進行訓練,然后用后140次作為測試集來測試訓練的效果。 2.4.2 分類結果分析 該文利用四個指標對左右手運動想象信號的分類結果進行評估,分別是準確率、精確率、召回率和AUC(area under curve)。準確率表示預測受試者進行左右想象的正確率,精確率表示衡量模型對某一類預測的準確度,召回率表示預測出的受試者進行左右想象的組數(shù)占實際進行左右手組數(shù)的比例,AUC為ROC曲線和坐標軸所圍面積的大小。AUC值的大小可以作為分類器分類效果優(yōu)劣的指標。AUC值越大,表明分類器的分類效果越好[19]。 利用提出的基于排列熵與CSP融合的算法對腦電數(shù)據(jù)進行分類。為了驗證該算法能夠有效分類腦電信號,采用基于DWT的排列熵、基于DWT的CSP以及兩者相融合的算法進行特征提取,并使用SVM進行分類。 三種不同特征提取算法的分類準確率、精確率、召回率和AUC指標見表2。 表2 實驗結果 % 由表2的實驗結果可知,提出的特征提取算法的分類準確率達到91.43%,相比于單一使用排列熵算法的分類準確率71.42%和CSP特征提取算法的分類準確率85.71%有了明顯的提高。說明該算法能夠提高運動想象腦電信號的分類準確率,更加驗證了算法的有效性。 將近幾年其他文獻中提取運動想象腦電特征的分類算法與文中實驗結果相對比,如表3所示。從表3可以看出,與文獻[6]中基于LMD和模糊熵的多特征融合提取算法相比,準確率高6.07%,這是因為文中算法還結合了CSP算法,使得兩類向量之間的差異度增大,提高了分類準確率??傮w來看,文中算法的準確率明顯高于其余四組的分類準確率。 表3 與其他文獻的分類準確率比較 2.4.3 不同分類算法的分析比較 為了能夠更好地驗證分類算法的有效性,將單一特征的特征向量和融合后的特征向量用線性判別法(LDA)和極限學習機(ELM)兩種分類方法進行分類,并將其結果與SVM的分類結果相比較,結果如表4所示。 表4 不同分類算法的準確率比較 % 由表4可知,對于排列熵特征,線性判別法和ELM的分類準確率分別為70.14%和67.85%,而SVM的分類準確率達到了71.42%;對于CSP特征,線性判別法和ELM的分類準確率分別為83.42%和 84.28%,而SVM的分類準確率達到了85.71%。對于融合后的特征,線性判別法和ELM的分類準確率分別為90.71%和87.57%,而SVM的分類準確率達到了91.43%??梢妼我惶卣骱腿诤虾蟮奶卣飨蛄?,SVM的分類性能都比其他兩種分類算法要好。線性判別法是一種常用的線性統(tǒng)計學分析法,操作簡單,而且不需要繁復的計算。但由于EEG的非線性,往往導致識別率不高。ELM是一種極限學習機,是用來求解單隱層神經(jīng)網(wǎng)絡的算法。在保證學習精度的前提下比傳統(tǒng)的學習算法速度更快。但ELM參數(shù)的不確定會導致整體分類精度下降。 分類結果表明,SVM相較于其他兩種分類算法可有效地對運動想象EEG進行分類。體現(xiàn)出SVM結構風險最小化和分類間隔最大化的特點,對于解決小樣本、非線性、高維度和局部極小點的問題時效果顯著。 該文提出一種將非線性域作用于時頻域和空域的特征提取法。在使用小波變換重構出特定頻段的基礎之上,利用排列熵算法衡量運動想象腦電信號復雜度特性以及共空間模式加大左右手特征向量差異度,從而提取出易于區(qū)分的特征向量。實驗采用的數(shù)據(jù)集是BCI2003中的Data set III,實驗結果表明,該算法的最高分類準確率高達91.43%,優(yōu)于單一使用排列熵和CSP的特征提取算法。2 實驗分析
2.1 實驗數(shù)據(jù)
2.2 數(shù)據(jù)預處理
2.3 特征提取
2.4 腦電信號分類
3 結束語