于 路,薄 華(上海海事大學信息工程學院,上海201306)
基于改進END的運動想象腦電信號識別算法研究
于 路,薄 華
(上海海事大學信息工程學院,上海201306)
針對現(xiàn)有的單一特征提取算法對運動想象腦電信號識別率不高的問題,提出一種以相關(guān)系數(shù)改進的經(jīng)驗模態(tài)分解(EMD)的特征提取算法。對已有的BCI競賽數(shù)據(jù)中C3、C4兩個通道腦電數(shù)據(jù)進行預處理,之后通過EMD對腦電信號進行分解,得到IMF分量。通過計算原始信號與各階IMF分量之間的相關(guān)系數(shù),選擇具有較大相關(guān)系數(shù)的IMF作為特征,由這些IMF分量的能量特征和平均幅值差來組成腦電信號的特征。使用支撐矢量機分類器(SVM)對左右手運動想象腦電信號進行分類。實驗結(jié)果表明,基于相關(guān)系數(shù)改進的EMD腦電信號的處理方法明顯優(yōu)于只用EMD的腦電處理方法,得到的最高正確識別率為88.57%。從而證明了該方法的有效性。
腦電信號;經(jīng)驗模態(tài)分解;相關(guān)系數(shù);特征提取
頭皮腦電(E1ectroenc EPha1o-GraPh,EEG)信號是一種產(chǎn)生機理相當復雜且非常微弱的隨機信號,它反映了大腦阻止的腦電活動及大腦的功能狀態(tài)。不同的思維狀態(tài)在大腦皮層有不同的反映[1]。
腦機接口(Brain-ComPuter Interface,BCI)不依賴于大腦外周神經(jīng)與肌肉系統(tǒng),是大腦與計算機或其他電子設(shè)備之間建立可直接交流和控制的通道,可以有效增強身體嚴重殘疾的患者與外界交流或控制外部環(huán)境的能力,提高患者的生活質(zhì)量,同時也在娛樂電競等領(lǐng)域有著巨大的應用前景[2 -5]。
目前EEG特征提取的常用方法有FFT、SFT、AR[5]、AAR[6]、ICA、小波分析[7]、特定頻帶的功率譜等方法。經(jīng)典的FFT在分析確定信號和平穩(wěn)信號時發(fā)揮了重要作用,但利用FFT分析突變信號的頻譜存在局限性。SFT在一定程度上克服了標準FFT不具有局部分析能力的缺陷,在某些信號處理中發(fā)揮了一定的作用,但也存在不可克服的缺陷。SFT是時間窗內(nèi)信號特征的平均,時間窗內(nèi)信號越短,獲得的時間分辨率就越高。根據(jù)信號測不準原理,時間局域化性質(zhì)和頻率局域化性質(zhì)是矛盾的。AAR模型參數(shù)隨每一樣本點的輸入而改變,因而更好地反映了大腦的狀態(tài)。但是,該方法更適合分析平穩(wěn)信號,對包含高度非平穩(wěn)信號的運動想象EEG,該模型達不到理想效果。小波變換和小波包變換分解信號時,要預先設(shè)好分層數(shù)和小波函數(shù),不具備對信號自適應的分解能力。因此需要采用一種非線性分析的方法,該方法同時具有對信號自適應的分解能力,能通過度量腦電信號的復雜度來反映腦電的特征。本文中采用的是用相關(guān)系數(shù)改進經(jīng)驗模態(tài)分解的腦電信號處理方法,可以獲得一系列固有模態(tài)函數(shù)分量(Intrinsic Mode Function,IMF)。將這種方法應用到腦電信號的處理過程中能得到較好的效果。
經(jīng)驗模式分解算法(EmPirica1 Mode DecomPosition,EMD)[8]是一種自適應的數(shù)據(jù)處理或挖掘方法,非常適合非線性非平穩(wěn)的時間序列。其本質(zhì)是通過數(shù)據(jù)的時間尺度來獲得本征波動模式,然后分解數(shù)據(jù)。這種分解過程可以形象地稱之為“篩選(sifting)”過程。
在理論上,EMD可以應用于任何類型的時間序列(信號)的分解,因而在處理非平穩(wěn)及非線性數(shù)據(jù)上,比之前的方法具有更明顯的優(yōu)勢。所以,EMD[9 -10]方法一經(jīng)提出就在不同的工程領(lǐng)域得到了迅速有效的應用。
該方法的關(guān)鍵是它能使復雜信號分解為有限個本征模函數(shù),所分解出來的各IMF分量包含了原信號的不同時間尺度的局部特征信號。EMD分解方法基于以下假設(shè)條件:
(1)數(shù)據(jù)至少有兩個極值,一個最大值和一個最小值;
(2)數(shù)據(jù)的局部時域特性是由極值點間的時間尺度來唯一確定;
(3)如果數(shù)據(jù)沒有極值點但有拐點,則可以通過對數(shù)據(jù)微分一次或多次求得極值,然后再通過積分來獲得分解結(jié)果。
設(shè)原始信號為X(t),EMD算法的計算步驟如下:
(1)找出原數(shù)據(jù)序列X(t)的所有極大值點和極小值點,將其用三次樣條函數(shù)擬合為原序列的上、下包絡(luò)線,分別為u(t)和v(t),可得包絡(luò)線的平均值m11:
(2)將原數(shù)據(jù)序列減去包絡(luò)平均值m11,得到一個減去低頻的新序列h11:
(3)h11不一定是平穩(wěn)數(shù)據(jù)序列,用h11(t)代替原始信號X(t),重復上述過程k次,直到所得包絡(luò)趨近于零,這樣可以得到第一個本征模函數(shù)(IMF)。分量c1=h1k(t),它表示信號數(shù)據(jù)序列最高頻率的成分。
(4)用X(t)減去c1,得到一個去掉高頻成分的新數(shù)據(jù)序列r1;對r1再進行上述分解,得到第二個本征模函數(shù)(IMF)分量c2;如此重復:
(5)當?shù)趎個剩余量rn已成為單調(diào)函數(shù),無法再分解IMF時,整個EMD分解過程完成。原始信號可以表示為將一個頻率不規(guī)則的波化為多個單一頻率的波與殘波相加的形式。即:
然而腦電信號其背景噪聲很強,在對腦電信號進行EMD分解時,通常不能將信號與噪聲徹底分開,在每一個輸出的軌道之中,或多或少都摻雜著一些噪聲,選擇合適的IMF分量顯得尤為重要。這里引入相關(guān)系數(shù)的概念,借此權(quán)衡各個IMF的有效性。
2.1 基于相關(guān)系數(shù)的特征提取
相關(guān)系數(shù)是用以反映變量之間相關(guān)關(guān)系密切程度的統(tǒng)計指標。相關(guān)系數(shù)是按積差方法進行計算,同樣以兩變量與各自平均值的離差為基礎(chǔ),通過兩個離差相乘來反映兩變量之間的相關(guān)程度。是判斷特征選取的一個方法。
相關(guān)系數(shù)的定義:假設(shè)有兩個隨機變量X和Y,則它們的相關(guān)系數(shù)為:
其中,Cov(X,Y)為隨機變量X與Y的協(xié)方差函數(shù),σX、σY分別指X、Y的標準差,E(X)、E(Y)為兩者的平均值。相關(guān)系數(shù)r的取值范圍是[-1,1],表示變量之間相關(guān)程度的高低,r的絕對值越大,說明這兩個變量之間相關(guān)程度越高。r>0表示正相關(guān),r<0表示負相關(guān),特殊地,r=1稱為完全正相關(guān),r=-1稱為完全負相關(guān),r=0稱為不相關(guān)。
對原信號進行EMD分解后,得到n階IMF分量和殘波。根據(jù)各個IMF分量與原信號的相關(guān)系數(shù)來選擇更合適的IMF分量。設(shè)原信號序列為X(n),信號的IMF分量為Yi(n),其中i表示第i個IMF分量,則相關(guān)系數(shù)的定義如下:
使用EMD分解原信號得到IMF分量后,在眾多分量中包含的有用信息各不相同,同時包含了噪聲。為了得到更好的特征,提高左右腦電信號的分辨率,本文通過相關(guān)系數(shù)選擇合適的分量。分別取各階IMF分量的能量單獨作為該信號的特征,因為每組腦電信號只取一個IMF分量,所以這里只考慮能量特征。計算公式如下:
其中,El對應了第l個IMF分量的能量,c(i)表示該分量中的第i個數(shù)值,n表示該分量的長度。本文中n為140。
一組信號可得到唯一能量特征。表1給出各階IMF分量與原信號之間的相關(guān)系數(shù),及只取相應能量特征作為腦電信號的特征后的左右手腦電信號識別率。
一直以來,我國始終都在忽視檔案管理,大數(shù)據(jù)時代的到來,讓人們重新意識到了檔案管理的重要性,這也在一定程度上推動了檔案管理部門的進一步發(fā)展。在大數(shù)據(jù)時代,有效記錄檔案數(shù)據(jù)顯得尤為重要,隨著檔案資源類型的增多,檔案管理人員的工作量不斷加大。在檔案管理過程中,如果依舊采用傳統(tǒng)的檔案管理模式,是無法滿足當今時代的發(fā)展需求的。所以,檔案管理部門應當認真考量檔案管理的未來發(fā)展方向,并采取行之有效的方法,使得人們所需要的重要信息能夠從檔案管理的大量數(shù)據(jù)中成功提取出來,這是檔案管理的核心內(nèi)容,也是大數(shù)據(jù)時代給檔案管理帶來的重大機遇。
表1 各IMF分量能量特征的分類結(jié)果
由表1可知,IMF2分量與原信號的相關(guān)系數(shù)最大,最適合進行特征提取。各階IMF分量以與原信號的相關(guān)系數(shù)從大到小排列,分別為IMF2、IMF1、IMF3、IMF4和IMF5。當IMF分量與原信號的相關(guān)系數(shù)越大時,采用該分量作為條件提取特征得到的信號識別率越高,從而該IMF分量比其他IMF分量更適合進行特征提取。
然而只用單一的IMF分量并不能達到很高的識別率。這里考慮使用多個IMF分量進行特征選取。當選取多個IMF分量時,除能量特征外,腦電信號的特征還包括平均幅度差。
在進行EMD算法分解時,得到的各階IMF分量是從高頻到低頻的腦電信號分解,所以可以看出,同階不同通道信號之間有時幅值波動相差過大,因此此處定義平均幅度差作為一個特征值,計算公式如下:
其中,ci是第i個IMF分量,cj表示第j個分量(i≠j),n為信號的長度,這里n為140。分別計算不同IMF分量個數(shù)來提取特征時的腦電信號分類正確率,如表2所示。
表2 不同IMF分量個數(shù)下SVM分類準確率
表2中,分量順序根據(jù)與原信號的相關(guān)系數(shù)從大到小排列,分別是:IMF2、IMF1、IMF3、IMF4、IMF5。分量選取從第一個開始取,如當IMF分量個數(shù)為2時,所取分量為IMF2、IMF1。實驗數(shù)據(jù)表明,取前3個分量達到了最好的分類效果。當所取IMF分量個數(shù)過多時,信號包含的無效信息比例也會同時增加,對分類會造成更大的影響,且前3個分量包含了原始信號約90%的能量,故能達到較好效果。
2.2 本文算法
本文選擇的腦電信號識別算法是基于相關(guān)系數(shù)改進的EMD算法。EMD算法是一種非線性分析方法,同時具有對信號自適應的分解能力,能通過度量腦電信號的復雜度來反映腦電的特征。對得到的腦電數(shù)據(jù)進行預處理后,進行EMD分解從而得到IMF分量和余量。但是腦電信號中仍然包含了無用信息,在使用EMD算法進行分解過程中,無法將噪聲信號徹底分解出來。故采用基于相關(guān)系數(shù)改進的EMD算法,選擇與原信號相關(guān)系數(shù)最大的3個IMF分量:IMF1、IMF2、IMF3。由這3個分量可以得到3個能量特征和兩個平均幅度差特征,送入SVM[11-12]進行分類。在SVM過程中先用訓練數(shù)據(jù)得出訓練模型,再用測試數(shù)據(jù)得到實驗結(jié)果。本文算法的具體步驟如下:
(2)從訓練數(shù)據(jù)中取一組信號中1 s的腦電數(shù)據(jù)進行EMD算法分解;
(3)計算各階IMF分量與原信號的相關(guān)系數(shù),選出3個相關(guān)系數(shù)最大的IMF分量;
(4)由IMF分量得到能量特征和平均幅度差;(5)將數(shù)據(jù)特征送入SVM進行訓練;
(6)載入測試數(shù)據(jù)得到結(jié)果,從而得出實驗結(jié)論。
3.1 實驗數(shù)據(jù)
本文實驗數(shù)據(jù)采用奧地利格拉茲工業(yè)大學腦機接口研究中心提供的運動想象腦電數(shù)據(jù)(Data setⅢ)[13]。該數(shù)據(jù)集的受試主體為25歲女性,主體以放松狀態(tài)坐在顯示器前,顯示器呈現(xiàn)提示信息。根據(jù)出現(xiàn)的左右線索想象左右手運動,從而得到反饋數(shù)據(jù),其中左右線索的順序是隨機的。
實驗共得到280次長度為9 s的腦電數(shù)據(jù),140次為訓練樣本(70次想象左手運動,70次想象右手運動),另140次作為測試樣本。在前2 s主體保持放松,在第2 s屏幕出現(xiàn)十字光標,持續(xù)時間1 s,提示實驗即將開始。第3 s屏幕出現(xiàn)左右箭頭,主體根據(jù)提示信息想象左右手運動,即該數(shù)據(jù)的有效時間段為4 s~9 s。
該信號的采集頻率為128 Hz,再經(jīng)過0.5~30 Hz的帶通濾波器。實驗采用Ag/AgC1電極,通過C3、Cz、C4三個通道獲得反饋數(shù)據(jù),其中,C3、C4電極位于大腦的初級感覺皮層運動功能區(qū),能反映主體在想象左右手運動時大腦狀態(tài)的變化,Cz作為參考電極。實際分析時只采用了C3、C4這2個通道的數(shù)據(jù)。
3.2 實驗分析
實驗數(shù)據(jù)為280組長度為9 s的腦電數(shù)據(jù),其中4~9 s為有效時間區(qū)間,但是考慮信號的有效性,選擇4~8 s的腦電數(shù)據(jù)作為實驗數(shù)據(jù)。以一個通道的1 s數(shù)據(jù)作為一小段數(shù)據(jù)進行EMD分解,得到IMF分量后,計算各階IMF分量與原始信號的相關(guān)系數(shù),按照相關(guān)系數(shù)由大到小選取最大的3階IMF分量進行特征提取。對于一組一個通道中1 s的數(shù)據(jù)包含3個能量特征和2個平均幅值差,則一組數(shù)據(jù)一共包含40個特征。采用十折交叉驗證法將訓練數(shù)據(jù)的特征采樣送入SVM,并確定SVM的核參數(shù)。將測試數(shù)據(jù)提取特征后送入SVM的分類模型進行分類。分類結(jié)果如表3所示。
表3 改進后EMD與原方法分類結(jié)果比較
從表3可以看出,采用結(jié)合相關(guān)系數(shù)的EMD特征提取方式能獲得更高的識別率。其中訓練集的識別率達到92.86%,測試集的分類正確率達到88.57%,這個結(jié)果非常接近BCI大賽中第一名的分類結(jié)果。由此改進后的EMD算法更加適合腦電特征提取。
本文提出通過相關(guān)系數(shù)來改進EMD對腦電信號特征的提?。?4]。通過分析EMD分量與原信號之間的相關(guān)系數(shù)來確定相應的特征組成特征向量,輸入SVM分類器中,從而實現(xiàn)左右手運動想象腦電信號的分類。研究結(jié)果表明,采用相關(guān)系數(shù)改進的EMD提取腦電特征的正確率明顯高于僅采用EMD的腦電特征提取方法。因此,基于相關(guān)系數(shù)改進的EMD算法在運動想象腦電信號的識別研究中具有很高的應用價值。
[1]徐寶國,何樂生,宋愛國.基于腦電信號的人機交互實驗平臺的設(shè)計和應用[J].電子測量與儀器學報,2008,22(1):81-85.
[2]高上凱.淺談腦-機接口的發(fā)展現(xiàn)狀與挑戰(zhàn)[J].中國生物醫(yī)學工程學報,2007.26(6):801-803.
[3]王斐,張育中,寧廷會,等.腦—機接口研究進展[J].智能系統(tǒng)學報,2011,6(3):189-199.
[4]TANAKA K,MATSUNAGA K,WANG H.E1ectroencePha-1ogram-based contro1 of an e1ectric whee1chair[J].IEEE Transactions on Robotics,2005,21(4):762-766.
[5]張毅,楊柳,李敏,等.基于AR和SVM的運動想象腦電信號識別[J].華中科技大學學報(自然科學版),2011,39(Z2):103-106.
[6]徐寶國,宋愛國.單次運動想象腦電的特征提取和分類[J].東南大學學報(自然科學版),2007,37(4):629-633.
[7]李明愛,王蕊,郝冬梅.想象左右手運動的腦電特征提取及分類研究[J].中國生物醫(yī)學工程學報,2009,28(2):166-170.
[8]張小莉,張歆,孫進才.基于經(jīng)驗模態(tài)分解的目標特征提取與選擇[J].西北工業(yè)大學學報,2006,24(4):453-456.
[9]余煒,韓強,馬晶晶,等.基于EMD和SVM的腦電信號處理方法[J].昆明理工大學學報(自然科學版),2012,37(6):38-42.
[10]金晶,王行愚,張秀,等.基于能量特征的左右手運動想象鬧心好的識別方法[J].科學通報,2001,46(3):257-263.
[11]安文娟.Fisher和支持向量綜合分類器[D].大連:遼寧師范大學,2010.
[12]李金華.基于SVM的多類文本分類研究[D].青島:山東科技大學,2010.
[13]Sun Shi1iang,Zhang Changshui.Adaptive feature extraction for EEG signa1 c1assification[J].Medica1&Bio1ogica1 Engineering&Computing,2006,44(10):931-935.
[14]RAKOTOMAMONJY A,GUIGUE V.BCI comPetition III:dataset II-ensemb1e of SVERP for BCIP300 spe11er[J].IEEE Transactions on Biomedica1 Engineering,2008,55(3):1147-1154 .
于路(1992 -),通信作者,女,碩士研究生,主要研究方向:智能信息處理、模式識別。E-mai1:605005642@qq.com。
薄華(1971 -),女,博士,副教授,主要研究方向:遙感圖像處理、智能信息處理、模式識別、人工智能。
Motor imagery EEG recognition method based on imProved EMD
Yu Lu,Bo Hua
(Information Engineering Co11ege,Shanghai Maritime University,Shanghai201306,China)
Considering the issue of 1ow recognition rate for EEG signa1ofmotor imagery by using current sing1e feature extraction method,the PaPer ProPosed amethod that using imProved emPirica1mode decomPosition(EMD)a1gorithm with the corre1ation coefficient to extract features.First1y,C3,C4 channe1EEG data of BCI data set is PreProcessed,then,the EEG is decomPosed with the EMD a1gorithm and the IMF comPonent is obtained.By ca1cu1ating the corre1ation coefficient between the origina1 signa1 and IMF comPonents,the method chooses IMF comPonents which have 1arger corre1ation coefficient as a character.Ca1cu1ating the energy and average amP1itude of difference IMF comPonents to form feature vectors.Using SVM c1assifier for 1eft and right hand motor imagery EEG c1assification.The resu1ts show that the EMD a1gorithm imProved with the corre1ation coefficient for EEG sing1e c1assifying is better than on1y EMD method,the highest rate of correct recognition is 88.57%.Thus the effectiveness and feasibi1ity of thismethod is Proved.
EEG;EMD;corre1ation coefficient;feature extraction
TP391.4
A
10.19358 /j.issn.1674-7720.2016.09.018
于路,薄華.基于改進EMD的運動想象腦電信號識別算法研究[J].微型機與應用,2016,35(9):58-61.
2016-01-10)