馬也+姜光萍
摘 要:針對(duì)P300腦電信號(hào)信噪比低,分類(lèi)困難的特點(diǎn),本文研究了一種基于獨(dú)立分量分析和支持向量機(jī)相結(jié)合的腦電信號(hào)處理方法。首先對(duì)P300腦電信號(hào)進(jìn)行疊加平均,根據(jù)ICA算法的要求,對(duì)疊加平均的信號(hào)進(jìn)行去均值及白化處理。然后使用快速定點(diǎn)的FastICA算法提取P300腦電信號(hào)的特征向量,最后送入支持向量機(jī)進(jìn)行分類(lèi)。采用國(guó)際BCI 競(jìng)賽III中的DataSetII數(shù)據(jù)進(jìn)行驗(yàn)證,算法的最高分類(lèi)正確率達(dá)90.12%。本算法原理簡(jiǎn)單,能有效提取P300腦電信號(hào)的特征,對(duì)P300腦電信號(hào)特征提取及分類(lèi)的任務(wù)提供參考方法。
關(guān)鍵詞:P300腦電信號(hào);特征提取;獨(dú)立分量分析;支持向量機(jī)
DOI:10.16640/j.cnki.37-1222/t.2017.10.180
0 引 言
近年來(lái)隨著世界人口的不斷增多和老齡化加劇的現(xiàn)象,肌肉萎縮性側(cè)索硬化癥,癱瘓,老年癡呆癥等患者的基數(shù)也相應(yīng)增長(zhǎng),給社會(huì)及病人家屬帶來(lái)了沉重的負(fù)擔(dān)。而近年來(lái)出現(xiàn)的涉及神經(jīng)科學(xué)、認(rèn)知科學(xué)、計(jì)算機(jī)科學(xué)、控制工程、醫(yī)學(xué)等多學(xué)科、多領(lǐng)域的腦機(jī)接口方式應(yīng)運(yùn)而生[1]。腦機(jī)接口(brain computer interface,BCI)是建立一種大腦與計(jì)算機(jī)或其他裝置聯(lián)系的技術(shù),該聯(lián)系可以不通過(guò)通常的大腦輸出通路(大腦的外周神經(jīng)和肌肉組織)[2]。這種人機(jī)交互形式可以代替語(yǔ)言和肢體動(dòng)作,使得恢復(fù)和增強(qiáng)人類(lèi)身體與心理機(jī)能、思維意念控制變成為可能。因此在軍事目標(biāo)搜索[3]、飛行模擬器控制[4]、汽車(chē)駕駛[5]、新型游戲娛樂(lè)[6]以及幫助運(yùn)動(dòng)或感覺(jué)機(jī)能出現(xiàn)問(wèn)題的殘障人士重新恢復(fù)信息通信功能[7]等方面均有應(yīng)用并有巨大潛能。
腦機(jī)接口系統(tǒng)的性能主要由腦電信號(hào)處理模塊決定。腦電信號(hào)處理模塊的核心由特征提取和分類(lèi)識(shí)別兩部分組成。常見(jiàn)的腦電信號(hào)特征提取方法很多,針對(duì)不同的腦電信號(hào)有不同的方法。例如時(shí)域分析方法有功率譜分析及快速傅里葉變換(FFT)等,適用于P300、N400等潛伏期與波形恒定,與刺激有嚴(yán)格鎖時(shí)關(guān)系的誘發(fā)腦電信號(hào);頻域分析方法有自回歸模型及數(shù)字濾波器等,適用于頻率特征明顯的運(yùn)動(dòng)想象腦電信號(hào);時(shí)頻域分析方法有小波變換,適用于時(shí)頻特性隨時(shí)間不斷改變的腦電信號(hào)。上述方法實(shí)時(shí)性較好,使用較為廣泛,但不能直接表達(dá)EEG各導(dǎo)聯(lián)之間的關(guān)系??臻g域特征提取方法有共空間模式法(CSP)、獨(dú)立分量分析法(ICA)等,該類(lèi)方法可以利用各導(dǎo)聯(lián)腦電信號(hào)之間的空間分布及相關(guān)性信息,一般用于多通道的腦電信號(hào)特征提取。 [8-10]
在分類(lèi)識(shí)別方面,BCI中使用的分類(lèi)方法主要有人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、K均值聚類(lèi)、遺傳算法等等。支持向量機(jī)方法在腦電信號(hào)分類(lèi)中有廣泛的應(yīng)用,在隨機(jī)性強(qiáng),非線(xiàn)性的分類(lèi)識(shí)別問(wèn)題中有較強(qiáng)適應(yīng)性及較高分類(lèi)正確率。
1 實(shí)驗(yàn)數(shù)據(jù)介紹
1.1 事件相關(guān)電位P300
事件相關(guān)電位(Event-Related Potential, ERP)是人們經(jīng)歷某種刺激事件時(shí),大腦在信息加工中所誘發(fā)出來(lái)的一系列腦電活動(dòng)在頭皮上引起的電位變化,是一種由心理或語(yǔ)言因素參與的特殊的誘發(fā)電位,1965年由Sutton首次報(bào)道。從頭皮記錄到ERP有兩個(gè)特征,首先它的潛伏期與刺激之間有嚴(yán)格的鎖時(shí)關(guān)系,其次它有特定的波形和電位分布。ERP的構(gòu)成分外源性和內(nèi)源性?xún)刹糠?,外源性成分包括P100, N100, P200波,潛伏期短,受刺激物理特性的影響較大;內(nèi)源性成分包括N200, P300波,受心理因素影響較大,和人的注意、記憶等認(rèn)知過(guò)程相關(guān)。
其中P300是應(yīng)用最廣泛的內(nèi)源性事件相關(guān)電位,因其潛伏期多在300ms左右,又是正相波,因而得名,故又稱(chēng)P300。目前的研究結(jié)果表明,P300是聯(lián)合皮層活動(dòng)的結(jié)果,與復(fù)雜的多層次心理活動(dòng)(認(rèn)知過(guò)程)有關(guān),是感覺(jué)、知覺(jué)、記憶、等心理過(guò)程的變化反映,是人對(duì)客觀(guān)事物的反應(yīng)過(guò)程。因此,P300是一個(gè)不需要靠外部行為判斷受試者認(rèn)知過(guò)程的客觀(guān)指標(biāo),也可以說(shuō)是判斷大腦高級(jí)功能的一個(gè)客觀(guān)指標(biāo)。
1.2 實(shí)驗(yàn)數(shù)據(jù)選取
實(shí)驗(yàn)數(shù)據(jù)取自國(guó)際BCI 競(jìng)賽III中的DataSetII數(shù)據(jù)。This dataset represents a complete record of P300 evoked potentials recorded with BCI2000 using a paradigm described by Donchin et al., 2000, and originally by Farwell and Donchin,1988[11]. In these experiments, a user focused on one out of 36 different characters. The objective in this contest is to predict the correct character in each of the provided character selection epochs.
The user was presented with a 6 by 6 matrix of characters (see Figure 1). The users task was to focus attention on characters in a word that was prescribed by the investigator (i.e., one character at a time) All rows and columns of this matrix were successively and randomly intensified at a rate of 5.7Hz. Two out of 12 intensifications of rows or columns contained the desired character (i.e., one particular row and one particular column). The responses evoked by these infrequent stimuli (i.e., the 2 out of 12 stimuli that did contain the desired character) are different from those evoked by the stimuli that did not contain the desired character and they are similar to the P300 responses previously reported.
We collected signals (bandpass filtered from 0.1一60Hz and digitized at 240Hz)from two subjects in five sessions each. Each session consisted of a number of runs. In each run, the subject focusedattention on a series of characters. For each character epoch in the run, user display was as follows: the matrix was displayed for a 2.5 s period, and during this time each character had the same intensity (i.e., the matrix was blank).Subsequently, each row and column in the matrix was randomly intensified for 100ms(i.e., resulting in 12 different stimuli一6 rows and 6 columns). After intensification of arow/column, the matrix was blank for 75ms. Row/column intensifications were block randomized in blocks of 12. The sets of 12 intensifications were repeated 15 times for each character epoch (i.e., any specific row/column was intensified 15 times and thus there were 180 total intensifications for each character epoch). Each character epoch was followed by a 2.5 s period, and during this time the matrix was blank. This period informed the user that this character was completed and to focus on the next character in thewordthat was displayed on the top of the screen (the currentcharacter was shown in parentheses).
2 P300腦電信號(hào)特征提取
2.1 獨(dú)立成分分析原理
ICA的基本思想是將多道觀(guān)察信號(hào)按照統(tǒng)計(jì)獨(dú)立的原則通過(guò)優(yōu)化算法分解為若干獨(dú)立成分,實(shí)現(xiàn)信號(hào)的增強(qiáng)和分析。設(shè)為N個(gè)相互獨(dú)立的信號(hào)源,為M個(gè)觀(guān)測(cè)信號(hào),其中,。將它們表示為向量的形式,得,。X中的各分量是由S中各獨(dú)立源經(jīng)過(guò)線(xiàn)圖疊而成的,即
上式用矩陣形式可表示為
式中,X為階常系數(shù)混合矩陣;A為未知的系數(shù)。要求在A和S未知的前提下,尋找一解混矩陣W,使得
式中,且Y的各分量相互獨(dú)立,即Y是對(duì)源信號(hào)S的良好的估計(jì),也可以說(shuō)S在Y中得到了分離。
ICA算法的研究可分為基于信息論準(zhǔn)則的迭代估計(jì)方法和基于統(tǒng)計(jì)學(xué)的代數(shù)方法兩大類(lèi),從原理上來(lái)說(shuō),它們都是利用了源信號(hào)的獨(dú)立性和非高斯性。基于信息論的方法研究中,各國(guó)學(xué)者從最大嫡、最小互信息、最大似然和負(fù)嫡最大化等角度提出了一系列估計(jì)算法。如FastICA算法,Infomax算法,最大似然估計(jì)算法等?;诮y(tǒng)計(jì)學(xué)的方法主要有二階累積量、四階累積量等高階累積量方法。本文使用的是基于負(fù)熵最大的FastICA算法。它以負(fù)嫡最大作為一個(gè)搜尋方向,可以實(shí)現(xiàn)順序地提取獨(dú)立源。其中負(fù)熵的定義為
式中是與Y有相同協(xié)方差的高斯隨機(jī)變量,H()為隨機(jī)變量的微分商。
快速I(mǎi)CA學(xué)習(xí)規(guī)則是找一個(gè)方向以便具有最大非高斯性。因此FastICA算法的迭代公式為
其中是W的新值。
2.2 基于FastICA的腦電信號(hào)特征提取
由于P300腦電信號(hào)波幅只有2~10,而自發(fā)腦電信號(hào)的波幅約為10~100,它淹沒(méi)于自發(fā)腦電信號(hào)中,二者構(gòu)成小信號(hào)和大噪聲的關(guān)系,因此,首先要對(duì)P300信號(hào)進(jìn)行疊加平均。本文首先選取每次刺激后1s的腦電信號(hào)數(shù)據(jù)進(jìn)行15次疊加平均,效果見(jiàn)圖4。為方便顯示效果,只顯示Cz導(dǎo)聯(lián)的結(jié)果,后續(xù)均為Cz導(dǎo)聯(lián)??梢钥闯霭琍300的腦電信號(hào)在300ms附近有一個(gè)正的波峰。
在絕大多數(shù)ICA算法中,都假設(shè)源信號(hào)s的均值為零,因此,為了使實(shí)際的盲源分離問(wèn)題能夠符合ICA數(shù)學(xué)模型,在對(duì)觀(guān)測(cè)信號(hào)x運(yùn)用ICA方法之前,通常先對(duì)其進(jìn)行如下的去均值預(yù)處理。
去均值過(guò)程只是為了簡(jiǎn)化ICA算法,由去均值后的向量Y估計(jì)出分離矩陣w后,還需將均值向量WE[x]加回到信源估計(jì)值中去。對(duì)疊加平均后的信號(hào)進(jìn)行去均值效果見(jiàn)圖5。
為進(jìn)一步簡(jiǎn)化ICA算法,對(duì)信號(hào)進(jìn)行白化處理。所謂白化即對(duì)觀(guān)測(cè)信號(hào)向量x施加一個(gè)線(xiàn)性變換,使得新向量Z的各個(gè)分量間互不相關(guān),同時(shí)Z的協(xié)方差矩陣為單位陣,此時(shí)稱(chēng)新向量z為空間白色或簡(jiǎn)稱(chēng)為白色。對(duì)去均值的信號(hào)進(jìn)行白化處理后的效果見(jiàn)圖6。
FastICA算法中的期望必須用它們的估計(jì)值代替,當(dāng)然最好的估計(jì)是相應(yīng)的樣本平均。理想情況下,所有的有效數(shù)據(jù)都應(yīng)該參與計(jì)算,但這會(huì)降低計(jì)算速度。所以通常用一部分樣本的平均來(lái)估計(jì),樣本數(shù)目的多少對(duì)最后估計(jì)的精確度有很大影響。迭代中的樣本點(diǎn)應(yīng)該分別選取,假如收斂不理想的話(huà),可以增加樣本的數(shù)量。因此實(shí)驗(yàn)樣本中選擇了每個(gè)字符的15次疊加平均后的腦電信號(hào),對(duì)其進(jìn)行FastICA處理,提取特征值,并送入支持向量機(jī)進(jìn)行分類(lèi)。
3 腦電信號(hào)分類(lèi)
3.1 支持向量機(jī)原理
定義為間隔(margin),其中為決策面沿方向到與其最近的訓(xùn)練樣本的距離,每類(lèi)至少有一個(gè)。距離決策面最近的訓(xùn)練實(shí)例為支持向量(support vector)。則支持向量機(jī)為計(jì)算使間隔最大化的分類(lèi)決策面,使得原空間線(xiàn)性不可分的數(shù)據(jù)在變換得到的高位空間中線(xiàn)性可分。在一次分類(lèi)仿真中,這6個(gè)導(dǎo)聯(lián)的P300信號(hào)較為突出的FZ, CZ, PZ, OZ,C3, C4。可根據(jù)需要選擇相應(yīng)導(dǎo)聯(lián)的腦電信號(hào)作為FastICA算法的輸入。從中隨機(jī)選取100組腦電信號(hào)作為訓(xùn)練數(shù)據(jù),剩下的80組信號(hào)作為測(cè)試數(shù)據(jù),檢測(cè)分類(lèi)效果是否有效。
本文使用的支持向量機(jī)核函數(shù)為徑向基核函數(shù)(Radial Basis Function,RBF):
若核函數(shù)滿(mǎn)足Mercer條件,則核函數(shù)可對(duì)應(yīng)相應(yīng)變換空間中的點(diǎn)積。其中是一個(gè)控制半徑的正數(shù)。將(10)展開(kāi)得:
其中、、皆滿(mǎn)足Mercer條件。
3.2 分類(lèi)結(jié)果
為綜合考慮實(shí)驗(yàn)效果,測(cè)試了不同導(dǎo)聯(lián)數(shù)對(duì)分類(lèi)正確率的影響。每次測(cè)試都進(jìn)行10回,以便求平均分類(lèi)正確率。分類(lèi)結(jié)果見(jiàn)表1。
可以看出,隨著使用導(dǎo)聯(lián)數(shù)的增加,平均分類(lèi)正確率也有所增加。增加到7個(gè)導(dǎo)聯(lián)時(shí),平均分類(lèi)正確率最高,可達(dá)90.12%。但超過(guò)7個(gè)導(dǎo)聯(lián)后,平均分類(lèi)正確率又出現(xiàn)下降趨勢(shì)。可見(jiàn),數(shù)據(jù)量的增多雖然可以提高平均分類(lèi)正確率,但是一味的增加也會(huì)使得FastICA在迭代時(shí)收斂效果不理想。
本文使用的方法可以有效的對(duì)P300腦電信號(hào)進(jìn)行特征提取和分類(lèi),分類(lèi)正確率較為理想,為P300腦電信號(hào)處理的研究提供研究參考。
4 結(jié)論
本文針對(duì)P300事件相關(guān)電位腦電信號(hào)信噪比低,隨機(jī)性強(qiáng)的特點(diǎn),先對(duì)腦電信號(hào)進(jìn)行疊加平均、去均值、白化的預(yù)處理,其次利用FastICA算法提取腦電信號(hào)的特征向量,最后將得到的腦電信號(hào)特征向量經(jīng)支持向量機(jī)分類(lèi),最高平均分類(lèi)正確率可達(dá)90.12%,因此可以有效進(jìn)行P300腦電信號(hào)的特征提取及分類(lèi)。本文使用的使用的算法原理簡(jiǎn)單,較高的腦電信號(hào)分類(lèi)正確率可增強(qiáng)腦機(jī)接口的運(yùn)行穩(wěn)定性,為實(shí)時(shí)在線(xiàn)腦機(jī)接口系統(tǒng)的研究提供研究思路,使腦機(jī)接口能更廣泛的用于軍事、游戲、醫(yī)療等領(lǐng)域。
參考文獻(xiàn):
[1]Rajesh P.N.Rao.Brain-Computer Interfacing:an introduction[M].China Machine Press,2016.
[2]Schalk G,Dennis J,Thilo H,et al.BCI2000: A general-purpose brain-computer interface(BCI) system [J].IEEE Transactions on Biomedical Engineering,2004,51(06):1034-1043.
[3]Robbin A.Miranda,William D.Casebeerb,Amy M.Heinz,et al. DARPA-funded efforts in the development of novel brain-computer interface technologies[J].Journal of Neuroscience Methods,2015,244:52-57.
[4]邢麗超.腦-機(jī)接口的研究現(xiàn)狀[J].科技創(chuàng)新與應(yīng)用,2015(06): 24-24.
[5]關(guān)偉,楊柳,江世雄,張文義.腦電在交通駕駛行為中的應(yīng)用研究綜述[J].交通運(yùn)輸系統(tǒng)工程與信息,2016,16(03):35-44.
[6]王斐,張育中,寧廷會(huì),聞時(shí)光.腦-機(jī)接口研究進(jìn)展[J].智能系統(tǒng)學(xué)報(bào),2011,6(03):189-199.
[7]李波,劉洋,周宗潭.嵌入式腦機(jī)接口系統(tǒng)的軟件設(shè)計(jì)與實(shí)現(xiàn)[J]. 計(jì)算機(jī)仿真,2007,24(07):292-295
[8]賈花萍,趙俊龍.腦電信號(hào)分析方法與腦機(jī)接口技術(shù)[M].北京:科學(xué)出版社,2016.
[9]段鎖林,尚允坤,潘禮正.多類(lèi)運(yùn)動(dòng)想象腦電信號(hào)特征提取與分類(lèi)[J].計(jì)算機(jī)測(cè)量與控制,2016,24(02):283-287.
[10]韓敏,孫卓然.基于小波變換和AdaBoost極限學(xué)習(xí)機(jī)的癲癰腦電信號(hào)分類(lèi)[J].計(jì)算機(jī)測(cè)量與控制,2015,35(09):2701-2709.
[11]Donchin E,Spencer K M,Wijesinghe R.The mental prosthesis:Assessing the speed of a P300-based brain-computer interface[J].IEEE Transactions on Rehabilitation Engineering,2000,8(02):174-179.