摘 要:文章針對BCI Competition 2003的Data set IIb競賽數(shù)據(jù),取得了一個很高的字符分類識別準確率,文章突出在數(shù)據(jù)預(yù)處理階段中,通過很多次程序驗證比較不同頻帶域的測試準確率,得出了一個最佳的頻帶范圍,用于原始數(shù)據(jù)的濾波過程。
關(guān)鍵詞:腦機接口;P300;預(yù)處理;特征提??;分類算法
1 引言
腦機接口(BCI)是一個系統(tǒng),允許用戶與環(huán)境的溝通,只有通過大腦活動,而無需使用肌肉輸出通道。它涉及了神經(jīng)科學(xué),信號檢測,信號處理,模式識別等多種領(lǐng)域。要建立大腦和外界設(shè)備之間的聯(lián)系,首先要測量大腦活動,然后進行處理分析信號數(shù)據(jù),再進行機器學(xué)習(xí)(訓(xùn)練分類模型)實行分類,進而實現(xiàn)用戶的意圖。P300電位是當視覺受到外界特殊刺激時腦電信號出現(xiàn)一個波峰,其峰值大約出現(xiàn)在相關(guān)事件發(fā)生后的300ms。其優(yōu)勢特點是被試驗之前不需要進行訓(xùn)練即可成功誘發(fā)出來。因此P300電位是腦-機接口常用的一種信號。文中所用數(shù)據(jù)是BCI Competition 2003的Data set IIb離線數(shù)據(jù)集。大致處理過程可以描述為:原始信號數(shù)據(jù)→預(yù)處理→特征選擇與提取→選擇并訓(xùn)練分類模型→分類結(jié)果→測試分類算法效果→根據(jù)效果調(diào)整分類模型→得出理想的分類結(jié)果。
2 處理數(shù)據(jù)的算法步驟
2.1 單次樣本提取:因為P300電位一般出現(xiàn)在刺激后的300ms左右,所以通過分類精度驗證后,本文截取從每次閃爍開始后100ms到700ms長度的數(shù)據(jù)作為一個單次樣本,這樣將訓(xùn)練集的前30個Trial的數(shù)據(jù)組成一個30×12×15×144×64維的原始特征空間。
2.2 數(shù)據(jù)預(yù)處理:由于采集到的原始數(shù)據(jù)中一般會含有眼電,肌肉以及外界干擾等因素(如測量儀器或環(huán)境干擾等)的噪音信號,以及P300電位的低頻特性,所以需要對原始數(shù)據(jù)進行預(yù)處理,本文主要涉及數(shù)據(jù)精度的轉(zhuǎn)化以及低通濾波。論文突出在打破了前人已有經(jīng)驗的限制,將P300電位的頻帶范圍更加精確化,更是體現(xiàn)了P300電位的低頻特征,文章選擇采用Matlab自帶的信號處理工具箱設(shè)計了一個合適的濾波器,以帶通替代低通設(shè)計了10階Butterworth(IIR)帶通濾波器,帶寬為0.05Hz~7.5Hz。不同頻帶域?qū)?yīng)的實驗準確率如表1。其中10階可以通俗理解為過濾次數(shù),一般來說過濾次數(shù)越多濾波效果就越好,但是同時也加重了程序運行負擔,因此選擇適當?shù)臑V波階數(shù)也是很關(guān)鍵的一步。
表1
2.3 特征選擇與提?。菏紫葘﹄姌O進行篩選,因為并不是所有電極都能明顯體現(xiàn)P300特征,所以需要把那些P300特征比較明顯的電極篩選出來。通過多次準確率比較論文選擇了22個導(dǎo)聯(lián)(用Ne表示)作為特征電極,對應(yīng)編號為:11,13,14,18,19,20,34,47,51-64。比較準確率時采用隨機增加通道,能提高準確率的通道保留,反之舍棄的方法。其次,為了提高訓(xùn)練模型的速度,需要對特征空間進行降維處理,本文嘗試過兩種降維方式,一是將相鄰6個采樣點的平均值作為一個特征點,二是每隔6個采樣點取一個特征點,事實證明后者的程序簡單而且準確率并高于前者,所以采用后者的方法將預(yù)處理后的數(shù)據(jù)降維。再關(guān)于試驗重復(fù)次數(shù)求平均,至此每個Trial只剩24個特征點(用Ne表示)。并將其特征電極與特征點結(jié)合考慮作為每個Trial的特征向量。這樣將得到前30個訓(xùn)練數(shù)據(jù)的特征空間為(30·12)×(Ne·Nt)即為360×528維的特征空間。
2.4 規(guī)范化特征空間:就是將特征空間向量投射到特定的小范圍內(nèi),如-1.0~1.0或0.0~1.0。文章采用向量單位化的方法將其投射到0.0~1.0范圍內(nèi)。規(guī)范化可以消除數(shù)值型屬性因為大小不一而帶來的特征分類偏差。這個過程對于提高腦機接口信息傳遞效率很重要。
2.5 訓(xùn)練分類模型:將特征提取得到的已知目標字符的數(shù)據(jù)作為訓(xùn)練集,利用C-SVC(C-支持向量分類)選擇線性核函數(shù)u'*v對其進行訓(xùn)練,其中樣本特征是屬于二分類樣本集,分別用-1和1標記兩種樣本類別。
3 分類結(jié)果
將訓(xùn)練出的分類器應(yīng)用于等量的未知目標字符的測試數(shù)據(jù)集,推斷出所選擇的字符。并計算分類準確率:Accuracy=■×100%。論文通過上述算法得到的最高準確率達90.00%。相應(yīng)不同重復(fù)次數(shù)文章分別測試了對應(yīng)準確率,見圖1。
圖1
4 結(jié)束語
文中選擇了22個通道數(shù)據(jù)進行處理得到了很好的分類效果,但是否這22個特征電極就適用任何群體的實驗數(shù)據(jù),本文并未明確給出。但至少文中所用的通道及其篩選方法可以為相關(guān)研究者提供參考。論文關(guān)于P300電位的低頻特性到底低到什么程度也只是對文中所用數(shù)據(jù)作了驗證,是不是普遍結(jié)論還有待這方面的研究者進一步探討。總之本文所用的處理算法對提高整個BCI系統(tǒng)的總體數(shù)據(jù)傳輸率起了積極作用。
參考文獻
[1]程明,高上凱,張琳.基于腦電信號的腦-計算機接口[J].北京生物醫(yī)學(xué)工程,2000,19(2):113-118.
[2]楊立才,李佰敏,李光林,等.腦-機接口技術(shù)綜述[J].電子學(xué)報,2005.
[3]Lin Zhonglin,Zhang Changshui.Enhancing classification by perceptual characteristic for the P300 speller paradigm [A].In :Proceedings of the 2nd International IEEE EMBS Conference on Neural Engineering,Arlington : IEEE EMBS,2005,574 -576.
作者簡介:林亞靜(1985,11-),女,漢,陜西西安人,研究方向:信息理論與應(yīng)用,碩士學(xué)歷。