劉 斌,羅 聰,魏夢然,何良華
(同濟大學計算機科學與技術系,上海 201804)
自1929年德國精神病學專家Hans Berger發(fā)現(xiàn)并記錄人的腦電信號以來,國內外的專家學者對腦電信號進行了大量的研究,取得了顯著的效果。近年來隨著科學技術的發(fā)展,尤其是隨著腦機接口(Brain Computer Interface,BCI)技術的出現(xiàn),使得對運動想象腦電信號的研究成為一個新的研究熱點。
針對腦電信號的處理分析尤其是對運動想象腦電信號的處理分析,眾多學者提出了很多判別計算方法,主要有基于不同腦電波段進行分析[1]、基于自回歸模型算法[2]、基于小波變換[3]、線性判別方法[4]、神經網絡等[5]。上述研究將運動想象的腦電分析問題看成是模式分類,對不同運動想象模式提取特征,如頻率和回歸系數(shù)等,然后構建判別分析模型進行判別分析。在一定的條件下這些方法取得了很好的結果,不足之處在于很少考慮到腦電信號的特點,即時間空間分布特征顯著,因此,本文提出了基于貝葉斯網絡的判別分析思想,通過圖模型的空間邏輯結構模擬導聯(lián)的空間位置,各節(jié)點的分布建模模擬導聯(lián)的時間特征。
貝葉斯網絡是一種表示變量間概率分布的圖形模型,它充分綜合了先驗知識以及數(shù)據(jù)分布特征,并以圖論方法準確地描述出變量之間的因果關系[6-7]。目前貝葉斯網絡在腦電方面的應用主要是做特征提取,文獻[8]利用貝葉斯網絡方法分析處理不同情感下的腦電數(shù)據(jù)來進行情感識別,文獻[9-10]則用貝葉斯網絡進行汽車駕駛員的疲勞狀態(tài)的識別。
在已往研究中針對的貝葉斯網絡算法中,其變量主要是針對離散變量,而在實際應用中,對如腦電信號這種連續(xù)變量也往往是采用連續(xù)數(shù)據(jù)離散化的方法進行貝葉斯網絡結構學習。離散過程中會丟失很多數(shù)據(jù)包含的信息,甚至可能出現(xiàn)假依賴的現(xiàn)象[11]。除了離散化之外,對于連續(xù)變量,還有一種方法是基于條件獨立性測試,文獻[12]將信息論與統(tǒng)計測試結合起來,通過計算互信息來確定節(jié)點之間的條件獨立性,從而構造多連接有向圖模型。雖然這種方法在一定程度上能夠反映連續(xù)變量之間的相互關系,但是文獻[13]已經指出,這種算法的缺點在于,在有限的樣本空間內,高階的條件獨立性檢驗的結果極有可能是不可靠的。
本文針對左右運動想象的連續(xù)腦電信號,提出一種基于高斯分布的貝葉斯網絡結構運動想象腦電信號分類方法,主要有以下創(chuàng)新:(1)分別構建左右運動想象的貝葉斯網絡,再通過網絡結構的差異性來進行相關統(tǒng)計分析;(2)在結構學習搜索過程中添加根據(jù)腦電導聯(lián)物理位置關系約束;(3)在評分過程中采用高斯分布來描述每個導聯(lián)的腦電數(shù)據(jù),進而獲得連續(xù)變量的相關參數(shù)和概率密度函數(shù)。
貝葉斯網絡是一個有向無圈圖,由網絡結構和條件概率分布組成[14]。設節(jié)點代表各個導聯(lián),節(jié)點間的邊代表導聯(lián)之間的相互關系。本文的貝葉斯網絡結構學習步驟如下:
(1)根據(jù)Fisher判別準則確定任意兩節(jié)點是否獨立,從而得到每個節(jié)點的父子節(jié)點集Π1;考慮到越相近的導聯(lián)獲取腦電信號所包含的神經活動越相近,本文再根據(jù)導聯(lián)的物理位置分布選取出每個導聯(lián)的四鄰域導聯(lián)作為其父子節(jié)點集Π2,于是取 Π=Π1∩Π2作為最終的父子節(jié)點集。
(2)對樣本集進行結構學習。對每個節(jié)點進行高斯分布建模,在此基礎上采用經典的貝葉斯信息準則(Bayesian Information Criterion,BIC)[15]對整個貝葉斯網絡進行評分。
對于連續(xù)腦電信號的概率密度函數(shù),本文通過高斯分布來表示,下面介紹具體的算法推導及過程。
現(xiàn)已知某導聯(lián)Xi及其連續(xù)父節(jié)點Y,則其條件概率密度可表示為:
其中,Bi是權值矩陣;μi表示均值;∑i表示協(xié)方差矩陣。
若存在m個獨立同分布樣本集D,則上式的最大似然估計可表示為:
將式(1)帶入式(2),則式(2)可轉變?yōu)橐韵滦问剑?/p>
通過上式進行最大似然估計即可得到相應的均值、協(xié)方差和權值,結果分別為:
其中,E[XY′]表示子節(jié)點X的樣本與父節(jié)點Y樣本的轉置的條件二階矩,其余表達式類似。
BIC評分是一種常用的評分方法,計算公式如下:
其中,LL表示極大似然估計的對數(shù);d表示參數(shù)的個數(shù);n表示變量的個數(shù)。
對于連續(xù)變量,通過計算變量概率密度或者條件概率密度的極大似然估計來進行評分,如式(6)所示:
其中,Θ表示連續(xù)分布的相關參數(shù);m表示樣本個數(shù)。
給定樣本數(shù)據(jù)即可通過上式分別計算出均值、協(xié)方差和權值,再代入式(1)即可得到概率密度函數(shù),繼而得到整個網絡的得分情況,該評分方法的流程如圖1所示。
圖1 基于單高斯分布的評分流程
本文提出的基于貝葉斯網絡的運動想象腦電信號分析方法流程如圖2所示。
圖2 基于貝葉斯網絡的運動想象腦電信號分析流程
本文實驗數(shù)據(jù)來源分為2組:第1組來源于Graz大學的國際BCI競賽數(shù)據(jù)(BCI IIIa),該數(shù)據(jù)集中包含3個被試驗對象(下文中簡稱被試),每個被試進行4種運動想象,本文分別取每個被試的30個左、右手運動想象數(shù)據(jù)來進行分析。另外,為了驗證本文方法的通用性,本文按照第3屆國際BCI競賽實驗設計運動想象實驗,并采集測試數(shù)據(jù),這同時也是本文的第2組數(shù)據(jù)。實驗數(shù)據(jù)采用64導的G.tech腦電放大器采集獲得,采樣頻率為250 Hz。被試對象為5名在校學生,男性,健康狀況良好,年齡在23歲~27歲之間。實驗過程中被試頭戴腦電帽,放松地坐在椅子上,按照電腦屏幕上隨機提示想象左手或右手運動。單次運動想象時間持續(xù)7 s,其中,前2 s被試處于安靜狀態(tài),2 s時計算機發(fā)出提示音并在屏幕中央顯示“+”,3 s時計算機屏幕上出現(xiàn)向左或者向右的箭頭,被試開始進行運動想象,該過程一直持續(xù)到第7 s。每個被試分別進行30個左、右手運動想象。
對2組數(shù)據(jù)隨機取其中20個作為訓練樣本,剩余10個作為測試樣本。綜合貝葉斯網絡構建的復雜度及前人的研究成果,本文選取11導(FC3,FC4,C5,C3,C1,CZ,C2,C4,C6,CP3,CP4)數(shù)據(jù)進行分析。在分析之前,本文對實驗數(shù)據(jù)進行了預處理。預處理主要是進行去除眼電和進行濾波工作。眼電的去除借助Neuroscan軟件完成。對于濾波工作,本文分析的頻帶為8 Hz~30 Hz,正好是α波和β波的頻帶[16]。因此,本文設計橢圓濾波器,其通帶頻段為8 Hz~30 Hz。
3.3.1 BCI IIIa實驗結果
在分析過程中,BCI IIIa數(shù)據(jù)集中的3組(k3b、k6b、l1b)被試的每種類型的運動想象樣本可以得到一個相應的貝葉斯網絡,將每種類型的20個貝葉斯網絡的共同邊屬性進行統(tǒng)計,得出可用于區(qū)分的邊和方向。
實驗結果如圖3所示(本文取被試k3b的統(tǒng)計圖進行說明),圖中橫坐標對應導聯(lián)的編號,縱坐標表示20個訓練樣本中以某導聯(lián)為父節(jié)點的相應邊出現(xiàn)的次數(shù)。圖3(a)表示左運動想象貝葉斯網絡相加統(tǒng)計結果;圖3(b)表示右運動想象貝葉斯網絡相加統(tǒng)計圖;圖3(c)則表示兩者相減之后的結果。
在所有3個被試的2類運動想象中,左右運動想象的貝葉斯網絡差值都有顯著性差異邊存在,但不相同。例如,對被試k3b,顯著性差異的邊為導聯(lián)1到導聯(lián)4所構成的邊。表1展示的是3個被試顯著性差異的邊及差異程度,括號內的數(shù)字表示差異程度(即對應邊顯著性差異的運動想象樣本個數(shù)),其中,正數(shù)表示左右顯著性差異程度,負號則表示右左顯著性差異程度。在判別分析過程中,根據(jù)網絡中這些顯著性差異邊就能就能識別運動想象的類型。
圖3 k3b左右統(tǒng)計結果
表1 BCI IIIa貝葉斯網絡公共邊統(tǒng)計結果
對于上述3個標準數(shù)據(jù)集,為了體現(xiàn)出本文方法的有效性,采用文獻[17]的實驗結果作為對比,同時采用文獻[18]的PCA+fisherscore方法進行判別分析,3種方法的識別率如表2所示??梢钥闯?,本文方法的平均識別率為76.67%,而文獻[18]的PCA+Fisherscore方法識別效果較差,平均識別率僅為45.55%;文獻[17]提出的基于時頻域分析的運動想象腦電信號分類方法是近來取得較好識別效果的一種方法之一,雖然對特定的數(shù)據(jù)集可能存在較好的效果,但該方法的平均識別率為76.47%,依然略差于本文方法的平均識別率。
表2 BCI IIIa數(shù)據(jù)左右運動想象識別率 %
3.3.2 自測數(shù)據(jù)實驗結果
對本文所用的5個被試實驗數(shù)據(jù),同樣按照上組實驗方法進行統(tǒng)計,得到如圖4所示的統(tǒng)計結果。
圖4 被試1的左右統(tǒng)計結果
表3展示了測試組所有5個被試顯著性差異的邊及相應的差異程度。
表3 貝葉斯網絡公共邊統(tǒng)計結果
為直觀地顯示出網絡結構的差異,圖5給出了被試實驗數(shù)據(jù)1的左、右運動想象貝葉斯網絡圖及最大差異邊的示意圖。其中,圓圈表示左右顯著性差異最大的邊,即用來進行左右判別的邊。
圖5 被試實驗數(shù)據(jù)1左右運動想象貝葉斯網絡
針對測試組5個被試,同樣采用PCA+fisherscore方法進行判別分析。2種方法的得到的識別率如表4所示。
表4 5組左右運動想象識別率 %
由表4中的測試結果可以看出,與PCA方法相比,本文方法對自測數(shù)據(jù)的5個被試的運動想象同樣具有較高的識別率和穩(wěn)定性。
本文介紹了一種基于貝葉斯網絡建模的運動想象腦電信號判別分析方法,并說明該方法的原理及流程。通過使用高斯分布來充分描述出腦電數(shù)據(jù)的分布特征,進而得到各個導聯(lián)之間相互關系,同時,將電極之間的物理關系作為限制條件構建貝葉斯網絡。
通過對比本文方法與PCA+fisherscore方法對2組實驗數(shù)據(jù)的識別效果,表明本文方法具有較好的識別效果。然而對于分布非平穩(wěn)且不規(guī)則的腦電數(shù)據(jù)而言,用單高斯模型去描述腦電數(shù)據(jù)的分布特征仍然可能會丟失很多重要信息。因此,下一步的工作主要集中在如何更全面、完整地描述腦電數(shù)據(jù)的分布特征,進而構建相應的貝葉斯網絡。
[1]萬 柏,綦宏志,趙 麗.基于腦電Alpha波的腦-機接口控制實驗[J].天津大學學報,2006,39(8):977-983.
[2]Krusienski D J,McFarland D J,Wolpaw J R.An Evaluation of Autoregressive Spectral Estimation Model Order for Braincomputer Interface Applications[C]//Proceedings of IEEE EMBS Annual International Conference.New York,USA:IEEE Press,2006:1323-1326.
[3]廖 樣,尹 愚,堯德中.基于連續(xù)小波變換和支持向量機的手動想象腦電分類[J].中國醫(yī)學物理學雜志,2006,23(2):129-132.
[4]Adeli H,Zhou Ziqin,Dadmehr N.Analysis of EEG Records in an Epileptic Patient Using Wavelet Transform[J].Journal of Neuroscience Methods,2003,123(1):69-87.
[5]Pfurtscheller G,Kalcher J,Neuper C.On-line EEG Classification During Externally-paced Hand Movements Using a Neural Network-based Classifier[J].Electroencephalography and Clinical Neurophysiology,1996,99(5):416-425.
[6]Cooper G F,Herskovits E.A Bayesian Method for the Induction of Probabilistic Networks from Data[J].Machine Learning,1992,9(4):309-347.
[7]劉志強.因果關系,貝葉斯網絡與認知圖[J].自動化學報,2001,27(4):552-566.
[8]Yang Guosheng,Lin Yingzi,Bhattacharya P.A Driver Fatigue Recognition Model Based on Information Fusion and Dynamic Bayesian Network[J].Information Sciences,2010,180(10):1942-1954.
[9]Ko K E,Yang H C,Sim K B.Emotion Recognition Using EEG Signals with Relative Power Values and Bayesian Network[J].International Journal of Control,Automation and Systems,2009,7(5):865-870.
[10]Li Xiangyang,Ji Qiang.Active Affective State Detection and User Assistance with Dynamic Bayesian Networks[J].IEEE Transactions on Systems,Man and Cybernetics,2005,35(1):93-105.
[11]張劍飛,王 輝,周顏軍,等.基于局部優(yōu)化具有連續(xù)變量的貝葉斯網絡結構學習[J].東北師大學報:自然科學版,2006,38(1):27-30.
[12]Jie Cheng,Bell D,Liu Weiru.Learning Bayesian Networks from Data:An Efficient Approach Based on Information Theory[J].Artificial Intelligence,2002,137(1/2):43-90.
[13]Wong M L,Leung K S.An Efficient Data Mining Method for Learning Bayesian Networks Using an Evolutionary Algorithm based Hybrid Approach[J].IEEE Transactions on Evolutionary Computation,2004,8(4):378-404.
[14]Neapolitan R E.Learning Bayesian Networks[M].New York,USA:Prentice Hall,2003.
[15]王書海,劉 剛.BIC評分貝葉斯網絡模型及其應用[J].計算機工程,2008,34(15):229-230,233.
[16]葉 坤.左右手運動想象腦電采集和特征提取方法初探[D].武漢:華中科技大學,2008.
[17]穆振東,胡劍鋒,肖 丹.基于時頻域分析的運動想象腦電信號分類[J].中國組織工程研究與臨床康復,2009,13(26):5079-5082.
[18]Cao Lei,Li Jie,Sun Yaoru,et al.EEG-based Vigilance Analysis by Using Fisher Score and PCA Algorithm[C]//Proceedings of IEEE International Conference on Progress in Informaticsand Computing.[S.l.]:IEEE Press,2010:175-179.