羅志增 魯先舉 周 瑩
(杭州電子科技大學智能控制與機器人研究所 杭州 310018)
腦–機接口(Brain-Computer Interface, BCI)是不依賴外周神經(jīng)與肌肉組織,在人腦和計算機之間直接建立交流通道的交互系統(tǒng)[1,2]?;谶\動想象腦電信號(ElectroEncephaloGram, EEG)的假肢控制是目前BCI的主要研究方向之一,它為運動功能障礙但思維正常的患者提供了一種新的人機交互方式,有著重要的研究意義和廣泛的應用前景[3]。特征的選擇與提取是BCI系統(tǒng)的關(guān)鍵環(huán)節(jié),EEG特征提取常用的方法有:傅里葉變換、功率譜、自回歸模型、空-頻域濾波、小波變換、希爾伯特-黃變換和小波包變換等[4]。為了適應EEG的非線性特點,Lyapunov指數(shù)[5]、Lempel–Ziv復雜度[6]和樣本熵[7]等非線性動力學方法應用越來越多。但實踐表明,單一的特征難以全面地表征EEG所蘊含的信息。
在進行單側(cè)運動想象時,大腦同側(cè)感覺運動區(qū)μ節(jié)律和β節(jié)律幅值增大,而對側(cè)感覺運動區(qū)的幅值減小,稱為事件相關(guān)同步/去同步(Event Related Synchronization/Event Related Desynchronization, ERS/ERD)現(xiàn)象[8]。腦功能網(wǎng)絡是通過計算各個腦區(qū)測量到的EEG信號之間的相關(guān)性而構(gòu)建的復雜網(wǎng)絡,它是對大腦結(jié)構(gòu)網(wǎng)絡中不同腦區(qū)之間動態(tài)活動交互整合的直觀描述[9]。近年來,對于腦功能網(wǎng)絡的研究已取得初步成果。如Chaovalitwongse等人[10]利用EEG構(gòu)建腦功能網(wǎng)絡,并把網(wǎng)絡節(jié)點之間的歐氏距離作為特征向量輸入到支持向量機中,實現(xiàn)對癲癇患者樣本的分類識別;Stanley等人[11]利用全局效率和局部效率網(wǎng)絡特征來分析年輕人和老年人的大腦信息傳遞效率和工作記憶表現(xiàn)之間的關(guān)系。楊碩等人[12]構(gòu)建正常態(tài)和疲勞態(tài)腦功能網(wǎng)絡,利用中間中心度、聚類系數(shù)和節(jié)點平均路徑長度特征區(qū)分不同的腦功能狀態(tài)。樣本熵是一種非線性方法,它用于度量一個時間序列中產(chǎn)生新模式概率的大小[7]。樣本熵在EEG特征提取中已有較好應用。周鵬等人[13]分析了左右手運動想象時感覺運動皮層的EEG信號樣本熵及其動態(tài)變化規(guī)律,并利用Fisher線性分類器進行動態(tài)分類,取得較好分類效果。樣本熵可以反映EEG的復雜度,但它不能分析不同腦區(qū)信號之間的關(guān)系;腦功能網(wǎng)絡可以分析不同腦區(qū)信號間的相關(guān)性,彌補了樣本熵對孤立通道信號分析的不足,但它不能反映信號的復雜度和信號新模式產(chǎn)生概率。因此腦功能網(wǎng)絡和樣本熵的結(jié)合,可以構(gòu)筑分布性和指向性兼具的特征向量,使特征向量描述既有全局上的考慮,又能突出重點,更能全面地反映大腦運動想象的生理電活動特征。
本文用腦功能網(wǎng)絡的結(jié)構(gòu)特征和樣本熵組成EEG特征向量,該特征向量從腦區(qū)功能連通性、信號復雜度兩方面刻畫EEG,并依托支持向量機(Support Vector Machine, SVM)對運動想象EEG進行分類。實驗結(jié)果表明,基于腦功能網(wǎng)絡和樣本熵的特征提取方法能夠?qū)崿F(xiàn)更優(yōu)的分類效果。
雖然大腦不同區(qū)域有相對獨立的功能,但即便是非常簡單的意識任務也需要不同功能的腦區(qū)互相作用、互相聯(lián)系,構(gòu)成一個復雜的網(wǎng)絡協(xié)調(diào)工作。腦功能網(wǎng)絡是一種描述大腦各個區(qū)域統(tǒng)計性連接關(guān)系的腦網(wǎng)絡,屬于無向網(wǎng)絡,它具有復雜網(wǎng)絡中小世界網(wǎng)絡的屬性[9]。構(gòu)建腦功能網(wǎng)絡的主要步驟如下:
(1) 定義網(wǎng)絡節(jié)點:對于多通道EEG,通常把每個EEG導聯(lián)對應的電極覆蓋的區(qū)域定義為一個節(jié)點。
(2) 量化節(jié)點之間的相關(guān)性:分析節(jié)點之間相關(guān)性的方法有Pearson相關(guān)系數(shù)、相干譜和互信息等方法。本文采用魯棒性較高的Pearson相關(guān)系數(shù)法計算各通道EEG之間的相關(guān)性如式(1)所示
其中,xi(t)和 xj(t)為 節(jié)點i和 節(jié)點j在 t 時刻的采樣值,和為節(jié)點i和 節(jié)點j的 平均采樣值,i ,j=1,2,···,N,N為節(jié)點數(shù)。rij的 值介于–1和1,若rij<0,則取絕對值, rij的絕對值越大,表示兩節(jié)點相關(guān)性越強。計算兩兩節(jié)點之間的相關(guān)系數(shù),可得到 N ×N的連接系數(shù)矩陣,該矩陣為對稱矩陣。
(3) 選取合適的閾值 T:對連接系數(shù)矩陣進行閾值處理,得到0–1矩陣Q
aij=1表 示節(jié)點i和 節(jié)點j 之間存在連接邊,反之則不存在連接邊,根據(jù)矩陣 Q可得到腦功能網(wǎng)絡的拓撲結(jié)構(gòu)。
(4) 計算腦功能網(wǎng)絡特征:常用的腦功能網(wǎng)絡測度有節(jié)點度、特征路徑長度、聚集系數(shù)和網(wǎng)絡密度等,這些測度反映了網(wǎng)絡的結(jié)構(gòu)特性。為了減少信息冗余,本文選擇平均節(jié)點度 K和平均聚集系數(shù)C作為腦功能網(wǎng)絡特征,平均節(jié)點度是衡量網(wǎng)絡規(guī)模大小的重要指標,平均聚集系數(shù)反映了網(wǎng)絡中兩個節(jié)點之間存在連接邊的可能性,其定義分別為
其中, N為網(wǎng)絡節(jié)點數(shù),ki為 節(jié)點i的度,表示與節(jié)點i 直接連接的節(jié)點數(shù),一個節(jié)點的度越大反映其在網(wǎng)絡中的地位越重要; Ei為 與節(jié)點i直接連接的ki個 節(jié)點之間實際存在的邊數(shù),ki個節(jié)點之間最多存在ki(ki?1)/2 條 邊,ci為 節(jié)點i的聚集系數(shù),即為Ei與 ki(ki?1)/2 的比值,因此0 ≤ci≤1。
樣本熵是Pincus[14]在近似熵基礎(chǔ)上提出的一種不計數(shù)自身匹配的統(tǒng)計量,樣本熵具有近似熵所有優(yōu)點的同時,避免了近似熵中統(tǒng)計量不一致的問題。樣本熵用于衡量時間序列中產(chǎn)生新模式概率的大小,樣本熵值越大,表示時間序列中產(chǎn)生新模式的概率越大,序列越復雜。計算時間序列z(l)(l=1,2,···,M,M為采樣點數(shù))樣本熵的步驟如下:
(1) 將序列按順序組成m 維矢量
式中,l =1,2,···,M ?m。
(2) 定義矢量 Zm(l) 和Zm(s)之間的距離為兩個矢量對應元素差值中最大的一個
式中,l ,s=1,2,···,M ?m 且l ≠s。
(3) 給定閾值p, 統(tǒng)計d [Zm(l),Zm(s)]小 于p 的數(shù)目,記為(p) ,計算該數(shù)目與距離總數(shù)目M?m+1 的比值,記為(p)
(5) 將序列按順序組成m +1維矢量,重復步驟(1)~(4)得到Bm+1(p)。
(6)序列的樣本熵為
(7)實際應用中,由于序列長度有限,因此采樣點數(shù)為 M的序列樣本熵的估計值為
本文實驗數(shù)據(jù)來自BCI Competition IV Data Set 1,由Berlin BCI研究中心提供[15]。實驗范式為7名健康受試者(A~G)面對電腦屏幕的相應提示執(zhí)行左手、右手和腳運動想象中的任意兩類,其中2名受試者(A, F)選擇左手和腳運動想象,另外5名受試者選擇左手和右手運動想象。數(shù)據(jù)的采集電極放置符合10-20導聯(lián)標準,每組數(shù)據(jù)包含59個通道的EEG信號,采樣頻率為100 Hz。本文實驗選用B, C, D, E和G5位受試者的實驗數(shù)據(jù)進行實驗分析。實驗過程中每名受試者均進行了200次運動想象,每個動作執(zhí)行100次,單次實驗持續(xù)時間為8 s。每次實驗記錄過程如下:0~2 s,屏幕顯示固定的交叉十字,受試者處于運動想象準備狀態(tài);2~6 s,屏幕顯示向左或向右或向下的箭頭,受試者根據(jù)箭頭進行左手或右手或腳的運動想象;6~8 s,屏幕變?yōu)楹谄粒茉囌咛幱谛菹顟B(tài),表示1次實驗結(jié)束。
由于EEG信號十分微弱,采集到的信號中包含很多干擾和偽跡的成分,因此有必要對數(shù)據(jù)進行預處理。ERS/ERD現(xiàn)象與 μ節(jié)律(8~13 Hz)和β節(jié)律(13~26 Hz)有關(guān),β節(jié)律中部分頻率是 μ節(jié)律的諧波, μ節(jié)律與運動或運動想象存在緊密聯(lián)系[16]。EEG信號采樣頻率為100 Hz,采用db5小波進行5層分解,對小波包分解后的小波系數(shù)進行重構(gòu)得到 μ節(jié)律用于后期的腦功能網(wǎng)絡構(gòu)建與特征提取。圖1為受試者B右手運動想象C3通道和左手運動想象C4通道的原始EEG和小波包變換消噪重構(gòu)后的μ節(jié)律。
根據(jù)ERS/ERD現(xiàn)象與運動想象的對側(cè)映射規(guī)律,為了體現(xiàn)大腦運動想象左半球腦區(qū)和右半球腦區(qū)潛在的功能連通性差異,本文用 μ節(jié)律分別對左半球腦區(qū):AF3, F1/3/5, FC1/3/5, CFC1/3/5/7,T7, C1/3/5, CCP1/3/5/7, CP1/3/5, P1/3/5,PO1和O1共27個電極作為節(jié)點和右半球腦區(qū):AF4,F2/4/6, FC2/4/6, CFC2/4/6/8, T8, C2/4/6,CCP2/4/6/8, CP2/4/6, P2/4/6, PO2和O2共27個電極作為節(jié)點,分別構(gòu)建兩側(cè)半球腦功能網(wǎng)絡,記為左腦功能網(wǎng)絡和右腦功能網(wǎng)絡,電極位置具體分布情況如圖2所示。
在腦功能網(wǎng)絡構(gòu)建過程中,目前連接閾值的選取沒有普遍的標準。本文閾值的選取是以構(gòu)建的腦網(wǎng)絡具有顯著的小世界特性且功能連接性顯著為基本原則。小世界網(wǎng)絡概念的提出,為量化研究復雜腦網(wǎng)絡的性質(zhì)和腦功能性疾病提供了新手段。計算小世界網(wǎng)絡特性公式為
其中, Creal和Lreal分別為所構(gòu)建真實網(wǎng)絡的平均聚集系數(shù)和平均路徑長度, Crand和Lrand分別為相同規(guī)模隨機網(wǎng)絡的平均聚集系數(shù)和平均路徑長度。σ為度量網(wǎng)絡是否具備小世界屬性的綜合指標,σ >1表明該網(wǎng)絡具備小世界屬性,且 σ越大說明小世界屬性越強。圖3為閾值按照0.05步長遞增下 σ特性分布。
圖1 受試者B原始EEG和小波包變換提取的μ節(jié)律
圖2 電極位置分布圖
由圖3可知,σ 與閾值大小關(guān)系呈正相關(guān)。但是隨著閾值T增大,網(wǎng)絡中節(jié)點連邊的數(shù)量減少,會導致網(wǎng)絡平均節(jié)點度 K逐漸降低。當閾值過大時,會造成網(wǎng)絡出現(xiàn)較多孤立節(jié)點的現(xiàn)象,導致網(wǎng)絡的功能連接性下降,進而保證不了腦網(wǎng)絡信息的完整性。因此網(wǎng)絡平均節(jié)點度 K不能小于網(wǎng)絡節(jié)點數(shù)N的自然對數(shù),即K ≥ln N =ln(54)≈3.988。當閾值 T =0.85時 ,腦功能網(wǎng)絡平均節(jié)點度 K的范圍為5~16,滿足 K ≥ln N 的關(guān)系,因此該閾值對應的腦功能網(wǎng)絡同時保證了顯著的小世界特性和功能連接性。圖4為受試者B左右手運動想象的左、右腦功能網(wǎng)絡拓撲結(jié)構(gòu),圖5為受試者B左右手運動想象的左、右腦功能網(wǎng)絡的平均節(jié)點度 K、平均聚類系數(shù)C 分布。
圖3 閾值T按照0.05步長遞增下σ 特性分布圖
從圖4可以直觀地看出,右手運動想象時,左腦功能網(wǎng)絡的網(wǎng)絡密度大于右腦功能網(wǎng)絡的網(wǎng)絡密度,而左手運動想象時,右腦功能網(wǎng)絡的網(wǎng)絡密度大于左腦功能網(wǎng)絡的網(wǎng)絡密度,該結(jié)果與ERS/ERD現(xiàn)象一致,也反映了左、右腦功能網(wǎng)絡的結(jié)構(gòu)特性可作為對側(cè)右手和左手運動想象EEG的分類特征。從圖5可知左、右腦功能網(wǎng)絡的平均節(jié)點度和平均聚類系數(shù)具有一定的區(qū)分度,但仍有較多樣本重疊。
圖4 腦功能網(wǎng)絡拓撲結(jié)構(gòu)
圖5 左、右腦功能網(wǎng)絡平均節(jié)點度、平均聚集系數(shù)分布
樣本熵的值與 m, p和 M 3個參數(shù)有關(guān)[7,14]:(1)維數(shù) m 一般取值1或2,當m >2時,要求數(shù)據(jù)量M在數(shù)千點以上,但 M過大不能保證序列具有相同的性質(zhì); M 一定時,若m >2, 需要p 較大才能取得較好的效果,但是 p太大會丟失序列的許多細節(jié)信息。Pincus[14]研究認為 m =2比m =1效果好,可使序列的聯(lián)合概率進行動態(tài)重構(gòu)時提供更詳細的信息。(2) p用來衡量時間序列相似性的大小。如果p 選得太小,估計出的統(tǒng)計概率會不理想;若p 選得太大,會丟失時間序列中很多細節(jié),達不到預期的效果。Pincus[14]通過對確定性和隨機過程的理論分析及其對計算和臨床應用的研究,總結(jié)出p 取值為0.1 ~0.25SD(S D為原始序列的標準差)能得出有效的統(tǒng)計特征。(3) M表示輸入數(shù)據(jù)點,一般取值為100~5000。因此根據(jù)上述原則,本文取 m=2,p=0.2SD。 根據(jù)實驗研究發(fā)現(xiàn)當M <100時,不同狀態(tài)的腦電信號的樣本熵并無太大差異;當M >100時,不同狀態(tài)的腦電信號的熵值有明顯差異。因此 M取值為100。即用長度為100點,間隔為4點的滑動窗計算EEG在運動想象期(2~6 s)的樣本熵序列,然后求該序列的均值作為該EEG的樣本熵。ERS/ERD現(xiàn)象主要出現(xiàn)在C3和C4電極對應的感覺運動區(qū)上,例如,右手運動想象時可觀測到C3電極對應的感覺運動區(qū)ERD現(xiàn)象,左手運動想象時可觀測到C4電極對應的感覺運動區(qū)ERD現(xiàn)象[17]。根據(jù)運動想象的ERS/ERD現(xiàn)象在感覺運動區(qū)的C3和C4通道表現(xiàn)得最為明顯,且μ 節(jié)律與運動想象有緊密的聯(lián)系,本文分別計算C3和C4通道μ 節(jié)律的樣本熵,使特征選擇方面在全局性腦功能網(wǎng)絡特征的基礎(chǔ)上,又補充指向明確的區(qū)域特征。圖6是受試者B的C3和C4通道樣本熵值分布。
從圖6可知,C3和C4通道 μ節(jié)律的樣本熵對左右手運動想象EEG具有一定的區(qū)分度,但仍有較多樣本重疊。
圖6 C3和C4通道樣本熵值分布
本文選擇支持向量機(SVM)對左右手運動想象EEG進行分類。從B, C, D, E和G每名受試者的樣本數(shù)據(jù)中,各隨機取50組左手運動想象和50組右手運想象樣本,合計500組樣本作為訓練集,余下的500組樣本作為測試集。分別將腦功能網(wǎng)絡特征(4維)、樣本熵(2維)、腦功能網(wǎng)絡特征與樣本熵的組合(6維)作為特征向量輸入SVM對左、右手運動想象EEG進行分類,分類前先對特征向量進行歸一化處理,SVM的核函數(shù)選擇高斯核函數(shù)。采用10倍交叉驗證確定最佳的懲罰因子 c =2.46,核參數(shù) g =0.28。為了減小因訓練集不同而產(chǎn)生的誤差,進行20次分類實驗,取20次實驗的平均正確識別率。表1為用不同特征向量重復20次分類的平均正確識別率。
表1 不同特征向量平均正確識別率與方差(%)
從表1可知,基于腦功能網(wǎng)絡和樣本熵的所有受試平均正確識別率為87.23%,相比僅使用腦功能網(wǎng)絡特征或樣本熵作為特征向量,識別率分別提高了8.75%和13.56%。而且基于腦功能網(wǎng)絡和樣本熵特征識別率的方差低于任意單一特征,說明兩種特征的融合具有更好的魯棒性。對于受試G,平均正確識別率達到了90.27%。表2為各受試不同特征t檢驗的p值,從表2可知各受試不同特征之間的p值均小于0.01,表明不同的特征具有顯著性差異。
以上結(jié)果說明,基于腦功能網(wǎng)絡和樣本熵兩類特征的融合可以得到更佳的分類效果,并驗證了本文在特征選擇上采取全局特征和局部特征相結(jié)合的方式能取得更好分類效果的設(shè)想。
為了更好地突出基于腦功能網(wǎng)絡和樣本熵的特征提取方法的有效性,本文將其與現(xiàn)有成熟方法進行對比說明,對比方法實驗數(shù)據(jù)均來自BCI Competition Ⅳ Data Set 1,與本文采用的實驗數(shù)據(jù)一致,如表3所示。
表2 各受試不同特征t檢驗的p值
表3 不同特征提取方法平均正確識別率對比
從表3可以看出:共空間模式算法、濾波器組共空間模式、功率譜密度和希爾伯特-黃變換方法進行分類的平均正確識別率分別為70.90%, 80.88%,73.13%和84.70%,均低于本文基于腦功能網(wǎng)絡和樣本熵的特征提取方法,有力驗證了本文提出方法的有效性。因此,基于腦功能網(wǎng)絡和樣本熵兩者結(jié)合的特征提取方法可為大腦意識任務模式分類提供新思路。
根據(jù)ERS/ERD現(xiàn)象與運動想象的對側(cè)映射規(guī)律,為體現(xiàn)大腦運動想象左半球腦區(qū)和右半球腦區(qū)功能連通性差異,本文用 μ節(jié)律分別對左、右半球腦區(qū)構(gòu)建腦功能網(wǎng)絡,并計算網(wǎng)絡的平均節(jié)點度和平均聚集系數(shù)作為腦功能網(wǎng)絡特征。為了彌補腦功能網(wǎng)絡在運動想象區(qū)域特征描述上的不足,在腦功能網(wǎng)絡特征基礎(chǔ)上融合樣本熵,更全面地反映大腦運動想象的生理電活動特性,故本文結(jié)合C3和C4通道 μ節(jié)律的樣本熵,將腦功能網(wǎng)絡特征和樣本熵組合作為EEG的特征向量。該特征向量充分考慮了左右腦的成對組合,并從腦區(qū)功能連通性、信號復雜度兩方面更全面地描述EEG。實驗結(jié)果表明,結(jié)合腦功能網(wǎng)絡和樣本熵的特征提取方法對左、右手運動想象EEG的正確識別率高于僅采用腦功能網(wǎng)絡特征、樣本熵以及其他傳統(tǒng)特征提取算法的正確識別率。因此,本文的特征提取方法在BCI研究中具有參考價值。