褚凱軒,常天慶,郭理彬,馬 也
陸軍裝甲兵學(xué)院 兵器與控制系,北京 100072
P300電位是腦-機(jī)接口中常用的信號(hào),是指在接受靶刺激后約300 ms出現(xiàn)的正向電位偏移。P300是一種經(jīng)典的事件相關(guān)電位(ERP)成分,是大腦對(duì)信息加工最好的反映,其潛伏期與刺激具有嚴(yán)格的鎖時(shí)關(guān)系。針對(duì)P300電位,Polich和Donchin[1]提出的Oddball范式沿用至今,Oddball范式中要求參與者對(duì)一系列刺激進(jìn)行分類,這些刺激可分為兩類,靶刺激和非靶刺激,靶刺激出現(xiàn)的概率遠(yuǎn)遠(yuǎn)小于非靶刺激出現(xiàn)的概率。學(xué)術(shù)界以O(shè)ddball范式為基礎(chǔ),將P300-RSVP目標(biāo)檢測(cè)系統(tǒng)應(yīng)用于多種目標(biāo)的分類和檢測(cè)[2-4]:用RSVP技術(shù)將一系列待檢圖片快速播放,小概率出現(xiàn)的含有目標(biāo)的圖片會(huì)刺激被試者產(chǎn)生P300電位,通過研究腦電波中是否含有P300即可鎖定目標(biāo)圖片。P300-RSVP目標(biāo)檢測(cè)系統(tǒng)需要與之配套的圖像最優(yōu)呈現(xiàn)技術(shù),以刺激被試者產(chǎn)生更強(qiáng)烈的P300,提取更顯著的腦電特征,進(jìn)而提高目標(biāo)檢測(cè)的正確率[5]。圖片中的目標(biāo)所占視場(chǎng)角是一個(gè)重要的因素,目標(biāo)視場(chǎng)角是指目標(biāo)的外緣與人眼視線形成的角度,目標(biāo)視場(chǎng)角直接影響誘發(fā)的P300信號(hào)的強(qiáng)度。
當(dāng)前對(duì)“視角”問題進(jìn)行了較多的研究。文獻(xiàn)[6]的研究顯示,當(dāng)目標(biāo)位于中心視野4°以內(nèi)時(shí),被試者主觀發(fā)現(xiàn)目標(biāo)概率達(dá)到90%,而當(dāng)目標(biāo)遠(yuǎn)離視角4°時(shí),被試者的識(shí)別率下降到50%,當(dāng)目標(biāo)遠(yuǎn)離視角8°時(shí),識(shí)別率進(jìn)一步下降。雖然被試者的周邊視野仍然可以發(fā)現(xiàn)目標(biāo)刺激,但目標(biāo)在視野的外緣處必須特征更顯著才能被發(fā)現(xiàn)。文獻(xiàn)[7]在4 Hz播放幀率下采用6°×4°視角的圖片刺激被試者,圖片中的目標(biāo)包括動(dòng)物、汽車、飛機(jī)、人等,最后對(duì)P300的分類正確率達(dá)到90%以上。文獻(xiàn)[8]在10 Hz播放幀率下采用約26°視角的圖片刺激被試者,要求被試者從汽車圖片中篩選出人臉圖片,對(duì)3名被試者的P300的分類正確率分別為84.5%±0.63%、85.0%±0.61%、84.7%±0.63%。
文獻(xiàn)[6]對(duì)目標(biāo)中心偏離中心視線(屏幕中心)的角度進(jìn)行了研究,而在實(shí)際應(yīng)用中,目標(biāo)的位置是未知的,目標(biāo)偏離視野的角度不可控,文獻(xiàn)中得到的結(jié)論難以直接用于實(shí)踐。文獻(xiàn)[7-8]對(duì)圖片所占視場(chǎng)角進(jìn)行了研究,而在刺激實(shí)驗(yàn)中,被試者更多的是關(guān)注圖片中的目標(biāo)而非圖片本身。當(dāng)前對(duì)于圖片中的目標(biāo)所占視場(chǎng)角的問題研究較少。目標(biāo)視場(chǎng)角是對(duì)刺激強(qiáng)度和最佳視域的權(quán)衡:因?yàn)橄鄬?duì)較大的目標(biāo)有利于刺激被試者產(chǎn)生更強(qiáng)的P300信號(hào),但當(dāng)目標(biāo)視場(chǎng)角超過人眼的最佳視域范圍時(shí),會(huì)造成被試者難以在短時(shí)間內(nèi)觀察目標(biāo)全貌而錯(cuò)過目標(biāo)。因此研究目標(biāo)的最佳視場(chǎng)角具有重要意義。
前期實(shí)驗(yàn)中已知,人能夠在短時(shí)間(0.1 s)內(nèi)識(shí)別坦克目標(biāo)的最少像素點(diǎn)個(gè)數(shù)為30個(gè)左右,分辨率為960×720的圖片中0.5°的視場(chǎng)角內(nèi)大約有30個(gè)像素點(diǎn),故選擇0.5°的目標(biāo)視場(chǎng)角進(jìn)行第一組實(shí)驗(yàn);文獻(xiàn)[6]中實(shí)驗(yàn)表明目標(biāo)位于中心視野4°以內(nèi)時(shí),被試者發(fā)現(xiàn)目標(biāo)的概率最大,因此本實(shí)驗(yàn)中也用4°目標(biāo)視場(chǎng)角進(jìn)行一組實(shí)驗(yàn);水平方向8°范圍內(nèi)的物體,映像將落在視網(wǎng)膜最敏感的部分——黃斑上[9],故選擇8°目標(biāo)視場(chǎng)角進(jìn)行一組實(shí)驗(yàn);人眼的分辨視域約為15°,該范圍內(nèi)人眼能較快地捕捉圖像特征,識(shí)別簡單的數(shù)字和字母[10],故選擇15°的目標(biāo)視場(chǎng)角為最后一組實(shí)驗(yàn)。
采用0.5°、4°、8°和15°共4種不同視場(chǎng)角的目標(biāo)對(duì)5名被試者進(jìn)行刺激實(shí)驗(yàn)。比較不同視場(chǎng)角的目標(biāo)刺激下P300的疊加平均信號(hào)的強(qiáng)度;采用結(jié)構(gòu)化判別成分分析(HDCA)對(duì)不同目標(biāo)視場(chǎng)角下的單試次信號(hào)進(jìn)行分類,比較目標(biāo)探測(cè)率。
P300-RSVP目標(biāo)檢測(cè)系統(tǒng)主要由腦電信號(hào)刺激模塊、腦電信號(hào)采集模塊、腦電信號(hào)處理模塊三個(gè)部分組成。腦電信號(hào)刺激模塊的功能是將圖片序列通過RSVP技術(shù)快速呈現(xiàn)給被試者,刺激被試者大腦產(chǎn)生相應(yīng)的腦電信號(hào)。腦電信號(hào)采集模塊的主要功能是對(duì)刺激產(chǎn)生的腦電信號(hào)進(jìn)行采集和儲(chǔ)存,同時(shí)產(chǎn)生標(biāo)簽,使圖片序列和腦電波在時(shí)間上一一對(duì)應(yīng)。腦電信號(hào)處理模塊主要是對(duì)腦電信號(hào)進(jìn)行預(yù)處理、特征提取和分類,其中預(yù)處理包括對(duì)腦電波進(jìn)行降采樣、濾波、分段和去噪聲等操作。
P300-RSVP目標(biāo)檢測(cè)系統(tǒng)工作原理如圖1所示。將待檢測(cè)圖片通過RSVP技術(shù)快速播放,刺激被試者產(chǎn)生腦電信號(hào),同時(shí)將圖片和對(duì)應(yīng)的腦電波打上標(biāo)簽,二者在時(shí)間上一一對(duì)應(yīng)。根據(jù)腦電波中是否存在P300對(duì)腦電信號(hào)進(jìn)行分類。通過圖片和腦電波之間的標(biāo)簽,鎖定目標(biāo)圖片,達(dá)到目標(biāo)檢測(cè)的目的[11]?;赑300腦-機(jī)接口的目標(biāo)檢測(cè)系統(tǒng)利用腦-機(jī)接口技術(shù),實(shí)現(xiàn)機(jī)器智能與生物智能的有機(jī)融合,實(shí)時(shí)提供反饋信息幫助被試者完成高速、流水線式的目標(biāo)檢測(cè)任務(wù)。
圖1 RSVP-BCI目標(biāo)檢測(cè)系統(tǒng)工作原理圖
腦電波具有低信噪比的特點(diǎn),P300信號(hào)的背景噪聲主要是自發(fā)腦電信號(hào)、眼電信號(hào)、肌電信號(hào)和工頻干擾組成。P300信號(hào)的幅值一般都在0.5~20μV,而自發(fā)EEG信號(hào)的幅值有時(shí)會(huì)達(dá)到100μV以上[12],遠(yuǎn)大于P300信號(hào)的幅值,造成P300信號(hào)經(jīng)常淹沒在噪聲之中。在單試次腦電波分類任務(wù)中,無法采取疊加平均的方法提高信噪比,腦電波分類難度較大。為了提高目標(biāo)檢測(cè)系統(tǒng)的性能,除了改進(jìn)信號(hào)處理的算法外,研究圖片最優(yōu)呈現(xiàn)技術(shù)從而提高刺激產(chǎn)生的P300強(qiáng)度也是一條重要途徑。因此,本文的研究主要是針對(duì)刺激——圖片,以期產(chǎn)生更強(qiáng)烈的P300電位,從而降低分類的難度,提高目標(biāo)檢測(cè)的正確率。
共有5名被試者參加該實(shí)驗(yàn),受試者年齡在23~30,被試者身體健康,視力正常,進(jìn)行實(shí)驗(yàn)時(shí)精神狀態(tài)良好。實(shí)驗(yàn)中對(duì)被試者提出以下要求:
(1)被試者需要了解實(shí)驗(yàn)的基本原理和流程,實(shí)驗(yàn)之前瀏覽一遍圖片。
(2)實(shí)驗(yàn)過程中被試者保持面部肌肉放松,減少四肢和頭部的動(dòng)作,保持呼吸平穩(wěn),情緒鎮(zhèn)定。一旦出現(xiàn)咳嗽、瞌睡或注意力不集中等情況,需要及時(shí)報(bào)告,剔除相應(yīng)的腦電波數(shù)據(jù)。
(3)由于兩張目標(biāo)圖片間隔至少1.5 s,鼓勵(lì)被試者在發(fā)現(xiàn)目標(biāo)圖片后0.8~1.5 s時(shí)間內(nèi)眨眼,該段腦電不作為分析使用。
實(shí)地航拍獲取圖片素材、對(duì)圖片素材進(jìn)行篩選、裁剪等預(yù)處理操作,建立圖庫。圖庫中包含目標(biāo)圖片與非目標(biāo)圖片,目標(biāo)圖片中含有坦克目標(biāo),非目標(biāo)圖片中無坦克目標(biāo)。兩類圖片大小一致,分辨率均為960×720。目標(biāo)圖片樣本和非目標(biāo)圖片樣本如圖2所示。
圖2 目標(biāo)圖片樣本和非目標(biāo)圖片樣本
每100張圖片組成一組圖片序列,其中有非目標(biāo)圖片96張,目標(biāo)圖片4張,目標(biāo)圖片位于圖片序列中的5~25、30~50、55~75、80~100,且任意兩張目標(biāo)圖片至少間隔15張非目標(biāo)圖片。每種目標(biāo)視場(chǎng)角下進(jìn)行100組實(shí)驗(yàn)刺激實(shí)驗(yàn),共計(jì)可以產(chǎn)生400個(gè)正樣本腦電波和9 600個(gè)負(fù)樣本腦電波。
目標(biāo)視場(chǎng)角的示意圖如圖3所示。
其中,α為目標(biāo)邊緣偏離視線的角度,γ即為目標(biāo)所占視場(chǎng)角,b為圖片邊緣距離目標(biāo)中心的距離,L為被試者與屏幕間的距離,本實(shí)驗(yàn)要求被試者距離屏幕0.6 m,即L=0.6 m。
圖3 視角示意圖
從近距離拍攝的源圖片中割取目標(biāo)視場(chǎng)角較大的圖片樣本,從遠(yuǎn)距離拍攝的源圖片中割取目標(biāo)視場(chǎng)角較小的圖片樣本,再對(duì)割取的圖片進(jìn)行適當(dāng)縮放從而使目標(biāo)視場(chǎng)角達(dá)到實(shí)驗(yàn)要求。最后對(duì)所有的樣本圖片進(jìn)行分辨率歸一化處理,輸出圖片的分辨率均為960×720,清晰度相同。由公式(1)計(jì)算不同大小的目標(biāo)所占視場(chǎng)角,見表1。
表1 目標(biāo)大小與目標(biāo)所占視角對(duì)應(yīng)關(guān)系
對(duì)腦電波進(jìn)行降采樣、0~30 Hz濾波、去眼點(diǎn)、分段和截取等操作,隨機(jī)選取每名被試者的各組目標(biāo)視場(chǎng)角實(shí)驗(yàn)中50段正樣本腦電波數(shù)據(jù),進(jìn)行疊加平均。目標(biāo)視場(chǎng)角影響因素下P300波形如圖4所示。
圖4 目標(biāo)視場(chǎng)角影響因素下P300波形
目標(biāo)視場(chǎng)角影響因素下P300波峰值見表2。
表2 目標(biāo)視場(chǎng)角影響因素下P300波峰值μV
五位被試者中,有四位在目標(biāo)視場(chǎng)角為8°左右時(shí)產(chǎn)生了最強(qiáng)的P300,有一位在目標(biāo)視場(chǎng)角為4°時(shí)產(chǎn)生了最強(qiáng)P300,但是比8°目標(biāo)視場(chǎng)角時(shí)的P300峰值僅高0.06μV。而當(dāng)目標(biāo)視角小于0.5°和大于15°的情況下,四位被試者的P300強(qiáng)度均出現(xiàn)了一定程度的衰減。
雖然P300的峰值是評(píng)價(jià)P300信號(hào)強(qiáng)弱的重要指標(biāo),但這并不是決定分類的唯一因素。例如,N200與刺激也有嚴(yán)格的鎖時(shí)關(guān)系,從圖4中可以看出N200和P300的強(qiáng)度不是嚴(yán)格的正相關(guān)。當(dāng)前對(duì)于P300腦電信號(hào)的分類算法不是只依據(jù)潛伏期附近的正向偏移,而是將整個(gè)波段的信息都列入分析[13-17]。因此,最終判定最佳目標(biāo)視場(chǎng)角,還需要對(duì)腦電波進(jìn)行分類。
采用結(jié)構(gòu)化判別成分分析(HDCA)對(duì)單試次腦電波進(jìn)行分類。算法的核心是對(duì)權(quán)重系數(shù)進(jìn)行訓(xùn)練,使得目標(biāo)圖像的得分盡可能地高于非目標(biāo)類圖像的得分[18]。HDCA分類器的訓(xùn)練過程如圖5所示。P300信號(hào)最晚不會(huì)超過400 ms,且根據(jù)實(shí)驗(yàn)要求,每當(dāng)被試者發(fā)現(xiàn)目標(biāo)后500~1 000 ms之間允許眨眼。因此選取0~400 ms內(nèi)的腦電數(shù)據(jù)作為樣本。分類方案中用到FLD和Logistic Regression方法。FLD對(duì)多維樣本進(jìn)行降維,使來自不同類別的樣本在該低維空間中具有可分性。LR通過一個(gè)多項(xiàng)式函數(shù)將樣本向量映射為一個(gè)(-∞,+∞)范圍內(nèi)的值,然后通過該值在Logistic曲線對(duì)應(yīng)的值給出樣本向量屬于某類別的概率。
圖5 HDCA分類器訓(xùn)練過程
HDCA訓(xùn)練分類器的步驟如下:
第一步:將0~400 ms腦電數(shù)據(jù)以50 ms為間隔分為8個(gè)時(shí)間窗口。
第二步:將各導(dǎo)聯(lián)第i(i=1,2,…,8)個(gè)時(shí)間窗內(nèi)腦電信號(hào)取平均值。
第三步:FLD降維,得到該時(shí)間窗內(nèi)腦電的判決值yi,使得目標(biāo)刺激對(duì)應(yīng)的yi值大于非目標(biāo)刺激對(duì)應(yīng)的yi值。記第i個(gè)時(shí)間窗內(nèi)第k個(gè)導(dǎo)聯(lián)xik特征降維所對(duì)應(yīng)的投影系數(shù)為ωik。對(duì)應(yīng)公式為:
第四步:通過LR找出第i個(gè)時(shí)間窗的加權(quán)系數(shù)ci,使得通過ci加權(quán)后的yi值之和成為圖像評(píng)分值IS,并且目標(biāo)刺激的IS值大于非目標(biāo)刺激的IS值。記第k個(gè)導(dǎo)聯(lián)xk特征降維所對(duì)應(yīng)的投影系數(shù)為ωik。對(duì)應(yīng)的公式為:
第五步:控制誤檢率為15%的前提下,設(shè)置分類閾值ω,進(jìn)行分類。當(dāng)IS≥ω時(shí),判斷腦電波中含有P300,當(dāng)IS<ω時(shí),判斷腦電波中不含P300。
從每位被試者的各不同目標(biāo)視場(chǎng)角刺激下的腦電數(shù)據(jù)中隨機(jī)選取正樣本腦電波和負(fù)樣本腦電波各100段,采用“留一法”對(duì)HDCA分類器進(jìn)行訓(xùn)練和分類,統(tǒng)計(jì)正樣本的分類正確率(即目標(biāo)探測(cè)率)。目標(biāo)視場(chǎng)角影響因素下目標(biāo)探測(cè)率見表3。
表3 目標(biāo)視場(chǎng)角影響因素下目標(biāo)探測(cè)率%
表中數(shù)據(jù)顯示,每位被試者都在目標(biāo)視場(chǎng)角為8°時(shí),達(dá)到了最高的目標(biāo)的探測(cè)率,5位被試者平均目標(biāo)探測(cè)率達(dá)到82%以上。
針對(duì)目標(biāo)所占視場(chǎng)角對(duì)P300-RSVP目標(biāo)檢測(cè)系統(tǒng)的影響,設(shè)計(jì)對(duì)照實(shí)驗(yàn),研究被試者在不同視場(chǎng)角的目標(biāo)刺激下P300的強(qiáng)度以及分類效果。采用HDCA分類算法,經(jīng)過FLD的空間加權(quán)平均和LR的時(shí)間加權(quán)平均,訓(xùn)練權(quán)值,計(jì)算圖像的評(píng)分值,以誤檢率為標(biāo)準(zhǔn)設(shè)置分類閾值,實(shí)現(xiàn)分類。實(shí)驗(yàn)結(jié)果顯示,目標(biāo)所占視角為8°左右時(shí),刺激被試者產(chǎn)生的P300強(qiáng)度最強(qiáng),峰值最高,相應(yīng)的目標(biāo)探測(cè)率最高,5位被試者的平均目標(biāo)探測(cè)率達(dá)到82%以上。