王海玉,王映龍,閔建亮,胡劍鋒
(1.江西農(nóng)業(yè)大學(xué)計(jì)算機(jī)與信息工程學(xué)院,江西 南昌 330045; 2.江西科技學(xué)院信息技術(shù)研究所,江西 南昌 330098)
腦電信號EEG(Electro Encephalo Gram)是一種從中樞神經(jīng)系統(tǒng)傳出的生物電活動,人在自主思維或經(jīng)受異同信號作用時,會生成攜帶不同特性信息的腦電信號,駕駛的過程中亦如此,駕駛?cè)瞬煌瑺顟B(tài)下產(chǎn)生不同腦電信號,通過腦電專項(xiàng)分析駕駛?cè)嗽隈{駛過程中的大腦活動規(guī)律,預(yù)測疲勞發(fā)生,提前進(jìn)行疲勞預(yù)警從而減少交通事故的發(fā)生,成為疲勞檢測領(lǐng)域可靠性極高的生物電應(yīng)用。腦電信號是一種振幅、相位、頻率連續(xù)變化的且受背景噪聲影響的非平穩(wěn)信號,最早期的腦電波研究中常用目視分析,分辨率極低且效果準(zhǔn)確性不高;隨著科技的更新,腦電信號逐步進(jìn)入計(jì)算機(jī)分析階段,功率譜、小波變換、信息熵等逐步被應(yīng)用到腦電信號分析上。本文選用小波變換提取4個頻段幅值以及4個合成指標(biāo)作為腦電特征,并利用KPCA核化的思想將樣本的空間映射到更高維度的空間,再利用這個更高維度的空間進(jìn)行線性降維[1],提取總貢獻(xiàn)率大于90%的主元組成特征集合作為最小二乘向量機(jī)的輸入變量,進(jìn)行分類模型測試及分析。
主觀監(jiān)測技術(shù)和客觀監(jiān)測技術(shù)是目前疲勞駕駛檢測應(yīng)用最為廣泛的方法。主觀監(jiān)測技術(shù)對于駕駛疲勞的評判實(shí)質(zhì)上多通過人的主觀界定時間標(biāo)準(zhǔn)來判定,即對駕駛員每次連續(xù)駕駛時間的控制和衡量,但由于限定這種界定時間無法考慮到不同駕駛員個體在體質(zhì)、精神狀態(tài)、生活飲食狀況,是否身體不適等多方面的差異,所以主觀監(jiān)測技術(shù)判斷界限不明確且結(jié)果往往不令人滿意[2]。因此本文采用客觀監(jiān)測方法采集腦電信號,針對不同駕駛員進(jìn)行針對性分析評價。圖1為實(shí)驗(yàn)處理的主要流程。
圖1 實(shí)驗(yàn)處理流程圖
在采集腦電數(shù)據(jù)后進(jìn)行小波變換處理,投入到KPCA-LSSVM模型進(jìn)行分析驗(yàn)證。值得一提的是實(shí)驗(yàn)獲得學(xué)校許可并與受試者簽訂相關(guān)協(xié)議。
為了印證所提出方法的可行性和有效性,EEG數(shù)據(jù)來自10位身體狀況良好的高校學(xué)生受試者,其中,6位男性,4位女性。所有的受試者身體康健,視力或矯正視力正常,均無神經(jīng)系統(tǒng)疾病或藥物濫用。實(shí)驗(yàn)前使各位受試者了解實(shí)驗(yàn)過程和細(xì)節(jié)相關(guān)問題,實(shí)驗(yàn)中受試者分別進(jìn)入模擬駕駛環(huán)境,根據(jù)測試標(biāo)準(zhǔn)和計(jì)算機(jī)屏幕上的指示作出適當(dāng)?shù)姆磻?yīng),實(shí)時監(jiān)測做相關(guān)記錄并輔以拍照,記錄受試者眼部變化,對受試者狀態(tài)進(jìn)行確定。采集EEG信號后,采用NeuroScan的Scan 4.3軟件進(jìn)行數(shù)據(jù)處理。除A1、A2參考電極外,將30個通道的5分鐘EEG信號分成1個時期,形成300個時期,位置安放采用國際10-20標(biāo)準(zhǔn),雙耳乳突做參考電極,采樣率設(shè)置為1000 Hz。
小波變換是對Gabor的加窗傅里葉變換的升級,對傅里葉窗口的局部化思想進(jìn)行優(yōu)化,并且對傅里葉變換窗口大小不能隨頻率變化的弊端進(jìn)行改進(jìn),利用一個具有快速衰減性和振蕩性的函數(shù)[3],將其伸縮和平移得到一個小波基函數(shù),使信號可按其小波基函數(shù)進(jìn)行時頻分解,基函數(shù)在時頻相平面上具備可變的時間-頻率窗,能夠適應(yīng)不同分辨率。實(shí)驗(yàn)中將數(shù)據(jù)依據(jù)小波變換的積分變換定義為:
(1)
并計(jì)算其小波系數(shù):
Cjk=[wψf](2-j,k2-j)
(2)
使用小波變換處理信號時,首先應(yīng)選取適當(dāng)?shù)男〔ê瘮?shù)將信號進(jìn)行分解,其次對分解出的參數(shù)進(jìn)行閾值處理,選取合適的閾值進(jìn)行分析,最后利用處理后的參數(shù)進(jìn)行逆小波變換將信號進(jìn)行重構(gòu)[5]從而得到變換后新數(shù)據(jù)。實(shí)驗(yàn)中將采樣頻率為1000 Hz的腦電信號進(jìn)行2倍提取后,其采樣頻率降低為500 Hz,依據(jù)采樣定理,250 Hz則成為待分析的焦點(diǎn)腦電數(shù)據(jù),這是由于該頻帶屬于受腦電信號自身特征影響以及受工頻干擾的主要頻帶范圍。
腦電信號降噪處理分解出的腦電信號因選擇不同的小波基函數(shù)而變化,去除噪聲的效果也各有不同,因此選擇適當(dāng)高效的小波基函數(shù)成為影響信號降噪效果的關(guān)鍵性因素。支撐寬度、對稱性、正交性、正則性是描述小波特性的幾項(xiàng)基本指標(biāo)[6]。對比采用DB10和DB5降噪結(jié)果如圖2所示。
實(shí)驗(yàn)中對比選用不同小波基的實(shí)驗(yàn)效果,通過對比發(fā)現(xiàn)coifN與dbN具有較大優(yōu)勢,其中N為小波的階數(shù)。
小波函數(shù)ψ(t)和尺度函數(shù)φ(t)中的支撐區(qū)為2N-1,ψ(t)的消失矩為N。dbN小波具有較好的正則性,即將其作為稀疏基所引入的光滑誤差不明顯,更具有一致性,因此光滑化信號重構(gòu)過程選用dbN為小波基函數(shù),并且對比了N的數(shù)值為5和10的這2種降噪效果。
圖2 DB5與DB10處理結(jié)果對比
圖2顯示經(jīng)過DB10處理的數(shù)據(jù)明顯與原數(shù)據(jù)具有更大的相似性,而DB5的總體趨勢大體和原數(shù)據(jù)一致,為盡可能保留數(shù)據(jù)中原始的信息,本文選用DB10降噪結(jié)果,為后序數(shù)據(jù)處理打好基礎(chǔ)。
EEG分解為α波、β波、θ波和δ波這4種頻段,應(yīng)用Daubechies D10小波函數(shù)進(jìn)行4層分解,其中,d1為原始信號,d2~d5分別為α波、β波、θ波和δ波這4種頻段重構(gòu)圖,圖3為疲勞腦電信號分解圖。
圖3 疲勞腦電信號分解圖
實(shí)驗(yàn)中提取α波、β波、θ波和δ波這4種頻段的幅值序列并求均值,并且參照文獻(xiàn)[7]依次計(jì)算(α+β)/β、α/β、(δ+α)/(α+β)、(α+β)/θ這4項(xiàng)合成指標(biāo),對N個電極的腦電信號進(jìn)行處理得到8N個腦電特征參數(shù)形成腦電參數(shù)特征集合X。
針對上文中得到的8個腦電特征參數(shù)形成的集合,由于對其進(jìn)行分類計(jì)算時數(shù)據(jù)量仍然比較大,為提高分類的準(zhǔn)確率,降低模型的訓(xùn)練時長以及優(yōu)化學(xué)習(xí)的靈活性,對X進(jìn)行降維。降維方法包括屬性選擇和映射方法。其中映射又分為線性映射方法(PCA、FDA等)和非線性映射方法:核方法(KPCA、KFDA等)、二維化、流形學(xué)習(xí)(ISOMap、LLE、LPP等),還包括神經(jīng)網(wǎng)絡(luò)和聚類等其他方法[8]。腦電波是非線性非平穩(wěn)信號,用線性關(guān)系去刻畫會損失精度且導(dǎo)致低效,因此本文選用非線性的KPCA選取累計(jì)貢獻(xiàn)率達(dá)到90%的主元構(gòu)成疲勞識別腦電指標(biāo)。
主成分分析(Principal Component Analysis,PCA)通過將高維空間的問題轉(zhuǎn)化到低維空間處理,從而使問題簡易化、明確化,并且這些綜合指標(biāo)之間不具有互相關(guān)性,同時又可以提供原有指標(biāo)包含的大部分信息[9]。作為一種由線性到非線性之間的橋梁,KPCA核方法是通過引入核函數(shù)把非線性變換后的特征空間內(nèi)積運(yùn)算轉(zhuǎn)換為原始空間的核函數(shù)計(jì)算[10],從而縮減計(jì)算量。
實(shí)驗(yàn)?zāi)X電特征參數(shù)樣本集合:x={x1,x2,…,xm},其中m=8N。KPCA方法將數(shù)據(jù)隱式映射到高維線性可分空間。樣本在特征空間中的內(nèi)積可以用一個核函數(shù)來計(jì)算[11]:
k(x,y)=Φ(x)tΦ(y)
(3)
核函數(shù)通過映射Φ把x映射到F,計(jì)算特征空間中的協(xié)方差矩陣為[12]:
(4)
(5)
公式(5)左乘Φt(Xj),則特征樣本在特征矢量上的投影即為主元[14]P:
(6)
本文應(yīng)用KPCA對所得8N個腦電參數(shù)進(jìn)行特征降維,將主元按照貢獻(xiàn)率降序排列,取前k(k 以受試者1腦電數(shù)據(jù)進(jìn)行分析,提取α波、β波、θ波和δ波這4種頻段的幅值序列并求均值,依次計(jì)算(α+β)/β、α/β、(δ+α)/(α+β)、(α+β)/θ依次記為特征信息集合,其靜息及重度疲勞狀態(tài)下腦電信號各貢獻(xiàn)率分布情況如圖4所示。 圖4 靜息與疲勞累計(jì)貢獻(xiàn)率對比 在疲勞數(shù)據(jù)集合中,θ波和α波這2種頻段的幅值均值以及(δ+α)/(α+β)、(α+β)/θ貢獻(xiàn)率較大;在靜息集合中,β波、δ波以及(α+β)/β、α/β、(δ+α)/(α+β)累計(jì)貢獻(xiàn)率達(dá)到了90%以上,融合成新的特征集合。 支持向量機(jī)(Support Vector Machine,SVM)區(qū)別于其他機(jī)器學(xué)習(xí)算法的經(jīng)驗(yàn)風(fēng)險最小原則,是建立在結(jié)構(gòu)風(fēng)險最小化原則基礎(chǔ)上的一種基于統(tǒng)計(jì)學(xué)習(xí)理論而來的分類方法,具有訓(xùn)練樣本數(shù)量小,并且局部優(yōu)化和泛化能力強(qiáng)的優(yōu)勢。 上文得到的樣本T=(xi,yi), i=1,2,…,m,其中,xi為樣本里的第i個n維輸入向量,yi為對應(yīng)的輸出向量,則基于支持向量機(jī)的學(xué)習(xí)可以理解為尋找輸入量和輸出量之間的映射關(guān)系f(·),使得f(xi)=yi成立[15]。一般f(·)表示為: f(x)=wΦ(x)+b (7) 式(7)中,w稱為權(quán)向量,b稱為閾值,Φ:xn→Ω,即把n維輸入向量xn映射到特征空間。若使預(yù)測模型精度盡可能高,須調(diào)試適當(dāng)?shù)膮?shù),最大程度降低風(fēng)險,構(gòu)造如式(8)的經(jīng)驗(yàn)風(fēng)險函數(shù): (8) 其中,L稱為損失函數(shù),其表達(dá)式為: (9) 在式(9)中ε是大于0的小數(shù),需根據(jù)實(shí)驗(yàn)情況進(jìn)行調(diào)整設(shè)定。原則上當(dāng)學(xué)習(xí)樣本有限時,使用經(jīng)驗(yàn)值代替實(shí)際風(fēng)險值是不準(zhǔn)確的且不具有科學(xué)性,所以SVM算法里融入了泛化風(fēng)險,稱之為SRM準(zhǔn)則。則根據(jù)SRM準(zhǔn)則可選取非線性估計(jì)函數(shù)為: (10) 構(gòu)造如下優(yōu)化目標(biāo)函數(shù): (11) (12) 式(11)中,ξ、ξ*為2個松弛變量,C稱之為容量因子。 將式(10)轉(zhuǎn)化為拉格朗日對偶問題求解,可得: (13) (14) 其中,αi為拉格朗日乘子,K(·)稱為核函數(shù),要求滿足: K(xi,xj)=(Φ(xi)·Φ(xj)) (15) 引入核函數(shù)可以實(shí)現(xiàn)實(shí)驗(yàn)在運(yùn)算維數(shù)和運(yùn)算復(fù)雜程度上的優(yōu)化。在實(shí)現(xiàn)輸入量與輸出量之間的對應(yīng)關(guān)系后,即可更新新的輸入量從而得到相應(yīng)的輸出量。本實(shí)驗(yàn)選用徑向基核函數(shù): K(x,xi)=exp (-‖x-xi‖2/(2δ)2) (16) 實(shí)驗(yàn)需要確定懲罰因子C和徑向基函數(shù)中δ,不同參數(shù)值的分類效果相差較大,本文通過對訓(xùn)練數(shù)據(jù)采用模擬退火算法并結(jié)合“留一法”進(jìn)行交叉驗(yàn)證得到[16],并由訓(xùn)練樣本求出Lagrange乘子a、偏置值b,再計(jì)算函數(shù)f(x),得到sgn f(x)為+1,則為重度疲勞狀態(tài),sgn f(x)為-1,則為靜息狀態(tài)。表1為特征集合相同情況下2種分類器分類效果對比。 表1 2種分類器分類效果對比 LS-SVM方法有較好的學(xué)習(xí)能力及泛化性能,能夠在一定程度上提高建模水平,訓(xùn)練和泛化誤差也可以較好地被控制在一定范圍內(nèi);同時該模型簡化了數(shù)據(jù)計(jì)算量,只需調(diào)整正規(guī)化參數(shù)和核參數(shù),提高了計(jì)算效率且能夠達(dá)到較高的計(jì)算精度[17]。 本文對比了單獨(dú)應(yīng)用小波變換、KPCA以及同時應(yīng)用這2種方法的實(shí)驗(yàn),結(jié)果如表2所示。 表2 4種方法的分類效果對比 從表2中可以看出在控制同等特征集合時LS-SVM在分類效果、訓(xùn)練分類器耗時上都占有一定的優(yōu)勢;但應(yīng)用到實(shí)際駕駛疲勞預(yù)警系統(tǒng)上由于客觀條件的限制,目前研究仍然存在一些局限性。例如沒有考慮模擬駕駛與實(shí)際駕駛的環(huán)境差異,模擬駕駛時間比較短,以及“單通道視覺”實(shí)驗(yàn)影響實(shí)驗(yàn)效果等因素對疲勞監(jiān)測的影響。因此,使用KPCA-LSSVM的分析方法還有待進(jìn)一步完善。 針對駕駛疲勞的檢測,盡可能準(zhǔn)確預(yù)測疲勞發(fā)生,并發(fā)出語音、震動等提示,提高安全駕駛系數(shù),減少交通事故的發(fā)生,通過強(qiáng)設(shè)備的改進(jìn)以及算法的優(yōu)化進(jìn)一步推進(jìn)腦電在疲勞駕駛智能檢測系統(tǒng)中的應(yīng)用。3 基于LS-SVM的腦電波數(shù)據(jù)處理
4 結(jié)束語