齊永鋒,李隴強
(西北師范大學 計算機科學與工程學院,蘭州 730070)
癲癇是一種急性和復發(fā)性神經(jīng)疾病,其主要臨床癥狀表現(xiàn)為發(fā)作性抽搐和感覺、意識及精神障礙等,嚴重影響患者的日常生活和工作[1]。目前,對癲癇進行臨床診斷的主要方法為CT掃描、磁共振波譜和腦電圖(Electroencephalogram,EEG)分析。與前2種方法相比較,EEG分析不對人體造成損傷且成本較低,因而成為當前癲癇診斷的主流方法。癲癇診斷一般由醫(yī)生通過對患者的EEG數(shù)據(jù)分析,然后根據(jù)自己的臨床經(jīng)驗來給出結論。由于癲癇發(fā)作的不確定性、個體差異性、其他大腦疾病及不明原因引起的神經(jīng)方面的異常,使得這種診斷方式容易造成誤診[2],因此通過計算機分析和自動識別癲癇腦電信號有著重要的現(xiàn)實意義。
文獻[3]將人工神經(jīng)網(wǎng)絡應用到癲癇自動檢測中,提出以“特征提取”結合“監(jiān)督型分類器”的設計理念,成為之后癲癇自動檢測的主要設計方法,而如何設計更優(yōu)秀的特征提取方式和分類器則成為探究的熱點。信號分析方法在特征提取方面起到了重要的作用,其應用在EEG信號分析中主要分為時域、頻域、時頻域和非線性動力學四大類。近年來,線性預測[4]、分數(shù)線性預測[5]、基于最小最大分類樹的徑向基函數(shù)神經(jīng)網(wǎng)絡[6]、小波變換[7-9]、經(jīng)驗模態(tài)分解(Empirical Mode Decomposition,EMD)[10-11]等技術在診斷癲癇EEG信號方面取得了較好的效果。文獻[12]在假設EEG信號是靜止信號的基礎上,引入基于傅里葉變換(Fourier Transformation,FT)和決策樹的混合框架,其中FT用于特征提取,決策樹用于分類。文獻[13]使用希爾伯特-黃變換(Hilbert-Huang Transform,HHT)結合支持向量機(Support Vector Machine,SVM)進行癲癇EEG信號分類,從得到的灰度子圖像直方圖中提取像素強度的均值、方差、偏度和峰度4個統(tǒng)計特征,其分類準確率能夠達到99.125%。
基于局部模式變換的特征提取技術由于計算相對簡單,被廣泛用于不同的模式識別,例如將局部二進制模式(Local Binary Patterns,LBP)應用在人臉識別、語音處理等領域[14-15]。但是該算法對噪聲比較敏感,中心點像素受到噪聲污染后使得特征點發(fā)生變化,無法處理窗口的中心像素點與鄰近像素點像素值相等的情況,導致提取的局部特征不完整,難以進一步挖掘信號中隱藏的細節(jié)信息。
針對上述問題,本文提出一種癲癇EEG信號的分類方法,通過設計的一維局部三值模式(1D Local Ternary Pattern,1D-LTP)算子,提取信號的局部三值特征,對其主成分分析(Principal Component Analysis,PCA)降維后用極限學習機(Extreme Learning Machine,ELM)進行分類。
本文的癲癇EEG信號分類流程如圖1所示。
圖1 癲癇EEG信號分類框架
LBP描述算子是一種簡單但高效的紋理運算符,它將各個像素與其附近的像素進行比較,并把結果保存為二進制數(shù),即當中心像素值小于等于鄰域像素值時,該像素點的位置賦值為1,否則為0,最后形成二進制序列并進行編碼,結果即為中心像素的LBP值[16],其計算過程如式(1)與式(2)所示。
(1)
(2)
其中,(xk,yk)是中心像素,fk是其灰度值,fi為相鄰像素的灰度值。當鄰域大小為3像素×3像素時,(M,L)取值為(8,1),n=9,即為8像素鄰域,LBP 編碼過程如圖2所示。
圖2 LBP算子示意圖
LBP具有旋轉不變性和灰度不變性等優(yōu)點,但對噪聲比較敏感,并且算子本身不夠完善,提取的局部特征不完整。為了降低對中心點像素值的依賴,減少噪聲影響,提取更具鑒別性的特征,本文提出1D-LTP算子。該算子也是局部紋理描述算法,但較LBP更具判別性并且受到統(tǒng)一區(qū)域的噪聲影響更小。1D-LTP通過計算頂層模式及底層模式的二值編碼轉換為二值模式。本文運用此方法將信號特征值擴大一倍,最后進行合并,大幅減小了噪聲及個別值的影響,其計算過程如下所示。
(3)
其中,nS表示信號點S在信號段n中的位置。
計算選取信號段的均值M及標準差ρ,對于每個信號點S,求其與選取信號段的均值的差值,差值計算如式(4)所示。
di=S-M
(4)
根據(jù)式(5)計算信號點S的1D-LTP變換碼。
(5)
(6)
1D-LTP算子涉及的各個步驟如圖3所示。
圖3 信號點S的1D-LTP變換碼
1D-LTP算子的時間復雜度計算如下:設M是由k個點組成的信號,每個信號點考慮相鄰點組成的信號長度n(n 每個變換代碼表示信號的局部模式結構,本文將其轉換為變換代碼直方圖。直方圖以圖形方式總結了二維空間中的結構分布,其中橫軸包含變換代碼的范圍,縱軸包含每個代碼的頻率(出現(xiàn)次數(shù))。本文以圖形結構表示特征向量并用于分類,實驗中不同組基于1D-LTP算子獲得的一小段特征直方圖如圖4所示。 圖4 1D-LTP特征直方圖 本文將直方圖表示對應的EEG信號的特征向量經(jīng)PCA降維后輸入到ELM分類器中。為避免分類結果受隨機性的影響,在進行分類時,隨機選擇90%的特征值作為訓練集,剩余的10%用作測試集。本文以正常和癲癇發(fā)作間期的EEG為負類,發(fā)作期EEG為正類,使用ELM進行分類的步驟如下: 步驟1采用PCA對提取的特征進行降維。 步驟2隨機選取降維樣本的10%構成測試樣本集,其余樣本組成訓練樣本集,計算測試精度。 步驟3隨機選取降維樣本的另外10%構成測試樣本集,其余的樣本組成訓練樣本集,計算測試精度。 步驟4重復步驟3,直至遍歷每個樣本。 其中,隨機化處理是為了使訓練樣本集更具代表性,不會對最終測試結果造成影響。 本文實驗數(shù)據(jù)來自于德國波恩大學腦電圖數(shù)據(jù)庫,數(shù)據(jù)集詳細描述見文獻[17]。基準數(shù)據(jù)集由5個組(A、B、C、D和E)組成,每組有100個單通道EEG信號,記錄每個EEG信號23.6 s,含有4 097個采樣點,采樣頻率為173.6 Hz。A組是5名健康自愿者在睜眼狀態(tài)下采集的腦電數(shù)據(jù)集,B組是5名健康自愿者在閉眼狀態(tài)下采集的腦電數(shù)據(jù)集,C組是5名癲癇病患者在癲癇發(fā)作間期在致癇灶對側域采集的腦電數(shù)據(jù)集,D組是5名癲癇病患者在癲癇發(fā)作間期在致癇灶內域采集的腦電數(shù)據(jù)集,E組是5名癲癇病患者在癲癇發(fā)作期在致癇灶內域采集的腦電數(shù)據(jù)集[17]。各個類別的EEG信號如圖5所示。 圖5 癲癇EEG信號 本文計算每個信號點的特征變換碼以直方圖的形式排列,并對所有信號重復該過程。不同組基于1D-LTP特征變換碼的直方圖如圖6所示。 圖6 EEG信號的1D-LTP特征直方圖 本文采用了敏感度、特異性和準確率[18]對分類性能進行評價,三者計算方法如下: (7) (8) (9) 其中,TP為正樣例中正確歸類的數(shù)目,TN為負樣例中正確歸類的數(shù)目,FP為負樣例中錯誤歸類的數(shù)目,FN為正樣例中錯誤歸類的數(shù)目用來表示分類錯誤。 本文實驗案例均是處理二進制分類的問題,具體案例如下: 案例1A組和E組混合數(shù)據(jù)。 案例2B組和E組混合數(shù)據(jù)。 案例3C組和E組混合數(shù)據(jù)。 案例4D組和E組混合數(shù)據(jù)。 案例55組混合數(shù)據(jù)。 使用本文方法獲得的靈敏度、特異性和準確率如表1所示。 表1 本文方法各案例分類結果 Table 1 Classification results of each case using the proposed method 案例靈敏度/%特異性/%準確率/%案例199.8799.7199.79案例299.2499.0699.15案例398.9599.3199.13案例499.1498.7298.93案例598.0598.3098.20 從表1可以看出,1D-LTP算子對5個案例的分類準確率均較高,分別為99.79%、99.15%、99.13%、98.93%以及98.20%,這說明本文方法合理有效。 在本文方法中,特征向量的長度l取決于在評估變換代碼時考慮的相鄰點n的數(shù)量,其關系為: l=2n (10) 本文實驗驗證了不同相鄰點數(shù)量對分類準確率的影響,結果如圖7所示。從圖7可以看出,當相鄰點的數(shù)量n=8時,特征向量的長度為256,分類準確率最高。 圖7 不同數(shù)量相鄰點的1D-LTP性能 Fig.7 1D-LTP performance of different numbers of adjacent points 在n=8的情況下,將本文方法與其他方法對癲癇EEG信號的識別準確率進行比較,結果如表2所示。其中,對比方法均采用10折交叉進行評估。從表2可以看出,本文方法能夠實現(xiàn)高精度分類。 表2 不同分類方法準確率對比 Table 2 Accuracy comparison of different classification methods 案例方法 分類準確率/%案例1DTCWT+CVANN[19]100.00加權排列熵+SVM[20]99.50HHT+SVM[13]99.13小波變換+ANN[21]96.00本文方法99.79案例2LNDP+ANN[22]99.25加權排列熵+SVM[20]85.00置換熵+SVM[23]82.88本文方法99.15案例31D-LGP+ANN[22]99.10加權排列熵+SVM[20]93.50模糊近似熵+SVM[24]99.60置換熵+SVM[23]88.00本文方法99.13案例41D-LGP+ANN[22]99.07加權排列熵+SVM[20]96.50模糊近似熵+SVM[24]95.85本文方法98.93案例5DTCWT+CVANN[19]99.15模糊近似熵+SVM[24]97.38本文方法98.20 本文提出一維局部三值模式算子1D-LTP,并將其應用于癲癇腦電信號的分類。相對于LBP算子,該算子能較好地反映數(shù)據(jù)間的相關性,得到的腦電特征具有良好的鑒別性,且對噪聲不敏感,在一定程度上減少了噪音影響及特征丟失的情況。在波恩大學癲癇病研究中心數(shù)據(jù)庫上的實驗結果表明,本文方法能夠對癲癇腦電信號進行準確區(qū)分,分類準確率可達99.79%,為快速準確地自動診斷癲癇疾病提供了一個解決方案。1.3 基于直方圖的特征向量
1.4 特征降維及分類
2 實驗與結果分析
3 結束語