王 鳳, 潘廣貞, 孫艷青
(中北大學(xué) 軟件學(xué)院,山西 太原 030051)
心電(electrocardiogram,ECG)信號是心臟系統(tǒng)生物電活動的記錄,通過分析ECG信號模式,可以診斷心率失常[1]。ECG信號中的波形特征,在正常搏動和心率失常搏動中不同,在不同病患身上會表現(xiàn)出不同形態(tài),同一個體在不同條件下正常心跳常表現(xiàn)出不同形態(tài),使得心率失常識別更加困難,因此,提升ECG識別準(zhǔn)確度尤為重要[2~4]。
心電分類過程為預(yù)處理、特征提取和分類。文獻(xiàn)[5]提出基于數(shù)學(xué)形態(tài)學(xué)及機(jī)器學(xué)習(xí)心率失常識別;文獻(xiàn)[6]采用經(jīng)驗(yàn)?zāi)J椒纸?empirical mode decomposition,EMD)法選擇ECG信號特征,并結(jié)合支持向量機(jī)(support vector machine,SVM)分類;文獻(xiàn)[7]使用基于塊的神經(jīng)網(wǎng)絡(luò)將ECG心跳分為5類;文獻(xiàn)[8]用離散余弦變換提取ECG心跳特征,并采用費(fèi)舍爾線性判別器對心率失常進(jìn)行檢測和分類。
特征選擇對心率失常識別有重要作用。上述特征選擇方法基于時域或頻域特征,只能在一定程度上反映ECG心跳特征,而基于非線性動力學(xué)參數(shù)的特征提取方法在生理信號處理中取得良好效果,卻在ECG心跳中少有涉及[9]。動力學(xué)特征能顯示ECG更深層次的信息,包含了ECG全部信息。不同類別心跳在不同時間尺度上表現(xiàn)出不同復(fù)雜度,因此本文提出將ECG心跳的模糊熵作為特征度量輸入徑向基函數(shù)(radial basis function,RBF)神經(jīng)網(wǎng)絡(luò),從而實(shí)現(xiàn)ECG分類的算法。
為了對ECG心跳進(jìn)行深層次特征提取,將經(jīng)過預(yù)處理的ECG心跳分解為若干分量,集合EMD(ensemble EMD,EEMD)方法能夠根據(jù)信號自身特點(diǎn)分解信號,具有良好抗模態(tài)混疊性能[9,10]。該方法在處理生物信號時具有獨(dú)特優(yōu)勢,通過對原始信號執(zhí)行多次EMD,在加入每次分解白噪聲,將每次EMD得到的內(nèi)蘊(yùn)模態(tài)函數(shù)(intrinsic modal function,IMF)分量求和再取平均得到最終IMF分量[11]。
ECG心跳經(jīng)EEMD得到IMFs分量,模糊熵作為ECG心跳動力學(xué)特征可以反映ECG心跳特點(diǎn),故提取有效IMFs分量模糊熵作為特征值。熵是用來衡量信號復(fù)雜度的非線性方法,其值越大代表序列復(fù)雜度越大,一般定義為[12]:
4)最終計(jì)算出的模糊熵為FuzzyEn(m,n,r,N)=lnφm(n,r)-lnφm+1(n,r)。
序列長度N,模式維數(shù)m和相似容限r(nóng)的選取直接影響實(shí)驗(yàn)結(jié)果。大量實(shí)驗(yàn)表明,N=1 000,m=1或2,r=(0.1~0.25)Std(Std為x(i)(i=1,2,…,N)的標(biāo)準(zhǔn)差),才能保證有效統(tǒng)計(jì)特性和較小誤差。
所提心電分類算法流程如圖1所示。
圖1 算法總體流程
實(shí)驗(yàn)平臺MATLAB 10.0搭建在Windows 7操作系統(tǒng)上。實(shí)驗(yàn)對5種常見ECG心跳進(jìn)行識別,分別為:正常心跳(normal),左束支傳導(dǎo)阻滯(LBBB),右束支傳導(dǎo)阻滯(RBBB),房性早搏(APC)和室性早搏(PVC)。
采用F值(Fmeasure)和總精確度(Acc)對識別效果進(jìn)行性能評估
(1)
式中TPi為正確分類為第i類的心跳數(shù),TNi為本不屬于第i類的且不被分為第i類的心跳數(shù)目,FPi為本不屬于第i類卻被錯誤劃分為該類的心跳數(shù)目,FNi為本該屬于第i類卻被劃分到其他類的數(shù)目,NT為總分類文件數(shù)目,NE為總分類文件中被錯誤分類的數(shù)目。
ECG數(shù)據(jù)源取自MIT-BIH Arrthythmia 數(shù)據(jù)庫導(dǎo)聯(lián)II(MLII),采樣頻率為360 Hz。選取5種不同心跳類型,在每種類型ECG心跳中各選取120組樣本(每個樣本以R波為基準(zhǔn)點(diǎn),向前、向后共取300個采樣點(diǎn)),將數(shù)據(jù)集分為訓(xùn)練集和測試集。得到訓(xùn)練集與測試集樣本數(shù)量均為300組,樣本集劃分如表1所示。
表1 MIT-BIH數(shù)據(jù)集
2.3.1 特征提取
以MIT-BIH/100號為例,對其EEMD得到各IMFs分量,各IMF分量未見模態(tài)混疊,且各分量QRS波群集,分解效果比較理想。大量實(shí)驗(yàn)證明,第2~6個IMFs分量與原始信號最為相關(guān),說明這5個分量包含ECG心跳主要特征信息,以MIT-BIH/100為例,選取這5個分量進(jìn)行重構(gòu)。圖2為原始信號和重構(gòu)信號對比,可見重構(gòu)信號良好保留ECG心跳峰值和特征,所以選取IMF2~I(xiàn)MF6 5個IMF分量作為提取模糊熵的分量。
圖2 IMF2~I(xiàn)MF6重構(gòu)信號
由于樣本數(shù)量較多,僅在每種類型心跳中各選取2組測試樣本,并分別對5個IMF分量計(jì)算模糊熵值,本文取N=300,m=2,r=0.2 Std。計(jì)算結(jié)果如表2所示。
表2 各IMF分量模糊熵值
實(shí)驗(yàn)結(jié)果表明各類型心跳模糊熵有明顯區(qū)別,不同類型心跳在不同時間尺度上表現(xiàn)出不同熵值,故可以用此作為特征值區(qū)別不同心跳類型。
圖3為各心跳類型10組數(shù)據(jù)的IMF2分量對比,可見不同心跳類型的模糊熵差異。其中,Normal型心跳的IMF分量模糊熵最大,這是因?yàn)镹ormal型心跳隨機(jī)性大。
圖3 IMF2分量的模糊熵
2.3.2 心率失常識別
將IMF2~I(xiàn)MF6分量模糊熵組成的特征向量送入RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行識別。圖4為數(shù)據(jù)集分類結(jié)果,其中縱坐標(biāo)1~5分別表示Normal,LBBB,RBBB,PVC,APC心跳類型。
圖4 分類結(jié)果
圖4顯示300組測試集中錯誤識別6組數(shù)據(jù)。其中,Normal類型樣本全部分類正確,1個LBBB樣本被錯誤劃分為RBBB類型,1個RBBB樣本被錯誤劃分為PVC類型,1個PVC樣本被錯誤劃分為LBBB類型,2個PVC樣本被錯誤劃分為RBBB類型,1個APC樣本被錯誤劃分為Normal類型。結(jié)果表明,所提算法可以有效分類5種心跳。
由分類結(jié)果計(jì)算得到F值和Acc如表3所示。
表3 性能指標(biāo)
可知,該分類方法具有較高準(zhǔn)確率,對不同類別心跳均有效,其中對Normal類型的識別精確度達(dá)到100 %,對PVC類型識別精確度不高與其病癥特點(diǎn)不明顯有關(guān)。
為進(jìn)一步顯示該算法在心率失常識別上的優(yōu)越性,分別采用模糊熵、EMD多尺度模糊熵和本文方法進(jìn)行性能對比,對比結(jié)果如表4所示。性能指標(biāo)顯示,本文方法提取的特征量能更好地反映ECG心跳特點(diǎn)。
表4 各方法心律失常識別率對比 %
基于多尺度模糊熵和RBF神經(jīng)網(wǎng)絡(luò)的心電分類算法,可以對ECG進(jìn)行特征提取和模式識別。采用EEMD對ECG進(jìn)行多尺度分解,將有效IMF分量的模糊熵組合成特征向量以分類5種不同ECG心跳。實(shí)驗(yàn)結(jié)果表明該方法能夠有效地提高心電分類準(zhǔn)確率。這種分類識別方法還可以應(yīng)用到其它類似生物信號處理上,但由于數(shù)據(jù)局限于MIT-BIH數(shù)據(jù)庫,存在樣本類別不平衡問題,對病人適應(yīng)性未知。這也是下一步要探究的問題。