黃佼,賓光宇,吳水才
北京工業(yè)大學(xué) 生命科學(xué)與生物工程學(xué)院,北京 100124
心電圖(Electrocardiograms,ECG)反映了心臟興奮的電活動過程,是心臟疾病診斷的重要依據(jù)。心電信號的自動檢測與分類技術(shù)在心電遠程監(jiān)護和輔助診斷方面具有重要的意義,受到研究者的普遍關(guān)注,也是醫(yī)學(xué)模式識別研究的經(jīng)典領(lǐng)域。
傳統(tǒng)的心電圖分類算法主要依據(jù)先驗知識進行特征提取,然后再利用機器學(xué)習(xí)進行心拍的分類,如基于頻域分析[1]、小波變換[2]、數(shù)學(xué)形態(tài)學(xué)[3]、支持向量機[4]、隱馬爾科夫模型[5]、人工神經(jīng)網(wǎng)絡(luò)[6]等心電信號自動分類方法。近年來,基于深度學(xué)習(xí)自動提取特征的方法被應(yīng)用于心拍分類。2014年,Meng等[7]用4層深度信念網(wǎng)絡(luò)從濾波后的ECG信號中自動提取了50個特征,加入高斯核的非線性支持向量機(Support Vector Machine,SVM)分類器,將心拍分成6類(正常、左束支傳導(dǎo)阻滯、右束支傳導(dǎo)阻滯、房性早搏、室性早搏、起搏心拍),總的準確率達到了98.49%。2016年,Rahhal等[8]使用具有稀疏約束的堆疊去噪自動編碼器,以無監(jiān)督的方式從原始的ECG信號中學(xué)習(xí)得到特征,再饋送到頂層的softmax回歸層,進行分類;對于信息量復(fù)雜、難以分辨的心電特征,引入了專家干預(yù),同時利用自主學(xué)習(xí)技術(shù),進一步提升分類準確度。Zubair等[9]基于深度卷積神經(jīng)網(wǎng)絡(luò),提出了應(yīng)用于ECG信號分類的系統(tǒng),分類準確率為92.7%,且計算效率明顯提高。但在實際應(yīng)用中ECG信號分布復(fù)雜多變,不同類型的心電信號也可能存在相似之處,同一種類型的心電信號在不同的患者身上形態(tài)也有差異,這種復(fù)雜性成為心電分類算法的一大難題。已有的分類算法大多基于標準數(shù)據(jù)庫,很難適應(yīng)臨床上復(fù)雜的ECG信號。
目前已有很多研究報道了具有患者特異性的心電分類算法[10-12]。Kiranyaz等[12]基于一維卷積神經(jīng)網(wǎng)絡(luò)提出了一種患者特異性心電圖分類和監(jiān)測系統(tǒng),對室性異位搏動(Ventricular Ectopic Beats,VEB)和室上性異位搏動(Supraventricular Ectopic Beats,SVEB)的分類準確率分別為99%和97.6%,較其他研究[10-11]報道的準確率有所提升,但對SVEB識別的靈敏度僅有60.3%,仍有提升的空間。為此,本研究提出了一種基于一維卷積進行特征融合的神經(jīng)網(wǎng)絡(luò)患者特異性心拍分類方法,通過融合一維卷積神經(jīng)網(wǎng)絡(luò)自動學(xué)習(xí)的特征和心電R波峰之間的時間間隔(RR間期)特征作用于softmax分類器,選擇少量公共心拍數(shù)據(jù)加上患者特定的心拍數(shù)據(jù)用于訓(xùn)練分類模型,實現(xiàn)患者特異性心拍識別。實驗結(jié)果表明,該方法不僅進一步提升了心拍分類性能,對SVEB識別的靈敏度由60.3%提升到了88.7%,分類算法的普適性顯著提升,可作為醫(yī)護人員診斷心臟疾病的輔助依據(jù)。
本文選用PhysioBank標準心電數(shù)據(jù)庫中的MIT-BIH心律失常數(shù)據(jù)庫,該數(shù)據(jù)庫包含48條記錄,每條記錄包含約30 min的心電信號,采樣頻率為360 Hz。編號100到124之間的23條數(shù)據(jù)(中間有些編號遺漏)中包含了心律失?,F(xiàn)象中常見的偽跡和變異波形;另外編號200~234之間的25條數(shù)據(jù)包含一些比較少見、復(fù)雜且不易識別的結(jié)性、室性、室上性異常以及傳導(dǎo)異常,在臨床上有重要意義[13]。
依據(jù)美國醫(yī)療促進協(xié)會(Association for the Advancement of Medical Instrumentation,AAMI)的ANSL/AAMI EC57: 2012標準,可將心電節(jié)拍主要分成5大類:N類(正常或者束支傳導(dǎo)阻滯)、S類(室上性異常)、V類(心室異常)、F類(融合類)、Q類(未知類)。MIT-BIH心律失常數(shù)據(jù)庫注釋的心拍類型和AAMI規(guī)定的心電種類是兩種臨床上的分類方法,為了心電分類算法之間橫向比較,需要把MIT-BIH數(shù)據(jù)庫中的心拍類型轉(zhuǎn)換為AAMI的心電種類,Chazal等[14]報道了具體轉(zhuǎn)換標準。AAMI標準中指出Q類分類的準確率僅供參考,因此本文僅對N、S、V、F類的心拍進行分類。
典型的心電圖包含P波、QRS波群和T波。P波由心房除極產(chǎn)生、QRS波群反映心室除極過程,T波由心室復(fù)極產(chǎn)生,因而一個心電波形能夠反映出心臟搏動過程各階段的狀況,醫(yī)生也是根據(jù)各波的形態(tài)進行判別。其中PR間期為0.12~0.20 s,QT間期為0.36~0.44 s,因此本文以R波為中心,向前取0.25 s,向后取0.35 s的數(shù)據(jù)表示一個心拍,見圖1,其中橫坐標表示采樣點,縱坐標表示幅值。R波的定位從MIT-BIH數(shù)據(jù)庫的標簽標注中獲得,采樣率為360 Hz。
圖1 正常心拍樣本
卷積神經(jīng)網(wǎng)絡(luò)是一種前饋神經(jīng)網(wǎng)絡(luò),通常由交替的卷積層和池化層構(gòu)成,卷積層能捕捉輸入信息中區(qū)域性連接特征,且應(yīng)用了權(quán)值共享原理,使模型要訓(xùn)練的參數(shù)量大大減少;池化層將相鄰的多個節(jié)點合并為一個來合并相似特征,進一步減小訓(xùn)練的數(shù)據(jù)量。體現(xiàn)其局部連接、權(quán)重共享以及子采樣的特性。這些特性使得卷積神經(jīng)網(wǎng)絡(luò)具有一定程度上的平移、縮放和扭曲不變性,且參數(shù)更少,使得訓(xùn)練效率加快,訓(xùn)練過程中采用反向傳播算法更新權(quán)重。
1.3.1一維卷積層
本文需要處理的心電信號是離散的時間序列,故選用一維卷積作為卷積層構(gòu)建適用于心電信號特征提取的一維卷積神經(jīng)網(wǎng)絡(luò)。給定一個輸入信號序列xt,t=1, …, n,和濾波器wt,t=1, …, m,濾波器依次對上一層的輸入特征進行局部卷積操作。一般情況下,濾波器的長度m遠小于信號序列長度n。卷積的輸出為:
在卷積層當中,第l層的每一個神經(jīng)元都只和第l-1層的一個局部窗口內(nèi)的神經(jīng)元相連,構(gòu)成一個局部連接網(wǎng)絡(luò)。卷積層需要一個激活函數(shù)f()做非線性特征映射,本文選用收斂速度較快的修正線性單元作為激活函數(shù):
那么第l層的第i個神經(jīng)元的輸入定義為:
其中,wl∈Rm為m維的濾波器bi是偏置參數(shù),i=1,…,n。wl對該卷積層的所有神經(jīng)元都是相同的。
1.3.2池化層
池化層的操作同樣是從一個區(qū)域中通過某種方式得到一個值作為特征,常見的池化方法是取區(qū)域內(nèi)所有神經(jīng)元的最大值或平均值。對于卷積層得到的一個特征映射Xl,將其劃分為很多個區(qū)域Rk,k=1,…,K。
池化是一個自采樣過程,可大大降低特征的位數(shù),避免過擬合,且可使得下一層的神經(jīng)元對一些小的形態(tài)改變保持不變性,是提供了很強的魯棒性。
RR間期反映了心電信號的時間特性,多種心律失常,都會引起RR間期異常改變,如早搏心律的RR間期縮短,逸搏心律的RR間期延長,房顫心律的RR間期絕對不規(guī)則。且單個心拍樣本能夠反映心拍的形態(tài)信息。
為了使心電信號的時間特性和形態(tài)特征能夠更好地作用于分類器,以提高分類性能,本文提出了一種基于神經(jīng)網(wǎng)絡(luò)輸出層特征融合的混合模型。該模型由兩個分支組成,第一分支是1維卷積神經(jīng)網(wǎng)絡(luò),作為形態(tài)特征提取器,以原始心拍數(shù)據(jù)作為特征學(xué)習(xí)原材料;第二分支以RR間期特征向量作為輸入,與卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的特征融合,融合后的特征向量被饋送到MLP(多層感知器),最后通過softmax分類器進行分類。融合神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),見圖2。模型在后端是TensorFlow的Keras神經(jīng)網(wǎng)絡(luò)框架上實現(xiàn)。
圖2 特征融合神經(jīng)網(wǎng)絡(luò)模型
本文選取當前心拍與前一心拍的的RR間期(pre_RR),當前心拍與后一心拍的RR間期(post_RR),以及他們的間期差值(d_RR)組成RR間期特征向量。
MIT-BIT心律失常數(shù)據(jù)庫中102、104、107、214號心電記錄是起搏心電,實驗中將其排除。余下的44個心電記錄依據(jù)AAMI標準,將心拍分成了5類,共計83945個心拍。根據(jù)Mar等[15]的建議,本研究按照跨病人的方式把選用的心電記錄分為訓(xùn)練集DS1和測試集DS2,其中DS1=(101,106,108,109,112,114,115,116,118,119,122,124,201,203,205,207,208,209,215,220,223,230),DS2為剩下的22條心電記錄。因為Q類數(shù)據(jù)量較少,且AAMI標準中指出Q類分類的準確率僅供參考,故本研究舍棄了Q類。從訓(xùn)練集中的N、S、V、F類中各隨機抽取了115例心拍樣本構(gòu)成公共數(shù)據(jù)集。那么公共數(shù)據(jù)集既包含心律失?,F(xiàn)象中常見的偽跡和變異波形,又包含了復(fù)雜且不易識別的結(jié)性、室性、室上性異常以及傳導(dǎo)異常。從每個患者心電信號中選取前5 min的心拍樣本作為患者特定的數(shù)據(jù)集,聯(lián)合公共數(shù)據(jù)集構(gòu)成訓(xùn)練樣本集,以訓(xùn)練患者特異性分類模型。每個患者余下的約25 min的心拍樣本作為各自模型的測試數(shù)據(jù)。
使用4個標準指標用來評估模型的分類性能[16],分別是:準確率、靈敏度、特異性和陽性預(yù)測值。
式(6)~(9)中,TP表示模型將正類預(yù)測為正類的樣本數(shù),F(xiàn)P表示模型將負類預(yù)測為正類的樣本數(shù),TN表示模型將負類預(yù)測為負類的樣本數(shù),F(xiàn)N表示模型將正類預(yù)測為負類的樣本數(shù)。
近幾年已有的相關(guān)研究中[11-12],選用了3個數(shù)據(jù)集來評估算法的性能,為了橫向比較,本研究的實驗結(jié)果也呈現(xiàn)在這3個數(shù)據(jù)集中。數(shù)據(jù)集1對VEB的評估,選用了測試集DS2中11條心電記錄,分別是(200,202,210,213,214,219,221,228,231,233,234),對SVEB的評估加入了(212,222,232)3條心電記錄;數(shù)據(jù)集2是除去100到124號心電記錄后剩下的24條心電記錄;數(shù)據(jù)集3是實驗所用的所有44條心電記錄。
本研究經(jīng)過5次獨立實驗,計算出VEB和SVEB兩類各評估指標的平均結(jié)果,與已有相關(guān)研究的算法[11-12]進行分類性能比較,見表1。對比觀察各指標,可以看出:① 本文使用小部分患者特定數(shù)據(jù)集,訓(xùn)練出的特征融合神經(jīng)網(wǎng)絡(luò)的患者特異性心電分類模型,能夠表現(xiàn)出優(yōu)秀的分類性能;② 本文方法對VEB和SVEB的識別都相對出色,且對SVEB的識別率有顯著的提升,在測試數(shù)據(jù)集1中,分類靈敏度達到了88.8%,算法的普適性有所提升;③ SVEB識別結(jié)果在所有算法中均低于VEB識別的結(jié)果,這種現(xiàn)象的一個原因是構(gòu)成訓(xùn)練集的患者特定數(shù)據(jù)集中SVEB數(shù)據(jù)量少。盡管如此,本文方法對SVEB的識別仍有很大的改善。
本文提出了一種基于一維卷積的特征融合神經(jīng)網(wǎng)絡(luò)患者特異性心拍分類方法。特征融合神經(jīng)網(wǎng)絡(luò)第一分支的卷積神經(jīng)網(wǎng)絡(luò)能夠自動提取心電信號的形態(tài)特征;第二分支的RR間期特征反映了心拍的規(guī)則性;少量患者特定的心電數(shù)據(jù)加入訓(xùn)練集能夠?qū)崿F(xiàn)患者心電特異性識別,可解決不同患者之間心電波形差異問題。實驗結(jié)果表明,本文的方法能夠?qū)崿F(xiàn)很好的分類性能,可作為醫(yī)護人員診斷心臟疾病的輔助依據(jù)。且卷積神經(jīng)網(wǎng)絡(luò)權(quán)值共享,計算速度快,使得模型便于移植到便攜式的可穿戴設(shè)備,讓心電實時監(jiān)測成為可能。但在實際應(yīng)用中,選取作為訓(xùn)練集的患者特定數(shù)據(jù)集,心拍類型還需要醫(yī)生進行標注,是實現(xiàn)心電信號全自動分類需要進一步研究和解決的問題。
表1 本文方法對VEB和SVEB的分類結(jié)果與文獻結(jié)果的性能比較(%)
[參考文獻]
[1] Uslu E,Bilgin G.Exploiting locality based Fourier transform for ECG signal diagnosis[A].International Conference on Applied Electronics[C].New York:IEEE,2012:323-326.
[2] Banerjee S,Mitra M.Application of cross wvelet transform for ECG pattern analysis and classi fi cation[J].IEEE T Instrum Meas,2014,63(2):326-333.
[3] Yu Y,Cheng S.ECG beat classification algorithm based on cluster analysis[J].J Comput Appl,2014,34(7):2132-2135.
[4] Homaeinezhad MR,Atyabi SA,Tavakkoli E,et al.ECG arrhythmia recognition via a neuro-SVM-KNN hybrid classi fi er with virtual QRS image-based geometrical features[J].Expert Syst Appl,2012,39(2):2047-2058.
[5] Pan ST,Hong TP,Chen HC.ECG signal analysis by using hidden Markov model[A].International Conference on Fuzzy Theory and It’s Applications[C].New York:IEEE,2013:288-293.
[6] Ubeyli ED.Combining recurrent neural networks with eigenvector methods for classification of ECG beats[J].Digit Signal Process,2009,19(2):320-329.
[7] Meng H,Yue Z.Classification of electrocardiogram signals with deep belief networks[A].Computational Science and Engineering (CSE),2014 IEEE 17thInternational Conference on IEEE[C].2014:7-12.
[8] Rahhal MMA,Bazi Y,Alhichri H,et al.Deep learning approach for active classi fi cation of electrocardiogram signals[J].Inform Sciences,2016,345(1):340-354.
[9] Zubair M,Kim J,Yoon C.An automated ECG beat classi fi cation system using convolutional neural networks[A].IT Convergence and Security (ICITCS),20166thInternational Conference on IEEE[C].New York:IEEE,2016:1-5.
[10] Jiang W,Kong SG.Block-based neural networks for personalized ECG signal classification[J].IEEE T Neural Network,2007,18(6):1750-1761.
[11] Ince T,Kiranyaz S,Gabbouj M.A generic and robust system for automated patient-specific classification of ECG signals[J].IEEE T Biomed Eng,2009,56(5):1415-1426.
[12] Kiranyaz S,Ince T,Gabbouj M.Real-time patient-speci fi c ECG classi fi cation by 1-D convolutional neural networks[J].IEEE T Biomed Eng,2016,63(3):664-675.
[13] Goldberger AL,Amaral LAN,Glass L,et al.Physiobank,physiotoolkit, and physionet[J].Circulation,2000,101(23):215-220.
[14] De Chazal P,O’Dwyer M,Reilly RB.Automatic classification of heartbeats using ECG morphology and heartbeat interval features[J].IEEE Trans Biomed Eng,2004,51(7):1196-1206.
[15] Mar T,Martinez JP,Llamedo M,et al.Optimization of ECG classi fi cation by means of feature selection[J].IEEE T Biomed Eng,2011,58(8):2016-2017.
[16] Association for the Advancement of Medical Instrumentation.ANSI/AAMI EC57,Testing and Reporting Performance Results of Cardiac Rhythm and ST Segment Measurement algorithms[S].Arlington: Association for the Advancement of Medical Instrumentation,2012:1-22.