(西安建筑科技大學(xué) 信息與控制工程學(xué)院, 西安 710055)
心律失常是一種常見(jiàn)的心血管疾病,會(huì)對(duì)人們的健康造成巨大危害。心律失常的及時(shí)檢測(cè)和診斷可以有效預(yù)防惡性心臟疾病的發(fā)生[1]。隨著便攜式心電監(jiān)測(cè)系統(tǒng)的廣泛使用,面對(duì)長(zhǎng)時(shí)海量的心電數(shù)據(jù), 需要更加智能化的心律失常識(shí)別技術(shù)。
人們對(duì)心律失常的診斷主要是對(duì)心電信號(hào)中的每個(gè)異常心跳進(jìn)行形態(tài)識(shí)別與分類,將單次心跳的形態(tài)特征信號(hào)稱為一個(gè)心拍。目前已有眾多學(xué)者對(duì)心律失常識(shí)別方法進(jìn)行了研究,包括基于小波變換的識(shí)別算法[2],基于小波變換與支持向量機(jī)(SVM)的識(shí)別算法[3],獨(dú)立成分分析與神經(jīng)網(wǎng)絡(luò)的心電識(shí)別算法[4],基于BP神經(jīng)網(wǎng)絡(luò)的識(shí)別算法[5]等等。除此之外,深度學(xué)習(xí)下的卷積神經(jīng)網(wǎng)絡(luò)(CNN)和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)在心律失常識(shí)別中也顯示出良好的前景。例如,基于傅里葉變換與卷積神經(jīng)網(wǎng)絡(luò)的心電識(shí)別算法[6-7],基于模糊C均值深度信念網(wǎng)絡(luò)的心電識(shí)別算法[8],基于深雙向LSTM網(wǎng)絡(luò)的心電識(shí)別算法[9]等等。
然而,不同節(jié)律的心電信號(hào)在發(fā)生心律失常時(shí)的信號(hào)形態(tài)會(huì)有所差別,間期特征和幅值特征會(huì)有所不同。若識(shí)別算法只針對(duì)包含P-QRS-T的心拍形態(tài)信號(hào),會(huì)丟失相關(guān)間期特征與節(jié)律特征,易對(duì)分類造成影響。并且,截取P-QRS-T的心拍形態(tài)信號(hào)還需要額外設(shè)計(jì)QRS波群檢測(cè)定位算法。因此有學(xué)者設(shè)計(jì)了針對(duì)整條信號(hào)片段的識(shí)別方法,例如文獻(xiàn)[10]搭建了ResNet-34網(wǎng)絡(luò)模型,對(duì)心電信號(hào)片段進(jìn)行分類,該方法假設(shè)輸入信號(hào)片段由一種心律失常類型組成,可預(yù)測(cè)該片段的心律失常類型。
本文基于U-NET全卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)了一種心電信號(hào)語(yǔ)義分割的識(shí)別方法。該方法省去了QRS檢測(cè)與定位的步驟,將直接截取的心電信號(hào)片段作為識(shí)別對(duì)象,即片段中同時(shí)包含不同種心律失常類型的心拍,又同時(shí)包含完整心拍與邊緣殘缺心拍。采用神經(jīng)網(wǎng)絡(luò)語(yǔ)義分割的處理方式,將信號(hào)片段作為輸入,標(biāo)簽地圖作為輸出,通過(guò)對(duì)不同種心拍情況的標(biāo)注,準(zhǔn)確地劃分出混合類型心電片段中的心拍位置與類型。
U-Net全卷積神經(jīng)網(wǎng)絡(luò)起源于深度卷積神經(jīng)網(wǎng)絡(luò)。深度卷積神經(jīng)網(wǎng)絡(luò)廣泛應(yīng)用于信號(hào)識(shí)別與分類、目標(biāo)檢測(cè)與定位等大規(guī)模運(yùn)算中。隨著目標(biāo)識(shí)別的任務(wù)要求不斷提高,產(chǎn)生了更為精細(xì)的分類處理任務(wù):語(yǔ)義分割。語(yǔ)義分割是指將每個(gè)像素點(diǎn)分類為屬于對(duì)象類的過(guò)程。心電信號(hào)作為一種一維采樣信號(hào),因此可以用語(yǔ)義分割的方法切分出心拍,并且同時(shí)給出其中的心拍類型。
應(yīng)用于語(yǔ)義分割的U-Net全卷機(jī)神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)卷積網(wǎng)絡(luò)相比,沒(méi)有全連接層結(jié)構(gòu),其結(jié)構(gòu)包括卷積層、下采樣層(池化層)和上采樣層。U-Net的網(wǎng)絡(luò)結(jié)構(gòu)是一種編碼器-解碼器結(jié)構(gòu),編碼器逐漸減少池化層的空間維度,解碼器逐步修復(fù)物體的細(xì)節(jié)和空間維度。網(wǎng)絡(luò)結(jié)構(gòu)具有空間平移不變性,將整幅樣本作為輸入,標(biāo)簽地圖作為輸出,顯著提高了語(yǔ)義分割的計(jì)算效率和預(yù)測(cè)性能。
在深度神經(jīng)網(wǎng)絡(luò)中,激活函數(shù)是用來(lái)為模型增加非線性機(jī)制。激活函數(shù)具有非線性、可微性、單調(diào)性。早期經(jīng)常使用的激活函數(shù)有Sigmoid、Tanh等函數(shù)。例如:
(1)
(2)
式(1)和式(2)分別為Sigmoid函數(shù)和Tanh函數(shù),其函數(shù)兩側(cè)均具有飽和區(qū),在反向傳播的過(guò)程中,容易出現(xiàn)梯度消失問(wèn)題。
本文網(wǎng)絡(luò)中結(jié)點(diǎn)的激活函數(shù)采用Relu函數(shù)。其優(yōu)點(diǎn)在于梯度不飽和,計(jì)算快,在反向傳播的過(guò)程中能夠減少梯度消失的現(xiàn)象,同時(shí)通過(guò)Relu激活后的特征能最大程度保留特性,抑制不重要信息。其函數(shù)輸出公式為:
f(x)=max(0,x)
(3)
卷積是對(duì)兩個(gè)實(shí)變函數(shù)的一種數(shù)學(xué)運(yùn)算。假設(shè)A和B為矩陣,大小分別為M×N和m×n,則卷積運(yùn)算C=A?B可以表示為:
1≤i≤M-m+1,1≤j≤N-n+1
(4)
如式(4)所示,卷積核按照一定的步長(zhǎng)在輸入矩陣序列上進(jìn)行卷積操作,通過(guò)對(duì)輸入的卷積可以使得網(wǎng)絡(luò)自動(dòng)提取到高層的語(yǔ)義信息,無(wú)需手工提取特征的操作。
池化運(yùn)算即下采樣,是使用某一位置相鄰輸出的總體統(tǒng)計(jì)特征來(lái)代替網(wǎng)絡(luò)在該位置的輸出。當(dāng)輸入存在少量平移時(shí),池化運(yùn)算能夠幫助表示輸入近似不變。
在截取的心電信號(hào)片段中,我們只關(guān)心某一個(gè)特征是否出現(xiàn),而無(wú)所謂其出現(xiàn)位置的前后,這時(shí)平移不變性顯得極為重要。
對(duì)輸入矩陣A進(jìn)行池化,首先對(duì)其分塊。設(shè)每塊大小為λ×τ,則其中第ij個(gè)塊可以表示為:
(5)
其中,(i-1)·λ+1≤s≤i·λ,(j-1)·τ+1≤t≤j·τ。
(6)
s≤i·λ,(j-1)·τ+1≤t≤j·τ}
(7)
如果用大小為λ×τ的塊對(duì)矩陣A進(jìn)行不重疊平均下采樣,結(jié)果定義為:
(8)
相應(yīng)地,對(duì)矩陣Davg進(jìn)行倍數(shù)為λ×τ的不重疊平均上采樣定義為:
avgupλ×τ(Davg)=Davg?1λ×τ
(9)
其中:1λ×τ是元素全為1的矩陣,?代表克羅內(nèi)克積。
如果用大小為λ×τ的塊對(duì)矩陣A進(jìn)行不重疊最大下采樣,結(jié)果定義為:
(10)
相應(yīng)地,對(duì)矩陣Dmax=(dij)進(jìn)行倍數(shù)為λ×τ的不重疊最大上采樣定義為:
maxupλ×τ(Dmax)=(Uij)
(11)
其中:所有Uij=(ukl)λ×u都是大小為λ×τ的矩陣,每個(gè)元素定義為:
ukl
(12)
本文對(duì)U-Net網(wǎng)絡(luò)進(jìn)行修改,使其可以處理一維心電信號(hào)序列,從心電片段中提取信號(hào)特征信息進(jìn)行逐點(diǎn)分析。
如圖1所示,網(wǎng)絡(luò)結(jié)構(gòu)主要有兩部分組成:收縮路徑和擴(kuò)展路徑。收縮路徑主要是用來(lái)捕捉心電信號(hào)的特征信息,與之相對(duì)稱的擴(kuò)展路徑則是對(duì)所需要分割出來(lái)的心拍進(jìn)行精準(zhǔn)定位與語(yǔ)義分類。
圖1 網(wǎng)絡(luò)結(jié)構(gòu)
在收縮路徑中,進(jìn)行卷積運(yùn)算與二倍最大池化運(yùn)算。每池化一次,特征圖的長(zhǎng)度減少一半,數(shù)量增加一倍。在擴(kuò)展路徑中,高分辨率的特征直接從壓縮路徑中復(fù)制,然后與后續(xù)卷積的上采樣特征相結(jié)合,有效地將編碼后的上下文信息傳輸?shù)胶罄m(xù)層。網(wǎng)路最后一層通過(guò)卷積運(yùn)算輸出預(yù)測(cè)標(biāo)簽地圖。由于心電信號(hào)為低頻信號(hào),有意義的特征往往體現(xiàn)在較為長(zhǎng)一點(diǎn)的波形上,因此模型大部分由核尺寸為32×1的一維卷積運(yùn)算組成。卷積運(yùn)算采用same模式,使得輸出特征圖尺寸保持不變,輸出與輸入因此而等長(zhǎng)。
MIT-BIH心律失常標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)由美國(guó)麻省理工學(xué)院和Beth Israel醫(yī)院合作建立。該數(shù)據(jù)庫(kù)的數(shù)據(jù)由1975年到1979年間采集的4 000 多個(gè)動(dòng)態(tài)心電圖(Holter)數(shù)據(jù)組成。本文的心電信號(hào)片段取自MIT-BIH心律失常數(shù)據(jù)庫(kù),所有記錄采樣率為360 Hz,實(shí)驗(yàn)重點(diǎn)關(guān)注包含正常竇性搏動(dòng)(Normal)、左束支傳導(dǎo)阻滯(left bundle branch block,LBBB)、右束支傳導(dǎo)阻滯(right bundle branch block,RBBB)、房性早搏(atrial premature beat,APB)和室性早搏(Ventricular premature beat,PVC)的信號(hào)片段。
本文將用于U-net訓(xùn)練的心電信號(hào)預(yù)處理成每條片段為5 s時(shí)長(zhǎng),即1 800個(gè)數(shù)據(jù)點(diǎn),這些片段可能包含也可能不包含混合性心律失常。在不將單個(gè)片段內(nèi)的所有節(jié)拍限制為單一的特定心律失常情況下,片段可能包含多種心律失常情況。心電記錄的混合心拍使得訓(xùn)練數(shù)據(jù)更加復(fù)雜和多樣化。表1給出了實(shí)驗(yàn)包含對(duì)應(yīng)心拍類型的片段數(shù)目。
表1 心電圖段數(shù)及對(duì)應(yīng)情況
在MIT-BIH心律失常標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)中,專家給出了每條心拍的r峰峰值位置以及對(duì)應(yīng)的心拍類型。輸入片段包含1 800個(gè)采樣點(diǎn),即輸入矩陣為1 800×1。網(wǎng)絡(luò)輸出1 800個(gè)采樣點(diǎn)的五分類標(biāo)簽地圖,即輸出矩陣為1 800×5。為每個(gè)訓(xùn)練樣本創(chuàng)建1 800×5輸出矩陣,將每個(gè)采樣點(diǎn)的對(duì)應(yīng)心拍類型的列設(shè)置為1,相對(duì)應(yīng)將其他列設(shè)置為0。分類方法重點(diǎn)關(guān)注可以完整體現(xiàn)心律失常的各類型特征的心拍,對(duì)于殘缺心拍,設(shè)置殘缺閾值,即殘缺程度過(guò)高導(dǎo)致無(wú)法體現(xiàn)信號(hào)特征的殘缺心拍默認(rèn)標(biāo)注為正常。
為了評(píng)價(jià)網(wǎng)絡(luò)模型在心律失常分類中的效果,本文驗(yàn)證準(zhǔn)確率、靈敏度、特異性以及正陽(yáng)性率等多個(gè)指標(biāo)。將心電片段中的實(shí)際各類型心拍數(shù)目與預(yù)測(cè)結(jié)果得出的各類型心拍數(shù)目予以統(tǒng)計(jì),用TP表示正確預(yù)測(cè)出本類心拍的個(gè)數(shù),TN表示正確預(yù)測(cè)出非本類心拍的個(gè)數(shù),F(xiàn)P表示錯(cuò)將其他類心拍預(yù)測(cè)為本類,F(xiàn)N表示錯(cuò)將本類心拍預(yù)測(cè)為其他類。評(píng)價(jià)指標(biāo)的具體計(jì)算方法和意義如下:
準(zhǔn)確度(ACC):指被正確預(yù)測(cè)出本類心拍與非本類心拍的個(gè)數(shù)之和占全部樣本的比率:
(13)
總準(zhǔn)確度(OA):指所有被正確分類的心拍數(shù)目與樣本總數(shù)∑之比,以NN、LL、RR、VV、AA分別表示各類型正確分類的個(gè)數(shù):
(14)
靈敏度(召回率,Se):指被正確預(yù)測(cè)出本類心拍的個(gè)數(shù)與實(shí)際的本類心拍總數(shù)的比率:
(15)
特異性(真陰性率,Sp):是指被正確預(yù)測(cè)出非本類心拍的個(gè)數(shù)與實(shí)際非本類心拍總數(shù)的比率:
(16)
正陽(yáng)性率(精準(zhǔn)度,Pp):是指全部被預(yù)測(cè)為本類心拍個(gè)數(shù)中正確的比率:
(17)
以上評(píng)價(jià)指標(biāo)中,準(zhǔn)確度是衡量分類是否準(zhǔn)確最直觀的一個(gè)指標(biāo)。靈敏度越高表示發(fā)生漏診的比例越低,特異度和正陽(yáng)性率越高表示發(fā)生誤診的比例越低。
網(wǎng)絡(luò)模型使用Python語(yǔ)言開發(fā),實(shí)驗(yàn)將全體樣本分為90%的訓(xùn)練樣本與10%的測(cè)試樣本,網(wǎng)絡(luò)訓(xùn)練迭代100次。在網(wǎng)絡(luò)訓(xùn)練過(guò)程中,為了防止發(fā)生過(guò)擬合,隨著網(wǎng)絡(luò)深度的增加采用丟失輸出的正則化技巧。最終,網(wǎng)絡(luò)訓(xùn)練集與測(cè)試集的學(xué)習(xí)準(zhǔn)確度曲線如圖2所示。
圖2 學(xué)習(xí)準(zhǔn)確度曲線
如圖2,隨著網(wǎng)絡(luò)的迭代,網(wǎng)絡(luò)學(xué)習(xí)準(zhǔn)確度曲線迅速上升。圖中的實(shí)線與虛線分別表示訓(xùn)練集與測(cè)試集準(zhǔn)確度曲線,可以看出,U-net模型能夠很好地從訓(xùn)練數(shù)據(jù)中進(jìn)行泛化,準(zhǔn)確度曲線緊密重疊,未出現(xiàn)過(guò)擬合跡象。
圖3
圖3描繪了4個(gè)測(cè)試心電片段的可視化標(biāo)簽地圖。網(wǎng)絡(luò)輸出的標(biāo)簽地圖為5列矩陣,即每一列表示為采樣點(diǎn)屬于每種類型的預(yù)測(cè)概率。每張標(biāo)簽地圖包含多個(gè)類型的心拍,用5條預(yù)測(cè)曲線分別表示五種類型的預(yù)測(cè)概率。圖中右側(cè)Y軸即表示采樣點(diǎn)隸屬于某一類型的預(yù)測(cè)概率值的大小,某一類型的預(yù)測(cè)概率越大,表示采樣點(diǎn)越隸屬于該類型。
由圖3(a)、圖3(d)可以看出在每一種相同類型的信號(hào)中間部分,該類型預(yù)測(cè)概率非常接近于1,在不同類型交界處,預(yù)測(cè)概率會(huì)出現(xiàn)交替下降與上升的部分,可以看出通過(guò)各類型的預(yù)測(cè)曲線可將片段中的不同類型的心拍區(qū)分出來(lái)。如圖3(b),當(dāng)信號(hào)片段中突然出現(xiàn)少量噪聲時(shí),圖中右束支阻滯的類型預(yù)測(cè)概率稍顯下降,但仍然維持在80%以上。如圖3(c),網(wǎng)絡(luò)在只發(fā)生單個(gè)室性早搏的心拍位置處,室早類型的預(yù)測(cè)概率迅速上升至80%。該模型具有良好的定位與分類能力,同時(shí)網(wǎng)絡(luò)模型使用較大感受野,使得分類結(jié)果具有一定的抗噪能力。
將心電片段中的實(shí)際各類型心拍數(shù)目與預(yù)測(cè)結(jié)果得出的各類型心拍數(shù)目予以統(tǒng)計(jì),表2給出了心律失常分類混淆矩陣。以每一行表示實(shí)際心拍類型,右側(cè)的合計(jì)表示實(shí)際各類型的心拍統(tǒng)計(jì)數(shù)目;以每一列表示預(yù)測(cè)心拍類型,下側(cè)的合計(jì)表示預(yù)測(cè)為各類型的心拍統(tǒng)計(jì)數(shù)目。
跟據(jù)混淆矩陣與評(píng)價(jià)指標(biāo)計(jì)算公式,分別計(jì)算了Normal、LBBB、RBBB、PVC、APB五類心律失常的準(zhǔn)確度(ACC)、總準(zhǔn)確度(OA)、靈敏度(Se)、特異性(Sp)以及正陽(yáng)性率(Pp)如表3所示。
表2 分類結(jié)果混淆矩陣
表3 分類結(jié)果各項(xiàng)指標(biāo) %
如表2和表3,對(duì)于該網(wǎng)絡(luò)模型,Normal、LBBB、RBBB、PVC、APB五類樣本的單類型識(shí)別準(zhǔn)確度和特異性均高于97%,總準(zhǔn)確度高于96%。對(duì)于RBBB、PVC、APB,其靈敏度數(shù)據(jù)稍低。由表2可以看出,網(wǎng)絡(luò)對(duì)于RBBB和PVC具有少量混淆。其混淆原因,一方面是幾類QRS波群的形態(tài)差異較小導(dǎo)致混淆,例如RBBB和PVC信號(hào)都包括一個(gè)正R波和一個(gè)負(fù)S波偏轉(zhuǎn);另一方面,在不同種心拍類型的交界處與片段邊緣兩側(cè)的殘缺心拍處,預(yù)測(cè)概率出現(xiàn)交替下降與上升的部分,產(chǎn)生了少量錯(cuò)誤的預(yù)測(cè)。
隨后,本文采用已有分類算法,包括支持向量機(jī)(SVM)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)進(jìn)行心律失常的心拍五分類,其平均指標(biāo)對(duì)比如表4所示。
表4 SVM、CNN、LATM 分類結(jié)果各項(xiàng)指標(biāo) %
通過(guò)對(duì)SVM、CNN、LSTM、U-NET的分類結(jié)果關(guān)鍵指標(biāo)對(duì)比分析可知,本文的U-NET模型在對(duì)心電片段進(jìn)行心律失常分類時(shí),同樣獲得了比較高的準(zhǔn)確度。本文的U-NET模型的靈敏度和正陽(yáng)性率指標(biāo)稍低,表現(xiàn)在網(wǎng)絡(luò)對(duì)不同種類型交界處的心拍與片段邊緣兩側(cè)的心拍處產(chǎn)生了錯(cuò)誤的預(yù)測(cè),但對(duì)于整條信號(hào)片段的各類型的劃分功能影響不大。從整體來(lái)看,本文的方法保證了較高識(shí)別準(zhǔn)確度,通過(guò)輸出標(biāo)簽地圖,可直接劃分出混合類型片段中的每個(gè)心拍的位置與類型。
本文基于U-NET全卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)了一種心電信號(hào)語(yǔ)義分割的識(shí)別方法。本文首先介紹了網(wǎng)絡(luò)模型的工作原理,然后給出了針對(duì)心電信號(hào)識(shí)別問(wèn)題的修改網(wǎng)絡(luò)模型,并介紹了樣本切片與標(biāo)簽方式,最后通過(guò)對(duì)網(wǎng)絡(luò)模型的測(cè)試,得到其分類效果。與常規(guī)的心電信號(hào)分類方法相比,本文的方法無(wú)需QRS檢測(cè)算法與特征設(shè)計(jì),同時(shí)又可精確地劃分出每條片段中每類心拍的位置和類型,處理混合心律失常類型的心電片段,具有較高的實(shí)用價(jià)值。