徐晨華,葉思超,喬清理
(天津醫(yī)科大學(xué)生物醫(yī)學(xué)工程與技術(shù)學(xué)院,天津 300070)
心律失常是心血管疾病最顯著的表現(xiàn),嚴(yán)重的心律失常可能會(huì)導(dǎo)致心臟驟停,甚至死亡。便攜式可穿戴設(shè)備可實(shí)現(xiàn)對(duì)患者的長期監(jiān)測(cè),達(dá)到早期識(shí)別心律失常的目的,但其必須滿足識(shí)別準(zhǔn)確度高、重量輕、能耗低、識(shí)別速度快等要求,因此,在降低計(jì)算復(fù)雜度的基礎(chǔ)上,提高心律失常的分類準(zhǔn)確度具有重要意義。
隨著技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)方法被應(yīng)用于心律失常分類[1-4]。Mondéjar-Guerra等[2]提取心電信號(hào)的RR間期特征、小波特征、高階統(tǒng)計(jì)特征等,輸入到支持向量機(jī)中,獲得了95.9%的準(zhǔn)確度。但人工提取特征高度依賴于經(jīng)驗(yàn),難以提取隱含特征,并且會(huì)引入大量計(jì)算,無法滿足計(jì)算簡單的要求。后來,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)被應(yīng)用于心律失常分類[5-6]。基于CNN的方法具有從輸入中獨(dú)立學(xué)習(xí)特征并分類的能力。Rajpurkar等[5]訓(xùn)練了一個(gè)34層的CNN,可以實(shí)現(xiàn)心律失常自動(dòng)分類,其靈敏度和準(zhǔn)確度均超過了心臟病專家的平均水平。如果使用較淺的CNN,則很難學(xué)習(xí)心電信號(hào)中的深層次特征,而當(dāng)網(wǎng)絡(luò)深度增加時(shí),網(wǎng)絡(luò)參數(shù)將成指數(shù)倍增加,計(jì)算負(fù)擔(dān)加重[7]。
本研究將人工提取特征和CNN自動(dòng)提取特征的優(yōu)勢(shì)相結(jié)合,提出了一種基于CNN的抗噪聲自動(dòng)心律失常分類方法。使用CNN對(duì)原始心電信號(hào)和小波分量進(jìn)行特征提取并與RR間期特征進(jìn)行融合,再使用softmax函數(shù)對(duì)心拍進(jìn)行自動(dòng)分類。為驗(yàn)證特征融合的有效性,對(duì)特征融合前后的網(wǎng)絡(luò)進(jìn)行性能評(píng)估對(duì)比。
實(shí)驗(yàn)數(shù)據(jù)來自MIT-BIH心律失常數(shù)據(jù)庫[8]。該數(shù)據(jù)庫包含48條數(shù)據(jù),每條數(shù)據(jù)持續(xù)30 min,采樣頻率為360 Hz,提供約110 000個(gè)心拍[9]。醫(yī)療器械促進(jìn)協(xié)會(huì)(AAMI)將心律失常分為五類:正常心拍(normal beat, N)、室上性異位心拍(superventricular premature beat, S)、心室異位心拍(ventricular ectopic beat, V)、融合心拍(fusion beat, F)和未知心拍(unknown beat, Q)。未知心拍是由于信噪比過低而無法準(zhǔn)確識(shí)別的心拍。因此,只對(duì)N、S、V、F四類心拍進(jìn)行研究。
II導(dǎo)聯(lián)是診斷心臟病最常用的導(dǎo)聯(lián)之一[10]。研究中使用修正后的II導(dǎo)聯(lián)數(shù)據(jù)(MLII)。
去除使用心臟起搏器的4條心電數(shù)據(jù)(102、104、107和217)。將數(shù)據(jù)分為不含相同患者信息的兩個(gè)數(shù)據(jù)集DS1和DS2[11]。DS1數(shù)據(jù)編號(hào)為:101、106、108、109、112、114、115、116、118、119、122、124、201、203、205、207、208、209、215、220、223、230。DS2數(shù)據(jù)編號(hào)為:100、103、105、111、113、117、121、123、200、202、210、212、213、214、219、221、222、228、231、232、233、234。
本研究使用主動(dòng)學(xué)習(xí)的訓(xùn)練方式[12]。將訓(xùn)練集分為全局訓(xùn)練集和個(gè)體訓(xùn)練集。使用全局訓(xùn)練集訓(xùn)練一個(gè)模型,當(dāng)遇到新患者時(shí),為新患者的一部分?jǐn)?shù)據(jù)制作標(biāo)簽,作為個(gè)體訓(xùn)練集對(duì)模型進(jìn)行微調(diào),用微調(diào)后的模型預(yù)測(cè)剩下的數(shù)據(jù)。研究中,DS1數(shù)據(jù)集充當(dāng)全局訓(xùn)練集。DS2數(shù)據(jù)集的前5 min數(shù)據(jù)作為個(gè)體訓(xùn)練集,引入患者特異性。將去除前5 min的DS2數(shù)據(jù)作為測(cè)試集。此做法符合AAMI標(biāo)準(zhǔn)。
特征提取之前需要將完整的心電信號(hào)分割為單個(gè)心拍。使用數(shù)據(jù)庫中標(biāo)記的R峰位置對(duì)心電信號(hào)進(jìn)行分割。為了表征一個(gè)完整的心拍周期,本研究取R峰前100個(gè)點(diǎn)、R峰后150個(gè)點(diǎn),共250個(gè)點(diǎn)表征一個(gè)心拍,并制作標(biāo)簽。
RR間期表示兩個(gè)相鄰心拍R峰之間的時(shí)間間隔,能夠有效區(qū)分心律失常的類型[13]。使用前RR間期和后RR間期表征心電信號(hào)的時(shí)域信息。根據(jù)式(1)、式(2)計(jì)算RR間期特征。
rrpre=rcur-rpre
(1)
rrpost=rpost-rcur
(2)
其中,rcur表示當(dāng)前R峰的位置,rpre表示前相鄰R峰的位置,rpost表示后相鄰R峰位置,rrpre為前RR間期,rrpost為后RR間期。
心電信號(hào)中,QRS波群包含的信息最多,對(duì)該部分進(jìn)行小波特征提取。以R峰為中心選取44個(gè)點(diǎn)表示QRS波群。使用離散小波變換(db4)將QRS波群信號(hào)分解為四個(gè)尺度,分別為D2、D3、D4、A4,并重建每個(gè)尺度的小波分量。
CNN可以自動(dòng)提取ECG信號(hào)的有效特征。研究中,提出一種用于心律失常分類的CNN,網(wǎng)絡(luò)結(jié)構(gòu)見圖1。網(wǎng)絡(luò)分為四個(gè)模塊:輸入、特征提取、特征融合、分類。
輸入模塊。網(wǎng)絡(luò)包括三部分輸入:尺寸為250×1的心拍信號(hào),4個(gè)尺寸為44×1的小波特征,尺寸為2×1的RR間期特征。
特征提取模塊。構(gòu)建網(wǎng)絡(luò)提取心拍波形特征和深層小波特征。提取心拍波形特征時(shí),對(duì)心拍波形進(jìn)行卷積核為9×1的卷積操作。對(duì)卷積結(jié)果進(jìn)行批量歸一化后再進(jìn)行非線性激活處理,非線性激活函數(shù)使用Relu函數(shù)。對(duì)得到的特征圖進(jìn)行最大池化操作,步長為4,能夠減少特征數(shù),降低計(jì)算量。對(duì)得到的特征圖再進(jìn)行大小為9×1的卷積操作、批量歸一化和Relu激活。為防止過擬合,加入Dropout層。最終得到大小為45×16的特征向量;提取深層小波特征時(shí),對(duì)四個(gè)小波分量D2、D3、D4、A4分別進(jìn)行卷積,卷積核大小為9×1,并在卷積操作之后使用Relu激活函數(shù),平均池化后最終得到22個(gè)4×4的特征向量。
特征融合與分類模塊。將網(wǎng)絡(luò)提取的特征向量和RR間期特征拼接后輸入到全連接層進(jìn)行融合,并在輸出層使用softmax函數(shù)分類。CNN結(jié)構(gòu)具體配置參數(shù)見表1。
表1 CNN結(jié)構(gòu)具體配置Table 1 Specific configuration of convolutional neural network structure
使用交叉熵?fù)p失函數(shù),通過Adam優(yōu)化器在訓(xùn)練過程中對(duì)權(quán)重和偏置進(jìn)行優(yōu)化。當(dāng)20次迭代內(nèi)損失值不再下降時(shí),停止迭代,保存準(zhǔn)確率最高的模型。
注:Conv Modular由一維卷積層Conv1D、批量歸一化BN、激活函數(shù)ReLu組成,Maxpool1D表示一維最大池化層,Dropout表示隨機(jī)失活層,F(xiàn)latten層把多維的輸入一維化,Averagepool1D表示一維平均池化層,Concatenate表示拼接層,fc為全連接層。圖1 網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 Network structure diagram
本研究提出的算法已在MIT-BIH心律失常數(shù)據(jù)庫中得到驗(yàn)證。選取準(zhǔn)確度(Acc)、靈敏度(Se)和陽性預(yù)測(cè)值(P+)來評(píng)估模型的性能,計(jì)算公式如下:
(3)
(4)
(5)
其中,TP(True Positive)為真陽性數(shù)量,F(xiàn)P(False Positive)為假陽性數(shù)量,TN(True Negative)為真陰性數(shù)量,F(xiàn)N(False Negative)為假陰性數(shù)量。
使用測(cè)試集對(duì)特征融合前后的網(wǎng)絡(luò)分別進(jìn)行了測(cè)試,計(jì)算了特征融合前后各類心拍的靈敏度、陽性預(yù)測(cè)值以及總體準(zhǔn)確度、平均靈敏度、平均陽性預(yù)測(cè)值,見表2。僅使用CNN對(duì)心拍進(jìn)行特征提取,所得結(jié)果在F類心拍上表現(xiàn)較差,靈敏度僅為37.15%。使用CNN對(duì)心拍和小波分量進(jìn)行特征提取并融合,主要改善了V類的分類性能,使其達(dá)到了91.03%靈敏度。當(dāng)使用CNN對(duì)心拍進(jìn)行特征提取,并與RR間期特征進(jìn)行融合時(shí),取得了最佳的S類靈敏度。將提取的所有特征進(jìn)行融合后,網(wǎng)絡(luò)的總體準(zhǔn)確度達(dá)到了98.12%,且各類心拍均取得了較高的靈敏度和陽性預(yù)測(cè)值,分類性能較融合前有了極大的提升。
表2 性能評(píng)估結(jié)果Table 2 Performance evaluation results
為了評(píng)估噪聲對(duì)分類結(jié)果的影響,向原始心電數(shù)據(jù)疊加四種不同信噪比的高斯白噪聲,以及使用db8小波對(duì)原始信號(hào)進(jìn)行去噪。以單個(gè)心拍為例,原始波形圖以及經(jīng)過處理后的心拍波形見圖2。使用構(gòu)建的CNN對(duì)增加和去除噪聲后的信號(hào)進(jìn)行分類,結(jié)果見表3。
圖 2 原始心拍與增加、去除噪聲后的心拍波形圖Fig. 2 Original heartbeat and heartbeat waveform after adding and removing noise
表3 抗噪能力測(cè)試結(jié)果Table 3 Noise immunity test results
根據(jù)表3數(shù)據(jù),疊加10 dB信噪比噪聲時(shí),網(wǎng)絡(luò)的各項(xiàng)性能指標(biāo)均有所下降。由圖2(c)可知,疊加10 dB噪聲的心拍波形嚴(yán)重失真,雖然分類效果有所下降,但仍然可以達(dá)到95.69%的總體準(zhǔn)確度,具有一定的參考價(jià)值。
當(dāng)疊加信噪比大于等于20 dB的噪聲時(shí),總體準(zhǔn)確度無顯著變化,且各類別性能評(píng)價(jià)指標(biāo)相差不大。網(wǎng)絡(luò)對(duì)去除基線漂移和高頻噪聲后的信號(hào)分類的總體準(zhǔn)確度最高。
表4顯示了其他同樣符合AAMI標(biāo)準(zhǔn)的分類方法的性能評(píng)估指標(biāo)結(jié)果,每項(xiàng)指標(biāo)的最佳結(jié)果加粗顯示。Kiranyaz等[12]使用一維CNN對(duì)MIT-BIH數(shù)據(jù)庫中24條心電數(shù)據(jù)進(jìn)行測(cè)試,得到95.13%的總體準(zhǔn)確度;Luo等[14]使用了一種頻率切片小波變換的方法產(chǎn)生心拍的時(shí)頻圖,構(gòu)建深度神經(jīng)網(wǎng)絡(luò)提取心拍特征并分類,取得了97.5%的總體準(zhǔn)確度;Xiang等[15]提出了一種基于注意機(jī)制的兩級(jí)特征提取方法,得到了96.74%的總體準(zhǔn)確度。通過對(duì)比,本研究方法的N、S類靈敏度和陽性預(yù)測(cè)值以及總體準(zhǔn)確度更高。
表4 心律失常分類方法及性能評(píng)估指標(biāo)Table 4 Arrhythmia classification methods and performanceevaluation indicators
本研究構(gòu)建CNN對(duì)心拍和QRS波群小波分量進(jìn)行自動(dòng)特征提取,融合RR間期特征,使用softmax函數(shù)對(duì)心拍進(jìn)行分類。通過對(duì)比特征融合前后獲得的評(píng)估指標(biāo)結(jié)果,證明本研究提出的特征融合方法能有效提高網(wǎng)絡(luò)對(duì)心拍的分類能力。
為了評(píng)估所構(gòu)建網(wǎng)絡(luò)對(duì)噪聲的抗干擾能力,向測(cè)試集信號(hào)中疊加或?yàn)V除噪聲,對(duì)網(wǎng)絡(luò)進(jìn)行測(cè)試。根據(jù)測(cè)試結(jié)果可以認(rèn)為本研究構(gòu)建的網(wǎng)絡(luò)對(duì)噪聲具有一定的抗干擾能力。這種抗噪能力的形成主要有兩個(gè)原因:(1)在網(wǎng)絡(luò)結(jié)構(gòu)中采用的批量歸一化層能夠消除一部分噪聲的影響;(2)本研究中未對(duì)輸入CNN的心電數(shù)據(jù)進(jìn)行去噪、歸一化等預(yù)處理,最大程度保留心電信號(hào)完整性的同時(shí),在包含噪聲的情況下訓(xùn)練網(wǎng)絡(luò),訓(xùn)練后的CNN模型能夠在含噪聲信號(hào)中提取到有效特征。
在后續(xù)工作中,需要結(jié)合QRS波群檢測(cè),優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練過程,進(jìn)一步提高分類準(zhǔn)確度。另外,研究中的異常心拍的數(shù)據(jù)量較少,需要采集更多的數(shù)據(jù)用于實(shí)驗(yàn)。
本研究基于CNN提出了一種對(duì)單導(dǎo)聯(lián)心電信號(hào)進(jìn)行特征提取與融合的抗噪聲自動(dòng)心律失常分類方法。提出的方法減少了預(yù)處理的過程,計(jì)算負(fù)擔(dān)小。將人工提取特征和CNN自動(dòng)提取特征的優(yōu)勢(shì)相結(jié)合,有效提高了分類準(zhǔn)確度。經(jīng)過抗干擾能力測(cè)試,證明本研究的分類方法對(duì)噪聲具有一定的抗干擾能力。另外,本研究方法僅需要單導(dǎo)聯(lián)數(shù)據(jù)就可以實(shí)現(xiàn)對(duì)心拍的分類,對(duì)心電數(shù)據(jù)處理速度快,計(jì)算量小,具有一定的臨床意義和價(jià)值,可以用作ECG篩查工具。