黃 麗,蔡定建,凌世康,歐陽昊,李 嘉
(五邑大學(xué)智能制造學(xué)部,廣東江門 529020)
每年死于心血管疾病(cardiovascular disease,CVD)的患者多于任何其他疾病[1]。鑒于CVD 的高流行率、高發(fā)病率和高治療成本,及早就診有助于早期診斷和治療,從而減輕癥狀并避免并發(fā)癥的發(fā)生。
心率為心臟每分鐘跳動(dòng)的次數(shù),成年人的正常心率為60~100 次/min,不在該范圍內(nèi)則稱為心律失常,也稱為不規(guī)則心跳[2]。CVD 的發(fā)病初期通常伴隨著心律失常,嚴(yán)重的心律失??赡軙?huì)增加發(fā)生其他CVD的風(fēng)險(xiǎn),例如心肌梗死、心肌病和心肌炎等。心電圖(electrocardiograph,ECG)具有非侵入性、操作簡(jiǎn)單且無害等特點(diǎn),刻畫了心臟在每個(gè)心動(dòng)周期內(nèi)產(chǎn)生的電活動(dòng)變化波形,是一種臨床檢測(cè)心律失常的常規(guī)手段。全球每年采集的ECG 信號(hào)超過3 億條,這充分說明了其臨床實(shí)踐中的重要性[3]。基于ECG 的心律失常檢測(cè)工作量大,易導(dǎo)致效率低和誤診,因此隨著智慧醫(yī)療的興起,自動(dòng)檢測(cè)心律失常的重要性逐漸凸顯。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)重要子集,具備強(qiáng)大的特征提取和數(shù)據(jù)處理能力。近年來,越來越多的研究人員將深度學(xué)習(xí)應(yīng)用于醫(yī)學(xué)領(lǐng)域[4],例如醫(yī)學(xué)圖像處理[5]、基因組分析[6]、電子健康記錄分析[7]和生理信號(hào)分析[8]等方面,都取得了良好的效果。相比于機(jī)器學(xué)習(xí),深度學(xué)習(xí)可以輔助醫(yī)生更高效地進(jìn)行心律失常臨床檢測(cè),搭載深度學(xué)習(xí)模型的可穿戴設(shè)備也可以給普通人提供日常的檢測(cè)。已有學(xué)者對(duì)機(jī)器學(xué)習(xí)在心律失常檢測(cè)領(lǐng)域的最新研究成果進(jìn)行了歸納和分析,如文獻(xiàn)[9]闡述了機(jī)器學(xué)習(xí)在ECG 自動(dòng)診斷方面的應(yīng)用,文獻(xiàn)[10]從CVD 的角度分析了深度學(xué)習(xí)在ECG 自動(dòng)診斷方面的研究過程,文獻(xiàn)[11]總結(jié)了深度學(xué)習(xí)在心電診斷方面的研究現(xiàn)狀。上述文獻(xiàn)均是從技術(shù)層面對(duì)現(xiàn)有方法進(jìn)行了總結(jié),并未仔細(xì)劃分具體的研究對(duì)象,如哪些方法是以單導(dǎo)聯(lián)ECG 作為研究對(duì)象,哪些是將12 導(dǎo)聯(lián)ECG 作為研究對(duì)象。因此,本文從不同的研究對(duì)象出發(fā),闡述深度學(xué)習(xí)在心律失常檢測(cè)方面的應(yīng)用現(xiàn)狀,并對(duì)現(xiàn)有檢測(cè)方法存在的問題進(jìn)行分析和提出解決方案,以便為該領(lǐng)域的研究者提供更有針對(duì)性的檢測(cè)性能優(yōu)化思路。同時(shí),本文也可為未來心律檢測(cè)手段走向智能化、多樣化提供理論參考。
單導(dǎo)聯(lián)ECG 可用于初步檢測(cè)心律失常,包括早搏、房顫等各種心律不齊。此外,它也適用術(shù)后隨訪場(chǎng)景。結(jié)合深度學(xué)習(xí)技術(shù),單導(dǎo)聯(lián)ECG 不僅可提供心電監(jiān)測(cè),還可以作為心律失常的初篩工具,同時(shí)提供心臟疾病的早期預(yù)警。這種方法有助于早發(fā)現(xiàn)、早治療和早控制心臟疾病。
CNN 因其強(qiáng)大的特征提取能力,在圖像和聲音識(shí)別等領(lǐng)域中有較好的應(yīng)用,適用于單導(dǎo)聯(lián)ECG 的特征提取。例如,Rajpurkar 等[12]構(gòu)建了一種34 層CNN 模型,并利用該模型在29 163 名患者中收集到的64 121 條單導(dǎo)聯(lián)ECG 記錄進(jìn)行心律失常檢測(cè),最后獲得的精確度和敏感度分別達(dá)到80%和78.4%。Acharya 等[13]搭建了9 層CNN 模型,采用美國(guó)麻省理工學(xué)院與貝斯以色列醫(yī)院(Massachusetts Institute of Technology-Beth Israel Hospital,MIT-BIH)心律失常數(shù)據(jù)庫[14]分別對(duì)未去噪和去噪的單導(dǎo)聯(lián)ECG 進(jìn)行了心律失常檢測(cè)。結(jié)果顯示,9 層CNN 模型在未去噪和去噪后的單導(dǎo)聯(lián)ECG 上分別得到了94.03%和93.47%的準(zhǔn)確率。Wang 等[15]在其研究中提出了一個(gè)改進(jìn)的7 層CNN 結(jié)構(gòu),通過不同大小的卷積核和最大池化層,實(shí)現(xiàn)了對(duì)單導(dǎo)聯(lián)ECG 心律失常的自動(dòng)檢測(cè),最終在MIT-BIH 數(shù)據(jù)庫上的準(zhǔn)確率達(dá)到了99.06%,但并未克服數(shù)據(jù)庫中類別不平衡的問題。Romdhane 等[16]利用焦點(diǎn)損失函數(shù)[17](Focal Loss)解決單導(dǎo)聯(lián)ECG 類別不平衡的問題,再使用由2 個(gè)卷積塊組成的CNN 模型完成心律失常檢測(cè),其中每個(gè)卷積塊由3 個(gè)卷積層組成。最終,在MIT-BIH 數(shù)據(jù)庫上獲得了98.41%的準(zhǔn)確率。
由于單導(dǎo)聯(lián)ECG 信號(hào)是一維的數(shù)據(jù),因此研究者們構(gòu)建了1-D CNN 用于心律失常的檢測(cè)。Kiranyaz等[18]構(gòu)建了一種自適應(yīng)1-D CNN 模型,先對(duì)每個(gè)患者的原始單導(dǎo)聯(lián)ECG 進(jìn)行特征提取,再對(duì)室性異位搏動(dòng)和室上性異位搏動(dòng)的心律失常類別進(jìn)行檢測(cè)。Yildirim 等[19]使用了16 層1D-CNN 對(duì)未經(jīng)過預(yù)處理的10 s 單導(dǎo)聯(lián)ECG 進(jìn)行心律失常檢測(cè),最終檢測(cè)13、15、17 種心律失常類別的準(zhǔn)確率分別為95.20%、92.51%和91.33%。de Santana 等[20]則使用2D-CNN 的方法檢測(cè)17 種心律失常,該方法主要是使用15×15像素的灰度圖像,且灰度圖像的所有像素?cái)y帶有單導(dǎo)聯(lián)ECG 的相關(guān)信息,該方法在MIT-BIH 數(shù)據(jù)集上獲得了99.13%的分類準(zhǔn)確率。為了提取單導(dǎo)聯(lián)ECG 圖像的空間局部性特征,Jun 等[21]使用2D-CNN 提取圖像(128×128)的空間局部性,再利用6 層的1D-CNN檢測(cè)8 種不同類型的心律失常,最終在MIT-BIH 數(shù)據(jù)庫上實(shí)現(xiàn)了99.05%的準(zhǔn)確率和99.57%的特異度。Ullah 等[22]也以類似于Jun 等[21]的方式,通過短時(shí)傅里葉變換(short-time fourier transform,STFT)將一維單導(dǎo)聯(lián)ECG 轉(zhuǎn)換成二維圖像(256×256),并對(duì)其使用數(shù)據(jù)增強(qiáng)技術(shù),最后在4 層2D-CNN 中實(shí)現(xiàn)心律失常檢測(cè)并獲得了99.11%的準(zhǔn)確率。為了解決CNN 中全連接層需要固定輸入尺寸的限制,Li 等[23]在CNN 層和全連接層之間加入了空間金字塔池化(spatial pyramid pooling,SPP)層,SPP 層匯集了CNN 提取的特征并輸出長(zhǎng)度固定的特征向量,再將這些特征輸送至全連接層,最終在單導(dǎo)聯(lián)ECG 上實(shí)現(xiàn)了94.00%的心律失常檢測(cè)準(zhǔn)確率,但仍缺乏對(duì)異常心跳的定位。Tong等[24]考慮到個(gè)體心跳和整個(gè)心電段之間的相互影響,搭建出了一種多實(shí)例神經(jīng)網(wǎng)絡(luò)(multi-instance neural network,MINN)模型。MINN 模型不但能對(duì)單導(dǎo)聯(lián)ECG 進(jìn)行分類,還能對(duì)單導(dǎo)聯(lián)ECG 異常部分進(jìn)行定位,并在定位異常心跳上實(shí)現(xiàn)了94.73%的敏感度。
可見,CNN 能夠有效地從單導(dǎo)聯(lián)ECG 信號(hào)中提取重要的時(shí)域和頻域特征,因而在檢測(cè)心律失常中得到廣泛應(yīng)用。
傳統(tǒng)的卷積層或全連接層在傳遞信息時(shí)存在信息丟失而使精度下降的問題。在保證訓(xùn)練成本的同時(shí),ResNet 通過引入殘差模塊,允許跳過1 個(gè)或多個(gè)卷積層,直接將輸入的信息與輸出的信息相加,從而傳遞了原始輸入的信息,有助于保護(hù)信息的完整性并提升模型的訓(xùn)練精度。例如,Li 等[25]使用了31層ResNet 對(duì)心律失常進(jìn)行檢測(cè),并在單導(dǎo)聯(lián)ECG上獲得了99.06%的平均準(zhǔn)確率。為了避免梯度消失并保留關(guān)鍵特征,沈堯等[26]在ResNet 中加入了用于增強(qiáng)CNN 性能的卷積注意力模塊(convolutional block attention module,CBAM),并將其與長(zhǎng)短時(shí)記憶(long short-term memory,LSTM)結(jié)合形成L-ResNet模型,進(jìn)而實(shí)現(xiàn)了不同類型的心律失常檢測(cè)。為了最大限度地提取單導(dǎo)聯(lián)ECG 的全局信息,潘輝[27]在ResNet 中將第一個(gè)傳統(tǒng)卷積改為空洞卷積(dilated convolution),以更有效地捕獲單導(dǎo)聯(lián)ECG 中的全局特征并將這些特征用于心律失常檢測(cè),最后在MITBIH 數(shù)據(jù)庫上獲得了97.20%的準(zhǔn)確率。為了提高心律失常檢測(cè)模型的泛化能力,Allam 等[28]設(shè)計(jì)了一個(gè)基于Stockwell 變換(Stockwell transform,ST)和由12個(gè)殘差路徑組成的二維殘差網(wǎng)絡(luò)(2D-ResNet)的特定心電圖心拍分類(specific ECG beat classification,SpEC)系統(tǒng)。其中,SpEC 系統(tǒng)利用基于ST 的時(shí)頻表示方法來區(qū)分不同心拍,并利用2D-ResNet 來克服數(shù)據(jù)不足和梯度退化問題。結(jié)果顯示,SpEC 系統(tǒng)在MIT-BIH 數(shù)據(jù)庫和該系統(tǒng)實(shí)時(shí)獲取的單導(dǎo)聯(lián)ECG數(shù)據(jù)庫上分別取得99.73%和89.87%的準(zhǔn)確率。黃瑩[29]在深度殘差收縮網(wǎng)絡(luò)的基礎(chǔ)上引入了注意力機(jī)制(Attention)和軟閾值化結(jié)合的子網(wǎng)絡(luò),從而搭建了一維改進(jìn)的殘差收縮網(wǎng)絡(luò)(1D modified residual shrinkage network,1D-MRSN)模型,用于未去噪的單導(dǎo)聯(lián)ECG 心律失常檢測(cè)。最終,1D-MRSN 模型在MIT-BIH 數(shù)據(jù)庫上獲得了99.51%的準(zhǔn)確率。
可見,ResNet 通過殘差鏈接的方式幫助網(wǎng)絡(luò)學(xué)習(xí)到更多的有效特征并且減少訓(xùn)練中出現(xiàn)的退化問題,從而提高心律失常檢測(cè)性能。
RNN 是一種具有記憶功能的神經(jīng)網(wǎng)絡(luò),適合處理單導(dǎo)聯(lián)ECG 這種前后關(guān)聯(lián)性強(qiáng)的時(shí)間序列信號(hào)。例如,Wang 等[30]提出了一種基于雙路徑遞歸神經(jīng)網(wǎng)絡(luò)(dual-path recurrent neural network,DPRNN)的心律失常自動(dòng)檢測(cè)方法。將整個(gè)單導(dǎo)聯(lián)ECG 作為該模型的輸入,再將單導(dǎo)聯(lián)ECG 分割成多個(gè)片段,然后對(duì)段內(nèi)(局部)和段間(全局)2 個(gè)方面進(jìn)行分析和建模,以提取更多的特征信息,最后在2017 年物理學(xué)/心臟病計(jì)算挑戰(zhàn)賽(The PhysioNet/Computing in Cardiology Challenge 2017,CinC 2017)提供的數(shù)據(jù)庫上能有效識(shí)別出房顫。
RNN 的變體也適用于心律失常檢測(cè)。LSTM 是一種在常規(guī)RNN 基礎(chǔ)上改進(jìn)后的時(shí)序分析方法,具有克服長(zhǎng)期依賴性的能力,可以解決RNN 梯度爆炸或梯度消失的問題,因而逐步成為目前最主流的時(shí)序信號(hào)處理網(wǎng)絡(luò)。例如,Singh 等[31]分別使用RNN、LSTM 和門控遞歸單元(gate recurrent unit,GRU)對(duì)MIT-BIH 數(shù)據(jù)庫的單導(dǎo)聯(lián)ECG 進(jìn)行心律失常檢測(cè),結(jié)果顯示LSTM 對(duì)心律失常檢測(cè)的準(zhǔn)確度更高,說明LSTM 更適合用于單導(dǎo)聯(lián)ECG 時(shí)序信號(hào)的處理。Ashfaq-Khan 等[32]使用主成分分析對(duì)單導(dǎo)聯(lián)ECG 進(jìn)行去噪,再使用LSTM 對(duì)心律失常進(jìn)行檢測(cè),最終在UCI ML Repository 數(shù)據(jù)庫[33]上實(shí)現(xiàn)了93.5%的檢測(cè)準(zhǔn)確率。Pandey 等[34]使用了不同特征提取方法,包括小波變換、高階統(tǒng)計(jì)量、R-R 間隔和形態(tài)學(xué)描述等,再將這些特征進(jìn)行組合并對(duì)其進(jìn)行歸一化,然后將它們輸入LSTM 中實(shí)現(xiàn)心律失常的自動(dòng)檢測(cè),最后在MIT-BIH 數(shù)據(jù)庫上實(shí)現(xiàn)了99.37%的平均準(zhǔn)確率。張異凡等[35]考慮到單導(dǎo)聯(lián)ECG 自身的特性,使用LSTM 和CNN 的并行組合模型,在心律失常檢測(cè)方面取得了99.11%的準(zhǔn)確率。其中,LSTM 被應(yīng)用于捕捉心電序列數(shù)據(jù)的時(shí)序依賴關(guān)系,CNN 則被用來提取單導(dǎo)聯(lián)ECG 的局部相關(guān)特征。陶亮等[36]將CNN 與LSTM 串聯(lián)起來,形成了CNN-LSTM 混合模型。該模型包括5 個(gè)卷積層、5 個(gè)池化層、1 個(gè)LSTM 層和1個(gè)全連接層,并將經(jīng)過預(yù)處理的單導(dǎo)聯(lián)ECG 輸入其中,以實(shí)現(xiàn)5 種心律失常類別的高效、準(zhǔn)確檢測(cè)。最終,CNN-LSTM 在MIT-BIH 數(shù)據(jù)庫上實(shí)現(xiàn)了99.48%的準(zhǔn)確率、99.47%的敏感度和99.86%的特異度??蔓惖萚37]提出一種結(jié)合深度卷積神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)多層概率融合的卷積長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(convolutional long short term memory network,C-LSTM),并在單導(dǎo)聯(lián)ECG 上實(shí)現(xiàn)了99.23%的心律失常檢測(cè)準(zhǔn)確率。LSTM 因具有長(zhǎng)期記憶功能的特點(diǎn),適合用于ECG 這種時(shí)序信號(hào)的檢測(cè)分析。
ECG 信號(hào)不僅僅與前一時(shí)刻有關(guān),還與后一時(shí)段密不可分,使得雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(bidirectional long short-term memory,BiLSTM)比LSTM 更適用于ECG 信號(hào)檢測(cè)。例如,李興秀等[38]先是利用CNN 學(xué)習(xí)單導(dǎo)聯(lián)ECG 的形態(tài)特征,之后通過BiLSTM 獲取特征間的上下文依賴關(guān)系,最后在MIT-BIH 數(shù)據(jù)庫上運(yùn)用Softmax 函數(shù)完成心律失常檢測(cè)任務(wù)并取得了99.11%的平均準(zhǔn)確率。Yildirim 等[39]結(jié)合BiLSTM與小波序列(wavelet sequences,WS)對(duì)單導(dǎo)聯(lián)ECG信號(hào)進(jìn)行分類,并在MIT-BIH 數(shù)據(jù)庫上獲得了99.39%的心律失常檢測(cè)準(zhǔn)確率。然而,BiLSTM 中的隱藏單元數(shù)量和學(xué)習(xí)率是基于先驗(yàn)知識(shí)預(yù)設(shè)的。Li 等[40]解決了這個(gè)問題,提出了基于貝葉斯優(yōu)化的BiLSTM 模型用于心律失常自動(dòng)檢測(cè)。實(shí)驗(yàn)結(jié)果顯示,相對(duì)于優(yōu)化前,面向單導(dǎo)聯(lián)ECG 分類的BiLSTM 模型在MIT-BIH數(shù)據(jù)庫上的準(zhǔn)確率提升了0.86%,達(dá)到了99.00%,證明了貝葉斯優(yōu)化BiLSTM 是一種有效的方法,可以提高分類性能。葉興揚(yáng)等[41]則運(yùn)用基于ResNet 和BiLSTM 的融合模型對(duì)心律失常進(jìn)行檢測(cè),該融合模型使用了16 個(gè)殘差塊結(jié)構(gòu)來提取和整合單導(dǎo)聯(lián)ECG信號(hào)的特征,并利用BiLSTM 來替換34 層ResNet 的最后一層卷積層后面的全連接層和輸出層,最終在CinC 2017 數(shù)據(jù)庫上得到了85.71%的平均F1值。秦默然等[42]增加了空洞卷積池化金字塔(atrous spatial pyramid pooling,ASPP)模塊,并進(jìn)一步聚合各通道中不同尺寸的空洞卷積提取的信息,再將這些信息用于心律失常檢測(cè),最終在CinC 2017 數(shù)據(jù)庫上取得了87.35%的F1值,也在醫(yī)院實(shí)測(cè)的單導(dǎo)聯(lián)ECG 數(shù)據(jù)庫上取得了88.98%的平均F1值。Shin 等[43]使用MobileNetV2-BiLSTM 算法和匹配追蹤算法進(jìn)行心律失常檢測(cè),并在MIT-BIH 數(shù)據(jù)庫上獲得了92.00%的準(zhǔn)確率。其中,匹配追蹤算法可以在短時(shí)間內(nèi)增加單導(dǎo)聯(lián)ECG 數(shù)據(jù),以解決數(shù)據(jù)不平衡問題。總之,BiLSTM 在LSTM 的基礎(chǔ)上增加了反向運(yùn)算,可以更好地捕捉雙向語義信息,即單導(dǎo)聯(lián)ECG的前后信息均能被有效捕捉,進(jìn)而提高心律失常的檢測(cè)特性。
GAN 是解決數(shù)據(jù)不平衡的重要模型,其在多個(gè)領(lǐng)域[44]中都可以合成高質(zhì)量圖像,包括生成MRI 切片[45]、視網(wǎng)膜圖像[46]和胸部病理學(xué)數(shù)據(jù)[47]。GAN 至少由生成器G 和判別器D 組成,可用于合成心跳。而MIT-BIH 數(shù)據(jù)庫中各類的心律失常數(shù)據(jù)分布不平衡,大部分是正常心拍,而心室融合心跳(fusion of ventricuiar and normal beat,F(xiàn)VN)、心室逸搏(ventricular escape beat,VEB)和心室顫動(dòng)波(ventricular flutter wave,VFW)等數(shù)據(jù)較少。因此,在進(jìn)行相關(guān)研究時(shí)許多學(xué)者會(huì)對(duì)每個(gè)類別的數(shù)據(jù)進(jìn)行平衡處理,以確保模型訓(xùn)練和評(píng)估的準(zhǔn)確性和可靠性。陳鵬等[48]將一維單導(dǎo)聯(lián)ECG 進(jìn)行單個(gè)節(jié)拍分割后轉(zhuǎn)化成二維灰度圖像(192×128),再利用GAN-CNN 生成高質(zhì)量的心拍圖像,以解決數(shù)據(jù)不平衡問題,并實(shí)現(xiàn)了8種心律失常的檢測(cè)。Shaker 等[49]使用GAN 合成高質(zhì)量的單導(dǎo)聯(lián)ECG 數(shù)據(jù),并提出了2 種基于CNN 的方法來實(shí)現(xiàn)15 種心律失常的檢測(cè)。其中,第一種方法(端到端方法)是由3 個(gè)inception 模塊和3 個(gè)全連接層構(gòu)成的CNN 結(jié)構(gòu),直接將心跳分為15 種類型之一;第二種方法(兩階段分層法)先在第一階段確定心律失常的類別,然后在第二階段將其分類為屬于該類別的具體類型。最后,通過第一種方法實(shí)現(xiàn)了98.30%的總體準(zhǔn)確率和90.0%的精確度,第二種方法的總體準(zhǔn)確率為98.00%,精確度為93.95%。實(shí)驗(yàn)證明,GAN 可以有效解決單導(dǎo)聯(lián)ECG 數(shù)據(jù)不平衡問題。
Transformer 在處理長(zhǎng)序列數(shù)據(jù)時(shí)會(huì)采用并行處理的方式,無需依次處理每個(gè)元素,使得其在長(zhǎng)序列數(shù)據(jù)時(shí)有更高的效率。例如,Yan 等[50]提出了一種基于Transformer 的心律失常檢測(cè)方法。考慮到單導(dǎo)聯(lián)ECG 沒有平移信號(hào),所以該方法只使用了Transformer 編碼器部分,并將其中的dropout 層替換為批量歸一化。此外,為更好地捕獲單導(dǎo)聯(lián)ECG 中的節(jié)律特征,該研究將手工設(shè)計(jì)的時(shí)間特征與Transformer 學(xué)習(xí)到的特征進(jìn)行融合。最終,在MIT-BIH 數(shù)據(jù)庫上取得了95.09%的精確度。Hu 等[51]提出了一種基于CNN和Transformer 的單導(dǎo)聯(lián)ECG 心律失常檢測(cè)算法。該算法將連續(xù)單導(dǎo)聯(lián)ECG 片段作為輸入,且設(shè)計(jì)了一個(gè)同時(shí)考慮位置與類別的損失函數(shù)和配對(duì)代價(jià)函數(shù),在MIT-BIH 房顫數(shù)據(jù)庫上的準(zhǔn)確率達(dá)到99.23%,在PTB-XL 數(shù)據(jù)庫上的準(zhǔn)確率達(dá)到99.21%??梢?,Transformer 在處理長(zhǎng)序列的時(shí)序信號(hào)方面能夠得到心律失常檢測(cè)的高準(zhǔn)確率。
在實(shí)際臨床環(huán)境中,除了準(zhǔn)確的心律失常檢測(cè)外,結(jié)果的可解釋性也同樣重要。心臟專家除了提供診斷結(jié)果之外,還要有詳細(xì)的解釋來支撐自己的診斷結(jié)果[52]。羅望成等[53]提出一種基于CNN-BiLSTM和Attention 的可解釋性的模型來實(shí)現(xiàn)心律失常檢測(cè)。該模型由6 個(gè)卷積層、3 個(gè)最大池化層、1 個(gè)BiLSTM 層、2 個(gè)Attention 層和1 個(gè)全連接層組成,并在MIT-BIH數(shù)據(jù)庫上獲得了94.65%的準(zhǔn)確率和98.69%的特異度。Li 等[54]結(jié)合單導(dǎo)聯(lián)ECG 信號(hào)的全局序列特征,構(gòu)建了具有可解釋性的BiLSTM-Attention 模型用于心律失常檢測(cè),實(shí)驗(yàn)結(jié)果顯示該模型在MIT-BIH 數(shù)據(jù)庫上的檢測(cè)準(zhǔn)確率可以達(dá)到99.49%。Lu 等[55]提出一種端到端的殘差注意力網(wǎng)絡(luò)(residual attention network,RA-NET)模型。該模型先是利用CNN 和殘差塊提取單導(dǎo)聯(lián)ECG 的局部特征,然后累加了5 個(gè)RA 進(jìn)一步增強(qiáng)信號(hào)類別的相關(guān)特征并抑制冗余特征,最終在CinC 2017數(shù)據(jù)庫上獲得了89.55%的心律失常檢測(cè)敏感度。Zhao 等[56]提出了基于Attention 的時(shí)域卷積網(wǎng)絡(luò)(temporal convolutional networks,TCN)的心律失常檢測(cè)模型。該模型利用TCN 和Attention 分別提取單導(dǎo)聯(lián)ECG 的全局特征和局部特征,并采用Focal Loss 來克服數(shù)據(jù)不平衡問題,最后在MIT-BIH數(shù)據(jù)庫上得到的準(zhǔn)確率為99.84%。
深度學(xué)習(xí)在以單導(dǎo)聯(lián)ECG 為研究對(duì)象的心律失常檢測(cè)中已經(jīng)取得了超過99%的準(zhǔn)確率,這使得其在日常監(jiān)測(cè)自身心臟狀態(tài)更具實(shí)用性。然而,與12 導(dǎo)聯(lián)ECG 相比,單導(dǎo)聯(lián)ECG 包含的特征信息相對(duì)較少。在臨床檢測(cè)中,12 導(dǎo)聯(lián)ECG 包含的特征與特定類型的心律失常密切相關(guān),因此12 導(dǎo)聯(lián)ECG有利于臨床心律失常的檢測(cè)。
ECG 信號(hào)雖然容易采集且操作簡(jiǎn)單,但與單導(dǎo)聯(lián)相比,12 導(dǎo)聯(lián)ECG 包含的特征更為豐富,可挖掘出更多有價(jià)值的信息,提取出更多有效特征用于檢測(cè),進(jìn)而對(duì)9 種類型(見表1)的心律失常進(jìn)行更精確的檢測(cè)。其中,完整的12 導(dǎo)聯(lián)ECG 通常來自6 個(gè)肢體導(dǎo)聯(lián)(Ⅰ、Ⅱ、Ⅲ、aVR、aVL、aVF)和6 個(gè)胸導(dǎo)聯(lián)(V1、V2、V3、V4、V5、V6)。不同導(dǎo)聯(lián)的ECG 信號(hào)表現(xiàn)出不同的特征,這些特征與特定類型的心律失常相關(guān)。因此,實(shí)現(xiàn)對(duì)完整的12 導(dǎo)聯(lián)ECG 自動(dòng)檢測(cè)在臨床醫(yī)學(xué)中越來越重要,而深度學(xué)習(xí)能夠以其優(yōu)勢(shì)輔助實(shí)現(xiàn)臨床心律失常檢測(cè)。
表1 9 種心律失常類別
靜態(tài)12 導(dǎo)聯(lián)ECG 是一種可用于全面檢測(cè)心臟的電活動(dòng)。He 等[57]提出了一種ResNet 與BiLSTM 相結(jié)合的模型,進(jìn)而實(shí)現(xiàn)對(duì)靜態(tài)12 導(dǎo)聯(lián)ECG 心律失常的檢測(cè)。其中,靜態(tài)12 導(dǎo)聯(lián)ECG 信號(hào)長(zhǎng)短不一,不利于模型的訓(xùn)練,故對(duì)靜態(tài)的每個(gè)導(dǎo)聯(lián)ECG 進(jìn)行處理以解決此問題。具體的處理方式為,以ECG 長(zhǎng)度30 s 為基準(zhǔn),若ECG 信號(hào)長(zhǎng)度不足30 s,則在ECG的前端補(bǔ)零至30 s 的長(zhǎng)度;若ECG 信號(hào)的長(zhǎng)度超過30 s,則截至30 s。該模型在2018 年舉辦的中國(guó)生理信號(hào)挑戰(zhàn)賽(China Physiological Signal Challenge 2018,CPSC 2018)的數(shù)據(jù)庫上進(jìn)行心律失常檢測(cè),獲得了0.836 的F1值。然而,靜態(tài)12 導(dǎo)聯(lián)ECG 上各導(dǎo)聯(lián)所具有的特征信息并不一致,為了最大限度地提取靜態(tài)12 導(dǎo)聯(lián)ECG 特征信息,Ye 等[58]則將每個(gè)導(dǎo)聯(lián)ECG分割成10 段6 s 的ECG 片段,再輸送至由12 個(gè)CNN和BiLSTM 組成的分支網(wǎng)絡(luò)中進(jìn)行特征提取,然后將這些特征進(jìn)行融合,最后在極限梯度提升樹(extreme gradient boosting,XGBoost)分類器中完成心律失常檢測(cè)并獲得了0.828 的F1值。Zhang 等[59]提出一種多導(dǎo)聯(lián)分支融合網(wǎng)絡(luò),用于心律失常的高效檢測(cè),最終在CPSC 2018 數(shù)據(jù)庫上獲得0.855 的F1值。其中,該融合網(wǎng)絡(luò)包括12 個(gè)由CNN、雙向門控遞歸單元(bidirectional gate recurrent unit,BiGRU)和Attention 組成的分支網(wǎng)絡(luò),可學(xué)習(xí)靜態(tài)12 導(dǎo)聯(lián)ECG 多樣性特征。Wang 等[60]搭建了一種用于12 導(dǎo)聯(lián)ECG 心律失常檢測(cè)的深度多尺度融合神經(jīng)網(wǎng)絡(luò)(deep multi-scale fusion convolutional neural network,DMSFNet)模型。DMSFNet 通過集成不同接收域的多個(gè)卷積核來實(shí)現(xiàn)不同大小的信號(hào)段的特征提取,且設(shè)計(jì)了多個(gè)不同尺度損失的聯(lián)合優(yōu)化策略,在學(xué)習(xí)過程中,不僅學(xué)習(xí)尺度特征,還實(shí)現(xiàn)了多尺度互補(bǔ)特征的累積過程。實(shí)驗(yàn)結(jié)果表明,DMSFNet 在CPSC 2018 數(shù)據(jù)庫上取得了0.828 的F1值,但在訓(xùn)練階段獨(dú)立提取每個(gè)導(dǎo)聯(lián)的內(nèi)部特征時(shí)沒有考慮到不同導(dǎo)聯(lián)之間的相關(guān)性。Li 等[61]針對(duì)此問題,搭建了一種基于二維ECG 信號(hào)和分離擠壓模塊的ResNet(ResNet with detached squeeze-and-excitation modules,DSE-ResNet)模型,將原始的靜態(tài)12 導(dǎo)聯(lián)ECG 合并到一個(gè)二維空間中,使得DSE-ResNet 能夠同時(shí)提取靜態(tài)12 導(dǎo)聯(lián)ECG的內(nèi)部特征和導(dǎo)聯(lián)間的相關(guān)性特征,在未公開的CPSC 2018 的測(cè)試集上進(jìn)行心律失常檢測(cè)并獲得了0.817 的F1值。以上結(jié)果表明靜態(tài)12 導(dǎo)聯(lián)ECG 經(jīng)過不同預(yù)處理、特征提取和分類的操作,能得到較好的心律失常檢測(cè)結(jié)果。
隨著時(shí)間和心臟節(jié)律的變化,ECG 信號(hào)也隨之發(fā)生變化,動(dòng)態(tài)ECG 信號(hào)中包含更多形態(tài)節(jié)律,可為心律失常檢測(cè)提供更豐富的信息,更貼近臨床實(shí)踐。Dong 等[62]搭建了多分支信號(hào)融合網(wǎng)絡(luò)(multibranch signal fusion network,MBSF-Net)用于心律失常檢測(cè)。其中,MBSF-Net 通過深度可分離卷積和多重卷積濾波器可有效提取動(dòng)態(tài)12 導(dǎo)聯(lián)ECG 中各導(dǎo)聯(lián)的特征,并引入SPP 層使得輸入的ECG 長(zhǎng)度變得更加靈活,從而實(shí)現(xiàn)對(duì)動(dòng)態(tài)12 導(dǎo)聯(lián)ECG 的自動(dòng)分類,并在CPSC 2018 數(shù)據(jù)庫上獲得了0.838 的F1值。Yao 等[63]考慮到動(dòng)態(tài)12 導(dǎo)聯(lián)ECG 信號(hào)的時(shí)間特性,提出了基于注意力的時(shí)間增量卷積神經(jīng)網(wǎng)絡(luò)(attention-based time-incremental convolutional neural network,ATI-CNN)模型,以實(shí)現(xiàn)動(dòng)態(tài)12 導(dǎo)聯(lián)ECG 的時(shí)間特征和空間特征融合,并用于心律失常檢測(cè)。ATICNN 由全卷積網(wǎng)絡(luò)(fullyconvolutionalnetworks,F(xiàn)CN)、2 個(gè)LSTM 層和Attention 組成。其中,F(xiàn)CN 為輸入數(shù)據(jù)的長(zhǎng)度提供了靈活性,最終在CPSC 2018 數(shù)據(jù)庫上獲得了0.812 的F1值。
從深度學(xué)習(xí)在單導(dǎo)聯(lián)和多導(dǎo)聯(lián)ECG 心律失常檢測(cè)方面的應(yīng)用(見表2、3)可以看出許多學(xué)者根據(jù)ECG 的特性,利用深度學(xué)習(xí)技術(shù)在心律失常檢測(cè)中取得一定的研究成果,但仍存在一些問題制約著計(jì)算機(jī)輔助心律失常檢測(cè)的發(fā)展,具體如下:
表2 MIT-BIH 數(shù)據(jù)庫上現(xiàn)有單導(dǎo)聯(lián)ECG 分類方法對(duì)應(yīng)檢測(cè)性能比較
表3 本文提到的12 導(dǎo)聯(lián)ECG 在心律失常檢測(cè)中的F1 值比較
(1)泛化能力差。不同方面的研究在不同的數(shù)據(jù)庫進(jìn)行,導(dǎo)聯(lián)數(shù)、持續(xù)時(shí)間和采樣參數(shù)各有差異,難以公平地比較。盡管本文提到的深度學(xué)習(xí)在心律失常檢測(cè)上均能達(dá)到較高的準(zhǔn)確率,但由于ECG 數(shù)據(jù)的異質(zhì)性和樣本間的差異,一些模型可能在新的數(shù)據(jù)集上的泛化能力較差,尤其是在醫(yī)療機(jī)構(gòu)的臨床數(shù)據(jù)上表現(xiàn)不佳。因此,可以考慮如何利用遷移學(xué)習(xí)的方式來處理和解決實(shí)際臨床ECG 數(shù)據(jù)問題,將心律失常檢測(cè)模型真正應(yīng)用于臨床實(shí)踐。
(2)可解釋性差。無論對(duì)于單導(dǎo)聯(lián)ECG 還是多導(dǎo)聯(lián)ECG,深度學(xué)習(xí)均可在心律失常檢測(cè)中取得較高的準(zhǔn)確率,但深度學(xué)習(xí)的“黑盒”性使其難以解釋決策的具體原因。在臨床實(shí)踐中,醫(yī)生需要了解深度學(xué)習(xí)算法的決策依據(jù),才能做出正確的診斷。因此,可以考慮利用醫(yī)生或?qū)<业南闰?yàn)知識(shí),將其作為先驗(yàn)分布或約束,幫助改進(jìn)深度學(xué)習(xí)算法的設(shè)計(jì),進(jìn)而提高模型的準(zhǔn)確率和可解釋性。
(3)時(shí)間復(fù)雜度大,耗時(shí)較長(zhǎng)。尤其是12 導(dǎo)聯(lián)ECG 心律失常檢測(cè)中的深度學(xué)習(xí)方法。深度學(xué)習(xí)無法在訓(xùn)練之后通過局部調(diào)整來修改學(xué)習(xí)效果,必須通過重新訓(xùn)練得到結(jié)果。針對(duì)心律失常檢測(cè)的特點(diǎn),可以優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)和損失函數(shù)等設(shè)計(jì),也可以利用并行計(jì)算的技術(shù),進(jìn)而縮短訓(xùn)練時(shí)間,從而有助于提高模型的效率和穩(wěn)定性。
除此之外,專家在手動(dòng)標(biāo)記過程中可能會(huì)出現(xiàn)錯(cuò)誤,還應(yīng)考慮到標(biāo)簽問題,故無監(jiān)督或弱監(jiān)督學(xué)習(xí)也將會(huì)是研究熱點(diǎn)。隨著更多的科研人員加入深入學(xué)習(xí)的隊(duì)伍中,未來在提高模型的泛化能力、增強(qiáng)模型可解釋性和降低時(shí)間成本等方面定會(huì)取得更優(yōu)異的成果,也一定會(huì)有一種健全的心律失常檢測(cè)算法可以滿足更廣泛和更高效的臨床實(shí)踐需求,進(jìn)而大大減輕醫(yī)生負(fù)擔(dān),降低誤診率,提高診斷效率。
心律失常是一種常見的心血管疾病,嚴(yán)重的話可能會(huì)危及生命。隨著人們生活方式的改變和壓力的增加,心律失?;颊叩臄?shù)量逐漸增多。因此,對(duì)于心律失常的早期檢測(cè)和診斷尤為重要。目前,隨著醫(yī)療技術(shù)的不斷進(jìn)步,心律失常檢測(cè)技術(shù)也在不斷完善。盡管深度學(xué)習(xí)在ECG 心律失常檢測(cè)準(zhǔn)確率方面優(yōu)勢(shì)顯著,但仍面臨著一些挑戰(zhàn)和問題。未來,在大數(shù)據(jù)時(shí)代的引領(lǐng)下,隨著各自算法的不斷迭代與更新、數(shù)據(jù)集的增加以及硬件設(shè)備性能的提升,深度學(xué)習(xí)在ECG 心律失常檢測(cè)領(lǐng)域中會(huì)有更廣闊的應(yīng)用前景。