唐建軍 李興秀 華 晶 楊富豪
1(江西農(nóng)業(yè)大學(xué)計(jì)算機(jī)與信息工程學(xué)院 江西 南昌 330045) 2(江西農(nóng)業(yè)大學(xué)軟件學(xué)院 江西 南昌 330045)
世界衛(wèi)生組織公布的數(shù)據(jù)表明:全球有1/3的死亡事例源于心血管疾病,隨著人口老齡化,該比例在不斷上升。對(duì)心電圖(ECG)的分析,可以進(jìn)行生物識(shí)別、活動(dòng)識(shí)別,以及更重要的患者篩查和診斷方面的活動(dòng)[1]。心電圖不僅在各種心律失常和心肌梗死等病癥的檢查、診斷、治療中扮演著重要的角色,在人們?nèi)粘5捏w檢以及醫(yī)療人員的研究中也具有重要意義。對(duì)于心律失常等常見(jiàn)的不健康的心電信號(hào),診斷程序主要依賴于醫(yī)生或臨床技術(shù)人員對(duì)ECG的視覺(jué)檢查。然而,有的異常信號(hào)缺乏特異性,與健康信號(hào)存在的區(qū)別非常小,有專業(yè)領(lǐng)域知識(shí)的醫(yī)生專家不僅需要花費(fèi)長(zhǎng)時(shí)間的觀察來(lái)尋找病因,在可能無(wú)法檢測(cè)到異常的同時(shí)也容易對(duì)心電信號(hào)形態(tài)的識(shí)別出現(xiàn)錯(cuò)誤判斷。
近年來(lái),除了資深醫(yī)生深入研究病因,從心電圖這種生理時(shí)間序列中自動(dòng)檢測(cè)病理或心理狀態(tài)已成為新的研究熱點(diǎn),如KNN[2]、決策樹(shù)、樸素貝葉斯、支持向量機(jī)(SVM)[3]、隱馬爾可夫模型(HMM)[4-5]、人工神經(jīng)網(wǎng)絡(luò)[6]、專家系統(tǒng)混合方法[7]等。SVM和HMM通常與人工選擇的特征一起使用,提取特征的質(zhì)量對(duì)所引用的分類(lèi)/預(yù)測(cè)策略的可靠性和性能及其結(jié)果具有最顯著的影響。然而,基于專家知識(shí)的特征提取技術(shù)是耗時(shí)且容易出錯(cuò)的,并且提取的特征在許多變化方面通常不是魯棒的,例如平移、噪聲、縮放和位移等。此外, ECG信號(hào)特征高度依賴于主體,提取有效特征通常需要深入的領(lǐng)域知識(shí)和專業(yè)知識(shí)。為了自動(dòng)檢測(cè)心電圖中的心律失常,算法必須能夠隱含地識(shí)別不同的波類(lèi)型并且隨著時(shí)間的推移識(shí)別它們之間的復(fù)雜關(guān)系。傳統(tǒng)的時(shí)間序列分類(lèi)方法高度依賴于提取的特征,但是很難提取捕獲時(shí)間序列數(shù)據(jù)的內(nèi)在屬性中正確和關(guān)鍵的信息。深度學(xué)習(xí)算法對(duì)ECG信號(hào)的檢測(cè)一般分為三個(gè)步驟:信號(hào)預(yù)處理,特征學(xué)習(xí)和ECG分類(lèi)。經(jīng)過(guò)訓(xùn)練后的網(wǎng)絡(luò)架構(gòu),能夠快速檢測(cè)到心電信號(hào)的異常并實(shí)現(xiàn)正確分類(lèi)。深度神經(jīng)網(wǎng)絡(luò)的最近應(yīng)用之一是時(shí)間序列分類(lèi)問(wèn)題,專門(mén)處理大量數(shù)據(jù)的時(shí)間序列分類(lèi)問(wèn)題,從而被廣泛用于醫(yī)療保健系統(tǒng)、自然語(yǔ)言處理、生物信息學(xué)、視頻動(dòng)作行為識(shí)別等各種應(yīng)用中。
本文旨在將心電圖分類(lèi)的深度學(xué)習(xí)算法做詳細(xì)的文獻(xiàn)評(píng)述。以前的工作主要探索了能夠提高分類(lèi)精度的算法,如傳統(tǒng)自動(dòng)分類(lèi)算法和各種神經(jīng)網(wǎng)絡(luò)算法。然而本文著重于各種不同模型的性能表現(xiàn),特別是卷積神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短期記憶模型的顯著優(yōu)點(diǎn)。
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)方法能夠模擬生物大腦的功能。ANN模型一般由輸入層、隱藏層和輸出層組成[8],如圖1所示,其中:n表示神經(jīng)元;b表示偏置項(xiàng)。人工神經(jīng)元中的激活函數(shù)充當(dāng)生物神經(jīng)元的核,輸入信息以及各自的權(quán)重分別模擬樹(shù)突和突觸[8],圖2為神經(jīng)元結(jié)構(gòu)。由于人工神經(jīng)網(wǎng)絡(luò)添加了一個(gè)偏置項(xiàng),即其可以平移或偏移,將其用作分類(lèi)器產(chǎn)生的分類(lèi)結(jié)果可能不太準(zhǔn)確。因此,產(chǎn)生了人工神經(jīng)網(wǎng)絡(luò)的擴(kuò)展版——卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)。
圖1 傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型[8]
圖2 神經(jīng)元結(jié)構(gòu)[8]
卷積神經(jīng)網(wǎng)絡(luò)可以確保平移或偏移的不變性,在信號(hào)特征的提取方面具有很好的性能,是近兩年來(lái)使用最多的網(wǎng)絡(luò)結(jié)構(gòu)。卷積神經(jīng)網(wǎng)絡(luò)能夠提供強(qiáng)大的特征向量,得益于其具有的結(jié)構(gòu):卷積層,池化層和完全連接層[8]。
卷積層:輸入樣本與該層的內(nèi)核(權(quán)重)進(jìn)行卷積,其中步幅控制內(nèi)核與輸入樣本卷積的程度。卷積運(yùn)算通過(guò)學(xué)習(xí)各種輸入的信息而充當(dāng)特征提取器。提取的特征用于后續(xù)層中的分類(lèi)或預(yù)測(cè)任務(wù)。
池化層:即下采樣層,采用池化操作可以減少輸入樣本的空間維度,同時(shí)保留重要信息。池化操作可以是最大值池化、均值池化或組合池化,如文獻(xiàn)[9]使用最大池化操作實(shí)現(xiàn)降維和減少特征空間。
完全連接層:表示前一層中的每個(gè)神經(jīng)元都連接到當(dāng)前層中的所有神經(jīng)元上。最后一層中的完全連接的神經(jīng)元的總數(shù)決定了類(lèi)的數(shù)量。神經(jīng)元都是連接的且每個(gè)連接都有一個(gè)特定的權(quán)重。該層建立前一層的所有輸出的加權(quán)和,以確定特定目標(biāo)的輸出。
CNN有助于學(xué)習(xí)數(shù)據(jù)的層次化表示,并且已被證明在分類(lèi)任務(wù)中非常有效。在匯集層中,通過(guò)學(xué)習(xí)這些特征圖來(lái)提供類(lèi)的自動(dòng)預(yù)測(cè),圖3展示了其學(xué)習(xí)過(guò)程。CNN有利于提取樣本內(nèi)部形態(tài)特征,但不擅長(zhǎng)利用節(jié)拍之間的信息。循環(huán)神經(jīng)網(wǎng)絡(luò)不同于前饋網(wǎng)絡(luò),其擅長(zhǎng)利用時(shí)序信息,其網(wǎng)絡(luò)輸出取決于先前的計(jì)算。
圖3 卷積神經(jīng)網(wǎng)絡(luò)
傳統(tǒng)的時(shí)間序列分類(lèi)方法高度依賴于提取的特征,但是難以捕獲時(shí)間序列數(shù)據(jù)固有屬性的所有基本特征和關(guān)鍵特征[10]。循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)與經(jīng)典前饋神經(jīng)元結(jié)構(gòu)之間的運(yùn)作不同, RNN為索引的所有項(xiàng)重復(fù)相同的任務(wù),具體取決于先前的輸出。RNN適合短期依賴性問(wèn)題,但是在處理長(zhǎng)期依賴問(wèn)題方面經(jīng)常遇到梯度消失或梯度爆炸問(wèn)題。引入長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)和門(mén)控復(fù)發(fā)單位可以克服RNN的缺點(diǎn),隱藏層中的每個(gè)傳統(tǒng)節(jié)點(diǎn)都被LSTM細(xì)胞單元替換,同時(shí)也解決了訓(xùn)練期間的梯度消失或梯度爆炸的問(wèn)題。LSTM網(wǎng)絡(luò)是由存儲(chǔ)器塊和細(xì)胞單元,以及它們包含的門(mén)單元組成的特殊結(jié)構(gòu),圖4-圖5顯示了LSTM存儲(chǔ)器塊及細(xì)胞單元內(nèi)部結(jié)構(gòu)[11]。輸入門(mén)控制到細(xì)胞單元的輸入流,輸出門(mén)控制細(xì)胞單元的輸出流到其他LSTM塊。
圖4 LSTM細(xì)胞單元的內(nèi)部結(jié)構(gòu)
圖5 LSTM存儲(chǔ)器塊
遺忘門(mén)由簡(jiǎn)單的單層神經(jīng)網(wǎng)絡(luò)控制。其激活公式如下:
f1=s(W[xt,ht-1,Ct-1]+bf)
(1)
式中:xt是輸入序列;ht-1是前一個(gè)塊輸出;Ct-1是前一個(gè)LSTM塊存儲(chǔ)器;bf是偏置向量;W表示每個(gè)輸入的單獨(dú)權(quán)重向量;s是Sigmoid激活函數(shù)。遺忘門(mén)決定細(xì)胞的歷史狀態(tài)信息有多少允許進(jìn)入當(dāng)前狀態(tài)。
輸入門(mén):作用于細(xì)胞單元狀態(tài),決定哪些新的信息被記錄到當(dāng)前單元狀態(tài)中。輸出門(mén):生成當(dāng)前LSTM單元輸出的部分。
it=s(W[xt,ht-1,Ct-1]+bi)
(2)
Ct=ft·Ct-1+it·tanh(W[xt,ht-1,Ct-1]+bc)
(3)
ot=s(W[xt,ht-1,Ct-1]+bo)
(4)
ht=tanh(Ct)·ot
(5)
除了上述常見(jiàn)的三種神經(jīng)網(wǎng)絡(luò)外,還有基于BP神經(jīng)網(wǎng)絡(luò)的多階分類(lèi)算法[12]、多層神經(jīng)網(wǎng)絡(luò)的徑向基函數(shù)算法(Radial-Basis Function,RBF)[13],以及其他多網(wǎng)絡(luò)架構(gòu)算法。研究表明,通過(guò)使用心電數(shù)據(jù)庫(kù)訓(xùn)練過(guò)的神經(jīng)網(wǎng)絡(luò),在對(duì)未經(jīng)訓(xùn)練的心電信號(hào)分類(lèi)上都有較好的表現(xiàn)。
使用準(zhǔn)確率、靈敏度、特異性、陽(yáng)性預(yù)測(cè)性、F-Score作為評(píng)估指標(biāo),其中:真陽(yáng)性(TP)為正確肯定的數(shù)目;真陰性(TN)為正確被否認(rèn)的非匹配數(shù);假陽(yáng)性(FP)為給出的匹配不正確的數(shù);假陰性(FN)為沒(méi)有找到的匹配數(shù)目。
① 準(zhǔn)確率(Accuracy,Acc):測(cè)量了所有類(lèi)別節(jié)拍的整體系統(tǒng)性能。
(6)
② 靈敏度(Sensitivity,Sen):真陽(yáng)性率,也稱為召回率(Recall),是所有正例事件中被正確分類(lèi)為正例的比率,衡量模型對(duì)正例事件的識(shí)別能力。
(7)
③ 特異性(Specificity,Spe):真陰性率,是所有負(fù)例事件中被正確分類(lèi)為負(fù)例的比率,衡量模型對(duì)負(fù)例事件的分類(lèi)能力。
(8)
④ 陽(yáng)性預(yù)測(cè)性(Positive Predictive Value,PPV):也稱為準(zhǔn)確率(Precision),是在所有檢測(cè)到的事件中正確分類(lèi)的事件的概率。
(9)
⑤ F-Score:綜合考慮陽(yáng)性預(yù)測(cè)性與靈敏度的調(diào)和值。
(10)
(11)
當(dāng)β為1時(shí),稱為F1-Score,此時(shí)表明,準(zhǔn)確率和召回率都很重要,權(quán)重相同。若準(zhǔn)確率更為重要?jiǎng)t調(diào)整β值小于1,召回率更為重要?jiǎng)tβ值大于1。
魯棒性:是指控制系統(tǒng)在一定結(jié)構(gòu)、大小的參數(shù)變動(dòng)下,維持它某些性能的特性。在異常或危險(xiǎn)情況下,該性能是系統(tǒng)生存的關(guān)鍵。
(1) 數(shù)據(jù)集。影響模型性能的關(guān)鍵是一個(gè)大的標(biāo)注數(shù)據(jù)集和一個(gè)深度神經(jīng)網(wǎng)絡(luò),可以映射一系列心電信號(hào)樣本中的心律失常標(biāo)簽。心電信號(hào)獲取方式普遍分為兩種:私有數(shù)據(jù)庫(kù);網(wǎng)上公開(kāi)可下載的數(shù)據(jù)庫(kù),如研究者使用最多的PhysioNet 數(shù)據(jù)庫(kù)和MIT-BIH 數(shù)據(jù)庫(kù)。
PhysioNet[14]是一個(gè)不斷擴(kuò)充、免費(fèi)提供了大量生理信號(hào)及相關(guān)處理工具的資源網(wǎng)站。其中大部分?jǐn)?shù)據(jù)帶有詳盡的標(biāo)簽信息,數(shù)據(jù)來(lái)源于正常人及常見(jiàn)多發(fā)病種的病人,如心臟猝死、心力衰竭、心律失常等。其擁有50個(gè)心電信號(hào)的數(shù)據(jù)庫(kù),共10 000個(gè)心電信號(hào)數(shù)據(jù)。另外PhysioNet/Computing in Cardiology Challenge 2017(CinC17)[15]在研究者中使用也較為廣泛,共包含8 528個(gè)心電信號(hào)用于公共訓(xùn)練和3 658個(gè)私人ECG記錄用于測(cè)試。
MIT-BIH數(shù)據(jù)庫(kù)[16]是國(guó)際上公認(rèn)的可作為標(biāo)準(zhǔn)的心電數(shù)據(jù)庫(kù)之一,在文獻(xiàn)中應(yīng)用最為廣泛。其包含48條記錄,每條記錄包含半小時(shí)的通道持續(xù)時(shí)間的雙通道ECG信號(hào)。信號(hào)選自47個(gè)受試者,進(jìn)行24小時(shí)記錄連續(xù)ECG信號(hào),并以0.1~100 Hz進(jìn)行帶通濾波,然后以360 Hz數(shù)字化。該數(shù)據(jù)庫(kù)的一個(gè)心電記錄包含3個(gè)文件,分別是頭文件、數(shù)據(jù)文件,以及由獨(dú)立專家驗(yàn)證的時(shí)序信息和節(jié)拍類(lèi)信息的注釋文件。標(biāo)注的數(shù)據(jù)是按每個(gè)心電圖周期進(jìn)行標(biāo)記的,即對(duì)每個(gè)周期的P-QRS-T波形都進(jìn)行了標(biāo)注,部分信號(hào)類(lèi)型記錄及節(jié)拍數(shù)量見(jiàn)表1。
表1 MIT-BIH數(shù)據(jù)庫(kù)每種心電節(jié)拍的數(shù)量
除以上數(shù)據(jù)集,中國(guó)心血管疾病數(shù)據(jù)庫(kù)(Chinese Cardiovascular Disease Database,CCDD)[17]被構(gòu)造用來(lái)研究面向臨床的ECG分析算法,其中的數(shù)據(jù)全部來(lái)自臨床,目前包含近18萬(wàn)條12導(dǎo)聯(lián)心電圖記錄,采樣率為500 Hz,所有記錄都有完整的診斷結(jié)論[18]。目前,國(guó)內(nèi)部分學(xué)者使用該數(shù)據(jù)庫(kù)進(jìn)行實(shí)驗(yàn),以使網(wǎng)絡(luò)架構(gòu)更具有適用性。
除了網(wǎng)絡(luò)上可用的數(shù)據(jù)庫(kù)外,有一些研究工作者使用建模方法,即使用ECG模擬器構(gòu)建合成數(shù)據(jù)集,模擬器可以根據(jù)設(shè)置不同的參數(shù)模擬合成不同類(lèi)型的ECG信號(hào),通過(guò)模擬合成大量的ECG信號(hào)進(jìn)行實(shí)驗(yàn),可以評(píng)估其提出的網(wǎng)絡(luò)模型的性能表現(xiàn),然后再使用公共數(shù)據(jù)庫(kù)進(jìn)行驗(yàn)證或在現(xiàn)實(shí)的臨床數(shù)據(jù)上評(píng)估其性能[19]。同時(shí),由于數(shù)據(jù)不夠,為滿足網(wǎng)絡(luò)訓(xùn)練的需要,通過(guò)增強(qiáng)數(shù)據(jù)而不會(huì)導(dǎo)致過(guò)度擬合,還利用神經(jīng)網(wǎng)絡(luò)生成心電信息,以滿足研究中數(shù)據(jù)缺乏的問(wèn)題。
(2) 數(shù)據(jù)處理。ECG信號(hào)預(yù)處理包括消除噪聲、基線漂移和增強(qiáng)數(shù)據(jù)等。消除噪聲主要有濾波器組、均值濾波、Butterworth濾波、小波變換[20]等。使用均值濾波時(shí),由于增加了平滑點(diǎn),導(dǎo)致其幅度下降,故而需要采用補(bǔ)償方法將波信號(hào)的幅值補(bǔ)償?shù)皆瓉?lái)數(shù)值。文獻(xiàn)[21]中指出,Butterworth濾波在幅度上會(huì)下降還會(huì)在波信號(hào)上發(fā)生形變,導(dǎo)致信號(hào)在一定程度上失真。經(jīng)驗(yàn)?zāi)B(tài)分解算法(EMD)是近年來(lái)信號(hào)處理技術(shù)的一個(gè)新熱點(diǎn),其可以將給定的數(shù)據(jù)分解為本質(zhì)模態(tài)函數(shù)(IMF),使得隱藏信息暴露,更便于處理[22]。Ji等[23]使用經(jīng)驗(yàn)分解算法將ECG信號(hào)分解成10個(gè)本質(zhì)模態(tài)函數(shù)(IMF),通過(guò)小波變換算法將高頻的IMF1和IMF2進(jìn)行去噪,通過(guò)中值濾波算法消除低頻的IMF9和IMF10的基線漂移,之后對(duì)處理過(guò)的IMF模式和剩余的未處理的IMF模式進(jìn)行重構(gòu)以獲得平滑且無(wú)噪聲的ECG信號(hào)。另外,數(shù)據(jù)增強(qiáng)可以充當(dāng)正則化方法以防止神經(jīng)網(wǎng)絡(luò)過(guò)度擬合,并改善具有不平衡類(lèi)頻率的問(wèn)題的分類(lèi)性能[24]。
在對(duì)信號(hào)經(jīng)過(guò)一定的處理后,對(duì)輸入到神經(jīng)網(wǎng)絡(luò)中的信息還需要進(jìn)一步處理。心電圖分類(lèi)的一個(gè)重要基礎(chǔ)是檢測(cè)R波峰,因此定位心跳節(jié)拍,心跳周期如圖6所示(心臟電活動(dòng)的去極化表現(xiàn)為心電圖上的P波和QRS波,心臟電活動(dòng)的復(fù)極化表現(xiàn)為心電圖上的T波,其中PR、ST分別表示心電圖上的P-R段和S-T段)。用于R峰提取的當(dāng)前算法傾向于使用小波變換計(jì)算來(lái)自原始ECG信號(hào)的特征,其次是基于精細(xì)調(diào)節(jié)的閾值分類(lèi)器。根據(jù)小波理論,R波峰值點(diǎn)對(duì)應(yīng)于模極大值的過(guò)零點(diǎn)。通過(guò)檢測(cè)R波的模極大值的位置來(lái)定位R波峰值位置,然后根據(jù)R峰值位置向前和向后搜索QRS波的起點(diǎn)和終點(diǎn)。此外,離散小波變換結(jié)合自適應(yīng)閾值去噪方法檢測(cè)心電信號(hào)的R波。檢測(cè)模數(shù)最大值和過(guò)零點(diǎn)以找到QRS波的位置,然后使用自適應(yīng)噪聲閾值方法來(lái)判斷檢測(cè)的峰值是R波還是毛刺。
圖6 心跳周期示意圖
特征提取即根據(jù)信號(hào)特征從波形信號(hào)提取重要特征,分類(lèi)器性能最重要的組成部分之一是輸入數(shù)據(jù)的特征。被用于分類(lèi)的特征可以分為手工提取的特征和神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)得到的特征?;谛〔ㄗ儞Q(通過(guò)小波變換和數(shù)字形態(tài)學(xué)相結(jié)合)提取的特征常常和支持向量機(jī)、KNN等特定的分類(lèi)器同時(shí)使用。Kumar等[25]使用最小平方支持向量機(jī)分類(lèi)器,對(duì)來(lái)自小波變換獲得的特征進(jìn)行分類(lèi),準(zhǔn)確度、敏感度和特異性都達(dá)到了99.5%以上。Oh等[26]分解ECG信號(hào)提取重要的特征,輸入到K最近鄰分類(lèi),獲得的性能超過(guò)了Kumar等的表現(xiàn)。另外,主成分分析、高階統(tǒng)計(jì)、獨(dú)立分量分析和Lyapunov指數(shù)(LE)[27]等方法也常用于對(duì)ECG信號(hào)的提取,表2為部分使用傳統(tǒng)自動(dòng)分類(lèi)算法的信息。
表2 傳統(tǒng)自動(dòng)分類(lèi)算法
將分段信號(hào)直接用于分類(lèi)器執(zhí)行在性能上表現(xiàn)得不是很好,在深度學(xué)習(xí)領(lǐng)域,特征提取和分類(lèi)階段在一個(gè)網(wǎng)絡(luò)中循環(huán)執(zhí)行,以使網(wǎng)絡(luò)學(xué)習(xí)提取特征并學(xué)會(huì)分類(lèi)。用于網(wǎng)絡(luò)中的經(jīng)過(guò)預(yù)處理之后的信號(hào),有兩種方式作為輸入信息:第一種是將分割后的節(jié)拍信息輸入到網(wǎng)絡(luò)中;第二種是將其轉(zhuǎn)換為時(shí)頻域進(jìn)行特征的提取,能夠?qū)崿F(xiàn)更好的分類(lèi)精度。在關(guān)于人工神經(jīng)網(wǎng)絡(luò)的相關(guān)文獻(xiàn)中,Sánchez等[28]開(kāi)發(fā)并評(píng)估了兩種用于心律失常(Atrial Fibrillation,AF)信號(hào)分類(lèi)的神經(jīng)網(wǎng)絡(luò)架構(gòu)。一種是傳統(tǒng)的前饋神經(jīng)網(wǎng)絡(luò)(Feedforward Neural Network,F(xiàn)NN)輸入時(shí)間序列格式的ECG信號(hào),另一種是將歸一化的ECG信號(hào)經(jīng)過(guò)GASF變換之后的圖像輸入卷積神經(jīng)網(wǎng)絡(luò)。實(shí)驗(yàn)結(jié)果表明,前饋神經(jīng)網(wǎng)絡(luò)中的平均準(zhǔn)確度為86.4%,與卷積神經(jīng)網(wǎng)絡(luò)的平均精度97.6%相差較遠(yuǎn)。作者認(rèn)為其原因是將信號(hào)轉(zhuǎn)換為圖像之后放大了信號(hào)的特征,更容易檢測(cè)到異常。另外,Jun等[29]使用GASF變換將Q波峰值切片變換成二維灰度圖像,獲得了99.05%的準(zhǔn)確度。
深度學(xué)習(xí)方法中,與LSTM相比,CNN具有更快的計(jì)算時(shí)間和更少的復(fù)雜性,由此常使用卷積神經(jīng)網(wǎng)絡(luò)中的卷積層和最大池化層來(lái)提取節(jié)段中的重要信息,使用循環(huán)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)節(jié)拍時(shí)序上的信息,最后通過(guò)一個(gè)完全連接層(該層常使用Softmax激活函數(shù))進(jìn)行分類(lèi)。Logistic回歸類(lèi)標(biāo)簽取值通常為0或1,Softmax回歸是在Logistic回歸上的擴(kuò)展??筛鶕?jù)提取到的不同特征,設(shè)計(jì)相對(duì)應(yīng)的類(lèi)標(biāo)簽[30]。在對(duì)CNN與LSTM的混合模型文獻(xiàn)解讀中,CNN常用作特征提取器,LSTM網(wǎng)絡(luò)用作順序?qū)W習(xí),之后使用完全連接層進(jìn)行分類(lèi)[31]。
在對(duì)網(wǎng)絡(luò)模型訓(xùn)練中,通常使用Adam優(yōu)化器和分類(lèi)交叉熵函數(shù)來(lái)優(yōu)化參數(shù)。優(yōu)化訓(xùn)練結(jié)果的方法有:
(1) 添加Dropout層。網(wǎng)絡(luò)中通常會(huì)添加一個(gè)Dropout層,可以有效防止由于參數(shù)膨脹引起的緩慢梯度下降。Dropout是一種正則化技術(shù)[32],旨在訓(xùn)練過(guò)程中,網(wǎng)絡(luò)節(jié)點(diǎn)以指定的速率隨機(jī)丟棄,通過(guò)概率地減少同一層的節(jié)點(diǎn)來(lái)減少層之間的依賴性即通過(guò)防止單元彼此過(guò)于順從而顯著減少過(guò)度擬合。文獻(xiàn)[33]通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),與丟棄 20%的LSTM循環(huán)連接和輸入連接的單元(方案A)相比,丟棄20%的LSTM循環(huán)連接和隨后的匯集層的單元(方案B)的模型具有更好的泛化能力。
(2) 使用非線性激活函數(shù):ReLU,Softmax函數(shù)。Nair等[34]實(shí)驗(yàn)表明使用ReLU可以更快地收斂并提高精度。ReLU函數(shù)表示為:f(x)=max(x,0)。
(3) 目標(biāo)復(fù)制和輔助輸出。文獻(xiàn)[35]的實(shí)驗(yàn)表明,目標(biāo)復(fù)制[36]和輔助輸出都可提高性能并減少過(guò)度擬合。目標(biāo)復(fù)制即為在每個(gè)時(shí)間步復(fù)制目標(biāo)使得整個(gè)序列的分類(lèi)任務(wù)更容易,目標(biāo)復(fù)制不僅僅是正則化,而是通過(guò)提高本地目標(biāo)來(lái)減少對(duì)遠(yuǎn)程依賴的程度。輔助輸出不及目標(biāo)復(fù)制所帶來(lái)的性能提升顯著,但是其正則化效果更大,原因在于其以緩慢的訓(xùn)練為代價(jià)。
(4) 批量標(biāo)準(zhǔn)化(Batch Normalization)。批量標(biāo)準(zhǔn)化的位置通常在激活函數(shù)之前和卷積層之后應(yīng)用。而根據(jù)文獻(xiàn)[29]的經(jīng)驗(yàn),在有些情況下激活功能之后放置標(biāo)準(zhǔn)化層有利于心電圖心律失常分類(lèi)。
(5) 改變訓(xùn)練集和驗(yàn)證集的比例。驗(yàn)證集用于確定模型是否已達(dá)到給定訓(xùn)練集的足夠精度。如果沒(méi)有驗(yàn)證程序,模型可能會(huì)過(guò)度擬合。當(dāng)訓(xùn)練集和驗(yàn)證集的比例發(fā)生改變時(shí),可以改變模型的性能。驗(yàn)證數(shù)據(jù)集用于調(diào)整參數(shù)并確定設(shè)計(jì)模型的最佳單元數(shù)。
文獻(xiàn)[19]與利用人工選擇的特征或從原始信號(hào)域?qū)W習(xí)特征的傳統(tǒng)方法不同,Zhang等提出了基于深度卷積神經(jīng)網(wǎng)絡(luò)的方法(DCNN),使用傅里葉變換將ECG信號(hào)變換到時(shí)頻域后,設(shè)計(jì)了一個(gè)涉及二維卷積的深度CNN架構(gòu)。其架構(gòu)針對(duì)特定長(zhǎng)度的ECG樣本訓(xùn)練特定的DCNN,以端到端的方式從時(shí)域?qū)W習(xí)ECG波信號(hào)的特征并進(jìn)行分類(lèi)。其將ECG信號(hào)變換為二維頻譜圖作為輸入,從頻譜圖中可以得到信號(hào)的時(shí)頻特征,有更好的分類(lèi)精度。但是其無(wú)法學(xué)習(xí)過(guò)去的決策和特征,導(dǎo)致其分類(lèi)上需要更精細(xì)的可視化分類(lèi),否則有些聚類(lèi)會(huì)與其他類(lèi)混合,影響分類(lèi)結(jié)果。李端等[45]將ECG信號(hào)經(jīng)過(guò)小波自適應(yīng)閾值去噪算法之后,使用20層深度殘余卷積網(wǎng)絡(luò)對(duì)5種心電圖異常進(jìn)行分類(lèi),分類(lèi)準(zhǔn)確度達(dá)到了99%以上。文獻(xiàn)[46]提出了具有塊結(jié)構(gòu)的10層深度卷積神經(jīng)網(wǎng)絡(luò)模型,對(duì)所有ECG導(dǎo)聯(lián)信號(hào)單獨(dú)訓(xùn)練和驗(yàn)證。該模型在檢測(cè)心肌梗死(Myocardial Infarction)上產(chǎn)生了超過(guò)99%的準(zhǔn)確度和靈敏度性能,適用于可穿戴設(shè)備和重癥監(jiān)護(hù)病房。Fan等[47]將DCNN結(jié)合多尺度融合技術(shù)用于單導(dǎo)聯(lián)短ECG信號(hào),以此篩查心房顫動(dòng)。
Acharya等[48]提出了一個(gè)11層CNN網(wǎng)絡(luò)模型,該模型不需要去噪及R峰檢測(cè)。Teplitzky等[31]使用12層CNN模型用于移動(dòng)遙測(cè)全自動(dòng)心室異位搏動(dòng)的分類(lèi),其特異性和敏感性達(dá)到了99%。文獻(xiàn)[49]搭建了34層的卷積神經(jīng)網(wǎng)絡(luò),將29 163個(gè)心電樣本映射到12種類(lèi)型分類(lèi)中,其性能超越了專家的診斷。文獻(xiàn)[10]將CNN應(yīng)用于ECG的特征學(xué)習(xí)機(jī)制上,用于篩查患者的信號(hào),其學(xué)習(xí)機(jī)制能夠生成具有魯棒性的特征而無(wú)需專業(yè)領(lǐng)域知識(shí)和特征選擇算法。同時(shí),該文獻(xiàn)將CNN與其他標(biāo)準(zhǔn)分類(lèi)器集成,即K-近鄰、SVM和多層感知器(MLP)網(wǎng)絡(luò)進(jìn)行比較。實(shí)驗(yàn)結(jié)果得出CNN在端到端上的性能優(yōu)于CNN與其他分類(lèi)器集成所達(dá)到的性能。在早期,Kiranyaz等[50]使用平移不變的二元小波變換來(lái)提取形態(tài)特征,為避免維度災(zāi)難現(xiàn)象,使用主成分分析方法進(jìn)一步減少高維數(shù)據(jù)空間的冗余信息,其網(wǎng)絡(luò)在MIT-BIH數(shù)據(jù)庫(kù)上實(shí)現(xiàn)了99%的準(zhǔn)確度。表3為近三年使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行心電圖分類(lèi)的文獻(xiàn)總結(jié)。
表3 基于卷積神經(jīng)網(wǎng)絡(luò)的心電圖異常分類(lèi)
Saadatnejad等[53]首先將輸入的數(shù)字化心電樣本分割成心跳,提取RR間隔和小波特征,然后將心電信號(hào)和特征輸入到兩個(gè)基于RNN的模型中,對(duì)每個(gè)心跳分類(lèi),然后將兩個(gè)輸出混合到MLP中形成對(duì)每一個(gè)心跳的最終分類(lèi)。該算法是輕量級(jí)的,可用于連續(xù)監(jiān)測(cè)心電分類(lèi)的個(gè)人可穿戴設(shè)備中。文獻(xiàn)[11]提出了深度雙向LSTM的網(wǎng)絡(luò)模型,其通過(guò)對(duì)ECG信號(hào)分類(lèi)時(shí)組成每個(gè)ECG搏動(dòng)的特征向量和Lyapunov指數(shù)并輸入到循環(huán)神經(jīng)網(wǎng)絡(luò)分類(lèi)器進(jìn)行分類(lèi)。文獻(xiàn)[54]用于ECG分類(lèi)的RNN方法,使用人工選擇特征和RNN網(wǎng)絡(luò)作為分類(lèi)器,核心思想是:從ECG記錄中的心跳序列中提取多種特征,用作RNN聚合的輸入特征,使用Softmax輸出層的多層感知器將各個(gè)模型的預(yù)測(cè)混合到每類(lèi)分類(lèi)的F1分?jǐn)?shù)中。RNN訓(xùn)練識(shí)別其他心律失常主要集中在心律的突然延長(zhǎng)的停頓上,以確定該記錄最可能是其他心律失常。表4記錄了使用循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行心電圖分類(lèi)的文獻(xiàn)。
表4 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的心電圖異常分類(lèi)
與文獻(xiàn)[22]類(lèi)似,文獻(xiàn)[55]提出的雙向LSTM和CNN展現(xiàn)的功能不同。其根據(jù)CNN有利于提取內(nèi)部形態(tài)特征但不利于節(jié)拍之間信息的特點(diǎn),將ECG搏動(dòng)的形態(tài)特征用CNN提取,然后通過(guò)雙向LSTM考慮每個(gè)節(jié)拍的特征,最后通過(guò)完全連接層進(jìn)行分類(lèi)。文獻(xiàn)[56]應(yīng)用了疊加CNN和LSTM網(wǎng)絡(luò)用于CAD心電信號(hào)分類(lèi),獲得了99.85%的準(zhǔn)確度,但其局限于少量數(shù)據(jù)的高準(zhǔn)確度。文獻(xiàn)[33]使用七層CNN獲得特征映射,隨后使用LSTM從特征圖中提取時(shí)間信息,最后通過(guò)完全連接層進(jìn)行心律失常分類(lèi),其沒(méi)有消除噪音而獲得了98.1%的分類(lèi)精度。由于CNN具有提取局部光譜和空間/時(shí)間變化不變的特征的能力,文獻(xiàn)[24]提出了兩種架構(gòu)進(jìn)行比較,其中:第一種架構(gòu)為24層的CNN,使用線性分類(lèi)器循環(huán)訓(xùn)練;第二種架構(gòu)是用24層CNN和3層LSTM訓(xùn)練。得出數(shù)據(jù)增強(qiáng)時(shí),CRNN產(chǎn)生了比CNN更高的總體準(zhǔn)確度。表5為部分使用多網(wǎng)絡(luò)架構(gòu)進(jìn)行心電圖分類(lèi)的文獻(xiàn)總結(jié)。
表5 基于多網(wǎng)絡(luò)架構(gòu)的心電圖異常分類(lèi)
通過(guò)神經(jīng)網(wǎng)絡(luò)診斷心電圖的諸多研究中,使用最多的是將卷積神經(jīng)網(wǎng)絡(luò)作為特征提取器,將長(zhǎng)短期記憶模型用于學(xué)習(xí)心率節(jié)拍信息。大部分經(jīng)過(guò)訓(xùn)練的網(wǎng)絡(luò)都已經(jīng)表現(xiàn)出了很好的性能,其中許多研究的精度和特異性都超過(guò)了99%,甚至針對(duì)特定的心電異常信號(hào)其精度能達(dá)到100%,超過(guò)了人類(lèi)醫(yī)生的診斷能力。雖然基于神經(jīng)網(wǎng)絡(luò)的心電圖分類(lèi)進(jìn)展已經(jīng)發(fā)展得較好,但是也存在一些問(wèn)題需要進(jìn)一步研究解決:(1) 心電信號(hào)預(yù)處理方面,對(duì)是否需要處理存在一定的爭(zhēng)論,比如有的研究表明未處理的信號(hào)因?yàn)樵肼暤却嬖谝欢ǖ氖д?,而有的研究表明,通過(guò)小波變換等處理后的信號(hào)特征會(huì)有缺失,不能很好地還原原始信號(hào)。(2) 有的網(wǎng)絡(luò)模型的表現(xiàn)僅限于部分心電信號(hào)異常分類(lèi),其用于訓(xùn)練和驗(yàn)證的數(shù)據(jù)集非常專一,沒(méi)有結(jié)合臨床數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò)而不具備泛化能力。(3) 有的網(wǎng)絡(luò)雖然能夠達(dá)到很好的性能,如文獻(xiàn)[51]的預(yù)測(cè)精度已經(jīng)超過(guò)了專家評(píng)估,但未給出算法的計(jì)算效率。(4) 雖然有的網(wǎng)絡(luò)其性能已經(jīng)達(dá)到非常高的水平,但是目前為止還不能完全替代醫(yī)生用于實(shí)際操作,進(jìn)一步的確定仍需醫(yī)生的專業(yè)領(lǐng)域知識(shí)。
本文對(duì)神經(jīng)網(wǎng)絡(luò)在心電圖分類(lèi)的應(yīng)用進(jìn)行了全面回顧,重點(diǎn)關(guān)注了網(wǎng)絡(luò)架構(gòu),特別是對(duì)不同類(lèi)型的神經(jīng)網(wǎng)絡(luò)進(jìn)行了分類(lèi)研究。給出了神經(jīng)網(wǎng)絡(luò)算法和心電檢測(cè)步驟的介紹,并對(duì)網(wǎng)絡(luò)應(yīng)用于分類(lèi)中的性能指標(biāo)進(jìn)行了回顧。研究表明,使用深度學(xué)習(xí)進(jìn)行自動(dòng)分類(lèi)的性能已經(jīng)達(dá)到了比較高的水平,如準(zhǔn)確度和特異性都超過(guò)了99%。就其表現(xiàn)而言,可替代傳統(tǒng)的手工提取的特征與特定自動(dòng)分類(lèi)器結(jié)合方法。但是,只考慮準(zhǔn)確度等指標(biāo)還遠(yuǎn)遠(yuǎn)不足以支持其在臨床上得以應(yīng)用,在未來(lái)需要考慮的是優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)以減少計(jì)算或者增強(qiáng)其泛化能力。隨著輕便式可穿戴醫(yī)療保健系統(tǒng)的發(fā)展,平臺(tái)化、用戶可操作性、簡(jiǎn)約化是未來(lái)研究中應(yīng)考慮的問(wèn)題。國(guó)外已經(jīng)有研究者在開(kāi)展平臺(tái)化研究,文獻(xiàn)[60]設(shè)計(jì)了自動(dòng)檢測(cè)心律失常的系統(tǒng)和Android健康云平臺(tái)。 本文提出一個(gè)新的方法:即將文獻(xiàn)[61]對(duì)心電信號(hào)不進(jìn)行預(yù)處理直接用于訓(xùn)練,不破壞信號(hào)特征的思想,結(jié)合文獻(xiàn)[57]的網(wǎng)絡(luò)架構(gòu),可建立一個(gè)具有強(qiáng)泛化能力并滿足準(zhǔn)確度的網(wǎng)絡(luò)架構(gòu)。未來(lái),在應(yīng)用深度學(xué)習(xí)可以接近資深醫(yī)生的診斷能力之前,仍有許多工作在等待解決。