吳義滿 徐瑤瑞
1(江蘇醫(yī)藥職業(yè)學(xué)院醫(yī)學(xué)影像學(xué)院 江蘇 鹽城 224000)2(鹽城市第一人民醫(yī)院設(shè)備科 江蘇 鹽城 224000)
室性早搏是一種心律失?,F(xiàn)象,是由心室中的異位起搏點過早發(fā)出電沖動引起的,危害性較大。因此,及時準確地診斷室性早搏對于臨床治療具有重要意義。傳統(tǒng)的室性早搏識別主要是通過特征分析與分類器進行識別,即人為地設(shè)計并提取QRS波寬、波峰間隔和心電周期等諸多參數(shù),僅為室性早搏的信號外部形態(tài)特征,特征分析易產(chǎn)生較大偏差而導(dǎo)致分類失敗[1]。
近年來,深度學(xué)習(xí)理論深入發(fā)展,為信號處理領(lǐng)域的特征分析提供了有效的理論和方法。深度神經(jīng)網(wǎng)絡(luò)的自適應(yīng)特征提取能力受到了廣泛的關(guān)注與研究,在很多信號處理任務(wù)中取得了優(yōu)良的效果,遠遠超過了人工特征處理方法[2]。卷積神經(jīng)網(wǎng)絡(luò)是一種被廣泛應(yīng)用的深度神經(jīng)網(wǎng)絡(luò),通常用于圖像處理任務(wù),且所挖掘的特征對圖像平移、旋轉(zhuǎn)和縮放等操作具有魯棒性[3]。Kiranyaz等通過采用卷積神經(jīng)網(wǎng)絡(luò)方法來構(gòu)建特征心電分類,在MIT-BIH心電數(shù)據(jù)庫的室上性異位與室性異位心拍心拍識別中取得了良好的識別率[4]。文獻[5]首先通過多層一維卷積神經(jīng)網(wǎng)絡(luò)來提取心電信號特征,然后采用SoftMax分類器進行分類,使MIT-BIH心電數(shù)據(jù)庫的心拍分類性能得到了提高,但識別率與靈敏度不夠理想。文獻[6]提出了一種并行多通道的卷積神經(jīng)網(wǎng)絡(luò)分類結(jié)構(gòu),在BIDMC數(shù)據(jù)集上的檢測準確率達到94.65%。上述研究將一維心電時域數(shù)據(jù)進行處理,由于卷積神經(jīng)網(wǎng)絡(luò)的全鏈接層要求在訓(xùn)練時輸入的心電數(shù)據(jù)為固定長度,病理特征在時域上往往隨機出現(xiàn),截取的數(shù)據(jù)經(jīng)常發(fā)生有效信息丟失。而且由于心電信號極其微弱,在采集過程中容易受到干擾,造成特征信息發(fā)生變形,一維時域序列的直接輸入處理使CNN魯棒性較差[7]。此外,深度學(xué)習(xí)算法對訓(xùn)練樣本數(shù)據(jù)量要求比較高,一般數(shù)十萬級別的樣本量才能使深度學(xué)習(xí)模型獲得良好的性能。實際中的室性早搏檢測,其訓(xùn)練數(shù)據(jù)往往較少,卷積神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時往往過擬合造成性能急劇下降,即泛化能力差[8]。
本文提出了一種改進的卷積神經(jīng)網(wǎng)絡(luò)室性早搏檢測算法。該算法模型首先通過經(jīng)驗小波變換實現(xiàn)了心電信號的自適應(yīng)分解進而得到時頻二維數(shù)據(jù),分析了室性早搏與正常心電信號的差異性,并以此取代傳統(tǒng)一維數(shù)據(jù)作為網(wǎng)絡(luò)訓(xùn)練輸入,避免了心電信號的信息損失問題。然后利用二維卷積神經(jīng)網(wǎng)絡(luò)進行心電信號的特征自適應(yīng)提取,且在網(wǎng)絡(luò)代價函數(shù)中引入布雷格曼散度以解決傳統(tǒng)交叉熵代價函數(shù)在小樣本訓(xùn)練時的性能下降問題。最后該算法在心電數(shù)據(jù)庫MIT-BIH上進行了訓(xùn)練,并對該算法進行了性能評估。
經(jīng)驗小波變換的優(yōu)勢在于:解決了傳統(tǒng)模態(tài)分解存在的模態(tài)混疊問題,以達到信號分解過程更具魯棒性。理論基礎(chǔ)是自適應(yīng)模態(tài)分解與小波分析理論[9]。經(jīng)驗小波變換表達式表示為:
(1)
式中:固有模態(tài)函數(shù)為調(diào)幅調(diào)頻信號,即為:
fk(t)=Fk(t)cos(φk(t))
(2)
式中:Fk(t)>0,φk(t)>0。該變換實質(zhì)上是自適應(yīng)地把信號分解成多個本征模態(tài)函數(shù)的組合和形式。
從MIT-BIH心電數(shù)據(jù)庫中的選取部分室性早搏心拍數(shù)據(jù)去除基線漂移和高頻噪聲等簡單預(yù)處理得到室性早搏心拍時域波形,如圖1所示。心電周期中的波形狀態(tài)和間期時間表征著心臟的各種生理狀況,若心臟發(fā)生病變或受到某些刺激都會使心電信號發(fā)生相應(yīng)的變化[10]。典型的室性早搏心電特征有:① QRS波群提前出現(xiàn),導(dǎo)致波形形態(tài)變化;② QRS波群間期T常大于0.12 s[11]。
圖1 室性早搏心拍時域波形
對室性早搏心拍時域數(shù)據(jù)進行EWT分解,可得到一系列子分量信號如圖2所示,依次從低頻向高頻的順序顯示。
圖2 室性早搏心拍EWT分解結(jié)果
對運用經(jīng)驗小波變換方法分解得到的心拍子分量信號進行Hilbert變換,可以得到子分量Hilbert譜數(shù)據(jù):瞬時頻率和幅度函數(shù)。對所有心拍子分量信號的Hilbert譜數(shù)據(jù)進行相加,就得到通過經(jīng)驗小波變換得到的時頻譜數(shù)據(jù)。圖3和圖4分別為室性早搏心拍與正常心拍EWT時頻譜,時頻譜中表達了豐富的時頻特征變化信息。心拍信號的瞬時頻率實質(zhì)上是由心室原始振動頻率決定[12]。因此,若將EWT時頻二維數(shù)據(jù)作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,可以進一步自適應(yīng)地挖掘出心臟的振動特征變化參數(shù)。而且,二維數(shù)據(jù)類似于圖像,可在不丟失時頻信息的情況下對其進行縮放以滿足卷積神經(jīng)網(wǎng)絡(luò)的輸入大小,避免了一維數(shù)據(jù)截取時的信息損失問題。
圖3 室性早搏心拍通過EWT變換后的時頻譜
圖4 正常心拍通過EWT變換后時頻譜
卷積神經(jīng)網(wǎng)絡(luò)的由三個部分構(gòu)成:輸入層、中間層及輸出層。其中,中間層由卷積層、池化層、全連接層構(gòu)成。卷積層通過卷積運算得到輸入數(shù)據(jù)的不同特征。在一定范圍內(nèi),卷積層數(shù)越多,則能夠獲得更為抽象的深度特征表達。但過度增加卷積層數(shù)也會降低網(wǎng)絡(luò)準確性,造成特征表達性能飽和甚至下降[13]。
池化層主要實現(xiàn)特征降維,減小過擬合,同時提高模型的容錯性。池化操作是神經(jīng)元針對局部接受域進行的,常用的池化方法有均值池化、最大池化、隨機池化等[14]。
卷積層與池化層的運算過程如圖5所示。卷積層首先對輸入數(shù)據(jù)進行卷積運算,再經(jīng)過加入偏置部分得到輸出。池化層的采樣過程: ① 使用對應(yīng)區(qū)域位置內(nèi)數(shù)據(jù)的最大值或平均值等降采樣得到對應(yīng)的數(shù)據(jù)。② 通過加權(quán),再加上偏置部分。③ 利用激活函數(shù)得到降采樣后的數(shù)據(jù)特征。而取樣層類似于二次特征提取,去除特征冗余維度的同時增加了特征魯棒性。
卷積神經(jīng)網(wǎng)絡(luò)所提取的特征數(shù)據(jù)經(jīng)全連接層后,一般是利用Softmax函數(shù)結(jié)合交叉熵代價函數(shù)進行有監(jiān)督分類識別。在這個過程中涉及到:① 訓(xùn)練的方法:反向傳播算法。② 調(diào)整的對象:訓(xùn)練過程中不斷的調(diào)整優(yōu)化網(wǎng)絡(luò)權(quán)重參數(shù)。調(diào)整參數(shù)的依據(jù)為每次迭代訓(xùn)練更新權(quán)值時,調(diào)整網(wǎng)絡(luò)各層的參數(shù)使訓(xùn)練輸出值和輸入標(biāo)簽誤差盡量小。③ 訓(xùn)練的目的:減小類內(nèi)距離并盡可能地增加類間距離,使模型能夠有效獲取區(qū)別能力更強地特征量,較好地實現(xiàn)后期樣本的分類識別。
圖5 卷積與取樣過程示意圖
設(shè)卷積神經(jīng)網(wǎng)絡(luò)的心電信號樣本集為:
{(x1,y1),(x2,y2),…,(xm,ym)}
其類別為正常心電信號和室性早搏心電信號。其中,y表示樣本信號,x表示類別標(biāo)簽,則其基本代價函數(shù)為:
(3)
式中:W為卷積神經(jīng)網(wǎng)絡(luò)的各層權(quán)值參量,b為網(wǎng)絡(luò)偏置項,hW,b(xi)為卷積神經(jīng)網(wǎng)絡(luò)的輸出預(yù)測值。網(wǎng)絡(luò)的訓(xùn)練過程即利用隨機梯度下降等方法,最小化J(W,b),進而得到最優(yōu)的網(wǎng)絡(luò)權(quán)值與偏置項。因此,網(wǎng)絡(luò)代價函數(shù)直接決定了最終的網(wǎng)絡(luò)優(yōu)化結(jié)果,亦直接影響了最終的模型分類能力。在小樣本情況下,傳統(tǒng)的交叉熵代價函數(shù)往往會造成網(wǎng)絡(luò)過擬合等造成性能下降嚴重,因此有必要尋找性能更優(yōu)的代價函數(shù)形式。
布雷格曼散度是一種距離失真函數(shù)。設(shè)樣本p與類別q,利用布雷格曼散度便可以有效度量令p屬于類別q而導(dǎo)致的距離失真,因此布雷格曼散度可以用作卷積神經(jīng)網(wǎng)絡(luò)的代價函數(shù)。
定義函數(shù)F:Ω→R。其中,Ω為凸集,F(xiàn)為嚴格凸二次可微函數(shù)。則布雷格曼散度可表示如下:
d(p,q)=F(p)-F(q)-<▽F(q),(p-q)>
(4)
式中:▽F(q)表示函數(shù)F在q處的梯度,(p-q)表示兩個向量的差,<▽F(q),(p-q)>表示▽F(q)與(p-q)的向量內(nèi)積結(jié)果。
布雷格曼散度是F函數(shù)與該函數(shù)的線性近似(一階泰勒展開式)之差。若令F(p)=‖p‖2,則布雷格曼散度即為歐氏距離函數(shù):
d(p,q)=‖p-q‖2
(5)
假設(shè)卷積神經(jīng)網(wǎng)絡(luò)所輸入的樣本數(shù)據(jù)y∈RD,輸出的特征為?!蔙M,可利用Γ=fγ(y)表示由輸入樣本至輸出特征的映射函數(shù),其中γ表示待優(yōu)化的網(wǎng)絡(luò)參數(shù)。文獻[15]的研究表明,在數(shù)據(jù)分類過程中,使用布雷格曼散度可使樣本至類別均值中心的損失到達最小,即利用布雷格曼散度作為代價函數(shù)可以獲得最優(yōu)的類別表達,使樣本分類能力達到最佳化。
如圖6所示,令Ck,k=1,2表示類別均值中心向量,即:
(6)
式中:n表示第k個類別所屬樣本的數(shù)量。如果能夠得到最佳化的類別中心Ck,則對于新輸入的樣本數(shù)據(jù)p,通過計算其與類別中心Ck的布雷格曼散度即能實現(xiàn)有效分類。
圖6 基于布雷格曼散度的特征優(yōu)化學(xué)習(xí)示意圖
在卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中,考慮到Softmax函數(shù)則有:
(7)
式中:Sγ(k|y)表示輸入樣本y屬于第k個類別的概率。因此,在樣本集的特征訓(xùn)練過程可以看作對于已知類別的樣本y,最小化網(wǎng)絡(luò)代價函數(shù)J(γ)=-log(Sγ(k|y))的過程。則相應(yīng)的網(wǎng)絡(luò)代價函數(shù)為:
(8)
訓(xùn)練過程中使用隨機梯度下降法,基本迭代過程可表示如下:
(9)
式中:α為卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)速率。
訓(xùn)練過程中先進行前向傳播,由輸入數(shù)據(jù)得到網(wǎng)絡(luò)輸出值,并計算網(wǎng)絡(luò)代價函數(shù),然后由誤差進行反向傳播,調(diào)整權(quán)值參量,最終達到網(wǎng)絡(luò)優(yōu)化,使卷積神經(jīng)網(wǎng)絡(luò)的輸出特征具有較好的分類能力。
為驗證上述算法檢測性能,實驗數(shù)據(jù)來源選取MIT-BIH心電數(shù)據(jù)庫部分心電數(shù)據(jù)。訓(xùn)練樣本包括標(biāo)注室性早搏心拍、正常心拍數(shù)據(jù)。性能評估樣本選取除訓(xùn)練數(shù)據(jù)外的第116、201、205、221、223號共五組病人的心電數(shù)據(jù)。如圖7所示,卷積神經(jīng)網(wǎng)絡(luò)的輸入為經(jīng)驗小波變換后的時頻二維數(shù)據(jù)(大小為256×256),包含兩個卷積層與兩個池化層,卷積核大小為128×128與48×48,池化層選用最大池化方法,初始網(wǎng)絡(luò)學(xué)習(xí)速率取0.06。
圖7 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
分別采用傳統(tǒng)交叉熵代價函數(shù)與布雷格曼散度代價函數(shù)且利用隨機梯度下降法進行訓(xùn)練評估,其中,布雷格曼散度選取歐氏距離函數(shù)。性能評估采用文獻[5]中的敏感度與陽性檢測率參數(shù)。性能評估結(jié)果如表1所示。
表1 實驗性能評估結(jié)果
其中,TP為正確檢測的心拍數(shù)量,F(xiàn)P為錯誤檢測的心拍數(shù)量,F(xiàn)N為漏檢的心拍數(shù)量,CE為傳統(tǒng)交叉熵函數(shù),BD為布雷格曼散度代價函數(shù)。
評估結(jié)果表明,本文代價函數(shù)情況下的總體敏感度與總體陽性檢測率分別為96.39%、97.25%,均優(yōu)于傳統(tǒng)交叉熵代價函數(shù),因此基于布雷格曼散度的代價函數(shù)在訓(xùn)練樣本有限的情況下具有更好的識別性能,即使用改進后的代價函數(shù)能夠計算得到更強的信號表征信息。此外,二者的性能均優(yōu)于文獻[5]的識別結(jié)果,顯示出基于經(jīng)驗小波變換的二維時頻數(shù)據(jù)輸入較之一維數(shù)據(jù)保存了更完整的特征信息,因此訓(xùn)練后的網(wǎng)絡(luò)模型具有更佳的特征識別能力。特別地,二維數(shù)據(jù)的輸入避免了一維數(shù)據(jù)的QRS波群檢測過程,因此不會因誤檢而影響特征提取,故在干擾較多的第221號病人數(shù)據(jù)上仍有良好的檢測率。
通常情況下,當(dāng)待識別的病人心拍數(shù)量增大時,F(xiàn)P與FN容易增加。整體來看,本文算法在五組病人的數(shù)據(jù)中的檢測性能浮動較小,特征提取與識別性能較為穩(wěn)定,具有良好的魯棒性,對于臨床檢測具有一定意義。
心電信號中包含了諸多心臟生理病變的信息,通過經(jīng)驗小波變換將心拍信號的自適應(yīng)分解以獲得二維訓(xùn)練數(shù)據(jù),并利用布雷格曼散度作為卷積神經(jīng)網(wǎng)絡(luò)的代價函數(shù)進行訓(xùn)練優(yōu)化,在有限樣本的情況下具有優(yōu)良的室性早搏心拍識別性能。未來將繼續(xù)針對其他類型的病變心拍數(shù)據(jù)進行數(shù)據(jù)采集、特征分析與檢測研究。