韋杰英,王 迪,孫亞楠,張 瑞
(西北大學 醫(yī)學大數(shù)據研究中心, 陜西 西安 710127)
心房顫動(atrial fibrillation, AF),簡稱房顫,是臨床上最常見的心律失常之一[4]。房顫發(fā)作時,心房肌喪失正常有規(guī)律的舒縮活動,代之以快速、不協(xié)調的微弱蠕動的房顫波(即心房產生每分鐘350~600次不規(guī)則的沖動),致使心房失去正常的有效收縮。其臨床表現(xiàn)為心慌氣喘、眩暈和心絞痛,嚴重時會引發(fā)昏厥、心力衰竭、休克等癥狀。隨著世界人口的日益老齡化,我國近70%的房顫發(fā)生在65~80歲的人群中,80歲以上人群的房顫發(fā)病率高達5%~15%[4]。
心電圖 (electrocardiogram, ECG)記錄了心臟活動時心肌細胞激動產生的生物電信號(即心電信號),其中蘊含大量的生理病理信息,對房顫的診斷和治療具有重要價值。圖1顯示了一個正常的心跳周期,其中P波表示心房的除極化過程,QRS波群表示心室的除極化過程,T波表示心室的復極化過程。房顫在心電圖上的表征主要為:①P波缺失,代之以連續(xù)、快速、大小不等、形態(tài)不一的房顫波(f波),其頻率為350~600次/分;②RR間期絕對不規(guī)則(見圖2)。
圖1 一個正常心動周期的心電圖波形Fig.1 A normal cycle of ECG
按照發(fā)作持續(xù)時間可以將房顫分為陣發(fā)性房顫、持續(xù)性房顫和永久性房顫。其中,陣發(fā)性房顫的發(fā)作具有突發(fā)性、反復性且發(fā)作時間短等特點,因而臨床上往往難以及時捕捉到房顫心電而造成誤診漏診等現(xiàn)象。如果陣發(fā)性房顫不能及時得到診斷與治療,則會進一步發(fā)展成為持續(xù)性房顫或永久性房顫,甚至誘使腦卒中等高危性疾病,嚴重危害人們的身體健康[5]。傳統(tǒng)的陣發(fā)性房顫檢測往往需要專業(yè)醫(yī)師對長時程連續(xù)心電進行視覺上的判讀,這一過程不僅耗時,也極度依賴于個人經驗。此外,有限數(shù)量的專業(yè)醫(yī)師也是臨床上難以實現(xiàn)及時監(jiān)測與診斷的一個重要因素。因此,展開陣發(fā)性房顫自動檢測的研究具有十分重要的臨床意義,其中有效的房顫心電特征提取則是實現(xiàn)自動檢測的關鍵步驟。
圖2 竇性心律與房顫心電圖示例Fig.2 ECG example of sinus rhythm and atrial fibrillation
在已有的房顫心電特征提取研究中,最具代表性的一類方法是基于RR間期的不規(guī)則性來提取房顫心電特征。文獻[17]刻畫了RR間期的龐加萊散點圖,并指出竇性心律的散點主要集中在直線y=x上,而房顫心電的散點則分布散亂。Moody和Mark在文獻 [18]中構建了一個RR間期序列的隱馬爾可夫模型,并使用轉移概率作為特征來檢測房顫。辛怡等人將RR間期進行符號序列編碼,并通過計算其信息熵來刻畫心臟活動的復雜程度[12]。B.T.Logan等人提取了RR間期序列的統(tǒng)計特征——RR間期方差,并以此來刻畫RR間期變化的程度[9]。另一類方法是依賴于P波缺失這一表現(xiàn)來提取房顫心電特征。文獻[19]提出將P波的寬度和數(shù)量作為刻畫P波信息的參數(shù)。Juan Rodenas等人將P波提取出來,并利用其小波熵來描述心房活動的復雜程度[15]。Andrikopouls G.K.等人提出P波變異性特征來反映心房傳導的變異程度[6]。由于房顫發(fā)作時心電圖上的兩個表現(xiàn)缺一不可,因此學者們又相繼提出了RR間期與P波相結合的特征提取方法。Ricardo Couceir等人提出P波模板匹配法檢測P波,并將KL散度與RR間期轉移熵結合進行房顫檢測[20]。在文獻[7]中,Kai JIANG等人提出將RR間期分布差曲線的峰值作為刻畫RR間期分布規(guī)則程度的特征,將PR間期的有效個數(shù)作為刻畫P波缺失的特征,最后將兩者結合作為融合特征。Saeed Babaeizadeh等人提出Philips算法[8],即通過概率轉移矩陣中的概率來表示兩個RR間期序列的相似程度,并結合PR間期的時間偏差作為房顫心電的特征。
本文將提出一種新的融合RR間期不規(guī)則性與P波缺失的房顫心電特征提取方法。首先,在QRS波群所在頻帶的重構信號上檢測R峰,并提取RR間期變異系數(shù)與子串長度概率分布熵來刻畫其規(guī)則程度;其次,對P波所在頻帶的小波系數(shù)繪制T-lag散點圖,并定義置信散度距離和與置信散度指數(shù)來反映房顫心電在P波頻帶上的異常表現(xiàn)。將上述兩類特征融合作為最終所提取的房顫心電特征,再結合超限學習機(ELM)[2-3]完成陣發(fā)性房顫的自動檢測,并在MIT-BIH心房顫動數(shù)據集上驗證所提方法的有效性與可行性。
心電信號在采集過程中會受到各種噪聲的影響,主要包括基線漂移、肌電干擾和工頻干擾。其中基線漂移是由電極移動、人體呼吸等低頻干擾所引起,頻率在1Hz以下;肌電干擾是由人體各種肌肉收縮引起的干擾,頻率范圍較廣;工頻干擾是由電力系統(tǒng)引起的一種干擾,頻率為50Hz左右。
首先對原始心電信號進行離散小波變換去除基線漂移,本文選用sym8函數(shù)為基小波,并設置分解層數(shù)為7層。其次,采用小波軟閾值去噪算法進一步去除工頻干擾和肌電干擾。本文選用db5函數(shù)為基小波,分解層數(shù)為3層。圖3顯示了一個時長為10s的心電信號片段去噪前后的效果。
圖3 心電信號去噪效果Fig.3 The performance of ECG denoising
1.2.1 基于RR間期不規(guī)則的特征提取方法 時間序列可以轉換為符號序列,當符號序列中不同長度子串的發(fā)生概率顯著不一致時,則說明該時間序列出現(xiàn)紊亂。由于熵可以描述一個系統(tǒng)內在的復雜程度,故可采用子串長度概率分布熵來刻畫時間序列的規(guī)則程度。變異系數(shù)是衡量時間序列差異程度的統(tǒng)計量,可以用來刻畫時間序列的有序程度?;诖?本小節(jié)采用變異系數(shù)與子串長度概率分布熵來描述RR間期的規(guī)則程度[10-14,21]。具體過程可總結為如下算法I。
算法I(基于RR間期不規(guī)則的特征提取方法):給定去噪后心電信號S={s(1),s(2),…,s(N)},其中N為樣本點數(shù)。
步驟1對信號S作不重疊等長分段處理,記Si={si(1),si(2),…,si(n)}為第i個心電片段(i=1,…,Γ,Γ=[n|N])。
步驟4計算RR間期序列的變異系數(shù)
(1)
并記
F1=[CV1,CV2,…,CVΓ]T。
步驟5計算RR間期序列的子串長度概率分布熵。
首先,計算RRi的一階差分序列:
ΔRRi={ΔRi(j)|Ri(j+1)-Ri(j),
j=1,…,J-1}。
(2)
其次,計算ΔRRi的符號時間序列:
其中
Thr=mean(ΔRRi)。
(3)
最后,計算符號時間序列DsRRi的子串長度概率分布熵:
PEi=
(4)
Pi(l)=nl/Ki,
(5)
dRi(j)(1-dRi(j+1))],
(6)
其中nl為長度為l的子串在DsRRi序列中出現(xiàn)的次數(shù),Ki為DsRRi序列中的子串總數(shù)(規(guī)定log0=0)。記
F2=[PE1,PE2,…,PEΓ]T。
1.2.2 基于P波缺失的特征提取方法 龐加萊散點圖[11]是信號在相空間上的幾何表示,能夠揭示信號的非線性特征。心電信號中P波代表了心房活動,竇性心律時P波正常,房顫發(fā)作時P波缺失代之以房顫波。為了刻畫房顫心電在P波上的異常表現(xiàn),本小節(jié)首先采用小波分析提取P波所在頻帶范圍內的小波系數(shù),然后通過定量描述龐加萊散點圖的特征來揭示房顫心電的動力學特性。圖4分別展現(xiàn)的是竇性心律心電和房顫心電的散點圖。從圖中可以看出,竇性心律上的散點分布較集中,且向坐標軸趨近;而房顫心電上的散點則以原點為中心向四周擴散,且分布較之竇性心律更為分散?;诖?本小節(jié)提出兩個度量指標,置信散度距離和置信散度指數(shù),并將其作為基于P波缺失的房顫心電特征。具體過程可總結為如下算法II。
圖4 P波所在頻帶的小波系數(shù)散點圖Fig.4 The corresponding scatter diagram of wavelet coefficients of sinus rhythm and atrial fibrillation
算法II(基于P波缺失的特征提取方法):給定去噪后心電信號S={s(1),s(2),…,s(N)},其中N為樣本點數(shù)。
步驟1對信號S做不重疊等長分段處理,記Si={si(1),si(2),…,si(n)}為第i個心電片段(i=1,…,Γ,Γ=[n|N])。
步驟3繪制Wi的T-lag散點圖。
步驟4在T-lag散點圖上構建η%置信圓,并以直線y=x和y=-x為分割線在該圓上劃分A,B,C,D四個區(qū)域,如圖5所示。
步驟5在η%置信圓內,分別計算散點的置信散度距離和ψi1與置信散度指數(shù)ψi2:
其中nA,nB,nC,nD分別為區(qū)域A,B,C,D內的散點總數(shù);dA(·),dC(·)分別為區(qū)域A,C內的散點到y(tǒng)軸的距離;dB(·),dD(·)分別為區(qū)域B,D內的散點到x軸的距離。記
F3=[ψ11,ψ21,…,ψΓ1]T,
F4=[ψ12,ψ22,…,ψΓ2]T。
綜合算法I和算法II,稱
為本文所提取的房顫心電融合特征。
本文使用的心電信號均來自于MIT-BIH心房顫動數(shù)據集[1],共包含25個持續(xù)時長為1h的雙導聯(lián)心電記錄,采樣率為250Hz,分辨率為12bit。本小節(jié)選取了6個陣發(fā)性房顫心電記錄進行數(shù)值實驗,所有實驗均在Matlab R2015b中運行。
2.2.1 房顫心電融合特征的性能分析 在特征提取過程中,對去噪后的心電信號進行無重疊等長分段處理,每個心電片段長度為30s。采用品質因子為1、冗余度為3的8層可調品質因子小波變換,選取中心頻帶為3.66 Hz,5.49 Hz,8.23 Hz和12.35 Hz的小波系數(shù)繪制10-lag散點圖(見圖4),并選取97%置信圓(見圖5)。此外,在RR間期序列的子串概率分布熵計算過程中,選取子串為長度是1,2,3和4的全為1或全為0的子序列。
圖6展示的是4個單一特征(即變異系數(shù)、子串長度概率分布熵、置信散度距離和置信散度指數(shù))以及融合特征的箱線圖。從圖中可以看出,房顫發(fā)作時4個單一特征值總體上均高于竇性心律的值;同時,融合特征所表現(xiàn)的差異性最為明顯,這說明本文所提取的融合特征性能良好。
2.2.2 融合特征在實現(xiàn)房顫自動檢測中的性能分析 將上述融合特征作為超限學習機的輸入,最終實現(xiàn)陣發(fā)性房顫的自動檢測,算法流程如圖7所示。
圖5 散點圖的97%的置信圓Fig.5 The 97% confidence circle corresponding to the scatter graph
數(shù)值實驗采用5倍交叉驗證,并取100次實驗的平均結果作為最終分類性能的度量。表1列出了準確率、敏感性以及特異性作為評估算法優(yōu)劣的度量指標[1]。從表1可以看出,本文所提取的融合特征在實現(xiàn)陣發(fā)性房顫自動檢測中具有良好的性能。表2列出了本文所提方法與已有方法在MIT-BIH房顫數(shù)據集上的性能比較??梢钥闯?本文所提方法的檢測性能整體上優(yōu)于其他方法。
表1 陣發(fā)性房顫自動檢測的性能Tab.1 Performances of the proposed automatic PAF detection method
圖6 提取特征的箱線圖Fig.6 The boxplot of features corresponding to sinus rhythm and atrial fibrillation
作 者特征提取敏感性/%特異性/% 本文RR間期不規(guī)則和P波缺失94.6498.15Couceiro et al[20]RR間期不規(guī)則和P波缺失93.8096.09 Babaeizadeh et al[8]RR間期不規(guī)則和P波缺失91.0096.00 Moody et al[18]RR間期不規(guī)則96.1086.80Logan et al[9]RR間期不規(guī)則96.0089.00 Rodenas et al[15]P波缺失96.4794.19
圖7 陣發(fā)性房顫自動檢測算法流程圖Fig.7 The flow diagramof automatic PAF detection
本文提出了一種新的房顫心電融合特征提取方法。首先,利用小波變換對原始心信號做去噪處理,并進行可調品質因子小波變換;其次,對QRS波群頻帶的重構信號進行R峰的自動檢測,進而計算RR間期變異系數(shù)與子串長度概率分布熵;然后繪制P波頻帶范圍內小波系數(shù)的T-lag散點圖,計算其置信散度距離和與置信散度指數(shù);最后,將這4個特征作為最終提取的房顫心電融合特征,并結合MIT-BIH心房顫動數(shù)據集與超限學習機完成陣發(fā)性房顫的自動檢測。數(shù)值實驗表明本文所提方法能夠有效地完成房顫心電的識別,為臨床的監(jiān)測與診斷提供一定的輔助作用。