石滿紅,武 柯,郭航志
(安徽科技學(xué)院 信息與網(wǎng)絡(luò)工程學(xué)院,安徽 蚌埠 233030)
心臟性猝死(Sudden cardiac death,SCD)是指一個人在出現(xiàn)癥狀后不到一小時內(nèi),因先前已知或未知的心臟疾病而突然死亡,盡管公共除顫設(shè)備的使用有所增加,但根據(jù)最新數(shù)據(jù),由于未能及時為患者提供護理,只有大約10.4%的院外幸存者,伴有心力衰竭、冠狀動脈疾病或心肌梗死病史的人患有SCD的風(fēng)險更高[1].盡管SCD的主要原因還不清楚,心室顫動能夠?qū)е滦呐K泵血功能衰竭進而導(dǎo)致死亡,它被認為是20%的SCD的潛在發(fā)作機制,且患者的存活率在經(jīng)歷過心室顫動以后每分鐘下降10%[2].故對于經(jīng)歷過心室顫動的人來說,早期發(fā)現(xiàn)未預(yù)料到的 SCD 對于提高 SCD 風(fēng)險患者,尤其院外患者的生存率非常重要.
HRV已被證明是心肌梗死后死亡的一個獨立指標[3].HRV信號的分析方法主要有經(jīng)典線性方法(包括時域、頻域)、時頻和非線性方法3種.Van Hoogenhuyze等人在1989年的一項研究報道表明,與正常組相比,SCD組中HRV的平均竇房結(jié)R-R間期(SDANN)、標準差的均值的統(tǒng)計特征較低.除了上述對HRV信號進行時域分析外,Shen等人還對HRV信號進行了快速傅里葉變換(FFT)來獲取頻域特征,發(fā)現(xiàn)各種標準片段(比如高頻(HF)、低頻(LF)和甚低頻(VLF))是SCD的強指標[4].在時頻域,對HRV信號進行Wigner-Ville變換、平滑pseudo Wigner-Ville分布和短時傅里葉變換,得到相應(yīng)的時頻特征,用于SCD預(yù)測[5-7].有研究表明,與經(jīng)典的HRV信號分析方法相比,由于HRV信號本身的非平穩(wěn)和非線性特性,非線性分析方法如重整熵、條件熵、相互非線性預(yù)測和符號動力學(xué)等,能更好地挖掘信號內(nèi)部包含的復(fù)雜性[8].此外,Ebrahimzadeh等人在對HRV信號分析中,較之經(jīng)典的線性分析,非線性特征在區(qū)分SCD受試者與正常受試者方面的表現(xiàn)更加穩(wěn)定[9].樣本熵(SamEn)作為典型的信號非線性分析方法被廣泛應(yīng)用于許多信號和圖像處理應(yīng)用[10-11].Fujita等人提出結(jié)合非線性特征(Renyi熵,模糊熵,Hjorth’s參數(shù),Tsallis 熵)和小波變換的算法,對HRV信號進行處理,能夠在SCD發(fā)生前4 min進行預(yù)測[12],然而,由于小波分解對于信號的分解不具有自適應(yīng)能力,選擇合適的基函數(shù)對于信號分析至關(guān)重要.集成經(jīng)驗?zāi)B(tài)分解(EEMD)是不需先驗知識,只有根據(jù)信號本身特點的自適應(yīng)信號分解方法,將信號分解成固有模式函數(shù),這對于非線性和非平穩(wěn)信號的分析極其重要[13].EEMD信號分解方法已經(jīng)在各種信號的分析中顯示出其優(yōu)越能力,如心電圖心跳的分類[14],可電擊性室性心律失常的檢測[15],以及充血性心力衰竭的自動識別[16].因此,結(jié)合樣本熵與集合經(jīng)驗?zāi)J椒纸獾膬?yōu)勢,提出基于集合經(jīng)驗?zāi)J椒纸獾臉颖眷貞?yīng)用于心臟猝死早期識別.
以PhysioBank miti-BIH Normal Sinus Rhythm(NSR)和MIT/BIH SCD作為評估數(shù)據(jù).在23例SCD患者中,僅選取20例(8例女性,10例男性,2例未知,年齡18~89歲)進行進一步分析,因為其他3例患者的心電信號未出現(xiàn)任何VF發(fā)作.從SCD數(shù)據(jù)庫中總共使用了來自MIT-BIH NSR的36條心電圖記錄和來自SCD數(shù)據(jù)庫的40條SCD心電信號.為了在正常組和SCD風(fēng)險受試者之間保持一致的采樣,使用的所有心電圖信號重新采樣至360 Hz.在SCD患者24 h心電記錄中,僅使用VF發(fā)作前5 min心電信號,以此模擬SCD前5 min.對于正常受試者,隨機選擇5 min心電信號.心電信號在采集過程中會受基線漂移(<0.5 Hz)、電源線干擾(>50 Hz)等各種噪聲干擾[17],采用小波基為Daubechies 6階的DWT對獲取的ECG信號進行分解,此方法適用于非平穩(wěn)信號的分解[18],將分解得到的前兩個細節(jié)系數(shù)和最高近似系數(shù)設(shè)置為零,用于心電信號去噪,然后對去噪后的心電信號采用Pan Tompkins算法,檢測QRS波,確定相應(yīng)的HRV信號.HRV信號分析前需要對HRV信號進行預(yù)處理,因為缺失的或是錯誤的R峰會帶來異位間隔,從而產(chǎn)生差質(zhì)量的HRV信號.采用中值濾波器方法刪除超過對后5個和前5個RR間隔的中值 20% 的RR間隔的方法[19],來對HRV信號進行預(yù)處理.
在給定信號x(n)的情況下,EMD的出發(fā)點是識別所有的局部最大值與最小值,以上包絡(luò)eu(n)的三次樣條曲線連接所有這些最大值.同樣,所有局部極小值都用樣條曲線作為下包絡(luò)e1(n)連接,兩個包絡(luò)的均值表示為:
m1(n)=[eu(n)+el(n)]/2.
(1)
因此,第一個成分h1(n)可由式(2)獲得:
x(n)-m1(n)=h1(n).
(2)
上述提取的固態(tài)莫函數(shù)(IMF)的程序稱之為篩選過程,理想情況下當h1(n)滿足IMF的兩個要求時,h1(n)即為IMF.由于h1(n)在過零點之間仍然包含多重極值,因此在h1(n)上再次執(zhí)行篩選過程,該過程經(jīng)反復(fù)應(yīng)用,得到滿足IMF條件的第一個IMFc1(n).接著使用兩個停止準則來終止篩選過程,最常用的標準是標準差(Standard Deviation,SD),它是從兩個連續(xù)的篩選過程中計算出來的:
(3)
這里的N代表信號x(n)中樣本點的個數(shù),當SD小于給定的閾值時,得到第一個IMF.那么c1(n)由式(4)從剩下的數(shù)據(jù)中分離出來:
x(n)-c1(n)=r1(n).
(4)
需要注意的是,殘差r1(n)包含一些有用的信息,因此,將殘差作為信號,采用相同的篩選過程獲得
ri-1(n)-ci(n)=ri(n),i=1,…,q.
(5)
當分量cq(n)或是rq(n)變小或殘差rq(n)變?yōu)閱握{(diào)函數(shù)時,整個過程結(jié)束.結(jié)合式(4)、(5)產(chǎn)生原始信號的經(jīng)驗?zāi)J椒纸猓?/p>
(6)
分解得到q個固態(tài)模函數(shù)和一個殘差,低階IMF捕獲快速震蕩模式,高階IMF代表緩慢震蕩模式[13].
在EMD方法中,存在模態(tài)混合現(xiàn)象與端點效應(yīng),造成模態(tài)混合現(xiàn)象的主要原因是震蕩信號中混有脈沖、間歇性以及噪聲等信號,這些信號使得信號的分解層數(shù)增加,相應(yīng)的時效性降低,甚至出現(xiàn)非常嚴重的模態(tài)混疊的現(xiàn)象.為了解決EMD方法的局限性,Wu 和 Huang[13]在2009年提出了一種改進的EMD信號分解方法—集合經(jīng)驗?zāi)J椒纸?EEMD),通過加入有限幅值的高斯白噪聲均勻分布在整個時頻空間,加入白噪聲分量將原始信號的各個尺度分量映射到合適的參考尺度上.因被分解的信號由白噪聲和原信號構(gòu)成,使得每一次分解試驗的結(jié)果都是有噪聲的.但通過計算所有試驗的總體均值,完全消除了均勻分布的白噪聲,通過這種方法,有效地避免了EMD的模態(tài)混合現(xiàn)象[15].EEMD算法過程表述如下:
步驟1 加入不同標準差的高斯白噪聲(ni(t),i=0,…,L)到原始信號x(t):
xi(t)=x(t)+ni(t).
(7)
步驟3 計算集合信號xi(t)的第k個IMF:
(8)
利用EEMD(D=0.2)將5 min HRV信號分割成多個IMF,然后提取相應(yīng)的特征.考慮到重建誤差的可容忍程度,都使用了前4個IMFs.圖1描述了SCD發(fā)生前5 min間隔HRV信號的分解.
圖1 利用EEMD技術(shù)對SCD發(fā)生前5 min HRV信號的分解
樣本熵(sample entropy,SamEn)測量生理信號的規(guī)律性,與模式長度無關(guān).對于給定模式長度(m)和相似度準則(r),如果一個數(shù)據(jù)集的樣本熵值高于另一個數(shù)據(jù)集,那么對于所有不同的模式長度(m)和相似度準則(r),SamEn值都高于另一個數(shù)據(jù)集.因此,SamEn相對一致且減少了近似熵的偏差.較高的SamEn值表示該信號是高度不可預(yù)測的,較低的SamEn值表示該信號是可預(yù)測的.SamEn的計算過程如下:
1)對于時間序列{μ(i),i=1,…,N},構(gòu)造m維向量:
Xi={u(i),u(i+1),…,
u(i+m-1)},1≤i≤N-m+1.
(9)
2)定義向量Xi和Xj的最大距離函數(shù)d[Xi,Xj],記Nm(i)為滿足d[Xi,Xj]≤r條件的個數(shù).
3)計算
(10)
其中:i=1,…,N-m+1.
4)構(gòu)造m+1維向量,重復(fù)上述步驟,類似地計算Bm+1(r).
5)SamEn為:
(11)
這種熵的優(yōu)點是:(i)它可以用于短序列的有噪聲數(shù)據(jù);(ii)它能夠區(qū)分不同的復(fù)雜度信號;(iii)對于隨機數(shù),它比近似熵度量更準確;(iv)它保持了相對一致性.根據(jù)以往的研究經(jīng)驗,這里SamEn的n=2,r=0.15*SD(SD 表示時間序列的標準差),m=2[10].
為了確定所獲得特征的統(tǒng)計意義和分類性能,采用了包括t檢驗的統(tǒng)計分析方法.當t檢驗生成的特征的p值小于0.05時,該特征被視為統(tǒng)計顯著性,p值越小,對應(yīng)統(tǒng)計顯著性越明顯.此外,為了區(qū)分SCD和正常人,SVM分類器中采用不同的核函數(shù),且分別計算3個評估指標(準確度、靈敏度和特異性),以評估分類器的性能.為確保分類結(jié)果的公正性和可信性,實施了5倍交叉驗證方法,并計算了總體評估指標.
表1顯示的是樣本熵與集合經(jīng)驗?zāi)J椒纸獾谝粚臃纸獾墓虘B(tài)模函數(shù)的樣本熵的平均值和標準差,從表1不難看出,直接計算不同群體的心率變異性信號的樣本熵的值,在正常人與心臟猝死患者之間不具備差異性(p=0.683),而將集合經(jīng)驗?zāi)J椒纸庾饔糜谛穆首儺愋孕盘?,計算分解獲得的第一層固態(tài)模函數(shù)的樣本熵的值,在兩者之間存在顯著性差異(p=2.91e-9),圖2顯示的是樣本熵(SamEn)與基于集合經(jīng)驗?zāi)J椒纸獾臉颖眷?EEMD-SamEn)的值在正常人與SCD患者之間的箱線圖,不難發(fā)現(xiàn),EEMD-SamEn在正常人與SCD患者之間具有顯著性分離,區(qū)分性能好.
表1 正常人與CHF HRV信號的SamEn和EEMD-SamEn對應(yīng)的p值
圖2 樣本熵與基于集合經(jīng)驗?zāi)J椒纸獾臉颖眷卦诓煌后w間的箱線圖
隨后,分別將SamEn與EEMD-SamEn輸入不同核函數(shù)的SVM分類器,表2顯示的是分類結(jié)果,由表2不難看出,EEMD-SamEn在使用核函數(shù)為Quadratic和Gaussian都獲得80.3%的準確度,而SamEn獲得的準確度分別為47.7%和53.9%,且EEMD-SamEn獲得的平均準確度、靈敏度、特異性分別為75.03%、68.13%與80.38%.顯著高于SamEn.
表2 使用不同核函數(shù)的SVM分類器的分類性能 %
研究表明,全世界每年都有數(shù)百萬人由于SCD喪生,因此,急需一種合適的方法來提前識別SCD,盡可能早地發(fā)出預(yù)警信息,以便醫(yī)生可以為有風(fēng)險的患者做出及時的后續(xù)治療.筆者基于集合經(jīng)驗?zāi)J椒纸馀c樣本熵提出基于集合經(jīng)驗?zāi)J椒纸獾臉颖眷貞?yīng)用于SCD患者的識別,數(shù)值實驗基于集合經(jīng)驗?zāi)J椒纸獾臉颖眷剡_到80.3%,它對SCD風(fēng)險患者的識別具有較高的實用價值.