孫 括, 王云峰, 徐靜波, 張海英
基于自組織神經(jīng)網(wǎng)絡(luò)的QRS波聚類方法
孫 括1,2, 王云峰2, 徐靜波2, 張海英2
(1.中國科學(xué)院大學(xué) 電子電氣與通信工程學(xué)院,北京 101407;2.中國科學(xué)院 微電子研究所 新一代通信射頻芯片技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100029)
為提高查看大量數(shù)據(jù)動(dòng)態(tài)心電(ECG)圖時(shí)的效率,將波形聚類,采用埃爾米特函數(shù)和自組織神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)了室性早搏占比高情況下的心電波形聚類算法。使用MIT—BIH心率失常數(shù)據(jù)庫,利用埃爾米特函數(shù)分解QRS波形為QRS向量,將所有QRS向量輸入自組織神經(jīng)網(wǎng)絡(luò)進(jìn)行分類。使用特征向量元素分析聚類結(jié)果,用陽性率指標(biāo)對結(jié)果進(jìn)行統(tǒng)計(jì),平均真陽性率為91.2 %,假陽性率為1.03 %,驗(yàn)證了基于自組織神經(jīng)網(wǎng)絡(luò)的心電聚類算法的有效性。達(dá)到了將正常心搏和室性早搏心搏聚類的目標(biāo)。
QRS; 聚類; 埃爾米特函數(shù); 自組織神經(jīng)網(wǎng)絡(luò); 陽性率
近年來,心臟疾病越來越受到人們關(guān)注。為全面了解心臟狀態(tài),動(dòng)態(tài)心電圖使用廣泛。動(dòng)態(tài)心電圖對心臟進(jìn)行24h或48h監(jiān)測,產(chǎn)生大量心電數(shù)據(jù)[1]。人工查看心電波形工作量大,易出錯(cuò)。計(jì)算機(jī)自動(dòng)識別歸類技術(shù)可以大大提高醫(yī)護(hù)人員的工作效率[2]。
為實(shí)現(xiàn)將心電波形聚類目標(biāo),本文使用埃爾米特函數(shù)提取心電波形特征,自組織神經(jīng)網(wǎng)絡(luò)對心電特征聚類[3],利用特征向量不同元素的貢獻(xiàn)度對自組織神經(jīng)網(wǎng)絡(luò)的輸出進(jìn)行分析,并用陽性率指標(biāo)對聚類結(jié)果進(jìn)行統(tǒng)計(jì)。使用MIT—BIH心率失常數(shù)據(jù)庫,聚類結(jié)果真陽性率為91.2 %,假陽性率為1.03 %,實(shí)驗(yàn)結(jié)果說明基于自組織神經(jīng)網(wǎng)絡(luò)的聚類算法適用于室性早搏心搏占比高的動(dòng)態(tài)心電圖,基于自組織神經(jīng)網(wǎng)絡(luò)的心電波形聚類算法有效,完成了將心電波形聚類的目標(biāo)。
1.1 埃爾米特函數(shù)
埃爾米特多項(xiàng)式是經(jīng)典的正交多項(xiàng)式序列。埃爾米特多項(xiàng)式Hn定義如下
(1)
式中n為階數(shù)。埃爾米特函數(shù)定義如下
(2)
埃爾米特函數(shù)具有正交性[4]
(3)
ψn(x)構(gòu)成正交基空間,不同階的埃爾米特函數(shù)的組合可以表示QRS波形。
1.2 自組織神經(jīng)網(wǎng)絡(luò)
自組織映射 (self-organizing map,SOM) 模型是一種無監(jiān)督的自組織神經(jīng)網(wǎng)絡(luò),它自動(dòng)尋找數(shù)據(jù)中的規(guī)律,并改變網(wǎng)絡(luò)參數(shù)[5]。SOM由輸入層和輸出層組成,可以將高維度向量分類,分類結(jié)果是一個(gè)二維平面結(jié)構(gòu),二維平面上存在神經(jīng)元。SOM使輸入數(shù)據(jù)從高維數(shù)據(jù)空間映射到二維空間[6]。
SOM使用了競爭性學(xué)習(xí)方法,對于一個(gè)有權(quán)重向量Wv(s)的神經(jīng)元v,更新準(zhǔn)則為[7]
Wv(s+1)=Wv(s)+f(u,v,s)α(s)(D(t)-Wv(s))
(4)
式中s為迭代次數(shù),t為輸入向量的下標(biāo),u為神經(jīng)元,α為學(xué)習(xí)速率,D(t)為輸入向量,f(u,v,s)為計(jì)算神經(jīng)元之間距離的函數(shù)。f(u,v,s)與兩個(gè)神經(jīng)元的距離直接相關(guān)。
1)提取心電數(shù)據(jù)庫心電數(shù)據(jù),將心電數(shù)據(jù)用埃爾米特函數(shù)重構(gòu),將每一個(gè)心電波形表示為四維標(biāo)準(zhǔn)QRS向量。
2)將標(biāo)準(zhǔn)QRS向量輸入SOM,找到獲勝向量,調(diào)整獲勝向量和鄰近向量的權(quán)重。
3)所有標(biāo)準(zhǔn)QRS向量進(jìn)行步驟(2),并調(diào)整學(xué)習(xí)速率參數(shù),重復(fù)200次。
4)將分類結(jié)果輸出,統(tǒng)計(jì)每一類的心電類型和數(shù)量,得到陽性率指標(biāo)。
使用MIT—BIH心率失常106#心電數(shù)據(jù),106#心電數(shù)據(jù)正常心搏(數(shù)據(jù)庫中標(biāo)記為1)1 507次,室性早搏心搏(數(shù)據(jù)庫標(biāo)記為5)520次,將正常心搏和室性早搏心搏數(shù)據(jù)混合。
實(shí)驗(yàn)對正常心搏和室性早搏心搏分類,自組織神經(jīng)網(wǎng)絡(luò)使用4個(gè)輸出。神經(jīng)元按照從左到右,從下到上編號1#,2#,3#,4#。
數(shù)據(jù)分類之后,神經(jīng)元之間的距離如圖1。神經(jīng)元的距離是相應(yīng)權(quán)重向量的歐氏距離,神經(jīng)元之間的顏色代表相鄰神經(jīng)元之間的距離。顏色越深,距離越大,顏色越亮,距離越小。1#和2#神經(jīng)元距離最近,3#和4#神經(jīng)元距離最遠(yuǎn)。
圖1 權(quán)重向量距離
聚類結(jié)果輸出如圖2。每一個(gè)神經(jīng)元內(nèi)部的數(shù)字表示該分類結(jié)果中包含的心電波形總數(shù)量。1#神經(jīng)元對應(yīng)967個(gè)心搏,2#神經(jīng)元對應(yīng)619個(gè)心搏,3#神經(jīng)元對應(yīng)228個(gè)心搏,4#神經(jīng)元對應(yīng)213個(gè)心搏。將這些數(shù)據(jù)分類結(jié)果進(jìn)行統(tǒng)計(jì),見表1。
圖2 聚類結(jié)果
分類正常心搏室性早搏1944232562573122740213
根據(jù)SOM的篩檢結(jié)果表2,得到真陽性率為84.2 %,假陽性率接近0 %。
表2 陽性率統(tǒng)計(jì)數(shù)據(jù)表
項(xiàng)目 金標(biāo)準(zhǔn)陽性陰性合計(jì)自組織神經(jīng)網(wǎng)絡(luò)篩檢結(jié)果陽性陰性440 80 11506 4411586合計(jì)52015072027
圖3為權(quán)重向量位置圖,由圖可見輸入的標(biāo)準(zhǔn)心電向量集中在上部,上部的兩個(gè)神經(jīng)元是1#和2#神經(jīng)元,處于下部的兩個(gè)神經(jīng)元是3#和4#神經(jīng)元。
圖3 權(quán)重向量位置
實(shí)驗(yàn)中,輸入SOM的是四維向量,輸出二維平面空間,輸入向量的每個(gè)元素對神經(jīng)元都有權(quán)重貢獻(xiàn)。輸入向量每個(gè)元素對輸出神經(jīng)元的貢獻(xiàn)度統(tǒng)計(jì)如表3。
表3中可以得到結(jié)論:輸入向量的第一元素對2#神經(jīng)元貢獻(xiàn)最大,對4#神經(jīng)元貢獻(xiàn)最小。輸入向量的第二元素對3#神經(jīng)元貢獻(xiàn)最大,對4#神經(jīng)元貢獻(xiàn)最小。輸入向量第三元素對4#神經(jīng)元貢獻(xiàn)最大,對1#神經(jīng)元貢獻(xiàn)最小。輸入向量第四元素對3#神經(jīng)元貢獻(xiàn)最大,對4#神經(jīng)元貢獻(xiàn)最小。
表3 元素貢獻(xiàn)度統(tǒng)計(jì)
輸入向量維度序數(shù)每個(gè)元素對神經(jīng)元貢獻(xiàn)度從高到低排序一2134二3214三4231四3124
至此,使用SOM完成了106#心電數(shù)據(jù)波形聚類過程,真陽性率為84.2 %,假陽性率接近0 %。使用此算法對MIT—BIH的所有包含心率失常和正常心搏的數(shù)據(jù)文件進(jìn)行聚類統(tǒng)計(jì),得到表4。
表4 所有心電文件陽性率統(tǒng)計(jì)
文件號正常心搏個(gè)數(shù)室性早搏個(gè)數(shù)真陽性率/%假陽性率/%100223910010299475.0010416320010525264100106150752084.201081739170011418204397.70116230210997.21.41191543444100012118611001231515300200174382690.30.2201162519899.00.320220611900203252944485.11.920525717197.20208158699298.32.12092621100210242319479.40213264122093.60215319516489.0021724416287.71.221920816400221203139696.70223202947371.59.5228168836295.02.8230225510023131421000233223083196.20.22342700300
表4中的真陽性率統(tǒng)計(jì)數(shù)據(jù)變化非常大,分布在兩個(gè)極端,一部分接近100 %,一部分接近0 %,假陽性率所有統(tǒng)計(jì)接近0 %。真陽性率和假陽性率均為0的原因是室性早搏心搏數(shù)量過少,室性早搏心搏數(shù)目與正常心搏數(shù)量比例過低。SOM在數(shù)據(jù)分類過程中,神經(jīng)元的權(quán)重向量要依據(jù)輸入向量調(diào)整,心搏數(shù)據(jù)過少會使室性早搏類型神經(jīng)元學(xué)習(xí)受阻,整個(gè)數(shù)據(jù)訓(xùn)練學(xué)習(xí)過程權(quán)重向量調(diào)整有限,并且容易受到正常心搏向量的影響,使權(quán)重向量偏向正常心搏向量。在結(jié)果中沒有分出室性早搏類型,從而出現(xiàn)真陽性率和假陽性率均為0的情況?;赟OM的心電聚類算法適用于室性早搏數(shù)量較多的情況。
為進(jìn)一步統(tǒng)計(jì)結(jié)果,舍去表4中真假陽性率均為0的情況,對其他心電數(shù)據(jù)文件的真假陽性率取均值,得到真陽性率均值為91.2 %,假陽性率均值為1.03 %。在室性早搏心搏占比高的心電數(shù)據(jù)中,基于SOM的聚類算法可以有效對室性早搏心搏和正常心搏分類。
本文使用埃爾米特函數(shù)和SOM實(shí)現(xiàn)聚類算法,用輸入向量的不同元素分量對聚類結(jié)果進(jìn)行貢獻(xiàn)度分析,完成心電波形聚類統(tǒng)計(jì)。聚類結(jié)果平均真陽性率為91.2 %,平均假陽性率為1.03 %。在室性早搏占比高的動(dòng)態(tài)心電圖中,算法有效,達(dá)到了將心電波形聚類的目標(biāo)。
[1] 李 婧,劉知貴,彭桂力,等.心電檢測技術(shù)及其在遠(yuǎn)程醫(yī)療中的應(yīng)用[J].傳感器與微系統(tǒng),2008,27(1):1-3.
[2] 朱 非.室性早搏的檢測與心電分類技術(shù)的研究[D].天津:天津大學(xué),2005.
[3] 徐 毓,李 鋒,金以慧.基于聚類融合的多目標(biāo)跟蹤算法[J].傳感器技術(shù),2002,21(7):31-34.
[4] Laguna P,Jane R,Olmos S,et al.Adaptive estimation of QRS complex wave features of ECG signal by the Hermite model[J].Medical & Biological Engineering & Computing,1996,34(1):58-68.
[5] Philip de Chazal,Maria O’Dwyer,Richard B Reilly.Automatic classification of heartbeats using ECG morphology and heartbeat interval features[J].IEEE Transactions on Biomedical Enginee-ring,2004,1(7):1196-1206.
[6] Linh T H,Osowski S,Stodolski M.On-line heart beat recognition using Hermite polynomials and neuro-fuzzy network[J].IEEE Transactions on Instrumentation & Measurement,2003,52(4):1224-1231.
[7] Martin Lagerholm,Carsten Peterson,Guido Braccini,et al.Clustering ECG complexes using hermite functions and self-organizing maps[J].IEEE Transactions on Biomedical Engineering,2000,47(7):838-848.
Method for QRS wave clustering using self-organizing neural network
SUN Kuo1,2, WANG Yun-feng2, XU Jing-bo2, ZHANG Hai-ying2
(1.School of Electronic,Electrical and Communication Engineering,University of Chinese Academy of Sciences,Beijing 101407,China; 2.Beijing Key Laboratory for Next Generation RF Communication Chip Technology,Institute of Microelectronics of Chinese Academy of Sciences,Beijing 100029,China)
To improve the efficiency when checking the morphology of the large dataset of a dynamic ECG and cluster QRS complexes,a method for QRS clustering is realized using Hermite functions and self-organizing neural network with premature ventricular contraction in high proportion. Using MIT-BIH arrhythmia database,a QRS complex is decomposed into a QRS vector by Hermit functions.All the vectors are input into self-organizing neural network for clustering.Elements of the vectors are used to analyze the clustering result. Positive rate is used to give a statistics result.Method achieves an average true positive rate of 91.2 % and an average false positive rate of 1.03 %.The method is effective in clustering using self-organizing neural network.The aim of clustering normal beats and premature ventricular contraction beats is attained.
QRS; clustering; Hermite functions; self-organizing neural network; positive rate
10.13873/J.1000—9787(2017)02—0061—03
2016—04—01
R 318; TP 183
A
1000—9787(2017)02—0061—03
孫 括(1988-),男,碩士研究生,研究方向?yàn)樯镝t(yī)學(xué)傳感器、新型醫(yī)療電子設(shè)備以及信號處理。