收稿日期:2023-04-27
DOI:10.19850/j.cnki.2096-4706.2023.21.010
摘" 要:采用集合經(jīng)驗(yàn)?zāi)B(tài)分解的功率歸一化倒譜系數(shù)(Power Normalized Cepstral Coefficients base on EEMD, EPNCC)作為人體脈搏時(shí)域的補(bǔ)充特征,把多周期人體脈搏信號(hào)的時(shí)域及EPNCC特征進(jìn)行融合后,作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,開展人體脈搏特征的提取、識(shí)別及分類研究。采用從MIT-BIH-MIMIC數(shù)據(jù)庫(kù)得到的呼吸衰竭、肺水腫、心源性休克三種臨床脈搏信號(hào),借助上述方法開展了實(shí)驗(yàn)研究,實(shí)驗(yàn)結(jié)果表明,脈搏特征識(shí)別及分類準(zhǔn)確率達(dá)到95.7%,識(shí)別及分類效果較好。
關(guān)鍵詞:脈搏特征提取;功率歸一化倒譜系數(shù);集合經(jīng)驗(yàn)?zāi)B(tài)分解;卷積神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào):TP391" 文獻(xiàn)標(biāo)識(shí)碼:A" 文章編號(hào):2096-4706(2023)21-0040-04
Feature Extraction and Pathological Diagnosis Methods for Human Pulse
CHEN Guangxin, CHEN Haichu
(School of Mechatronic Engineering and Automation, Foshan University, Foshan" 528200, China)
Abstract: Using the Power Normalized Cepstral Coefficients base on EEMD (EPNCC) of Ensemble Empirical Mode Decomposition as a supplementary feature of the human pulse time domain, the time-domain and EPNCC features of multi cycle human pulse signals are fused as inputs to the Convolutional Neural Networks to carry out research on the extraction, recognition, and classification of human pulse features. Experimental research is conducted using three clinical pulse signals, namely respiratory failure, pulmonary edema, and cardiogenic shock, obtained from the MIT-BIH-MIMIC database. The experimental results shows that the accuracy of pulse feature recognition and classification reaches 95.7%, and the recognition and classification effect is good.
Keywords: pulse feature extraction; Power Normalized Cepstral Coefficient; Ensemble Empirical Mode Decomposition; Convolutional Neural Networks
0" 引" 言
號(hào)脈診療法在中醫(yī)領(lǐng)域是一種極為重要的病情診斷方法。人體脈搏信號(hào)往往蘊(yùn)含著人體心臟、心血管疾病等重要信息,現(xiàn)階段人體脈搏信號(hào)主要應(yīng)用在心率或血壓計(jì)算上,通過(guò)光電容積脈搏波(Photo Plethysmo Graphy, PPG)信號(hào)來(lái)估算心率。無(wú)論是中醫(yī)切脈還是西醫(yī)心血管疾病檢查,都試圖從脈搏波特征中提取各種生理病理信息。隨著傳感器技術(shù)的不斷發(fā)展,脈搏信號(hào)的成功采集對(duì)脈搏信號(hào)的分析起到了至關(guān)重要的作用。
文獻(xiàn)[1,2]中采用光電描記法設(shè)計(jì)脈搏采集電路實(shí)現(xiàn)對(duì)人體脈搏信號(hào)的有效獲取。文獻(xiàn)[3]中提出一種用于識(shí)別光電容積脈搏波特征點(diǎn)的自動(dòng)識(shí)別算法,以較高的準(zhǔn)確率搜尋到脈搏波的波峰點(diǎn)及波谷點(diǎn)。文獻(xiàn)[4,5]中分別以脈搏波的面積變化和四個(gè)特定點(diǎn)之間的斜率與周期作為脈搏特征進(jìn)行脈搏波分析,能夠很好地反映心血管系統(tǒng)中的生理因素并找到最佳周期脈搏波,輔助醫(yī)生進(jìn)行診斷。文獻(xiàn)[6]中通過(guò)PPG信號(hào)的一階和二階導(dǎo)數(shù)提取時(shí)域特征信號(hào)并根據(jù)特征對(duì)生物識(shí)別的貢獻(xiàn)進(jìn)行排名,最后使用k-NN分類器進(jìn)行驗(yàn)證,平均準(zhǔn)確率在90.7%左右。
1" 原理與方法
1.1" PNCC脈搏特征提取
本文采用基于改進(jìn)EEMD的PNCC方法來(lái)獲取頻域特征。首先采用EEMD方法對(duì)脈搏周期信號(hào)進(jìn)行分解,分解步驟如圖1所示。
脈搏信號(hào)經(jīng)過(guò)分解后,可得到一系列的集合模態(tài)分量。通過(guò)對(duì)脈搏信號(hào)分解后的IMFS分量進(jìn)行相關(guān)性研究,從中挑選出能夠表征人體脈搏信號(hào)的分征量。相關(guān)性分析能夠反映各IMF分征量與原始PPG信號(hào)的相干程度,相干系數(shù)表達(dá)式為:
其中,fx(i)表示第i個(gè)IMF分量;Sk(i)表示原始PPG信號(hào)與fx(i)的差值。通過(guò)設(shè)定合適的系數(shù)閾值篩選出對(duì)應(yīng)的相干IMFS。
PPG信號(hào)經(jīng)過(guò)集合經(jīng)驗(yàn)?zāi)B(tài)分解處理后,將分量排列并用矩陣IMFn = [imf1,imf2,…,imfn]表示?;诩辖?jīng)驗(yàn)?zāi)B(tài)分解改進(jìn)的功率歸一化倒譜系數(shù)特征提取步驟如下:
1)估計(jì)IMFn中每個(gè)分量的功率譜。
2)經(jīng)過(guò)功率譜計(jì)算后,將功率估計(jì)值輸入伽馬通濾波器中進(jìn)行濾波處理。
3)伽馬通濾波器經(jīng)過(guò)濾波后,對(duì)其進(jìn)行功率歸一化處理。
4)對(duì)冪函數(shù)進(jìn)行非線性處理,其表達(dá)式為Pow = ,?表示指數(shù)因子,一般選擇0<?<1。本文所設(shè)定的指數(shù)冪為1/15。
5)對(duì)經(jīng)過(guò)非線性處理的信號(hào)進(jìn)行離散余弦變換后,改進(jìn)的功率歸一化倒譜特征系數(shù)可以表示為yn。
經(jīng)過(guò)上述步驟后,可得到改進(jìn)的功率歸一化倒譜系數(shù)的脈搏特征信息。后續(xù)將該特征作為補(bǔ)充特征與多周期時(shí)域特征進(jìn)行融合,使得人體脈搏特征信號(hào)得以完整表征。
1.2" 脈搏時(shí)域特征提取
本文將采集到的脈搏信號(hào)分割為多周期形式作為數(shù)據(jù)樣本,選取脈搏周期樣本數(shù)據(jù)的個(gè)數(shù)為5[7,8]。把整個(gè)脈搏周期樣本用于表達(dá)時(shí)域變化,并用于與上述所得的基于EEMD的PNCC脈搏特征進(jìn)行融合,輸入到卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行分析。
1.3" 脈搏時(shí)頻特征融合及網(wǎng)絡(luò)結(jié)構(gòu)
搭建用于脈搏信號(hào)分類的卷積神經(jīng)網(wǎng)絡(luò),首先把頻域特征與時(shí)域特征進(jìn)行混疊,作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,然后對(duì)混疊特征進(jìn)行識(shí)別及分類,結(jié)構(gòu)如圖2所示。
其中,圖2中的卷積模塊1、卷積模塊2均包含一個(gè)卷積層和一個(gè)池化層,每層參數(shù)如表1所示。
該方法對(duì)脈搏周期信號(hào)的時(shí)域特征和頻域特征進(jìn)行歸一化處理及融合后,再輸入到卷積網(wǎng)絡(luò)中進(jìn)行處理,最后將經(jīng)過(guò)全連接層的輸出結(jié)果輸入到Softmax分類器進(jìn)行人體脈搏特征分類。Softmax的表達(dá)式為:
其中,zk表示前級(jí)輸出單元的輸出,k表示類別的索引號(hào),K表示總類別數(shù)。
在對(duì)脈搏波數(shù)據(jù)進(jìn)行預(yù)處理后,將脈搏波的時(shí)域特征、頻域特征輸入到卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行特征訓(xùn)練,采用Softmax分類器進(jìn)行脈搏波分類,從而實(shí)現(xiàn)人體脈搏分類診斷。
脈搏特征分類在Softmax中分類輸出表示為:
其中,向量M僅在所對(duì)應(yīng)脈搏分類類別處為1,文中采用[0,0,1]表示心源性休克臨床癥狀,[0,1,0]表示呼吸衰竭臨床癥狀,[1,0,0]表示CHF肺水腫臨床癥狀。
由于脈搏特征數(shù)據(jù)結(jié)構(gòu)簡(jiǎn)單,文中選取的網(wǎng)絡(luò)模型結(jié)構(gòu)上僅由兩個(gè)卷積模塊、兩個(gè)全連接層組成。網(wǎng)絡(luò)訓(xùn)練對(duì)于數(shù)據(jù)集的選取會(huì)有一定的影響,因此本文通過(guò)對(duì)原始脈搏分割處理得到的脈搏數(shù)據(jù)樣本共780組。對(duì)脈搏數(shù)據(jù)樣本進(jìn)行隨機(jī)分配,其中70%作為訓(xùn)練集,30%作為測(cè)試集。
2" 結(jié)果與討論
2.1" 數(shù)據(jù)獲取及預(yù)處理
脈搏數(shù)據(jù)來(lái)源于美國(guó)麻省理工學(xué)院提供的MIT-BIH-MIMIC數(shù)據(jù)庫(kù)中ICU重癥對(duì)應(yīng)的三類臨床癥狀脈搏數(shù)據(jù)樣本,其中39例患者的臨床癥狀分為三類:16例為CHF肺水腫、10例為呼吸衰竭、13例為心源性休克。
脈搏數(shù)據(jù)集提取過(guò)程為:首先對(duì)截取的脈搏信號(hào)段進(jìn)行波峰點(diǎn)搜尋,然后根據(jù)波峰點(diǎn)進(jìn)行分組分割處理。波峰點(diǎn)搜尋采用MATLAB中的findpeaks函數(shù),該函數(shù)能夠通過(guò)設(shè)定閾值及點(diǎn)間界限來(lái)獲取脈搏波形中的局部峰值。根據(jù)幅值設(shè)置閾值大小,例如,該處的脈搏信號(hào)最大峰值均在0.2以上,因此閾值設(shè)定為0.2,經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證點(diǎn)間界限,設(shè)定為60僅能記錄出最大峰值點(diǎn)。
對(duì)脈搏原始數(shù)據(jù)進(jìn)行分割,獲取20組脈搏PPG信號(hào)樣本,共計(jì)780組脈搏數(shù)據(jù)用于網(wǎng)絡(luò)模型構(gòu)建,其中546組為訓(xùn)練集,234組為測(cè)試集。分割后脈搏PPG樣本示例圖如圖3所示,脈搏PPG樣本EEMD分解示例圖如圖4所示。在脈搏信號(hào)經(jīng)過(guò)EEMD分解及相干性處理后對(duì)其進(jìn)行PNCC處理,得到EPNCC特征數(shù)據(jù),如圖5所示。
2.2" 網(wǎng)絡(luò)仿真結(jié)果與分析
將多周期脈搏數(shù)據(jù)與經(jīng)EEMD-PNCC法提取的脈搏特征融合輸入到網(wǎng)絡(luò)進(jìn)行訓(xùn)練及分類驗(yàn)證。網(wǎng)絡(luò)超參數(shù)經(jīng)過(guò)實(shí)驗(yàn)后,最終選擇SGDM優(yōu)化器來(lái)控制學(xué)習(xí)速度,初始學(xué)習(xí)率為0.01,學(xué)習(xí)率降低系數(shù)為0.7,最大迭代周期為50。對(duì)脈搏數(shù)據(jù)集進(jìn)行訓(xùn)練并對(duì)測(cè)試集進(jìn)行驗(yàn)證后得到如圖6所示的分類混淆矩陣數(shù)據(jù)圖。
此外,還對(duì)兩個(gè)單項(xiàng)目進(jìn)行了實(shí)驗(yàn)分析。所有實(shí)驗(yàn)均采用546組脈搏數(shù)據(jù)作為訓(xùn)練集,234組脈搏數(shù)據(jù)作為測(cè)試集,具體實(shí)驗(yàn)結(jié)果如表2所示。
在表2中,每一行的實(shí)驗(yàn)數(shù)據(jù)分別對(duì)應(yīng)表2標(biāo)題中的召回率、精確率及準(zhǔn)確率數(shù)據(jù)。
為了凸顯本文方法所獲取結(jié)果的有效性,與采用相同數(shù)據(jù)庫(kù)脈搏進(jìn)行分析的文獻(xiàn)進(jìn)行了比對(duì),具體如表3所示。
本文還針對(duì)其他分解方法進(jìn)行了實(shí)驗(yàn)比對(duì)分析,其中包括VMD-PNCC、CEEMD-PNCC、CEEMDAN-PNCC,得到的結(jié)果如表4所示。
其中,R表示召回率,P表示精確率。
由圖6混淆矩陣可知,通過(guò)將多周期脈搏信號(hào)與EPNCC處理的脈搏信號(hào)特征相融合,計(jì)算所得的分類識(shí)別準(zhǔn)確率為95.7%。從圖6中可以看出三類臨床的脈搏對(duì)模型的敏感程度有些許差異,但基本都適應(yīng)該模型的分類需求。分析表2可知,經(jīng)過(guò)對(duì)比實(shí)驗(yàn)后僅采用多周期脈搏特征或僅采用頻域特征進(jìn)行識(shí)別分類時(shí),各項(xiàng)指標(biāo)均有所下降。脈搏信號(hào)特征大部分都在時(shí)域中進(jìn)行表征,因此可以明顯看出,僅采用時(shí)域時(shí)的分類準(zhǔn)確率要比僅采用頻域時(shí)高2.5%左右。而把EPNCC作為時(shí)域特征的補(bǔ)充,融合后進(jìn)行分類的準(zhǔn)確率要比僅采用時(shí)域特征時(shí)提高4.7%。因此可以看出,采用EPNCC與多周期脈搏融合能夠使人體脈搏特征表征得更加完整,差異性突顯更利于卷積神經(jīng)網(wǎng)絡(luò)的分類識(shí)別。
由表3可知,文獻(xiàn)[7]中采用MFCC獲取頻域特征并與周期脈搏時(shí)域特征進(jìn)行混疊,最后獲得93.75%的分類識(shí)別準(zhǔn)確率。相比于文獻(xiàn)[7]脈搏信號(hào)特征,本文所用方法的識(shí)別準(zhǔn)確率提高近2%。雖然識(shí)別準(zhǔn)確率的提高僅有2%,但在數(shù)據(jù)輸入維度上,本文所用方法比文獻(xiàn)[7]降低了1/3.5。與文獻(xiàn)[8]相比分類準(zhǔn)確率提高3.82%,數(shù)據(jù)輸入維度降低1/1.5。由表4可知,其他分解方法與PNCC結(jié)合所得的分類結(jié)果分別為78.6%、88.5%和82.1%。EPNCC所得的分類結(jié)果為88.5%,由此可知EPNCC與CEEMDAN-PNCC所得的分類識(shí)別準(zhǔn)確率基本一致,均比VMD和CEEMD兩種分解方法所得的結(jié)果要好。由于EEMD與CEEMDAN分解所得的模態(tài)分量基本相同,所得的分類結(jié)果也基本相同,但CEEMDAN的計(jì)算過(guò)程比EEMD復(fù)雜,因此EPNCC滿足分類識(shí)別需求,更適于作為人體脈搏時(shí)域特征的補(bǔ)充。
3" 結(jié)" 論
文中采用EPNCC來(lái)提取人體脈搏特征,將其與多周期脈搏信號(hào)進(jìn)行融合。時(shí)域和頻域混合的特征經(jīng)過(guò)卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練及分類得到95.7%的準(zhǔn)確率。經(jīng)過(guò)EPNCC處理能夠很好地將人體脈搏微小特征放大,使得差異性更為明顯。但目前受限于脈搏數(shù)據(jù)的獲取途徑,僅針對(duì)心源性休克、呼吸衰竭、肺水腫三種癥狀脈搏數(shù)據(jù)展開實(shí)驗(yàn)研究。雖然本文方法所得到的脈搏診斷模型局限性較大,但未來(lái)可通過(guò)遷移學(xué)習(xí)的方法予以完善和提升。
參考文獻(xiàn):
[1] 陳斌.光電容積脈搏波描記法原理、應(yīng)用及其電路設(shè)計(jì) [J].電子技術(shù)與軟件工程,2014(18):132-133.
[2] 胡凱麗,金杰,張瑞峰.稀疏恢復(fù)的梯度投影算法在PPG信號(hào)重建中的研究 [J].中國(guó)生物醫(yī)學(xué)工程學(xué)報(bào),2017,36(5):536-542.
[3] 李思楠,王素新.一種光電容積脈搏波的特征點(diǎn)自動(dòng)識(shí)別算法 [J].醫(yī)用生物力學(xué),2019,34(4):358-364.
[4] 羅志昌,張松,楊文鳴,等.脈搏波波形特征信息的研究 [J].北京工業(yè)大學(xué)學(xué)報(bào),1996(1):71-79.
[5] CHEN H C,KUO S S,SUN S C,et al. A Distinguishing Arterial Pulse Waves Approach by Using Image Processing and Feature Extraction Technique [J].Journal of Medical Systems,2016,40(10):215.
[6] KAVSAO?LU A R,POLAT K,BOZKURT M R. A novel feature ranking algorithm for biometric recognition with PPG signals [J].Computers in Biology and Medicine,2014,49:1-14.
[7] 劉國(guó)華,周文斌.基于卷積神經(jīng)網(wǎng)絡(luò)的脈搏波時(shí)頻域特征混疊分類 [J].吉林大學(xué)學(xué)報(bào):工學(xué)版,2020,50(5):1818-1825.
[8] 郭成龍,陳海初,王志鋒.基于HHT的人體脈搏特征識(shí)別及分類研究 [J].電子測(cè)量技術(shù),2021,44(19):116-121.
作者簡(jiǎn)介:陳廣新(1998—),男,漢族,廣東佛山人,碩士研究生在讀,主要研究方向:移動(dòng)機(jī)器人、信號(hào)處理。