吳紹武,續(xù)育茹
(北京工業(yè)大學(xué)數(shù)理學(xué)院,北京 100124)
血壓作為判斷人體健康的一個重要生理指標(biāo),它能夠直接或間接地反映人體心臟的泵血功能、心率、血管受到的阻力、血管血容量等狀況,對于輔助診斷心血管疾病具有重要意義。
當(dāng)前,日常生活中測量血壓常用的方法主要有示波法、柯氏音法、水銀式血壓計、電子血壓計等,其中水銀式血壓計被公認是無創(chuàng)血壓測量的“金標(biāo)準(zhǔn)”[1]。但由于水銀式血壓計操作要求較高,對于老弱群體極不方便[2]。電子血壓計的原理大多是示波法[3-6],但該方法仍存在不足之處,其檢測精度無法從根本上得到解決[7]。
目前,多數(shù)研究都是利用光電容積脈搏波(PPG)技術(shù)來檢測脈搏波波形,進而間接地檢測血壓[8]。由于PPG信號具有易采集、成本低的特點而被廣泛應(yīng)用于血壓、血氧飽和度等的研究,所以如果PPG信號可以高精度的檢測血壓,那么它將可以替代一些繁瑣的血壓檢測方法,對高血壓患者或需時刻檢測血壓的人提供重要幫助。本研究基于PPG信號,利用LightGBM算法對血壓進行檢測,與以往研究不同的是,本研究加入了歷史血壓數(shù)據(jù)。研究表明該方法能夠獲得更高的精度,其對于個性化血壓檢測以及臨床上的血壓檢測均具有一定的參考意義。
PPG技術(shù)是一種無創(chuàng)檢測血液容積變化的方法,其原理主要基于朗伯比爾定律和光散射理論[9-10]。當(dāng)光束(大多為紅光或綠光)照射到表皮面時,光束通過穿透(或者反射)的方式被一端(或者同端)的光電接收器接收。而在此過程中,由于肌肉組織和血液的吸收衰減作用,接受器接收到的光強度呈周期性變化[10-11]。把光電接收器接收到的光信號轉(zhuǎn)換成電信號,即可獲得PPG信號。
LightGBM模型是GBDT(gradient boosting decision tree,GBDT)算法的一種改進,它是2016年微軟亞洲研究院公布的一個開源、快速、高效的算法框架,其核心原理基于決策樹算法。它被用于分類、回歸等多種機器學(xué)習(xí)的任務(wù),且被證明了在達到相同的精度下,LightGBM的計算速度比其他模型算法快20倍。其主要原理如下[12-13]:
(1)初始化m棵決策樹,訓(xùn)練樣本的權(quán)重為1/m;
(2)訓(xùn)練子模型f(x);
(3)決定該子模型的話語權(quán)?;
(4)更新權(quán)重ε;
(5)得到最終的模型:
Fm(x)=?0f0(x)+?1f1(x)+…+?mfm(x)
(1)
本研究所使用的數(shù)據(jù)來自MIMIC數(shù)據(jù)庫,該數(shù)據(jù)庫是MIT麻省理工下屬管理的一個公共臨床數(shù)據(jù)庫[14]。我們選取了其中12 000條樣本,每條樣本包含患者的PPG信號、血壓(BP)信號以及心電信號。
由于信號序列的長度長短不一,我們初步篩選了其中序列長度大于2 000個點的樣本,以保證該序列樣本能夠包含足夠多的周期,方便后續(xù)的進一步研究。
考慮到波傳播的延遲性,脈搏波信號的傳達時間和血壓信號的傳達時間不是同步的。為了保證脈搏波信號和血壓信號的同時性,我們選擇特征提取的PPG信號區(qū)間,以及其對應(yīng)的血壓目標(biāo)區(qū)間,見圖1。
圖1 血壓信號和脈搏波信號示意圖Fig.1 Schematic diagram of blood pressure signal and pulse wave signal
本研究中,我們以PPG信號為參照對象,確定特征提取區(qū)間后,最終提取的特征主要包括:兩個波谷點到波峰的水平距離、兩個波谷點的水平距離、兩個波谷值與波峰值的縱向距離、兩個波谷到波峰的斜率、該周期內(nèi)的統(tǒng)計特征(包括平均值、標(biāo)準(zhǔn)差、總和以及中位數(shù))、當(dāng)前時刻的前一時刻的舒張壓和收縮壓。
對于訓(xùn)練標(biāo)簽舒張壓和收縮壓的選取,我們以PPG波形的波峰點對應(yīng)的時間為中心,在其前一個周期內(nèi),血壓中的最大值為收縮壓;之后以該收縮壓為中心點,其后一個周期內(nèi)的最小值作為舒張壓。
考慮到異常值的影響,我們對特征提取后的樣本進行異常值處理。為了方便,我們直接使用剔除的方法,剔除的原則是連續(xù)兩個收縮壓相差不大于40 mmHg,連續(xù)兩個舒張壓相差不大于60 mmHg。最終,我們得到有效樣本總數(shù)為8 736條。
為了評估模型的性能,我們選擇平均絕對誤差(mean absolute error,MAE)和均方根誤差(root mean square error, RMSE)進行評估,其表達式分別如下:
(2)
(3)
其中yobs,i是真實值,ymodel,i是模型預(yù)測值,n是樣本總數(shù)。
我們通過LightGBM模型,對舒張壓和收縮壓分別進行了10折的交叉驗證。結(jié)果表明,收縮壓的MAE為4.710 mmHg,RMSE為7.551 mmHg;舒張壓的MAE為2.041 mmHg,RMSE為3.450 mmHg。其MAE均小于5 mmHg,RMSE均小于8 mmHg,達到了AAMI國際電子血壓計的標(biāo)準(zhǔn)。血壓預(yù)測結(jié)果與真實值的分布情況見圖2。
圖2 真實血壓和預(yù)測血壓的分布圖Fig.2 Distribution of real and predicted blood pressure
由圖2可以發(fā)現(xiàn),模型預(yù)測結(jié)果除了個別樣本的預(yù)測誤差較大外,大部分的樣本預(yù)測誤差均比較小。為了進一步分析模型的擬合效果,我們分別計算了誤差小于5、10、15 mmHg的樣本所占百分比,結(jié)果見表1。
表1 預(yù)測誤差分別小于5、10、15 mmHg的百分比Table 1 Percentage of prediction errors less than 5 mmHg,10 mmHg and 15 mmHg respectively
從表1可知,預(yù)測誤差小于5 mmHg的樣本,收縮壓占到71%,而舒張壓占到91%;誤差小于10 mmHg的樣本,收縮壓占到87%,而舒張壓占到97%;誤差小于15 mmHg的樣本,收縮壓占到93%,而舒張壓占到99%。從結(jié)果還可以看出,舒張壓的預(yù)測結(jié)果明顯優(yōu)于收縮壓,同時也說明LightGBM模型很好地學(xué)到了其中的特征。
表2是本研究方法與其他研究方法的對照。從表2可以發(fā)現(xiàn),本研究方法中舒張壓的誤差均優(yōu)于其他方法;收縮壓優(yōu)于人工神經(jīng)網(wǎng)絡(luò)ANN模型,而劣于線性回歸模型,我們分析其主要原因可能是因為測試數(shù)據(jù)不一致導(dǎo)致的。相比其他方法,本研究方法簡單高效,易于實現(xiàn),不用進行小波分解、多級建模等復(fù)雜過程也可獲得較高的精度,其對波形的檢測以及可穿戴設(shè)備的血壓檢測具有一定的參考價值。
表2 本研究方法與其他方法的誤差對比Table 2 Comparison of errors between this researchmethod and other methods
為了獲得更高的精度,我們可進一步地去噪處理,并嘗試對PPG波形進行分解,找出與血壓更相關(guān)的波形。當(dāng)然,結(jié)合歷史血壓數(shù)據(jù),血壓的檢測問題可以轉(zhuǎn)換為異常檢測的二分類問題與回歸問題相結(jié)合,這也是我們下一步的研究方向。
本研究基于PGG信號,以及歷史血壓數(shù)據(jù),提取了時域上的17個特征參數(shù),作為模型的特征輸入,通過LightGBM模型進行10折交叉驗證,獲得了較高的血壓預(yù)測精度。本研究所使用的方法,有利于可穿戴設(shè)備的個性化血壓檢測,以及血壓檢測在臨床上的應(yīng)用。