徐馨荷, 王曉飛
(北京信息科技大學(xué) 儀器科學(xué)與光電工程學(xué)院,北京 100192)
血糖是人體一項(xiàng)極為重要的生理指標(biāo),血糖濃度的相對(duì)恒定對(duì)維持機(jī)體,尤其是腦、神經(jīng)的正常生理功能有著非常重要的意義[1-2]。目前血糖濃度測(cè)量方法主要有自動(dòng)生化儀測(cè)量法和快速血糖儀測(cè)量法[3],都是通過(guò)采血的方式來(lái)檢測(cè)血糖值,給患者帶來(lái)創(chuàng)傷,對(duì)患者長(zhǎng)時(shí)間的血糖監(jiān)測(cè)不利,故無(wú)創(chuàng)血糖檢測(cè)的實(shí)現(xiàn)具有十分重要的現(xiàn)實(shí)意義。然而,由于信號(hào)微弱、測(cè)量條件變化復(fù)雜、人體生理背景難以定量等問(wèn)題對(duì)光譜測(cè)量的影響進(jìn)而導(dǎo)致血糖預(yù)測(cè)精度不高,達(dá)不到臨床使用需求,是目前近紅外無(wú)創(chuàng)光譜血糖測(cè)量突出的難題[4-5]。因此探究新的測(cè)量方法以克服測(cè)量條件、人體生理背景等對(duì)光譜測(cè)量的影響來(lái)提高測(cè)量精度,對(duì)全面實(shí)現(xiàn)血糖的無(wú)創(chuàng)測(cè)量具有重要意義。
“M+N”理論[6-7]從誤差理論的角度分析測(cè)量系統(tǒng)和測(cè)量過(guò)程,將被測(cè)對(duì)象自身的差異和其他干擾因素一同歸于整個(gè)測(cè)量系統(tǒng)中,系統(tǒng)地考慮兩者對(duì)測(cè)量精度的影響。本文研究無(wú)創(chuàng)血糖測(cè)量中的影響因素,并根據(jù)“M+N”理論將影響因素分成“M”因素和“N”因素,依據(jù)影響因素的特性采用不同的方法減小其對(duì)血糖預(yù)測(cè)值的影響。
“M+N”理論中“M”表示被測(cè)對(duì)象中的M種非測(cè)量組分;“N”表示影響被測(cè)成分測(cè)量精度的N種外界干擾因素[6]。其提高測(cè)量精度的關(guān)鍵在于將“M”因素與“N”因素同等對(duì)待,判斷其為系統(tǒng)誤差還是隨機(jī)誤差,同時(shí)提出必要的解決辦法。圖1所示為“M+N”理論框圖。
圖1中影響因素E1、E2、E3、E4如表1所示。其中:E1為影響血糖測(cè)量的血液組分及其他非測(cè)量組分[8];E3是現(xiàn)今無(wú)創(chuàng)血糖測(cè)量研究的熱門(mén)之一;E2和E4分別是“M”因素和“N”因素中隨機(jī)誤差的典型代表。
根據(jù)各因素的不同屬性對(duì)其有不同的處理方法來(lái)降低其對(duì)血糖測(cè)量值的影響,本文采用單沿提取法減小接觸壓力帶來(lái)的影響,并將甘油三酯、高密度脂蛋白膽固醇、血清總膽固醇、年齡納入模型中,系統(tǒng)地考慮這4種因素對(duì)血糖測(cè)量值的影響[8-9]。
圖1“M+N”理論結(jié)構(gòu)框圖
表1 “M”因素和“N”因素的分類(lèi)
圖2所示為基于“M+N”理論的人體試驗(yàn)系統(tǒng),其中光源為50 W的溴鎢燈,實(shí)驗(yàn)所用光譜儀為AvaSpec-HS1024x58TEC高靈敏度型光纖光譜儀,波長(zhǎng)范圍為200~1 160 nm。本次實(shí)驗(yàn)被測(cè)對(duì)象為239名患者,受測(cè)者平臥放松將食指指端完全遮擋住光纖入口,光源發(fā)出的光聚焦透過(guò)手指后,由光譜儀直接進(jìn)行光譜數(shù)據(jù)的采集,并由計(jì)算機(jī)保存采集到的光譜數(shù)據(jù)。
光譜數(shù)據(jù)采集完成后,對(duì)受試者進(jìn)行靜脈抽血,獲得血糖真值以及膽固醇、甘油三酯等血液其他組分?jǐn)?shù)據(jù)并記錄患者的年齡。由于在脈搏波的采集過(guò)程中,光強(qiáng)及其他檢測(cè)條件的影響,本次實(shí)驗(yàn)選取的波長(zhǎng)范圍是580.43~900.81 nm。波長(zhǎng)間隔為0.94 nm,約560個(gè)波長(zhǎng)。
圖221基于“M+N”理論的人體試驗(yàn)系統(tǒng)
為了提高基于動(dòng)態(tài)光譜的多波長(zhǎng)血糖建模方法的穩(wěn)定性和可靠性,需要評(píng)判動(dòng)態(tài)光譜質(zhì)量。本文采用的方法是利用動(dòng)態(tài)光譜數(shù)據(jù)穩(wěn)定波長(zhǎng)數(shù)的多少來(lái)進(jìn)行光譜數(shù)據(jù)質(zhì)量的評(píng)判[10]。穩(wěn)定波長(zhǎng)數(shù)是各波長(zhǎng)下對(duì)數(shù)脈搏波頻域基波分量頻率持續(xù)一致的波長(zhǎng)個(gè)數(shù)。圖3所示為單個(gè)樣本的脈搏波頻率圖,可看出,對(duì)數(shù)脈搏波在1.2 Hz處連續(xù)出現(xiàn),共560個(gè)波長(zhǎng),在該處所覆蓋的波長(zhǎng)個(gè)數(shù)即為穩(wěn)定波長(zhǎng)數(shù)。穩(wěn)定波長(zhǎng)數(shù)越大則表明各波長(zhǎng)下對(duì)數(shù)脈搏波越相似,即動(dòng)態(tài)光譜數(shù)據(jù)質(zhì)量越高。根據(jù)穩(wěn)定波長(zhǎng)數(shù)這一標(biāo)準(zhǔn)在原有的239組光譜樣本中選取了192組光譜樣本。
圖3單個(gè)樣本的脈搏波頻率
單沿提取法的基本思想是用統(tǒng)計(jì)平均的方法提取各波長(zhǎng)下峰峰值的對(duì)應(yīng)比例關(guān)系,并非直接提取峰峰值。該方法利用了對(duì)數(shù)脈搏波的疊加平均效應(yīng)來(lái)剔除和校正各波長(zhǎng)下脈搏波的波形誤差,同時(shí)也利用了單沿動(dòng)態(tài)光譜的疊加平均效應(yīng)剔除含有粗大誤差的單沿動(dòng)態(tài)光譜,從兩方面降低誤差對(duì)波形的影響[11-13]。因此在數(shù)據(jù)預(yù)處理階段選取單沿法提取動(dòng)態(tài)光譜,可以減小“N”因素的系統(tǒng)誤差——接觸壓力帶來(lái)的影響。
單沿提取法的提取步驟如下:
(1) 對(duì)采集到的光電容積脈搏波信號(hào)取對(duì)數(shù),并將其中強(qiáng)度較大的信號(hào)進(jìn)行疊加平均,作為脈搏波的模板。
(2) 找到每個(gè)周期內(nèi)的波峰與波谷值,通過(guò)峰谷值來(lái)確定上升沿和下降沿,將所有波長(zhǎng)的有效上升沿與模板的有效上升沿進(jìn)行最小二乘擬合,以此來(lái)校正對(duì)數(shù)脈搏波的上升沿。
任意波長(zhǎng)λ下對(duì)數(shù)脈搏波在時(shí)域上如下式所示:
yλ(t)=ΔAλ·x(t)+DCλ
(1)
式中:ΔAλ為脈動(dòng)動(dòng)脈血液的吸光度值;x(t)為對(duì)數(shù)脈搏波的波形函數(shù);DCλ為對(duì)數(shù)脈搏波的直流分量;對(duì)數(shù)脈搏波隨時(shí)間t變化的出射光強(qiáng)為yλ(t)。
由于各波長(zhǎng)下對(duì)數(shù)脈搏波的波形具有相似性,即x(t)是不變的,故對(duì)數(shù)脈搏波模板的出射光強(qiáng)值y0(t)可表示為:
y0(t)=ΔA0·x(t)+DC0
(2)
式中:ΔA0為對(duì)數(shù)脈搏波模板的平均吸光度;DC0為對(duì)數(shù)脈搏波模板的平均直流分量。
將式(1)、(2)合并,可以得到:
(3)
從式(3)可以看出,對(duì)數(shù)脈搏波模板的出射光強(qiáng)y0(t)為自變量,各波長(zhǎng)對(duì)數(shù)脈搏波的出射光強(qiáng)yλ(t)為因變量,兩者呈線(xiàn)性關(guān)系;斜率α=ΔAλ/ΔA0為經(jīng)過(guò)最小二乘擬合得到的各波長(zhǎng)的擬合斜率,將所有波長(zhǎng)下的擬合斜率作為動(dòng)態(tài)光譜的等效值,構(gòu)成一系列單沿動(dòng)態(tài)光譜。
(3) 采用歐式距離來(lái)判定單沿動(dòng)態(tài)光譜與疊加平均值的相似性。計(jì)算每一個(gè)波長(zhǎng)下單沿動(dòng)態(tài)光譜與疊加平均值的歐式距離di(x,y)(i為單沿動(dòng)態(tài)光譜樣本數(shù)量),其幾何表達(dá)式如下:
(4)
若d(x,y)越小,則表明單沿動(dòng)態(tài)光譜與疊加平均值之間的相似程度越高。
(4) 按照萊以特準(zhǔn)則(3σ準(zhǔn)則)判別單沿動(dòng)態(tài)光譜是否含有粗大誤差,
|δi|>3σ
(8)
若某單沿動(dòng)態(tài)光譜滿(mǎn)足3σ準(zhǔn)則,則可判定該單沿動(dòng)態(tài)光譜含有粗大誤差,應(yīng)予以剔除;否則認(rèn)為該樣本中不含粗大誤差。對(duì)剔除粗大誤差后的單沿動(dòng)態(tài)光譜再進(jìn)行上述操作步驟,直到全部剔除含有粗大誤差的單沿動(dòng)態(tài)光譜,篩選得到最終的有效動(dòng)態(tài)光譜,之后進(jìn)行疊加平均作為最終的單沿動(dòng)態(tài)光譜輸出。圖4為單個(gè)樣本經(jīng)單沿提取法提取后的動(dòng)態(tài)光譜圖,其中該樣本有效沿的個(gè)數(shù)為59個(gè)。
圖4 單沿法提取的動(dòng)態(tài)光譜
偏最小二乘法[14-17](Partial Least Squares Regression,PLS)是一種數(shù)學(xué)優(yōu)化技術(shù),它提供一種線(xiàn)性回歸建模的方法。PLS的原理如下: 將自變量矩陣X和因變量矩陣Y分別做標(biāo)準(zhǔn)化處理,得到:
E0=(E01,E02,…,E0p)n×p,F(xiàn)0=(F01,F02,…,F0q)n×q
由拉格朗日算法可得出ε1和θ1:
(10)
(11)
(12)
式中:E1和F1分別為以上2個(gè)回歸方程的殘差矩陣;回歸系數(shù)向量p1和q1表示為:
(13)
此時(shí)若回歸方程能夠達(dá)到所需精度,可終止算法。否則,將利用X被t1解釋后的殘差和Y被u1解釋后的殘差來(lái)進(jìn)行第2成分t2和u2的提取。即用殘差矩陣E1和F1取代E0和F0求得ε2和θ2,并得到第2成分t2和u2,建立回歸方程,有:
(14)
(15)
同樣地,E2和F2為殘差矩陣,回歸系數(shù)向量是:
(16)
以此類(lèi)推,設(shè)秩為A,可得到:
由于t1,t2,…,tA均可以表示為E0中各向量的線(xiàn)性組合,式(17)與(18)結(jié)合可表示為
(19)
式中:
本文采用PLS建立模型并進(jìn)行血糖預(yù)測(cè),將“M”因素系統(tǒng)誤差中的甘油三酯、膽固醇、高密度脂蛋白膽固醇和年齡4個(gè)影響因素作為自變量矩陣
X=[x1,x2,x3,x4]
經(jīng)單沿法提取后的光譜數(shù)據(jù)作為因變量矩陣Y=[y1,y2,…,yq],將這兩部分?jǐn)?shù)據(jù)作為模型的輸入,模型輸出為血糖預(yù)測(cè)值,如圖5所示。
圖5建立模型
采用相關(guān)系數(shù)和平均預(yù)測(cè)相對(duì)誤差兩個(gè)指標(biāo)來(lái)評(píng)價(jià)模型,計(jì)算公式如下:
在192例樣本中隨機(jī)選取144例樣本進(jìn)行建模,48例樣本進(jìn)行預(yù)測(cè)?;凇癕+N”理論的血糖模型預(yù)測(cè)值、未考慮其他非測(cè)量組分影響的預(yù)測(cè)值和血糖真實(shí)值的數(shù)據(jù)對(duì)比如表2所示。圖6為基于“M+N”理論的血糖模型預(yù)測(cè)值與血糖真實(shí)值之間的相對(duì)誤差。
基于“M+N”理論測(cè)量方法的血糖預(yù)測(cè)值和血糖真值的相關(guān)系數(shù)為0.929 5,平均預(yù)測(cè)相對(duì)誤差為0.033,而未考慮其他非測(cè)量組分影響下的光譜數(shù)據(jù)與血糖真值的相關(guān)系數(shù)為0.828 5,平均預(yù)測(cè)相對(duì)誤差為0.046。結(jié)果表明,基于“M+N”理論考慮非測(cè)量組分對(duì)血糖的影響這一測(cè)量方法的測(cè)量精度優(yōu)于傳統(tǒng)的測(cè)量方法。
表2 預(yù)測(cè)值與真實(shí)值的對(duì)比
圖6 基于“ M+N”理論的血糖預(yù)測(cè)值與真值的相對(duì)誤差
“M+N”理論將被測(cè)對(duì)象和其他影響因素一同歸于整個(gè)測(cè)量系統(tǒng)中,全面考慮了兩者對(duì)血糖測(cè)量精度的影響。本文通過(guò)將“M”因素系統(tǒng)誤差中的膽固醇、甘油三酯、年齡和高密度脂蛋白膽固醇四種非測(cè)量組分納入模型,利用單沿提取法減小“N”因素系統(tǒng)誤差中接觸壓力對(duì)血糖測(cè)量值帶來(lái)的影響,使得血糖測(cè)量精度得以提高。這一方法可推廣應(yīng)用到其他血液組分的無(wú)創(chuàng)測(cè)量中。
參考文獻(xiàn)(References):
[1]王連明, 辛?xí)悦? 劉曉民,等. 血糖測(cè)定的影響因素研究[J]. 中國(guó)實(shí)驗(yàn)診斷學(xué), 2006, 10(11):1345-1347.
[2]Tamura K, Ishizawa H, Fujita K,etal. Application to noninvasive measurement of blood components based on infrared spectroscopy[J]. Ieej Transactions on Electronics Information & Systems, 2007, 127(5):686-691.
[3]石博雅. 牙齒與皮膚組織光學(xué)相干層析成像建模及應(yīng)用研究[D]. 天津:天津大學(xué), 2014.
[4]劉蓉, 徐可欣. 近紅外光譜無(wú)創(chuàng)血糖檢測(cè)中體溫變化的影響分析[J]. 天津大學(xué)學(xué)報(bào)(自然科學(xué)與工程技術(shù)版), 2008, 41(1):1-6.
[5]Maruo K, Oota T, Tsurugi M,etal. New methodology to obtain a calibration model for noninvasive near-infrared blood glucose monitoring[J]. Applied Spectroscopy, 2006, 60(4):441-449.
[6]李剛, 李哲, 王曉飛,等. 測(cè)量模式的演進(jìn)與“M+N”理論的提出[J]. 北京信息科技大學(xué)學(xué)報(bào)(自然科學(xué)版), 2013(2):9-13.
[7]李剛, 李哲, 李曉霞,等. 基于“M+N”理論的光譜分析中光源電壓對(duì)預(yù)測(cè)精度影響的研究[J]. 光譜學(xué)與光譜分析, 2013, 33(6):1456-1461.
[8]李曼. 老年2型糖尿病患者腰圍、體重指數(shù)與血糖、血壓、血脂、尿酸的相關(guān)性研究[J]. 中西醫(yī)結(jié)合心腦血管病雜志, 2015, 13(11):1351-1352.
[9]李麗, 王曉飛, 盧愷. 基于“M+N”理論的近紅外光譜血氧飽和度無(wú)創(chuàng)測(cè)量方法[J]. 生物醫(yī)學(xué)工程學(xué)雜志, 2016(5):885-889.
[10]李剛,王慧泉,趙喆,等. 動(dòng)態(tài)光譜數(shù)據(jù)質(zhì)量的評(píng)價(jià)[J]. 光譜學(xué)與光譜分析,2010,30(10);2802-2806.
[11]李剛, 熊嬋,王慧泉,等.動(dòng)態(tài)光譜的單拍提取[J].光譜學(xué)與光譜分析,2011,31(7):1857-1861.
[12]李剛, 周梅, 王慧泉,等. 動(dòng)態(tài)光譜提取方法的對(duì)比研究[J]. 光譜學(xué)與光譜分析, 2012, 32(5):1324-1328.
[13]李剛, 王慧泉, 趙喆,等. 提高DS法無(wú)創(chuàng)血液成分檢測(cè)信噪比的方法與分析[J]. 光譜學(xué)與光譜分析, 2012, 32(8):2290-2294.
[14]張寶菊,賈萍,張志勇,等. PLS在基于動(dòng)態(tài)光譜的人體血液中性粒細(xì)胞無(wú)創(chuàng)測(cè)量中的應(yīng)用[J]. 光譜學(xué)與光譜分析,2010(2):466-469.
[15]李朋成,朱軍桃,馬云棟,等. 基于偏最小二乘法的近紅外光譜分析應(yīng)用[J]. 測(cè)繪地理信息,2015(2):53-56.
[16]Delwiche S, Reeves J I. The effect of spectral pre-treatments on the partial least squares modelling of agricultural products[J]. Journal of Near Infrared Spectroscopy, 2004, 12(1):177.
[17]Fang J, Qiang J, Wei X. Simultaneous determination of main composition and additive in vinegar by NIR and partial least squares[J]. Computers & Applied Chemistry, 2010, 27(3):351-354.