摘要: 采用間隔偏最小二乘法(IPLS)和移動窗口偏最小二乘方法(MWPLS),在640~1 100 nm范圍內(nèi)建立血糖短波近紅外的優(yōu)化模型。使用馬氏距離對人血清樣品中的奇異樣品進行篩選,將檢測光譜分別等分為2~15份進行IPLS分析,對比建立預測模型。設窗寬為151 nm,成分數(shù)范圍(1~20),全譜進行MWPLS,對預測模型進行優(yōu)化。結(jié)果顯示,依據(jù)馬氏距離采用最小半球體積法能有效篩選所采集光譜中的奇異光譜,IPLS可以有效地找到葡萄糖分子官能團對應的近紅外特征譜段,MWPLS能夠找到適合建模的精確起止波長點,通過偏最小二乘法建立血糖濃度的預測模型,相關系數(shù)R=0.982 2,預測均方差RMSEP=0.163 5 mmol/L,偏差Bias=-0.087 3 mmol/L。
關鍵詞: 短波近紅外光譜; 血糖; 間隔偏最小二乘法; 移動窗口偏最小二乘法
引言糖尿病是一種常見的慢性終身性疾病。近年來,隨著人民生活水平的提高,糖尿病發(fā)病率不斷攀升。最新調(diào)查數(shù)據(jù)顯示[1],1994年我國糖尿病患病率僅為2.5%,到2008年,糖尿病患病率已高達9.7%,其中前期患病率為15.5%。血糖是診斷糖尿病的關鍵指標。目前,小型便攜式的電子血糖儀得到了廣泛的應用?,F(xiàn)代光譜分析技術是實現(xiàn)無損血糖檢測的一個重要的發(fā)展方向。以往的血糖檢測研究多集中于長波近紅外(1 100~2 500 nm)[27],其主要原因是在這些區(qū)域,含有葡萄糖的甲基CH對稱伸縮振動和 OH伸縮振動的一級、二級倍頻,具有較強的葡萄糖特征吸收信號。然而這些區(qū)域內(nèi)水分子也會產(chǎn)生較強的吸收信號,在此干擾條件下使得在長波近紅外內(nèi)實現(xiàn)血糖的無損檢測幾乎是不可行的。本文則關注短波近紅外(700~1 100 nm)的檢測分析。在短波近紅外處,人體骨骼、肌肉、脂肪、皮膚等的吸收系數(shù)很小,該波段被譽為人體“光學治療窗”[8],處于該窗口的光學波段可以更有效地攜帶人體內(nèi)部的信息。而且短波近紅外包含了葡萄糖的甲基CH對稱伸縮振動的三倍頻和OH伸縮振動的三倍頻[9],具有檢測的可能性。長波近紅外區(qū)域制作成快速并行檢測所需的陣列檢測器,價格較為昂貴,且檢測時間較長。相比較,短波近紅外光譜區(qū)域可以使用成本較低的Si基光敏元件,硅陣列檢測器CCD的技術也已成熟,可以大幅度提高檢測速度,有利于實現(xiàn)檢測設備的小型化和低成本。本文對短波近紅外波段用于血液樣本中葡萄糖濃度的定量檢測的可行性進行探索。與長波近紅外相比,短波近紅外是更高倍頻(或合頻)的振動吸收,譜峰更寬,光譜重疊的情況會更嚴重。為了充分提取光譜信息,需要研究有效可靠的定量校正方法。本文在640~1 100 nm范圍內(nèi)測量血清短波近紅外光譜,采用間隔偏最小二乘法(interval partial least squares,IPLS)和移動窗口偏最小二乘法(moving window partial least squares,MWPLS)分析了吸光度與血清中葡萄糖濃度之間的量化關系。1原理及方法偏最小二乘法(partial least squares,PLS)是一種較為常用的近紅外光譜數(shù)據(jù)處理方法[10],主要用于線型模型的建立。為了更有效利用光譜信息,選擇血糖光譜信息最為豐富的波段進行建模,文章采用IPLS和MWPLS技術,其主要原理和步驟如下:IPLS:(1)將整個光譜分割成若干個波段,對每個波段進行偏最小二乘分析,根據(jù)交叉驗證均方差(root mean square error of cross validation,RMSECV),從中找出最佳主成份數(shù);(2)改變光譜分割的波段數(shù)目,按照(1)中的過程分析;(3)對比(2)中不同波段數(shù)時所得到的結(jié)果,最終找出最適宜建模的光譜區(qū)間。MWPLS:選取一個寬度為w的光譜窗口,從整個光譜(假設有n個波長點)的第一個波長點開始依次向右移動一個波長點直至最后,設置一最大主成分數(shù),對每個子波長區(qū)分別建立偏最小二乘法PLS 模型,分別得到不同主成分數(shù)里對應PLS 模型的預測誤差(root mean square error of prediction,RMSEP),從而找出含有用信息的一個或幾個波長區(qū)。然后利用這些波長區(qū)建立PLS模型。光學儀器第35卷
第3期王偉,等:血糖濃度的短波近紅外定量分析
文章采用IPLS和MWPLS對血清樣品的短波近紅外光譜進行數(shù)據(jù)分析和優(yōu)化時,模型最終的預測能力通過相關系數(shù)R,預測均方差RMSEP,偏差Bias的值來檢驗,其中RMSEP和Bias的定義如下:RMSEP=1Ip∑Ipi=1(y^i-yi)2(1)
Bias=1Ip∑Ipi=1(y^i-yi)(2)其中y^i表示樣本的預測值,yi表示樣本的實測值,Ip表示檢驗的樣本數(shù)。2數(shù)據(jù)測量及模型建立
2.1數(shù)據(jù)測量對13名志愿者在午飯后3h各抽取靜脈血約5 mL,為了擴大樣本血糖范圍,每名志愿者第一次抽血后口服葡萄糖50 g,30 min后再次抽血。每個樣品取少量全血用血糖儀測量其血糖值作為參考值,血糖濃度范圍4.9~8.3 mmol/L,剩余血樣經(jīng)分離得到血清約2.5 mL。使用UV1900紫外可見分光光度計室溫下測定樣品的吸收光譜,帶寬1 nm,測量波長范圍640~1 100 nm,采用10 mm光程的石英比色皿,以空氣作參比,測量其吸光度。樣品中,血清的提取及血清中葡萄糖濃度參考值由上海交通大學校醫(yī)院采用血糖儀測量后提供。
2.2數(shù)據(jù)預處理為了避免除血糖濃度以外的因素對血清樣本光譜的干擾,根據(jù)馬氏距離采用最小半球體積法(smallest halfvolume,SHV)[11]對樣本中的奇異樣品進行篩選,結(jié)果如圖1所示。由圖1可以發(fā)現(xiàn)標記1的樣品其馬氏距離明顯高于其它樣品,經(jīng)檢查發(fā)現(xiàn)是由于該血清較其它樣品混濁,呈乳濁液狀,而乳濁液在光譜檢測時,由于溶液中顆粒的存在容易導致光線通過樣品池時產(chǎn)生散射,因此建立模型時將樣品1剔除較好。將奇異光譜剔除后,為了去除高頻噪聲,基線漂移等影響,對剩余的樣品在640~1 100 nm波段內(nèi)作基線校正,然后采用窗口寬度為10 nm,多項式次數(shù)為2的SavitzkyGolay平滑法對光譜作預處理[1213],處理后的血清光譜如圖2所示。
圖5可以看出,在915~1 065 nm這個波段建立PLS模型,當主成分數(shù)為9時交叉驗證均方差RMSECV最小,因此選用這一譜段對血糖濃度進行回歸建模。用建立的模型對驗證集每一個樣品進行預測,其預測結(jié)果如圖6所示,相關系數(shù)R=0.982 2,預測均方差RMSEP=0.163 5 mmol/L,偏差Bias=-0.087 3 mmol/L。3結(jié)論本文主要研究了使用短波近紅外進行血糖濃度檢測的可行性。通過IPLS與MWPLS對640~1 100 nm血清光譜的數(shù)據(jù)建模,結(jié)果表明:(1)根據(jù)馬氏距離對樣品的光譜進行奇異樣品篩選,可以提高建模的準確性;(2)采用IPLS方法對全譜進行分析,能夠提取葡萄糖分子官能團對應的近紅外特征譜段,從而有效提取光譜中有效信息建立較好的預測模型;(3)采用MWPLS的方法,能夠找出包含光譜有效信息的精確波長起止點,進一步優(yōu)化其預測模型。下一步的工作是將樣本濃度范圍擴大,從而使建立的模型適用范圍更廣泛,并提高血糖定量分析的準確性。本文的研究結(jié)果將為進一步發(fā)展短波近紅外的無損血糖檢測技術提供基礎。
參考文獻:
[1]YANG W,LU J,WENG J,et al.Prevalence of diabetes among men and women in China[J].The New England Journal of Medicine,2010;362(12):1090-1101.
[2]肖君,王龍,駱清銘,等.基于近紅外三波長的血糖檢測系統(tǒng)研制[J].光電子·激光,2007,18(9):1135-1138.
[3]高麗麗,陶衛(wèi),趙輝,等.用于無創(chuàng)血糖檢測的光聲池設計與研究[J].光學儀器,2012,34(2):55-60.
[4]劉娟,王尚奇,簡水生.血糖濃度檢測技術的最新進展[J].激光生物學報,2005,14(5):393-396.
[5]李剛,劉玉良,林凌,等.采用多光程長建模方法檢測血液成分含量[J].分析化學,2007,35(10):1495-1498.
[6]張?zhí)m,張清悅,南群,等.中紅外光譜法在無創(chuàng)血糖檢測技術中的應用[J].光學與光電技術,2008,6(2):81-84.
[7]王云,徐可欣,常敏.近紅外光譜技術檢測牛奶中脂肪及蛋白質(zhì)含量校正模型的建立[J].光學儀器,2006,28(3):3-7.
[8]陳文亮,徐可欣,杜振輝,等.人體無創(chuàng)血糖檢測技術[J].儀器儀表學報,2003,24(4):258-264.
[9]陸婉珍,袁洪福,徐廣通,等.現(xiàn)代近紅外光譜分析技術[M].北京:中國石化出版社,2001:18-19,148-149.
[10]李振慶,黃梅珍,倪一,等.改進偏最小二乘法在近紅外牛奶成分測量中的應用[J].光學技術,2009,35(1):70-73.
[11]劉蓉,陳文亮,徐可欣,等.奇異點快速檢測在牛奶成分近紅外光譜測量中的應用[J].光譜學與光譜分析,2005,25(2):207-210.
[12]SAVITZKY A,GOLAY M J E.Smoothing and differentiation of data by simplified least squares procedures[J].Analytical Chemistry,1964,36(8):1627-1639.
[13]梁逸曾,俞汝勤.分析化學手冊(十)化學計量學[M].2版.北京:化學工業(yè)出版社,2000:161-162.