王麗平, 司圣柱, 董雄輜
(合肥師范學(xué)院化學(xué)化工系,安徽合肥230061)
小波變換-偏最小二乘法用于多組分混合物光度法同時測定
王麗平, 司圣柱, 董雄輜
(合肥師范學(xué)院化學(xué)化工系,安徽合肥230061)
在波長范圍380-600nm測定了藏紅、熒光桃紅、曙紅三種色素混合物溶液的吸光度數(shù)據(jù),用小波變換對光譜數(shù)據(jù)進行處理,然后將小波變換系數(shù)用偏最小二乘 (PLS)法進行回歸分析。用Daubechies4小波對原始吸光度數(shù)據(jù)進行一次分解,以低頻系數(shù)作校正集并用交叉驗證法選擇主成分數(shù)進行PLS建模,獲得了令人滿意的預(yù)測結(jié)果。
小波變換;偏最小二乘;色素;分光光度;同時測定
小波變換(WT)是在傅里葉變換(FT)基礎(chǔ)上發(fā)展起來的數(shù)學(xué)方法。與 Fourier變換相比,小波變換在時域和頻域同時具有良好的局部化特征,能有效地從信號中提取更多的信息。通過伸縮和平移等操作能對信號進行多尺度分析,解決了 Fourier分析不能解決的許多問題,因而被譽為“數(shù)學(xué)顯微鏡”。小波分析在化學(xué)領(lǐng)域已有很多應(yīng)用[1]。由于小波分析具有多分辨率分析的能力,因此可以對信號在不同尺度上進行分解,得到原始信號在小波域的不同頻率的離散逼近和離散細節(jié)。利用吸光度信號的離散逼近代替原始吸光度數(shù)據(jù)進行多元校正建模,可以壓縮數(shù)據(jù)并降低噪聲對校正結(jié)果的影響[2-4]。
藏紅、熒光桃紅、曙紅三種色素的可見光譜嚴重重疊,借助多元校正結(jié)合可見光度法可實現(xiàn)對其混合組分進行同時測定[5]。本文將離散小波變換和偏最小二乘回歸方法結(jié)合對藏紅、熒光桃紅、曙紅混合物的可見光譜數(shù)據(jù)進行處理,實現(xiàn)了三種組分的同時測定,并取得令人滿意預(yù)測結(jié)果。
根據(jù)離散小波變換(DWT)原理和Mallat算法[6],原始信號C0經(jīng) j尺度分解后可表示為:
其中
算子 H和G分別為低通和高通濾波器,Cj和Dj分別為 C0在2j分辨率下的離散逼近(低頻系數(shù))和離散細節(jié)(高頻系數(shù)),C0在 j尺度下分解所得到Cj和Dj數(shù)據(jù)量各為原始數(shù)據(jù)的1/2j。
由于小波變換是一種線性變換,Cj和Dj是C0在小波空間的線性映射,因此我們可以用較少的小波系數(shù)(Cj或Dj)代替原始數(shù)據(jù)C0進行分析。
偏最小二乘回歸的主要目的是要建立一個線性模型:
其中,T和U分別為X和Y的得分,P和Q分別為X和Y的載荷,E和F分別為用偏最小二乘模型擬合 X和Y所引進的誤差。偏最小二乘法在同時分解 X和Y時,考慮了U和 T之間的內(nèi)在線性關(guān)系,即在分解矩陣Y時考慮X的因素,而在分解矩陣X時考慮Y的因素。
對于未知樣品,由其響應(yīng)矩陣,利用式(3)關(guān)系及校正過程中的 P求出未知樣的T,再由U和T間的線性關(guān)系求得未知樣的U,然后利用校正過程中的Q,由式(4)計算出未知樣品的濃度。
由圖3可見,定向耦合器1端口的頻率為fc的信號由三部分構(gòu)成:(1)發(fā)射機的互調(diào)發(fā)射信號vt1(t);(2)信號源的互調(diào)發(fā)射信號vjj(t)經(jīng)發(fā)射機端口反射后的信號,簡稱為信號源一次反射互調(diào)信號vt2(t);(3)發(fā)射機的互調(diào)發(fā)射信號vtt(t)經(jīng)信號源端口的反射,再經(jīng)發(fā)射機端口反射后的信號,簡稱為發(fā)射機的二次反射互調(diào)信號vt3(t).
本文將響應(yīng)矩陣 X用小波系數(shù)替換進行最小二乘建模和預(yù)測,使用均方根誤差(Root Mean Square Difference,簡稱 RMSD)和相對預(yù)測誤差(Relative Error of Prediction,簡稱REP)評價模型的預(yù)測能力。其中,
RMSD、REP越小,模型的預(yù)測能力越強。
2.1 實驗儀器
SHIMADZU(蘇州島津)
UV-2550紫外可見分光光度計;
PC-PentiumII個人計算機。
2.2 試劑
藏紅、熒光桃紅、曙紅儲備液500ug/ml(二次蒸餾水配制)。
采用正交設(shè)計配制3組分染色劑混合溶液,將定量的單一成分溶液分別移入25ml容量瓶中,用二次蒸餾水稀釋至刻度,搖勻備用。在波長380-600nm范圍內(nèi),每隔0.1nm分別測定混合樣品的吸光度值(以二次蒸餾水為參比),實驗數(shù)據(jù)用自編Matlab程序處理。
3.1 吸收光譜
由藏紅、熒光桃紅、曙紅的吸收光譜圖可知,三種色素的吸收光譜重疊嚴重,用經(jīng)典的光度分析方法進行定量分析干擾嚴重,借助化學(xué)計量學(xué)方法與光度分析相結(jié)合可在不經(jīng)分離的情況下對各組分進行同時準確定量。
3.2 小波函數(shù)的選擇
對在波長380-600nm范圍內(nèi),每隔0.1nm測得的混合樣品的吸光度數(shù)據(jù)進行小波變換處理。試驗了Daubechies1~Daubechies10、bior1.1、bior1.3、bior1.5、bior2.2、sym2、sym3、sym4及coif等函數(shù)對校正結(jié)果的影響,研究發(fā)現(xiàn)小波函數(shù)對本文所研究的三組分混合物體系的預(yù)測結(jié)果準確度無明顯差異。
圖1 三種染色劑的吸收光譜
3.3 主成分數(shù)的選擇
在用PLS方法建立校正模型時,如何確定建立模型所使用的主成分數(shù)是至關(guān)重要的。本文采用Cross-validation留一法計算了校正模型的最佳主成分數(shù),對于由12個樣品組成校正集(波長范圍380-600nm,波長間隔0.1nm)體系的吸收光譜,用Daubechies(db4)進行小波分解所得到的小波系數(shù)建模,3種色素的主成分數(shù)在5時預(yù)測誤差平方和(PERSS)達最小,本文選擇5因子建立校正模型。
3.4 不同尺度的小波系數(shù)對預(yù)測結(jié)果的影響
為了考察不同尺度的小波系數(shù)對預(yù)測結(jié)果的影響,我們用12個樣品作校正集,12個樣品作預(yù)測集,用C1~C4及D1~D4構(gòu)成數(shù)據(jù)矩陣進行PLS回歸分析,選用5因子建模時對12個樣品預(yù)測的RMSD和REP值列于表1中。
表1 不同尺度下WT-PLS法對12個樣品中3種組分預(yù)測的RMSD和REP值
由表1可以看出,基于C1~C4預(yù)測的誤差都比較小,而在基于D1~D4的預(yù)測誤差中,D3和D4較小,D1的預(yù)測誤差很大,這正說明在小波分析中,小尺度的離散細節(jié)中包含更多的隨機噪聲(頻率高),而大尺度的高頻系數(shù)主要反映信號的頻率特征。在本文研究的三組分色素可見分光度同時測定中,選用原始吸光度數(shù)據(jù)的小波低頻系數(shù)C1構(gòu)造分析矩陣進行PLS回歸分析。
3.5 合成樣品分析
選用原始吸收光譜在1尺度下的小波低頻系數(shù)(C1)構(gòu)成分析數(shù)據(jù),使用校正樣品數(shù)為12、主成分數(shù)為5進行 PLS建模對藏紅、熒光桃紅、曙紅三種色素的合成樣品進行預(yù)測,結(jié)果列于表2。
表2 WT-PLS法對合成樣品的測定結(jié)果(主成分數(shù)取為5)
由表2可見,藏紅的回收率在95.1~109.4之間,熒光桃紅的回收率在94.4.00~108.78之間,曙紅的回收率在96~103.9之間,而12個樣品中3組分的預(yù)測相對誤差REP分別為4.3%、3.29%、2.35%,結(jié)果令人滿意。另外,使用小波系數(shù)進行PLS建模,不僅可以消除原始信號中的部分噪音而提高預(yù)測準確度,而且數(shù)據(jù)量也得到較大的壓縮使計算效率得以提高。由此可見,用WT-PLS法結(jié)合可見分光光度分析可為混合食用色素不分離同時測定提供一種新的簡便、可靠的方法。
[1] 司圣柱.小波變換方法及其在化學(xué)中的應(yīng)用[J].安徽教育學(xué)院學(xué)報,2004,113(3):73.
[2] 金繼紅,陳家瑋,張永文.小波變換用于鎢和鉬的同時光度測定[J].理化檢驗-化學(xué)分冊,2001,37(10):443.
[3] 王國慶,王 芳,陳 達,等.近紅外光譜技術(shù)用于復(fù)雜植物樣品中無機離子測定的新方法[J].光譜學(xué)與光譜分析,2004,24 (12):1540.
[4] 司圣柱,司 媧.小波變換-偏最小二乘法用于三組分食用色素的光度法同時測定[J].分析儀器,2007,No.2,48.
[5] 王麗平,司圣柱.丁愛民,校正變換矩陣法用于多組分染色劑的同時測定研究[J].安徽教育學(xué)院學(xué)報,2008,No.6,69.
[6] 徐佩霞,孫功憲.小波分析與應(yīng)用實例[M].合肥:中國科技大學(xué)出版社,1996.
Application of Wavelet Transform-Partial Least Square Method to Simultaneous Determination of Multi-components Using Spectrophotometry
WANG Li-ping, SI Sheng-zhu, DONG Xiong-zi
(Department of Chemistry and Chemical Engineering,Hef ei Normal University,Hef ei230061,China)
The absorbance data is determined for ternary mixture solution of safranine,phloxine B and eosin Y within wavelength ranging 380~600 nm,wavelet transform(WT)is then employed to process the obtained data of absorbance spectrum,and finally the partial least square(PLS)regression procedure is performed on the wavelet coefficients.Therefore,the original absorbance spectrum is decomposed with Daubechies4 wavelet transform,and cross-validated with low frequency coefficient as a calibration set to select the optimal number of components modeled on PLS,and the desirable prediction results is obtained.
wavelet transform;partial least square;pigment;spectrophotometry;simultaneous determination
O65
A
1674-2273(2010)06-0083-03
2010-05-10
安徽省高等學(xué)校教學(xué)研究項目(2008jyxm467),安徽省高校青年教師資助計劃項目(2008jqw1125)
王麗平(1963-),女,山東濟南人,合肥師范學(xué)院化學(xué)化工系副教授,研究方向:分析化學(xué),化學(xué)計量學(xué)的教學(xué)及研究。