劉福強(qiáng),任瑞雪,周慧琴,費(fèi)強(qiáng),任瑞冰,王彬,任玉林
(1.解放軍208醫(yī)院藥劑科,長春 130036;2.吉林大學(xué)化學(xué)學(xué)院,長春 130023)
近紅外光譜分析具有不破壞樣品,樣品可多次利用,并可對(duì)樣品實(shí)現(xiàn)在線質(zhì)量檢測和成分分析等優(yōu)點(diǎn),是快速分析技術(shù)之一,目前廣泛應(yīng)用于各個(gè)領(lǐng)域[1,2]。化學(xué)計(jì)量學(xué)方法可提取復(fù)雜或譜峰重疊的光譜信息,其中偏最小二乘法(PLS)是最普遍使用的定量分析方法,該方法可有效地除去噪聲,解決光譜共線問題,有效地提取光譜信息[3]。
本文研究了近紅外漫反射光譜同偏最小二乘法(PLS)相結(jié)合定量分析甲氧芐啶粉末藥品。使用了三種不同的光譜預(yù)處理方法:標(biāo)準(zhǔn)歸一化(SNV)、一階導(dǎo)數(shù)和二階導(dǎo)數(shù)對(duì)樣本的原始光譜進(jìn)行預(yù)處理,討論了主成分?jǐn)?shù)對(duì)預(yù)測樣品中甲氧芐啶含量的影響,建立了最佳的PLS數(shù)學(xué)校正模型,分別預(yù)測了校正集和預(yù)測集中甲氧芐啶的含量,并對(duì)所得結(jié)果做了比較。
島津UV-3100型紫外可見近紅外分光光度計(jì)及附件積分球。微機(jī)通過接口同分光光度計(jì)連接,自動(dòng)傳輸、采集光譜數(shù)據(jù)。所用藥品均符合中國藥典(2000版)規(guī)定。
甲氧芐啶粉末藥品由甲氧芐啶和淀粉等組成。共配制甲氧芐啶粉末藥品100個(gè),甲氧芐啶的含量在中華人民共和國藥典規(guī)定值的±10%之間。所有藥品被隨機(jī)分成兩組,一組為校正集(The calibration set, 73個(gè)),另一組為預(yù)測集(The prediction set, 27個(gè))。甲氧芐啶含量按照中國藥典(2000版)的含量測定方法測定,計(jì)算出每批次中甲氧芐啶的含量[4]。
將甲氧芐啶粉末藥品裝于積分球樣品槽中,壓實(shí),壓平,測定光譜圖。光譜帶寬1nm,波長掃描范圍1100~2500nm。每個(gè)樣品掃描4次,取平均值。
由于儀器、樣品背景和其他因素的影響,近紅外光譜分析中經(jīng)常出現(xiàn)譜圖的偏移或漂移現(xiàn)象,如果不加處理,會(huì)直接影響建立模型的質(zhì)量和未知樣品預(yù)測結(jié)果的準(zhǔn)確性。因此,對(duì)光譜的預(yù)處理是十分必要的,常用的光譜預(yù)處理方法為導(dǎo)數(shù)處理。
偏最小二乘法利用主成分分析將吸光度矩陣和濃度矩陣先分別分解為特征向量和載荷向量,然后用偏最小二乘法在這些穩(wěn)變量之間建立相互關(guān)系,從而得到吸光度矩陣與濃度矩陣之間的數(shù)學(xué)校正模型。用交互校驗(yàn)法確定最佳主成分?jǐn)?shù)。所用PLS軟件為TQ Aanlyst 6.1.1軟件包(美國Thermo Nicolet公司),其它輔助軟件自行編制。
評(píng)價(jià)定量分析結(jié)果的誤差采用均方根誤差(root mean square error, RMSE)[5]:
式中,CNIRi為PLS預(yù)報(bào)濃度值;CREFi為依據(jù)藥典標(biāo)準(zhǔn)測得的參考濃度值;n—樣本數(shù)。
甲氧芐啶粉末藥品由活性成分甲氧芐啶和輔料淀粉等組成,由于組成成分復(fù)雜,因此NIR光譜重疊非常嚴(yán)重,用經(jīng)典的光譜分析方法難以定量分析,必須用化學(xué)計(jì)量學(xué)方法才能對(duì)其進(jìn)行準(zhǔn)確分析。圖1為甲氧芐啶粉末的近紅外漫反射SNV光譜、一階導(dǎo)數(shù)光譜和二階導(dǎo)數(shù)光譜。
73個(gè)校正集和27個(gè)預(yù)測集樣品的原始光譜數(shù)據(jù)在第一主成分和第二主成分上的得分分布見圖2。由圖2可以看出預(yù)測集樣品較均勻地分布于校正集樣品之中,導(dǎo)數(shù)光譜的得分圖與原始光譜的得分圖相似,圖略。
使用PLS方法建立校正模型,其中最困難的問題就是如何確定建立模型所使用的主成分?jǐn)?shù)。如果建立模型時(shí)使用的主成分?jǐn)?shù)過少,就不能反映未知樣品被測組分產(chǎn)生的量測數(shù)據(jù)(如光譜)變化,其模型預(yù)測準(zhǔn)確度就會(huì)降低,這種情況稱之為不充分?jǐn)M合(Underfit)。如果使用過多的主成分建立模型,就會(huì)將一些代表噪音的主成分加到模型中,使模型的預(yù)測能力下降,這種情況稱之為過度擬合(Overfit)。因此,合理確定參加建立模型的主成分?jǐn)?shù)是充分利用光譜信息和濾除噪音的有效方法之一。
要找到恰當(dāng)?shù)闹鞒煞謹(jǐn)?shù)來保證既能避免不充分?jǐn)M合,又能避免過度擬合情況的出現(xiàn)。最常見的方法是采用預(yù)測殘差平方和[6](Prediction Residual Error Sum of Square,縮寫為PRESS)作為評(píng)價(jià)標(biāo)準(zhǔn)。即使用一定數(shù)目的主成分建立一個(gè)模型,然后用這個(gè)模型對(duì)參加建模的每個(gè)樣品進(jìn)行預(yù)測,求出每個(gè)樣品的預(yù)測值和已知參考值的差。PRESS的數(shù)學(xué)表達(dá)式為:
式中,n為校正集中樣品的數(shù)目;d為建立模型使用的主成分?jǐn)?shù)目;rp,ij為預(yù)報(bào)濃度值;rij為依據(jù)藥典標(biāo)準(zhǔn)測得的參考濃度值。
PRESS值最小,說明建模的預(yù)測能力最好。本文分別討論了校正集樣本的兩種有效成分在不同主成分?jǐn)?shù)時(shí)對(duì)PRESS值的影響。圖3表明了不同主成分?jǐn)?shù)對(duì)PRESS值的影響。從圖中PRESS最小可以看出,基于SNV、一階導(dǎo)數(shù)及二階導(dǎo)數(shù)光譜數(shù)據(jù)所建立的PLS模型的最佳主成分?jǐn)?shù)分別為4、2和5,而且基于一階導(dǎo)數(shù)光譜數(shù)據(jù)建立的PLS模型具有最小的PRESS值。
數(shù)學(xué)校正模型建立后,分別預(yù)報(bào)校正集和預(yù)測集樣本的濃度,所得到的預(yù)測含量值和參考值對(duì)應(yīng)關(guān)系的有關(guān)參數(shù)列于表l。從表1中可以看出,在三種預(yù)處理光譜中,以一階導(dǎo)數(shù)處理光譜的線性相關(guān)系數(shù)R和誤差為最小,說明使用一階導(dǎo)數(shù)預(yù)處理原始光譜可以得到更加令人滿意的結(jié)果。
PLS法同近紅外漫反射光譜法結(jié)合,無損定量分析甲氧芐啶粉末藥品是可行的,同常規(guī)測定方法相比,速度快而簡便。一階導(dǎo)數(shù)預(yù)處理光譜的應(yīng)用可一定程度地降低誤差,從而獲得更好的預(yù)測結(jié)果。
[1]李先保,李興民等,乳酸菌發(fā)酵劑在肉制品中的應(yīng)用,肉類研究,1997,1:19.
[2]Jerome J W Jr. Applied Spectroscopy Review,1996,31:251.
[3]朱爾一,楊芃原,化學(xué)計(jì)量學(xué)技術(shù)及應(yīng)用,北京:科學(xué)出版社,2001:11.
[4]中華人民共和國衛(wèi)生部藥典委員會(huì)編.中國藥典(二)部[M].北京:化學(xué)工業(yè)出版社,2000: 148-149.
[5]楊輝華,覃鋒,王義明,羅國安.NIR光譜的Isomap-PLS非線性建模方法.光譜學(xué)與光譜分析.2009.29(2):322-326.
[6]陸婉珍,袁洪福,徐廣通.現(xiàn)代近紅外光譜分析技術(shù).北京:中國石化出版社,2000.