夏 雨
首都醫(yī)科大學(xué)附屬北京友誼醫(yī)院藥劑科,北京 100050
美國材料檢測協(xié)會(ASTM)將780~2526 nm的光譜區(qū)定義為近紅外光譜區(qū)[1],該譜區(qū)主要是含氫基團(C-H,N-H,O-H)的倍頻與合頻的吸收,借助化學(xué)計量學(xué)及計算機技術(shù)可有效地利用近紅外光譜信息,反映被測物質(zhì)的性質(zhì),可用于藥品原輔料及制劑的非破壞性定性定量分析以及假劣藥品的檢測[2~4]?!吨袊幍洹?005年版已收載有近紅外光譜法[5]。
維生素C是人體需要量最大的一種水溶性維生素,市場上銷售的維生素C片包括口服片、含片、咀嚼片、泡騰片等多種片型,且藥品規(guī)格多樣。《中國藥典》2010年版采用碘滴定法測定維生素C片中的含量[6],預(yù)處理麻煩,分析耗時長。本文以不同廠家生產(chǎn)的維生素C片為分析對象,采用近紅外光譜法(near infrared diffuse reflectance spectroscopy,NIR)與偏最小二乘法(partial least square,PLS)結(jié)合,對建立維生素C片定量分析模型的可行性進行探討,為今后類似樣品快速檢測提供參考。
美國Thermo Fisher AntarisⅡ 型傅里葉變換近紅外光譜儀,配有積分球漫反射采樣系統(tǒng),Result操作軟件,TQ Analyst 8.0光譜分析軟件,瑞士Mettler AL-204型電子分析天平。
維生素C片分別來自南京白敬宇制藥有限責(zé)任公司、青島海爾藥業(yè)有限公司、海南養(yǎng)生堂藥業(yè)有限公司、北京雙鶴藥業(yè)股份有限公司、鄭州維他卡姆維生素有限公司、江蘇江山制藥有限公司、拜耳醫(yī)藥保健品有限公司、德國史達(dá)德大藥廠及美國百時美施貴寶公司等9個廠家共60批次樣品。
取每個批次的維生素C片5片,精密稱定總重量,求得平均重量后,再按照說明書標(biāo)示規(guī)格求得每批次維生素C含量(g/g),其中最大為66.67%,最小為0.83%。
將維生素C片嵌入可調(diào)節(jié)樣品槽內(nèi),以空氣為參比扣除背景,利用積分球漫反射采樣系統(tǒng)及Result操作軟件采集光譜圖。采集光譜區(qū)間:10000~4000 cm-1;掃描次數(shù):32次;分辨率:8 cm-1;溫度:(25±2)℃;相對濕度:45%~50%。每批樣品取2片,每片正、反面各重復(fù)測量3次,取平均值。將60個批次的120張光譜一并納入后續(xù)的模型。維生素C片近紅外原始光譜圖見圖1。
圖1 120張維生素C片的近紅外原始光譜
將120份樣品隨機劃分為兩組,其中110個為校正集(calibration),10 個為驗證集(validation),要求校正集樣品濃度囊括所有驗證集樣本濃度。校正集用于建立定量分析模型,驗證集用于檢驗所建模型的性能。將校正集樣品的近紅外光譜與其說明書標(biāo)示的維生素C含量(g/g)相關(guān)聯(lián)輸入TQ Analyst 8.0光譜分析軟件中,結(jié)合PLS建立維生素C片的含量測定校正模型。
近紅外光譜信號含有隨機噪音、基線漂移、信號本底、樣品不均勻、光散射等干擾,對模型的預(yù)測準(zhǔn)確度和穩(wěn)定性會有很大的影響。因此,利用TQ Analyst 8.0光譜分析軟件內(nèi)嵌的多元散射校正(multiplication scattering correction,MSC)、一階導(dǎo)數(shù)(first derivative,F(xiàn)D)、二階導(dǎo)數(shù)(second derivation,SD)對原始光譜進行預(yù)處理,提取近紅外光譜的特征信息。多元散射校正可以去除紅外漫反射光譜中樣品的鏡面反射及不均勻性造成的噪聲,消除漫反射光譜的基線及光譜的不重復(fù)性;一階導(dǎo)數(shù)、二階導(dǎo)數(shù)可以有效地消除樣品由于顏色差別引起的基線漂移,強化譜帶特征,克服譜帶重疊。不同廠家3種含量維生素C片的原始光譜、一階導(dǎo)數(shù)光譜、二階導(dǎo)數(shù)光譜見圖2。
多元校正方法要求適當(dāng)設(shè)計校正集與驗證集樣品,以求達(dá)到較好的預(yù)測結(jié)果。110個校正集和10個驗證集樣品的原始光譜數(shù)據(jù)在第1個主成分和第2個主成分上的得分分布見圖3。圖3示驗證集樣品較均勻的分布于校正集樣品之中。
PLS利用主成分分析將吸光度矩陣和濃度矩陣先分別分解為特征向量和載荷向量,用交叉驗證法(cross validation)確定最佳主成分?jǐn)?shù),然后建立吸光度矩陣與濃度矩陣的數(shù)學(xué)模型,是目前應(yīng)用較多的一種多元校正方法。本研究采用偏最小二乘法建模,模型評價指標(biāo)采用相關(guān)系數(shù)(correlation coefficient,r),校正均方根誤差(root mean standard error of calibration,RMSEC),計算公式同參考文獻(xiàn)[1]。在優(yōu)化模型時,對同一樣品集的同一組分,r越接近1,RMSEC越小,則PLS算法所提取的光譜信息與分析組分的相關(guān)性越好,所建模型的預(yù)測能力和穩(wěn)定性越高。TQ Analyst 8.0光譜分析軟件內(nèi)嵌有譜區(qū)范圍計算插件,本研究通過比較軟件包建議的譜區(qū)范圍與自選的譜區(qū)范圍及全譜區(qū)范圍,選取較優(yōu)結(jié)果(表1)。可知優(yōu)化后的預(yù)處理方法主要集中于二階導(dǎo)數(shù),模型的光譜范圍在 10000~4000 cm-1,此時 r為 0.9969,RMSEC 為 1.30。
圖2 3種維生素C片的近紅外光譜
圖3 兩種主成分的得分
采用PLS法建立校正模型,主成分?jǐn)?shù)的選擇直接關(guān)系到模型的實際預(yù)測能力。在計算的多個主成分中,第一主成分最重要,隨著主成分?jǐn)?shù)的增加,重要程度降低,一直到后來的許多主成分反映的是噪音信息。如果建立模型時使用的主成分?jǐn)?shù)過少,就不能反映未知樣品被測組分產(chǎn)生的量測數(shù)據(jù)(如光譜)變化,其模型預(yù)測準(zhǔn)確度就會降低,這種情況稱之為不充分?jǐn)M合(underfit)。如果使用過多的主成分建立模型,就會將一些代表噪音的主成分加到模型中,使模型的預(yù)測能力下降,這種情況稱之為過度擬合(overfit)。因此,合理確定參加建立模型的主成分?jǐn)?shù)是充分利用光譜信息和濾除噪音的有效辦法之一。
表1 維生素C片的校正模型
本研究通過交叉驗證法對所建二階導(dǎo)數(shù)模型進行驗證,以預(yù)測殘差平方和(prediction residual error sum of square,PRESS)和交叉驗證均方根誤差(root mean square error of cross validation,RMSECV)作為評價標(biāo)準(zhǔn),選擇最佳主成分?jǐn)?shù),當(dāng)PRESS和RMSECV的值最小時,所選的主成分?jǐn)?shù)最佳。
將二階導(dǎo)數(shù)光譜數(shù)據(jù)所建模型的主成分?jǐn)?shù)、PRESS和RMSECV作圖,如圖4所示,當(dāng)主成分?jǐn)?shù)為8時,PRESS和RMSECV均為最小,此主成分?jǐn)?shù)即為最佳主成分?jǐn)?shù)。
用建立的最佳校正模型對驗證集中樣品的維生素C含量進行驗證,預(yù)測均方根誤差(root mean standard error of prediction,RMSEP)為 0.656,驗證集結(jié)果見表 2。
圖4 主成分?jǐn)?shù)對PRESS和RMSECV的影響
表2 驗證集中維生素C含量的驗證結(jié)果(%)
外界環(huán)境如溫度、濕度等對光譜的重現(xiàn)性都會有影響,因此,在采集樣品的近紅外光譜時,要盡量保證在相同的環(huán)境下進行,以增強各光譜間的可比性。
光譜預(yù)處理方法不同,所建模型預(yù)測效果存在較大差異。由于市售維生素C片表面多比較粗糙且顆粒度較大,所以通過多元散射校正(MSC)預(yù)處理對維生素C片建模效果影響并不明顯。但是,常見的維生素C片多添加色素改善外觀,市售維生素C片顏色多不相同,由于一階導(dǎo)數(shù)、二階導(dǎo)數(shù)可以有效的消除樣品由于顏色差別引起的基線漂移等干擾信息,同時放大了樣品本身的特征信號,所以通過一階導(dǎo)數(shù)、二階導(dǎo)數(shù)對光譜進行預(yù)處理后所得的預(yù)測模型較原始光譜的預(yù)測模型準(zhǔn)確度大為提高。由實驗結(jié)果可知無論是校正集還是驗證集,二階導(dǎo)數(shù)預(yù)處理光譜的應(yīng)用能獲得更好的預(yù)測結(jié)果。
雖然TQ Analyst 8.0光譜分析軟件本身內(nèi)嵌有譜區(qū)范圍計算插件,但是由于不同廠家生產(chǎn)的維生素C片成分組成、粒徑差異及混合均勻程度相差較大,軟件推薦的譜區(qū)范圍并不能完全代表光譜的有效信息,而在10000~4000 cm-1全譜段內(nèi)所包含的維生素C片含量信息量最大,受背景干擾最小,所建立的模型預(yù)測效果最佳。
本實驗直接對市售維生素C片進行光譜掃描,并與藥品標(biāo)示濃度關(guān)聯(lián)建立預(yù)測模型,具有通用性。雖然外部驗證結(jié)果中若干批次藥品含量的相對偏差較大,這主要是由于存在不同生產(chǎn)工藝、片劑類型品種(口服片、含片、咀嚼片或泡騰片)、原(輔)料來源或級別、保存條件、批次等影響,藥品真實含量與標(biāo)示含量會存在一定的誤差。隨著樣本量的不斷增加,模型的準(zhǔn)確性和適應(yīng)性將進一步增加。
總之,偏最小二乘法法同近紅外漫反射光譜結(jié)合,對市售不同廠家的維生素C片進行無損非破壞性定量分析是可行的,且具有無需預(yù)處理,快速、簡便等優(yōu)點,可作為藥物定量分析的常規(guī)方法之一,既可用于產(chǎn)品質(zhì)量控制,也可用于藥品快速檢驗。
[1]陸婉珍,袁洪福,徐廣通.現(xiàn)代近紅外光譜技術(shù)[M].2版.北京:中國石化出版社,2007:1.
[2]Olsen BA,Borer MW,Perry FM,et al.Screening for counterfeit drugs using near-infrared spectroscopy[J].Pharm Technol,2002,6:62-71.
[3]Rodionova OY,Houmoller LP,Pomerantsev AL,et al.NIR spectrometry for counterfeit drug detection[J].Anal Chim Acta,2005,549:151-158.
[4]劉緒平,馮艷春,胡昌勤,等.頭孢拉定膠囊劑近紅外通用性定量分析模型的建立[J].藥物分析雜志,2008,28(5):722-726.
[5]國家藥典委員會.中國藥典[S].二部.北京:化學(xué)工業(yè)出版社,2005:附錄23-25.
[6]國家藥典委員會.中國藥典[S].二部.北京:中國醫(yī)藥科技出版社,2010:902.