王小亮,楊靜,梁亞偉,林芳
陜西省食品藥品檢驗研究院,陜西 西安 710065
鹽酸氨溴索是臨床上廣泛應用的祛痰藥物,具有療效肯定、毒副作用小的優(yōu)點。其作用機制是通過增加呼吸道漿液的分泌,同時抑制黏液的分泌并裂解黏蛋白中的多糖纖維,從而稀釋痰液促進痰液排出[1-3]。目前的使用劑型包括:片劑(普通片、緩釋片、分散片、口崩片等),膠囊(普通膠囊、緩釋膠囊),口服液和氣霧劑等。其中,鹽酸氨溴索口服液避免了片劑和膠囊?guī)淼耐萄蕟栴},其應用前景日益寬廣。
公開報道的鹽酸氨溴索近紅外鑒別方法主要集中在鹽酸氨溴索片劑的定量分析[4]、快速識別檢測[5]、注射用鹽酸氨溴索的近紅外一致性檢驗模型建立等[6],針對鹽酸氨溴索口服液的近紅外定性鑒別或定量分析還未見相關文獻。
本研究基于鹽酸氨溴索口服液樣本近紅外漫反射光譜,進行其定量預測模型建模,實現(xiàn)了對鹽酸氨溴索口服液的快速檢驗。
Matrix-F 近紅外光譜儀(德國Bruker 公司),配有1.5 m 長固體光纖探頭;銦鎵砷(InGaAs)檢測器;OPUS5.5 光譜分析軟件(德國Bruker 公司);BP211D電子分析天平(德國賽多利斯公司);MATLAB R2010 商業(yè)數(shù)學軟件(美國MathWorks 公司)。
陜西省食品藥品檢驗研究院國家評價性抽驗樣品,包含22 個廠家共計123 批次鹽酸氨溴索口服液樣品,共兩種規(guī)格,分別為0.3 g/100 mL 和0.6 g/100 mL。
按照《中國藥典》2020 年版二部,采用高效液相色譜法測定鹽酸氨溴索口服液的含量,123 批樣品含量測定結果以mg/mL 表示,其中標示含量為0.3 g/100 mL 的樣品有91 批,含量分布在2.87~3.12 mg/mL 范圍內(nèi);標示含量為0.6 g/100 mL 的樣品有32 批,含量分布在5.77~6.20 mg/mL 范圍內(nèi),見圖1。
圖1 所有樣本的含量分布
在進行含量預測模型建模時,選取100 批次樣品為訓練集,剩余的23 批次樣品為預測集,訓練集和預測集樣品的前兩個主成分分布見圖2,訓練集和預測集樣本均勻分布,均可以表征樣本的有效信息。
圖2 樣本的前兩個主成分分布圖
采用透反射測量方式,以固體光纖探頭配合1號液體附件直接測量采集樣品近紅外(NIR)圖譜。光譜掃描范圍為12 000~4 000 cm-1,分辨率8 cm-1,掃描次數(shù)64 次,每批樣品測定3 次,使用平均光譜建模。最終獲得的樣本光譜見圖3。
圖3 經(jīng)平均后的近紅外建模光譜
支持向量回歸算法是支持向量機在回歸問題上的應用,支持向量機在近紅外快速檢驗領域已經(jīng)得到了廣泛應用,包括將其分類和回歸算法應用于食品和藥品的產(chǎn)地鑒別、摻偽定性分析、含量預測等[7-10]。
采用絕對百分比均值誤差mAPE(mean absolute percentage error)和均方根誤差RMSE(root mean square error)對模型的預測性能進行評價,MAPE表征模型預測相對誤差的均值,RMSE 表征模型預測誤差的標準差,MAPE 和RMSE 越小,表征模型的預測精度越高。MAPE 和RMSE 計算方法如下:
式中,yk表示第k個樣本的真實值,表示第k個樣本的預測值,n為樣本數(shù)。
液體樣品選擇光譜范圍應避開溶劑吸收峰,而純水的O-H 伸縮振動在6 950 cm-1的一級倍頻和5 155 cm-1合頻吸收峰較強,且譜帶較寬,而其中的活性成分的吸收較弱,建模時應避開。同時,應避開邊緣效應,小于10 000 cm-1或大于4 250 cm-1一般不選。故最終選擇的光譜范圍為6 100~5 400 cm-1和8 200~7 400 cm-1。
光譜預處理可以有效剔除對建模精度提高無貢獻甚至降低建模精度的無用信息,不同光譜預處理方法對應的模型預測精度對比見表1,多元散射校正預處理對應的MAPE 值和RMSE 值均為四種預處理方法中的最優(yōu)值,因此,建模選用經(jīng)過多元散射校正后的光譜數(shù)據(jù)。
表1 不同光譜預處理方法對應的模型預測精度
圖4 經(jīng)多元散射校正預處理后的樣本光譜
支持向量回歸中合適的核函數(shù)不但可以獲得更好的預測效果,還可以在一定程度上消除不平衡樣本的消極影響。常用的核函數(shù)包括線性核函數(shù)、徑向基核函數(shù)、多項式核函數(shù)和反曲核函數(shù)。選取不同核函數(shù)所建立的定量預測模型的預測精度見表2,采用徑向基核函數(shù)所建立的預測模型可以獲得最優(yōu)預測結果。
表2 不同核函數(shù)對應的模型預測精度
回歸模型的參數(shù)選擇主要是對懲罰因子c 和核函數(shù)參數(shù)g 的優(yōu)化。采用蟻群算法進行模型參數(shù)c和g 的優(yōu)化,設定初始蟻群規(guī)模為80,最大迭代代數(shù)為100,c 和g 的優(yōu)化區(qū)間為[0.001,10],最終獲得的RMSE 隨迭代代數(shù)的變化曲線見圖5,最優(yōu)的c 和g 分別為6.561 1 和1.100 4,對應的RMSE為0.133 36。
圖5 回歸模型參數(shù)優(yōu)化結果
根據(jù)光譜預處理、核函數(shù)和參數(shù)c、g 的選擇結果,最終確定的定量預測模型建模參數(shù)選取見表3。
表3 定量預測模型建模參數(shù)
所建立的定量預測模型對訓練集樣本的含量預測結果及相關性見圖6,最大絕對誤差為0.17 mg/mL,預測均方根誤差RMSE 為0.149 3 mg/mL,預測值和真實值的相關系數(shù)達到了0.996 5,說明預測值和真實值顯著相關。
圖6 訓練集樣本含量預測結果及相關性:A.含量預測;B.相關性
同樣,圖7 給出了預測集樣本的含量預測結果及相關性,最大絕對誤差為0.20 mg/mL,預測均方根誤差RMSE 為0.152 0 mg/mL,相關系數(shù)為0.994 7,詳細結果見表4。
表4 預測集樣本含量預測值與真實值
圖7 預測集樣本含量預測結果及相關性:A.含量預測;B.相關性
本研究基于鹽酸氨溴索口服液樣本近紅外漫反射光譜,進行其定量預測模型建模,實現(xiàn)了對鹽酸氨溴索口服液的快速檢驗。選取多元散射校正預處理方法,核函數(shù)為徑向基核函數(shù)時,所建立模型的預測精度最高。對訓練集和預測集樣本的最大預測誤差分別為0.17 mg/mL 和0.20 mg/mL,相關系數(shù)分別為0.996 5 和0.994 7。所建立的定量模型建模方法,具有過程簡單、預測準確的特點,拓展了近紅外快速檢驗和定量預測的新途徑。