王小亮,黃萍
佐匹克隆片常規(guī)劑量具有鎮(zhèn)靜催眠和肌肉松弛作用,作用于苯二氮卓受體,可用于各種失眠癥。作為一種安全性較高的速效催眠藥,佐匹克隆能延長睡眠時間,提高睡眠質(zhì)量,減少夜間覺醒和早醒次數(shù),臨床應(yīng)用廣泛[1]。
近紅外光譜檢測(Near Infrared Spectrum,NIR)技術(shù)作為一種快速、簡便、無損檢測方法,極大簡化了樣本測試環(huán)節(jié),可以用于石化、農(nóng)業(yè)、食品和藥品領(lǐng)域[2]。近年來已廣泛用于藥品快速檢驗(yàn)及過程分析領(lǐng)域,但其建模方法多基于偏最小二乘算法[3-6]。
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)是一種模擬大腦神經(jīng)突觸聯(lián)接結(jié)構(gòu)實(shí)現(xiàn)信息處理的數(shù)學(xué)運(yùn)算模型,由大量進(jìn)行并行計(jì)算的基本單元(神經(jīng)元)相互連接組成。神經(jīng)網(wǎng)絡(luò)的功能與信息處理能力全部由神經(jīng)元之間的相互連接(權(quán)值)來體現(xiàn),神經(jīng)元之間的互連體現(xiàn)了信息的分布式存儲,各神經(jīng)元連接權(quán)值的動態(tài)修正體現(xiàn)了網(wǎng)絡(luò)的學(xué)習(xí)進(jìn)化過程,神經(jīng)網(wǎng)絡(luò)通過計(jì)算得到的輸出體現(xiàn)了網(wǎng)絡(luò)的聯(lián)想記憶功能[7-10]。主要分為兩個步驟:第一步為正向傳播階段,對于給定的網(wǎng)絡(luò)輸入,通過正向傳播得出各個單元的實(shí)際輸出;第二步為誤差反向傳播階段,計(jì)算輸出層各單元的輸出誤差項(xiàng),根據(jù)這些誤差逐層向輸入層方向逆向傳播,調(diào)整各個連接權(quán)值。通過兩個步驟的反復(fù)迭代,直到輸出層的誤差項(xiàng)最小。見圖1。
圖1 神經(jīng)網(wǎng)絡(luò)功能示意圖
本文將近紅外檢測與人工神經(jīng)網(wǎng)絡(luò)建模相結(jié)合,通過近紅外在線檢測獲得樣本的光譜數(shù)據(jù),然后通過神經(jīng)網(wǎng)絡(luò)快速建模,可以將近紅外檢測的高效性與神經(jīng)網(wǎng)絡(luò)的高準(zhǔn)確性、高魯棒性相結(jié)合,實(shí)現(xiàn)對樣本的快速定量檢測[11-12]。
本研究起止時間2016年6月至2017年3月。
1.1儀器Matrix-F近紅外光譜儀(德國Bruker公司,配有1.5 m長固體光纖探頭);銦鎵砷(InGaAs)檢測器;OPUS 5.5光譜分析軟件(德國Bruker公司);UV-2600紫外可見分光光度計(jì)(日本島津公司);BP211D電子分析天平(德國賽多利斯公司);MATLAB R2010a商業(yè)數(shù)學(xué)軟件(美國MathWorks公司)。
1.2樣品5個廠家生產(chǎn)的84批佐匹克隆片,均為陜西省食品藥品檢驗(yàn)所抽驗(yàn)樣品;佐匹克隆對照品(中國食品藥品檢定研究院,生產(chǎn)批號100872~200801,規(guī)格:50 mg)。
1.3方法
1.3.1含量測定 依據(jù)《中國藥典2015年版二部》,采用紫外分光光度法測定佐匹克隆的含量[13]。84批樣品含量測定結(jié)果均以%表示。見表1。
表1 建模選用的樣本數(shù)據(jù)
1.3.2NIR光譜測定及預(yù)處理 以漫反射方式采集樣品的NIR光譜。以固體光纖探頭抵住片劑采集樣品的NIR漫反射光譜。選擇未帶刻痕、一面作為光譜采集部位。光譜采集條件:掃描范圍為(12 000~4 000)/cm,分辨率8/cm,室溫,掃描次數(shù)64次,每批樣品測定6片作為原始光譜,再求平均光譜作為建模光譜。如圖2所示。
圖2 經(jīng)平均后的近紅外建模光譜
一階求導(dǎo)及矢量歸一化的光譜預(yù)處理方法可有效地校正光源強(qiáng)度波動及人為因素的影響,消除光程或樣品厚度帶來的影響,更能真實(shí)細(xì)致地反映與活性成分含量相關(guān)的光譜信息。同時,通過與原始光譜、一階求導(dǎo)預(yù)處理、二階求導(dǎo)預(yù)處理所建立的模型相比,采用一階求導(dǎo)及矢量歸一化預(yù)處理光譜建立的神經(jīng)網(wǎng)絡(luò)模型具有相對更高的預(yù)測精度,因此選用一階求導(dǎo)及矢量歸一化方法對光譜進(jìn)行預(yù)處理,處理后的光譜如圖3所示。由于光譜在前端很平,基本上沒有峰值出現(xiàn),進(jìn)行建模時無法提供有效的樣本信息,而光譜在后端存在較大的系統(tǒng)噪聲。為了保證光譜包含足夠豐富的樣本信息,同時又盡可能減小系統(tǒng)誤差對建模精度的影響,建模時選取(10 000~4 200)/cm譜段,每組樣本包含778個數(shù)據(jù)點(diǎn)。
圖3 經(jīng)一階求導(dǎo)及矢量歸一化后的近紅外建模光譜
1.4統(tǒng)計(jì)學(xué)方法利用MATLAB R2010a商業(yè)數(shù)學(xué)軟件(美國MathWorks公司)進(jìn)行紅外圖譜的數(shù)據(jù)信息處理。主要方法是:以一階求導(dǎo)對紅外光譜做矢量歸一化的光譜預(yù)處理,而后對數(shù)據(jù)進(jìn)行主成分分析。
2.1主成分分析結(jié)果經(jīng)過預(yù)處理后的光譜數(shù)據(jù)每個樣本包含778個數(shù)據(jù)點(diǎn),直接進(jìn)行神經(jīng)網(wǎng)絡(luò)建模會導(dǎo)致模型輸入層節(jié)點(diǎn)過多,因此,為了數(shù)據(jù)降維和消除重復(fù)的光譜信息,首先對84組樣本光譜數(shù)據(jù)進(jìn)行主成分分析[14-16]。經(jīng)主成分分析得出的前20個主成分對應(yīng)的特征值和貢獻(xiàn)率、累計(jì)貢獻(xiàn)率見表2。
表2 前20個主成分對應(yīng)的特征值和貢獻(xiàn)率、累計(jì)貢獻(xiàn)率
由主成分分析結(jié)果可知,第一個主成分的特征值為494.96,其貢獻(xiàn)率為63.62%,即其對總體信息的解釋程度為63.32%;第二個主成分的特征值為150.57,其貢獻(xiàn)率為19.35%,即其對總體信息的解釋程度為19.35%。按照主成分確定的一般原則,當(dāng)其特征值大于1或累計(jì)貢獻(xiàn)率達(dá)到85%以上時即可,綜合考慮確定建模選取的主成分為10個,其對總體信息的累計(jì)代表程度為99.07%。
圖4 選用的神經(jīng)網(wǎng)絡(luò)模型構(gòu)型
2.2人工神經(jīng)網(wǎng)絡(luò)建模與分析圖4給出了建模選用的神經(jīng)網(wǎng)絡(luò)模型示意圖,模型為10(輸入節(jié)點(diǎn))-6(隱含層節(jié)點(diǎn))-1(輸出節(jié)點(diǎn))三層神經(jīng)網(wǎng)絡(luò),輸入樣本集包括三部分:訓(xùn)練集、驗(yàn)證集和測試集。訓(xùn)練集用于網(wǎng)絡(luò)訓(xùn)練,驗(yàn)證集用于在網(wǎng)絡(luò)訓(xùn)練過程中防止訓(xùn)練過擬合,即當(dāng)訓(xùn)練集誤差繼續(xù)下降,但驗(yàn)證集誤差還是上升時停止網(wǎng)絡(luò)訓(xùn)練,而測試集用于對訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行測試,以檢驗(yàn)網(wǎng)絡(luò)的推廣能力,樣本的劃分采用隨機(jī)取樣方法。
進(jìn)行神經(jīng)網(wǎng)絡(luò)建模時,選取所有84組樣本數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)建模,建模所采用的參數(shù)見表3。
表3 神經(jīng)網(wǎng)絡(luò)建模模型參數(shù)
在進(jìn)行神經(jīng)網(wǎng)絡(luò)建模前,首先對樣本進(jìn)行了歸一化處理,將樣本數(shù)據(jù)轉(zhuǎn)換到[-1,+1]區(qū)間內(nèi),轉(zhuǎn)換方法如下:
y=2×(x-xmin)/(xmax-xmin)-1
式中,x表示單個樣本值,xmax和xmin分別為樣本數(shù)據(jù)列的最大值和最小值。
圖5給出了神經(jīng)網(wǎng)絡(luò)訓(xùn)練次數(shù)與誤差均方值MSE的關(guān)系曲線,隨著訓(xùn)練次數(shù)的增加,訓(xùn)練集、驗(yàn)證集和測試集的誤差均方值均有所下降,當(dāng)訓(xùn)練次數(shù)達(dá)到12次時,訓(xùn)練集的誤差均方值減小到2.75e-7,小于設(shè)定的訓(xùn)練目標(biāo)誤差值1e-5,神經(jīng)網(wǎng)絡(luò)停止訓(xùn)練,建模完成。訓(xùn)練結(jié)束時,對于驗(yàn)證集的誤差均方值為1.02e-1,測試集的誤差均方值為5.71e-2。
圖6 樣本實(shí)測值與模型輸出值相關(guān)性:A為訓(xùn)練集;B為驗(yàn)證集;C為測試集;D為全樣本
圖6給出了樣本實(shí)測值與模型預(yù)測值相關(guān)性曲線,所建立的神經(jīng)網(wǎng)絡(luò)模型對訓(xùn)練集、驗(yàn)證集和測試集的回歸系數(shù)分別為1.000、0.992和0.973,而神經(jīng)網(wǎng)絡(luò)模型對整個樣本集的回歸系數(shù)則達(dá)到了0.994,說明依據(jù)神經(jīng)網(wǎng)絡(luò)模型所預(yù)測出的模型預(yù)測值與樣本實(shí)測值之間存在極高的相關(guān)性,模型預(yù)測結(jié)果具有極高的可信度。
從84組樣本中選取10組樣本,代入神經(jīng)網(wǎng)絡(luò)模型,進(jìn)行了模型預(yù)測值與樣本實(shí)測值對比如表4所示,模型預(yù)測值與樣本實(shí)測值的最大偏差為2.85%,最小偏差為0.02%,平均偏差為0.70%,具有相當(dāng)高的預(yù)測精度。
表4 模型預(yù)測值與樣本實(shí)測值的對比
將近紅外光譜測量方法與人工神經(jīng)網(wǎng)絡(luò)建模方法相結(jié)合建立了佐匹克隆片的定量分析模型。在主成分分析的基礎(chǔ)上,利用84組樣本對神經(jīng)網(wǎng)絡(luò)模型進(jìn)行了訓(xùn)練,并對模型進(jìn)行了預(yù)測驗(yàn)證。模型預(yù)測值與樣本實(shí)測值的對比結(jié)果顯示,模型預(yù)測結(jié)果與實(shí)測結(jié)果很好吻合,其最大偏差為2.85%,最小偏差為0.02%,平均偏差為0.70%。經(jīng)訓(xùn)練的網(wǎng)絡(luò)模型可以用于對佐匹克隆片含量的快速準(zhǔn)確預(yù)測。
(本文圖5見插圖1-2)