亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于參數(shù)校正的近紅外光譜模型轉(zhuǎn)移新方法

        2020-06-13 02:00:28李博巖彭黔榮
        光譜學(xué)與光譜分析 2020年6期
        關(guān)鍵詞:方法模型

        胡 蕓,李博巖,張 進(jìn),彭黔榮

        1.貴州中煙工業(yè)有限責(zé)任公司技術(shù)中心,貴州 貴陽 550009 2.貴州醫(yī)科大學(xué)食品科學(xué)學(xué)院,貴州 貴陽 550025

        引 言

        近年來,基于近紅外光譜的快速檢測(cè)分析迅速發(fā)展并被廣泛應(yīng)用于煙草、石油等領(lǐng)域。近紅外光譜分析主要是通過收集大量樣品數(shù)據(jù)建立多元校正模型,進(jìn)而實(shí)現(xiàn)組分的定性和定量分析目的。與常規(guī)檢測(cè)方法相比,具有無損、綠色、簡(jiǎn)單快捷等優(yōu)點(diǎn)。在實(shí)際應(yīng)用過程中,由于近紅外儀器的更新、維修、老化,或不確定的外界因素等變化會(huì)引起光譜數(shù)據(jù)的改變,從而導(dǎo)致校正模型的預(yù)測(cè)能力降低或者根本不能使用。因此,為了提高模型預(yù)測(cè)的準(zhǔn)確性和適用范圍,研究與應(yīng)用合理的模型轉(zhuǎn)移方法就顯得尤為重要。

        模型轉(zhuǎn)移的主要思路是建立主機(jī)(master instrument)和子機(jī)(slave instrument)光譜、模型參數(shù)或預(yù)測(cè)值之間的函數(shù)關(guān)系,進(jìn)而校正由于儀器或檢測(cè)環(huán)境因素變化導(dǎo)致的樣本預(yù)測(cè)誤差[1-3]。按照校正的對(duì)象不同,模型轉(zhuǎn)移方法大致可以分為三類:(1)對(duì)預(yù)測(cè)結(jié)果進(jìn)行校正,如模型斜率/截距(S/B)修正算法等[4];(2)對(duì)光譜進(jìn)行校正,如分段直接標(biāo)準(zhǔn)化(piecewise direct standardization,PDS)等[5-8];(3)對(duì)模型參數(shù)進(jìn)行校正,如兩步偏最小二乘方法等[9]。模型參數(shù)校正方法簡(jiǎn)單、實(shí)用,不涉及近紅外光譜的校正。當(dāng)然,不同的分析體系所適用的模型轉(zhuǎn)移方法會(huì)不同,轉(zhuǎn)移模型的預(yù)測(cè)準(zhǔn)確性也有差異。

        正則化(regularization)是一種通用的防止參數(shù)過擬合的方法。在化學(xué)計(jì)量學(xué)回歸和聚類算法中廣泛使用不同的正則化約束方法[10],如嶺回歸、LASSO和彈性網(wǎng)等。本文基于吉洪諾夫正則化提出了一種參數(shù)校正的模型轉(zhuǎn)移新方法(new Tikhonov regularization-based calibration transfer method,NTRCT)。其思路是通過同時(shí)約束主機(jī)與子機(jī)光譜模型,使得標(biāo)準(zhǔn)樣品的主機(jī)與子機(jī)模型的預(yù)測(cè)差異最小。該方法為有標(biāo)準(zhǔn)樣本的模型轉(zhuǎn)移方法,簡(jiǎn)單、直接。將該方法分別應(yīng)用于藥物和煙葉的近紅外光譜數(shù)據(jù)分析,其偏最小二乘模型轉(zhuǎn)移效果令人滿意。

        1 實(shí)驗(yàn)部分

        1.1 數(shù)據(jù)與儀器

        藥物的透射近紅外光譜數(shù)據(jù)采自于兩臺(tái)近紅外儀器(Foss NIR systems,Silver Spring,MD),來源于國際漫反射會(huì)議網(wǎng)(http://www.idrc-chambersburg.org/shootout2002.html)。光譜的波長(zhǎng)范圍為600~1 898 nm,間隔為2 nm,藥物的有效成分(API)含量范圍為151.6~239.1 mg。樣本集包含655個(gè)樣本,其中校正集有155個(gè)樣本,驗(yàn)證集40個(gè)樣本,預(yù)測(cè)集460個(gè)樣本。依據(jù)文獻(xiàn)[6],剔除4個(gè)校正集異常樣本(即#19,122,126和127樣本),9個(gè)預(yù)測(cè)集異常樣本(#11,145,267,294,295,313,341,342和343樣本)。

        煙葉的近紅外光譜采自兩臺(tái)Thermo Antaris Ⅱ傅里葉近紅外分析儀器(Thermo Scientific公司)。光譜的波數(shù)范圍為10 000~4 000 cm-1,分辨率為8 cm-1,掃描次數(shù)為64。按照煙草及煙草制品總植物堿與水溶性糖的測(cè)定標(biāo)準(zhǔn),采用連續(xù)流動(dòng)分析法測(cè)得煙葉中總植物堿含量范圍為1.28%~3.96%,總糖含量范圍為7.92%~36.18%。利用Kennard-Stone算法對(duì)209個(gè)煙葉樣本的光譜進(jìn)行選樣,40個(gè)樣本作為標(biāo)準(zhǔn)樣品,120個(gè)樣本用作校正集,剩余的49個(gè)樣本作為測(cè)試集。

        1.2 算法

        樣品在主機(jī)和子機(jī)上量測(cè)所得近紅外光譜分別為Xm和Xs,目標(biāo)組分的偏最小二乘定量校正模型可表示

        ym=Xmβm+em

        (1)

        ys=Xsβs+es

        (2)

        不同儀器采集相同樣品的近紅外光譜之間存在差異性,但目標(biāo)組分的含量是一致的,因此,使用主機(jī)和子機(jī)光譜模型對(duì)樣品進(jìn)行預(yù)測(cè)時(shí),其差異可用式(3)表示

        e=Xmβm-Xsβs

        (3)

        這里,我們定義e為模型預(yù)測(cè)損失函數(shù)。

        若光譜存在微小線性差異,模型參數(shù)差異則較小,可以使用相關(guān)系數(shù)corr(βm,βs)>rth作為約束優(yōu)化模型[11]?;瘜W(xué)計(jì)量學(xué)中常使用稀疏或者平方等正則化約束。其中平方約束能夠有效地約束向量之間的夾角和長(zhǎng)度,是一種性質(zhì)優(yōu)異的約束條件。因此,定義主機(jī)和子機(jī)光譜模型參數(shù)的平方約束小于一個(gè)特定值ξ,

        ‖βm-βs‖2≤ξ

        (4)

        方程(3)中平方損失函數(shù)在式(4)的約束下,可以轉(zhuǎn)化為最小化損失函數(shù)

        f(βs)=min(‖Xmβm-Xsβs‖2+λ‖βm-βs‖2)

        (5)

        其中λ為權(quán)重參數(shù),決定著子機(jī)光譜模型的預(yù)測(cè)準(zhǔn)確度和模型復(fù)雜度。當(dāng)λ較小時(shí),使用不同儀器模型預(yù)測(cè)樣品的差異最小化占主導(dǎo)作用,而忽略了對(duì)模型一致性的約束,結(jié)果可能導(dǎo)致模型過擬合(over-fitting);當(dāng)λ過大時(shí),則過分強(qiáng)調(diào)模型一致性,從而導(dǎo)致子機(jī)預(yù)測(cè)結(jié)果變差,引起欠擬合(under-fitting)問題。通過對(duì)式(5)中的損失函數(shù)求導(dǎo)數(shù),并令其等于零,得到該損失函數(shù)的極小值

        (6)

        其中I表示單位矩陣。該方法簡(jiǎn)單、穩(wěn)健,能夠直接求解出最優(yōu)解,無需優(yōu)化算法。

        1.3 模型建立和轉(zhuǎn)移評(píng)價(jià)

        采用偏最小二乘(partial least squares,PLS)方法建立校正模型;利用交互檢驗(yàn)均方根誤差(root mean square error of cross validation,RMSECV)、預(yù)測(cè)均方根誤差(root mean square error of prediction,RMSEP)和相對(duì)分析誤差(relative prediction deviation,RPD)(即建模數(shù)據(jù)分布標(biāo)準(zhǔn)偏差與預(yù)測(cè)均方根誤差的比值)[12]三個(gè)指標(biāo)評(píng)價(jià)模型建立和轉(zhuǎn)移效果。RPD綜合考慮預(yù)測(cè)樣本化學(xué)值的標(biāo)準(zhǔn)差與所建模型的預(yù)測(cè)標(biāo)準(zhǔn)差,是評(píng)價(jià)模型分辨能力的重要參數(shù)。通常,RPD>3.0,說明定標(biāo)效果良好,所建模型可用于實(shí)際樣品檢測(cè);RPD=2.5~3.0,說明所建模型可進(jìn)行定量分析,但精度有待提高;RPD<2.5,說明該成分定量分析困難。

        2 結(jié)果與討論

        2.1 不同儀器采集的近紅外光譜數(shù)據(jù)分析

        同一藥物樣本分別在兩臺(tái)儀器上量測(cè)的光譜相似,而在600~750和1 650~1 800 nm區(qū)間內(nèi)差異較為明顯[圖1(a)]。由于藥物的近紅外光譜在1 750~1 898 nm區(qū)間內(nèi)存在嚴(yán)重的噪聲干擾,因此,僅選擇600~1 738 nm波長(zhǎng)范圍的光譜信號(hào)用于建立模型。而相同的煙葉樣本在兩臺(tái)儀器上測(cè)量所得的光譜有一定的背景差異,但整體形狀非常相似[圖1(b)]。

        圖1 同一藥物(a)和煙葉(b)樣本在兩臺(tái)儀器上量測(cè)的近紅外光譜圖Fig.1 NIR spectra of the same sample collected on two instruments (a) pharmaceutical tablet and (b) tobacco leaf

        我們采用主成分-馬氏距離(PCA-Mahalanobis)方法,提取樣品光譜的特征信息,進(jìn)而表征同一樣本體系在不同儀器上的光譜性質(zhì)或特征的相似程度。無論是就藥物還是煙葉樣品而言,在主機(jī)上量測(cè)樣品光譜間的馬氏距離小于子機(jī)與主機(jī)樣品光譜間的馬氏距離(圖2),例如,藥物和煙葉的測(cè)試集樣品在主機(jī)上量測(cè)所得光譜間的馬氏距離平均值分別為2.34和2.55,而在子機(jī)上量測(cè)光譜與主機(jī)光譜間的馬氏距離平均值分別為4.69和5.58。馬氏距離的大小一定程度上量化了同一樣品在主機(jī)和子機(jī)上所采集的光譜數(shù)據(jù)的差異性,因此直接用主機(jī)校正模型預(yù)測(cè)子機(jī)光譜樣品參數(shù),必然會(huì)引起預(yù)測(cè)結(jié)果的誤差。

        圖2 (a)藥物和(b)煙葉樣本在兩臺(tái)儀器上的馬氏距離Fig.2 Mahalanobis distance of the samples taken on two instruments:(a) pharmaceutical tablets and (b) tobacco leaves

        2.2 子機(jī)模型的參數(shù)計(jì)算

        NTRCT方法主要是通過對(duì)標(biāo)準(zhǔn)樣品的預(yù)測(cè)來優(yōu)化參數(shù)λ,調(diào)整主機(jī)和子機(jī)光譜預(yù)測(cè)結(jié)果一致性和模型相似性。λ值的大小對(duì)模型轉(zhuǎn)移效果非常關(guān)鍵:λ較小,則會(huì)出現(xiàn)模型過擬合,過分追求樣本的預(yù)測(cè)效果;λ過大,則會(huì)出現(xiàn)模型欠擬合,過分強(qiáng)調(diào)主機(jī)和子機(jī)模型的相似程度。我們以藥物樣本集為例,應(yīng)用15個(gè)標(biāo)準(zhǔn)樣品,以子機(jī)光譜樣本的PLS定量模型的RMSECV為目標(biāo),優(yōu)化參數(shù)λ。圖3(a)給出了藥物樣本活性成分模型中λ隨子機(jī)光譜樣本的RMSECV變化曲線,結(jié)果表明當(dāng)λ=2.442時(shí),其對(duì)應(yīng)的RMSECV為最小,子機(jī)光譜樣本預(yù)測(cè)集的RMSEP為3.9 mg,接近主機(jī)模型預(yù)測(cè)主機(jī)光譜樣本的RMSEP 3.4 mg,大大低于主機(jī)模型直接預(yù)測(cè)子機(jī)光譜樣本的RMSEP 8.3 mg。圖3(b)和(c)為煙葉中總植物堿和總糖含量模型中參數(shù)λ隨子機(jī)光譜樣本的RMSECV變化曲線。當(dāng)λ分別為222.300和0.027時(shí),其對(duì)應(yīng)的RMSECV為最小,相應(yīng)的子機(jī)光譜預(yù)測(cè)集樣本的總植物堿和總糖的RMSEP為0.09%和0.83%。該結(jié)果表明,通過選擇合適的參數(shù)λ,優(yōu)化子機(jī)模型的參數(shù),能夠提高子機(jī)光譜樣本的預(yù)測(cè)結(jié)果。

        圖3 (a)藥物活性成分、煙葉樣本中(b)總植物堿和(c)總糖的RMSECV隨參數(shù)λ的變化情況Fig.3 Effect of the parameter λ on the RMSECV values:(a) API of pharmaceutical tablets, (b) total alkaloid content and (c) total sugar content in tobacco leaves

        2.3 模型轉(zhuǎn)移效果的考察

        通過與PDS方法比較,考察了NTRCT方法的應(yīng)用效果及標(biāo)準(zhǔn)樣品的數(shù)量因素對(duì)這兩種方法模型轉(zhuǎn)移效果的影響。

        對(duì)于藥物數(shù)據(jù)來說,如果用主機(jī)光譜建立的PLS模型直接預(yù)測(cè)子機(jī)光譜樣本得到的RMSEP為8.3 mg,是主機(jī)RMSEP的2.4倍,對(duì)應(yīng)的RPD值為2.65,預(yù)測(cè)誤差較大,因此不能滿足模型轉(zhuǎn)移實(shí)際應(yīng)用的需要。PDS和NTRCT方法都能有效降低轉(zhuǎn)移模型的預(yù)測(cè)誤差,且兩者的RPD值均大于3.0(表1),其中NTRCT的效果接近或好于PDS。

        煙葉中的總植物堿和總糖含量是評(píng)價(jià)煙葉質(zhì)量的重要化學(xué)指標(biāo),因此,其快速準(zhǔn)確的測(cè)定是非常重要的。若用主機(jī)樣本光譜建立的校正模型直接預(yù)測(cè)子機(jī)光譜樣本的總植物堿和總糖含量,得到的 RMSEP分別為0.49%和1.92%,對(duì)應(yīng)的RPD值為1.30和3.39(表2和表3)。表2和表3的結(jié)果表明PDS和NTRCT方法都能有效提高轉(zhuǎn)移模型的預(yù)測(cè)能力,所得RPD值都大于3.0,其中NTRCT的效果遠(yuǎn)遠(yuǎn)好于PDS方法。使用15個(gè)標(biāo)準(zhǔn)樣品時(shí),NTRCT方法模型轉(zhuǎn)移后的RPD值分別增加到6.68和7.84。

        表1 藥物活性成分的模型轉(zhuǎn)移結(jié)果Table 1 Model transfer results of the API content (mg) in pharmaceutical tablets

        表2 煙葉中總植物堿的模型轉(zhuǎn)移結(jié)果Table 2 Model transfer results of the total alkaloid content (%) in tobacco leaves

        表3 煙葉中總糖的模型轉(zhuǎn)移結(jié)果Table 3 Model transfer results of the total sugar content (%) in tobacco leaves

        圖4 模型轉(zhuǎn)移前后煙葉測(cè)試樣品中總植物堿的預(yù)測(cè)值與參考值的比較Fig.4 Comparison of predicted and reference values of total alkaloids of tobacco leaf samples before and after model transfer

        圖4比較了使用120個(gè)主機(jī)樣本光譜建立的煙葉中總植物堿含量的校正模型分別對(duì)49個(gè)樣本的主機(jī)和子機(jī)光譜進(jìn)行直接預(yù)測(cè)以及經(jīng)過NTRCT算法轉(zhuǎn)移后的預(yù)測(cè)相關(guān)分析結(jié)果。我們可以看出,經(jīng)過NTRCT算法轉(zhuǎn)移后子機(jī)樣本光譜的預(yù)測(cè)精度有顯著的提高,參考值與預(yù)測(cè)值相關(guān)曲線的截距變小(0.120),對(duì)應(yīng)的斜率更接近于1.0,與使用主機(jī)校正模型直接預(yù)測(cè)主機(jī)樣本光譜所得結(jié)果較為一致,這說明了該方法的有效性。

        隨著標(biāo)準(zhǔn)樣品數(shù)的增加,PDS方法使得藥物活性成分主機(jī)與子機(jī)樣品光譜轉(zhuǎn)移模型的預(yù)測(cè)能力變差(表1);對(duì)煙葉數(shù)據(jù)來說,標(biāo)準(zhǔn)樣品數(shù)量的增加使PDS模型轉(zhuǎn)移方法的預(yù)測(cè)效果變得更好,而對(duì)NTRCT模型轉(zhuǎn)移方法的預(yù)測(cè)影響不大。這說明選擇10個(gè)或者15個(gè)標(biāo)準(zhǔn)樣品用于模型轉(zhuǎn)移已足夠求得合理的子機(jī)模型參數(shù)。

        3 結(jié) 論

        基于參數(shù)校正的近紅外光譜模型轉(zhuǎn)移方法通過使用標(biāo)準(zhǔn)樣本集光譜,正則化主機(jī)與子機(jī)的光譜模型系數(shù),訓(xùn)練、優(yōu)化參數(shù)λ,實(shí)現(xiàn)子機(jī)光譜的模型參數(shù)校正,達(dá)到較準(zhǔn)確的模型轉(zhuǎn)移目的。該方法分別成功應(yīng)用于藥物活性成分和煙葉中總植物堿與總糖含量的模型轉(zhuǎn)移和預(yù)測(cè)分析,使得子機(jī)光譜樣本的RMSEP明顯降低,且模型預(yù)測(cè)的RPD值均大于3,模型預(yù)測(cè)效果良好。該方法為具有標(biāo)準(zhǔn)樣本模型轉(zhuǎn)移提供了一種思路,有利于實(shí)現(xiàn)近紅外模型的共享,減少重復(fù)建立模型的工作量,從而推動(dòng)近紅外光譜技術(shù)網(wǎng)絡(luò)化的發(fā)展。該方法不適合用于無標(biāo)準(zhǔn)樣本的模型轉(zhuǎn)移。

        猜你喜歡
        方法模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        學(xué)習(xí)方法
        可能是方法不對(duì)
        3D打印中的模型分割與打包
        用對(duì)方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢方法
        乱人伦中文视频在线| 人妻少妇中文字幕久久69堂| 亚洲av一二三四又爽又色又色| 亚洲黄色av一区二区三区| 偷拍激情视频一区二区三区| 欧美粗大无套gay| 96精品免费视频大全| 国产精品国产三级国产an不卡| 精品午夜福利在线观看| 无码少妇一区二区浪潮av| 人妻洗澡被强公日日澡电影| 国产suv精品一区二人妻| 精品亚洲成a人在线观看青青| 亚洲中文字幕久久精品蜜桃 | 中文字幕在线亚洲日韩6页| 国产午夜无码视频免费网站| 日本二区三区视频免费观看| 久久精品视频日本免费| 日本污ww视频网站| 久久久国产一区二区三区四区小说| 久久久久亚洲女同一区二区| 亚洲人妖女同在线播放| 日本高清乱码中文字幕| 蜜臀av性久久久久蜜臀aⅴ| 中文字幕Aⅴ人妻一区二区苍井空| 日韩亚洲国产中文字幕| 国产精品高清一区二区三区不卡| 116美女极品a级毛片| 亚洲av中文无码乱人伦在线咪咕| 精品乱色一区二区中文字幕| 久热国产vs视频在线观看| 精品国精品无码自拍自在线| 国产黑色丝袜在线观看视频| 免费看片的网站国产亚洲| 激情综合五月婷婷久久| 亚洲午夜精品久久久久久人妖| 国产精品情侣露脸av在线播放| 国产精品一区二区久久蜜桃| 国产精品亚洲第一区二区三区| 中文字幕乱伦视频| 久99久精品免费视频热77|