亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        聯(lián)合區(qū)間高斯過程的近紅外光譜波長選擇方法及應(yīng)用

        2016-06-15 16:40:58尹燕燕
        光譜學(xué)與光譜分析 2016年8期
        關(guān)鍵詞:高斯波長區(qū)間

        徐 琛, 尹燕燕, 劉 飛

        江南大學(xué)輕工過程先進(jìn)控制教育部重點(diǎn)實(shí)驗(yàn)室, 自動(dòng)化研究所, 江蘇 無錫 214122

        聯(lián)合區(qū)間高斯過程的近紅外光譜波長選擇方法及應(yīng)用

        徐 琛, 尹燕燕, 劉 飛*

        江南大學(xué)輕工過程先進(jìn)控制教育部重點(diǎn)實(shí)驗(yàn)室, 自動(dòng)化研究所, 江蘇 無錫 214122

        針對(duì)近紅外光譜應(yīng)用, 提出了一種基于高斯過程(GP)模型的波長選擇算法, 即聯(lián)合區(qū)間高斯過程(synergy interval gaussian process, siGP)算法。 首先將全光譜區(qū)域劃分為一系列無重復(fù)且間距相等的區(qū)間, 再選取最優(yōu)的若干個(gè)區(qū)間聯(lián)合建立GP模型, 由于GP模型具有非線性處理能力, 因此該方法可以減少非線性的影響。 以紅曲菌固態(tài)發(fā)酵過程中過程參數(shù)水分含量和pH值的檢測(cè)為例, 新算法對(duì)水分含量、 pH值的預(yù)測(cè)集相關(guān)系數(shù)(rp)分別為0.956 4和0.977 3, 預(yù)測(cè)均方根誤差(RMSEP)分別為0.012 7和0.161 0, 參與建模的數(shù)據(jù)點(diǎn)由全譜的1 500個(gè)分別減少到225個(gè)、 375個(gè), 在對(duì)獨(dú)立樣本的預(yù)測(cè)上, 表現(xiàn)出較好的精度。 與傳統(tǒng)聯(lián)合區(qū)間偏最小二乘(siPLS)波長選擇算法對(duì)比, siGP算法預(yù)測(cè)效果更好: 對(duì)水分含量和pH值,rp在GP模型預(yù)測(cè)時(shí)提高了3.37%和3.51%, RMSEP在GP模型預(yù)測(cè)時(shí)提高了29.4%和34.8%。 表明siGP結(jié)合GP模型能夠有效選擇波長區(qū)間以及提高近紅外模型的準(zhǔn)確性, 對(duì)進(jìn)一步實(shí)現(xiàn)近紅外光譜技術(shù)在線檢測(cè)具有參考價(jià)值。

        近紅外光譜; 高斯過程模型; 聯(lián)合區(qū)間高斯過程(siGP); 紅曲菌; 水分含量; pH值

        引 言

        近年來, 近紅外光譜技術(shù)(NIR)作為一個(gè)過程分析工具, 被廣泛應(yīng)用于石油、 環(huán)境、 食品、 醫(yī)藥、 工業(yè)等領(lǐng)域[1-4]。 與傳統(tǒng)實(shí)驗(yàn)室分析方法相比, NIR具有高效、 快速、 無損、 無污染等特點(diǎn)。

        建立NIR定量分析模型, 以往大多使用線性回歸方法, 如主成分回歸(PCR)、 偏最小二乘(PLS); 但由于光譜數(shù)據(jù)中, 不可避免的會(huì)出現(xiàn)非線性因素, 一些非線性建模方法被提出, 如人工神經(jīng)網(wǎng)絡(luò)(ANN)[5]、 最小二乘支持向量機(jī)(LS-SVM)[6]等。 波長選擇是NIR建模中非常重要的步驟, 可以減少無效信息對(duì)NIR模型的影響, 降低模型復(fù)雜度。 目前, 被廣泛應(yīng)用的波長選擇算法有遺傳算法(GA)、 連續(xù)投影算法(SPA)、 無信息變量消除(UVE)、 間隔偏最小二乘(iPLS)等。

        iPLS算法是將NIR模型建立在全光譜區(qū)域中最優(yōu)的一個(gè)區(qū)間上, 但在全光譜區(qū)域, 有效的波長區(qū)間不止分布在一個(gè)區(qū)間, 因此聯(lián)合區(qū)間(si)的思想被提出[7], 通過選取幾個(gè)(通常是2, 3, 4)區(qū)間聯(lián)合建立NIR模型。 在實(shí)際過程中, 過程參數(shù)與光譜數(shù)據(jù)之間常常具有一定的非線性, 因此, 為了提高模型精度, 須在波長選擇時(shí)考慮非線性因素。

        作為一種新的機(jī)器學(xué)習(xí)方法, 高斯過程(GP)模型可以處理復(fù)雜的非線性問題, 且泛化能力強(qiáng)[8-10]。 與ANN和LS-SVM相比, GP模型作為一種非參數(shù)概率模型, 在給出模型預(yù)測(cè)值的同時(shí), 還可以給出預(yù)測(cè)值對(duì)模型的精度函數(shù); GP模型的優(yōu)化參數(shù)相對(duì)較少, 學(xué)習(xí)速度快, 而且更易收斂。 近幾年, 國內(nèi)外學(xué)者逐步重視這一研究熱點(diǎn), 并在一些領(lǐng)域得到了成功應(yīng)用[11-12]。

        將GP方法引入近紅外光譜檢測(cè), 提出一種融合GP模型和聯(lián)合區(qū)間策略的波長選擇算法: 聯(lián)合區(qū)間高斯過程(siGP)算法, 為近紅外光譜技術(shù)建立定量分析模型, 在波長選擇階段, 提供了一種處理光譜非線性因素的新思路, 并應(yīng)用到紅曲菌固態(tài)發(fā)酵過程參數(shù)水分含量和pH值的快速檢測(cè)中。

        1 siGP波長篩選原理及方法

        1.1 GP算法描述

        對(duì)于給定光譜數(shù)據(jù)樣本集A={(xi,yi)},i=1,…,n,xi∈Rd,yi∈R,n表示訓(xùn)練樣本數(shù),d表示輸入向量維數(shù)。 對(duì)于一個(gè)新的樣本輸入x, 預(yù)測(cè)分布的均值和方差如式(1)所示

        (1)

        (2)

        其中,c(x)=[c(x,x1),…,c(x,xn)]T是訓(xùn)練樣本和測(cè)試樣本之間的協(xié)方差向量,C是訓(xùn)練樣本之間的協(xié)方差矩陣,c(x,x)是測(cè)試樣本自身的方差,y=[y1,y2,…,yn]T。

        GP模型可以選擇不同的協(xié)方差函數(shù), 我們選擇高斯協(xié)方差函數(shù)

        (3)

        其中,ν是控制協(xié)方差的量度,ωd為每個(gè)輸入的測(cè)度權(quán)重。

        (4)

        為了得到最優(yōu)的參數(shù)θ, 首先在合理范圍內(nèi)選擇一個(gè)隨機(jī)值, 再用共軛梯度法搜索得到一個(gè)最優(yōu)的θ[12]。 確定參數(shù)θ之后, 對(duì)于測(cè)試樣本x, 用式(1)和式(2)來估計(jì)均值和方差, 高斯過程的輸出即為估計(jì)的均值。

        1.2 siGP算法

        siGP算法類似于siPLS算法的思想, 篩選波長區(qū)間步驟如下:

        (1)采用間隔策略將全譜數(shù)據(jù)劃分為n個(gè)區(qū)間, 區(qū)間無重復(fù)且間距相等;

        (2)選取n個(gè)區(qū)間中2, 3和4個(gè)子區(qū)間, 排列組合后分別建立GP校正模型, 并求解每個(gè)組合的交叉驗(yàn)證均方根誤差(RMSECV);

        (3)重復(fù)以上步驟, 對(duì)全光譜區(qū)域劃分的不同的n個(gè)區(qū)間進(jìn)行求解;

        (4)尋找最小的RESECV對(duì)應(yīng)的區(qū)間數(shù)及對(duì)應(yīng)的子區(qū)間組合數(shù);

        (5)輸出最優(yōu)波長變量數(shù)據(jù)。

        此處, RMSECV的計(jì)算公式如下

        (5)

        2 實(shí)驗(yàn)部分

        2.1 樣本制備

        實(shí)驗(yàn)室制備單個(gè)樣本的過程為: 首先, 培養(yǎng)基的斜面孢子用接種鏟刮取, 放入20 mL無菌生理鹽水中, 獲得孢子懸浮液, 取500 mL三角瓶, 里面盛有100 mL種子培養(yǎng)基, 將孢子懸浮液接種到其中, 在32 ℃, 150 r·min-1恒溫振蕩培養(yǎng)36~48 h后, 得到種子液。 在250 mL三角瓶中裝入固態(tài)發(fā)酵培養(yǎng)基, 滅菌后, 用三角瓶盛放5 mL的種子液, 在培養(yǎng)箱中培養(yǎng)108 h。

        實(shí)驗(yàn)樣本分5個(gè)批次進(jìn)行制備, 前4個(gè)批次共制備148個(gè)樣本, 構(gòu)成建模所需的校正集和預(yù)測(cè)集, 第5批次制備10個(gè)樣本, 作為獨(dú)立批次驗(yàn)證模型的準(zhǔn)確性。

        2.2 光譜采集

        實(shí)驗(yàn)室選用Thermo Antaris MX傅里葉-近紅外快速分析儀, 采集范圍10 000~4 000 cm-1, 分辨率為8.0 cm-1, 掃描次數(shù)為16次。 采集光譜時(shí), 將樣本壓實(shí), 光纖探頭緊貼樣本表面, 通過TQ軟件完成光譜采集。 圖1為前4個(gè)批次148個(gè)樣本的原始光譜圖。 表1為這148個(gè)樣本水分含量和pH值的分布情況。

        圖1 原始光譜圖

        ComponentNo ofsamplesMaxMinMeanStandDeviationMoi Con1480 68020 37110 52810 0479pH1488 085 777 09570 7888

        3 結(jié)果與討論

        3.1 樣本集的選擇與光譜預(yù)處理

        建模樣本集為實(shí)驗(yàn)最終獲得的148個(gè)樣本。 選用基于變量間歐氏距離的K-Stone(K-S)方法劃分校正集和驗(yàn)證集, 該方法在特征空間中均勻選取樣本, 很好的解決了人為選取的盲目性。 最終選取了校正集樣本100個(gè), 驗(yàn)證集樣本48個(gè)。

        由圖1可知, 在4 000 cm-1附近, 存在很大的無規(guī)律儀器噪聲, 因此, 選取波長4 219~10 000 cm-1間1 500個(gè)光譜數(shù)據(jù)作為建模所需數(shù)據(jù)點(diǎn)。 對(duì)選中的光譜數(shù)據(jù)分別運(yùn)用標(biāo)準(zhǔn)正態(tài)變量變換、 多元散射校正、 一階導(dǎo)數(shù)、 二階導(dǎo)數(shù)以及其組合進(jìn)行預(yù)處理, 比較發(fā)現(xiàn), 不做預(yù)處理的光譜數(shù)據(jù), 得到的效果最好。 出現(xiàn)這種情況的原因可能為: 對(duì)數(shù)據(jù)進(jìn)行預(yù)處理的同時(shí), 伴隨著有效信息的丟失, 以及高斯過程建模可以很好的減少噪聲的影響。

        3.2 siGP波長選擇

        對(duì)光譜數(shù)據(jù)進(jìn)行適當(dāng)?shù)牟ㄩL選擇, 可以降低模型復(fù)雜度, 獲得預(yù)測(cè)精度高的模型。 分別將1 500個(gè)波長點(diǎn)劃分為6~20個(gè)波長區(qū)間, 子區(qū)間組合數(shù)為2, 3, 4, 圖2和圖3為RMSECV得到的關(guān)系圖。

        圖2 水分含量siGP選擇不同區(qū)間組合的RMSECV

        圖3 pH值siGP選擇不同區(qū)間組合的RMSECV

        由圖2和圖3可知, 對(duì)于水分含量, 當(dāng)RESECV獲得最小值0.013 6時(shí), siGP算法選擇了將光譜劃分為20個(gè)區(qū)間并按[5, 10, 20]區(qū)間組合的波長區(qū)間。 對(duì)于pH值, 當(dāng)RESECV獲得最小值0.161 2時(shí), siGP算法選擇了將光譜劃分為16個(gè)子區(qū)間并按[1, 5, 8, 16]區(qū)間組合的波長區(qū)間。 表2為選擇區(qū)間組合對(duì)應(yīng)的波段區(qū)間。

        表2 siGP選擇的波長區(qū)間(cm-1)

        由表2中可得出: 對(duì)于水分含量, siGP算法選取的波段區(qū)間6 824.2~7 109.4 cm-1在水分子對(duì)稱伸縮振動(dòng)組合頻吸收峰6 900 cm-1附近, 5 379.4~5 664.5 cm-1波段區(qū)間包含5 620 cm-1附近一個(gè)比較弱的組合頻吸收; 固態(tài)培養(yǎng)基中有機(jī)氮被菌體消耗后產(chǎn)生的氨類物質(zhì)會(huì)導(dǎo)致pH的變化, siGP算法選取的4 223.5~4 581.8 cm-1包含氨類物質(zhì)N—H鍵4 525 cm-1處的強(qiáng)吸收峰, 6 731.8~7 090.1 cm-1包含6 803 cm-1附近的一級(jí)倍頻吸收峰。

        3.3 模型建立與分析

        對(duì)校正集樣本中的水分含量、 pH值, 分別用siGP算法優(yōu)選的波長變量建立GP模型, 并對(duì)預(yù)測(cè)集樣本進(jìn)行預(yù)測(cè), 預(yù)測(cè)結(jié)果如圖4和圖5。 評(píng)價(jià)指標(biāo)為均方根誤差和相關(guān)系數(shù)[13]。 從圖中可以看出, 兩個(gè)模型的擬合度和預(yù)測(cè)精度均較好, 相關(guān)系數(shù)達(dá)到0.95以上, 預(yù)測(cè)精度可以滿足在紅曲菌發(fā)酵過程中的條件。 表3和表4給出了與傳統(tǒng)方法偏最小二乘建模的對(duì)比分析。

        圖4 NIR預(yù)測(cè)值與參考值(水分)對(duì)比

        圖5 NIR預(yù)測(cè)值與參考值(pH)對(duì)比

        從表3和表4的結(jié)果可以得出: siGP方法選取波段所建的GP模型取得了最好的預(yù)測(cè)效果。 在對(duì)水分含量和pH值建模過程中, 波長點(diǎn)數(shù)分別從1 500個(gè)數(shù)據(jù)點(diǎn)減少到225和375個(gè)數(shù)據(jù)點(diǎn)。 對(duì)比傳統(tǒng)線性波長選擇方法及建模方法, 從RMSEP上看, 水分含量的預(yù)測(cè)精度分別比全譜PLS模型、 siPLS選取波段的PLS模型和全譜GP模型提高了23.5%, 29.4%和13.0%, pH值的預(yù)測(cè)精度分別比全譜PLS模型、 siPLS選取波段的PLS模型和全譜GP模型提高了22.7%, 34.8%和5.2%, 表明siGP算法選取波段所建的GP模型, 減少了光譜數(shù)據(jù)非線性的影響。

        表3 siGP方法和傳統(tǒng)方法得到的水分結(jié)果對(duì)比

        表4 siGP和傳統(tǒng)方法得到的pH結(jié)果對(duì)比

        3.4 獨(dú)立樣本預(yù)測(cè)

        采用獨(dú)立的第5批次樣本, 進(jìn)一步驗(yàn)證所建模型準(zhǔn)確性和適用性。 取第5批次10個(gè)樣本, 分別測(cè)定這10個(gè)樣本的水分含量和pH值以及光譜數(shù)據(jù), 采取siGP算法選擇波長后, 用已建成的GP模型對(duì)水分含量和pH值進(jìn)行預(yù)測(cè), 獲得的發(fā)酵時(shí)間曲線如圖6和圖7。

        由圖6和圖7可知, 近紅外光譜法和常規(guī)理化方法取得了較為一致的結(jié)果, 采用高斯過程所建模型的適用性和預(yù)測(cè)精度都較好, 可用于快速檢測(cè)紅曲菌固態(tài)發(fā)酵過程參數(shù)水分含量及pH值。

        4 結(jié) 論

        以紅曲菌固態(tài)發(fā)酵過程中水分含量和pH值的快速檢測(cè)為例, 提出了一種近紅外光譜非線性波長選擇算法, 即聯(lián)合區(qū)間高斯過程(siGP)算法, 減少了非線性的影響, 并表現(xiàn)出比傳統(tǒng)siPLS波長選擇算法更好的性能。 研究結(jié)果表明, siGP結(jié)合GP模型在紅曲菌固態(tài)發(fā)酵過程參數(shù)建模上, 提高了模型的預(yù)測(cè)精度, 降低了模型的復(fù)雜度。 近紅外光譜技術(shù)結(jié)合高斯過程方法可以實(shí)現(xiàn)過程參數(shù)的快速檢測(cè), 對(duì)實(shí)現(xiàn)過程參數(shù)在線檢測(cè)具有參考價(jià)值。

        圖6 水分含量發(fā)酵時(shí)間曲線

        圖7 pH值發(fā)酵時(shí)間曲線

        [1] Zou Xiaobo, Zhao Jiewen, Povey M J W, et al. Analytica Chimica Acta, 2010, 667(1): 14.

        [2] Agelet L, Hurburgh C. Jr. Critical Reviews in Analytical Chemistry, 2010, 40(4): 246.

        [3] Balabin R, Smirnov S. Analytica Chemica Acta, 2011, 692(1): 63.

        [4] Chen M L, Khare S, Huang B, et al. Industrial & Engineering Chemistry Research, 2013, 52(23): 7886.

        [5] Blanco M, Coello J, Iturriaga H, et al. Chemometrics and Intelligent Laboratory Systems, 2000, 50(1): 75.

        [6] Chauchard F, Cogdill R, Roussel S, et al. Chemometrics and Intelligent Laboratory Systems, 2004, 71(2): 141.

        [7] Chen Q S, Zhao J W, Liu M H, et al. Journal of Pharmaceutical and Biomedical Analysis, 2008, 46(3): 568.

        [8] Chen T, Morris J, Martin E. Chemometrics and Intelligent Laboratory Systems, 2007, 87(1): 59.

        [9] Rasmussen C E, Williams C K I. Massachusetts Institute of Technology: The MIT Press, 2006.

        [10] HE Zhi-kun, LIU Guang-bin, ZHAO Xi-jing, et al(何志昆, 劉光斌, 趙曦晶, 等). Control and Decision(控制與決策), 2013, 28(8): 1121.

        [11] Chen T, Wang B. Neurocomputing, 2010, 73(13): 2718.

        [12] LEI Yu, YANG Hui-zhong(雷 瑜, 楊慧中). CIESC Journal(化工學(xué)報(bào)), 2013, 64(12): 4434.

        [13] Peng Jiangtao, Jiang An, Peng Silong. Analytica Chemica Acta, 2010, 667(1): 14.

        *Corresponding author

        Near Infrared Spectroscopy Wavelength Selection Method and the Application Based on Synergy Interval Gaussian Process

        XU Chen, YIN Yan-yan, LIU Fei*

        Key Laboratory of Advanced Process Control for Light Industry (Ministry of Education), Institute of Automation, Jiangnan University, Wuxi 214122, China

        Based on Gaussian Process (GP), a wavelength selection algorithm named Synergy Interval Gaussian Process (siGP) model is proposed in this paper by using near infrared spectroscopy technology. Full spectrum is divided into a series of unique and equal spacing intervals, before selecting optimal several intervals to establish GP model. Due to the GP model with nonlinear processing ability, the method reduces the disadvantages of nonlinear factor. Taking the near infrared spectrum data of moisture content and pH in solid-state fermentation of monascus as performance verification object of this new algorithm, the prediction correlation coefficient (Rp) of moisture content and pH are 0.956 4 and 0.977 3, respectively. The root mean square errors for prediction set (RMSEP) are 0.012 7 and 0.161 0, respectively. Data points participating in modeling decrease respectively from the original 1 500 to 225 and 375. In the prediction for independent samples, it shows good accuracy. Comparing with traditional synergy interval partial least squares (siPLS) algorithm, the results show that the siGP achieves the best prediction result. The prediction correlation coefficient of moisture content and pH in new algorithm has increased respectively by 3.37% and 3.51% under the model of Gaussian Process, with increases of 29.4% and 34.8% in the root mean square errors for prediction set. This study shows that the combination of siGP and GP model can select wavelength effectively and improves the prediction accuracy of the NIR model. This method is reference for realizing the online detection and optimization control.

        NIR; GP model; siGP; Monascus; Moisture content; pH

        Mar. 7, 2015; accepted Jul. 25, 2015)

        2015-03-07,

        2015-07-25

        國家自然科學(xué)基金項(xiàng)目(NSFC 61273087), 江蘇省產(chǎn)學(xué)研前瞻性聯(lián)合研究項(xiàng)目(BY2013015-27)資助

        徐 琛, 1990年生, 江南大學(xué)自動(dòng)化研究所博士研究生 e-mail: wxjnxc@163.com *通訊聯(lián)系人 e-mail: fliu@jiangnan.edu.cn

        O657.33

        A

        10.3964/j.issn.1000-0593(2016)08-2437-05

        猜你喜歡
        高斯波長區(qū)間
        小高斯的大發(fā)現(xiàn)
        解兩類含參數(shù)的復(fù)合不等式有解與恒成立問題
        HPLC-PDA雙波長法同時(shí)測(cè)定四季草片中沒食子酸和槲皮苷的含量
        你學(xué)會(huì)“區(qū)間測(cè)速”了嗎
        天才數(shù)學(xué)家——高斯
        雙波長激光治療慢性牙周炎的療效觀察
        日本研發(fā)出可完全覆蓋可見光波長的LED光源
        中國照明(2016年4期)2016-05-17 06:16:15
        區(qū)間對(duì)象族的可鎮(zhèn)定性分析
        便攜式多用途光波波長測(cè)量儀
        有限域上高斯正規(guī)基的一個(gè)注記
        1000部夫妻午夜免费| 中文字幕日本av网站| 丁香婷婷激情视频在线播放| 青青草视频在线你懂的| 国产一区二区三区特区| 在线视频国产91自拍| 伊在人天堂亚洲香蕉精品区| av无码免费永久在线观看| 91精选视频在线观看| 日韩美女av二区三区四区| 亚洲熟女少妇一区二区三区青久久 | 免费毛片a线观看| 伊人精品在线观看| 亚洲一区二区三区乱码在线| 娇小女人被黑人插免费视频| 人妻少妇出轨中文字幕| 66lu国产在线观看| 亚洲午夜无码久久久久软件| 亚洲一区二区三区精品视频| av综合网男人的天堂| 国产精品6| av资源在线永久免费观看| 国产免费三级av在线| 夜夜高潮夜夜爽夜夜爱爱| 久久青青草原国产精品最新片| 精品极品视频在线观看| 先锋五月婷婷丁香草草| 亚洲成aⅴ人在线观看| 亚洲一区区| 国产久色在线拍揄自揄拍| 先锋中文字幕在线资源| 2021久久最新国产精品| 国产精品不卡无码AV在线播放 | 亚洲av无码成人精品区天堂| 亚洲欧美国产日产综合不卡| 青青草免费高清视频在线观看| 国产精品久久av色婷婷网站| 青青草国产精品一区二区| 国产喷水在线观看| 亚洲嫩模一区二区三区视频| 精品亚洲一区二区三区四区五|