亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于k-means聚類挑選特征樣品建立煙草近紅外光譜模型

        2016-12-12 10:21:42招云芳王獻(xiàn)友黃文勇米津銳尚關(guān)蘭李克強(qiáng)秦家文李瑞東孫
        關(guān)鍵詞:中國(guó)煙草校正煙草

        招云芳王獻(xiàn)友黃文勇米津銳尚關(guān)蘭李克強(qiáng)秦家文李瑞東孫 莉

        (1.云南煙葉復(fù)烤有限責(zé)任公司技術(shù)中心,云南 昆明 650031;2.美國(guó)賽默飛世爾科技(中國(guó))有限公司,北京 100007)

        基于k-means聚類挑選特征樣品建立煙草近紅外光譜模型

        招云芳1王獻(xiàn)友1黃文勇1米津銳2尚關(guān)蘭1李克強(qiáng)1秦家文1李瑞東1孫莉1

        (1.云南煙葉復(fù)烤有限責(zé)任公司技術(shù)中心,云南 昆明 650031;2.美國(guó)賽默飛世爾科技(中國(guó))有限公司,北京 100007)

        為突破建立近紅外光譜模型需要大量實(shí)驗(yàn)數(shù)據(jù)這一瓶頸,實(shí)現(xiàn)快速建立煙草近紅外光譜預(yù)測(cè)數(shù)學(xué)模型,本研究利用k-means聚類分析算法挑選出具有代表性的特征樣品光譜,采用偏最小二乘(PLS)回歸法建立了煙草6項(xiàng)常規(guī)化學(xué)指標(biāo)的近紅外光譜模型,并對(duì)模型進(jìn)行了優(yōu)化及外部驗(yàn)證。結(jié)果表明:煙草6項(xiàng)常規(guī)化學(xué)指標(biāo)預(yù)測(cè)模型的相關(guān)系數(shù)(R)較大,在0.9356以上,交叉驗(yàn)證均方差(RMSECV)在0.867以內(nèi),外部驗(yàn)證均方差(RMSEP)小于1.71,預(yù)測(cè)值和標(biāo)準(zhǔn)值沒有顯著差異。同時(shí),預(yù)測(cè)結(jié)果還與用大量樣品建立的模型的預(yù)測(cè)結(jié)果進(jìn)行了t檢驗(yàn)方式的比較,其結(jié)果無顯著性差異,說明用挑選特征樣品建立的模型和使用大量樣品建立的模型分析效果一致,可用于批量煙草樣品常規(guī)化學(xué)指標(biāo)的快速檢測(cè)。

        k-means聚類分析;近紅外光譜預(yù)測(cè)數(shù)學(xué)模型;化學(xué)指標(biāo);優(yōu)化驗(yàn)證

        目前,近紅外光譜法已被廣泛應(yīng)用于煙草成分的定量測(cè)定。但目前近紅外光譜建模的研究都是依靠大量的樣品光譜及對(duì)應(yīng)的樣品化學(xué)分析數(shù)據(jù),這給建模工作帶來了巨大的壓力,即要耗費(fèi)大量的人力和物力,更要為之付出大量的時(shí)間,使得建模周期比較長(zhǎng)。為突破建立近紅外光譜模型需要大量實(shí)驗(yàn)數(shù)據(jù)這一瓶頸,本文采用k-means聚類分析算法對(duì)采集的光譜進(jìn)行聚類分析,挑選出特征光譜進(jìn)行化學(xué)分析檢測(cè)后,應(yīng)用多元校正技術(shù)中的偏最小二乘法,建立了測(cè)定復(fù)烤行業(yè)常規(guī)化學(xué)指標(biāo):水溶性總糖、還原糖、煙堿、總氮、氯、鉀的校正模型,并對(duì)影響建模效果的光譜數(shù)據(jù)預(yù)處理方法、異常值等進(jìn)行了討論。此外,校正模型分別采用交叉驗(yàn)證和外部驗(yàn)證進(jìn)行預(yù)測(cè)評(píng)價(jià),預(yù)測(cè)效果良好。

        1.儀器與材料

        AntarisⅡ傅里葉變換NIR光譜儀(美國(guó)Thermo Nicolet公司,配有積分球漫反射采樣系統(tǒng)、Result操作軟件、TQ Analyst分析軟件);625烘箱(德國(guó)FREAS公司);AA3連續(xù)流動(dòng)分析儀(德國(guó)SEAL公司)。青州標(biāo)樣對(duì)照品(中國(guó)煙草總公司青州煙草研究所),蒸餾水,其余試劑為分析純。

        2.方法

        2.1樣品的制備

        以2014烤季云南煙葉復(fù)烤公司所屬10個(gè)復(fù)烤廠(石林廠、瀘西廠、麒麟廠、大理廠、楚雄廠、文山廠、保山廠、師宗廠、宣威廠、陸良廠)的烤煙為示范性研究對(duì)象。樣品來自云南省不同地區(qū)、不同品種、不同等級(jí)、不同部位的烤煙,樣品共計(jì)1534個(gè),用粉碎機(jī)粉碎,過40目篩,樣品裝入密封袋中,在低溫(0~4℃)條件下密封避光保存。

        2.26項(xiàng)化學(xué)指標(biāo)標(biāo)準(zhǔn)值的測(cè)定

        分別采用行業(yè)標(biāo)準(zhǔn)《煙草及煙草制品 鉀的測(cè)定 連續(xù)流動(dòng)法》YC/T 217-2007,《煙草及煙草制品 氯的測(cè)定 連續(xù)流動(dòng)法》YC/T 162-2011,《煙草及煙草制品 總氮的測(cè)定 連續(xù)流動(dòng)法》YC/T 161-2002,《煙草及煙草制品 水溶性糖的測(cè)定 連續(xù)流動(dòng)法》YC/T 159-2002,《煙草及煙草制品 總植物堿的測(cè)定 連續(xù)流動(dòng)法》YC/T 160-2002,對(duì)煙草樣品進(jìn)行6項(xiàng)指標(biāo)的檢測(cè)。

        2.3光譜采集

        取預(yù)先制備好的煙草樣品,裝入樣品杯中,利用積分球漫反射采樣系統(tǒng)采集其NIR光譜。光譜采集條件:以儀器內(nèi)置背景為參比,波數(shù)范圍10000~3800cm-1,掃描次數(shù)為64次,分辨率為8cm-1,見表1。

        2.4k-means聚類分析原理

        k-means聚類算法是一種以距離為相似性依據(jù)的聚類方法,本研究在對(duì)近紅外光譜的主成因子進(jìn)行歐氏距離計(jì)算,距離公式如式(1)所示。

        其中:d為距離,P為主成分,下標(biāo)a,b代表樣品編號(hào),下標(biāo)i代表第i維主成分因子。

        之后對(duì)距離進(jìn)行聚類,該聚類算法流程如圖1所示。

        本研究取煙草的近紅外光譜貢獻(xiàn)率超過95%的前6維主成分因子,代入k-means矩陣算法中進(jìn)行聚類計(jì)算。聚類后從每類中選取一個(gè)樣品光譜作為代表性樣品參與建模。

        本實(shí)驗(yàn)共采集樣品光譜1534條,使用k-means聚類選取的特征樣品光譜415條。

        3.1定量校正模型中檢測(cè)指標(biāo)的統(tǒng)計(jì)描述

        表2為復(fù)烤行業(yè)主要化學(xué)指標(biāo)常規(guī)方法檢測(cè)的標(biāo)準(zhǔn)值的統(tǒng)計(jì)描述。建立模型時(shí)全部樣品都用作校正集。由表2可知,校正集樣品化學(xué)指標(biāo)的含量范圍較寬,且含量分布均勻。

        3.2光譜數(shù)據(jù)的處理

        煙草是一種復(fù)雜的天然產(chǎn)物,其近紅外光譜中譜峰重疊嚴(yán)重,因此建模前通常采用導(dǎo)數(shù)處理來消除光譜基線的平衡、漂移及平緩背景的干擾,但同時(shí)導(dǎo)數(shù)處理也放大了光譜信號(hào),噪聲信號(hào)也被放大,因此在對(duì)原始光譜求導(dǎo)前,首先對(duì)光譜數(shù)據(jù)進(jìn)行平滑處理,然后分別考察原始光譜、一階導(dǎo)數(shù)和二階導(dǎo)數(shù)光譜對(duì)所建校正模型的影響。

        從圖2和圖3對(duì)比可以看出,光譜數(shù)據(jù)經(jīng)過導(dǎo)數(shù)處理后,可消除基線偏移,扣除本底吸收,從而更為細(xì)致地反映樣品的光譜特征。

        經(jīng)過Norris導(dǎo)數(shù)平滑濾波后的光譜數(shù)據(jù)分別經(jīng)多元散射校正技術(shù)(MSC)和標(biāo)準(zhǔn)正態(tài)變量變換技術(shù)(SNV)處理后,又分別考察了原始光譜、一階導(dǎo)數(shù)和二階導(dǎo)數(shù)光譜對(duì)所建校正模型的影響,并采用偏最小二乘(PLS)回歸法建立定量校正模型。考察結(jié)果如圖4所示,圖4為RMSEC/R的比值做的折線圖。由于校正集樣品的校正標(biāo)準(zhǔn)偏差(RMSEC)越小,相關(guān)系數(shù)(R)越大,說明模型優(yōu)化的越好,所以RMSEC/R值越小,模型效果越好。從圖4看出,總糖、煙堿、總氮、鉀的預(yù)測(cè)模型采用SNV處理光譜并對(duì)光譜進(jìn)行二階導(dǎo)數(shù)后建立的模型的RMSEC/R值最?。贿€原糖、氯的預(yù)測(cè)模型采用SNV處理光譜并對(duì)光譜進(jìn)行一階導(dǎo)數(shù)后建立的模型RMSEC/R值最小。

        3.3定量校正模型的建立

        應(yīng)用TQ Analyst分析軟件中的偏最小二乘回歸(Partial least-square regression,PLS)算法,把采集的近紅外漫反射光譜與標(biāo)準(zhǔn)方法測(cè)定的烤煙水溶性總糖、還原糖、煙堿、總氮、氯、鉀的標(biāo)準(zhǔn)值,全部用做校正集來建立定量校正模型。由于PLS主因子數(shù)關(guān)系到模型的穩(wěn)定性,主因子選取太小會(huì)丟失有用信息,包含過多噪音,出現(xiàn)“欠擬合”,太大則會(huì)出現(xiàn)“過擬合”,因此,本研究按留一交叉驗(yàn)證的方法確定最終的偏最小二乘因子數(shù)。采用校正標(biāo)準(zhǔn)偏差(Standard error of calibration,SEC)、外部驗(yàn)證均方差即預(yù)測(cè)標(biāo)準(zhǔn)偏差(Standard error of prediction,RMSEP)、交叉驗(yàn)證均方差(RMSECV)和決定系數(shù)(R2)對(duì)PLS模型的性能進(jìn)行評(píng)價(jià)。RMSEC和RMSEP越小,R越大,表示模型的性能越好。所有參數(shù)的計(jì)算方法見文獻(xiàn)。校正模型初步建立以后,需要對(duì)模型進(jìn)一步優(yōu)化,即用不同的樣品檢驗(yàn)?zāi)P停蕹悠分械漠惓V?,修改建模的譜區(qū)和其他參數(shù),以提高模型的穩(wěn)定性和可靠性。本研究采用最直觀、最簡(jiǎn)單的判別方法對(duì)異常值進(jìn)行剔除,即用外部驗(yàn)證樣品的真實(shí)值和擬合值(Ture/Fit)的散點(diǎn)圖進(jìn)行查看,并結(jié)合馬氏距離和杠桿值等聯(lián)合判斷,采用交叉驗(yàn)證(Cross validation)逐步剔除這些強(qiáng)影響點(diǎn)。

        3.4PLS主因子數(shù)的選擇和交叉驗(yàn)證結(jié)果

        采用PLS法建立定量校正模型時(shí),為避免出現(xiàn)“過擬合”現(xiàn)象,需要對(duì)主因子數(shù)進(jìn)行合理選擇。本研究采用留一交叉驗(yàn)證法,考察了主因子數(shù)對(duì)RMSECV的影響如圖5所示。由圖中可以看出,PLS主因子數(shù)依次為總糖17,還原糖18,煙堿18,總氮19,氯18,鉀21。

        3.5模型的外部驗(yàn)證

        模型自身的外部驗(yàn)證:將建立的定量校正模型用于對(duì)云南煙葉復(fù)烤公司所屬10個(gè)復(fù)烤廠挑選出的不同地區(qū)、不同品種、不同部位、不同等級(jí)的60個(gè)樣品進(jìn)行6項(xiàng)化學(xué)指標(biāo)的預(yù)測(cè)。預(yù)測(cè)值和標(biāo)準(zhǔn)值有較低的預(yù)測(cè)均方差和較高的相關(guān)系數(shù)(表3)。

        與用大量樣品建立的成熟模型的對(duì)比驗(yàn)證:為了進(jìn)一步驗(yàn)證模型的準(zhǔn)確性,本研究還選取一些驗(yàn)證樣品與其他單位用大量樣品建立的成熟的模型進(jìn)行預(yù)測(cè)對(duì)比,預(yù)測(cè)樣品數(shù)為40個(gè),同樣得到了較低的預(yù)測(cè)均方差和較高的相關(guān)系數(shù)(表4)。同時(shí),預(yù)測(cè)結(jié)果使用t檢驗(yàn)方式進(jìn)行檢驗(yàn)。假設(shè)兩種方法建立的預(yù)測(cè)模型檢測(cè)的6項(xiàng)化學(xué)指標(biāo)的均值在風(fēng)險(xiǎn)水平α=0.05時(shí),計(jì)算得到的t值均小于t臨界值,則說明兩種方法建立的預(yù)測(cè)模型的檢測(cè)結(jié)果無顯著差異。由表4看出,6項(xiàng)化學(xué)指標(biāo)的t檢驗(yàn)值均小于臨界值,兩種方法建立的模型檢測(cè)結(jié)果無顯著差異,說明挑選特征樣品建立的模型和使用大量樣品建立的模型分析效果一致。

        結(jié)論

        采用k-means聚類分析選擇特征樣品光譜,用PLS法建立了煙草常規(guī)化學(xué)指標(biāo)的近紅外定量預(yù)測(cè)模型,并用未參與建模的眾多樣品進(jìn)行了外部驗(yàn)證,驗(yàn)證的均方差(RMSEP)分別為總糖1.71,還原糖1.35,煙堿0.18,總氮0.28,氯0.14,鉀0.32。與用原始方法建立的成熟模型相比,驗(yàn)證均方差均在0.9403以上,兩種的檢測(cè)結(jié)果也無顯著差異。由此說明,本研究采用k-means聚類分析挑選特征樣品建立近紅外光譜模型的方法解決了實(shí)際建模過程中需要大量化學(xué)實(shí)驗(yàn)數(shù)據(jù)的這一瓶頸,所建立的煙草近紅外光譜模型可運(yùn)用于煙草化學(xué)6項(xiàng)化學(xué)指標(biāo)的快速檢測(cè)。為了使模型具有更寬的檢測(cè)范圍,本研究還在收集不在模型范圍內(nèi)的檢測(cè)數(shù)據(jù)。從而獲得更完善的模型,指導(dǎo)復(fù)烤行業(yè)生產(chǎn)過程質(zhì)量的在線監(jiān)測(cè),為實(shí)現(xiàn)復(fù)烤行業(yè)均質(zhì)化生產(chǎn)模式提供了理論依據(jù)。

        [1]滑榮,韓建國(guó),齊曉,等.近紅外漫反射光譜法預(yù)測(cè)紫花苜蓿草顆粒營(yíng)養(yǎng)價(jià)值[J]. 光譜學(xué)與光譜分析,2008(12):2826-2829.

        [2]陳昭,吳志生,史新元,等. Bagging 偏最小二乘和 Boosting 偏最小二乘算法的金銀花醇沉過程近紅外光譜定量模型預(yù)測(cè)能力研究[J].化學(xué)分析,2014(11):1679-1686.

        [3]王冬,閔順耕,曹金莉,等.溫度對(duì)煙草總植物堿近紅外定量分析模型的影響[J].中國(guó)煙草科學(xué),2013-08,34(4):103-106.

        [4]王家俊,梁逸曾,汪帆.偏最小二乘法結(jié)合傅里葉變換近紅外光譜同時(shí)測(cè)定卷煙焦油、煙堿和一氧化碳的釋放量[J].化學(xué)分析,2005(6):793-797.

        [5] Balabin R M, Safieva R Z. Biodiesel classification by base stock type (vegetable oil)using near infrared spectroscopy data[J]. Analytica Chimica Acta, 2011,689: 190-197.

        [6]梁俐俐,吳正舉,蘇明亮,等.云貴產(chǎn)區(qū)煙葉近紅外檢測(cè)分模型和總模型的對(duì)比分析[J].中國(guó)煙草科學(xué),2008,29(2):42-46.

        [7]邱軍,王允白,張懷寶,等.近紅外光譜法預(yù)測(cè)煙氣總粒相物中的煙堿含量[J].中國(guó)煙草科學(xué),2006(2):12-13.

        [8] Barbin D F, Kaminishikawahara C M, Soares A L. Prediction of chicken quality attributes by near infrared spectroscopy[J]. Food Chemistry,2015, 168: 554-560.

        [9] Haughey S A, Graham S F, Cancou?t E, et al. The application of Near-Infrared Reflectance Spectroscopy (NIRS) to detect melamine adulteration of soya bean meal[J]. Food Chemistry,2013, 136: 1557-1561.

        [10] 邱軍,張懷寶,宋巖,等.近紅外光譜分析技術(shù)在煙草行業(yè)的應(yīng)用[J].中國(guó)煙草科學(xué),2008,29(1):55-59.

        [11]董小衛(wèi),馬 強(qiáng),厲昌坤,等.近紅外檢測(cè)把煙葉片化學(xué)成分技術(shù)研究[J].中國(guó)煙草科學(xué),2008,29(4):10-14.

        [12] 付秋娟,張懷寶,邱軍,等.近紅外光譜法快速測(cè)定煙草中的總揮發(fā)堿[J].中國(guó)煙草科學(xué),2005,26(4):14.15.

        [13] 王宏鋁,王筑臨,許小雙,等.基于在線煙堿預(yù)測(cè)模型的煙葉復(fù)烤均質(zhì)化加工[J].煙草科技,2015,48(6):73-77.

        [14] 溫亞東,王毅,王能如,等.近紅外光譜的投影分析方法在工業(yè)分級(jí)與復(fù)烤模塊配方中的應(yīng)用[J].中國(guó)煙草學(xué)報(bào),2009,15(5):6-10.

        O657

        A

        中國(guó)煙草總公司云南省公司2015年度科技計(jì)劃項(xiàng)目(基于煙葉外觀與生化表征的均質(zhì)化復(fù)烤控制技術(shù)開發(fā),NO.2015YN33)。

        猜你喜歡
        中國(guó)煙草校正煙草
        《中國(guó)煙草學(xué)報(bào)》入編《中文核心期刊要目總覽》2023年版
        煙草具有輻射性?
        "中國(guó)煙草科教網(wǎng)"平臺(tái)簡(jiǎn)介
        劉光第《南旋記》校正
        基于完全壟斷體制下的中國(guó)煙草企業(yè)倫理管理淺析
        一類具有校正隔離率隨機(jī)SIQS模型的絕滅性與分布
        機(jī)內(nèi)校正
        煙草依賴的診斷標(biāo)準(zhǔn)
        煙草中茄酮的富集和應(yīng)用
        中國(guó)煙草博物館
        日本美女中文字幕第一区| 无码国产伦一区二区三区视频| 天堂影院一区二区三区四区| 天天做天天躁天天躁| 尤物视频一区二区| 成在线人视频免费视频| 激情一区二区三区视频| 日本免费大片一区二区三区 | 亚洲 另类 日韩 制服 无码| 亚洲va欧美va| 亚洲AV无码AV色| 亚洲女同人妻在线播放| 国产亚洲精品熟女国产成人 | 天堂√最新版中文在线天堂| 国产精品成人无码久久久久久| 96中文字幕一区二区| 亚洲av高清一区二区三| 亚洲精品国产电影| 国产精品泄火熟女| 免费观看黄网站| 久久久久久无中无码| 久久国产女同一区二区| 最近免费中文字幕中文高清6| 中文成人无码精品久久久不卡| 四虎精品视频| 在线a人片免费观看高清| 久久久国产精品首页免费| 香蕉成人伊视频在线观看| 99久久er这里只有精品18| 国产欧美精品一区二区三区–老狼| 日韩精品一二区在线视频| 精品国产一区二区三区av天堂| 高h纯肉无码视频在线观看| av片在线观看免费| 久久久99精品成人片中文字幕 | 久久精品人人做人人爱爱| 国产性生大片免费观看性| 四虎永久免费一级毛片| 中文字幕成人乱码亚洲| 亚洲精品人成中文毛片| 国产精品成人国产乱|