亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        江西烤煙淀粉近紅外檢測(cè)模型的建立

        2019-05-10 03:56:24張雄峰張啟明何寬信
        廣東農(nóng)業(yè)科學(xué) 2019年3期
        關(guān)鍵詞:模型

        李 卓,張 棋,張雄峰,張啟明,何寬信

        (1.江西省煙草科學(xué)研究所,江西 南昌 330000;2.瀘州市環(huán)境監(jiān)測(cè)中心站,四川 瀘州 646000)

        【研究意義】 近紅外光譜輻射區(qū)域介于可見(jiàn)光和中紅外光之間(4 000~12 500 cm-1),輕型原子間的化學(xué)鍵(如C-H,O-H 和N-H)會(huì)發(fā)生振動(dòng)而產(chǎn)生復(fù)雜重疊的倍頻和合頻譜帶[1-2]。近紅外光譜譜帶重疊嚴(yán)重,很難將透射峰直接與特定結(jié)構(gòu)的官能團(tuán)相對(duì)應(yīng)。近年來(lái),隨著數(shù)據(jù)處理技術(shù)的豐富,加上近紅外光譜技術(shù)本身具有快速、高效、無(wú)損等特點(diǎn),被廣泛用于農(nóng)產(chǎn)品中營(yíng)養(yǎng)物質(zhì)及功能性組分的測(cè)定及定量預(yù)報(bào)[3-7]。近紅外輻射比中紅外具有更強(qiáng)的穿透能力,能深入樣品內(nèi)數(shù)毫米,意味著近紅外光譜能反映樣品內(nèi)部的某些信息[8],為快速無(wú)損檢測(cè)創(chuàng)造了條件。但近紅外數(shù)據(jù)量較大且無(wú)明顯規(guī)律,通常需要結(jié)合化學(xué)計(jì)量學(xué)方法對(duì)數(shù)據(jù)中的信息進(jìn)行提取和利用[9]。淀粉是由D-葡萄糖通過(guò)苷鍵結(jié)合而成的多糖,存在于植物細(xì)胞內(nèi),尤其是種子、塊莖和塊根等[10]。淀粉也是煙葉中的重要組成部分,煙葉進(jìn)入成熟期后,淀粉會(huì)轉(zhuǎn)化為還原糖和有機(jī)酸,淀粉含量也是衡量煙葉品質(zhì)的重要指標(biāo)之一,通常認(rèn)為,淀粉含量越高,煙葉的成熟度越低[11]。目前,煙草行業(yè)主要采用碘顯色法(YC/T 216-2013)對(duì)煙葉中淀粉含量進(jìn)行檢測(cè),基本原理是:煙葉樣品用80%乙醇-飽和氯化鈉溶液除雜質(zhì),再用40%高氯酸提取淀粉,酸性條件下淀粉水解生成糊精,糊精與碘發(fā)生顯色反應(yīng)并于570 nm處比色測(cè)定[12]。傳統(tǒng)的碘顯色法需要復(fù)雜耗時(shí)的前處理和實(shí)驗(yàn)準(zhǔn)備:一方面,整個(gè)淀粉浸提過(guò)程相對(duì)耗時(shí)費(fèi)力;另一方面,由于不同的淀粉(直鏈:支鏈)遇碘顯色不完全相同(呈藍(lán)色或呈紫色)[13],因此在配制標(biāo)準(zhǔn)溶液時(shí)必須按照行業(yè)標(biāo)準(zhǔn)規(guī)定的淀粉標(biāo)液中直鏈:支鏈1∶4的比例配制標(biāo)準(zhǔn)溶液,并且由于含有4%的高氯酸,隨時(shí)間的推移淀粉會(huì)逐漸水解[14],因此標(biāo)液不宜保留過(guò)久?!厩叭搜芯窟M(jìn)展】 近紅外檢測(cè)手段操作簡(jiǎn)單、檢測(cè)快速,幾乎不消耗試劑、樣品、標(biāo)準(zhǔn)品,降低了檢測(cè)成本。利用煙葉的近紅外數(shù)據(jù)可建立煙葉產(chǎn)地和等級(jí)的定性識(shí)別模型,也可建立煙葉中某些化學(xué)組分的定量預(yù)報(bào)模型。煙草行業(yè)內(nèi)對(duì)于近紅外檢測(cè)手段的使用也在逐漸增多[15],上海煙草集團(tuán)、鄭州煙草研究院、云南中煙等單位都建立了各自的近紅外檢測(cè)模型[16-18],然而很多具體的建模細(xì)節(jié)和方法理論闡述不夠充分,基于江西烤煙的近紅外檢測(cè)模型也尚未有報(bào)道?!颈狙芯壳腥朦c(diǎn)】 本研究以淀粉為例,首次將近紅外預(yù)報(bào)模型建模方法應(yīng)用于江西煙草,收集煙葉樣品的近紅外光譜數(shù)據(jù)和對(duì)應(yīng)化學(xué)分析數(shù)據(jù),對(duì)近紅外光譜數(shù)據(jù)進(jìn)行預(yù)處理,消除環(huán)境背景和儀器狀態(tài)導(dǎo)致的噪音和隨機(jī)誤差,再對(duì)高維度的近紅外光譜數(shù)據(jù)進(jìn)行降維并選擇合適的變量,最后建立校正曲線,并驗(yàn)證模型的準(zhǔn)確性和穩(wěn)定性?!緮M解決的關(guān)鍵問(wèn)題】 旨在通過(guò)近紅外光譜技術(shù)和化學(xué)計(jì)量學(xué)方法建立用于江西烤煙的淀粉近紅外檢測(cè)模型,同時(shí)將建模步驟具體化,并充分闡述方法的理論支撐。本研究對(duì)于江西煙葉的質(zhì)量控制和其他煙草模型的建立具有重大指導(dǎo)和借鑒意義。

        1 材料與方法

        1.1 試驗(yàn)材料

        選擇江西2014年和2015年的上(B2F)、中部(C3F)煙葉烤煙樣品共650個(gè),其中2014年上部煙161個(gè)、中部煙161個(gè),2015年上部煙164個(gè)、中部煙164個(gè)(表1)。

        儀器:配備積分球漫反射采樣系統(tǒng)的近紅外光譜儀(AntarisⅡ型,賽默飛,美國(guó));連續(xù)流動(dòng)分析儀(San++,SKALAR,荷蘭)

        1.2 樣品制備

        先用軟毛刷將煙葉上的細(xì)土和砂粒刷去,抽去主脈,將煙葉用切絲機(jī)切絲,再放入烘箱中,在不高于40 ℃的烘箱中烘干,直至煙絲可用手指捻碎,取出烘好的煙絲,馬上研磨,持續(xù)研磨時(shí)間不應(yīng)超過(guò)2 min,然后用0.42 mm網(wǎng)過(guò)篩,得到粒徑均勻的煙粉樣品[19]。

        1.3 光譜數(shù)據(jù)的采集

        取10 g煙葉粉末,均勻填裝進(jìn)內(nèi)徑5 cm樣品杯,用銅塊壓實(shí),然后在FT-NIR分析儀上進(jìn)行漫反射光譜采集。光譜采集時(shí)樣品杯相對(duì)光源入射孔作偏心旋轉(zhuǎn),掃描次數(shù)64次,分辨率8 cm-1,掃描范圍3 800~12 000 cm-1,步長(zhǎng)為3.86 cm-1。以積分球鍍金內(nèi)壁作為背景,每個(gè)樣品掃描前均掃描背景,掃描次數(shù)同樣為64次,實(shí)驗(yàn)溫度控制在25.0(±1.0)℃。

        1.4 化學(xué)分析數(shù)據(jù)的收集

        淀粉含量的化學(xué)分析數(shù)據(jù)由連續(xù)流動(dòng)分析儀根據(jù)行業(yè)標(biāo)準(zhǔn)YC/T 216-2013檢測(cè)得到[12]。

        1.5 化學(xué)計(jì)量學(xué)方法

        1.5.1 標(biāo)準(zhǔn)正則化 標(biāo)準(zhǔn)正則化(Standard NormalVariate,SNV)常用于消除斜率的影響[20],首先計(jì)算一條光譜的平均吸光度值,用不同波數(shù)點(diǎn)處的吸光度值與平均吸光度值的差值除以它們的相對(duì)標(biāo)準(zhǔn)偏差得到不同波數(shù)點(diǎn)處新的吸光度值,繼而得到新的光譜。

        表1 烤煙樣品的產(chǎn)地信息Table 1 Origin information of flue-cured tobacco samples

        式中,Xi為第i樣品光譜的平均值,k=1,2…m,m為波長(zhǎng)點(diǎn)數(shù);i =1,2 …,n,n為樣品數(shù)。

        1.5.2 多元散射校正 多元散射校正(Multiplicative Scatter Correction,MSC)常用于減少散射效應(yīng)對(duì)數(shù)據(jù)響應(yīng)的影響[21],首先計(jì)算所有樣品近紅外光譜的平均光譜,然后將平均光譜作為標(biāo)準(zhǔn)光譜,每個(gè)樣品的近紅外光譜與標(biāo)準(zhǔn)光譜進(jìn)行一元線性回歸運(yùn)算,求得各光譜相對(duì)于標(biāo)準(zhǔn)光譜的線性平移量(回歸常數(shù))和傾斜偏移量(回歸系數(shù)),在每個(gè)樣品原始光譜中減去線性平移量同時(shí)除以回歸系數(shù)修正光譜的基線相對(duì)傾斜,這樣各光譜的基線平移和偏移都可得到修正。

        1.5.3 Savitzky-Golay(SG)平滑和 Norris Derivative(ND)平滑 SG平滑又稱移動(dòng)窗口平滑,是一種在時(shí)域內(nèi)基于局域多項(xiàng)式最小二乘法擬合的濾波方法,利用中心點(diǎn)及其前、后各w個(gè)點(diǎn)進(jìn)行最小二乘擬合,新點(diǎn)其實(shí)是這個(gè)窗口內(nèi)各點(diǎn)的線性組合,由不同權(quán)值的2w+1個(gè)點(diǎn)進(jìn)行加權(quán)而得。這種平滑方法最大的特點(diǎn)在于在濾除噪聲的同時(shí)可以確保信號(hào)的形狀和寬度不變。ND平滑又稱直接差分法,是一種最簡(jiǎn)單的離散波譜求導(dǎo)方法,常常用于原始光譜求導(dǎo)前消除光譜變換帶來(lái)的噪音[22]。

        1.5.4 朗伯比爾定律和多元線性回歸 朗伯比爾定律(Lambert-Beer’s law,LBL)是光吸收的基本定律,是一元線性回歸,當(dāng)光程和光波長(zhǎng)確定時(shí),吸光度只與物質(zhì)的濃度成正比。多元線性回歸(Multiple Linear Regression,MLR)是一元線性回歸在處理兩個(gè)或者兩個(gè)以上變量時(shí)的擴(kuò)展,實(shí)際應(yīng)用中往往存在多個(gè)重要因素的影響,因此在建模中的使用價(jià)值大于一元線性回歸[23]。

        1.5.5 經(jīng)典最小二乘回歸 經(jīng)典最小二乘回歸(Classical Least-Squares Regression,CLSR)是通過(guò)最小化誤差的平方和尋找數(shù)據(jù)的最佳函數(shù)匹配[24]。利用最小二乘法可以簡(jiǎn)便地求得未知的數(shù)據(jù),并使得這些求得的數(shù)據(jù)與實(shí)際數(shù)據(jù)之間誤差的平方和為最小,由此得到回歸直線,該方法外標(biāo)法分析檢測(cè)中最常用的回歸方式。

        1.5.6 逐步多元線性回歸 逐步多元線性回歸(Stepwise Multiple Linear Regression,SMLR)是將變量逐個(gè)引入模型,進(jìn)行F檢驗(yàn),并對(duì)已經(jīng)選入的解釋變量逐個(gè)進(jìn)行t檢驗(yàn),當(dāng)原來(lái)引入的解釋變量由于后面解釋變量的引入變得不再顯著時(shí),可將其刪除,保證回歸方程中只包含顯著性變量。直到既沒(méi)有顯著的解釋變量選入回歸方程也沒(méi)有不顯著的解釋變量從回歸方程中剔除為止[25]。

        1.5.7 主成分回歸 主成分回歸(Principal Component Regression,PCR)通過(guò)奇異值分解將原始的圖譜數(shù)據(jù)矩陣分解成得分矩陣、載荷矩陣和殘差矩陣,即將原數(shù)據(jù)的特征變量進(jìn)行線性組合,轉(zhuǎn)化成一組稱作為主成分(PCs)的正交變量,是響應(yīng)和獨(dú)立變量之間最小方差的超平面。主成分回歸能對(duì)原始變量進(jìn)行降維,并最大限度的保留原始數(shù)據(jù)信息,并能解決共線性問(wèn)題和變量數(shù)限制問(wèn)題,可以用于復(fù)雜體系的回歸[26-27]。

        1.5.8 偏最小二乘回歸 偏最小二乘法回歸(Partial Least-Squares Regression,PLSR)是集主成分分析和多元線性回歸優(yōu)點(diǎn)的一種回歸方法。它與主成分分析法都試圖提取出反映數(shù)據(jù)變異的最大信息,主成分分析法只考慮一個(gè)自變量數(shù)據(jù)矩陣X,而偏最小二乘法還考慮響應(yīng)數(shù)據(jù)矩陣Y,因矩陣X和Y都會(huì)投影到新空間,因此預(yù)測(cè)結(jié)果往往優(yōu)于主成分回歸[28-29]。

        2 結(jié)果與分析

        2.1 選擇不同數(shù)據(jù)前處理方法的模型效果

        在進(jìn)行粉末樣品的近紅外漫反射光譜采集時(shí),由于樣品的均勻性和尺寸顆粒不同,光程也不一樣,因此需要對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理以消除光程的影響,常用的方法有SNV和MSC。圖1A和1B分別是煙葉樣品的近紅外原始光譜和SNV光譜,可以看到經(jīng)SNV處理后,光譜偏移得到了很大改善。另外導(dǎo)數(shù)處理也可以一定程度消除基線偏移還可以分離重疊信息。圖1C和圖1D分別是樣品的一階和二階導(dǎo)數(shù)光譜,可以看出,相比原始光譜,基線差異明顯減小且重疊信息得到了分離。但高階導(dǎo)數(shù)處理在放大信息的同時(shí)也會(huì)放大噪聲,因此在導(dǎo)數(shù)處理之前通常還要對(duì)數(shù)據(jù)進(jìn)行濾波(平滑)處理。濾波的作用是減小噪聲,提高信噪比,我們選擇了SG和ND兩種濾波方式。如表2所示,在進(jìn)行了不同的光程類型方式、平滑方法和導(dǎo)數(shù)階數(shù)的組合建模后,我們發(fā)現(xiàn)選擇MSC+ND(5,5)+一階導(dǎo)數(shù)的組合建立的模型具有最小的均方根誤差和最大的相關(guān)系數(shù)。

        2.2 選擇不同波數(shù)區(qū)間的模型效果

        樣品的近紅外光譜掃描范圍為3 800~12 000 cm-1,步長(zhǎng)為3.86 cm-1,有多達(dá)2 127個(gè)數(shù)據(jù)點(diǎn),其中既包含與目標(biāo)檢測(cè)物相關(guān)的有效信息,也包含很多影響擬合結(jié)果的無(wú)用信息,選擇波數(shù)區(qū)間太寬,雖然能夠保留較多的樣品信息,但同時(shí)也會(huì)引入大量的噪音和冗余信息,反而會(huì)使模型的預(yù)測(cè)效果變差,選擇波數(shù)區(qū)間太窄又會(huì)造成信息的丟失和不全,不能完全提取樣品代表性的特征信息,因此需要對(duì)原始光譜數(shù)據(jù)進(jìn)行取舍。波數(shù)區(qū)間的選擇對(duì)模型至關(guān)重要,是建模過(guò)程中最難以確定的環(huán)節(jié),它完全取決于建模樣品的實(shí)際模型效果,需要反復(fù)嘗試不同波段;除了要考慮模型的匹配程度,還要考慮模型的兼容性,因此在進(jìn)行波數(shù)選擇時(shí),盡可能要選擇波數(shù)區(qū)間段,而不是離散的波數(shù)點(diǎn),并且要避免選擇干擾較大的區(qū)間。圖2B標(biāo)出了C-H,O-H 和N-H等官能團(tuán)的振動(dòng)倍頻和合頻譜帶,參考這些譜帶波段,我們選擇了10種波數(shù)區(qū)間或區(qū)間組合用來(lái)建立模型。如表3所示,當(dāng)波數(shù)區(qū)間選為4 000~4 500 cm-1和5 800~6 400 cm-1的組合時(shí),模型具有最小的均方根誤差和最大的相關(guān)系數(shù)。根誤差和最大的相關(guān)系數(shù)。LBL、MLR、SMLR、CLSR的誤差較大,RMSEC均在2以上,且相關(guān)系數(shù)很差,可能有以下原因:首先LBL要求吸光物質(zhì)為均勻非散射體系,吸光質(zhì)點(diǎn)之間無(wú)相互作用,因此對(duì)于復(fù)雜體系使用價(jià)值有限;MLR雖然可以容納更多的變量數(shù),但仍不適用于非散射體系;SMLR雖然可以對(duì)變量進(jìn)行篩選,但是也會(huì)出現(xiàn)共線性的問(wèn)題;CLSR常用于構(gòu)建標(biāo)準(zhǔn)曲線,但是也會(huì)受共線性的問(wèn)題的影響。PCR的回歸效果也不及PLSR,這可能是:雖然PCR通過(guò)數(shù)據(jù)降維產(chǎn)生新變量(主成分)解決了共線性問(wèn)題和變量數(shù)限制問(wèn)題,但是參與回歸的主成分不一定一定與樣品性質(zhì)有關(guān),因此預(yù)報(bào)能力有限,而PLSR特征向量與樣品性質(zhì)直接相關(guān),在保證奇異值影響不大的情況下,預(yù)測(cè)能力往往好于主成分回歸,更適用于復(fù)雜體系的回歸。

        圖1 所有樣品的近紅外原始光譜(A)、標(biāo)準(zhǔn)正態(tài)化光譜(B)、一階導(dǎo)數(shù)光譜(C)、二階導(dǎo)數(shù)光譜(D)Fig.1 NIR(A), SNV(B), first derivative (C)and second derivative(D) spectra of all samples

        表2 不同數(shù)據(jù)前處理方法組合參數(shù)的模型效果Table 2 Model effects of combination parameters of different data pretreatment methods

        表3 不同波數(shù)區(qū)間的模型效果Table 3 Model effects of different wavenumber intervals

        表4 不同回歸方式的模型效果Table 4 Model effects of different regression types

        2.4 主成分?jǐn)?shù)的選擇

        PLSR需要在評(píng)估均方根誤差的基礎(chǔ)上選擇主成分?jǐn)?shù),以盡可能少的主成分來(lái)反映原樣本空間最大的信息。圖2是均方根誤差隨主成分?jǐn)?shù)變化的曲線圖,在主成分?jǐn)?shù)為9時(shí),均方根誤差達(dá)最小,累計(jì)貢獻(xiàn)率達(dá)到99.1%。

        圖2 選擇主成分?jǐn)?shù)的碎石圖Fig.2 The gravel map for selecting principal components

        3 討論

        比較了不同的光譜數(shù)據(jù)預(yù)處理方法、波數(shù)區(qū)間、回歸方式、主成分?jǐn)?shù)后,確定了最佳的建模參數(shù),如表5所示。圖3A是模型的回歸直線,橫坐標(biāo)為化學(xué)檢測(cè)值、縱坐標(biāo)為模型預(yù)報(bào)值,所有樣品均集中在擬合直線附近,沒(méi)有明顯的離群值,模型相關(guān)系數(shù)達(dá)到0.9652,校正均方根誤差為0.407,預(yù)測(cè)均方根誤差為0.490。圖3B是模型預(yù)測(cè)值和化學(xué)檢測(cè)值的相對(duì)偏差分布,均在15%以內(nèi),將樣品的相對(duì)偏差以0為中點(diǎn),每隔2%分別進(jìn)行統(tǒng)計(jì),如圖3B所示,樣品的偏差分布接近高斯曲線,一定程度上反映了模型的穩(wěn)定性。

        表5 江西烤煙近紅外淀粉模型信息Table 5 Information of NIR model for starch content in Jiangxi flue-cured tobacco

        圖3 淀粉模型的PLS回歸圖(A)與相對(duì)偏差散點(diǎn)圖(B)Fig.3 PLS regression plot of the starch NIR model(A), scatter diagram of relative deviation (B)

        為進(jìn)一步驗(yàn)證模型的實(shí)用性,隨機(jī)選擇40個(gè)外部樣品,通過(guò)比較它們的化學(xué)分析值和近紅外模型預(yù)報(bào)值,評(píng)價(jià)模型的預(yù)測(cè)效果,規(guī)定相對(duì)偏差<10%為預(yù)報(bào)結(jié)果通過(guò)。如表6所示,絕大部分樣品的預(yù)測(cè)結(jié)果良好,相對(duì)偏差較小,只有兩個(gè)樣品的預(yù)測(cè)相對(duì)偏差超過(guò)10%,預(yù)報(bào)通過(guò)率達(dá)到95%,表現(xiàn)了模型良好的預(yù)測(cè)效果。

        表6 外部樣品的模型驗(yàn)證結(jié)果Table 6 The model verification results of external samples

        (續(xù)表6)

        4 結(jié)論

        本文利用化學(xué)計(jì)量學(xué)方法對(duì)江西省煙葉樣品的光譜數(shù)據(jù)進(jìn)行處理并確定了定量模型的相關(guān)參數(shù),最終建立了用于江西烤煙淀粉含量的近紅外定量分析模型,該模型的相關(guān)系數(shù)達(dá)到0.9652,校正均方根誤差為0.407,預(yù)測(cè)均方根誤差為0.490,外部樣品驗(yàn)證通過(guò)率達(dá)到95%以上,預(yù)測(cè)效果良好。該方法相比于傳統(tǒng)的連續(xù)流動(dòng)分析法具有操作簡(jiǎn)單、檢測(cè)快速、成本低廉的優(yōu)勢(shì),可以較為準(zhǔn)確地檢測(cè)江西省煙葉中的淀粉含量,具有很強(qiáng)的實(shí)用價(jià)值。

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機(jī)模型
        提煉模型 突破難點(diǎn)
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達(dá)及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        亚洲欧美中文字幕5发布| 性感人妻中文字幕在线| 久久精品国产亚洲av蜜臀久久| 蜜桃视频网站在线观看一区| 亚洲乱亚洲乱妇50p| 97精品伊人久久大香线蕉app| 亚洲AV日韩Av无码久久| 日本高清一区二区不卡| 天天躁日日躁狠狠躁欧美老妇小说| 深夜福利小视频在线观看| 久久精品国产亚洲Av无码偷窍| 成人性生交c片免费看| 日本av在线一区二区| 国产精品你懂的在线播放 | 久久精品国产91久久性色tv| 亚洲中文字幕高清乱码毛片| 精品久久亚洲中文字幕| 成年无码av片在线| 青春草国产视频| 日本久久黄色高清视频| 久久人人爽人人爽人人片av高请| 国产成人无码区免费内射一片色欲| 久久久久久99精品| 中文字幕有码久久高清| 无码一区二区三区中文字幕| 精品熟女少妇av免费观看| 极品人妻少妇一区二区| 男女主共患难日久生情的古言| 黑人巨大精品欧美一区二区| 欧美日韩国产在线观看免费| 国产精品视频白浆免费看| 中文字幕有码无码人妻av蜜桃| 欧美熟妇精品一区二区三区| 亚洲AⅤ乱码一区二区三区| 国产丝袜长腿美臀在线观看| 免费视频爱爱太爽了| 欧美在线播放一区二区| 亚洲天堂av中文字幕| 亚洲va韩国va欧美va| 一个人看的www免费视频中文| 在线观看免费人成视频国产|