夏駿,陸揚(yáng),蘇燕,潘力,林墾,朱書(shū)秀,陸明華
浙江中煙工業(yè)有限責(zé)任公司,浙江 杭州 310024
煙草水溶性糖近紅外定量模型中光譜范圍選擇方法的研究
夏駿,陸揚(yáng),蘇燕,潘力,林墾,朱書(shū)秀,陸明華
浙江中煙工業(yè)有限責(zé)任公司,浙江 杭州 310024
運(yùn)用四種不同的光譜范圍選擇方法來(lái)建立煙草中水溶性糖的近紅外定量模型,發(fā)現(xiàn)模型的交互驗(yàn)證系數(shù)、交互驗(yàn)證均方差和預(yù)測(cè)均方差有明顯的差異。通過(guò)對(duì)煙草中水溶性糖的分子結(jié)構(gòu)分析,結(jié)合傅里葉變換近紅外漫反射光譜的特性,初步確定煙草水溶性糖近紅外定量模型的建模光譜范圍,以交互驗(yàn)證系數(shù)和交互驗(yàn)證均方差為評(píng)價(jià)指標(biāo)進(jìn)一步優(yōu)化光譜范圍,可以得到煙草水溶性糖在近紅外定量模型中的最佳光譜范圍為3850~5010 cm-1、5720~7010 cm-1和7760~7980 cm-1,總糖和還原糖定量模型的交互驗(yàn)證系數(shù)、交互驗(yàn)證均方差和預(yù)測(cè)均方差分別為0.989、0.787、0.565和0.982、0.801、0.693。
近紅外;煙草;定量模型;光譜范圍;水溶性糖;交互驗(yàn)證
煙草中的水溶性糖對(duì)煙葉品質(zhì)具有重要影響[1],是決定煙氣醇和度的主要因素[2]。在煙草工業(yè)中,水溶性糖含量的分析測(cè)定是日常檢測(cè)項(xiàng)目之一,對(duì)卷煙成品質(zhì)量的控制具有重要的意義。由于傳統(tǒng)的化學(xué)檢測(cè)方法比較復(fù)雜,費(fèi)時(shí)長(zhǎng),消耗大, 因此近些年來(lái),簡(jiǎn)單快速的近紅外光譜分析技術(shù)在煙草行業(yè)中的應(yīng)用頗為廣泛[3-5]。但是近紅外光譜分析技術(shù)是利用化學(xué)計(jì)量學(xué)方法從復(fù)雜的光譜數(shù)據(jù)中提取有用的樣品含量信息,所以其分析結(jié)果容易受到多種因素的影響。李軍會(huì)等研究了樣品裝樣、測(cè)試條件等因素對(duì)近紅外檢測(cè)結(jié)果的影響,并實(shí)現(xiàn)了通過(guò)建立全局模型應(yīng)用自校正方法來(lái)降低分析誤差[6]。段焰青等考察了粒度對(duì)煙末總糖、總氮和煙堿含量近紅外預(yù)測(cè)值的影響,結(jié)果表明當(dāng)煙末粒度在40目以上才能保證預(yù)測(cè)數(shù)據(jù)的準(zhǔn)確性和精密性[7]。練文柳等采用基線校正、去卷積、一階微分、二階微分、主成分回歸和偏最小二乘法對(duì)煙葉樣品的近紅外光譜數(shù)據(jù)進(jìn)行處理,建立了相應(yīng)的校正模型,并作比較,發(fā)現(xiàn)運(yùn)用二階微分和偏最小二乘法建立的模型效果最好[8]。馬翔等選擇不同的譜區(qū)范圍對(duì)煙草定量模型進(jìn)行優(yōu)化,結(jié)果顯示不同譜區(qū)范圍對(duì)定量模型的影響明顯[9]。但對(duì)建立近紅外定量模型過(guò)程中如何確定最優(yōu)光譜范圍,目前還未見(jiàn)詳盡的報(bào)道。本文通過(guò)研究水溶性糖的分子結(jié)構(gòu),推斷出水溶性糖中含氫基團(tuán)在近紅外譜區(qū)的合頻與倍頻吸收范圍,并以近紅外模型的交互驗(yàn)證系數(shù)和交互驗(yàn)證均方差為評(píng)價(jià)指標(biāo),確定了煙草水溶性糖在建立近紅外定量模型時(shí)的最優(yōu)光譜范圍。
Antaris 傅里葉變換近紅外光譜儀(Thermo,美國(guó)),配有積分球漫反射采樣系統(tǒng)和樣品杯旋轉(zhuǎn)采樣附件;Futura全自動(dòng)連續(xù)流動(dòng)分析儀(Alliance,法國(guó));Cyclotec 1093旋風(fēng)式樣品磨(Foss Tecator,丹麥);SC101型鼓風(fēng)電熱恒溫干燥箱(浙江嘉興新塍電器廠)。
收集700個(gè)2011~2013年烤煙煙葉樣本,產(chǎn)區(qū)包括云南、四川、山東、江西、湖南、湖北、河南、貴州、廣西、福建、安徽共11個(gè),等級(jí)包括B1F、B2F、B3F、C1F、C2F、C3F、X1F、X2F、X3F 共9個(gè),樣本涵蓋主要產(chǎn)區(qū)和等級(jí)。將所有樣本按照煙草行業(yè)標(biāo)準(zhǔn)《YC/T 31-1996 煙草及煙草制品 試樣的制備和水分測(cè)定 烘箱法》制備成粉末樣本(粒徑≥40目,水分含量5%~7%),其中600個(gè)作為建模樣本集,100個(gè)作為預(yù)測(cè)樣本集。
將煙葉粉末樣本裝入樣品杯,并用壓樣器壓實(shí),然后采集光譜,光譜采集范圍:3800~10000 cm-1,光譜分辨率:8 cm-1,掃描次數(shù):64次,樣品杯方式:旋轉(zhuǎn)。
按照煙草行業(yè)標(biāo)準(zhǔn)《YC/T 159-2002 煙草及煙草制品 水溶性糖的測(cè)定 連續(xù)流動(dòng)法》對(duì)所有樣本的水溶性總糖和還原糖含量進(jìn)行測(cè)定。結(jié)果如表1所示。
表1 連續(xù)流動(dòng)法測(cè)得的煙草中水溶性糖含量Tab. 1 Water-soluble sugar content in tobacco by continuous fl ow method
使用TQ Analyst軟件進(jìn)行水溶性總糖和還原糖近紅外定量模型的建立和優(yōu)化,建模方法選擇偏最小二乘法,光程使用多元散射進(jìn)行校正,光譜數(shù)據(jù)采用二階微分并用諾里斯導(dǎo)數(shù)濾波法進(jìn)行平滑處理。光譜范圍:(a)全光譜范圍:3800-10000 cm-1;(b)TQ Analyst軟件自動(dòng)優(yōu)化選擇光譜范圍:4331.34-4416.19 cm-1、5688.98-5847.11 cm-1和 5958.96-6012.96 cm-1;(c)從文獻(xiàn)引用的光譜范圍:4246.70-7502.10 cm-1[9];(d)通過(guò)分子化學(xué)結(jié)構(gòu)分析確定的光譜范圍。
評(píng)價(jià)近紅外定量模型的優(yōu)劣一般采用內(nèi)部交互驗(yàn)證和外部驗(yàn)證,所謂內(nèi)部交互驗(yàn)證是指從建模樣本集中剔除一個(gè)或多個(gè)樣本,用剩余的樣本建立模型來(lái)預(yù)測(cè)剔除的樣本,重復(fù)該過(guò)程直至所有樣本都被剔除并預(yù)測(cè)過(guò),該驗(yàn)證主要考察模型的穩(wěn)定性和內(nèi)部預(yù)測(cè)能力,避免模型出現(xiàn)過(guò)擬合現(xiàn)象,評(píng)價(jià)指標(biāo)為交互驗(yàn)證系數(shù)(Q2)和交互驗(yàn)證均方差(RMSECV);而外部驗(yàn)證則是用已建立的模型來(lái)預(yù)測(cè)多個(gè)未知樣本,主要考察模型的實(shí)際預(yù)測(cè)能力,是評(píng)價(jià)模型好壞的主要方法,評(píng)價(jià)指標(biāo)為預(yù)測(cè)均方差(RMSEP)。
交互驗(yàn)證系數(shù)、交互驗(yàn)證均方差和預(yù)測(cè)均方差的計(jì)算公式如下:
其中n為模型的樣本數(shù)量,yi為模型中第i個(gè)樣本的參考值,i為模型中第i個(gè)樣本的交互驗(yàn)證預(yù)測(cè)值,為模型中所有樣本參考值的平均值,N為預(yù)測(cè)樣本集的樣本數(shù)量,yNi為預(yù)測(cè)樣本集中第i個(gè)樣本的參考值,
Ni為預(yù)測(cè)樣本集中第i個(gè)樣本的預(yù)測(cè)值。
從以上公式可以看出:交互驗(yàn)證系數(shù)越大,交互驗(yàn)證均方差越小,說(shuō)明模型的穩(wěn)定性越好,其內(nèi)部預(yù)測(cè)能力越強(qiáng);預(yù)測(cè)均方差越小,模型的實(shí)際預(yù)測(cè)效果越好。
煙草中的水溶性糖主要包括單糖(葡萄糖、果糖)、雙糖(蔗糖),其分子結(jié)構(gòu)如下圖所示:
圖1 煙草中水溶性糖的分子結(jié)構(gòu)圖Fig.1 Molecular structure of water-soluble sugar in tobacco
從圖1可以看出,煙草中水溶性糖中所包含的含氫基團(tuán)主要就是C—H和O—H基團(tuán),因此煙草中水溶性糖在近紅外譜區(qū)的吸收主要就是C—H和O—H基團(tuán)基頻振動(dòng)的合頻與倍頻吸收。C—H基團(tuán)伸縮振動(dòng)的基頻吸收帶在中紅外區(qū)的3000 cm-1附近,彎曲振動(dòng)在1450 cm-1左右;O—H基團(tuán)伸縮振動(dòng)的基頻吸收帶約在中紅外區(qū)的3650 cm-1,彎曲振動(dòng)約在1300 cm-1??紤]到實(shí)際的分子振動(dòng)并不完全符合簡(jiǎn)諧振動(dòng),而是屬于非線性諧振,所以倍頻的實(shí)際頻率比基頻乘以倍頻數(shù)的計(jì)算值略小,由此推測(cè)出C—H基團(tuán)和O—H基團(tuán)的倍頻與合頻吸收帶的近似位置,如表2所示。
表2 煙草中水溶性糖中C—H基團(tuán)和O—H基團(tuán)倍頻與合頻吸收帶的近似位置Tab. 2 Approximate absorption band of water-soluble sugar in tobacco
同時(shí)從近紅外漫反射光譜的背景掃描圖中發(fā)現(xiàn)在5100~5560 cm-1和 7010~7440 cm-1處存在較大的背景干擾。
圖2 近紅外漫反射光譜的背景掃描圖Fig. 2 Background spectrum of FT-NIR diffuse re fl ectance spectroscopy
由此初步確定了C—H基團(tuán)和O—H基團(tuán)在近紅外譜區(qū)的吸收范圍:3950~5100 cm-1;5560~7010 cm-1;7440~7950 cm-1;8300~9300 cm-1。
C—H基團(tuán)和O—H基團(tuán)是有機(jī)分子組成的基本結(jié)構(gòu),在水溶性糖以外的其他成分中大量存在。為使最終得到的光譜范圍和煙草中水溶性糖的含量有較大的相關(guān)性,所以需要結(jié)合連續(xù)流動(dòng)法測(cè)得的煙草中水溶性糖含量數(shù)據(jù)來(lái)建立相應(yīng)的近紅外定量模型,并以近紅外模型的交互驗(yàn)證系數(shù)和交互驗(yàn)證均方差為評(píng)價(jià)指標(biāo)對(duì)每一個(gè)光譜區(qū)間的上下限進(jìn)一步優(yōu)化。發(fā)現(xiàn)當(dāng)光譜區(qū)間選擇 3850~5010 cm-1、5720~7010 cm-1和7760~7980 cm-1時(shí),該兩項(xiàng)指標(biāo)達(dá)到最優(yōu)。
用三種不同的光譜范圍選擇方法建立水溶性總糖和還原糖的近紅外定量模型,并對(duì)含100個(gè)樣本的預(yù)測(cè)樣本集進(jìn)行預(yù)測(cè)。按照1.5中提到的四種選擇方法選擇光譜范圍,其預(yù)測(cè)結(jié)果見(jiàn)表3和表4。
表3 不同光譜范圍選擇方法對(duì)水溶性總糖近紅外定量模型的影響Tab. 3 Effect of different spectral range selection methods on total sugar model
表4 不同光譜范圍選擇方法對(duì)水溶性還原糖近紅外定量模型的影響Tab. 4 Effect of different spectral range selection methods on reduced sugar model
從表3和表4的數(shù)據(jù)可以看出,通過(guò)不同的光譜范圍選擇方法來(lái)建立的近紅外定量模型,其交互驗(yàn)證系數(shù)、交互驗(yàn)證均方差和預(yù)測(cè)均方差存在較大的差異,通過(guò)分子化學(xué)結(jié)構(gòu)分析確定光譜范圍后建立模型的內(nèi)部驗(yàn)證指標(biāo)明顯優(yōu)于其他3種方法,其外部驗(yàn)證的實(shí)際預(yù)測(cè)效果也最好。最終得到水溶性總糖、還原糖的化學(xué)測(cè)量值和模型預(yù)測(cè)值的關(guān)系如圖3和圖4所示。
圖3 水溶性總糖的化學(xué)測(cè)量值和模型預(yù)測(cè)值的關(guān)系Fig. 3 Relationship between total sugar standard value and calculated value
圖4 水溶性還原糖的化學(xué)測(cè)量值和模型預(yù)測(cè)值的關(guān)系Fig. 4 Relationship between reduced sugar standard value and calculated value
本文通過(guò)對(duì)煙草中水溶性糖的分子結(jié)構(gòu)分析,結(jié)合傅里葉變換近紅外漫反射光譜的特性,確定了水溶性糖中含氫基團(tuán)在近紅外譜區(qū)倍頻與合頻吸收帶的近似位置,并結(jié)合連續(xù)流動(dòng)法測(cè)得的煙草中水溶性糖含量數(shù)據(jù)進(jìn)一步優(yōu)化,得到最佳的光譜范圍,在此基礎(chǔ)上建立了水溶性總糖和還原糖的近紅外定量模型,取得了較好的結(jié)果,模型的交互驗(yàn)證系數(shù)、交互驗(yàn)證均方差和預(yù)測(cè)均方差都優(yōu)于其他3種光譜范圍選擇方法。該方法可以有效的應(yīng)用于煙草水溶性總糖和還原糖含量的實(shí)際分析。
[1]閆克玉. 煙草化學(xué)[M]. 鄭州:鄭州大學(xué)出版社,2002:51-56.
[2]卷煙工藝(第二版)編寫(xiě)組. 卷煙工藝(第二版)[M].北京:北京出版社,2000:88-93.
[3]鄧亮,冷紅瓊,段沅杏,等. FT-NIR光譜測(cè)定煙草中煙堿、總氮、總糖含量的模型研究[J]. 云南農(nóng)業(yè)大學(xué)學(xué)報(bào),2013,28(6):814-818.
[4]鄧發(fā)達(dá),朱立軍,戴亞,等. 近紅外技術(shù)測(cè)定成品卷煙中總糖和還原糖及綠原酸的含量[J]. 安徽農(nóng)業(yè)科學(xué),2010,38(12):6181-6182,6188.
[5]張建平,謝雯燕,束如欣,等. 煙草化學(xué)成分的近紅外快速定量分析研究[J]. 煙草科技,1999,136(3):37-38.
[6]李軍會(huì),秦西云,張文娟,等. 樣品裝樣、測(cè)試條件等因素對(duì)近紅外檢測(cè)結(jié)果的影響與分析誤差源比較研究[J]. 光譜學(xué)與光譜分析,2007,27(9):1751-1753.
[7]段焰青,周紅,王明鋒,等. 粒度對(duì)煙末總糖、總氮和煙堿含量NIR預(yù)測(cè)值的影響[J]. 煙草科技,2005,(7):22-23.
[8]練文柳,吳名劍,孫賢軍,等. 不同預(yù)處理方法對(duì)煙草近紅外光譜預(yù)測(cè)模型的影響[J]. 煙草科技,2005, (2):19-23.
[9]馬翔,王毅,溫亞?wèn)|,等. FT—NIR光譜儀測(cè)定煙草化學(xué)成分不同譜區(qū)范圍對(duì)數(shù)學(xué)模型影響的研究[J]. 光譜學(xué)與光譜分析,2004,24(4):444-446.
Spectral range selection method in NIR quantitative model of tobacco water-soluble sugar
XIA Jun, LU Yang, SU Yan, PAN Li, LIN Ken, ZHU Shuxiu, LU Minghua
China Tobacco Zhejiang Industrial Co., Ltd, Hangzhou 310024, China
Four different spectral range selection methods were applied in NIR quantitative model of tobacco water-soluble sugar. It was found that correlation coef fi cients of cross validation(R2), root mean square errors of cross validation (RMSECV) and root mean square errors of prediction (RMSEP) were signi fi cantly different. Spectral ranges were preliminarily determined by analyzing molecular structures of tobacco water-soluble sugar and characteristic of FT-NIR diffuse re fl ectance spectroscopy. Two evaluating indicators, R2and RMSECV,were used to further optimize spectral range. It was found that the optimal spectral ranges of tobacco water-soluble sugar was 3850~5010 cm-1, 5720~7010 cm-1and7760~7980 cm-1. The fi nal quantitative models of total sugar and reduced sugar, R2, RMSECV and RMSEP were 0.989, 0.787, 0.565 and 0.982, 0.801, 0.693, respectively.
near-infrared; tobacco; quantitative model; spectral range; water-soluble sugar; cross validation
:XIA Jun, LU Yang, SU Yan, et al. Spectral range selection method in NIR quantitative model of tobacco water-soluble sugar [J].Acta Tabacaria Sinica, 2015,21 (2)
夏駿,陸揚(yáng),蘇燕,等. 煙草水溶性糖近紅外定量模型中光譜范圍選擇方法的研究[J]. 中國(guó)煙草學(xué)報(bào),2015,21(2)
浙江中煙工業(yè)有限責(zé)任公司科技項(xiàng)目“近紅外光譜法在烤煙煙葉化學(xué)成分測(cè)定中的應(yīng)用研究”(ZJZY2013C004)
夏駿(1978—),碩士,工程師,主要從事煙草化學(xué)分析,Tel:0571-81188571,Email:xiajun@zjtobacco.com
陸明華 (1965—),本科,工程師,主要從事煙草化學(xué)分析,Tel:0571-81188293,Email:lumh@zjtobacco.com
2014-06-05