胡 涌, 彭海根, 劉 偉, 曹 君, 夏 凡, 付正義, 劉 洋,魯 平, 肖景元, 姚源黔, 杜鴻武, 黃 沙
(1. 貴州煙葉復(fù)烤有限責(zé)任公司,貴州 貴陽(yáng) 550005; 2. 四川威斯派克科技有限公司,四川 成都 610041)
煙葉水分檢測(cè)貫穿于煙葉初烤、復(fù)烤、卷煙加工以及貯藏等煙草生產(chǎn)加工全部環(huán)節(jié),是一項(xiàng)關(guān)鍵質(zhì)量指標(biāo)。YCT146——2010《煙葉 打葉復(fù)烤 工藝規(guī)范》[1]規(guī)定復(fù)烤成品煙葉制品的含水率為11%~13%,含水率的高低對(duì)后續(xù)煙葉加工、運(yùn)輸和貯存有直接影響。打葉復(fù)烤企業(yè)常規(guī)煙葉水分檢測(cè)方式主要分為實(shí)驗(yàn)室檢測(cè)和在線檢測(cè),其中實(shí)驗(yàn)室檢測(cè)主要使用標(biāo)準(zhǔn)烘箱或布拉本德快速烘箱干燥法,雖然兩種檢測(cè)方法穩(wěn)定性好且精度高,但是檢測(cè)周期都較長(zhǎng),不能滿足煙葉復(fù)烤生產(chǎn)快速檢測(cè)的需求。微波水分儀在煙葉復(fù)烤過(guò)程中可以實(shí)時(shí)檢測(cè)煙葉水分,但方法穩(wěn)定性和準(zhǔn)確性難以滿足煙葉生產(chǎn)需求,主要用于生產(chǎn)過(guò)程中煙葉水分預(yù)判和指導(dǎo)。
近紅外光譜分析技術(shù)作為一種方便、快捷、客觀準(zhǔn)確的檢測(cè)技術(shù)[2],已經(jīng)廣泛應(yīng)用于煙葉中主要成分(如總糖、還原糖、煙堿、總氮等物質(zhì)含量)的檢測(cè)[3-8],且應(yīng)用近紅外檢測(cè)時(shí),1~2 min便可以給出檢測(cè)結(jié)果,非常適合打葉復(fù)烤快速檢測(cè)的要求。應(yīng)用近紅外光譜分析技術(shù)時(shí),主要難點(diǎn)為校正模型的建立、優(yōu)化和后期模型維護(hù)。本文將貴州煙葉復(fù)烤有限責(zé)任公司下屬6個(gè)復(fù)烤廠相關(guān)數(shù)據(jù)進(jìn)行有效整合和提取,建立具有良好穩(wěn)健性和準(zhǔn)確性且滿足煙葉復(fù)烤生產(chǎn)需求的近紅外校正模型,實(shí)現(xiàn)快速、準(zhǔn)確檢測(cè)成品煙葉水分,縮短檢測(cè)時(shí)間,實(shí)現(xiàn)生產(chǎn)過(guò)程中的煙葉復(fù)烤過(guò)程水分檢測(cè)實(shí)時(shí)監(jiān)控,提高產(chǎn)品質(zhì)量,滿足煙葉生產(chǎn)和客戶個(gè)性化需求。
Antaris II傅里葉變換近紅外光譜儀(美國(guó)Thermo Fisher公司);Mettler AT-200電子天平(美國(guó)Mettler-Teledo公司);101-2A型電熱鼓風(fēng)干燥箱(北京中興偉業(yè)儀器公司)。
煙葉樣品由貴州復(fù)烤集團(tuán)下屬6個(gè)復(fù)烤廠按照統(tǒng)一要求進(jìn)行收集并提供,樣品涵蓋各復(fù)烤廠生產(chǎn)周期的全部等級(jí)、產(chǎn)地范圍。使用煙葉粉碎機(jī)進(jìn)行粉碎,要求粒度≤3 mm,隨后放入密封袋備用,共收集樣品2 661個(gè)。
各復(fù)烤廠都擁有相同型號(hào)Antaris II傅里葉變換近紅外光譜儀,且都按照統(tǒng)一要求和儀器參數(shù)掃描樣品光譜。儀器參數(shù)設(shè)置:1)光譜掃描范圍為:10 000 ~4 000 cm–1;2)分辨率:8 cm–1;3)光譜掃描次數(shù):64次;4)光譜采集方式:積分球漫反射采集,參比采用儀器內(nèi)置背景。測(cè)量過(guò)程中,溫度、濕度等環(huán)境條件盡量保持一致。樣品光譜圖如圖1所示。
圖1 樣品近紅外光譜圖
樣品收集,制備并采集光譜之后,各復(fù)烤廠按統(tǒng)一要求測(cè)定樣品水分值,且距光譜采集時(shí)間不超過(guò)48 h。樣品水分按標(biāo)準(zhǔn)烘箱干燥法進(jìn)行測(cè)定,每個(gè)樣品平行測(cè)定兩次,以兩次平行測(cè)定的平均值作為測(cè)定結(jié)果,精確至0.01%,兩次平行測(cè)定結(jié)果絕對(duì)值之差大于0.10%的樣品進(jìn)行剔除并按要求重新測(cè)定,烘箱水分參考值統(tǒng)計(jì)結(jié)果和分布直方圖分別見表1和圖2。
表1 水分參考值統(tǒng)計(jì)結(jié)果
表1和圖2顯示,樣品烘箱水分值分布范圍為9%~13%,但主要集中在11%~12%之間,且樣品水分值呈高斯分布。若這些樣品不加選擇直接參加校正模型的建立,預(yù)測(cè)時(shí)極有可能產(chǎn)生回歸預(yù)測(cè)結(jié)果趨向中心值現(xiàn)象[9],且樣品光譜庫(kù)數(shù)據(jù)過(guò)于龐大,不利于今后模型的更新和維護(hù)。本文采用K-S方法挑選模型驗(yàn)證集和校正集:1)首先剔除異常光譜樣品,針對(duì)全部水分值范圍,應(yīng)用K-S方法挑選模型驗(yàn)證集,數(shù)量為100個(gè);2)針對(duì)11%~12%水分值分布范圍,應(yīng)用K-S方法挑選一定數(shù)量樣品作為校正集;3)其他范圍的樣品全部作為校正集參與建模;4)模型校正集數(shù)量共為900個(gè)。
圖2 樣品頻數(shù)分布直方圖
K-S方法[10]基于變量之間的歐氏距離,在特征空間中均勻選取樣本,把所有的樣本都看作校正集和驗(yàn)證集候選樣本,并從中依次挑選樣本進(jìn)入校正集和驗(yàn)證集,本文中是將光譜作為特征變量。
采用K-S方法挑選后,校正集和驗(yàn)證集的烘箱水分值統(tǒng)計(jì)結(jié)果和分布直方圖分別如表2和圖3所示。
圖3顯示,K-S方法挑選后校正集水分值分布情況得到改善,且實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過(guò)K-S方法挑選后的校正集和驗(yàn)證集同樣覆蓋了貴州復(fù)烤集團(tuán)下屬?gòu)?fù)烤廠實(shí)際生產(chǎn)中復(fù)烤成品煙葉水分分布、產(chǎn)地和等級(jí)分布范圍,即方法不僅能有效改善樣品分布情況,且能保持建模樣品代表性,起到有效壓縮光譜數(shù)據(jù)庫(kù)的作用。
分別結(jié)合K-S方法挑選前后的校正集,建立不同廠家的成品煙葉近紅外水分模型。結(jié)合成品煙葉光譜數(shù)據(jù)的特點(diǎn),應(yīng)用化學(xué)計(jì)量學(xué)方法,采用PLS建模方法,結(jié)合不同光譜預(yù)處理方法,如矢量歸一化、導(dǎo)數(shù)、多元散射校正等,同時(shí)優(yōu)選不同的近紅外譜區(qū)來(lái)建立水分模型,結(jié)合相關(guān)的模型評(píng)價(jià)參數(shù),采用驗(yàn)證集驗(yàn)證方式,建立混合成品煙葉近紅外水分模型。詳細(xì)的建模參數(shù)見表3。
表2 K-S挑選后校正集和驗(yàn)證集水分值統(tǒng)計(jì)結(jié)果
圖3 K-S方法挑選后樣品頻數(shù)分布直方圖
圖4和圖5分別是采用K-S方法挑選前模型校正集和驗(yàn)證集烘箱水分參考值與預(yù)測(cè)值散點(diǎn)圖。
圖6是采用K-S方法挑選樣品前,模型交叉驗(yàn)證過(guò)程中主因子與RMSECV的變化趨勢(shì)圖。
圖7和圖8分別是樣品經(jīng)過(guò)K-S方法挑選后模型校正集和驗(yàn)證集烘箱水分參考值與預(yù)測(cè)值散點(diǎn)圖。
圖9是采用K-S方法挑選建模后,模型交叉驗(yàn)證過(guò)程中主成分?jǐn)?shù)與RMSECV的變化趨勢(shì)圖。
表3 成品煙葉水分模型參數(shù)
圖4 K-S方法挑選前模型校正集參考值與預(yù)測(cè)值散點(diǎn)圖
圖5 K-S方法挑選前模型驗(yàn)證集參考值與預(yù)測(cè)值散點(diǎn)圖
圖6 K-S方法挑選前模型交互驗(yàn)證主因子數(shù)與RMSECV變化趨勢(shì)圖
上述結(jié)果顯示,應(yīng)用K-S方法挑選校正集后建立的混合成品煙葉近紅外水分模型,預(yù)測(cè)偏差RMSEP由原來(lái)的0.36變?yōu)?.34,交叉驗(yàn)證時(shí)R2由原來(lái)的0.73變?yōu)?.84,即模型相關(guān)性得到改善。
通常評(píng)價(jià)一種分析方法的誤差采用重復(fù)性和再現(xiàn)性指標(biāo)。在應(yīng)用近紅外光譜分析技術(shù)檢測(cè)成品煙葉水分時(shí),雖然近紅外分析方法與常規(guī)分析方法不屬于同種方法,在定義上,再現(xiàn)性并不適用這兩種方法之間的比較,但根據(jù)RMSECV和RMSEP與常規(guī)分析方法再現(xiàn)性誤差的比較,可以基本判斷所建立的近紅外光譜分析模型是否可行或滿足實(shí)際工作的需要。在煙葉復(fù)烤中采用標(biāo)準(zhǔn)烘箱法測(cè)定煙葉水分值,方法只規(guī)定2次測(cè)量之間所允許的誤差為0.1%,即重復(fù)性要求,而沒(méi)有規(guī)定方法再現(xiàn)性誤差要求,通常再現(xiàn)性誤差是重復(fù)性誤差的3~6倍[11],表3顯示近紅外方法RMSECV和RMSEP均與常規(guī)方法的再現(xiàn)性相當(dāng),進(jìn)一步說(shuō)明近紅外方法模型預(yù)測(cè)結(jié)果與實(shí)際值一致。
圖7 K-S方法挑選后模型校正集參考值與預(yù)測(cè)值散點(diǎn)圖
圖8 K-S方法挑選后模型驗(yàn)證集參考值與預(yù)測(cè)值散點(diǎn)圖
圖9 K-S方法挑選后模型交互驗(yàn)證主因子數(shù)與RMSECV變化趨勢(shì)圖
為了進(jìn)一步驗(yàn)證模型的準(zhǔn)確度和穩(wěn)定性,分別從貴州復(fù)烤集團(tuán)下屬6個(gè)復(fù)烤廠各隨機(jī)挑選5個(gè)樣品,共30個(gè)樣品,驗(yàn)證得到平均絕對(duì)偏差為0.24%,RMSEP為0.27。
通過(guò)本文的研究得出如下結(jié)論:
1)在應(yīng)用近紅外分析方法建模過(guò)程中,當(dāng)樣品分布比較集中,呈高斯分布時(shí),可以應(yīng)用K-S方法挑選集中樣品,方法能有效改善樣品分布情況,且能保持建模樣品仍然具有代表性,同時(shí)方法還能達(dá)到壓縮建模光譜數(shù)據(jù)庫(kù)的作用。
2)對(duì)比應(yīng)用K-S方法挑選前后的校正集建立統(tǒng)一成品煙葉近紅外水分模型,模型絕對(duì)系數(shù)R2由原來(lái)的0.73變?yōu)?.84,模型相關(guān)性得到改善。應(yīng)用K-S方法挑選后校正集建立的成品煙葉近紅外水分模型RMSECV、RMSEP分別為0.33、0.34,均與常規(guī)方法的再現(xiàn)性相當(dāng),方法準(zhǔn)確度和檢測(cè)效率滿足煙葉復(fù)烤生產(chǎn)需求。
3)針對(duì)煙葉復(fù)烤企業(yè)集團(tuán)化的形式,應(yīng)用近紅外分析技術(shù)時(shí),可以結(jié)合K-S方法進(jìn)行樣品挑選后再建立統(tǒng)一近紅外模型,模型建模數(shù)據(jù)得到有效壓縮,有助于企業(yè)后期近紅外模型管理和維護(hù),具有明顯作用,方法可以推廣到其他集團(tuán)化企業(yè)的近紅外檢測(cè)過(guò)程。
4)模型在實(shí)際應(yīng)用過(guò)程中,預(yù)測(cè)各復(fù)烤廠隨機(jī)挑選的樣品,近紅外模型預(yù)測(cè)值和參考值平均絕對(duì)偏差為0.24%,RMSEP=0.27,總體來(lái)看近紅外模型預(yù)測(cè)和標(biāo)準(zhǔn)烘箱測(cè)量差異較小,即所建立校正模型具有實(shí)用價(jià)值,可以預(yù)測(cè)復(fù)烤煙葉水分值含量。