吳繼忠,王新宇,藍(lán)黃博恩,譚浩東,殷思佳,陳曉宏,歐陽琴
(1.江蘇大學(xué)食品與生物工程學(xué)院,江蘇鎮(zhèn)江 212013;2.鎮(zhèn)江市金山翠芽茶業(yè)責(zé)任有限公司,江蘇鎮(zhèn)江 212111)
干燥是各類茶產(chǎn)品加工的一道重要工序,不僅是水分散失和穩(wěn)固外形的過程,更是內(nèi)含成分發(fā)生微妙變化的過程,對茶葉的色澤、香氣和滋味的形成尤為重要。傳統(tǒng)茶葉干燥過程采用輝鍋干燥,干燥過程品質(zhì)的控制依賴工人師傅感官經(jīng)驗,然而人工感官評價手段容易受到師傅經(jīng)驗、性別、年齡、環(huán)境等主客觀因素的影響,使茶葉品質(zhì)的穩(wěn)定性得不到保證。近年來,盡管現(xiàn)代化茶葉干燥機(jī)已在很多茶葉加工企業(yè)推廣應(yīng)用,茶葉加工機(jī)械化得到了全面推廣,但茶葉加工過程的智能化和數(shù)字化監(jiān)控并沒有實施。研究茶葉加工過程品質(zhì)的智能化監(jiān)控方法,開發(fā)茶葉加工的智能化和數(shù)字化裝備,對于提高機(jī)械制茶品質(zhì)的穩(wěn)定性具有重要意義。
水分是衡量茶葉干燥過程最重要的品質(zhì)因子。近紅外光譜主要是有機(jī)物含氫基團(tuán)(C-H,O-H,N-H)等的倍頻和合頻吸收,具有快速、無損、準(zhǔn)確等優(yōu)勢[1],近年來,該技術(shù)在食品水分檢測中受到了越來越多的關(guān)注。Pan Talens等人[2]利用近紅外高光譜圖像技術(shù)的光譜信息預(yù)測火腿的水分含量。Lu Ying-guo等人[3]利用近紅外光譜技術(shù)預(yù)測方便面的水分量。Eva Achata等人[4]利用近紅外高光譜圖像技術(shù)的光譜信息預(yù)測咖啡、薄餅、大豆的濕度和水分含量。朱逢樂等人[5]利用近紅外高光譜圖像技術(shù)的光譜信息預(yù)測三文魚的水分含量。王婉嬌等人[6]利用可見-近紅外高光譜成像技術(shù)的光譜信息預(yù)測冷鮮羊肉的水分含量。
在茶葉品質(zhì)檢測方面,王勝鵬等人[7]利用近紅外光譜技術(shù)評價茶鮮葉的水分含量;Deng Shuiguang等人[8]利用近紅外光譜技術(shù)檢測茶葉的水分含量。然而,近紅外光譜技術(shù)在茶葉加工過程品質(zhì)的水分含量檢測還比較少見。研究嘗試近紅外光譜技術(shù)檢測茶葉干燥過程的水分含量,對茶葉干燥過程品質(zhì)的智能化和數(shù)字化監(jiān)測,以及茶葉智能化加工裝備的開發(fā)具有重要意義。
采集鎮(zhèn)江金山翠芽茶業(yè)有限責(zé)任公司綠茶(烏牛草品種)加工干燥過程的樣本為研究對象,取干燥過程不同時間節(jié)點的樣本共90個。每個樣本取20 g,使用精度為0.1 g的電子天平稱質(zhì)量,樣本密封保存。
研究構(gòu)建了便攜式的近紅外光譜系統(tǒng)用于樣本的光譜采集,該系統(tǒng)主要包括以下幾個部分:①近紅外光譜儀(NIRQUEST512,海洋光學(xué));②Y型光纖 (QR400-7-VIS-NIR,海洋光學(xué));③光源(HL-2000,海洋光學(xué));④計算機(jī),采用漫反射方式采集光譜,光譜范圍900~1 700 nm,參數(shù)設(shè)定為積分時間500 ms,平均次數(shù)3次,平滑度5。光譜采集軟件為Spectra Suite軟件。每個樣本采集3次光譜,以3次光譜的平均值為樣本的原始光譜,并采用標(biāo)準(zhǔn)正態(tài)變量變換(SNV)預(yù)處理光譜,用于后續(xù)模型分析。
茶葉干燥過程樣本原始光譜圖(a)和經(jīng)SNV預(yù)處理后的光譜圖(b) 見圖1。
參考GB 5009.3—2016的直接干燥法對茶葉樣本進(jìn)行含水率測量。其測量步驟如下:將含蓋稱量瓶置于烘箱內(nèi),在105℃條件下保持1 h后取出,于干燥皿內(nèi)自然冷卻至室溫,將烘干后的稱量瓶放在精度為0.000 1 g的天平上稱質(zhì)量,記為Ma,清零,再將茶葉樣品放入稱量瓶中稱質(zhì)量,得出樣品濕質(zhì)量(M0)。
圖1 茶葉干燥過程樣本原始光譜圖(a)和經(jīng)SNV預(yù)處理后的光譜圖(b)
研究比較應(yīng)用全光譜偏最小二乘模型(PLS)、競爭性自適應(yīng)加權(quán)抽樣偏最小二乘模型(CARSPLS)、遺傳偏最小二乘模型(GA-PLS) 建立模型,采用交互驗證優(yōu)化模型建立和優(yōu)化模型。采用交互驗證方法得到最佳主成分?jǐn)?shù),當(dāng)交互驗證均方根誤差(RMSECV)最小時,對應(yīng)的主成分?jǐn)?shù)即為最優(yōu)。同時通過校正集的相關(guān)系數(shù)(Rc)、校正均方根誤差(RMSEC),預(yù)測集的相關(guān)系數(shù)(Rp)和預(yù)測均方根誤差(RMSEP) 評價所建模型的性能。RMSEC和RMSEP,Rc和Rp之間差異越小,最佳主成分?jǐn)?shù)越小,模型性能越好。
建立模型時,將樣本隨機(jī)劃分為校正集和預(yù)測集樣本。校正集樣本用于建立茶葉干燥過程水分含量的近紅外光譜預(yù)測模型,預(yù)測集用于評價模型的準(zhǔn)確性和可靠性。
校正集和預(yù)測集中樣本水分含量值分布見表1。
將茶葉樣品放入烘箱內(nèi),120℃時計時,1 h后取出,移入干燥皿內(nèi),冷卻至室溫。然后取出茶葉樣品連同稱量瓶稱質(zhì)量,記為M2。
茶葉含水率公式如下:
表1 校正集和預(yù)測集中樣本水分含量值分布
PLS是一種應(yīng)用廣泛的模型建立方法。該方法是利用茶葉干燥過程的全光譜近紅外數(shù)據(jù)進(jìn)行建模,所用到的光譜數(shù)據(jù)一共為512個。
PLS模型中校正集RMSECV與主成分?jǐn)?shù)變化關(guān)系(a),校正集和預(yù)測集樣本的預(yù)測值與實測值之間的散點圖(b) 見圖2。
圖2 PLS模型中校正集RMSECV與主成分?jǐn)?shù)變化關(guān)系(a)校正集和預(yù)測集樣本的預(yù)測值與實測值之間的散點圖(b)
由圖2(a)可看出,當(dāng)主成分?jǐn)?shù)為8時,RMSECV最低,此時建模效果最好。圖2(b) 顯示了當(dāng)主成分為8時,PLS模型中校正集和預(yù)測集樣本的預(yù)測值與實測值之間的散點圖,校正集Rc=0.978 7,RMSEC=0.846;預(yù)測集Rp=0.970 3,RMSEP=1.02。
GA-PLS的特點是可以進(jìn)行全局快速搜索,結(jié)合GA算法和PLS算法,建立的模型更加穩(wěn)定,預(yù)測效果更好。該方法的主要步驟是確定控制參數(shù)(群體大小、交叉變異概率)、編碼、確定適應(yīng)度函數(shù)、產(chǎn)生初始群體、選擇算子、交叉運算、變異、收斂。
采用GA優(yōu)選變量時,初始群體大小、交叉概率、變異概率和遺傳迭代次數(shù)分別設(shè)定為50,0.5,0.01,100。圖3(a) 為GA變量篩選的頻次圖,頻次在8以上的變量被選中,共58個變量。
GA篩選變量的頻次見圖3(a),GA-PLS模型中校正集和預(yù)測集樣本的預(yù)測值與實測值之間的散點圖見圖3(b)。
圖3 GA篩選變量的頻次圖(a)GA-PLS模型中校正集和預(yù)測集樣本的預(yù)測值與實測值之間的散點圖(b)
圖3(b) 為GA-PLS模型中茶葉干燥過程最佳校正集和預(yù)測集的含水率預(yù)測值與實測值的散點圖,結(jié)果顯示,當(dāng)主成分?jǐn)?shù)為8時,該模型校正集Rc=0.992 7、RMSEC=0.497,預(yù)測集Rp=0.986 8,RMSEP=0.696。結(jié)果顯示,GA-PLS建模結(jié)果優(yōu)于PLS模型,變量數(shù)大大減少,簡化了模型,且模型性能得到提高。
CARS模仿達(dá)爾文進(jìn)化理論中“適者生存”的原則優(yōu)選變量,具體包含如下步驟:①采用蒙特卡羅抽樣法選取校正集中80%~90%的樣本建模;②建立PLS模型,得到每個變量對應(yīng)的回歸系數(shù),并計算其權(quán)重;③根據(jù)指數(shù)遞減函數(shù)(Exponentially Decreasing function,EDF) 和自適應(yīng)加權(quán)采樣ARS(Adaptive reweighted sampling,ARS) 兩步篩選變量;④用每次產(chǎn)生的新變量子集建立PLS回歸模型,最后選出RMSECV最低的子集,即為最優(yōu)變量子集[9]。
運行CARS-PLS時,隨機(jī)選取校正集80%的樣本(48個樣本)用于構(gòu)建模型,蒙特卡羅采樣次數(shù)為50,采用5倍交互驗證優(yōu)化模型,依據(jù)最低RMSECV值確定最佳變量和模型。
CARS篩選變量的過程見圖4(a),CARS-PLS模型中校正集和預(yù)測集樣本的預(yù)測值與實測值之間的散點圖見圖4(b)。
圖4 CARS篩選變量的過程圖(a)CARS-PLS模型中校正集和預(yù)測集樣本的預(yù)測值與實測值之間的散點圖(b)
圖4(a) 顯示了RMSECV與采樣次數(shù)的關(guān)系,當(dāng)采樣次數(shù)為35時,RMSECV值最低,之后逐漸增加,說明運行35次以上時,CARS開始剔除與水分含量相關(guān)的特征變量。圖4(b) 為被選中的變量數(shù)與采樣次數(shù)的關(guān)系,從中可見,被選中的變量數(shù)隨采樣次數(shù)的增加而逐漸下降,且下降趨勢由快到慢,體現(xiàn)了變量粗選和精選2個過程。從圖4(b)可知,當(dāng)采樣次數(shù)為35次時,獲得最小的RMSECV值,此時,篩選的變量數(shù)為11個,圖中以“*”代表RMSECV值最小的位置及篩選變量數(shù)。以CARS-PLS篩選的11個變量建立茶葉干燥過程水分含量的近紅外光譜預(yù)測模型,其主成分?jǐn)?shù)為7,校正集Rc和RMSEC分別為0.991 3,0.543,預(yù)測集Rp和RMSEP分別為0.990 7,0.574。
近紅外光譜結(jié)合不同模型預(yù)測茶葉干燥過程水分含量的結(jié)果見表2。
表2 近紅外光譜結(jié)合不同模型預(yù)測茶葉干燥過程水分含量的結(jié)果
表2顯示了PLS,GA-PLS和CARS-PLS 3種方法建立的茶葉干燥過程水分含量的近紅外光譜分析結(jié)果。從表中可以得出,CARS-PLS模型結(jié)果最佳,該模型的變量數(shù)最少,模型最簡單,其校正集和預(yù)測集均具有較高的模型預(yù)測精度,且RMSEC和RMSEP,Rc和Rp之間差異最小,表明模型更加穩(wěn)健。因此,CARS-PLS模型效果最好,說明通過篩選變量提高預(yù)測準(zhǔn)確度是有效的。
研究采用近紅外光譜技術(shù)對茶葉干燥過程的水分含量進(jìn)行評價分析,比較應(yīng)用PLS,GA-PLS和CARS-PLS建立茶葉干燥過程水分含量的近紅外光譜分析模型。結(jié)果表明,CARS-PLS模型的預(yù)測效果最佳,變量數(shù)為11,主成分?jǐn)?shù)為7校正集的Rc=0.991 3,RMSEC=0.543,預(yù)測集的Rp=0.990 7,RMSEP=0.574。研究結(jié)果表明,采用近紅外光譜技術(shù)結(jié)合合適的化學(xué)計量學(xué)方法評價茶葉干燥過程的水分含量具有可行性,為茶葉干燥過程品質(zhì)的數(shù)字化、智能化監(jiān)控提供方法。