夏金梅, 孫威江, 林 濤, 游 泳, 曾兆華, 王冰玉
(1.福建省農(nóng)業(yè)科學(xué)院植物保護(hù)研究所農(nóng)藥環(huán)境安全評(píng)價(jià)中心, 福建 福州 350002;2.福建農(nóng)林大學(xué)園藝學(xué)院, 福建 福州 350002)
?
基于近紅外光譜技術(shù)結(jié)合遺傳算法的安溪鐵觀音品質(zhì)評(píng)價(jià)
夏金梅1,2, 孫威江2, 林 濤1, 游 泳1, 曾兆華1, 王冰玉2
(1.福建省農(nóng)業(yè)科學(xué)院植物保護(hù)研究所農(nóng)藥環(huán)境安全評(píng)價(jià)中心, 福建 福州 350002;2.福建農(nóng)林大學(xué)園藝學(xué)院, 福建 福州 350002)
以清香型鐵觀音茶葉為試驗(yàn)原料,基于近紅外光譜技術(shù)結(jié)合遺傳算法,建立相關(guān)的數(shù)學(xué)分析模型,用于安溪鐵觀音綜合品質(zhì)得分的測(cè)定,完善茶葉檢測(cè)體系,進(jìn)一步推動(dòng)我國茶產(chǎn)業(yè)的標(biāo)準(zhǔn)化進(jìn)程。實(shí)驗(yàn)結(jié)果表明,經(jīng)二階導(dǎo)數(shù)+平滑+歸一化方法對(duì)光譜進(jìn)行預(yù)處理后,得到綜合品質(zhì)得分PLS測(cè)定模型最優(yōu),驗(yàn)證集相關(guān)系數(shù)為0.913,均方根偏差為0.665。選用近紅外光譜6 670-4 000 cm-1譜區(qū),經(jīng)遺傳算法篩選特征波長(zhǎng)后,建立茶樣綜合品質(zhì)得分GA-PLS測(cè)定模型,校正集相關(guān)系數(shù)為0.959,均方根偏差為0.413;驗(yàn)證集相關(guān)系數(shù)為0.940,均方根偏差為0.587,GA-PLS模型的預(yù)測(cè)能力和精度更高。
近紅外光譜技術(shù); 遺傳算法; 偏最小二乘法; 安溪鐵觀音; 品質(zhì)評(píng)價(jià)
安溪鐵觀音作為我國的十大名茶之一,以其獨(dú)特的“觀音韻”聞名,隨著鐵觀音消費(fèi)量的提高,人們對(duì)茶葉品質(zhì)的要求也隨之提高。當(dāng)前市場(chǎng)上的安溪鐵觀音外觀多為顆粒狀,消費(fèi)者很難直接從外觀上辨別其品質(zhì)優(yōu)劣。感官審評(píng)和理化分析是目前茶葉品質(zhì)檢測(cè)最主要的兩種方法,但二者在判別安溪鐵觀音品質(zhì)方面都具有不同程度的局限性。傳統(tǒng)的感官審評(píng)方法主要依靠專業(yè)審評(píng)人員的感覺器官對(duì)茶葉的外形(權(quán)重20%)、湯色(權(quán)重5%)、香氣(權(quán)重30%)、滋味(權(quán)重35%)和葉底(權(quán)重10%)5項(xiàng)單因子進(jìn)行審評(píng)得出分?jǐn)?shù),計(jì)算5項(xiàng)因子的加權(quán)總分,以分?jǐn)?shù)的高低來判斷其品質(zhì)優(yōu)劣,雖然簡(jiǎn)便、快捷,但其易受到主觀因素和生理因素的影響,評(píng)審缺乏說服力。理化分析是利用化學(xué)分析方法檢測(cè)茶葉中咖啡堿、茶多酚等理化指標(biāo)來評(píng)判茶葉品質(zhì)的一種方法,得到的結(jié)果雖然較為準(zhǔn)確,但因其操作步驟繁瑣、費(fèi)時(shí)、成本高等缺點(diǎn),難以推廣與運(yùn)用(傅志明,2005)因此,快捷、準(zhǔn)確新型的檢測(cè)方法的開發(fā)研究受到普遍關(guān)注。
20世紀(jì)70年代日本最早運(yùn)用近紅外光譜技術(shù)快速檢測(cè)茶葉組分。中國在20世紀(jì)90年代才開始就近紅外光譜技術(shù)開展相關(guān)研究(許瓊等,2007)。王勝鵬等(2011)驗(yàn)證偏最小二乘法,建立了茶葉在近紅外波段光譜與含水量、全氮量的相關(guān)模型,這為茶葉的品質(zhì)研究提供了一個(gè)新的突破。李艷肖等(2015)利用蟻群算法和遺傳算法進(jìn)行優(yōu)化譜區(qū),建立花茶花青素近紅外光譜預(yù)測(cè)模型,具有較高精度,可有效選擇特征光譜信息。近紅外光譜技術(shù)作為一種具有綠色、無損、快速等優(yōu)勢(shì)的新興技術(shù),被認(rèn)為是有望替代傳統(tǒng)的化學(xué)分析的無損檢測(cè)方法(劉發(fā)龍等,2008)。
因此,本文以安溪鐵觀音為試驗(yàn)原料,嘗試?yán)眠z傳算法選取波段,結(jié)合偏最小二乘法,最后建立綜合品質(zhì)得分模型,并對(duì)其進(jìn)行評(píng)價(jià)與優(yōu)化。研究結(jié)果有助于更好地規(guī)范烏龍茶銷售市場(chǎng),防止出現(xiàn)外觀相似的假冒偽劣產(chǎn)品,并探索出一種能夠快速、準(zhǔn)確地評(píng)判安溪鐵觀音品質(zhì)優(yōu)劣的方法。
1.1 材料
1.1.1 試驗(yàn)材料 選取安溪各地茶農(nóng)或者茶葉生產(chǎn)廠家未包裝的清香型安溪鐵觀音毛茶,根據(jù)收購價(jià)格的高低,將茶樣初步劃分為高中低3個(gè)檔次,共130個(gè)茶樣。其中95個(gè)茶樣作為校正集;35個(gè)茶樣作為驗(yàn)證集。
1.1.2 儀器和軟件 采用Antaris II傅立葉近紅外光譜儀,基于Workflow光譜采集工作流獲取茶樣近紅外光譜信息;使用紅外處理軟件OPUS進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換和近紅外光譜預(yù)處理;利用Matlab R2010a軟件進(jìn)行數(shù)據(jù)分析和數(shù)學(xué)建模(段焰青等,2011)。
1.2 試驗(yàn)方法
1.2.1 感官審評(píng) 根據(jù)《茶葉感官審評(píng)方法》(馮花等,2010),由3位專業(yè)審評(píng)人員在福建省茶葉質(zhì)量監(jiān)督檢驗(yàn)站對(duì)茶葉進(jìn)行了感官審評(píng),得出茶樣品質(zhì)得分,以此作為建模依據(jù)。
1.2.2 樣品前處理 將茶樣放入中藥粉碎機(jī)研磨,粉碎1 min呈粉末狀,過80目篩,取篩下茶粉,稱取10-15 g茶粉進(jìn)行編號(hào)、封裝,作為近紅外光譜采集的樣品。
1.2.3 近紅外光譜數(shù)據(jù)的采集 利用Antaris II傅立葉近紅外光譜儀采集,基于Workflow設(shè)置茶粉光譜采集工作流,設(shè)置參數(shù)為:光譜掃描次數(shù)64 次,分辨率8 cm-1,光譜范圍10 000-4 000 cm-1,光譜數(shù)據(jù)點(diǎn)為1 557個(gè)(鄒小波等,2007),保持室內(nèi)溫濕度穩(wěn)定。
1.2.4 近紅外光譜預(yù)處理 近紅外光譜圖除了攜帶茶樣的自身信息外,還包含了一系列無關(guān)信息和噪聲。因此,在結(jié)合化學(xué)計(jì)量學(xué)方法建立模型時(shí),利用譜圖預(yù)處理方式消除光譜數(shù)據(jù)中無關(guān)信息與噪聲,提取與化學(xué)組成相關(guān)的信息對(duì)提高模型的準(zhǔn)確率十分關(guān)鍵。
本試驗(yàn)采用6種光譜預(yù)處理方式:平滑;平滑+歸一化;一階導(dǎo)數(shù)+平滑;一階導(dǎo)數(shù)+平滑+歸一化;二階導(dǎo)數(shù)+平滑;二階導(dǎo)數(shù)+平滑+歸一(“+”表示光譜預(yù)處理方式結(jié)合),分別形成6組數(shù)據(jù)矩陣,再代入試驗(yàn)?zāi)P椭羞M(jìn)行調(diào)試和篩選。
1.2.5 利用遺傳算法進(jìn)行建模波段的篩選 遺傳算法(GeneticAlgorithm,簡(jiǎn)稱GA)是一種自適應(yīng)的全局的概率搜索算法,通過選擇、交換和突變等遺傳操作,模擬生物界的遺傳機(jī)制和自然選擇,使目標(biāo)函數(shù)值中較好的變量被保留下來,從而使結(jié)果達(dá)到最優(yōu)。在近紅外光譜技術(shù)分析領(lǐng)域,遺傳算法常作用于分析對(duì)象特征波長(zhǎng)的優(yōu)選和組合(劉輝軍等,2008)。
本試驗(yàn)在光譜預(yù)處理后進(jìn)行遺傳算法篩選特征波長(zhǎng)。將光譜總區(qū)間平均分為30個(gè)子區(qū)間進(jìn)行二進(jìn)制隨機(jī)編碼,每個(gè)子區(qū)間包含24個(gè)數(shù)據(jù)點(diǎn),設(shè)置參數(shù):種群大小為50,基因數(shù)為30,變異概率為0.01,交叉概率為0.6,迭代次數(shù)為15代。以預(yù)測(cè)值與真實(shí)值的相關(guān)系數(shù)(Correlation Coefficient,簡(jiǎn)稱R)、預(yù)測(cè)均方根偏差(Root Mean Squared Errorof Prediction,簡(jiǎn)稱RMSEP)作為模型結(jié)果的評(píng)價(jià)指標(biāo)。以F=R/RMSEP最大作為優(yōu)化指標(biāo),重復(fù)遺傳操作至最大繁殖代數(shù)時(shí)停止,F(xiàn)越大代表模型的預(yù)測(cè)能力越強(qiáng),以F最大時(shí)的基因編碼解碼后得到的譜線組合作為最優(yōu)譜線組合(任廣鑫,2012;周明等,1999)。
1.2.6 引入偏最小二乘法建立模型 偏最小二乘法是一種多因變量對(duì)多自變量的回歸建模方法,有機(jī)結(jié)合了模式型和認(rèn)識(shí)型的方法,使以往用普通多元回歸無法解決的問題得到有效的解決。
本試驗(yàn)使用Matlab數(shù)學(xué)軟件,以茶樣的感官審評(píng)得分作為建模依據(jù),引入偏最小二乘法,將其與遺傳算法優(yōu)選后的光譜波段信息進(jìn)行關(guān)聯(lián)性分析,建立近紅外光譜信息與茶樣感官審評(píng)得分之間的GA-PLS數(shù)學(xué)模型(PLS,Partial Least Squares)。
1.2.7 模型的驗(yàn)證與優(yōu)化 采集驗(yàn)證集樣品的近紅外光譜數(shù)據(jù)作為模型驗(yàn)證的輸入量,通過模型預(yù)測(cè)茶樣的品質(zhì)加權(quán)總分,將預(yù)測(cè)值與感官審評(píng)的結(jié)果值進(jìn)行比較分析,來確定茶葉品質(zhì)的優(yōu)劣。如果PMSEP值越小,R值越大,說明校正模型的預(yù)測(cè)準(zhǔn)確度越高(任廣鑫,2012)。
2.1 近紅外光譜預(yù)處理方法的確定與分析
經(jīng)平滑、平滑+歸一化、一階導(dǎo)數(shù)+平滑、一階導(dǎo)數(shù)+平滑+歸一化、二階導(dǎo)數(shù)+平滑、二階導(dǎo)數(shù)+平滑+歸一化6種預(yù)處理后的譜圖見圖1、PLS模型數(shù)據(jù)結(jié)果見表1。結(jié)果表明,在二階導(dǎo)數(shù)+平滑+歸一化條件下,茶樣綜合品質(zhì)的校正集的相關(guān)系數(shù)RC為0.921,預(yù)測(cè)均方根偏差RMSEC為0.543;驗(yàn)證集的相關(guān)系數(shù)RP為0.913,驗(yàn)證均方根偏差RMSEP為0.665,其效果優(yōu)于其它預(yù)處理方法。因此本試驗(yàn)采用二階導(dǎo)數(shù)法+平滑+歸一化的光譜預(yù)處理方式。
2.2 近紅外光譜波段的選擇
為避免搜索空間過大而影響尋優(yōu)效果,本試驗(yàn)擬選取部分光譜區(qū)間進(jìn)行波長(zhǎng)篩選。圖1表明,在6 670-4 000 cm-1光譜區(qū)域吸收峰與光譜特征信息較明顯。因此,本試驗(yàn)選用近紅外光譜數(shù)據(jù)6 670-4 000 cm-1作為特征篩選范圍。
表1 不同光譜預(yù)處理?xiàng)l件下的安溪鐵觀音茶樣綜合品質(zhì)得分PLS模型
Table 1 The PLS model of AXTGY tea based on different kinds of spectral pretreatment
光譜預(yù)處理校正集RCRMSEC驗(yàn)證集RPRMSEP平滑0.1851.4350.3881.505平滑+歸一化0.3411.3730.5121.402一階導(dǎo)數(shù)+平滑0.6141.2230.8660.818二階導(dǎo)數(shù)+平滑0.8120.8530.9070.688一階導(dǎo)數(shù)+平滑+歸一化0.9040.6260.9220.636二階導(dǎo)數(shù)+平滑+歸一化0.9210.5430.9130.665
(a)平滑 (b)平滑+歸一化 (c)一階導(dǎo)數(shù)+平滑
(d)一階導(dǎo)數(shù)+平滑+歸一化 (e)二階導(dǎo)數(shù)+平滑 (f)二階導(dǎo)數(shù)+平滑+歸一化
圖1 不同光譜預(yù)處理方式處理后的安溪鐵觀音茶樣光譜圖
Figure 1 The spectra of AXTGY tea sample after different spectral pretreatment process
2.3 PLS模型和GA-PLS模型對(duì)比分析
試驗(yàn)中GA-PLS模型將全部譜區(qū)平均分為30個(gè)子區(qū)間進(jìn)行隨機(jī)編碼,試驗(yàn)結(jié)果表明(表2),經(jīng)過遺傳算法優(yōu)選出最佳的譜區(qū)編碼為:101010110111011101010110010010,其中編碼為“1”的基因個(gè)數(shù)為17個(gè),表示平均分割的30個(gè)子區(qū)間中有17段譜區(qū)被選擇參與GA-PLS模型的建立,每個(gè)子區(qū)間包含24個(gè)數(shù)據(jù)點(diǎn),即建模點(diǎn)數(shù)為24×17=408(表2)。
經(jīng)二階導(dǎo)數(shù)+平滑+歸一化處理后,得到茶葉綜合品質(zhì)得分的PLS模型與GA-PLS模型(表2),PLS模型和GA-PLS模型的RC和RP均在0.9以上,預(yù)測(cè)均方根偏差RMSEC均小于0.6,模型預(yù)測(cè)效果好,可用于預(yù)測(cè)茶葉綜合品質(zhì)得分。其中PLS模型的校正集的相關(guān)系數(shù)RC為0.959、預(yù)測(cè)均方根偏差RMSEC為0.413、驗(yàn)證集的相關(guān)系數(shù)RP為0.940、驗(yàn)證均方根偏差RMSEP為0.587。GA-PLS模型的校正集的相關(guān)系數(shù)RC為0.959、預(yù)測(cè)均方根偏差RMSEC為0.413、驗(yàn)證集的相關(guān)系數(shù)RP為0.940、驗(yàn)證均方根偏差RMSEP為0.587,對(duì)比可知GA-PLS模型結(jié)果較優(yōu)。其中PLS模型建模波段為1 557,經(jīng)遺傳算法波段優(yōu)化后的模型GA-PLS建模波段僅為408,建模波段減少,縮小建模運(yùn)行時(shí)間,GA-PLS模型驗(yàn)證集的相關(guān)系數(shù)RP達(dá)到0.940,RMSEP為0.587(表2),優(yōu)于PLS模型,精度更高預(yù)測(cè)效果更佳。
表2 安溪鐵觀音茶樣綜合品質(zhì)得分PLS和GA-PLS模型
Table 2 The comprehensive quality score PLS and GA-PLS model of AXTGY tea sample
建模方法建模波段最佳染色體校正集RCRMSECF驗(yàn)證集RPRMSEPFPLS1557全譜段0.9210.5431.6970.9130.6651.375GA-PLS4081010101101110111010101100100100.9590.4132.3220.9400.5871.601
(a) 偏最小二乘模型 (b) 遺傳算法-偏最小二乘模型
圖2 安溪鐵觀音茶樣綜合品質(zhì)得分PLS和GA-PLS模型的線性回歸散點(diǎn)圖
Figure 2 The linear regression scatterplot of comprehensive quality score PLS and GA-PLS model of AXTGY tea sample
近紅外光譜會(huì)受到其他外界因素的影響。在具體運(yùn)用中,應(yīng)根據(jù)不同目的和樣品體系選擇不同的預(yù)處理方式,由于所測(cè)得的光譜曲線圖往往伴隨一定的噪聲,本試驗(yàn)通過平滑預(yù)處理改善光譜形狀,提高信噪比(尼珍等,2008)。導(dǎo)數(shù)法能夠有效的消除其他背景的干擾,但是會(huì)引入噪音,所以將平滑法與導(dǎo)數(shù)法結(jié)合使用,同時(shí)運(yùn)用歸一化法,進(jìn)一步校正樣品因顆粒散射和樣品稀疏而引起的光譜信息誤差。將平滑法、導(dǎo)數(shù)法和歸一化法結(jié)合使用,能夠有效的對(duì)近紅外光譜進(jìn)行預(yù)處理,滿足其適用性。
在建立近紅外光譜校正模型時(shí),對(duì)于樣品的選擇應(yīng)具有一定的代表性和廣泛性。為了提高模型的校正效果和應(yīng)用范圍,應(yīng)充分考慮茶樣的產(chǎn)地范圍、品質(zhì)等級(jí)等因素。本試驗(yàn)將茶樣根據(jù)品質(zhì)高中低進(jìn)行排序,選取茶樣數(shù)量,以含量梯度法劃分訓(xùn)練集和預(yù)測(cè)集。但是茶樣收集存在一定難度,無法收集全部樣品,使得所建模型存在局限性。
本試驗(yàn)結(jié)果表明,綜合品質(zhì)得分GA-PLS模型相關(guān)系數(shù)R達(dá)到0.959,預(yù)測(cè)均方根偏差RMSEP為0.413,能夠較準(zhǔn)確評(píng)判安溪鐵觀音品質(zhì)。但該方法仍存在樣品收集復(fù)雜、參數(shù)設(shè)定憑經(jīng)驗(yàn)等問題。因此,在今后的科研工作中,需要我們進(jìn)一步研究和優(yōu)化近紅外光譜模型,完善茶葉快速無損檢測(cè)體系,促進(jìn)我國茶產(chǎn)業(yè)的標(biāo)準(zhǔn)化進(jìn)程。
段焰青,陶鷹,者為,等,2011.近紅外光譜分析技術(shù)在煙葉產(chǎn)地鑒別中的應(yīng)用[J].云南大學(xué)學(xué)報(bào)(自然科學(xué)版),33(1):77-82.
馮花,郭雅玲,2010.茶葉感官審評(píng)方法及其新發(fā)展[J].福建茶葉,32(7):28-31.
傅志民,2005.茶葉感官審評(píng)存在的不足和改進(jìn)建議[J].中國茶葉加工,1:16-17.
劉發(fā)龍,馬新剛,程福銀,等,2008.近紅外光譜分析技術(shù)在快速分析上的應(yīng)用[J].分析測(cè)試技術(shù)與儀器,,14(4):241-247.
劉輝軍,林敏,施秧,等,2008.遺傳算法在綠茶葉近紅外光譜分析中波長(zhǎng)選擇的應(yīng)用[J].理化檢驗(yàn)(化學(xué)分冊(cè)),44(3):249-251.
李艷肖,黃曉瑋,鄒小波,等,2015.蟻群和遺傳算法優(yōu)化花茶花青素近紅外光譜預(yù)測(cè)模型的比較[J].食品與生物技術(shù)學(xué)報(bào),34(6):575-583.
尼珍,胡昌勤,馮芳,2008.近紅外光譜分析中光譜預(yù)處理方法的作用及其發(fā)展[J].藥物分析雜志,05:824-829.
任廣鑫,2012.基于近紅外分析技術(shù)的紅茶成分分析與產(chǎn)地識(shí)別的研究[D].安徽:安徽農(nóng)業(yè)大學(xué).
王勝鵬,宛曉春,林茂先,等,2011.基于水分、全氮量和粗纖維含量的茶鮮葉原料質(zhì)量近紅外評(píng)價(jià)方法[J].茶葉科學(xué),31(1):66-71.
許瓊,馬國欣,2007.近紅外光譜技術(shù)在化學(xué)分析方面的應(yīng)用進(jìn)展[J].中國高新技術(shù)企業(yè),3:123-124.
周明,孫樹棟,1999.,遺傳算法原理及應(yīng)用[M].北京:國防工業(yè)出版社,1-202.
鄒小波,趙杰文,2007.用遺傳算法快速提取近紅外光譜特征區(qū)域和特征波長(zhǎng)[J].光學(xué)學(xué)報(bào),27(7):1 316-1 321.
(責(zé)任編輯:陳曉雯)
The quality evaluation of Anxi Tieguanyin tea based on near-infrared spectroscopy combined with genetic algorithm
XIA Jin-Mei1,2, SUN Wei-Jiang2, LIN Tao1, YOU Yong1, ZENG Zhao-Hua1, WANG Bing-Yu2
(1.PesticideEnvironmentalSafetyAssessmentCenter,InstituteofPlantProtection,F(xiàn)ujianAcademyofAgriculturalSciences,F(xiàn)uzhou,Fujian350002,China;2.CollegeofHorticulture,F(xiàn)ujianAgricultureandForestryUniversity,F(xiàn)uzhou,F(xiàn)ujian350002,China)
To evaluate the quality of Anxi Tieguanyin (AXTGY) tea by unified standards, the present experiment studied the characterization of AXTGY tea using near-infrared spectroscopy and genetic algorithm. AXTGY tea was collected as the research materials, and genetic algorithm (GA) combined with partial least squares (PLS) was used for building the mathematical analysis model to analyse the quality of AXTGY tea. The results of comprehensive quality score determination model showed that the PLS model displayed the highest prediction performance after spectrum being processed by smoothing, the second derivative and normalized methods. Statistic results of PLS model:Rp=0.913, RMSEP=0.665.NIR spectra ranged from 6 670 to 4 000 cm-1were selected, using GA to select characteristic wavelength and then to construct GA-PLS calibration model which has higher predictive power and precision. Statistic results of GA-PLS model wereRC=0.959, RMSEC=0.413,RP=0.940, RMSEP=0.587.
near-infrared spectroscopy; genetic algorithm; partial least squares method; Anxi Tieguanyin tea; quality score
2016-07-19; 發(fā)表日期: 2016-10-31
福建省自然科學(xué)基金(2016J01139); 福建省省屬公益類科研院所專項(xiàng)(2014R1024-6,2016R1023-9)。
夏金梅(1993-),女,本科,研究實(shí)習(xí)員。研究方向:農(nóng)藥環(huán)境毒理。Email:1083647947@qq.com。
O657.33; S132
A
1001-4276-(2016)01-0132-06
夏金梅,孫威江,林濤,等,2016.基于近紅外光譜技術(shù)結(jié)合遺傳算法的安溪鐵觀音品質(zhì)評(píng)價(jià)[J].武夷科學(xué),32:132-137.