吳瑞梅,吳彥紅,艾施榮,劉木華,趙杰文,嚴(yán)霖元
(1.江西農(nóng)業(yè)大學(xué) 工學(xué)院,江西 南昌 330045;2.江西農(nóng)業(yè)大學(xué) 軟件學(xué)院,江西 南昌 330045;3.江蘇大學(xué)食品與生物工程學(xué)院,江蘇 鎮(zhèn)江 212013)
茶葉是一種有益于人體健康的保健飲料。目前,茶葉品質(zhì)好壞、等級劃分、價值高低決定主要由人工感官審評進行,該方法相對簡便,能對茶葉的風(fēng)味特征進行鑒別和描述,但感官審評結(jié)果由評茶師的經(jīng)驗決定,具有明顯的隨意性和不確定性,主觀性強,一致性差。研究采用科學(xué)儀器量化茶葉的品質(zhì)指標(biāo),可有效避免感官評定方法存在的缺陷,提高茶葉品質(zhì)評價的準(zhǔn)確性、穩(wěn)定性和一致性。
茶葉品質(zhì)包括茶葉外形、湯色、香氣、滋味和葉底5個評價指標(biāo),其中茶葉外形是最直觀的評價指標(biāo),茶葉外形指標(biāo)評價包括對茶葉外形形狀和外形顏色2個方面。一些文獻研究采用色差計來量化分析茶葉的外形色澤[1-2],但色差計所測視角直徑只有8mm,代表性受到影響。茶葉外形品質(zhì)不僅包括外形色澤,茶葉外形的形狀、嫩度、整碎等審評因子對其品質(zhì)評價影響也很大[3],因此采用測色技術(shù)難以實現(xiàn)茶葉外形的形狀特征分析。近年來,文獻研究表明,利用計算機視覺技術(shù)能很好的鑒別茶葉的品質(zhì)[4-5],但這些研究只是利用計算機視覺技術(shù)實現(xiàn)茶葉品質(zhì)的定性鑒別,并未將儀器參數(shù)與人工感官審評結(jié)果相關(guān)聯(lián)。高光譜圖像技術(shù)具有計算機視覺技術(shù)和光譜技術(shù)的優(yōu)點,獲取的高光譜數(shù)據(jù)中,既有特定波長下的二維圖像信息,又有待測物內(nèi)部品質(zhì)的光譜信息[6]。茶葉品質(zhì)是茶葉內(nèi)部成分的綜合反映,而茶葉的高光譜圖像中的光譜信息能反映出其內(nèi)部成分信息,圖像信息能反映出茶葉的色澤和外形特征。因此,可利用高光譜圖像對茶葉品質(zhì)進行客觀分析。陳全勝等[7-8]將高光譜成像技術(shù)結(jié)合適當(dāng)?shù)哪J阶R別方法鑒別茶葉等級,模型達到了很好的預(yù)測效果。為探討采用高光譜成像技術(shù)來量化分析茶葉外形感官品質(zhì)的可行性,以碧螺春名優(yōu)綠茶為對象,研究了茶葉的高光譜圖像數(shù)據(jù)與人工感官審評得分值之間的相關(guān)關(guān)系,旨在為茶葉品質(zhì)的儀器化表征提供基礎(chǔ)。
試驗材料選用不同生產(chǎn)日期的蘇州洞庭山碧螺春茶(采集時間為2011年3月19日到2011年4月20日),共采集75批茶樣,每批樣本200 g,由江蘇三萬昌茶葉有限公司提供。
75批茶樣的外形品質(zhì)感官審評實驗在安徽農(nóng)業(yè)大學(xué)茶學(xué)系感官審評實驗室完成,由4位審評專家,按照茶葉感官審評標(biāo)準(zhǔn)(GB/T 23776—2009)和碧螺春茶(NY/T 863—2004)農(nóng)業(yè)行業(yè)標(biāo)準(zhǔn),采用集體評分和密碼審評形式進行。各評茶師以該實驗室的標(biāo)準(zhǔn)碧螺春茶樣品作為參照,對各茶樣的外形形狀和外形顏色按百分制分別給出評分,取4位評茶師的得分平均值。各茶樣的外形得分值為其形狀得分和顏色得分的平均值,以各茶樣的評分值作為外形品質(zhì)優(yōu)劣的數(shù)值依據(jù)。
利用基于光譜儀的高光譜圖像系統(tǒng)采集茶葉高光譜圖像,該系統(tǒng)由基于圖像光譜儀的高光譜攝像機(ImSpector,V10E,Specim Spectral Image Ltd.,Oulu,F(xiàn)inland)、CMOS相機(BCi4 -U -M -20 -LP,Vector International,Belgium),一套 150 W 的光纖鹵素?zé)粝到y(tǒng)(Fiber- Lite DC950 Illuminator,Dolan -Jenner Industries Inc,MA,USA),移動平臺輸送裝置(Zolix,SC30021A,北京)和計算機等部件組成。光譜儀的光譜范圍為408~1117 nm,光譜分辨率為2.8 nm,光譜采樣間隔為0.67 nm。
試驗時,對每批茶樣,采用四分法稱取(10±0.5)g作為一個樣本,將其均勻平鋪在長×寬×高分別為6 cm×6 cm×1 cm的正方體盒子中。將盛放茶葉的盒子放在載物臺上,采集其高光譜圖像。為使高光譜圖像采集過程中不產(chǎn)生失真,經(jīng)試驗反復(fù)嘗試,最終確定高光譜攝像機曝光時間為30 ms,輸送裝置的線速度為1.25mm/s,圖像分辨率為500×1280,采集得到1024個波長下的圖像,得到大小為500×1280×1024的高光譜圖像數(shù)據(jù)塊。
由于高光譜攝像頭傳感器中存在暗電流,且光源強度在各波段下的分布不均勻,導(dǎo)致在光照強度分布較弱的波段下,獲得的高光譜圖像噪音較大,不同波長下的圖像亮度值差異也較大[7]。因此,在數(shù)據(jù)分析前需對茶葉高光譜圖像進行標(biāo)定,其標(biāo)定過程如下[8]:在茶葉高光譜圖像采集的參數(shù)條件下,首先,掃描標(biāo)準(zhǔn)白色校正板(99%光照反射的白板),得到全白的標(biāo)定圖像(Iwh);然后,關(guān)閉攝像機快門采集圖像,得到全黑的標(biāo)定圖像(Ibl);最后,按公式(1)對高光譜圖像進行標(biāo)定校正,使采集得到的絕對圖像Iim轉(zhuǎn)換成相對圖像R。
(1)式中,R為標(biāo)定后的高光譜圖像;Iim為原始的高光譜圖像;Ibl為全黑的標(biāo)定圖像;Iwh為全白的標(biāo)定圖像。
圖1為75個茶樣高光譜圖像在指定位置10×10像素區(qū)域的平均光譜圖。由圖1可看出,光譜兩端存在噪聲,這是因為高光譜相機在該光譜區(qū)間內(nèi)的信噪比較低,校正后容易將噪聲放大,因此必須去除噪聲波段以提高模型的穩(wěn)定性。由圖1可知,在460 nm以上區(qū)域各樣本的光譜差異較大,460 nm以下光譜區(qū)域的反射值變化不大,且在415 nm附近存在明顯的尖峰噪音;在1000 nm以上的光譜曲線也存在噪音,且光譜趨勢不規(guī)則,故選擇460~1000 nm范圍,共540個波數(shù)點的高光譜圖像數(shù)據(jù)進行研究。
試驗采用ENVI軟件在原始高光譜圖像數(shù)據(jù)中重新采樣,在460~1000 nm波段,共提取418張圖像,圖像大小為500×500,得到1個500×500×540的高光譜數(shù)據(jù)塊。該數(shù)據(jù)塊中去除了大部分噪音信息,但相鄰波段下的兩幅圖像之間相關(guān)性較強,在重新得到的三維數(shù)據(jù)塊中仍有大量冗余信息。因此,必須從這些數(shù)據(jù)中提取最能表征茶葉外形品質(zhì)的特征波長圖像。主成分分析法(principal component analysis,PCA)是一種最常見的線性變換投影方法,該方法沿協(xié)方差最大的方向,由高維數(shù)據(jù)空間向低維數(shù)據(jù)空間投影。原始數(shù)據(jù)經(jīng)主成分分析后,得到一組互不相關(guān)的新變量(主成分),消除大量冗余信息[9]。研究采用主成分分析法來優(yōu)選高光譜圖像的特征波長,經(jīng)PCA分析后得到新的主成分圖像,從中找到最能表征原始信息的主成分圖;且方差貢獻率越大的主成分圖像,能解釋原始高光譜圖像中的信息越多。由主成分分析法原理可知,各個主成分圖像是由原始高光譜圖像數(shù)據(jù)中各個波長下的圖像經(jīng)線性組合后形成的新圖像,線性組合公式見式(2)。
圖1 茶葉高光譜圖像在10×10像素區(qū)域的平均光譜曲線Fig.1 The mean spectra of 10 ×10 regions from hyper-spectral images of teas
(2)式中,PCi為第i個主成分圖像,αi為各主成分的權(quán)重系數(shù),Ii為第i個波段下的原始圖像。在該線性組合中,絕對值最大的權(quán)重系數(shù)αi所對應(yīng)波長下的圖像即為特征圖像[8]。
圖2 由主成分分析獲取的前4個主成分圖像Fig.2 The first four principle component images by PCA
圖2為經(jīng)主成分分析后,得到的前4個主成分圖像 PC1、PC2、PC3和 PC4,第一主成分圖像(PC1)、第二主成分圖像(PC2)、第三主成分圖像(PC3)和第四主成分圖像(PC4)的方差貢獻率分別為97.14%、2.62%、0.18%和0.02%。從圖2可看出,第一主成分圖像與原始圖像最接近(與圖3提取的灰度圖像對比),且第一主成分圖像的方差貢獻率占了所有原始信息的97.14%,解釋了原始高光譜圖像的絕大多數(shù)信息;從第二主成分圖像開始出現(xiàn)小量噪音,而在第三、第四主成分圖像中能看到明顯噪音。因此本研究根據(jù)第一主成分圖像尋找特征波長圖像。
經(jīng)比較不同樣本的第一主成分圖像的418個權(quán)重系數(shù),發(fā)現(xiàn)權(quán)重系數(shù)較大者出現(xiàn)在768.74 nm,827.54 nm和886.83 nm波長處,因此選擇這3個波長作為本研究的特征波長。在ENVI軟件中,提取此3個特征波長下的灰度圖像(簡稱特征圖像),用于后續(xù)的圖像特征信息提取。優(yōu)選出的3個特征波長下的灰度圖像見圖3。
圖3 由主成分分析法提取的3個特征波長下的茶葉灰度圖像Fig.3 Gray images of tea from three feature wavelengths extracted by PCA
本研究利用高光譜圖像量化分析茶葉的外形感官品質(zhì)。茶葉外形感官品質(zhì)包括茶葉的形狀和顏色2個方面,從特征圖像中分別提取顏色特征和紋理特征。由于單個波長下的圖像是灰度圖像,其顏色特征只能提取該波長下灰度圖像的亮度均值和標(biāo)準(zhǔn)差2個特征變量。圖像的紋理特征提取,分別采用灰度統(tǒng)計矩法、頻譜法和灰度共生矩陣法,其中基于灰度統(tǒng)計矩的紋理特征參數(shù)有6個,分別為:平均灰度值(m)、標(biāo)準(zhǔn)差(δ)、平滑度(R)、三階矩(μ3)、一致性(U)和熵(e);基于頻譜的紋理特征參數(shù)有6個,分別為:圓周向譜 t(ρ)能量的幅值(Aρ)、均值(mρ)、方差(δρ)和徑向譜能量(s(θ))的幅值(Aθ)、均值(mθ)、方差(δθ);基于灰度共生矩陣的紋理特征提取參照文獻[10-11],有16個,分別為:0°慣性矩、0°相關(guān)性、0°能量、0°同質(zhì)性;45°慣性矩、45°相關(guān)性、45°能量、45°同質(zhì)性;90°慣性矩、90°相關(guān)性、90°能量、90°同質(zhì)性;135°慣性矩、135°相關(guān)性、135°能量、135°同質(zhì)性。這樣每個特征波長下的灰度圖像提取了2個顏色特征,28個紋理特征,共30個特征,各特征參數(shù)的計算公式參見文獻[12]。每個茶樣的高光譜數(shù)據(jù)塊中,分別優(yōu)選出了3個特征波長下的灰度圖像,因此每個茶樣最終提取了90個特征變量。
茶葉品質(zhì)由評茶員通過感覺器官完成,人體感覺器官機理復(fù)雜,且茶葉品質(zhì)是茶葉內(nèi)部成分的錯綜復(fù)雜作用結(jié)果,在茶葉品質(zhì)與感官評分間可能是復(fù)雜的非線性關(guān)系。BP神經(jīng)網(wǎng)絡(luò)(back-propagation artificial neural network,BP-ANN),該網(wǎng)絡(luò)采用最小均方差學(xué)習(xí)方式,以反向傳播的學(xué)習(xí)算法來調(diào)整各權(quán)重值,能很好的解決模糊,非線性復(fù)雜問題[13-14]。
表1 校正集和預(yù)測集綠茶外形品質(zhì)感官審評實際得分值結(jié)果Tab.1 The sensory appearance scores of tea samples by the tea tasters and sample numbers in calibration and prediction set
本試驗選用BP神經(jīng)網(wǎng)絡(luò)方法建立茶葉外形感官品質(zhì)與高光譜圖像特征變量之間的相關(guān)模型,采用3層BP網(wǎng)絡(luò)結(jié)構(gòu)(包括:輸入層,隱含層,輸出層),輸出層為茶葉外形感官審評得分值。從75個樣本中選取50個作為校正集,建立校正模型,余下的25個樣本為預(yù)測集,用來評價模型性能,校正集和預(yù)測集樣本的外形品質(zhì)感官審評實際得分值統(tǒng)計結(jié)果見表1。
由2.3節(jié)共提取了90個特征變量,這些特征變量中,有些對茶葉外形品質(zhì)貢獻不大或無貢獻,有些特征變量間存在一定相關(guān)性,因此,模型建立前必須去除冗余信息和無關(guān)信息,以提高模型的精度和穩(wěn)定性[8]。研究采用主成分分析法(PCA)提取有效特征信息,由提取的主成分?jǐn)?shù)作為網(wǎng)絡(luò)模型的輸入。網(wǎng)絡(luò)模型的參數(shù)設(shè)計如下:輸入層到隱含層、隱含層到輸出層的傳遞函數(shù)都采用正切S形函數(shù),權(quán)重修正動量設(shè)為0.1,初始權(quán)重設(shè)為0.3,學(xué)習(xí)速率設(shè)為0.1,目標(biāo)誤差設(shè)為0.001,最大訓(xùn)練次數(shù)為1000。研究表明,主成分?jǐn)?shù)的多少作為網(wǎng)絡(luò)模型的輸入,對網(wǎng)絡(luò)模型性能影響很大;主成分?jǐn)?shù)選擇過少,會損失部分特征信息,降低模型的精度;而主成分?jǐn)?shù)選擇過多,一些無關(guān)和冗余信息會引入模型中,從而降低模型的魯棒性,網(wǎng)絡(luò)訓(xùn)練的時間也會更長。因此,在校正集中采用交互驗證法確定最佳主成分?jǐn)?shù),最小的交互驗證均方根誤差(RMSECV)所對應(yīng)模型使用的主成分?jǐn)?shù)作為網(wǎng)絡(luò)模型的輸入。圖4顯示采用不同主成分?jǐn)?shù)訓(xùn)練網(wǎng)絡(luò)模型的RMSECV值。由圖4可看出,采用13個主成分?jǐn)?shù)訓(xùn)練網(wǎng)絡(luò)模型時,RMSECV值最小。因此,研究使用前13個主成分作為網(wǎng)絡(luò)模型的輸入,最終網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)為13-14-1。用該網(wǎng)絡(luò)訓(xùn)練校正集樣本,模型校正集的預(yù)測值與實際評分值之間的相關(guān)系數(shù)為0.875,RMSECV為3.376。用預(yù)測集25個獨立樣本檢驗?zāi)P托阅?,模型預(yù)測值與實際評分值之間的相關(guān)系數(shù)為0.859,預(yù)測均方根誤差(RMSEP)為3.611。
為驗證所建模型的準(zhǔn)確度,對預(yù)測集中25個樣品的實際評分值與模型預(yù)測值進行配對t檢驗,檢驗結(jié)果如表2。表2中,實際評分值&模型預(yù)測值是指25個茶葉樣本的外形感官評分值與模型預(yù)測值相互配對。由表2可知,實際評分值與模型預(yù)測值的配對差的均值為0.850,t統(tǒng)計量的值為1.187,對應(yīng)的概率P 值為0.247(P=0.247 >0.05),表明實際評分值與模型預(yù)測值之間無顯著差異。說明所建模型用于未知茶葉外形感官得分值的預(yù)測,其預(yù)測結(jié)果是準(zhǔn)確、可靠的。
圖4 校正集中不同主成分下訓(xùn)練BP-ANN模型對應(yīng)的RMSECVFig.4 RMSECV of BP-ANN models at different PCs in the calibration set
表2 實際評分值與模型預(yù)測值配對樣本t檢驗結(jié)果Tab.2 T-test result between the reference values and the prediction values
本研究表明,基于高光譜圖像數(shù)據(jù)建立茶葉外形感官品質(zhì)評價模型是可行性,所建模型的預(yù)測值與實際評分值之間無顯著差異,說明所建模型用于茶葉外形感官品質(zhì)的量化評價是準(zhǔn)確、可靠的。茶葉種類不同,其品質(zhì)各有差異,本文只研究了一種茶葉,為探討該方法的普適性,將進一步研究其他多種大宗茶和名優(yōu)茶的感官品質(zhì)的儀器化表征方法,為茶葉品質(zhì)的量化評價的儀器化開發(fā)提供方法支持。
[1]賴國亮,吳金桃,蘭永輝.測色技術(shù)在炒青綠茶品質(zhì)評價中的應(yīng)用[J].中國茶葉,1999(2):19-21.
[2]嚴(yán)俊,林剛,葉付剛,等.測色技術(shù)在工夫紅茶品質(zhì)評價中的應(yīng)用研究[J].中國農(nóng)學(xué)通報,1997,13(6):24-26.
[3]陸松侯,施兆鵬.茶葉審評與檢驗[M].3版.北京:中國農(nóng)業(yè)出版社,2001:6.
[4]Wu D,Yang H Q,Chen X J,et al.Application of image texture for sorting of tea categories using multi- spectral imaging technique and support vector machine[J].Journal of Food Engineering,2008,88(4):474 -483.
[5]Chen Q S,Zhao J W,Cai J R.Identification of tea varieties using computer vision[J].Transaction of the ASABE,51(2):623-628.
[6]趙杰文,陳全勝,林顥.現(xiàn)代成像技術(shù)及其在食品、農(nóng)產(chǎn)品檢測中的應(yīng)用[M].北京:機械工業(yè)出版社,2010,63.
[7]陳全勝,趙杰文,蔡健榮,等.利用高光譜圖像技術(shù)評判茶葉的質(zhì)量等級[J].光學(xué)學(xué)報,2008,28(4):669-674.
[8]Zhao J W,Chen Q S,Cai J R,et al.Automated tea quality classification by hyperspectral imaging[J].Applied Optics,2009,48(19):3557-3564.
[9]許祿,邵學(xué)廣.化學(xué)計量學(xué)方法[M].北京:科學(xué)出版社,2006,163 -174.
[10]于海鵬,劉一星,張斌,等.應(yīng)用空間灰度共生矩陣定量分析木材表面紋理特征[J].林業(yè)科學(xué),2004,40(6):121-129.
[11]Dobrowski S Z,Greenberg J A,Ramirez C M,et al.Improving image derived vegetation maps with regression based distribution modeling[J].Ecological Modelling,2006,192(1):126 -142.
[12]岡薩雷斯.數(shù)字圖像處理[M].2版.北京:電子工業(yè)出版社,2008:224-275.
[13]Barma S D,Das B,Giri A,et al.Back propagation artificial neural network(BPANN)based performance analysis of diesel engine using biodiesel[J].Journal of Renewable and Sustainable Energy,2011,3(1):013101 -1:12
[14]Balabin R M,Safieva R Z,Lomakina E I.Comparison of linear and nonlinear calibration models based on near infrared(NIR)spectroscopy data for gasoline properties prediction [J].Chemometric and Intelligent Laboratory Systems,2007,88(2):183-188.
[15]王文杰,羅守進,黃建琴,等.電腦測定茶葉色澤的方法研究[J].茶葉科學(xué),2005,25(1):37-42.