韓方凱,張雪柯,宋玉軍,呂日琴,張東京,翟科峰
葡萄酒味美、富含大量的生理活性成分,深受消費者喜愛.近年來,隨著生活水平的提高,葡萄酒的消費越來越大眾化,同時葡萄酒的品質(zhì)問題亦受到人們的廣泛關(guān)注.傳統(tǒng)的葡萄酒品質(zhì)評價方法主要包括感官評價法和理化分析分法.感官評價雖簡單易行,卻具有較強的主觀性;理化分析雖然客觀可靠,然而每一種理化指標僅能標志葡萄酒一方面的品質(zhì)特性,無法實現(xiàn)葡萄酒綜合品質(zhì)的準確評判.因此,葡萄酒綜合品質(zhì)檢測新技術(shù)的開發(fā)尤為迫切.
為了克服傳統(tǒng)檢測方法的缺陷,研究人員采用新型傳感器技術(shù),如電子舌、電子鼻、近紅外等,開發(fā)葡萄酒綜合品質(zhì)的快速檢測方法.其中,近紅外光譜技術(shù)具有檢測速度更快、無需樣品預(yù)處理的明顯優(yōu)勢,具有較大潛力.2009年,吳桂芳等人采用近紅外結(jié)合BP-人工神經(jīng)網(wǎng)絡(luò)實現(xiàn)了不同品牌葡萄酒樣本的準確識別[1];2010年,劉巍等人采用近紅外光譜技術(shù)構(gòu)建了不同產(chǎn)地葡萄酒樣本的Fisher判別識別模型,獨立樣本正確識別率達到86.7%[2];2017年,Jing Yu等人采用近紅外結(jié)合徑向基人工神經(jīng)網(wǎng)絡(luò)和最小二乘支持向量機構(gòu)建了不同葡萄品種的葡萄酒識別模型,預(yù)測準確率均在90%以上[3].
極限學(xué)習(xí)機(Extreme learning machine,ELM)是一種新型前饋神經(jīng)網(wǎng)絡(luò)算法,由Huang等人于2006年首次提出[4].與傳統(tǒng)采用梯度下降法的神經(jīng)網(wǎng)絡(luò)相比,ELM隨機產(chǎn)生輸入層與隱含層的連接權(quán)值及隱含神經(jīng)元閾值,具有學(xué)習(xí)速度快,且泛化能力好的優(yōu)勢,現(xiàn)已廣泛用于模式識別.然而,目前國內(nèi)外尚未出現(xiàn)采用近紅外光譜技術(shù)結(jié)合ELM算法建立葡萄酒品質(zhì)快速識別方法的相關(guān)報道.
本研究嘗試采用近紅外光譜技術(shù)結(jié)合ELM算法構(gòu)建不同產(chǎn)地、葡萄品種、品牌葡萄酒樣本的快速識別模型,以克服傳統(tǒng)檢測的缺陷,建立葡萄酒品質(zhì)快速識別新方法.
研究所用葡萄酒樣本信息如表1所示.采樣結(jié)果保證同一品牌(張裕),同一葡萄品種(赤霞珠),不同產(chǎn)地(山東煙臺、河北廊坊、陜西咸陽)的葡萄酒樣本各10個;同一葡萄品種(赤霞珠),同一產(chǎn)地(山東煙臺),不同品牌(張裕、長城、朋珠)的葡萄酒樣本各10個;同一品牌(張裕),同一產(chǎn)地(山東煙臺),不同葡萄品種(赤霞珠、蛇龍珠、美樂)的葡萄酒樣本各10個.
表1 葡萄酒樣本
研究采用傅立葉變換近紅外光譜儀(WQF-600N,北京北分瑞利分析儀器(集團)有限責(zé)任公司)對葡萄酒樣本進行檢測分析.儀器參數(shù)設(shè)置如下,采樣分辨率為4cm-1,數(shù)據(jù)范圍為3300.00cm-1~10000.00cm-1,每個樣品掃描次數(shù)為32次.測樣時,直接將葡萄酒樣本原液置入樣品室內(nèi)進行光譜掃描.
研究首先采用主成分分析(Principal Component Analysis,PCA)對原始光譜信息進行降維和去共線化,以可以解釋原始變量信息90%以上的主成分得分作為輸入構(gòu)建ELM模型.經(jīng)過多次對比研究,采用閾值傳遞函數(shù)(hardlim)作為隱含層神經(jīng)元激活函數(shù).隨機選取每組樣本總數(shù)2/5個樣本作為測試集,其余樣本作為訓(xùn)練集構(gòu)建ELM模型,并考察了不同隱含層神經(jīng)元個數(shù)對模型預(yù)測效果的影響.
近紅外光譜是由樣品中含氫基團(C-H,O-H,S-H,N-H)分子振動引起的,反映出這些基團基頻振動的合頻與倍頻信息,波普范圍內(nèi),二級倍頻區(qū)與三級倍頻區(qū),一級倍頻區(qū)與二級倍頻區(qū),合頻區(qū)與一級倍頻區(qū)都有一定的重合帶,再加上葡萄酒本身的復(fù)雜性,導(dǎo)致酒樣近紅外光譜數(shù)據(jù)具有嚴重的共線性.因此,研究首先采用PCA對近紅外光譜數(shù)據(jù)進行預(yù)處理,以達到降維和去共線化的目的.不同產(chǎn)地、葡萄品種及品牌的葡萄酒樣本近紅外光譜信息在不同主成分下的累積貢獻率如圖1所示.可以看出,前7個主成分的累積貢獻率已達到90%以上,可認為能夠代表原始變量信息.
圖1 不同主成分累積貢獻率
ELM測試集預(yù)測結(jié)果如圖2所示.從圖中可以產(chǎn)出,針對產(chǎn)地識別,其中本屬于山東煙臺的2個樣本判錯給陜西咸陽,正確識別率為83.33%;針對品種識別,其中1個屬于赤霞珠的樣品錯判給蛇龍珠,正確識別率為91.67%;針對品牌識別,共有2個樣本預(yù)測錯誤,其中有1個屬于張裕牌的樣品和1個屬于長城牌的樣品均錯判給朋珠牌,正確識別率為83.33%.
圖2 ELM測試集預(yù)測結(jié)果(A-產(chǎn)地識別,B-品種識別,C-品牌識別)
從ELM模型預(yù)測結(jié)果可以產(chǎn)出,近紅外光譜技術(shù)對品質(zhì)差異性的成品葡萄酒樣本預(yù)測正確率均在83%以上,效果良好.這主要是由于產(chǎn)地、葡萄品種及生產(chǎn)工藝(品牌)是影響成品葡萄酒綜合品質(zhì)的主要因素.產(chǎn)地、品種及品牌的差異導(dǎo)致終端葡萄酒產(chǎn)品理化成分(如酚類、香氣成分、pH、總酸等)的差異[5-7],而近紅外光譜技術(shù)可以識別出復(fù)雜基質(zhì)中有機物成分及含量的變化,從而可以實現(xiàn)品質(zhì)差異性葡萄酒樣本的識別.
為克服葡萄酒綜合品質(zhì)傳統(tǒng)檢測方法的局限性,研究采用近紅外結(jié)合ELM建立葡萄酒品質(zhì)快速識別方法,結(jié)果顯示,ELM模型對不同產(chǎn)地、葡萄品種、品牌葡萄酒樣本的正確識別率均在83%以上.可以看出,近紅外結(jié)合ELM可用于葡萄酒綜合品質(zhì)的快速預(yù)測.