李宜聰,樊雙喜,吉鑫,李春揚(yáng),辛鵬,諶松強(qiáng),張澤輝,劉鳳暉,鐘其頂*
1(中國(guó)食品發(fā)酵工業(yè)研究院有限公司,北京,100015)2(全國(guó)食品發(fā)酵標(biāo)準(zhǔn)化中心,北京,100015) 3(酒鬼酒股份有限公司,湖南 吉首,416000)
馥郁香型白酒秉承了湘西傳統(tǒng)小曲酒的生產(chǎn)基礎(chǔ),將中國(guó)傳統(tǒng)大曲酒生產(chǎn)工藝精髓與小曲酒生產(chǎn)工藝巧妙融合,香氣優(yōu)雅,諸香馥郁[1],具有“前濃、中清、后醬”的香味[2]。年份酒一直以來是我國(guó)白酒市場(chǎng)的暢銷產(chǎn)品,深得消費(fèi)者喜歡,但檢測(cè)技術(shù)體系尚不健全。因此,通過科學(xué)技術(shù)手段鑒定年份酒產(chǎn)品標(biāo)注的真實(shí)性,建立白酒年份酒真實(shí)性檢測(cè)體系,成為規(guī)范行業(yè)和市場(chǎng)的迫切要求。
目前,國(guó)內(nèi)在白酒年份鑒別技術(shù)方面研究很多。例如,徐占成通過頂空與氣相色譜聯(lián)用技術(shù)測(cè)定出年份酒中微量香味成分的揮發(fā)系數(shù),并根據(jù)揮發(fā)系數(shù)與貯存時(shí)間之間的關(guān)系繪制出標(biāo)準(zhǔn)曲線,研究發(fā)現(xiàn)年份酒的貯存時(shí)間越長(zhǎng),其揮發(fā)系數(shù)越來越小[3]。莊名[4]利用原子吸收光譜儀測(cè)定酒體中的金屬元素含量來鑒定年份酒的貯存年份,研究發(fā)現(xiàn)酒體中對(duì)酒質(zhì)產(chǎn)生影響的金屬元素隨著貯存時(shí)間的增長(zhǎng),其含量增加,且成正相關(guān)。楊濤等[5]采用紫外光譜法測(cè)定年份酒中共軛體系化合物含量,并發(fā)現(xiàn)白酒的紫外吸收度隨貯存時(shí)間加長(zhǎng)而增強(qiáng)。王國(guó)祥[6]采用Raman光譜技術(shù)對(duì)古井貢系列年份酒進(jìn)行鑒別分析,建立基于支持向量機(jī)回歸的白酒年份與年份指數(shù)對(duì)應(yīng)關(guān)系,實(shí)現(xiàn)了白酒年份識(shí)別及預(yù)測(cè)。徐瑞煜[7]采用熒光光譜技術(shù)測(cè)得濃香型白酒樣品的三維熒光光譜,結(jié)合非負(fù)矩陣分解-支持向量機(jī)算法,可以實(shí)現(xiàn)濃香型白酒年份的分類預(yù)測(cè)。李彪[8]通過近紅外光譜技術(shù)檢測(cè)白云邊年份酒樣品(兼香型),可以建立稀疏主成分-支持向量機(jī)白云邊年份酒酒齡分類鑒別模型,模型正確率為96%。
目前,已開發(fā)的關(guān)于白酒的年份真實(shí)性鑒定技術(shù)研究,主要集中在探索濃香型、清香型等典型香型白酒基酒的年份預(yù)測(cè)方面,對(duì)馥郁香型白酒尤其是瓶貯年份(瓶貯年份指的是白酒在原包裝瓶中實(shí)際貯存的年數(shù))預(yù)測(cè)、瓶貯年份與其香氣成分之間關(guān)系的研究未見報(bào)道,同時(shí)也未見報(bào)道研究明確馥郁香型瓶貯年份白酒特征標(biāo)記物。
常規(guī)的多元線性回歸模型不能有效解決變量間的多重共線性問題。偏最小二乘回歸(partial least squares regression, PLSR)集成了主成分分析、典型相關(guān)分析、線性回歸分析的優(yōu)點(diǎn)[9],可以清晰、靈活地闡述自變量與因變量之間的關(guān)系,有效避免了自由度過小造成的影響,解決了樣本量少、自由度低、變量間相關(guān)性強(qiáng)等問題,可以充分提取樣本有效信息[10]。留一交叉驗(yàn)證法(leave one out cross validation, LOOCV)是將N個(gè)樣本單獨(dú)作為驗(yàn)證集,其余的N-1個(gè)樣本作為訓(xùn)練集進(jìn)行驗(yàn)證[11]。由于LOOCV的訓(xùn)練集最接近原始樣本的分布,用該方法建立的模型可信度高、不容易受隨機(jī)因素的影響,在處理小樣本數(shù)據(jù)上有較大優(yōu)勢(shì)。本研究以馥郁香型白酒為研究對(duì)象,采用氣相色譜直接進(jìn)樣內(nèi)標(biāo)測(cè)定馥郁香型白酒樣品中48 種主要風(fēng)味組分的含量,建立PLSR模型,預(yù)測(cè)馥郁香型白酒的甁貯年份,用LOOCV驗(yàn)證PLSR模型,篩選瓶貯年份特征標(biāo)記物,解決當(dāng)下瓶貯年份白酒產(chǎn)業(yè)高質(zhì)量健康發(fā)展缺乏有效市場(chǎng)監(jiān)管的技術(shù)難題。
37個(gè)馥郁香型白酒樣本,包括8個(gè)52%vol內(nèi)參酒樣本、7個(gè)42%vol酒鬼酒樣本、7個(gè)52%vol酒鬼酒樣本、6個(gè)42%vol湘泉酒樣本、9個(gè)54%vol湘泉酒樣本。
GC-2010氣相色譜儀,配備FID檢測(cè)器,日本Shimadzu公司;色譜柱:CP-Wax 57 CB Acidic石英毛細(xì)管柱(50 m×0.25 mm×0.2 μm),美國(guó)安捷倫J&W公司。
1.2.1 白酒風(fēng)味特征組分含量測(cè)定
采用氣相色譜直接進(jìn)樣內(nèi)標(biāo)[12]測(cè)定馥郁香型白酒樣品中主要風(fēng)味組分的含量。
1.2.2 數(shù)據(jù)預(yù)處理
建模前對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理(中心化和無量綱化),具體處理如公式(1)、公式(2)所示:
(1)
(2)
1.2.3 偏最小二乘回歸法
將通過氣相色譜直接進(jìn)樣內(nèi)標(biāo)測(cè)定馥郁香型白酒樣品中48 種主要風(fēng)味組分的含量(mg/L)(已進(jìn)行數(shù)據(jù)預(yù)處理)作為自變量X矩陣,將相應(yīng)馥郁香型白酒樣品瓶貯年份/年作為因變量Y矩陣。對(duì)自變量X矩陣和因變量Y矩陣進(jìn)行矩陣分解,如公式(3)、公式(4)所示:
X=TP+E
(3)
Y=UQ+F
(4)
式中:T、X矩陣的得分矩陣;P,相應(yīng)的載荷矩陣;E、殘差矩陣;U、Y矩陣的得分矩陣;Q,相應(yīng)的載荷矩陣;F,殘差矩陣。T與U滿足關(guān)系如公式(5)所示:
U=TB+G
(5)
式中:B為回歸系數(shù)矩陣,G為誤差矩陣。
結(jié)合公式(3)、公式(4)可得公式(6)、公式(7):
Y=TBQ
(6)
Y=XBQP-1
(7)
1.2.4 偏最小二乘回歸模型評(píng)價(jià)
采用LOOCV驗(yàn)證PLSR模型。模型預(yù)測(cè)的質(zhì)量通常需要通過建立預(yù)測(cè)值與實(shí)際值之間的關(guān)系進(jìn)行評(píng)價(jià),常用的模型評(píng)價(jià)參數(shù)為相關(guān)系數(shù)(R2)、預(yù)測(cè)標(biāo)準(zhǔn)偏差(root mean square error of prediction,RMSEP)、校正標(biāo)準(zhǔn)偏差(root mean square error of calibration, RMSEC)和相對(duì)分析誤差(residual predictive deviation, RPD)[14],相關(guān)計(jì)算如公式(8)~公式(11)所示:
(8)
(9)
(10)
(11)
1.2.5 回歸系數(shù)顯著性檢驗(yàn)原理
偏最小二乘法不同于一般最小二乘法,其回歸系數(shù)方差無法得到準(zhǔn)確的無偏估計(jì),本實(shí)驗(yàn)采用jack-knife方法進(jìn)行方差估計(jì)[15],如公式(12)所示:
(12)
直接進(jìn)樣氣相色譜內(nèi)標(biāo)法測(cè)定37 個(gè)馥郁香型白酒樣品的風(fēng)味特征指紋圖譜,共定量出易揮發(fā)風(fēng)味組分48 種,其中包括酯類物質(zhì)13種、醇類物質(zhì)15 種、有機(jī)酸9 種、羰基化合物(醛、酮)8 種、縮醛類化合物3 種,其描述性統(tǒng)計(jì)結(jié)果如表1所示。由表1中48 種馥郁香型白酒風(fēng)味組分含量的均值、中位數(shù)、標(biāo)準(zhǔn)差、偏度系數(shù)等描述性統(tǒng)計(jì)量可知,馥郁香型白酒中風(fēng)味組分含量不同且差別較大,存在量綱的影響,因此,在建模之前需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化和中心化預(yù)處理,消除量綱對(duì)所建模型的不良影響。
表1 風(fēng)味組分含量描述性統(tǒng)計(jì) 單位:mg/L
采用Pearson相關(guān)系數(shù)法[16]計(jì)算48 種風(fēng)味組分的相關(guān)系數(shù)。其中,乙醛、甲酸乙酯、乙縮醛等24種風(fēng)味組分相關(guān)性極強(qiáng),其相關(guān)系數(shù)R表現(xiàn)為0.90 (13) 式中:Ri,第i個(gè)變量Xi與其余變量Xj(i=1,2,…,k;i≠j)的復(fù)相關(guān)系數(shù)。 24種馥郁香型白酒風(fēng)味組分的VIF值如表2所示。一般情況下,當(dāng)VIF>10時(shí),認(rèn)為模型中自變量存在較強(qiáng)的共線性問題。由表2可知,17 種馥郁香型白酒風(fēng)味組分VIF均大于10,其余7 種風(fēng)味組分的VIF值在2.47~9.73,最大值為49.52(丁酸乙酯),說明24 種風(fēng)味組分的共線性問題仍較嚴(yán)重。這可能是由于白酒在長(zhǎng)期發(fā)酵、蒸餾、勾調(diào)過程中,同一前體物質(zhì)接連發(fā)生一系列化學(xué)反應(yīng),生成眾多風(fēng)味成分,這些風(fēng)味成分間存在嚴(yán)重的共線性問題。例如乙醇氧化生成乙醛、乙醛縮合生成乙縮醛等物質(zhì)[17]。多元線性回歸模型中,若變量共線性問題嚴(yán)重,會(huì)破壞模型的穩(wěn)定性,增大誤差,不適宜直接建立回歸模型。 表2 24種風(fēng)味組分多重共線性診斷結(jié)果Table 2 Diagnosis results of multicollinearity of 24 flavor components 逐步回歸是避免多重共線性的一種有效方法,它將向前選擇和向后選擇的2種變量選擇方法結(jié)合起來篩選自變量。對(duì)上述24 種馥郁香型白酒風(fēng)味組分進(jìn)行逐步回歸,最終選擇出10 種風(fēng)味組分,并建立馥郁香型白酒甁貯年份多元線性回歸模型。 篩選出的10種風(fēng)味組分VIF值在1.62~9.56,如表3所示。 表3 10種風(fēng)味組分多重共線性診斷結(jié)果Table 3 Diagnosis results of multicollinearity of 10 flavor components 建立的馥郁香型白酒甁貯年份多元線性回歸表達(dá)式為Y=-1.744 2+0.377 8X1+0.004 6X2-0.007 6X3-0.002 5X4-0.153 5X5+0.047X6+0.509 1X7-0.339 3X8+0.002 4X9+0.744 2X10;Y表示馥郁香型白酒瓶貯年份,年;X1,……,X10表示氣相色譜測(cè)得的各風(fēng)味組分含量(具體組分名稱參考表3),mg/L。 (14) 式中:R2,多元線性回歸的多重決定系數(shù);n,樣本量;k,變量個(gè)數(shù)。 2.3.1 模型參數(shù)的選擇 主成分?jǐn)?shù)的選擇是PLSR建模的關(guān)鍵,選取成分個(gè)數(shù)過多,會(huì)將冗余信息帶入模型,導(dǎo)致過擬合,預(yù)測(cè)準(zhǔn)確性降低;選取成分個(gè)數(shù)過少,不能充分反映樣品的變量信息,導(dǎo)致欠擬合,預(yù)測(cè)準(zhǔn)確性降低[18]。 本實(shí)驗(yàn)根據(jù)各成分建模時(shí)的累計(jì)貢獻(xiàn)率和RMSEP綜合選取參與建模的主成分?jǐn)?shù)。選取1到累計(jì)貢獻(xiàn)率為100%的35個(gè)主成分分別進(jìn)行PLSR建模,觀察不同主成分?jǐn)?shù)參與建模的RMSEP值變化趨勢(shì)(圖1、圖2),各個(gè)主成分對(duì)變量的貢獻(xiàn)率變化趨勢(shì)(圖3),不同主成分?jǐn)?shù)對(duì)變量的貢獻(xiàn)率變化趨勢(shì)(圖4)。 圖1 不同主成分?jǐn)?shù)參與建模的RMSEP值Fig.1 RMSEP values in models with different principal component numbers 圖2 不同主成分?jǐn)?shù)參與建模的RMSEP值(局部放大圖)Fig.2 RMSEP values in models with different principal component numbers (partial enlarged) 圖3 各個(gè)主成分對(duì)變量的貢獻(xiàn)率Fig.3 The contribution of each principal component to the variable 綜合圖1、圖2可知,當(dāng)參與建模主成分?jǐn)?shù)增加至3時(shí),RMSEP值下降至0.844 3,繼而在其周圍上下波動(dòng),待主成分?jǐn)?shù)為9時(shí),RMSEP值達(dá)到最低0.830 5,隨后,RMSEP值隨主成分?jǐn)?shù)增加而迅速增大。由圖3可知,第一主成分、第二主成分、第三主成分對(duì)變量(自變量和因變量)的貢獻(xiàn)率較大,貢獻(xiàn)率均超過10%。然而,觀察圖4不難發(fā)現(xiàn),前3個(gè)主成分對(duì)變量的累計(jì)貢獻(xiàn)率較低(對(duì)自變量的累計(jì)貢獻(xiàn)率為71.95%,對(duì)因變量的累計(jì)貢獻(xiàn)率為55.07%),均小于75%。 圖4 不同主成分?jǐn)?shù)對(duì)變量的貢獻(xiàn)率Fig.4 The contribution of different principal components to the variable 綜合考慮,選擇RMSEP相對(duì)較小且對(duì)變量(自變量和因變量)累計(jì)貢獻(xiàn)率大于85%的主成分?jǐn)?shù)建立PLSR模型。當(dāng)提取9個(gè)主成分建立PLSR模型時(shí),RMSEP值取得最小值0.830 5,對(duì)自變量的累計(jì)貢獻(xiàn)率為89.17%,對(duì)因變量的累計(jì)貢獻(xiàn)率為95.34%,樣本信息得到了充分的提取。因此,綜合RMSEP值與主成分對(duì)變量的累計(jì)貢獻(xiàn)率,選取前9個(gè)主成分建立PLSR模型。 2.3.2 模型建立與評(píng)價(jià) 綜上,本研究從馥郁香型白酒樣品中48種風(fēng)味組分含量數(shù)據(jù)中抽提出9個(gè)主成分參與建立PLSR模型,得出馥郁香型白酒瓶貯年份與風(fēng)味組分含量的回歸方程,進(jìn)行馥郁香型白酒瓶貯年份的預(yù)測(cè)。回歸方程為Y=-0.475 4X1+0.048 4X2+0.290 7X3+……+0.279 1X46+0.229 1X47+0.312 3X48;Y表示馥郁香型白酒瓶貯年份,年;X1,……,X48表示氣相色譜測(cè)得的各風(fēng)味組分含量,mg/L。 以馥郁香型白酒瓶貯年份實(shí)際值為橫坐標(biāo),馥郁香型白酒瓶貯年份PLSR模型預(yù)測(cè)值為縱坐標(biāo),做馥郁香型白酒瓶貯年份預(yù)測(cè)圖。如圖5所示,瓶貯年份實(shí)際值與PLSR模型預(yù)測(cè)值數(shù)據(jù)點(diǎn)總體呈對(duì)角線分布,同時(shí)通過成對(duì)T檢驗(yàn),瓶貯年份預(yù)測(cè)值與實(shí)際值間無明顯差異(P>0.95)。 圖5 馥郁香型白酒瓶貯年份預(yù)測(cè)圖Fig.5 Prediction graph of storage year of bottle storage year of fragrant Baijiu 采用馥郁香型白酒瓶貯年份預(yù)測(cè)值與實(shí)際值間相關(guān)系數(shù)R2、RPD和RMSEC值作為評(píng)價(jià)PLSR模型擬合效果的重要指標(biāo)。R2越接近1,表明PLSR模型預(yù)測(cè)值與實(shí)際值間的誤差越小[19]。若RMSEC<1,RMSEP <1,RPD > 3,表明模型預(yù)測(cè)精度較高[20]。 本實(shí)驗(yàn)所建PLSR模型的R2為0.953 4,RMSEC值為0.215 9,RMSEP值為0.838 4,RPD值為4.631 3,表明馥郁香型白酒瓶貯年份實(shí)際值與預(yù)測(cè)值間線性關(guān)系良好,該模型擬合性較好,預(yù)測(cè)精度較高。 馥郁香型白酒瓶貯年份預(yù)測(cè)模型的回歸系數(shù)如圖6、圖7所示。23個(gè)風(fēng)味組分的含量與馥郁香型白酒瓶貯年份呈正相關(guān),25個(gè)風(fēng)味組分的含量與馥郁香型白酒瓶貯年份呈負(fù)相關(guān)。采用jack-knife方法[12]對(duì)各風(fēng)味物質(zhì)的回歸系數(shù)進(jìn)行顯著性 檢驗(yàn),結(jié)果發(fā)現(xiàn),己酸乙酯(P<0.001)、乙醛(P<0.01)、辛酸乙酯(P<0.05)、正丁醇(P<0.05)在預(yù)測(cè)馥郁香型白酒瓶貯年份上影響顯著。 圖6 馥郁香型白酒瓶貯年份預(yù)測(cè)模型回歸系數(shù)圖Fig.6 Regression coefficient graph of prediction model of bottle storage year of fragrant Baijiu 辛酸乙酯對(duì)馥郁香酒風(fēng)味貢獻(xiàn)很大,是馥郁香型白酒特有的風(fēng)味物質(zhì)。醇是酯和酸的前驅(qū)物質(zhì),可增加白酒的甜味,并讓香氣濃郁且持久,部分高級(jí)醇還具有特殊的風(fēng)味。研究表明,正丁醇是馥郁香型白酒區(qū)別于其他香型白酒的主要醇類組分[21]。 程嬌嬌[22]發(fā)現(xiàn),不同年份的賒店酒(濃香型)中,己酸和乙酸的含量隨貯藏年份的增加呈現(xiàn)先降低后平緩的趨勢(shì),己酸乙酯的含量隨貯藏年份的增加而增加。白酒的pH值為4~5,在酸性條件下,己酸和白酒的主體物質(zhì)乙醇發(fā)生酯化反應(yīng),生成己酸乙酯,最終達(dá)到動(dòng)態(tài)平衡。研究發(fā)現(xiàn),馥郁香型白酒中己酸乙酯含量明顯高于醬香型白酒、濃香型白酒和清香型白酒[21]。 圖7 馥郁香型白酒瓶貯年份預(yù)測(cè)模型回歸系數(shù)圖Fig.7 Regression coefficient graph of prediction model of bottle storage year of fragrant Baijiu 乙醛是白酒中主要呈味物質(zhì),濃度低時(shí)有水果香,濃度高時(shí)會(huì)產(chǎn)生辛辣的刺激性氣味[23]。研究發(fā)現(xiàn),老酒中的乙醛和乙縮醛的含量都比新酒多。新酒貯存一段時(shí)間后,酒中檢測(cè)出的乙醛和乙縮醛含量均顯著升高[24]。白酒的陳釀是一系列的氧化過程,乙醇是白酒中的重要組成成分,在白酒老熟的過程中,乙醇在酸性條件下不斷被氧化為乙醛,乙醛與醇類縮合生產(chǎn)乙縮醛,隨著老熟的推進(jìn),白酒中乙醛和乙縮醛的含量不斷增加,上下波動(dòng),最終達(dá)到穩(wěn)定地動(dòng)態(tài)平衡[14]。 綜上,通過對(duì)馥郁香型白酒瓶貯年份預(yù)測(cè)模型回歸系數(shù)進(jìn)行顯著性檢驗(yàn),結(jié)合白酒自然老熟機(jī)制,尋找出4個(gè)馥郁香型白酒瓶貯年份預(yù)測(cè)的特征標(biāo)記物:己酸乙酯、乙醛、辛酸乙酯、正丁醇。其中,辛酸乙酯、正丁醇預(yù)測(cè)馥郁香型白酒瓶貯年份的機(jī)制尚不清晰,有待后續(xù)深入研究。 本文通過氣相色譜直接進(jìn)樣內(nèi)標(biāo)測(cè)定馥郁香型白酒樣品中48 種主要風(fēng)味組分的含量,建立PLSR模型,預(yù)測(cè)馥郁香型白酒的甁儲(chǔ)年份,并用LOOCV法驗(yàn)證PLSR模型。通過累計(jì)貢獻(xiàn)率和RMSEP綜合選取出9個(gè)主成分參與建立偏最小二乘回歸模型,所建立的模型R2為0.953 4,RMSEC為0.215 9,RMSEP為0.838 4,RPD為4.631 3,回歸擬合效果好,預(yù)測(cè)精度高。此外,本文還用jack-knife方法對(duì)所建模型的回歸系數(shù)顯著性進(jìn)行檢驗(yàn),結(jié)合白酒自然老熟機(jī)制,尋找出4個(gè)對(duì)馥郁香型白酒瓶貯年份預(yù)測(cè)有顯著影響的特征標(biāo)記物:己酸乙酯、乙醛、辛酸乙酯和正丁醇,為馥郁香型白酒瓶貯年份鑒定提供了新思路,為馥郁香型白酒貯存機(jī)理的研究奠定基礎(chǔ)。2.3 PLSR模型的建立
2.4 馥郁香型白酒瓶貯年份特征標(biāo)記物的篩選
3 結(jié)論