賈柳君,王健,張海紅*,李子文,李宗朋,熊雅婷
(1.寧夏大學農學院,寧夏銀川750021;2.中國食品發(fā)酵工業(yè)研究院,北京100015)
基于FT-NIR的葡萄酒發(fā)酵過程中揮發(fā)酸的定量分析
賈柳君1,2,王健2,張海紅1*,李子文1,2,李宗朋2,熊雅婷2
(1.寧夏大學農學院,寧夏銀川750021;2.中國食品發(fā)酵工業(yè)研究院,北京100015)
利用近紅外光譜技術對葡萄酒發(fā)酵過程中揮發(fā)酸含量進行定量分析,通過偏最小二乘法建立葡萄酒發(fā)酵過程中揮發(fā)酸定量分析模型,同時采用間隔偏最小二乘法(iPLS)、后向間隔偏最小二乘法(BiPLS)、組合間隔偏最小二乘法(SiPLS)、競爭性自適應重加權算法(CARS)對整個譜區(qū)進行光譜特征變量篩選。以決定系數(shù)(R2)、校正標準偏差(RMSEC)、預測標準偏差(RMSEP)、相對分析誤差(RPD)以及最佳主因子數(shù)為模型質量的評價指標。結果表明:進行變量篩選可對模型起到優(yōu)化作用,提高識別精度,降低模型解析難度。其中CARS對模型的優(yōu)化效果最佳,優(yōu)化模型的決定系數(shù)R2達到0.868,RMSEC為0.033,RMSEP為0.032,RPD為5.31,有效簡化了模型復雜程度,提高了模型穩(wěn)定性和預測能力。
葡萄酒;揮發(fā)酸;近紅外光譜技術;定量分析;波段篩選
葡萄酒以其豐富的營養(yǎng)成分,獨特濃郁的香味聞名于世界,深受消費者的喜愛[1]。如今隨著葡萄酒市場的發(fā)展,消費者對葡萄酒的質量有了更高的要求,而葡萄酒發(fā)酵過程中各項指標的變化對葡萄酒品質有著極為重要的影響,因此,釀酒企業(yè)對于葡萄酒發(fā)酵過程中各參數(shù)的實時監(jiān)測尤為重視[2]。其中,葡萄酒發(fā)酵過程中揮發(fā)酸含量的變化,會對葡萄酒的風味及品質產(chǎn)生較大影響,隨著揮發(fā)酸含量的增加,葡萄酒的酸味會逐漸增強,出現(xiàn)酸味壓制其他味覺特征,成為主要味覺的現(xiàn)象,當揮發(fā)酸含量過高時,會導致葡萄酒很快喪失其特有的營養(yǎng)和風味特征,品質變差[3-4]。因此,實時檢測揮發(fā)酸含量極其重要。而目前檢測揮發(fā)酸含量的傳統(tǒng)方法操作步驟繁多,過程復雜,費時費力,很難進行大量樣品的在線快速檢測,存在監(jiān)測信息滯后,不具實時性等缺點[5]。因此,為了保證葡萄酒品質,尋找一種快速、準確的在線檢測方法對葡萄酒發(fā)酵過程中揮發(fā)酸含量進行實時監(jiān)測尤為迫切和重要。
近紅外光譜技術具有分析速度快、檢測效率高、操作簡便、無需前處理且無污染、可完成生產(chǎn)過程的實時監(jiān)測等優(yōu)點,已應用到了食品、化工、藥品、釀酒等許多行業(yè)[6]。目前,在葡萄酒快速檢測方面,國內外學者進行了大量的研究。張樹明等[7]用近紅外光譜法結合化學計量學方法對葡萄酒發(fā)酵過程中葡萄糖、果糖、甘油、乙醇四個指標進行了定量分析,比較了主成分回歸和偏最小二乘回歸模型的預測能力。URBANO C M等[8]用近紅外光譜法對葡萄酒發(fā)酵過程中的多個指標進行分析檢測,采用偏最小二乘法和交互驗證等方法建立模型,其中酒精度、總酸、pH值、乳糖等指標的判別系數(shù)>0.8。王豪等[9]用近紅外光譜法對葡萄酒進行測定,利用偏最小二乘法建立了葡萄酒中酒精度的回歸模型,模型的準確度高。以上研究均表明了近紅外光譜技術可用于葡萄酒發(fā)酵過程中主要參數(shù)的檢測,但在葡萄酒發(fā)酵過程中揮發(fā)酸指標的近紅外研究較少,且未深入優(yōu)化模型。
本研究擬對葡萄酒發(fā)酵過程中揮發(fā)酸含量進行快速無損檢測,探討分析間隔偏最小二乘法(interval partial least square,iPLS)、后向間隔偏最小二乘法(backward interval partial least square,BiPLS)、組合間隔偏最小二乘法(synergy interval partial least square,SiPLS)、競爭性自適應重加權算法(competitive adaptive reweighted sampling,CARS)對葡萄酒發(fā)酵過程中揮發(fā)酸定量回歸模型效果的影響,期望為葡萄酒發(fā)酵過程中揮發(fā)酸含量的在線檢測提供一定參考依據(jù)。
1.1材料與試劑
本試驗所用葡萄酒發(fā)酵液樣品共356個,由某葡萄酒企業(yè)提供,采用透反射方式掃描采集葡萄酒發(fā)酵液的近紅外光譜。葡萄酒發(fā)酵液中揮發(fā)酸含量根據(jù)國標GB/T 15038—2006《葡萄酒、果酒通用分析方法》,采用堿標準溶液滴定,再測定游離二氧化硫和結合二氧化硫,通過計算與修正得出。
1.2儀器與設備
Buchi N-500傅立葉變換近紅外光譜儀:瑞士步琦有限公司;光譜儀光源為鹵鎢燈,檢測器為溫控InGaAs,配有高性能測量杯及透反射蓋。光譜范圍為4000~10000cm-1,分辨率為8 cm-1,掃描次數(shù)為32次;利用配套軟件NIRWare Operator采集葡萄酒發(fā)酵液樣品的近紅外光譜信息。
1.3方法
1.3.1校正集與驗證集的劃分
在隨機保留50個葡萄酒發(fā)酵液樣本作為獨立測試集的基礎上,采用Kennard-Stone(K-S)法[10]以2∶1的比例將剩余306個樣品進行樣本集和驗證集的劃分。選擇校正集樣本204個,驗證集樣本102個。校正集與驗證集的揮發(fā)酸值統(tǒng)計如表1所示。
表1 校正集與驗證集統(tǒng)計結果Table 1 Statistical results of calibration set and validation set
1.3.2光譜預處理
為了消除近紅外光譜中的干擾因素對模型的影響,提高模型穩(wěn)定性與準確度,本實驗采用標準正態(tài)變量變換(standardized normal variate,SNV)對光譜進行預處理。
1.3.3光譜變量選擇
為了剔除無信息變量,降低模型簡析難度,提升模型穩(wěn)定性和準確度,本實驗分別采用iPLS、BiPLS和SiPLS、 CARS法對全光譜1 501個變量進行優(yōu)化選擇,并結合偏最小二乘法(partial least square,PLS)法建立模型。選取決定系數(shù)(R2)、校正標準偏差(root mean square error of cross,RMSEC)、預測標準偏差(root mean square error of prediction,RMSEP)、相對分析誤差(relative percent deviation,RPD)以及最佳主因子數(shù)來評價模型穩(wěn)定性與預測能力[11]。決定系數(shù)R2越接近1,RMSEC與RMSEP越接近并且越小,則表明建立的模型效果越好,并且RPD一般>3[12]。
1.3.4數(shù)據(jù)處理與分析
iPLS、BiPLS、SiPLS、CARS等程序均在MATLAB環(huán)境下運行,偏最小二乘計算應用Unscrambler X10.3光譜分析軟件(挪威CAMO公司)實現(xiàn)。
2.1光譜波段優(yōu)選
2.1.1間隔偏最小二乘波段選擇法優(yōu)選特征變量
iPLS是將全光譜劃分為k個均勻子區(qū)間,在每個子區(qū)間建立PLS模型,選擇預測精度最高的回歸模型所在的子區(qū)間為建模區(qū)間的方法[13]。本實驗k的范圍為10~40,間隔為5。經(jīng)計算得出k為10時,iPLS得到的交叉驗證均方差(root mean square error of cross validation,RMSECV)值最小,為0.054 7,波段篩選結果如圖1所示,圖1中縱坐標表示各波段交叉驗證均方差(RMSECV),虛線則表示全光譜區(qū)建模時的RMSECV值。因此本實驗挑選處于虛線以下的第3、4、5、6、7號波段建模。優(yōu)化后模型所用到的變量數(shù)為750個,僅占全光譜的50%。
圖1 各區(qū)間模型與全譜模型的RMSECV值比較Fig.1 Comparison of RMSECV between interval model and full spectrum model
2.1.2后向間隔偏最小二乘波段選擇法優(yōu)選特征區(qū)間
BiPLS是在全光譜劃分成k個均勻子區(qū)間的情況下,每次去掉一個RMSECV值最大的子區(qū)間,在剩余區(qū)間建立模型,得到RMSECV值,重復進行至剩余一個子區(qū)間,最終選擇RMSECV值最小的區(qū)間組合來建立模型[14]。經(jīng)計算得出k為10時,BiPLS得到的RMSECV值最小,為0.045 2,波段篩選結果如表2所示,選擇[2、10、9、8]波段建模。經(jīng)篩選后所得變量數(shù)為600個,僅占全光譜的40%。
表210 個區(qū)間數(shù)的BiPLS優(yōu)化結果Table 2 Optimized results of BiPLS in 10 intervals
2.1.3組合間隔偏最小二乘波段選擇法優(yōu)選特征區(qū)間
SiPLS是將全光譜劃分成k個均勻子區(qū)間后,組合不同區(qū)間個數(shù)并建模,最終選擇相關系數(shù)最大且RMSECV值最小的組合區(qū)間進行建模[15]。本實驗k的范圍為10~40,間隔為5,組合數(shù)范圍為1~4。經(jīng)計算得出k為10時,SiPLS得到的RMSECV值最小,為0.042 8,波段篩選結果如表3所示,選擇[5、7、8、9]組合波段建模。篩選所得變量數(shù)僅為600個,占全光譜的40%。
2.1.4競爭性自適應重加權算法優(yōu)選特征區(qū)間
表310 個區(qū)間數(shù)的SiPLS優(yōu)化結果Table 3 Optimized results of SiPLS in 10 intervals
CARS在進行變量篩選時,保留回歸系數(shù)絕對值大的變量,剔除回歸系數(shù)絕對值小的變量,重復運行篩選出最佳變量子集[16]。圖2(a)表示隨著運行次數(shù)增加,變量數(shù)的下降趨勢由前段快速減少到后段逐漸平緩,反映了CARS的“粗選”和“精選”過程;圖2(b)表示交互驗證均方差的變化趨勢,前68次運行中RMSECV值逐漸減小,為0.040 8,68次之后呈逐漸增大的趨勢,這是因為在運行68次時已基本剔除了與揮發(fā)酸含量無關的變量,其后開始剔除相關變量,導致出現(xiàn)RMSECV值增大的現(xiàn)象;圖2(c)表示回歸系數(shù)的變化趨勢,與“*”相對的點為RMSECV值的最低點[17-19]。經(jīng)CARS法篩選所得變量數(shù)為37個,如圖3所示,僅占全光譜的2.5%。
圖2CARS法關鍵變量選擇結果Fig.2 Key variable selection results by CARS method
圖3CARS篩選的波數(shù)變量分布Fig.3 Distribution diagram of variables selected by CARS
2.2模型建立與評價
經(jīng)過上述四種方法的篩選,分別建立葡萄酒發(fā)酵過程中揮發(fā)酸的全光譜-PLS,iPLS、BiPLS、SiPLS、CARS-PLS定量模型,并對決定系數(shù)(R2)、校正標準偏差(RMSEC)、預測標準偏差(RMSEP)、相對分析誤差(RPD)以及最佳主因子數(shù)進行比較,來評價模型效果,模型優(yōu)化結果如表4所示。
表4 揮發(fā)酸的不同PLS模型及性能評價結果Table 4 Different PLS models and performance evaluation results of volatile acids
從表4可看出,與全光譜建模相比,采用上述四種方法進行變量篩選后,建模所用變量數(shù)均有不同程度的減少,模型識別精度提高,解析難度降低,決定系數(shù)R2相對增加,RMSEP相對減小,最佳主因子數(shù)相對降低,模型質量均達到不同程度的優(yōu)化。iPLS雖然減少了建模變量數(shù),簡化了建模的復雜程度,但由于只篩選得到單個子區(qū)間進行建模,容易遺漏其他區(qū)間的有效信息,導致建模所用變量信息不夠充分。BiPLS、SiPLS則通過將相關性大的子區(qū)間進行優(yōu)化組合建模,去除信息冗余的區(qū)間,使得建模所用光譜更加全面有效,模型的精度更高[20]。其中CARS在剔除無信息變量的同時,淘汰了光譜中共線性變量及受外界因素影響較大的變量,優(yōu)選出最能表征目標信息的關鍵性變量,有效地簡化了模型復雜程度,提高了模型信噪比。
采用CARS篩選后所得變量建立的葡萄酒發(fā)酵過程中揮發(fā)酸定量模型的優(yōu)化效果最為理想,建模所用變量數(shù)最少,決定系數(shù)R2達到0.868,RMSEC為0.033,RMSEP為0.032,RPD為5.31。同時,CARS篩選得到的變量包含了成分中C—O、C=O、C—H、O—H等官能團的主要吸收區(qū)域,其中,6 500 cm-1歸屬為OH伸縮振動和C—H伸縮振動的組合頻,6 920 cm-1處的尖吸收峰是羧酸單體非鍵合或游離OH伸縮振動的一級倍頻吸收,8 070 cm-1是O—H伸縮振動和C=O伸縮振動一級倍頻的組合頻等,反映出葡萄酒發(fā)酵過程中揮發(fā)酸的特征波數(shù)[21]。
2.3模型驗證
將獨立樣本測試集中50個樣品的光譜通過CARS模型進行驗證,如圖4所示,各參數(shù)的實測值與預測值點呈現(xiàn)對角線分布,且經(jīng)成對t檢驗,各參數(shù)的預測值與實測值無顯著差異。經(jīng)驗證,葡萄酒發(fā)酵過程中揮發(fā)酸決定系數(shù)R2為0.871 2,RMSEP為0.033 2,說明模型的預測結果較為準確。
圖4 揮發(fā)酸CARS模型實測值與預測值分布Fig.4 Measured values and predicted values distribution of volatile acid in CARS model
本文分別采用間隔偏最小二乘法(iPLS)、后向間隔偏最小二乘法(BiPLS)、組合間隔偏最小二乘法(SiPLS)、競爭性自適應重加權算法(CARS)對光譜特征變量進行篩選,得出以下結論:
(1)結合上述四種波段篩選方法,分別建立葡萄酒發(fā)酵過程中揮發(fā)酸定量分析模型,模型質量均有所優(yōu)化,不僅降低了模型的復雜程度,同時大幅提升了模型的穩(wěn)定性和預測能力,證明了近紅外光譜技術在葡萄酒發(fā)酵過程中揮發(fā)酸定量分析方面的可行性和巨大潛力,同時說明了變量篩選對模型優(yōu)化的重要性。
(2)采用CARS法進行波段篩選后所建模型的效果優(yōu)于其余三種方法,在保留揮發(fā)酸特征波長區(qū)間的同時剔除大量冗余信息,達到變量優(yōu)選并提高模型預測精度的目的,同時篩選得到的變量與揮發(fā)酸在近紅外區(qū)域中的特征吸收峰相對應,反映了該指標所含主要基團。因此,利用CARS法結合PLS法建立模型,可實現(xiàn)對葡萄酒發(fā)酵過程中揮發(fā)酸進行快速、實時、準確、無損檢測的要求,并為該指標的在線檢測提供一定參考依據(jù)。
[1]高年發(fā).葡萄酒生產(chǎn)技術[M].第2版.北京:化學工業(yè)出版社,2012:1.
[2]張紅梅,曹晶晶.中國葡萄酒產(chǎn)業(yè)的現(xiàn)狀和趨勢及可持續(xù)發(fā)展對策[J].農業(yè)現(xiàn)代化研究,2014,35(2):183-187.
[3]張琳.傅立葉變換紅外光譜法快速測定葡萄酒理化指標[D].廣州:暨南大學,2012.
[4]袁偉,王全林,應璐.利用自動定氮儀測定葡萄酒中揮發(fā)酸[J].分析儀器,2008,30(2):31-33.
[5]張樹明,楊陽,倪元穎.近紅外光譜和電子鼻技術用于葡萄酒發(fā)酵過程中酒精度的定量分析[J].光譜學與光譜分析,2012,32(11):2997-3001.
[6]邵春甫,李長文,王珊,等.紅外光譜技術在中國釀酒行業(yè)中的應用研究進展[J].中國釀造,2013,32(4):15-19.
[7]張樹明,楊陽,梁學軍.葡萄酒發(fā)酵過程主要參數(shù)近紅外光譜分析[J].農業(yè)機械學報,2013,57(1):152-156.
[8]URBANO CUADRADO M,CASTRO L D,PEREZ-JUAN P M,et al. Near infrared reflectance spectroscopy and multivariate analysis in enology:Determination or screening of fifteen parameters in different types of wines[J].Anal Chim Acta,2004,527(1):81-88.
[9]王豪,鄔蓓蕾,林振興.傅立葉變換近紅外光譜法快速測定葡萄酒中的酒精度[J].中國釀造,2008,27(4):72-74.
[10]褚小立.化學計量學方法與分子光譜分析技術[M].北京:化學工業(yè)出版社,2011:4.
[11]嚴衍祿,陳斌,朱大洲.近紅外光譜分析的原理、技術與應用[M].北京:中國輕工業(yè)出版社,2013:165-174
[12]李子文,熊雅婷,張海紅.近紅外光譜技術結合遺傳算法用于蘋果醋總酸定量分析[J].食品與發(fā)酵工業(yè),2016,47(1):195-199.
[13]NRGAARD L,SAUDLAND A,WAGNER J,et al.Interval partial least squares regression(iPLS):a comparative chemometric study with an example from near-infrared spectroscopy[J].Appl Spectrosc,2000,54(3): 413-419.
[14]石吉勇,鄒小波,趙杰文.BiPLS結合模擬退火算法的近紅外光譜特征波長選擇研究[J].紅外與毫米波學報,2011,30(5):458-462.
[15]彭海根,彭云發(fā),詹映.近紅外光譜技術結合聯(lián)合區(qū)間間隔偏最小二乘法對南疆紅棗糖度的測定[J].食品科技,2014,40(6):276-280.
[16]張華秀,李曉寧,范偉.近紅外光譜結CARS變量篩選方法用于液態(tài)奶中蛋白質與脂肪含量的測定[J].分析測試學報,2010,29(5):430-434.
[17]孫通,許文麗,林金龍.可見/近紅外漫透射光譜結合CARS變量優(yōu)選預測臍橙可溶性固形物[J].光譜學與光譜分析,2012,32(12):3229-3233.
[18]熊雅婷,李宗朋,王健.近紅外光譜波段優(yōu)化在白酒酒醅成分分析中的應用[J].光譜學與光譜分析,2016,36(1):84-90.
[19]劉燕德,施宇,蔡麗君.基于CARS算法的臍橙可溶性固形物近紅外在線檢測[J].農業(yè)機械學報,2013,44(9):138-144.
[20]張德濤,鄒小波,石吉勇.近紅外光譜結合不同偏最小二乘法快速檢測鎮(zhèn)江香醋的渾濁度[J].中國釀造,2012,31(1):169-172.
[21]JERRY W,JRLOIS W.近紅外光譜解析實用指南[M].北京:化學工業(yè)出版社,2009:50-55.
Quantitative analysis of volatile acid in wine fermentation by near infrared spectroscopy technology
JIA Liujun1,2,WANG Jian2,ZHANG Haihong1*,LI Ziwen1,2,LI Zongpeng2,XIONG Yating2
(1.College of Agriculture,Ningxia University,Yinchuan 750021,China; 2.China National Research Institute of Food&Fermentation Industries,Beijing 100015,China)
The volatile acid content during wine fermentation was quantitatively analyzed by near infrared spectroscopy technology,and the quantitative analysis model was established by partial least squares.The characteristic variable was selected from the whole spectrum area using iPLS,BiPLS, SiPLS and CARS.R2,RMSEC,RMSEP,PRD and the optimal main factors were used for model evaluation.The results showed that variable screening can optimize the effect of the model,improve recognition accuracy and reduce the difficulty of model analysis.The optimization effect of CARS model was the optimal.R2of the optimized mode,RMSEC,RMSEP,and RPD were 0.868,0.033,0.032,and 5.31,respectively.The methods simplified the model complexity,and improved model stability and prediction ability.
wine;volatile acid;near infrared spectroscopy;quantitative analysis;band selection
0254-5071(2016)10-0166-05
10.11882/j.issn.0254-5071.2016.10.037
2016-05-16
科技部科研院所技術開發(fā)研究專項(2013EG111212)
賈柳君(1992-),女,碩士研究生,研究方向為農產(chǎn)品無損檢測。
張海紅(1967-),女,教授,碩士,研究方向為農產(chǎn)品無損檢測。