梁俊發(fā),吳文林,陳代偉,萬渝平,涂松林,陳 然,羅曼妮,曾 苑,葉 玲,王志雄,區(qū)碩俊
(1.廣州質(zhì)量監(jiān)督檢測研究院食品檢驗部,廣東廣州 511447;2.成都市食品藥品檢驗研究院,四川成都 610100)
?
基于FT-IR結(jié)合PCA-LDA的白酒真?zhèn)舞b別方法
梁俊發(fā)1,2,吳文林2,*,陳代偉2,萬渝平2,涂松林2,陳然1,羅曼妮1,曾苑1,葉玲1,王志雄1,區(qū)碩俊1
(1.廣州質(zhì)量監(jiān)督檢測研究院食品檢驗部,廣東廣州 511447;2.成都市食品藥品檢驗研究院,四川成都 610100)
運用傅里葉變換紅外光譜法(FT-IR)采集白酒的紅外光譜圖,并采用主成分分析法(Principal Component Analysis,PCA)對白酒紅外光譜數(shù)據(jù)進行降維處理,提取累積方差貢獻率達到99%以上的主成分作為建模參數(shù),結(jié)合線性判別分析法(Linear Discriminant Analysis,LDA)建立基于白酒紅外光譜全波段、指紋區(qū)和一階導(dǎo)數(shù)譜的白酒真?zhèn)舞b別模型。結(jié)果顯示,采用白酒紅外光譜全波段數(shù)據(jù)所建立的白酒真?zhèn)舞b別模型的精度更高,其初始判別準確率為95.6%,交叉驗證實驗中的判別準確率為91.4%,對測試集中30組樣本的判別正確率為86.7%。本研究可以為白酒的真?zhèn)舞b別提供技術(shù)參考。
白酒,真?zhèn)舞b別,主成分分析法,線性判別分析法,FT-IR
傳統(tǒng)的白酒真?zhèn)舞b別方法主要依靠品酒師憑借感官品評或者識別碼、防偽標識等方式防偽[1]。但近年來,隨著分析技術(shù)的發(fā)展和對白酒微量香味成分的深入研究,一些現(xiàn)代分析技術(shù),特別是光譜技術(shù)[2-4]、色譜技術(shù)[5-6]、質(zhì)譜技術(shù)[7-8]、陣列傳感器[9]和同位素方法[10]等已經(jīng)廣泛應(yīng)用于白酒的生產(chǎn),質(zhì)量控制,安全監(jiān)督等環(huán)節(jié)當中。
物質(zhì)的紅外光譜圖能夠體現(xiàn)復(fù)雜混合的特征性,同時,具有快速分析、無損檢測等特點[11],在食品與中藥等行業(yè)的相關(guān)檢測中得到廣泛的運用[12-14]。因此,本文以水井坊井臺裝白酒作為研究對象,運用FT-IR對白酒樣品的干燥物進行分析,采用主成分分析法對其紅外光譜數(shù)據(jù)進行降維處理,結(jié)合線性判別分析法,研究基于FT-IR的白酒真?zhèn)舞b別方法。
1.1材料與儀器
水井坊井臺裝白酒、五糧液白酒、郎酒、瀘州老窖及劍南春白酒、五津醇白酒一共100個樣品生產(chǎn)企業(yè)。具體樣品信息見表1。
表1 白酒樣品信息Table 1 Samples information
傅里葉變換紅外光譜儀美國Thermo Fisher Nicolet 6700;溴化鉀鹽窗,DTGS檢測器,掃描次數(shù)為32次,光譜分辨率4 cm-1,波數(shù)范圍400~4000 cm-1;YP-2壓片機天津天光光學(xué)儀器有限公司。
1.2樣品制備
取10 mL白酒樣品與500 mg光譜純溴化鉀晶體置于蒸發(fā)皿中混勻干燥,將白酒干燥物轉(zhuǎn)移至稱樣瓶中,用封口膠密封,待測。
取2 mg處理好的白酒干燥物與純溴化鉀晶體200 mg放入瑪瑙研缽中進行研磨,壓片,進行FT-IR測定。
1.3紅外光譜數(shù)據(jù)處理
在采集白酒樣品的紅外光譜圖過程中,由于儀器本身的穩(wěn)定情況、溴化鉀顆粒的大小、測定環(huán)境等因素的干擾,紅外光譜圖上會出現(xiàn)基線漂移、噪聲大、光散射現(xiàn)象等[14-15]。如果直接采用白酒樣品的原始數(shù)據(jù)去建立鑒別模型,勢必會很大程度上影響模型的判別精度,因此,有必要采用適當?shù)姆椒▽Π拙频募t外光譜圖進行前處理。在本文中,對白酒紅外光譜數(shù)據(jù)進行基線校正、平滑及歸一化處理,并在OMNIC中生成一階導(dǎo)數(shù)譜。
1.4數(shù)據(jù)分析
將白酒樣品的紅外光譜相關(guān)數(shù)據(jù)直接作為建?;A(chǔ)數(shù)據(jù),計算量會非常大,且會稀釋模型的精度。因此,本文采用PCA法對其進行降維處理,消除信息重疊問題。另外,提取累計方差達到99%以上的主成分作為建模參數(shù),隨機抽取21組水井坊井臺裝白酒和49組其他白酒作為鑒別模型的訓(xùn)練集,其余的30組白酒作為測試集,取水井坊井臺裝白酒的分類變量值為1,其他品牌白酒的分類變量值為2,運用線性判別分析法建立相關(guān)真?zhèn)舞b別模型。
2.1白酒的紅外光譜圖分析
綜上,在不同白酒中,由于特征風味物質(zhì)種類的不同或其含量的差異,在紅外光譜上得到了體現(xiàn)。因此,基于紅外光譜的白酒真?zhèn)舞b別具有了理論上的可行性。
圖1 不同品牌白酒紅外光譜圖比較Fig.1 The comparison of infrared spectrogram in difference brand liquor
2.2白酒真?zhèn)舞b別模型
2.2.1基于白酒紅外光譜全波段鑒別模型將前處理后的白酒紅外光譜全波段數(shù)據(jù)作為建?;A(chǔ)數(shù)據(jù),按照1.4節(jié)的數(shù)據(jù)分析方法,建立基于白酒紅外光譜全波段的真?zhèn)舞b別模型。該模型對建模樣本的分類結(jié)果見表2。
表2 分類結(jié)果Table 2 Classification results
在初始分類中,20組水井坊井臺裝白酒都被正確分類,1組樣品被誤判;在49組其他品牌白酒中,有2組樣本被誤判,總的初始正確判別率達到了95.6%。在交叉驗證實驗中,只有6組其他白酒被誤判,交叉驗證實驗的總正確判別率達到91.4%。
運用測試集樣品對該模型的準確性進行驗證,由組質(zhì)心處函數(shù)可知,類別1的投影中心點為2.573,類別2的投影中心點為-0.284,根據(jù)投影距離的判別規(guī)則,對30組新樣本進行判別,結(jié)果顯示,有4組白酒樣本被誤判,正確判別率為86.7%。
2.2.2基于白酒紅外光譜指紋區(qū)鑒別模型由于不同白酒干燥物的紅外光譜在2000~4000 cm-1差別不大,其差異主要集中在400~1330 cm-1指紋區(qū),另外400~500 cm-1也沒有明顯的差異。因此,本節(jié)只截取500~1330 cm-1的數(shù)據(jù)作為基礎(chǔ)樣本數(shù)據(jù),按照1.4節(jié)的數(shù)據(jù)分析方法,建立基于白酒紅外光譜指紋區(qū)數(shù)據(jù)的鑒別模型,該模型對建模樣本的分類結(jié)果見表3。
表3 分類結(jié)果Table 3 Classification results
在初始分類中,有1組水井坊井臺裝白酒及3組其他品牌白酒樣品被誤判,總初始正確判別率為94.2%。在交叉驗證實驗中,有2組水井坊井臺裝白酒及5組其他品牌白酒樣本被誤判,交叉驗證實驗的總正確判別率只有90.2%,低于全波段鑒別模型,說明白酒紅外光譜的指紋區(qū)對白酒的真?zhèn)舞b別貢獻更大。
由組質(zhì)心處的函數(shù)可知,基于白酒紅外光譜指紋區(qū)的鑒別模型中,類別1的投影中心點為2.683,類別2的投影中心點為-0.512。根據(jù)新樣本的判別得分與類別的投影中心距離最小原則,對30組測試集樣品進行鑒別,結(jié)果有5組樣本被誤判,正確判別率為83.3%。
2.2.3基于白酒紅外光譜一階導(dǎo)數(shù)譜的鑒別模型一階導(dǎo)數(shù)譜可以增強原始光譜的特征。在本文中,采用OMNIC軟件把歸一化處理后的100組白酒紅外光譜圖轉(zhuǎn)化為一階導(dǎo)數(shù)譜圖,圖2展示了6種不同白酒紅外光譜一階導(dǎo)數(shù)譜圖。從中可以發(fā)現(xiàn),1800~4000 cm-1之間,不同白酒的差異較小,而在1800~500 cm-1的特征性較強。因此,本文采用白酒1800~500 cm-1一階導(dǎo)數(shù)光譜數(shù)據(jù)用于白酒的真?zhèn)舞b別研究,按照1.4節(jié)的數(shù)據(jù)分析方法,建立基于白酒紅外光譜一階導(dǎo)數(shù)光譜數(shù)據(jù)的鑒別模型,該模型對建模樣本的分類結(jié)果見表4。
圖2 白酒樣品的一階導(dǎo)數(shù)光譜Fig.2 The first derivative spectroscopy of liquor samples
類別預(yù)測組成員12合計初始計數(shù)%119221224749190.59.5100.024.195.9100.0交叉驗證計數(shù)%1201212113849195.24.8100.0222.477.6100.0
在初始的分類中,水井坊井臺裝白酒和其他品白酒中各有2組樣本被誤判,總的初始正確判別率達到96.0%;但在交叉驗證實驗中,有1水井坊井臺裝白酒和11組其他品牌白酒被誤判,總的交叉驗證正確判別率只有86.4%。比較全波段模型和指紋區(qū)模型,一階導(dǎo)數(shù)譜模型的判別精度最差,說明對白酒紅外光譜圖進行一階導(dǎo)數(shù)處理之后,不同類別白酒的紅外特征性不顯著。
由組質(zhì)心處的函數(shù)可知,基于白酒紅外譜一階導(dǎo)數(shù)譜的鑒別模型中,類別1的投影中心點為2.486,類別2的投影中心點為-0.979,根據(jù)待判樣本的投影點與中心投影點距離最小原則,對30組測試集樣本進行鑒別,結(jié)果有7組樣本被誤判,正確判別率只有76.7%。
本文運用FT-IR結(jié)合線性判別分析法,建立基于白酒紅外光譜全波段、指紋區(qū)和一階導(dǎo)數(shù)譜的白酒真?zhèn)舞b別模型。比較了以上3種模型的判別效果,采用白酒紅外光譜的全波段數(shù)據(jù)所建立的水井坊井臺裝白酒真?zhèn)舞b別模型的精度最高;白酒紅外光譜的指紋區(qū)信息對鑒別模型的貢獻不及全波段模型;而一階導(dǎo)數(shù)處理之后,白酒特征性降低。本研究可以為白酒的真?zhèn)舞b別提供技術(shù)參考。
[1]袁潔,尹京苑,高海燕. 指紋圖譜在白酒中的應(yīng)用研究進展[J]. 食品科學(xué),2009,29(11):680-684.
[2]Friedel M,Patz C D,Dietrich H. Comparison of different measurement techniques and variable selection methods for FT-MIR in wine analysis.[J]. Food Chemistry,2013,141(4):4200-4207.
[3]Wu Z,Xu E,Long J,et al. Monitoring of fermentation process parameters of Chinese rice wine using attenuated total reflectance mid-infrared spectroscopy[J]. Food Control,2015,50:405-412.
[4]Cozzolino D,Smyth H E,Gishen M. Feasibility Study on the Use of Visible and Near-Infrared Spectroscopy Together with Chemometrics To Discriminate between Commercial White Wines of Different Varietal Origins[J]. J.agric.food Chem,2003,51(26):7703-7708.
[5]Fernández P L,Pablos F,MartíN M J,et al. Multi-element analysis of tea beverages by inductively coupled plasma atomic emission spectrometry. Food Chem[J]. Food Chemistry,2002,76(4):483-489.
[6]王忠彥,尹昌樹. 白酒色譜骨架成分的含量及比例關(guān)系對香型和質(zhì)量的影響[J]. 釀酒科技,2000(6):93-96.
[7]Nagy K,Bongiorno D,Avellone G,et al. High performance liquid chromatography-mass spectrometry based chemometric characterization of olive oils[J]. Journal of Chromatography A,2005,1078(1-2):90-97.
[8]Almeida C M,Vasconcelos M T S D. ICP-MS determination of strontium isotope ratio in wine in order to be used as a fingerprint of its regional origin[J]. Journal of Analytical Atomic Spectrometry,2001,16(6):607-611.
[9]Qin O,Zhao J,Chen Q,et al. Classification of rice wine according to different marked ages using a novel artificial olfactory technique based on colorimetric sensor array[J]. Food Chemistry,2013,138(2-3):1320-1324.
[10]Bot B L,Oulhote Y,Deguen S,et al. Using and interpreting isotope data for source identification[J]. Trac Trends in Analytical Chemistry,2011,30(2):302-312.
[11]Quansheng C,Jiao D,Jianrong C,et al. Rapid measurement of total acid content (TAC) in vinegar using near infrared spectroscopy based on efficient variables selection algorithm and nonlinear regression tools[J]. Food Chemistry,2012,135(2):590-595.
[12]劉景旺,張博洋,李樹峰,等. 近紅外吸收光譜技術(shù)快速檢測奶制品中添加三聚氰胺[J]. 光散射學(xué)報,2010,22(3):291-297.
[13]武曉丹,金哲雄,孫素琴,等. 七種不同產(chǎn)地仙鶴草原藥材及提取物的紅外光譜與二維相關(guān)紅外光譜的分析與鑒定[J]. 光譜學(xué)與光譜分析,2010,30(12):3222-3227.
[14]Shi J Y,Zou X B,Huang X W,et al. Rapid detecting total acid content and classifying different types of vinegar based on near infrared spectroscopy and least-squares support vector machine[J]. Food Chemistry,2013,138(1):192-199.
[15]Shen F,Yang D,Ying Y,et al. Discrimination Between Shaoxing Wines and Other Chinese Rice Wines by Near-Infrared Spectroscopy and Chemometrics[J]. Food & Bioprocess Technology,2012,5(2):786-795.
[16]Sun S Q,Li C W,Wei J P,et al. Discrimination of Chinese Sauce liquor using FT-IR and two-dimensional correlation IR spectroscopy[J]. Journal of Molecular Structure,2006,799(1):72-76.
[17]鄧月娥,孫素琴. FTIR法用于白酒的區(qū)分及真?zhèn)舞b定[J]. 現(xiàn)代儀器,2005,11(5):29-30.
Identification of liquor authenticity based on FTIR with PCA-LDA
LIANG Jun-fa1,WU Wen-lin2,*,CHEN Dai-wei2,WAN Yu-ping2,TU Song-lin2,CHEN Ran1,LUO Man-ni1,ZENG Yuan1,YE Ling1,WANG Zhi-xiong1,OU Shuo-jun1
(1.Guangzhou Quality Supervision and Testing Institute,Guangzhou 511447,China;2.Chengdu food and Drug Inspection Institute,Chengdu 610100,China)
The infrared spectrograms of liquor samples were gathered by FT-IR and principal component analysis was used for datas dimension-reduced processing. The principal components which cumulative variance contribution rate exceed 99% were extracted as the modeling parameters,combined with the discriminant analysis,the liquor authenticity identification model was established based on all wavelengths,fingerprint region and first derivative spectrum of liquors infrared spectroscopy,respectively. The results showed that the discriminant rate of identification model which was established by the all wavelengths data was the highest,the initial discrimination rate was 95.6% and the cross validation test of discriminant rate was 91.4%. The correct discrimination rate of this identification model for the 38 samples in validation set was 86.7%. This study could provide theoretical reference for liquor identification.
liquor authenticity;principal component analysis;linear discriminant analysis;FT-IR
TS207.3
A
1002-0306(2016)15-0309-04
10.13386/j.issn1002-0306.2016.15.051