王丙濤,陳 波,涂小珂,顏 治,靳保輝,林燕奎,謝麗琪
(深圳出入境檢驗檢疫局,深圳市食品安全檢測技術(shù)研發(fā)重點實驗室,廣東 深圳 518045)
葡萄酒中元素分布與其原產(chǎn)地關(guān)系的分類模型
王丙濤,陳 波,涂小珂,顏 治,靳保輝,林燕奎,謝麗琪
(深圳出入境檢驗檢疫局,深圳市食品安全檢測技術(shù)研發(fā)重點實驗室,廣東 深圳 518045)
為了解決進(jìn)口葡萄酒來源復(fù)雜,原產(chǎn)地難鑒別的問題,使用電感耦合等離子體質(zhì)譜檢測葡萄酒中的元素含量,采用偏最小二乘法建立聚類分類模型用于原產(chǎn)地鑒別。電感耦合等離子體質(zhì)譜檢測了澳大利亞、智利、法國、意大利和西班牙5個國家的100份葡萄酒中的41種元素,通過變量兩兩相乘進(jìn)行擴(kuò)維,偏最小二乘法變量篩選方法對擴(kuò)維后的大量變量進(jìn)行處理,刪除冗余變量和影響不顯著的變量,建立了聚類分析模型,模型可以很好地將各國葡萄酒樣品區(qū)分,分辨準(zhǔn)確率在96%以上。將來自5個國家的99份和南非的11份葡萄酒樣品檢測數(shù)據(jù)代入模型,判別結(jié)果令人滿意。
葡萄酒;元素;分類模型;原產(chǎn)地
2009年以來中國葡萄酒進(jìn)口量突飛猛進(jìn),中國已經(jīng)成為世界上第五大葡萄酒消費國。2011年葡萄酒的進(jìn)口均價為3.89美元每升,市場平均售價為進(jìn)口均價的10倍以上,巨額的利潤導(dǎo)致大量假冒紅酒進(jìn)入市場,特別是名牌葡萄酒,如拉菲,國內(nèi)一年的消費量居然超出拉菲年產(chǎn)量的10倍以上,顯而易見至少90%以上的拉菲都是假酒。每年的糖酒交易會上,各種假冒紅酒登堂入室,令國內(nèi)市場十分混亂。但怎樣才能遏制這種假貨泛濫的現(xiàn)象,除了加強市場監(jiān)管外,關(guān)鍵還要從技術(shù)上鑒別假酒。
利用葡萄酒中的有機化合物[1-4]、花青素[5]、同位素比[6-9]、穩(wěn)定同位素[10-11]、甚至DNA分析[12]等方法鑒定葡萄酒的真實產(chǎn)地報道較多,同時葡萄酒中含有豐富的常量元素和微量元素,這些元素的存在對葡萄酒的感官質(zhì)量和穩(wěn)定性以及葡萄酒的品質(zhì)有著至關(guān)重要的影響,產(chǎn)地地球化學(xué)元素的配置直接影響葡萄中的元素分布,多元素含量作為變量的指紋分析技術(shù)也有用于產(chǎn)地鑒定的報道[13-14]。Baxter等[15]最早報道了使用電感耦合等離子體-質(zhì)譜(inductively coupled plasma-mass spectrometry,ICPMS)測定葡萄酒中的多種元素含量,使用多元統(tǒng)計分析技術(shù)來確定葡萄酒的原產(chǎn)地域。面對大批量來自世界各地的葡萄酒,采用ICP-MS檢測研究了幾個主要進(jìn)口國家葡萄酒中的元素分布,通過偏最小二乘法聚類分析,找出葡萄酒產(chǎn)地與特征元素相關(guān)性信息,建立葡萄酒原產(chǎn)地聚類分析鑒別模型,為葡萄酒的產(chǎn)地鑒定提供技術(shù)手段和數(shù)據(jù)基礎(chǔ)。
1.1 樣品來源和分布
樣品來自5個不同的國家和地區(qū),共計199份,其中法國45份、意大利41份、西班牙37份、智利36份、澳大利亞40份,所有的樣品均采集自深圳各出入境口岸正規(guī)手續(xù)進(jìn)口樣品。由于不同國家葡萄酒風(fēng)格或者釀造工藝的區(qū)別,在所采集的樣品中既有單葡萄品種葡萄酒,又有含多種葡萄品種的混合型葡萄酒,葡萄酒樣品相關(guān)的國家和產(chǎn)區(qū)、葡萄品種信息見表1。
表1 5個國家葡萄酒樣品的具體產(chǎn)地信息Table1 The geographical origin of wines samples from five foreign countries
1.2 試劑與儀器
K、Na、Ca、Mg、Fe、Cu、Mn、Zn、B、Al、V、Cr、Ba、Rb、Sr、Pb、Li、Co、Ni、As、Se、Mo、Cd、Ce、Ti等各單元素國家標(biāo)準(zhǔn)溶液以及15種稀土元素混合國家標(biāo)準(zhǔn)溶液,質(zhì)量濃度在10~1 000 mg/L。其他試劑均為優(yōu)級純或分析純。
Xseries2電感耦合等離子體質(zhì)譜儀 美國熱電公司。
1.3 方法
1.3.1 儀器參數(shù)設(shè)定
功率:1 400 W;霧化器:Bremen;霧化氣流速:0.85 mL/min;冷卻氣流速:14.2 L/min;輔助氣流速:0.8 L/min;采樣深度:150;脈沖電壓:3 380 V;模擬電壓:1 800 V。
1.3.2 樣品前處理
使用移液槍準(zhǔn)確吸取待測樣品溶液0.5 mL(精確至0.01 mL)至15 mL比色管中,加入等量的硝酸,靜置消解1~2 h后,去離子水定容,上機測定。同樣方法配制試劑空白。
2.1 ICP-MS分析
采用ICP-MS檢測所有樣本中的K、Na、Ca、Mg、 Fe、Cu、Mn、Zn、B、Al、V、Cr、Ba、Rb、Sr、Pb、Li、Co、Ni、As、Se、Y、Mo、Cd、Ce、Ti以及15種稀土元素等共計41種元素含量。結(jié)果顯示,不同元素之間含量相差很大,K含量很高,基本都在1 000 mg/L以上,Na、Ca、Mg含量在幾十到幾百mg/L范圍內(nèi),F(xiàn)e、Mn、B、Rb含量一般在幾個mg/L,Zn、Cu、Ba、Sr等含量稍低,一般為幾百μg/L,其他一些元素含量更低,甚至屬于痕量范圍,見表2。要從如此大量 的數(shù)據(jù)中分析出各來源國葡萄酒的特征信息,采用常規(guī)的統(tǒng)計方法根本無法實現(xiàn)。
表2 一些元素的ICP-MS檢測結(jié)果Table 2ble 2 ICP-MS analytical results for 27 elements in imported wines
2.2 偏最小二乘法(partial least squares method,PLS)
對葡萄酒中的有效成分進(jìn)行分析后會產(chǎn)生大量的數(shù)據(jù),無論是香氣等有機成分還是元素等常規(guī)理化指標(biāo),僅依靠簡單的數(shù)據(jù)大小無法判別樣品歸類,往往需要采取一定的數(shù)據(jù)統(tǒng)計方法進(jìn)行處理[16-19],建立適當(dāng)?shù)姆诸惸P?,才能將大量?shù)據(jù)簡化成可視化指標(biāo)進(jìn)行判別。
偏最小二乘回歸是對多元線性回歸模型的一種擴(kuò)展,在其最簡單的形式中,只用一個線性模型來描述獨立變量Y與預(yù)測變量組X之間的關(guān)系:
式中:b0為截距;bp為數(shù)據(jù)點1到p的回歸系數(shù)。
變量篩選主要通過誤差方程計算出每刪除特定變量引起的誤差變化的大小來選擇變量,重新建立預(yù)報模型。方法在刪除那些對所研究問題影響不大的變量的同時,保證模型的總誤差值的增長最小。
式中:ΔEi表示刪除第i個變量時,模型總誤差的增加值,通過不斷刪除ΔE(i)值為最小的變量達(dá)到變量篩選優(yōu)化的效果;bi為線性模型第i個變量的回歸系數(shù)矢量;1i為第i個分量為1,其余分量為0的一種特殊矢量;T為正交矩陣;矩陣(TTT)-1為對角矩陣;R為PLS正交分解得到的矩陣。
本PLS判別模型的源代碼為Excel下VBA代碼。已知的X數(shù)據(jù)(不同產(chǎn)地元素含量矩陣)和Y數(shù)據(jù)(樣品分類信息,相應(yīng)的葡萄酒產(chǎn)地類別Y=1,否則為0),先對X數(shù)據(jù)兩兩相乘進(jìn)行擴(kuò)維,使其自變量數(shù)增加,而后使用變量篩選計算方法去除冗余變量,最終獲取約40個變量用于建立模型。模型的交叉驗證相關(guān)系數(shù)需大于0.9,則模型可靠性更高。
2.2.1 直接對原始數(shù)據(jù)進(jìn)行PLS處理分析
檢測的葡萄酒中41種元素部分元素含量過低,無法對相關(guān)數(shù)據(jù)進(jìn)行處理,經(jīng)過篩選選擇K、Na、Ca、Mg、Fe、Cu、Mn、Zn、B、Al、V、Cr、Ba、Rb、Sr、Pb、Li、Co、Ni、As、Se、Y、Mo、Cd、Ce、Ti 26種元素的數(shù)據(jù)信息,以100個樣本的數(shù)據(jù)信息構(gòu)成100×26維的自變量數(shù)據(jù)矩陣X,以5個國家構(gòu)成目標(biāo)變量矩陣Y,其中Y有5個矢量y1、y2、y3、y4、y5,分別代表澳大利亞、西班牙、意大利、法國、智利。將可用于數(shù)據(jù)分析的變量不經(jīng)預(yù)處理直接進(jìn)行PLS建模分析,共選擇原始變量26個,根據(jù)y的信息分別對變量矩陣X做正交分解,建立回歸模型,模型交叉檢驗相關(guān)系數(shù)(CR)分別為0.873 5、0.772 8、0.719 2、0.781 1、0.661 1,實際判別準(zhǔn)確率分別為90%、80%、75%、80%和65%。對于某產(chǎn)地信息yi,模型計算出來的該產(chǎn)地樣本點估計值大于0.5,則判斷正確,否則判錯,同時模型計算出來的其他產(chǎn)地樣本的估計值小于0.5,則判斷正確,否則判錯,通過樣本總數(shù)和判別正確數(shù)來計算全部樣品實際判別的準(zhǔn)確率。
2.2.2 變量擴(kuò)維后進(jìn)行PLS建模分析
直接對原始數(shù)據(jù)進(jìn)行PLS分析所建立的分類模型還無法滿足要求,為了進(jìn)一步理清各變量之間的相關(guān)性,將對變量進(jìn)行擴(kuò)維,引入各變量之間的非線性項,通過變量之間兩兩相乘,使得變量數(shù)從原來的26個,擴(kuò)充到445個,Y矩陣不變,對X和Y進(jìn)行PLS正交分解建立分析模型。CR分別為0.942 6、0.907 2、0.883 4、0.936 5、0.912 2。變量擴(kuò)維后模型的實際判別準(zhǔn)確率比擴(kuò)維前顯著提高。采用PLS變量篩選方法對擴(kuò)維后的大量變量進(jìn)行處理,通過指定判據(jù)刪除冗余變量或者影響不顯著的變量,從而在不影響預(yù)報準(zhǔn)確性的前提下最大限度的減少冗余變量,使模型簡化至最優(yōu)化。以意大利地區(qū)葡萄酒為例,目標(biāo)變量y3篩選過程中入選自變量數(shù)與模型相關(guān)系數(shù)的關(guān)系如圖1所示,PLS模型分析結(jié)果見表3。
圖1 PLS模型篩選過程中模型CR值與入選變量數(shù)的關(guān)系圖Fig.1 Relationship between the correlation coefficient of cross validation and the number of variables selected for the PLS model
表3 5個葡萄酒產(chǎn)地回歸模型信息Table3 PLS model parameters for the five wine producing countries
采用3列矢量模型的擬合值y1、y2、y3、y4、y5的不同組合構(gòu)成不同來源國家葡萄酒的產(chǎn)地判別分類圖。如圖2所示,澳大利亞、法國和智利顯示了較好的分類效果,同樣是歐洲的3個國家的法國、意大利和西班牙的分類效果同樣比較滿意,只是有兩個意大利的樣本結(jié)果在分類范圍外,介于法國和意大利之間,而意大利同其他幾個國家的分類還是相當(dāng)滿意的。意大利的樣品點分布比較松散,CR也稍微偏低,低于0.9,模型判別效果沒有達(dá)到最佳,經(jīng)分析可能與選取的意大利紅葡萄酒樣品葡萄品種來源較多有關(guān),雖然都來自意大利,但葡萄品種多達(dá)12種,從側(cè)面也反映了不同葡萄品種之間的模型離散性。
圖2 PLS模式識別分類圖Fig.2 The PLS-based classification models for wines from the five countries
2.3 實際樣品分析
采用上述建立的PLS模型,分析了來自法國、澳大利亞、智利和意大利的99份葡萄酒,結(jié)果顯示,不同國家之間的葡萄酒樣品均能得到很好的判別,特別是澳大利亞、智利等與歐洲國家酒樣區(qū)分明顯。但在法國和意大利的葡萄酒樣品中,有4份樣品出現(xiàn)異常,這可能與葡萄品種多樣化、產(chǎn)區(qū)不同有關(guān),也不排除個別酒樣來源有異常,需要進(jìn)一步進(jìn)行考察研究。同時將11份南非的葡萄酒檢測數(shù)據(jù)代入計算,結(jié)果顯而易見,均沒有落在任何國家范圍內(nèi)。這5個國家110份實際樣品的總體鑒別準(zhǔn)確率達(dá)到96.4%,進(jìn)一步說明了本實驗所建立模型的可靠性和準(zhǔn)確度。
對于不同產(chǎn)區(qū)的葡萄酒而言,各個大洲的差別還是比較明顯的。當(dāng)采用PLS分析時,通過變量擴(kuò)維,引入變量兩兩相乘,大大增加了變量數(shù),避免了有效信息的損失,同時通過變量優(yōu)化刪除一些冗余變量和影響不顯著的變量后,達(dá)到很好的分類效果,由此建立的分類模型,不僅能夠?qū)⒉煌笾薜钠咸丫茋?yán)格區(qū)分,還可以將歐洲不同國家之間的葡萄酒分離,模型的預(yù)報能力大大提高,鑒別準(zhǔn)確率均達(dá)96%以上。進(jìn)一步對實際樣品進(jìn)行分析,將檢測數(shù)據(jù)代入模型進(jìn)行計算,分類效果也達(dá)到實驗要求,結(jié)果令人滿意。
[1] 王秀芹, 張慶華, 戰(zhàn)吉成, 等. 產(chǎn)地與品種對葡萄酒中酚類物質(zhì)含量的影響[J]. 食品科學(xué), 2009, 30(21): 113-118.
[2] 陶永勝, 李華, 王華. 中國不同產(chǎn)區(qū)赤霞珠干紅葡萄酒香氣成分?jǐn)?shù)據(jù)的可視化分析[J]. 分析化學(xué), 2008, 36(5): 635-657.
[3] BELTR?N N H, MERMOUD M A D, MU?OZ R E. Geographical classification of Chilean wines by an electronic nose[J]. International Journal of Wine Research, 2009, 1: 209-219.
[4] GRANATO D, KATAYAMA F C U, CASTRO I A. Phenolic composition of South American red wines classified according to their antioxidant activity, retail price and sensory quality[J]. Food Chemistry, 2011, 129(2): 366-373.
[5] GAMBELLI L, SANTARONI G P. Polyphenols content in some Italian red wines of different geographical origins[J]. Journal of Food Composition and Analysis, 2004, 17(5): 613-618.
[6] KELLYA S, HEATON K, HOOGEWERFF J. Tracing the geographical origin of food: the application of multi-element and multi-isotope analysis[J]. Trends in Food Science & Technology, 2005, 16(12): 555-567.
[7] ALMEIDA C M, TERESA M, VASCONCELOS S D. ICP-MS determination of strontium isotope ratio in wine in order to be used as a fingerprint of its regional origin[J]. Journal of Analytical Atomic Spectrometry, 2001, 16(6): 607-611.
[8] BARBASTE M, HALICZ L, GALY A, et al. Evaluation of the accuracy of the determination of lead isotope ratios in wine by ICP MS using quadrupole, multicollector magnetic sector and time-of-flight analyzers[J]. Talanta, 2001, 54(2): 307-317.
[9] DEHELEAN A, VOICA C. Determination of lead and strontium isotope ratios in wines by inductively coupled plasma mass spectrometry[J]. Romanian Journal of Physics, 2012, 57(7/8): 1194-1203.
[10] SPITZKE M E, FAUHL-HASSEK C. Determination of the13C/12C ratios of ethanol and higher alcohols in wine by GC-C-IRMS analysis[J]. European Food Research and Technology, 2010, 231(2): 247-257.
[11] GIACCIO M, VICENTINI A. Determination of the geographical origin of wines by means of the mineral content and the stable isotope ratios: a review[J]. Journal of Commodity Science Technology and Quality, 2008, 47(Ⅰ/Ⅳ): 267-284
[12] ???I B, YILDIRIM H K, ALTINDI?LI A. A review of the authentication of wine origin by molecular markers[J]. Journal of The Institute of Brewing, 2009, 115(3): 259-264.
[13] WATLING R J, LEE G S, SCADDING C J. The application of solution and laser ablation based ICP-MS and solution based AES for the provenance determination of selected food and drink produce[J]. The Open Chemical and Biomedical Methods Journal, 2010, 3: 179-196.
[14] PANEQUE P, SOTOMAYOR M T ?, CLAVIJO A, et al. Metal content in southern Spain wines and their classification according to origin and ageing[J]. Microchemical Journal , 2010, 94(2): 175-179.
[15] BAXTER M J, CREWS, DENNIS H M M J, et al. The determination of the authenticity of wine from its trace element composition[J]. Food Chemistry, 1997, 60(3): 443-450.
[16] 劉巍, 李德美, 劉國杰, 等. 利用近紅外光譜技術(shù)對葡萄酒原產(chǎn)地進(jìn)行fisher判別[J]. 釀酒科技, 2010(7): 65-67; 69.
[17] 張軍, 王方, 魏紀(jì)平, 等. 基于SVM的天津產(chǎn)地玫瑰香葡萄酒定性分析[J]. 光譜學(xué)與光譜分析, 2011, 31(1): 109-113.
[18] 高年發(fā), 李麗, 張健. 利用模式識別技術(shù)鑒別中國葡萄酒的產(chǎn)地和品種[J]. 中國釀造, 2009(3): 68-72.
[19] LINDE G V, FISCHER J L, COETZEE P P. Multi-element analysis of South African wines and their provenance soils by ICP-MS and their classification according to geographical origin using multivariate statistics[J]. South African Journal for Enology and Viticulture, 2010, 31(2): 143-153.
A Classification Model for Wines Based on Elements Distribution and Geographical Origin
WANG Bing-tao, CHEN Bo, TU Xiao-ke, YAN Zhi, JIN Bao-hui, LIN Yan-kui, XIE Li-qi
(Shenzhen Key Laboratory of Detection Technology R & D on Food Safety, Shenzhen Entry-Exit Inspection and Quarantine Bureau, Shenzhen 518045, China)
In this study, efforts were made to address the difficulty in identifying the geographic origin of imported wines to China due to the complex sources. Inductively coupled plasma mass spectrometry (ICP-MS) was used to detect the contents of 41 elements in 100 samples of imported wines from Australia, Chile, France, Italy and Spain. Furthermore, analysis of the experimental data by partial least squares (PLS) method and cluster analysis was carried out to establish a classification model for tracing the geographical origin of the wines. After variable dimension expansion and variable selection, the PLS model without redundant or non-significant variables showed a good correlation coefficient of cross validation with an identification accuracy above 96%. For 110 additional new wine samples, including 99 from the five countries and 11 from South Africa, satisfactory identification results were obtained when applying the analytical data to the model.
wine; elements; classification model; geographical origin
TS261.7;O657
A
1002-6630(2014)02-0213-04
10.7506/spkx1002-6630-201402041
2013-03-27
國家質(zhì)檢總局科研項目(2012IK189);深圳市技術(shù)研究開發(fā)計劃技術(shù)創(chuàng)新項目(CXZZ20120831160213590)
王丙濤(1977—),男,工程師,碩士,研究方向為食品理化檢測。E-mail:fsyswbt@163.com