唐洪玉,周 琳,陳義安
(重慶工商大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶 400067)
釀酒葡萄和葡萄酒成分間的典型性相關(guān)分析
唐洪玉,周 琳,陳義安**
(重慶工商大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶 400067)
根據(jù)釀酒葡萄與葡萄酒的理化指標(biāo),按“逐步降維,保留信息”的思想建立模型,把原來多個(gè)變量劃為幾個(gè)綜合指標(biāo),并對這些綜合指標(biāo)進(jìn)行研究,以簡化問題的求解過程;因釀酒葡萄和葡萄酒質(zhì)量間的內(nèi)在聯(lián)系及變化規(guī)律具有隨機(jī)性、理化指標(biāo)信息過大,先進(jìn)行變量替換,分別選取15個(gè)、8個(gè)綜合變量替代原變量,再對醞釀葡萄與醞釀葡萄酒主成分分析,最后進(jìn)行典型相關(guān)分析。
降維;主成分分析;典型相關(guān)分析;變量替換
目前,對葡萄酒的鑒別主要采用感官評定法。傳統(tǒng)的產(chǎn)品感官評價(jià)主要依靠品評專家的個(gè)人經(jīng)驗(yàn)來完成,品評專家必須具有大量的行業(yè)背景知識和豐富的品評經(jīng)驗(yàn)。但品評結(jié)果的主觀性較強(qiáng),且品評過程時(shí)間長,費(fèi)用大,成本較高,不利于大批量樣本的感官品評。由于葡萄酒的化學(xué)成分復(fù)雜,也可借助化學(xué)計(jì)量學(xué)的方法對其進(jìn)行區(qū)分?;瘜W(xué)計(jì)量學(xué)方法即通過定量分析葡萄酒中多種化學(xué)物質(zhì)的含量,再對數(shù)據(jù)進(jìn)行多元統(tǒng)計(jì)分析,從而達(dá)到對樣品進(jìn)行鑒別的目的。這種方法比感官評定更加客觀、公正。葡萄酒作為許多歐洲國家的一種重要的商品,國外對這種鑒別方法已經(jīng)作了較多的研究。但是,對化學(xué)成分進(jìn)行準(zhǔn)確的定性定量分析較困難且過程復(fù)雜。葡萄酒的成分有1 000多種,并且它們之間存在著復(fù)雜的關(guān)系。因此,采用科學(xué)的方法使存在于這些復(fù)雜關(guān)系的問題簡單化,進(jìn)而更加清楚地了解它們之間的關(guān)系,多元統(tǒng)計(jì)方法無疑可以為葡萄酒的質(zhì)量控制、預(yù)測、預(yù)報(bào)、區(qū)分提供一種有效的途徑。多元統(tǒng)計(jì)分析中主成分分析和典型性相關(guān)分析數(shù)學(xué)工具能把眾多的描述語轉(zhuǎn)化為較少的、綜合性較強(qiáng)的描述語,并且能夠反映出原來多個(gè)描述語的信息,從而篩選出科學(xué)合理的描述特性。
考慮到釀酒葡萄與葡萄酒的理化指標(biāo)數(shù)量過多,利用主成分分析的降維思想,尋找少數(shù)幾個(gè)綜合變量(原變量的線性組合)對替代原變量,將原兩組變量的關(guān)系化為少數(shù)幾對綜合變量的關(guān)系。于是分別建立釀酒葡萄與葡萄酒的理化指標(biāo)的向量矩陣,由于指標(biāo)信息大,于是對它們進(jìn)行了變量替換,并建立了典型性相關(guān)分析模型;應(yīng)用Matlab軟件先對醞釀葡萄與醞釀葡萄酒進(jìn)行主成分分析,分別選取與主成分個(gè)數(shù)相同的綜合變量替代原變量,然后再進(jìn)行典型相關(guān)分析。
(1)兩組評酒員對葡萄酒的質(zhì)量評估是權(quán)威公正的,不摻雜個(gè)人情感因素。
(2)在醞釀葡萄過程中,每種樣品的原材料不發(fā)生替換。
(3)釀酒葡萄、葡萄酒的各種指標(biāo)測量值是完全可信的。
(4)葡萄酒的質(zhì)量只與外觀、香氣、口感、平衡整體有關(guān)。
(5)假設(shè)每一個(gè)樣品酒源自同一個(gè)品酒組的平均評分都是來自同一個(gè)總體的樣本,服從正態(tài)分布,且每個(gè)總體之間相互獨(dú)立。
(6)假設(shè)兩個(gè)品酒組分別對紅葡萄酒、白葡萄酒的品均分具有方差齊性,若用σ21表示甲組品酒員給每個(gè)紅葡萄酒樣品平均分的方差,σ22表示乙組品酒員給每個(gè)紅葡萄酒樣品平均分的方差,即:σ21=σ22。
Xj:表示紅葡萄酒第j個(gè)指標(biāo)的值(j=1,2, 31);Xij:表示紅葡萄酒的第i個(gè)品種的第j個(gè)指標(biāo)值;zk:為紅葡萄酒新的指標(biāo)值(k<j);A:標(biāo)準(zhǔn)化后的紅葡萄的典型相關(guān)系數(shù);B:標(biāo)準(zhǔn)化后的白葡萄的典型相關(guān)系數(shù); R:釀酒紅葡萄和紅葡萄酒的理性指標(biāo)之間的相關(guān)性。
釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系,表面上無法看出它們的關(guān)系。但釀酒葡萄、葡萄酒的理化指標(biāo)均可以建立向量矩陣,于是考慮從這兩個(gè)向量矩陣間尋找關(guān)系。典型性相關(guān)分析[1]是研究兩組變量相關(guān)關(guān)系的一種統(tǒng)計(jì)方法,它的思想與主成分分析模型[2]相類似,以“逐步降維,減少變量”的思想為中心,尋找?guī)讉€(gè)綜合變量來替代原有的多個(gè)變量,與本題所要解決的問題相融合,于是建立典型性相關(guān)分析模型。
首先,對醞釀葡萄與葡萄酒進(jìn)行主成分分析,分別選取15個(gè)與9個(gè)綜合變量替代原變量進(jìn)行典型相關(guān)分析[1]。設(shè)研究的醞釀葡萄與葡萄酒的兩組指標(biāo)變量分別為 X=(χ1,χ2, χp)T,(p=15);Y= (y1,y2, yq)T,(q=9)。分別對X、Y的每個(gè)指標(biāo),觀察n次,有:
分別對X,Y取行平均,得到樣品向量的平均值:
分析式(1)將發(fā)現(xiàn):在使得V,W的相關(guān)達(dá)最大的同時(shí),V和W的方差將達(dá)最小,這說明按此準(zhǔn)則得到的典型成分V和W,對原變量組X和Y的代表性最差,它們無法更多地反映原變量組的變異信息。另一方面,因V,W任意線性組合的相關(guān)系數(shù)與V,W的相關(guān)系數(shù)相等,便使得相關(guān)系數(shù)最大的V=a'X和W=b'X并不唯一。故在典型相關(guān)分析解法[4]中附加了約束條件:
接下來,在約束條件式(2)下,求出a、b,使得ρ(V,W)最大。于是做拉格朗日函數(shù)[5]:
對a求導(dǎo):
對b求導(dǎo):
再式(3)×a',式(4)×b'得:
而a'Σ 12b正是相關(guān)系數(shù)ρ(V,W),利用式(4)中的結(jié)論,可得:
由式(7)得:
將式(8)代入式(6)中,得:
由定義可知a'X,b'Y是X,Y的第一對典型相關(guān)變量,它們之間的相關(guān)系數(shù)稱為第一個(gè)典型相關(guān)系數(shù)。
最后利用MATLAB軟件[6]求出第一典型變量和典型相關(guān)系數(shù)。
5.1 主成分分析
采用主成分分析方法,先將釀酒葡萄的理化指標(biāo)進(jìn)行主成分分析,得到了紅白釀酒葡萄的15種主要相關(guān)成分,分別是氨基酸總量、花色苷、多酚氧化酶活力、DPPH自由基、總酚、單寧、葡萄總黃酮、總糖、還原糖、可溶性固形物、可滴定酸、固酸比、干物質(zhì)含量、果皮質(zhì)量和果皮顏色;對于葡萄酒的理化指標(biāo),用同樣的方法得到兩種葡萄酒的理化指標(biāo)的主要相關(guān)成分,其中紅葡萄酒的成分是花色苷、單寧、總酚、酒總黃酮、白藜蘆醇、DPPH半抑制體積和色澤;白葡萄酒的成分是單寧、總酚、酒總黃酮、白藜蘆醇、DPPH半抑制體積和色澤。
5.2 典型性相關(guān)分析
第二步先將釀酒紅葡萄和紅葡萄酒進(jìn)行典型相關(guān)性分析,利用matlab軟件,使用指令[A,B,R]= canoncorr(χ,y),分別得到了矩陣A、B和R,其中A和B為標(biāo)準(zhǔn)化的紅葡萄、白葡萄的典型相關(guān)系數(shù),釀酒紅葡萄和紅葡萄酒的理性指標(biāo)之間的相關(guān)性為R,如表1、表2所示。
表1 釀酒紅葡萄和紅葡萄酒的理化指標(biāo)之間的相關(guān)性
由表1可以看出花色苷、單寧、總酚、酒總黃銅和白藜蘆醇相關(guān)性極強(qiáng),DPPH、色澤L*和色澤a*相關(guān)性較強(qiáng),色澤b*相關(guān)性較小,可以忽略。同樣的得出了釀酒白葡萄和白葡萄酒的理性指標(biāo)之間的相關(guān)性R:
表2 釀酒白葡萄和白葡萄酒的理化指標(biāo)之間的相關(guān)性
由表2可以看出單寧、總酚和酒總黃銅相關(guān)性極強(qiáng),白藜蘆醇、DPPH和色澤L*相關(guān)性較強(qiáng),色澤a*和色澤b*相關(guān)性較小,可以忽略。
[1]王俊,謝曉佳.基于層次分析法及可拓理論的露天采石場安全評價(jià)研究[J].重慶工商大學(xué)學(xué)報(bào):自然科學(xué)版,2013(6): 61-68
[1]高惠璇.典型相關(guān)與典型冗余分析[J].數(shù)理統(tǒng)計(jì)與管理,2002(1):56-64
[2]李新蕊.主成分分析、因子分析、聚類分析的比較與應(yīng)用[J].山東教育學(xué)院報(bào),2007(6):1-4
[3]茆詩松,程依明,濮小龍.概率論與數(shù)理統(tǒng)計(jì)教程[M].北京:高等教育出版社,2011
[4]楊俊英,楊洋,唐龍妹,等.典型相關(guān)分析[J].臨床薈萃,2006,21(1):52-53
[5]華東師范大學(xué).數(shù)學(xué)分析[M].北京:高等教育出版社,2010
[6]姜啟源,邢文訓(xùn),謝金星,等.大學(xué)數(shù)學(xué)實(shí)驗(yàn)[M].北京:清華大學(xué)出版,2005
Application of Typical Correlation Analysis to the Composition Analysis of Wine Grapes and Wine
TANG Hong-yu,ZHOU Lin,CHEN Yi-an
(School of Mathematics and Statistics,Chongqing Technology and Business University,Chongqing 400067,China)
According to physical and chemical indicators of wine grape and wine,the model is set up based on the idea of dimension reduction step by step and retaining the information to classify original multi-variable to several comprehensive indicators and to study these comprehensive indicators so as to simplify the solving process of the problems.Because the intrinsic connection and changing law between wine grapes and wine quality have randomness and because their physical and chemical indicators are too large,this paper firstly makes variable substitution by selecting 15 comprehensive variables and 8 comprehensive variables respectively to replace original variables,then conducts primary component analysis on wine grapes and wine and finally carries out typical correlation analysis.
dimension reduction;principal component analysis;variable substitution
O211
A
1672-058X(2014)01-0093-05
責(zé)任編輯:田 靜
2013-05-22;
2013-05-30.
唐洪玉(1990-),女,四川宜賓人,從事數(shù)學(xué)金融研究.
**通訊作者:陳義安(1969-),男,四川渠縣人,教授,從事應(yīng)用數(shù)學(xué)研究.E-mail:chenyian@ctbu.edu.com.