霍俊爽,張若東,潘淑霞,邰志艷吉林醫(yī)藥學(xué)院公共衛(wèi)生學(xué)院
基于多元線性回歸對釀酒葡萄與葡萄酒關(guān)系的研究
霍俊爽,張若東,潘淑霞,邰志艷
吉林醫(yī)藥學(xué)院公共衛(wèi)生學(xué)院
摘要:本文主要基于多元統(tǒng)計方法分析和研究了釀酒葡萄與葡萄酒關(guān)系的問題。最終得到了葡萄酒花色苷與葡萄理化指標(biāo)的多元線性回歸方程。
關(guān)鍵詞:多元線性回歸;標(biāo)準(zhǔn)化;花色苷
釀酒葡萄的理化指標(biāo)對葡萄酒的理化指標(biāo)有著重要的影響,本文以2012全國大學(xué)生建模競賽題為例,主要基于多元統(tǒng)計分析方法對釀酒葡萄的理化指標(biāo)與葡萄酒的理化指標(biāo)的關(guān)系進(jìn)行了研究。
由于釀酒葡萄的理化指標(biāo)過多,為了防止數(shù)量級較大的數(shù)據(jù)吞沒數(shù)量級較小的數(shù)據(jù),首先對釀酒葡萄的理化指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理。
2.1相關(guān)系數(shù)
相關(guān)分析是描述兩個變量間關(guān)系的密切程度,主要由相關(guān)系數(shù)值表示,當(dāng)相關(guān)系數(shù)r的絕對值越接近于1,則表示兩個變量間的相關(guān)性越顯著。雙變量系數(shù)測量的主要使用Pearson相關(guān)系數(shù),由于釀酒葡萄和葡萄酒的數(shù)據(jù)為定距數(shù)據(jù),則在進(jìn)行兩者間的相關(guān)性檢驗(yàn)時用Pearson相關(guān)系數(shù)[1]來判斷,其公式為:
2.2回歸分析
多元回歸分析是研究多個變量之間關(guān)系的回歸分析方法,確定變量之間數(shù)量的可能形式,并建立如下數(shù)學(xué)模型:
其中β0為截距項(xiàng),βi為偏回歸系數(shù),ε為殘差項(xiàng)。
建立模型,要對模型進(jìn)行擬合度檢驗(yàn),回歸方程的顯著性檢驗(yàn)就是檢驗(yàn)樣本回歸方程的變量的線性關(guān)系是否顯著,即能否根據(jù)樣本來推斷總體回歸方程中的多個回歸系數(shù)中至少有一個不等于0,主要是說明樣本回歸方程r2的顯著性。檢驗(yàn)的方法用方差分析,這時因變量Y的總體變異系本分解為回歸平方和與誤差平方和,即表示為:Lyy=Q+U,其中
此外可以用F檢驗(yàn)對整個回歸進(jìn)行顯著性檢驗(yàn),即Y與所考慮的k個變量自變量是否有顯著性線性關(guān)系,即公式為:
3.1相關(guān)系數(shù)
表1 紅葡萄酒的花色苷與釀酒葡萄個別指標(biāo)的相關(guān)性系數(shù)
表2 白葡萄酒的花色苷與釀酒葡萄個別指標(biāo)的相關(guān)性系數(shù)
根據(jù)相關(guān)性的分析,用SPSS做多元線性回歸分析,得到紅葡萄酒花色苷與葡萄理化指標(biāo)的線性回歸方程[3]為:
其中y表示紅葡萄酒的花色苷,x1、x2、x3、x4、x5、x6、x7分別表示釀酒葡萄的單寧、總酚、酒總黃酮、白藜蘆醇、DPPH、L、a的含量。通過該多元線性回歸方程可研究每1單位的釀酒葡萄的單寧、總酚、酒總黃酮、白藜蘆醇、DPPH、L、a的含量的變化所引起葡萄酒花色苷的變化。從而反映了釀酒葡萄與紅葡萄酒理化指標(biāo)的定量關(guān)系。
同上可得到白葡萄酒花色苷與釀酒葡萄理化指標(biāo)的多元線性回歸方程為y=0.291x1+0.904x2+0.564。
其中y表示白葡萄酒的花色苷,x1、x2分別代表葡萄白藜蘆醇、a。通過該多元線性回歸方程可研究每1單位的釀酒葡萄的白藜蘆醇、a含量的變化所引起白葡萄酒花色苷的變化。
參考文獻(xiàn):
[1]張杰,基于主成分分析的紅葡萄酒評價方法研究[J].東北電力大學(xué)學(xué)報,2013,6:4146.
[2]黃菲,葡萄酒評價與釀酒葡萄分級的統(tǒng)計研究[J].生物技術(shù)世界,2013,4:43-44.
[3]朱家明,葡萄酒質(zhì)量評價的定量分析[J].宜春學(xué)院學(xué)報, 2013,35:8-12.
基金項(xiàng)目:吉林省教育廳十二五規(guī)劃科學(xué)技術(shù)研究項(xiàng)目(2015393);吉林省科技發(fā)展計劃項(xiàng)目(20120697)。
作者簡介:霍俊爽(1982-),男,碩士,講師,研究方向:應(yīng)用數(shù)學(xué)與統(tǒng)計學(xué)。