資燕仙
對葡萄酒的質量等級劃分,主要是由一些資深的品酒員對其的打分來衡量的,而不同的品酒員對同一葡萄酒評分各不相同,為了對某一葡萄酒的質量給出一個評價,我們就有必要檢驗不同組品酒員打分的可信度??紤]到上述同題,文章首先對題目所給的數據進行了清洗,然后用統(tǒng)計上的假設檢驗方法對不同組品酒員的打分進行檢驗,再用變異系數對可信度進行判定。
假設檢驗 主成分分析
研究背景
隨著經濟的發(fā)展,人們生活水平的不斷提高,各類進口葡萄酒不斷的涌人中國市場,不僅引起了創(chuàng)業(yè)者對其的興趣,也吸引了很多中國學者對其的研究。
由于葡萄酒越來越受廣大人民的喜愛,這在一定程度上也吸引了一些學者、研究員、分析師的的目光,經過查閱資料發(fā)現各個領域對葡萄酒都做了一些定性和定量的研究。鹿文麗,楊潘,王晶( 2017)以煙臺葡萄酒旅游業(yè)為例,分析了葡萄酒旅游業(yè)中現代信息技術的應用程度和提升空間;林博學( 2017)研究了葡萄酒瓶上的軟木塞應該如何制造才能使得葡萄酒的密封效果最好;黃鴻基,錢圳冰,馮帆,周行洲( 2017)根據釀酒葡萄的理化指標和葡萄酒的質量利用統(tǒng)計的方法來對釀酒葡萄進行分級。
綜上,眾多學者都對葡萄酒進行了研究。但大部分學者都沒有對評酒員對葡萄酒的評分進行判定分析。針對研究的不足,文章在下文中對葡萄酒的不同組評酒員的評分進行了判定。
本文利用的數據是2012年全國大學生數學建模競賽A題的數據,由于文章研究的問題與競賽題目的問題有所差異,因此,文章只用了附件1的數據,來分析附件1中兩組評酒員的評價結果有無顯著差異,哪一組結果更可信。
模型建立與求解
(1)問題分析
葡萄酒的感官評價中,不同的品酒員對葡萄酒的評價在評價尺度方面存在不同的差異,由于定性分析總是不能使人們信服,所以就需要利用統(tǒng)計方法來對其進行檢驗;其次為了對葡萄酒選取一組質量評分標準,將利用統(tǒng)計方法從定量分析的基礎上確定出一組評分做為葡萄酒的質量評選標準。
(2)模型建立與求解
1.正態(tài)性檢驗
對于問題一文章采用每組評酒員對每一樣品各個理化指標打分的總和數據來分析,首先對附件一的兩組數據用Excel進行加總分別得出紅門兩種葡萄得分的27個或28個總分值;其次,對數據文件1中的每一組數據用RStudio進行正太性檢驗,文章將采用JB進行檢驗,得到的四個JB值分別為4.01,3.20,2.09,1.98,均小于臨界值5.99,故四組數據近似服從正太分布。
2.對兩組品酒員評分顯著性檢驗
根據上述檢驗,每組評酒員對每一樣品評分的平均值服從正太分布,因此對第一組紅葡萄酒樣品,可以設λi:N(μi,σi)i=1,2,L,27,第二組紅葡萄 酒 樣 品 , 可 以 設λj:N(μj,σj),j=1,2,L,27,則對第一組和第二組紅葡萄酒樣品的評分有無顯著性差異的問題,可以轉化為如下假設檢驗模型:
Ho:μi=μj,Hl:μi≠μj
(1)
因為兩組紅葡萄酒評分的方差均不知道并且不可能相等,進而不能進行假設檢驗,于是將表達形式變形為D=λi-λj,則樣本均值變?yōu)棣?μi-μj,因此第一個假設檢驗變?yōu)閷Α?0的t檢驗。變換后的樣本均值數據見數據文件l,利用RStudio對第一組和第二組紅葡萄酒樣品平均值評分的差進行t檢驗,
分析運算結果可知,在顯著性水平α=0.05下,p=1.027e-09小于其水平,因此拒絕原假設,即μi=μj,也就是說兩組品酒員對紅葡萄酒的評分存在顯著性差異,同理,對于門葡萄酒,在顯著性水平α=0.05下,p=1.027e-09小于其水平。綜上,兩組品酒員對紅、門兩組葡萄酒的打分存在顯著差異。
其次,對第二個方差假設檢驗進行F檢驗:
首先求出第一組和第二組中每一品酒員對紅葡萄酒每一樣品打分的和后,再求每組中每一樣品的方差,最后用RStudio對處理后的數據進行編程分析。
根據運行結果中p=0.04198,在在顯著性水平α =0.05下,拒絕原假設,說明兩組品酒員對紅葡萄酒的評分存在差異。采用同樣的方法,對兩組門葡萄酒的每一樣品評分數據進行分析,可得p=0.04088,在α=0.05下,拒絕原假設,說明兩組品酒員對門葡萄酒的評分存在差異。
綜上,兩組品酒員對紅門葡萄酒的評分在均值和方差上都存在顯著性差異,所以可認為評酒員對紅白葡萄酒的兩組評價結果有顯著性差異。
(3)兩組品酒員評價結果可信度評估
要評價兩組品酒員的評價結果的可信度,就要看兩組評分中哪一組更穩(wěn)定,因此用變異系數來判定,它常用來衡量樣本值的離散程度,其值越小表示樣本越集中,穩(wěn)定性越好,可信度越高,反之。變異系數的計算公式如下:
其中σ表示樣本標準差,x表示樣本均值。
利用Excel計算了每一組品酒員的變異系數,第一組紅、白葡萄為;9,86%、6.88%;第一組紅、白葡萄為:5.54%、4.07%??梢钥闯龅谝唤M品酒員對紅、門葡萄酒的評分變異系數遠大于第二組的變異系數。所以,可以確定第二組品酒員的評分結果更可靠。
結論
文章利用2012年全國大學生數學建模競賽A題的數據,來對釀酒葡萄和葡萄酒進行分析。首先通過假設檢驗驗證了附件1中兩組評酒員對葡萄酒的評分存在顯著差異,最后用變異系數證明了第二組評酒員的評分可信度更高。
[1]網絡資源:http: //baike.sogou.com/v66069.htm?fromTitle=%E8%91%A1%E8%90%84%E9%85%92, 2017.
[2]鹿文麗,楊潘,王晶.信息技術與葡萄酒旅游融合模式研究[J]沖國農業(yè)大學煙臺研究院,2017.
[3]林博學.葡萄酒用軟木塞的生產及品質控制[J].煙臺張裕葡萄釀酒股份有限公司,2017.
[4]黃鴻基,錢圳冰,馮帆,周行洲.基于改進后的K-means算法研究根據釀酒葡萄和葡萄酒的理化指標對紅葡萄酒的分級方法[J].南京郵電大學,2017.
[5]趙靜,但琦.數學建模與數學實驗[M].高等教育出版社.2014, 191-270.
[6]費宇.多元統(tǒng)計分析——基于R[M].中國人民大學出版社.2014.