邱靖 彭莞云 吳瑞武 張海濤
摘要 由于影響葡萄酒質(zhì)量的指標(biāo)較多,利用主成分分析法,找到了影響葡萄酒質(zhì)量的指標(biāo)總計17個。并對兩組評酒員的品評數(shù)據(jù)進行了差異性檢驗,研究表明,第2組評酒員的評分?jǐn)?shù)據(jù)更可信。同時,利用QPSO算法優(yōu)化KM算法,建立了葡萄酒分類模型。通過試驗分析,該算法相對其他兩種算法更能搜索到全局最優(yōu)解,并對葡萄酒樣品進行了分級,該算法能處理聚類方面的類似問題。
關(guān)鍵詞 量子粒子群算法;KM算法;葡萄酒酒樣;分級模型
中圖分類號 S126文獻(xiàn)標(biāo)識碼 A文章編號 0517-6611(2015)11-285-02
葡萄酒品質(zhì)評定一般是通過有資質(zhì)的評酒員進行品評后對酒的各項指標(biāo)進行打分,對其求總分后以確定葡萄酒的質(zhì)量。但葡萄酒的品質(zhì)與釀酒葡萄和葡萄酒的理化指標(biāo)及芳香物質(zhì)都有密切的聯(lián)系,因此構(gòu)建一個有效實用的葡萄酒分級模型,使之更客觀有效地對葡萄酒進行分級有重要意義。不少學(xué)者對此進行了研究,并取得了一定的研究成果,如神經(jīng)網(wǎng)絡(luò)[1]、K均值[2]、Copula函數(shù)[3]及最小二乘支持向量機[4]等。筆者利用QPSO優(yōu)化KM算法建立分級模型,以期取得較好的分級效果。
1算法分析
量子粒子群算法(QPSO)具有較強的全局搜索能力,能夠在整個可行解空間搜尋最優(yōu)解。KM算法是一種基于劃分的算法,通過不斷更新迭代聚類中心,從而找到較優(yōu)的聚類結(jié)果。但QPSO算法與KM算法如何有效地結(jié)合,從而使聚類效果好,運行速度快,且不陷入局部最優(yōu)解。在利用QPSO算法優(yōu)化KM算法時,主要是找到一個有機的結(jié)合點,利用局部最優(yōu)位置和全局最優(yōu)位置更新K均值,當(dāng)QPSO陷入局部最優(yōu)時,引入KM算法提高收斂速度和全局搜索性能。
適應(yīng)度函數(shù)為:
F=∑ni=1 ∑mj=1min(xi-cij)2
(1)
式(1)中,n為酒樣個數(shù),xi為酒樣,xi表示屬于第j類酒,cij表示第i個粒子速度。
具體算法如下:
①初始化種群。種群初始化時,先選n個酒樣做為聚類中心,計算各類聚類中心值,種群數(shù)N、最大迭代次數(shù)、初始化粒子速度,粒子群粒子的最好位置pi和全局最好位置pg。②根據(jù)迭代次數(shù),調(diào)整收縮擴張系數(shù)。③根據(jù)適應(yīng)度函數(shù),計算每個粒子的適應(yīng)度值,比較其適應(yīng)度值與所經(jīng)歷的適應(yīng)度值,判斷是否更新粒子最優(yōu)位置和粒子群最優(yōu)位置。④根據(jù)QPSO進化方程調(diào)整粒子速度、局部和全體最優(yōu)位置。⑤根據(jù)聚類中心計算每個酒樣到中心的距離,并根據(jù)最小距離對酒樣重新劃分,將每個酒樣劃分到最近的類。⑥按照聚類原則重新劃分新的聚類中心。⑦判斷是否滿足終止條件,聚類中心適應(yīng)度更優(yōu),更新粒子并結(jié)束,否則轉(zhuǎn)到步驟②。⑧輸出全局最優(yōu)聚類結(jié)果。
2 試驗討論
2.1 數(shù)據(jù)處理
2012高教社杯全國大學(xué)生數(shù)學(xué)建模競賽A題中總計有紅葡萄酒27個樣品,白葡萄酒28個,以及評酒員的評分?jǐn)?shù)據(jù),各葡萄酒酒樣的理化指標(biāo)及芳香物質(zhì)。
分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系,由于釀酒葡萄的理化指標(biāo)較多,可以先利用統(tǒng)計分析中主成分分析將許多相關(guān)的隨機變量壓縮成少量的綜合指標(biāo),同時又能反映原來較多指標(biāo)的信息。按照主成分分析的理論,若前R個主成分的累計貢獻(xiàn)率達(dá)到了85%原則,則這R個主成分能反映足夠的信息。
由表1可知,反映葡萄酒質(zhì)量的主要成分有17個指標(biāo),分別為總酚、單寧、花色苷、DPPH自由基、蛋白質(zhì)、可溶性固形物、固酸比、VC含量、酒總黃酮、白藜蘆醇、檸檬烯、3-甲基-1-丁醇、丁二酸二乙酯、乙酸乙酯、乙醇、3-甲基-1-丁醇-乙酸酯、苯甲醇。
2.2組別差異性檢驗
由于2組評酒員對不同酒樣的評價結(jié)果不同,因此該問題可以轉(zhuǎn)化為多因素?zé)o重復(fù)方差分析。因子包含了組別、評酒員、酒樣及評價結(jié)果,組別用1、2表示,評酒員用1、2、3、…、20表示,酒樣紅白葡萄酒統(tǒng)一標(biāo)號,紅葡萄酒用1~27表示,白葡萄酒用28~55表示。
利用spss19.0,對其進行無重復(fù)觀測值無交互作用的方差分析,總計有4個變量,組別、評酒員、酒樣及評價結(jié)果。分析結(jié)果如表2所示。
評酒員評分可信度可以通過評酒員對酒樣評分的方差評價,即計算每組中每個評酒員對每個評價指標(biāo)相對該組評酒員對該指標(biāo)的平均值偏差平方和。方差平方和越大也即越不穩(wěn)定,其評價分?jǐn)?shù)可信度低??傮w樣本方差定義如下:
S2=1n×10×9
∑ni=1 ∑10j=1 ∑10k=1 (xijk-xijk)2
(2)
式(2)中,S2為總體樣本方差,i為酒樣數(shù),j為評酒員,k為酒樣的10個評價指標(biāo),xijk為第j個評酒員對第i個酒樣的第k個指標(biāo)的評分,xijk為10個評酒員對第i個酒樣的第k個指標(biāo)的平均值。
利用各評酒員的評分?jǐn)?shù)據(jù),算出每組評酒員的總體偏差平方和,結(jié)果如表4所示。
由表4可知,第2組評酒員的評分無論是紅白葡萄酒為一整體還是紅白葡萄酒各為一整體,其總體樣本偏差平方和均小于第1組評酒員評分的總體樣本偏差平方和,所以第2組評酒員的評分相對第1組評酒員的評分更穩(wěn)定,因此,其分?jǐn)?shù)更可信。
綜合表3和表4的結(jié)果,說明人們在判定葡萄酒質(zhì)量時,以第2組評酒員的評分結(jié)果判定其質(zhì)量的好壞。
2.3 葡萄酒分級
根據(jù)利用的QPSO算法優(yōu)化KM算法建立的葡萄酒分級模型,以及利用主成分分析法得到?jīng)Q定葡萄酒質(zhì)量的理化指標(biāo)和芳香物質(zhì),結(jié)合評酒員的評分結(jié)果,對紅葡萄酒和白葡萄酒酒樣進行分級試驗。
紅葡萄酒分級試驗,種群個數(shù)為27,粒子長度為17(影響葡萄酒質(zhì)量的理化指標(biāo)和芳香物質(zhì)),迭代次數(shù)為500,學(xué)習(xí)率為C1=0.8,C2=1,權(quán)重系數(shù)ω從0.8到0.3線性減少,進行100次試驗求平均值,算法比較如圖1所示。
從圖1可知,QPSO-K算法的適應(yīng)度值明顯比其他算法的適應(yīng)度值小,且該算法的迭代次數(shù)明顯比其他2種算法的多,說明該算法更能在全體解空間搜索全局最優(yōu)解,不易陷入局部極值。利用該算法求葡萄酒分級結(jié)果如表5所示。
3 結(jié)論
該研究利用QPSO算法優(yōu)化KM算法,建立了葡萄酒分類模型。從試驗分析看,QPSO-K算法的適應(yīng)度值明顯比其他算法的適應(yīng)度值小,解決了PSO算法易陷入局部極值的缺點,并得到了紅葡萄酒和白葡萄酒較好的分級結(jié)果。說明該算法應(yīng)用在葡萄酒分級問題上有效可行,是一種較優(yōu)的聚類方法。
參考文獻(xiàn)
[1]
曾祥燕,趙良忠,孫文兵,等.基于PCA和BP神經(jīng)網(wǎng)絡(luò)的葡萄酒品質(zhì)預(yù)測模型[J].食品與機械, 2014,30(1):40-44.
[2] 凌佳,言方榮.K均值聚類在葡萄酒分級中的應(yīng)用[J].食品工業(yè)科技, 2013,34(6):104-107.
[3] 凌佳,言方榮.Copula函數(shù)在葡萄酒分級中的應(yīng)用[J].釀酒科技, 2013,226(4):57-60.
[4] 吳瑞紅,王亞麗,張環(huán)沖,等.一種基于最小二乘支持向量機的葡萄酒品質(zhì)評判模型[J].華僑大學(xué)學(xué)報:自然科學(xué)版, 2013,34(1):30-35.
安徽農(nóng)業(yè)科學(xué),Journal of Anhui Agri. Sci.2015,43(11):289-290,294
責(zé)任編輯 李菲菲 責(zé)任校對 況玲玲