孫文兵
(邵陽(yáng)學(xué)院 理學(xué)與信息科學(xué)系,湖南 邵陽(yáng),422000)
遺傳算法降維優(yōu)化的BP模型及葡萄酒質(zhì)量預(yù)測(cè)
孫文兵
(邵陽(yáng)學(xué)院 理學(xué)與信息科學(xué)系,湖南 邵陽(yáng),422000)
針對(duì)BP神經(jīng)網(wǎng)絡(luò)模型輸入自變量維數(shù)過(guò)高導(dǎo)致模型訓(xùn)練時(shí)間長(zhǎng)、泛化能力低、效率不高的缺陷,提出一種基于遺傳算法篩選降維的方法,并利用遺傳算法優(yōu)化降維過(guò)程中建立的BP網(wǎng)絡(luò)的權(quán)值與閾值以提高篩選效率,最后建立用遺傳算法優(yōu)化的GA-BP網(wǎng)絡(luò)預(yù)測(cè)模型,用于葡萄酒的質(zhì)量預(yù)測(cè)。利用遺傳算法從37個(gè)理化指標(biāo)中篩選出18個(gè)作為自變量輸入GA-BP預(yù)測(cè)模型并與未經(jīng)優(yōu)化的BP模型對(duì)比,經(jīng)遺傳算法降維優(yōu)化的GA-BP模型建模時(shí)間由7.5625秒縮短為0.8623秒,預(yù)測(cè)平均相對(duì)誤差由10.83%減少為2.85%。仿真實(shí)驗(yàn)表明降維優(yōu)化的GA-BP網(wǎng)絡(luò)模型效率更高、泛化能力更好。
遺傳算法;降維;優(yōu)化;神經(jīng)網(wǎng)絡(luò);質(zhì)量預(yù)測(cè)
目前國(guó)際上對(duì)葡萄酒質(zhì)量評(píng)價(jià)沒(méi)有一個(gè)統(tǒng)一的量化標(biāo)準(zhǔn),一般是聘請(qǐng)一批有資質(zhì)的評(píng)酒員進(jìn)行品評(píng)。評(píng)酒員對(duì)葡萄酒進(jìn)行品嘗后根據(jù)分類(lèi)指標(biāo)打分,然后求和得到其總分,根據(jù)分?jǐn)?shù)的高低以衡量葡萄酒的質(zhì)量。而實(shí)際中請(qǐng)有資質(zhì)的品酒師不是一件容易的事,而且評(píng)價(jià)結(jié)構(gòu)受主觀因素的影響較大。葡萄酒質(zhì)量的好壞從生化角度來(lái)看與葡萄酒和釀酒葡萄的一些理化指標(biāo)密切相關(guān),如果能建立理化指標(biāo)和葡萄酒質(zhì)量間的合理關(guān)系,那么在沒(méi)有合適品酒員時(shí),也能預(yù)測(cè)葡萄酒的質(zhì)量。目前常見(jiàn)的建模預(yù)測(cè)方法有多元回歸、趨勢(shì)預(yù)測(cè)等,然而有些復(fù)雜關(guān)系很難準(zhǔn)確確定具體的函數(shù)關(guān)系式,因此建立的模型往往不準(zhǔn)確。
人工神經(jīng)網(wǎng)絡(luò)具有良好的非線(xiàn)性逼近能力,理論上已證明一個(gè)三層BP網(wǎng)絡(luò)可以滿(mǎn)足一般函數(shù)映射的要求,可以任意精度逼近任意多變量函數(shù),而且預(yù)測(cè)精度較高,因此在各種預(yù)測(cè)模型中有廣泛應(yīng)用[1-3 ]。而B(niǎo)P算法是基于梯度下降的,自身的缺陷也不可避免:網(wǎng)絡(luò)權(quán)值閾值隨機(jī)設(shè)定,當(dāng)解空間有多個(gè)局部極小時(shí)容易陷入局部極小而無(wú)法跳出。另外當(dāng)網(wǎng)絡(luò)輸入自變量很多,自變量之間又不是相互獨(dú)立的時(shí),BP網(wǎng)絡(luò)易出現(xiàn)過(guò)擬合現(xiàn)象,導(dǎo)致模型泛化能力低建模時(shí)間長(zhǎng)等缺陷。
遺傳算法是模擬自然界優(yōu)勝劣汰生物進(jìn)化過(guò)程的全局優(yōu)化搜索算法,采用群體進(jìn)化的方式對(duì)目標(biāo)函數(shù)空間進(jìn)行并行式搜索,根據(jù)個(gè)體適應(yīng)度大小選擇個(gè)體,保留競(jìng)爭(zhēng)力強(qiáng)的基因,是一種搜索效率高、魯棒性強(qiáng)的優(yōu)化方法。結(jié)合二者的特點(diǎn),目前很多學(xué)者利用遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)取得不錯(cuò)的成效[ 4-5],比較廣泛的是利用遺傳算法優(yōu)化網(wǎng)絡(luò)權(quán)值和閾值[ 6-8]。也有通過(guò)不同的編碼方式,優(yōu)化BP網(wǎng)絡(luò)的結(jié)構(gòu)和系數(shù)以確定合適的網(wǎng)絡(luò)結(jié)構(gòu)[9]。
針對(duì)葡萄酒和釀酒葡萄的理化指標(biāo)過(guò)多,導(dǎo)致自變量維數(shù)過(guò)高,很可能存在冗余信息,從而增加建模時(shí)間,造成精度不高,泛化能力下降的缺陷,本文先利用遺傳算法優(yōu)化篩選[10],去掉冗余信息,提取最能反映網(wǎng)絡(luò)輸入和輸出關(guān)系的自變量參與建模。由于遺傳算法篩選過(guò)程計(jì)算適應(yīng)度函數(shù)時(shí)要建立BP網(wǎng)絡(luò),篩選的效率不高,篩選的時(shí)間往往很長(zhǎng)[11],因此利用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,減少篩選時(shí)間。并建立遺傳算法優(yōu)化的GA-BP模型用于對(duì)葡萄酒質(zhì)量預(yù)測(cè),優(yōu)化后的模型有明顯的效果。
結(jié)合2012年全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽A題—葡萄酒質(zhì)量評(píng)價(jià)問(wèn)題的附件數(shù)據(jù)[12],以其中白葡萄為例。提取所有可能對(duì)白葡萄酒質(zhì)量影響的一級(jí)理化指標(biāo),包括釀酒葡萄29個(gè)指標(biāo)和葡萄酒8個(gè)指標(biāo)總共37個(gè)指標(biāo)。葡萄酒的質(zhì)量以10位品酒師對(duì)每個(gè)樣品的評(píng)分平均值為衡量標(biāo)準(zhǔn),樣品個(gè)數(shù)為28個(gè)。
由于不同輸入因子綱量和數(shù)值大小的差異,為了避免奇異因子影響網(wǎng)絡(luò)的訓(xùn)練時(shí)間和收斂性,有必要對(duì)原始數(shù)據(jù)進(jìn)行歸一化處理,使歸一化后的數(shù)據(jù)分布在[-1,1]之間。計(jì)算公式:
(1)
其中,xi是原始數(shù)據(jù),yi是歸一化后的數(shù)據(jù),max(x),min(x)是輸入數(shù)據(jù)的最大值和最小值.
2.1 遺傳算法自變量降維
根據(jù)以上數(shù)據(jù)可用BP神經(jīng)網(wǎng)絡(luò)建模學(xué)習(xí),以理化指標(biāo)為輸入自變量,葡萄酒質(zhì)量評(píng)分為輸出因變量。然而37個(gè)理化指標(biāo)可能包含一些冗余信息,若全部作為輸入自變量,必然降低學(xué)習(xí)性能,利用遺傳算法對(duì)自變量進(jìn)行不斷迭代進(jìn)化,最終篩選出具有代表性的自變量參與建模。
2.1.1 個(gè)體編碼與初始種群
采用二進(jìn)制的編碼方法,染色體編碼長(zhǎng)度為37,將這些理化指標(biāo)按順序排列,染色體的每一位對(duì)應(yīng)一個(gè)輸入自變量,基因取值為“0”和“1”,取“0”時(shí)表示不選擇該變量,取“1”時(shí)表示選擇該變量。隨機(jī)產(chǎn)生n個(gè)長(zhǎng)度為37的串結(jié)構(gòu)數(shù)據(jù)為一個(gè)個(gè)體,即為n個(gè)初始種群。
2.1.2 適應(yīng)度函數(shù)
適應(yīng)度函數(shù)是遺傳算法中選擇運(yùn)算的依據(jù),遺傳算法朝著適應(yīng)度函數(shù)增大的方向進(jìn)化,即適應(yīng)度函數(shù)值越大被選中的機(jī)率就越大。這里選取數(shù)據(jù)集誤差平方和的倒數(shù)作為適應(yīng)度函數(shù):
(2)
其中,xi是第i個(gè)樣本輸出值,ti是第i個(gè)樣本實(shí)際值,n為樣本數(shù)目。每一個(gè)個(gè)體適應(yīng)度函數(shù)的實(shí)現(xiàn)通過(guò)建立BP網(wǎng)絡(luò)求均方誤差,適應(yīng)度函數(shù)取均方誤差的倒數(shù)。
2.1.3 選擇運(yùn)算
選擇運(yùn)算采用基于排序的適應(yīng)度分配,按適應(yīng)度大小升序?qū)€(gè)體排序,按線(xiàn)性排序確定染色體的選取概率:
Pi=c(1-c)i-1
(3)
其中i為個(gè)體排序序號(hào),c為排序?yàn)?的個(gè)體的選擇概率。
2.1.4 交叉運(yùn)算
交叉操作采用單點(diǎn)交叉算子,對(duì)初始種群個(gè)體進(jìn)行隨機(jī)配對(duì),這里初始種群大小設(shè)為20,共有10個(gè)相互配對(duì)的個(gè)體組,對(duì)每一對(duì)相互配對(duì)的個(gè)體,隨機(jī)選取某一基因座之后的位置為交叉點(diǎn),互換兩個(gè)配對(duì)個(gè)體的部分染色體,產(chǎn)生兩個(gè)新個(gè)體。
2.1.5 變異運(yùn)算
采用單點(diǎn)變異算子,隨機(jī)產(chǎn)生變異點(diǎn),由變異點(diǎn)的位置改變對(duì)應(yīng)基因座上的基因值,即變異點(diǎn)的基因值由“0”變成“1”或由“1”變成“0”。
2.2 遺傳算法篩選降維主要步驟
Step 1 初始化種群,對(duì)種群進(jìn)行二進(jìn)制編碼;
Step 2 計(jì)算適應(yīng)度函數(shù),適應(yīng)度大遺傳到下一代概率相對(duì)大,若滿(mǎn)足終止條件便輸出結(jié)果,即得到篩選出的自變量,算法終止;
Step 3 若適應(yīng)度不滿(mǎn)足條件,計(jì)算每一個(gè)個(gè)體選擇概率,單點(diǎn)交叉和變異操作,產(chǎn)生新的個(gè)體;
Step 4 在新一代種群中,返回 step 2。
由于降維過(guò)程中個(gè)體適應(yīng)度函數(shù)采用數(shù)據(jù)集誤差平方和的倒數(shù),而B(niǎo)P網(wǎng)絡(luò)的學(xué)習(xí)特點(diǎn)是使網(wǎng)絡(luò)輸出層的誤差平方和達(dá)到最小,故計(jì)算適應(yīng)度函數(shù)時(shí)需要建立BP網(wǎng)絡(luò)以求適應(yīng)度函數(shù)。同時(shí)對(duì)葡萄酒質(zhì)量預(yù)測(cè)時(shí)也建立BP網(wǎng)絡(luò)模型,針對(duì)BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值的隨機(jī)選取的缺陷,對(duì)于自變量篩選降維過(guò)程中個(gè)體適應(yīng)度函數(shù)計(jì)算時(shí)所建立的BP網(wǎng)絡(luò)和葡萄酒質(zhì)量預(yù)測(cè)所建立的BP網(wǎng)絡(luò)模型均用遺傳算法對(duì)初始閾值和權(quán)值進(jìn)行優(yōu)化。
3.1 遺傳算法優(yōu)化BP網(wǎng)絡(luò)權(quán)值和閾值
神經(jīng)網(wǎng)絡(luò)采用3層網(wǎng)絡(luò)結(jié)構(gòu)為:輸入層—隱含層—輸出層,遺傳算法優(yōu)化BP網(wǎng)絡(luò)時(shí)其主要要素如下:
3.1.1 種群初始化
隨機(jī)產(chǎn)生初始種群,種群數(shù)目N根據(jù)需要自己擬定,本文中選取N=20,初始種群編碼采用實(shí)數(shù)編碼,每個(gè)個(gè)體為一個(gè)實(shí)數(shù)串,由輸入層與隱含層的連接權(quán)值、隱含層與輸出層以及隱含層閾值和輸出層閾值組成。若網(wǎng)絡(luò)結(jié)構(gòu)確定時(shí)便可以確定個(gè)體編碼長(zhǎng)度,比如2-3-1的網(wǎng)絡(luò)結(jié)構(gòu),權(quán)值個(gè)數(shù)為2×3+3×1=9個(gè),閾值為3+1=4個(gè),所以個(gè)體編碼長(zhǎng)度為9+4=13。
3.1.2 適應(yīng)度函數(shù)
根據(jù)隨機(jī)產(chǎn)生的權(quán)值和閾值對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò),對(duì)給定的輸入數(shù)據(jù)集和輸出數(shù)據(jù)集計(jì)算每個(gè)神經(jīng)網(wǎng)絡(luò)的全局誤差,遺傳算法只能朝著使適應(yīng)度增大的方向進(jìn)化,因此適應(yīng)度函數(shù)可按照(2) 式構(gòu)造。
3.1.3 選擇操作
采用旋轉(zhuǎn)輪盤(pán)賭和最優(yōu)保存策略相結(jié)合的混合選擇算子。選擇過(guò)程以旋轉(zhuǎn)輪盤(pán)賭策略為基礎(chǔ),根據(jù)個(gè)體適應(yīng)度,按某種規(guī)則挑選出好的個(gè)體進(jìn)入下一代種群,即每個(gè)個(gè)體的選擇概率
(4)
其中fi為個(gè)體i的適應(yīng)度值,N為種群數(shù)目。
個(gè)體適應(yīng)度越高, 被選中的概率就越大, 進(jìn)入下一代的機(jī)會(huì)就越大。由于隨機(jī)操作的原因, 這種選擇誤差比較大,有時(shí)甚至連適應(yīng)度較高的個(gè)體也選擇不上。為了提高遺傳算法的收斂性,還采用最優(yōu)保留策略,即將最大適應(yīng)度的個(gè)體直接保留到下一代。每次新種群用上一代所記錄的最優(yōu)個(gè)體替換群體中的最差個(gè)體, 以防止當(dāng)前種群中適應(yīng)度較好的個(gè)體被淘汰。
3.1.4 交叉操作
交叉操作采用算術(shù)交叉算子:
c1=p1×a+p2×(1-a)
c2=p2×a+p1×(1-a)
(5)
其中,a為(0,1)間的隨機(jī)數(shù)即為交叉概率,p1,p2為一組配對(duì)的兩個(gè)父代個(gè)體,c1,c2為交叉后產(chǎn)生的兩個(gè)子代個(gè)體。
3.1.5 變異操作
為提高搜索能力和算法的收斂速度,變異操作采用自適應(yīng)調(diào)整:
(6)
其中,fmax是群體中最大適應(yīng)度值,favg是每代群體的平均適應(yīng)度值,f是要變異個(gè)體的適應(yīng)度值,k1,k2為(0,1)中的值。
3.2 遺傳算法優(yōu)化BP網(wǎng)絡(luò)權(quán)值和閾值的主要步驟
Step 1 根據(jù)創(chuàng)建的BP網(wǎng)絡(luò),按神經(jīng)網(wǎng)絡(luò)生成初始權(quán)值和閾值的方法對(duì)種群初始化,并且對(duì)其進(jìn)行實(shí)數(shù)編碼,確定種群數(shù)目;
Step 2 計(jì)算每一個(gè)個(gè)體的選擇概率,并將其排序;
Step 3 按旋轉(zhuǎn)輪盤(pán)賭和最優(yōu)保存策略挑選出好的個(gè)體進(jìn)入下一代種群中;
Step 4 在新一代種群中,按算術(shù)交叉算子和自適應(yīng)變異率選擇適應(yīng)的個(gè)體進(jìn)行交叉和變異操作,產(chǎn)生新的個(gè)體;
Step 5 將新個(gè)體插入到種群中,并計(jì)算其適應(yīng)度;
Step 6 如果找到了滿(mǎn)意的個(gè)體,則終止算法,否則轉(zhuǎn)step 2。
Step 7 找到優(yōu)化的權(quán)值與閾值后,將最終群體中的最優(yōu)個(gè)體解碼,即可得到優(yōu)化后的網(wǎng)絡(luò)權(quán)值和閾值用以訓(xùn)練BP網(wǎng)絡(luò)。
通過(guò)遺傳算法降維優(yōu)化后篩選出來(lái)的理化指標(biāo)作為網(wǎng)絡(luò)的輸入變量,葡萄酒質(zhì)量評(píng)分作為輸出變量建立三層拓?fù)浣Y(jié)構(gòu)的BP網(wǎng)絡(luò)模型。輸入層到隱含層以Tansig為訓(xùn)練函數(shù),隱含層到輸出層以purelin為傳遞函數(shù),為了克服標(biāo)準(zhǔn)BP算法固有的一些缺陷,訓(xùn)練算法采用基于數(shù)值優(yōu)化方法的Levenberg-Marquardt法。隱含層節(jié)點(diǎn)數(shù)待確定輸入單元后可通過(guò)反復(fù)試驗(yàn)來(lái)確定,學(xué)習(xí)速率為0.01,最大訓(xùn)練次數(shù)max_epochs=1000,目標(biāo)誤差err_goal=0.01。
5.1 理化指標(biāo)篩選降維結(jié)果
利用文中第2節(jié)介紹的遺傳算法降維的方法對(duì)影響葡萄酒質(zhì)量的37個(gè)理化指標(biāo)做降維處理,染色體長(zhǎng)度為37,種群大小設(shè)為20,最大進(jìn)化代數(shù)設(shè)為100。降維過(guò)程中用到的BP網(wǎng)絡(luò)用第3節(jié)中介紹的遺傳算法對(duì)初始權(quán)值和閾值進(jìn)行優(yōu)化。利用遺傳算法工具箱GAOT在Matlab軟件上實(shí)現(xiàn),得到的最優(yōu)二進(jìn)制編碼(0010100011101110101101011010001110000)。由二進(jìn)制編碼方法可知篩選出來(lái)的理化指標(biāo)分別是第3、5、9、10、11、13、14、15、17、19、20、22、24、25、27、31、32、33號(hào),共18個(gè)自變量,對(duì)應(yīng)為白葡萄中的VC含量(mg/L)、酒石酸、褐變度、DPPH自由基、總酚、葡萄總黃酮、白藜蘆醇、黃酮醇、還原糖、PH值、可滴定酸、干物質(zhì)含量、百粒質(zhì)量、果梗比、果皮質(zhì)量及白葡萄酒中的總酚、酒總黃酮、白藜蘆醇。這說(shuō)明其余19個(gè)沒(méi)選擇的自變量是冗余信息,可見(jiàn)篩選出來(lái)參與建模的自變量不到原來(lái)總數(shù)的一半。
遺傳算法優(yōu)化降維過(guò)程如圖1 所示,從圖可看到,當(dāng)種群進(jìn)化到第35代之后得到了最優(yōu)個(gè)體,種群的平均適應(yīng)度函數(shù)均值在穩(wěn)定中有微小的波動(dòng),這是因?yàn)檫z傳算法中的一些隨機(jī)性因素造成的。
圖1 種群適應(yīng)度函數(shù)進(jìn)化曲線(xiàn)Fig.1 The evolution curve of population fitness function
5.2 遺傳算法優(yōu)化的GA-BP模型預(yù)測(cè)結(jié)果及仿真
BP模型及參數(shù)設(shè)置采用第4節(jié)介紹BP網(wǎng)絡(luò),隱含層數(shù)通過(guò)反復(fù)試驗(yàn)方法確定。并利用第3節(jié)中介紹的遺傳算法對(duì)BP預(yù)測(cè)模型的初始權(quán)值和閾值進(jìn)行優(yōu)化,種群大小設(shè)為20,最大進(jìn)化代數(shù)設(shè)為100。
為了檢驗(yàn)遺傳算法優(yōu)化的GA-BP模型的泛化能力,以1號(hào)至20號(hào)樣本為訓(xùn)練樣本,21號(hào)至28號(hào)樣本為檢測(cè)樣本以檢驗(yàn)?zāi)P偷臏?zhǔn)確性。為了檢驗(yàn)經(jīng)遺傳算法降維篩選以及優(yōu)化后的GA-BP模型的合理性和優(yōu)勢(shì),先將原37個(gè)自變量輸入BP網(wǎng)絡(luò)建模,經(jīng)反復(fù)實(shí)驗(yàn)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)選定為37×50×1;再將經(jīng)遺傳算法優(yōu)化篩選出來(lái)的18個(gè)自變量輸入BP網(wǎng)絡(luò)建模;最后將經(jīng)遺傳算法優(yōu)化篩選出來(lái)的18個(gè)自變量輸入用遺傳算法優(yōu)化后的GA-BP網(wǎng)絡(luò)建模,同樣經(jīng)反復(fù)試驗(yàn),后兩種網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)確定為18×35×1,三種模型對(duì)21至28號(hào)樣本的預(yù)測(cè)結(jié)果如下表1:
表1 遺傳算法優(yōu)化篩選的BP模型樣本預(yù)測(cè)值Table 1 The sample prediction value of BP model optimized by genetic algorithm
為了比較三種模型對(duì)預(yù)測(cè)樣本的泛化能力以及建模時(shí)間的長(zhǎng)短,將三種模型預(yù)測(cè)結(jié)果的偏差以及三種模型訓(xùn)練時(shí)間做出對(duì)比,見(jiàn)表2。
表2 三種BP模型泛化能力、建模時(shí)間對(duì)比Table 2 The comparison of generalization ability and modeling time about three kinds of BP model
由表2可以看出,用遺傳算法篩選前對(duì)葡萄酒質(zhì)量預(yù)測(cè)的平均相對(duì)誤差為10.83%,建模時(shí)間為7.5625秒;用遺傳算法篩選降維后再對(duì)葡萄酒質(zhì)量預(yù)測(cè)的平均相對(duì)誤差僅為5.35%,建模時(shí)間只有1.4531秒;而用遺傳算法降維后再用遺傳算法優(yōu)化的GA-BP模型預(yù)測(cè)平均相對(duì)誤差只有2.85%,而且建模時(shí)間縮短到0.8623秒。可見(jiàn)篩選降維后模型預(yù)測(cè)準(zhǔn)確率大大提高,建模時(shí)間明顯縮短。而經(jīng)遺傳算法降維再用遺傳算法優(yōu)化的BP模型預(yù)測(cè)最準(zhǔn)確,建模時(shí)間最短。為了更直觀地了解三種模型的泛化能力,作出預(yù)測(cè)仿真圖如圖2 。
圖2 葡萄酒質(zhì)量預(yù)測(cè)仿真圖Fig.2 The simulation diagram of wine quality prediction
本文利用遺傳算法降維方法,篩選BP網(wǎng)絡(luò)建模輸入因子,以降低自變量的維數(shù),并針對(duì)篩選過(guò)程中計(jì)算適應(yīng)度函數(shù)時(shí)所建立BP網(wǎng)絡(luò)以及葡萄酒質(zhì)量預(yù)測(cè)的BP網(wǎng)絡(luò)模型的初始權(quán)值和閾值的隨機(jī)性,用遺傳算法對(duì)權(quán)值和閾值進(jìn)行優(yōu)化,減少篩選時(shí)間和建模時(shí)間,提高了準(zhǔn)確度。建立了經(jīng)遺傳算法篩選優(yōu)化以后的GA-BP網(wǎng)絡(luò)模型,并用于葡萄酒質(zhì)量預(yù)測(cè),此模型比未經(jīng)優(yōu)化的BP模型具有更好的網(wǎng)絡(luò)泛化能力,且節(jié)省了建模時(shí)間。
由于實(shí)際中評(píng)價(jià)葡萄酒質(zhì)量對(duì)于小企業(yè)和個(gè)人而言聘請(qǐng)有資質(zhì)的品酒師不是一件容易的事,而且由于品酒師主觀原因造成評(píng)價(jià)結(jié)果有差異。因此,此模型為方便葡萄酒的質(zhì)量預(yù)測(cè)提供一種參考方式,而且此模型可以推廣到其他飲料的預(yù)測(cè)當(dāng)中。
[1]李亞,劉麗平,李柏青,等.基于改進(jìn) K-Means 聚類(lèi)和BP神經(jīng)網(wǎng)絡(luò)的臺(tái)區(qū)線(xiàn)損率計(jì)算方法[J].中國(guó)電機(jī)工程學(xué)報(bào),2016,36(17):4543-4551.
[2] 徐黎明,王清,陳劍平,等.基于BP神經(jīng)網(wǎng)絡(luò)的泥石流平均流速預(yù)測(cè)[J].吉林大學(xué)學(xué)報(bào),2013,43(1):186-191.
[3]陳 嘯,王紅英,孔丹丹,等.基于粒子群參數(shù)優(yōu)化和 BP 神經(jīng)網(wǎng)絡(luò)的顆粒飼料質(zhì)量預(yù)測(cè)模型[J].農(nóng)業(yè)工程學(xué)報(bào),2016,32(14):306-314.
[4]王德明,王莉,張廣明.基于遺傳BP 神經(jīng)網(wǎng)絡(luò)的短期風(fēng)速預(yù)測(cè)模型[J].浙江大學(xué)學(xué)報(bào)(工學(xué)版),2012,46(5):837-841.
[5]張立仿,張喜平.量子遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量預(yù)測(cè)[J].計(jì)算機(jī)工程與科學(xué),2016,38(1):114-119.
[6]杜文莉,周仁,趙亮.基于量子差分進(jìn)化算法的神經(jīng)網(wǎng)絡(luò)優(yōu)化方法[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,52(3):331-335.
[7]Leung H F,Lam H K,Ling S H,et al.Tuning of the structure and parameters of neural network using improved genetic algorithem[J].IEEE Transactions on Neural Network,2003,14(1):79-88.
[8]Tsai J,Chou J,Liu T.Tuning the structure and parameters of a neural network by using hybrid Taguchi-genetic algorithem[J].IEEE Transactions on Neural Network,2006,17(1):69-80.
[9]張偉棟,葉貞成,錢(qián) 鋒.基于混合編碼的遺傳算法在神經(jīng)網(wǎng)絡(luò)優(yōu)化中的應(yīng)用[J].華東理工大學(xué)學(xué)報(bào)( 自然科學(xué)版),2008,34(1):108-111.
[10]湯 勃,孔建益,王興東.基于遺傳算法的帶鋼表面缺陷特征降維優(yōu)化選擇[J].鋼鐵研究學(xué)報(bào),2011,23(9):59-62.
[11]MATLAB中文論壇編著.MATLAB神經(jīng)網(wǎng)絡(luò)30個(gè)案例分析[M].北京:北京航空航天大學(xué)出版社.2010.
[12]全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽網(wǎng)站[EB/OL].[2012-09-07].http://www.mcm.edu.cn/problem/2012/cumcm2012problems.rar.
BP model optimized by genetic algorithm reducing dimension and wine quality prediction
SUN Wenbing
(Department of Science and Information Science,Shaoyang University,Shaoyang 422000,China)
If BP neural network model has many input variables,this will reduce some defects:training time is too long,generalization ability is low,efficiency is not quick.In order to overcome these defects,this paper proposed a method based on genetic algorithm dimensions reduction.It used genetic algorithm to optimize weights and thresholds of BP neural network in the dimensionality reduction process,which improved the screening efficiency.Finally,the GA-BP network model of genetic algorithm optimization was established,and the model was used to predict wine quality.The 18 variables were chosen from the 37 physical and chemical indexes by genetic algorithm.The selected variables were independent variables to establish GA-BP model.In contrast,the modeling time of optimized GA-BP model was reduced from 7.5625 seconds to 0.8623 seconds,the average relative error was reduced from 10.83% to 2.85%.The simulation results show that the optimization GA-BP network model has more better efficiency and generalization ability than the BP network.
genetic algorithm;dimensions reduction;optimization;neural network;quality prediction.
1672-7010(2017)01-0023-07
2017-01-05
邵陽(yáng)市科技計(jì)劃項(xiàng)目(2016GX04)
孫文兵(1978-),男,湖南隆回人,副教授,碩士,從事智能算法及應(yīng)用,解析不等式研究;E-mail:swb0520@163.com
TP183;O242.1 < class="emphasis_bold">文獻(xiàn)標(biāo)志碼:A
A