摘要:極限學(xué)習(xí)機(jī)(ELM)學(xué)習(xí)速度快且泛化性好,極易產(chǎn)生惟一最優(yōu)解,適用于蟲害預(yù)測。通過實(shí)情驗(yàn)證,在廣西宜州三化螟蟲害預(yù)測預(yù)報(bào)中,ELM預(yù)測精度較高,能夠滿足蟲害預(yù)測對準(zhǔn)確率和實(shí)時(shí)性的要求,可作為一種新的蟲害預(yù)測方法。
關(guān)鍵詞:極限學(xué)習(xí)機(jī)(ELM);三化螟;預(yù)測
中圖分類號(hào):S126;S435.112+.1 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):0439-8114(2015)05-1205-03
DOI:10.14088/j.cnki.issn0439-8114.2015.05.045
Abstract:Extreme learning machine(ELM) is easy to generate a unique optimal solution and suitable for the pest forecast with fast speed of learning and good generalization. Through the truth verification, ELM had high prediction accuracy in the Tryporyza incertulas forecast in Yizhou city of Guangxi, which could meet the requirements about accuracy and real-time, and it will be a new method in the pest forecast.
Key words:extreme learning machine(ELM); Tryporyza incertulas; forecast
廣西河池宜州地區(qū)水稻病蟲害主要是“三蟲兩病”,即三化螟、稻縱卷葉螟、稻飛虱、紋枯病、稻瘟病,在各稻作區(qū)普遍發(fā)生且較為嚴(yán)重,尤其是三化螟蟲害對水稻生產(chǎn)影響較大,甚至造成顆粒無收。三化螟蟲害預(yù)測預(yù)報(bào)的準(zhǔn)確性是有效防治三化螟蟲害的前提和保證。傳統(tǒng)的蟲害預(yù)測預(yù)報(bào)常用的是線性方法,而在大多數(shù)情況下,預(yù)報(bào)因子與蟲害發(fā)生之間常常是非線性關(guān)系,若廣西宜州三化螟蟲害預(yù)測仍采用傳統(tǒng)的線性方法,則難以確保三化螟蟲害預(yù)測預(yù)報(bào)的準(zhǔn)確性。
近年來的研究表明,人工神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的非線性逼近能力,在蟲害預(yù)測中常被采用[1-3]。極限學(xué)習(xí)機(jī),即ELM(Extreme Learning Machine)是一種簡潔、快速、有效的單隱層前饋神經(jīng)網(wǎng)絡(luò)(SLFN)學(xué)習(xí)算法。相比較而言,傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法(如BP算法)需要人為設(shè)置大量的網(wǎng)絡(luò)訓(xùn)練參數(shù),且極易產(chǎn)生局部最優(yōu)解,而ELM只需要設(shè)置網(wǎng)絡(luò)的隱層節(jié)點(diǎn)個(gè)數(shù),在算法執(zhí)行過程中不需要調(diào)整網(wǎng)絡(luò)的輸入權(quán)值以及隱元的閾值,只產(chǎn)生惟一最優(yōu)解,具有學(xué)習(xí)速度快且泛化性能好的優(yōu)點(diǎn)[4],故ELM應(yīng)用領(lǐng)域極其廣泛[5-8],已取得了令人滿意的結(jié)果。為此,提出了一種基于ELM的廣西宜州三化螟蟲害預(yù)測方法,以期為該地區(qū)三化螟蟲害的預(yù)測方法提供一定的參考。
1 極限學(xué)習(xí)機(jī)基本原理
ELM在訓(xùn)練的過程中不需要調(diào)整ω和b的值,只需根據(jù)相應(yīng)算法調(diào)整β值,便可獲得一個(gè)全局最優(yōu)解,參數(shù)選擇的過程簡單易用,訓(xùn)練速度提升明顯,且不會(huì)如傳統(tǒng)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法(如BP算法)陷入局部最優(yōu)。
2 實(shí)例仿真
將上述ELM模型應(yīng)用于廣西河池宜州地區(qū)田間水稻病蟲害的預(yù)測。
2.1 預(yù)測的樣本數(shù)據(jù)來源
實(shí)例所用的數(shù)據(jù)來自宜州市蟲情燈下誘蛾數(shù)據(jù)及田間蟲情調(diào)查,是該地區(qū)第1~9年3、5、7、9月的三化螟蟲害發(fā)生程度及相應(yīng)的田間數(shù)據(jù),3、5、7、9月的三化螟對應(yīng)第1代、第2代、第3代、第4代三化螟。把第1~6年的數(shù)據(jù)作為ELM學(xué)習(xí)樣本,第7~9年的數(shù)據(jù)作為ELM預(yù)測樣本。
通過綜合考慮,選取上代殘蟲密度、上代燈下蛾量、平均氣溫、降雨量等4個(gè)因素作為預(yù)測的影響因子。
2.2 蟲情等級(jí)標(biāo)準(zhǔn)
三化螟發(fā)生程度分級(jí)參照廣西農(nóng)作物主要病蟲測報(bào)技術(shù)規(guī)范標(biāo)準(zhǔn),具體見表1。由蟲害發(fā)生面積和卵密度的數(shù)據(jù)作為分級(jí)依據(jù),把預(yù)報(bào)對象劃分為5個(gè)等級(jí),依次為:1級(jí),小發(fā)生;2級(jí),中等偏輕發(fā)生; 3級(jí),中等發(fā)生; 4級(jí),中等偏重發(fā)生;5級(jí),大發(fā)生。
2.3 數(shù)據(jù)預(yù)處理
預(yù)測的影響因子數(shù)據(jù)均為數(shù)值型,但是量綱和單位存在不同,故必須對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。把影響因子數(shù)據(jù)歸一化,使其分布在區(qū)間(-1,1)內(nèi)。歸一化后的部分?jǐn)?shù)據(jù)如表2。
2.4 仿真結(jié)果
選擇隱含層神經(jīng)元個(gè)數(shù)為35,隱含層神經(jīng)元的激活函數(shù)為sig。由于宜州地區(qū)三化螟病蟲害連續(xù)9年的數(shù)據(jù)發(fā)生程度只有1級(jí)(小發(fā)生)、2級(jí)(中等偏輕發(fā)生)、3級(jí)(中等發(fā)生),所以發(fā)生程度只分為1~3級(jí),目標(biāo)輸出模式為(100)、(010)、(001),故輸出層神經(jīng)元個(gè)數(shù)為3,采用ELM預(yù)測第7~9年各代蟲害的程度。用ELM模型得到的目標(biāo)輸出中,對于每個(gè)目標(biāo)輸出,當(dāng)a是最大值時(shí),取a=1,否則a=0。ELM模型蟲害預(yù)測測試集訓(xùn)練結(jié)果與預(yù)測值的對比如圖1所示,回測率和預(yù)測率均達(dá)到了100%。預(yù)測值與模擬結(jié)果對應(yīng)如表3所示。
選擇隱含層神經(jīng)元個(gè)數(shù)不同,得到的結(jié)果也不相同,在25~45之間,回測率一般達(dá)到97%~100%,預(yù)測率達(dá)到94%~100%,隱含層神經(jīng)元個(gè)數(shù)太多會(huì)使預(yù)測率呈逐步下降趨勢,隱含層神經(jīng)元個(gè)數(shù)太少,回測率和預(yù)測率不高。在學(xué)習(xí)速度上,試驗(yàn)基于3.0 GHz 的雙核Intel處理器、2 GB內(nèi)存的PC機(jī),試驗(yàn)環(huán)境為MATLAB 2009a版本,運(yùn)行預(yù)測模型所花的時(shí)間為3.533 5 s, 滿足了蟲情預(yù)測實(shí)時(shí)性要求。
3 小結(jié)
仿真試驗(yàn)結(jié)果表明,在廣西宜州三化螟蟲害預(yù)測中采用極限學(xué)習(xí)機(jī)(ELM)方法,在參數(shù)選擇以及學(xué)習(xí)速度上優(yōu)勢明顯,準(zhǔn)確率高,實(shí)時(shí)性強(qiáng),可作為一種新的蟲害預(yù)測方法。下一步將繼續(xù)對極限學(xué)習(xí)機(jī)(ELM)應(yīng)用作深入研究,如采用優(yōu)化的極限學(xué)習(xí)機(jī)[9]或引入結(jié)構(gòu)風(fēng)險(xiǎn)最小化策略[10]等,進(jìn)一步提高蟲害預(yù)測的效率和準(zhǔn)確度;同時(shí)開展廣西宜州三化螟蟲害預(yù)測軟件的研發(fā),將極限學(xué)習(xí)機(jī)(ELM)推廣應(yīng)用到農(nóng)業(yè)生產(chǎn)領(lǐng)域的其他方面,比如甘蔗種植戶信息分析模型研究等。
參考文獻(xiàn):
[1] 趙國富,趙 朋.基于BP網(wǎng)絡(luò)的蟲害預(yù)測預(yù)報(bào)系統(tǒng)的分析與實(shí)現(xiàn)[J].農(nóng)機(jī)化研究, 2008(4): 14-17,28.
[2] 唐建軍,王映龍,彭瑩瓊,等.BP神經(jīng)網(wǎng)絡(luò)在水稻病蟲害診斷中的應(yīng)用研究[J].安徽農(nóng)業(yè)科學(xué),2010,38(1):199-200,204.
[3] 賈花萍.農(nóng)作物蟲情的模糊神經(jīng)網(wǎng)絡(luò)預(yù)測模型[J].浙江農(nóng)業(yè)學(xué)報(bào), 2013, 25(4): 819-822.
[4] HUANG G B,ZHU Q Y,SIEW C K.Extreme learning machine: Theory and applications[J]. Neurocomputing, 2006, 70:489-501.
[5] 潘華賢,程國建,蔡 磊.極限學(xué)習(xí)機(jī)與支持向量機(jī)在儲(chǔ)層滲透率預(yù)測中的對比研究[J].計(jì)算機(jī)工程與科學(xué), 2010,32(2):131-133.
[6] 黃宴委,吳登國,李 竣.基于極限學(xué)習(xí)機(jī)的結(jié)構(gòu)健康監(jiān)測數(shù)據(jù)恢復(fù)[J].計(jì)算機(jī)工程,2011,37(16):241-243.
[7] 陳盛雙.基于極限學(xué)習(xí)機(jī)的XML文檔分類[J].計(jì)算機(jī)工程,2011,37(19):177-178,182.
[8] 丁 姣,蔡建榮,張海東,等.近紅外結(jié)合Si-ELM檢測食醋品質(zhì)指標(biāo)[J].食品與機(jī)械,2012,28(1):93-96.
[9] 王 杰,畢浩洋.一種基于粒子群優(yōu)化的極限學(xué)習(xí)機(jī)[J].鄭州大學(xué)學(xué)報(bào)(理學(xué)版),2013,45(1):100-104.
[10] 何其慧,姚登寶,王翠翠,等.基于模糊隨機(jī)樣本的結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則[J].計(jì)算機(jī)工程與科學(xué),2011,47(34):51-55,144.