靳然,李生才
(山西農(nóng)業(yè)大學(xué) 農(nóng)學(xué)院,山西 太谷030801)
多年來,眾多昆蟲學(xué)家和植保工作者致力于病蟲害測報方法的研究,發(fā)展了經(jīng)驗預(yù)測法、實驗預(yù)測法和統(tǒng)計預(yù)測法等傳統(tǒng)預(yù)測預(yù)報方法[1]。但由于害蟲的發(fā)生具有多樣性、突發(fā)性、隨機性等特點,易受環(huán)境因子及害蟲自身生長發(fā)育、天敵發(fā)生情況等影響,其所在的生態(tài)系統(tǒng)是一個非常復(fù)雜的非線性結(jié)構(gòu),傳統(tǒng)的預(yù)測預(yù)報方法很難達到理想的效果。近年來,專家、學(xué)者將現(xiàn)代非線性理論運用到害蟲測報領(lǐng)域,將傳統(tǒng)的動力學(xué)理論、數(shù)理統(tǒng)計與現(xiàn)代計算技術(shù)相結(jié)合,發(fā)展了人工神經(jīng)網(wǎng)絡(luò)、相空間重構(gòu)預(yù)測法、小波分析、支持向量機等病蟲害測報新方法[2~4]。
目前,人工神經(jīng)網(wǎng)絡(luò)在預(yù)測方面已有較多的應(yīng)用,如地質(zhì)災(zāi)害的發(fā)生、房地產(chǎn)走向、借貸風(fēng)險分析等,在害蟲預(yù)測預(yù)報方面也取得了一定的成果。陳恩會等[5]做了關(guān)于BP神經(jīng)網(wǎng)絡(luò)在病蟲預(yù)測預(yù)報中的應(yīng)用介紹;王國昌等[6]研究了近年來人工神經(jīng)網(wǎng)絡(luò)在農(nóng)林害蟲的識別和診斷,并且建立了發(fā)生期和發(fā)生量的預(yù)測預(yù)報模型;歐釗榮等[7]根據(jù)廣西甘蔗棉蚜蟲發(fā)生情況基本資料和氣象指標建立了BP神經(jīng)網(wǎng)絡(luò)預(yù)報模型,擬合程度和預(yù)報精度都比較高;唐建軍等[8]建立了水稻蟲害發(fā)生量預(yù)測預(yù)報的BP神經(jīng)網(wǎng)絡(luò)預(yù)測系統(tǒng),確定了自然因素與發(fā)生量之間的關(guān)系。
麥蚜以成蟲和若蟲刺吸小麥莖、葉和嫩穗的汁液。小麥苗期受害,輕者葉色發(fā)黃、生長停滯、分蘗減少,重者麥株枯萎死亡。穗期受害,麥粒不飽滿,嚴重時麥穗干枯不結(jié)實,甚至全株死亡。此外,麥蚜還可以傳播多種麥類毒素病。據(jù)資料統(tǒng)計,上世紀50~60年代,麥蚜的發(fā)生較為平穩(wěn),危害較小,年發(fā)生面積一般在190~460萬hm2之間。70~80年代,麥蚜發(fā)生量逐漸增大,由間歇性嚴重發(fā)生逐漸轉(zhuǎn)為經(jīng)常性發(fā)生主要害蟲,危害面積呈不斷上升趨勢,成為我國小麥作物重大害蟲之一。進入90年代,麥蚜發(fā)生面積急劇上升,由1972年的342萬hm2迅速上升到1999年的1838萬hm2,導(dǎo)致小麥產(chǎn)量年損失達到50萬t以上,占小麥病蟲害造成損失總量的1/3。尤其是90年代中后期,從發(fā)生面積、防治后的實際損失方面來看,小麥蚜蟲已上升為繼水稻飛虱、水稻紋枯病之后的我國農(nóng)作物重大病蟲害中的第3位[9]。
對麥蚜發(fā)生的預(yù)測研究自上世紀80年代末開始,迄今近30年,已運用馬爾柯夫鏈、列聯(lián)表法、逐步回歸法、模糊數(shù)學(xué)等方法進行預(yù)測,并取得一定的效果,但運用BP神經(jīng)網(wǎng)絡(luò)對麥蚜發(fā)生進行預(yù)測尚屬空白。與其它方法相比,BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型模擬人腦結(jié)構(gòu)設(shè)計,預(yù)測結(jié)果更科學(xué)和精確。本文以1980—2006年氣象因子和歷年最大蟲株率為基礎(chǔ),建立基于BP神經(jīng)網(wǎng)絡(luò)的麥蚜蟲株率預(yù)測模型,并將逐步回歸法預(yù)測結(jié)果作為對比,試圖探索建立更加準確和穩(wěn)定的病蟲害測報模型。
麥蚜原始數(shù)據(jù)來自山西省植保植檢總站,數(shù)據(jù)采集點在山西運城市芮城縣古魏鎮(zhèn),為山西小麥的主產(chǎn) 區(qū),北 緯 34°36′~48°30′,東 經(jīng) 110°36′~42°30",年平均氣溫12.77℃,無霜期250d左右,年降水量513mm。全鎮(zhèn)耕地面積約4 700hm2,土地平坦,土壤肥沃,小麥是最主要的農(nóng)作物。蟲害統(tǒng)計資料為1980—2011年間2月底到6月初,采用系統(tǒng)調(diào)查法每5d采集一次數(shù)據(jù)。
氣象數(shù)據(jù)來自山西省氣象局。以1980—2006年,每年2月1日到5月10日的氣象數(shù)據(jù)為基礎(chǔ),統(tǒng)計得到月平均溫度、月平均最高溫度、月平均最低溫度、月平均濕度、月平均降水量、月平均日照時數(shù)、月平均風(fēng)速等作為單一氣象指標;計算復(fù)合氣象指標,包括每月的溫雨系數(shù)(降雨量/平均氣溫)、晴雨系數(shù)(降雨量/日照時數(shù))、溫濕系數(shù)(平均濕度/平均氣溫)[10];將單一氣象指標與復(fù)合氣象指標共同建表(表1)。
表1 氣象因子對照表Table1 The contrast table of meteorological factor
由于各氣象因子量綱和數(shù)量級單位均不同,因此在建模之前,要將所有變量進行變換處理,使所有變量處于一個標準的范圍內(nèi)。常用的數(shù)據(jù)處理方法有歸一化法、極差正規(guī)化法、標準化法、對數(shù)變換法等,本實驗采用較常用的歸一化法對所有變量進行預(yù)處理。
神經(jīng)網(wǎng)絡(luò)對[0,l]間的數(shù)據(jù)最敏感[11,12],在建模之前,將成分因子歸一化處理到[0,l]范圍內(nèi)。歸一化公式為:
式中,xi表示數(shù)據(jù)原始值,x表示歸一化后的數(shù)據(jù),xmax、xmin分別表示每一類成分因子的最大值和最小值。
神經(jīng) 網(wǎng) 絡(luò) (artificial neural network,縮 寫ANN)模擬人腦結(jié)構(gòu)設(shè)計,是人腦的一種物理抽象、簡化和模擬,具有很強的非線性信息處理能力,人工神經(jīng)元通過不同聯(lián)結(jié)方式組成網(wǎng)絡(luò)結(jié)構(gòu)[13]。神經(jīng)網(wǎng)絡(luò)具有非線性、非局限性、非常定性、非凸性等四個基本特征,采用并行分布式系統(tǒng),克服了傳統(tǒng)的基于邏輯符號的人工智能在處理直覺、非結(jié)構(gòu)化信息方面的缺陷,具有良好的自適應(yīng)、自組織和自學(xué)習(xí)能力[14]。神經(jīng)網(wǎng)絡(luò)的類型很多,網(wǎng)絡(luò)結(jié)構(gòu)和學(xué)習(xí)算法不同,可分為單層前向網(wǎng)絡(luò)、多層前向網(wǎng)絡(luò)、反饋網(wǎng)絡(luò)、隨機神經(jīng)網(wǎng)絡(luò)等類型,常用的有BP神經(jīng)網(wǎng)絡(luò)、小波神經(jīng)網(wǎng)絡(luò)、模糊神經(jīng)網(wǎng)絡(luò)、徑向基神經(jīng)網(wǎng)絡(luò)等。
本實驗采用MATLAB軟件編寫神經(jīng)網(wǎng)絡(luò)程序,建立BP神經(jīng)網(wǎng)絡(luò)模型,將1980—2006年作為訓(xùn)練集進行建模,2007—2011年作為測試集進行預(yù)測,具體預(yù)測流程如圖1所示。
將1980—2006年麥蚜最大蟲株率作為訓(xùn)練集,2007—2011年麥蚜最大蟲株率作為測試集。建模程序分為數(shù)據(jù)歸一化、網(wǎng)絡(luò)訓(xùn)練、網(wǎng)絡(luò)預(yù)測、誤差分析、結(jié)果作圖等過程。在本實驗中設(shè)計的神經(jīng)網(wǎng)絡(luò)為3層結(jié)構(gòu),由一個輸入層、一個隱含層和一個輸出層組成,進行網(wǎng)絡(luò)訓(xùn)練時選擇LM算法。神經(jīng)網(wǎng)絡(luò)的參數(shù)很多,有輸入層節(jié)點數(shù)、隱含層節(jié)點數(shù)、輸出層節(jié)點數(shù)、傳遞函數(shù)、訓(xùn)練函數(shù)、學(xué)習(xí)率等[15]。在網(wǎng)絡(luò)結(jié)構(gòu)、權(quán)重及閾值相同的情況下,隱含層節(jié)點數(shù)及傳遞函數(shù)的選擇,直接影響著網(wǎng)絡(luò)的學(xué)習(xí)能力和泛化能力[16],根據(jù)經(jīng)驗,本實驗中設(shè)定輸入層節(jié)點數(shù)為100,隱含層節(jié)點數(shù)為10,輸出層節(jié)點數(shù)為1,訓(xùn)練迭代過程30,動量因子為0.9,訓(xùn)練步數(shù)30,學(xué)習(xí)率0.1,期望目標誤差最小值10-5。
圖1 BP神經(jīng)網(wǎng)絡(luò)預(yù)測流程Fig.1 The prediction flow of BPNN
BP神經(jīng)網(wǎng)絡(luò)選用Sigmoid函數(shù)作為隱含層的傳遞函數(shù),其定義如下:
S(x)= 1 1+e-t
Sigmoid主要有三種類型,分別為logsig函數(shù)、tansig函數(shù)及purelin函數(shù)。本實驗設(shè)置的隱含層傳遞函數(shù)為tansig,輸出層傳遞函數(shù)為purelin。
為評價BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型的優(yōu)劣,選擇目前在病蟲害預(yù)測預(yù)報領(lǐng)域較為常用的逐步回歸法作為參比模型。在SPSS軟件中進行逐步回歸[17],選擇“數(shù)理統(tǒng)計——回歸——線性回歸”,將訓(xùn)練集每年的麥蚜最大蟲株率作為Y值,表1所有氣象因子作為自變量,在方法框中選擇“逐步回歸”作為分析方法,按照逐步回歸結(jié)果,計算2007—2011年麥蚜最大蟲株率。
本實驗選擇模型擬合精度、平均絕對百分誤差(MAPE)和均方誤差(MSE)等評價指標對模型性能進行評價[18,19]。
公式中,yi為最大蟲株率的實際值,為模型的預(yù)測值,n為訓(xùn)練樣本數(shù)。
運用逐步回歸法對麥蚜最大蟲株率進行預(yù)測,得到多元線性方程為:
y=21.936+37.086x49-7.732x63+3.159x32+16.299x97
采用該方程對訓(xùn)練集進行擬合,得到1980—2006年麥蚜最大蟲株率擬合圖(圖2)。
在逐步回歸法對麥蚜最大蟲株率的訓(xùn)練中,平均擬合精度為73.66%,最大擬合精度為99.87%,擬合精度超過90%的年份有8個;運用BP神經(jīng)網(wǎng)絡(luò)對1980—2006年麥蚜最大蟲株率進行訓(xùn)練(圖3),平均擬合精度為78.15%,最大擬合精度為99.16%,擬合精度超過90%的年份有11個,說明這兩個模型都基本體現(xiàn)了麥蚜最大蟲株率的發(fā)展規(guī)律。由于BP神經(jīng)網(wǎng)絡(luò)模型有較強的處理非線性問題的能力,因此其擬合效果略好于逐步回歸。BP神經(jīng)網(wǎng)絡(luò)基于經(jīng)驗風(fēng)險最小準則,其擬合效果取決于樣本數(shù)的多少,訓(xùn)練樣本越多,擬合精度越高,預(yù)測準確率越好,模型越穩(wěn)定;當訓(xùn)練樣本過小時,往往訓(xùn)練擬合精度高但預(yù)測效果差,易于出現(xiàn)過擬合現(xiàn)象。
圖2 逐步回歸法對麥蚜最大蟲株率的擬合結(jié)果Fig.2 The simulation effect of study by stepwise regression method
圖3 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練擬合結(jié)果圖Fig.3 The simulation effect of study by BPNN
比較BP神經(jīng)網(wǎng)絡(luò)和逐步回歸模型的擬合精度和性能可得出(表2~表4):
(1)BP神經(jīng)網(wǎng)絡(luò)的平均預(yù)測精度明顯高于逐步回歸,BP神經(jīng)網(wǎng)絡(luò)的平均預(yù)測精度為96.09%,逐步回歸法平均預(yù)測精度為75.74%。BP神經(jīng)網(wǎng)絡(luò)對麥蚜最大蟲株率的預(yù)測非常準確,5年的預(yù)測結(jié)果中3年超過95%。逐步回歸法的預(yù)測結(jié)果較差,只有2009年預(yù)測準確率為99.01%,2010年預(yù)測準確率最低,只有34.85%,主要是由于逐步回歸采用的是線性處理方法,麥蚜的發(fā)生受到氣象因子、自身生長發(fā)育、寄主生長發(fā)育、天敵等多種因素影響,逐步回歸法不能很好的處理非線性問題。
(2)比較兩種模型的均方誤差(MSE),BP神經(jīng)網(wǎng)絡(luò)模型的MSE值明顯小于逐步回歸,其預(yù)測的均好性高于逐步回歸,表明其穩(wěn)定性優(yōu)于逐步回歸法。
表2 BP神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果Table 2 The prediction results of BPNN
表3 逐步回歸預(yù)測結(jié)果Table 3 The prediction results of stepwise regression method
表4 BP神經(jīng)網(wǎng)絡(luò)和逐步回歸預(yù)測模型比較Table 4 Comparision of BPNN and stepwise regression method performances
害蟲發(fā)生是一個非常復(fù)雜的非線性過程,受到各種因素的影響,要建立準確且穩(wěn)定的預(yù)測模型具有一定的難度。本實驗建立了BP神經(jīng)網(wǎng)絡(luò)對麥蚜最大蟲株率的預(yù)測預(yù)報模型,并與逐步回歸法的預(yù)測精度和穩(wěn)定性進行了比較。結(jié)果表明,BP神經(jīng)網(wǎng)絡(luò)的預(yù)測效果總體好于逐步回歸,主要是由于其處理非線性問題的能力、良好的自學(xué)習(xí)、自組織和自適應(yīng)性、良好的推廣能力。在取得影響害蟲發(fā)生且相當數(shù)量氣象因子的基礎(chǔ)上,此方法可較為準確的預(yù)測不同地區(qū)的病蟲害發(fā)生情況。
但運用BP神經(jīng)網(wǎng)絡(luò)在病蟲害預(yù)測預(yù)報中的研究較少,還存在許多亟待解決的問題。例如,本實驗中沒有考慮麥蚜越冬基數(shù)、天敵、寄主、防治措施等因素的影響,可通過進一步實驗對這些因素做定性定量分析后進入建模過程。如何更準確的確定神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點個數(shù);當樣本量過大時,由于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)了過多的樣本致使輸出模型不能反映樣本內(nèi)含的規(guī)律,超出了學(xué)習(xí)的度,易出現(xiàn)過擬合現(xiàn)象,如何選擇樣本數(shù)量的問題。下一步,可嘗試對氣象因子采用逐步回歸法、主成分分析法等進行篩選;采用交叉驗證法、試湊法等對神經(jīng)網(wǎng)絡(luò)的初始參數(shù)進行優(yōu)化,以建立預(yù)測更加準確的神經(jīng)網(wǎng)絡(luò)預(yù)測預(yù)報模型。
[1]張孝羲,翟保平,牟吉元.昆蟲生態(tài)及預(yù)測預(yù)報[M].北京:中國農(nóng)業(yè)出版社,1985:205-207.
[2]馬飛,許曉風(fēng),張夕林,等.相空間重構(gòu)與神經(jīng)網(wǎng)絡(luò)融合預(yù)測模型及其在害蟲測報中的應(yīng)用[J].生態(tài)學(xué)報,2002,22(8):1297-1301.
[3]王洪亮,王丙麗,李朝偉.害蟲綜合治理研究進展[J].河南科技學(xué)院學(xué)報(自然科學(xué)版),2006,34(3):40-42.
[4]張永生.害蟲預(yù)測預(yù)報方法的研究進展[J].湖南農(nóng)業(yè)科學(xué),2009,24(7):77-79.
[5]陳恩會,王煒,張建軍.BP神經(jīng)網(wǎng)絡(luò)在病蟲預(yù)測預(yù)報中的應(yīng)用簡介[J].湖北植保,2012,129(1):41-44.
[6]王國昌,王洪亮,呂文彥,等.基于人工神經(jīng)網(wǎng)絡(luò)的害蟲預(yù)測預(yù)報[R].第二屆亞太地區(qū)信息網(wǎng)絡(luò)數(shù)字會議報告,2011:110-112.
[7]歐釗榮,譚宗琨,蘇永秀.BP神經(jīng)網(wǎng)絡(luò)模型在甘蔗綿蚜蟲發(fā)生發(fā)展氣象等級預(yù)報中的應(yīng)用研究[J].安徽農(nóng)業(yè)科學(xué),2008,36(21):9141-9143,9152.
[8]唐建軍,王映龍,彭瑩瓊.BP神經(jīng)網(wǎng)絡(luò)在水稻病蟲害診斷中的應(yīng)用研究[J].安徽農(nóng)業(yè)科學(xué),2010,38(1):199-200,204.
[9]曹雅忠,尹姣,李克斌,等.小麥蚜蟲不斷猖獗原因及控制對策的探討[J].植物保護,2006,32(5):72-75.
[10]印毅.麥蚜種群的發(fā)生為害與主要影響因子分析[D].揚州:揚州大學(xué),2004.
[11]羅長壽,左強,李保國.基于遺傳算法的人工神經(jīng)網(wǎng)絡(luò)模型在冬小麥根系分布預(yù)報中的應(yīng)用[J].應(yīng)用生態(tài)學(xué)報,2004,15(2):354-356.
[12]陳明.MATLAB神經(jīng)網(wǎng)絡(luò)原理與實例精解[M].北京:清華大學(xué)出版社,2013:156-191.
[13]張映梅,李修煉,趙惠燕.人工神經(jīng)網(wǎng)絡(luò)及其在小麥等作物病蟲害預(yù)測中的應(yīng)用[J].麥類作物學(xué)報,2002,22(4):84-87.
[14]朱大奇.人工神經(jīng)網(wǎng)絡(luò)研究現(xiàn)狀及其展望[J].江南大學(xué)學(xué)報(自然科學(xué)版),2004,3(1):103-109.
[15]Gang Liu,Xuehong Yang,Yingbing Ge,et al.An Artificial Neural Network-based Expert System for Fruit Tree Disease and Insect Pest Diagnosis[R].IEEE International Conference on Networking,Sensing and Control.2006:1076-1079.
[16]傅薈璇,趙紅,王宇超.MATLAB神經(jīng)網(wǎng)絡(luò)應(yīng)用設(shè)計[M].北京:機械工業(yè)出版社,2010:193-208.
[17]吳駿.SPSS統(tǒng)計分析從零開始學(xué)[M].北京:清華大學(xué)出版社,2014:302-305.
[18]向昌盛,周子英.ARIMA與SVM 組合模型在害蟲預(yù)測中的應(yīng)用[J].昆蟲學(xué)報,2010,53(9):1055-1060.
[19]李啟權(quán),王昌全,張文江,等.基于神經(jīng)網(wǎng)絡(luò)模型和地統(tǒng)計學(xué)方法的土壤養(yǎng)分空間分布預(yù)測[J].應(yīng)用生態(tài)學(xué)報,2013,24(2):459-466.
山西農(nóng)業(yè)大學(xué)學(xué)報(自然科學(xué)版)2015年4期