梁 鈴 (長江大學(xué)園藝園林學(xué)院,湖北 荊州 434025)
賈偉寬,王 慧 (山東農(nóng)業(yè)大學(xué)植物保護學(xué)院,山東 泰安 271018)
基于熵組合預(yù)測模型的害蟲種群動態(tài)研究
梁 鈴 (長江大學(xué)園藝園林學(xué)院,湖北 荊州 434025)
賈偉寬,王 慧 (山東農(nóng)業(yè)大學(xué)植物保護學(xué)院,山東 泰安 271018)
在農(nóng)業(yè)害蟲種群動態(tài)的研究中,單一預(yù)測模型很難達到理想的預(yù)測精度。組合預(yù)測模型是將不同的預(yù)測模型進行適當(dāng)?shù)膬?yōu)化組合,以綜合利用各單項模型的預(yù)測信息,以提高預(yù)測精度,然而組合預(yù)測模型的核心問題是所綜合的模型權(quán)重的確定。運用信息熵理論,根據(jù)測度不確定性的函數(shù)確定組合模型的權(quán)值,建立了基于信息熵的組合預(yù)測模型,以期在研究昆蟲生態(tài)中應(yīng)用。將新建立的預(yù)測模型在玉米蚜種群動態(tài)研究中進行仿真實驗,驗證了新模型的有效性。
組合模型; 預(yù)測預(yù)報; 熵權(quán); 種群動態(tài)
目前,農(nóng)作物的蟲害已嚴(yán)重制約著農(nóng)作物的豐產(chǎn)豐收,使農(nóng)業(yè)經(jīng)濟遭受巨大損失。若對害蟲的發(fā)生能早期作出預(yù)報,及時采取防治措施,可使蟲害對農(nóng)作物危害造成的損失減少到最低。農(nóng)業(yè)害蟲種群動態(tài)受環(huán)境的影響十分明顯,各種影響因素相互干擾,具有很強的不確定性,所以預(yù)測起來十分困難。測報的精確性和有效性一直是制約農(nóng)業(yè)害蟲有效防治的瓶頸,在測報的方法選擇和模型的建立還有待于進一步的研究[1]。在當(dāng)前的害蟲測報模型中,往往采用一個固定的模型,不同模型原理和出發(fā)點不同,預(yù)測過程中考慮的影響因子側(cè)重點亦不同,不同的預(yù)測模型往往只能提供某一方面的有用信息,不可避免地會丟失另外一些有用信息,致使單一的模型難以達到理想的測報結(jié)果。
組合預(yù)測[2,3]是近年發(fā)展起來的一種有效的綜合預(yù)測方法,在其他領(lǐng)域已經(jīng)得到很好的應(yīng)用[4~9],但該模型在農(nóng)業(yè)害蟲種群動態(tài)的預(yù)測中的應(yīng)用還很少有報道。組合預(yù)測原理是將不同的預(yù)測方法進行適當(dāng)?shù)慕M合,以綜合利用各種方法所提供的信息,盡可能提高預(yù)測精度。組合預(yù)測的核心問題是權(quán)重的確定,本研究采用基于信息熵理論確定組合模型的權(quán)系數(shù)。該方法的特點是直接全面研究各個體預(yù)測方法的誤差指標(biāo)值以最終確定各個體預(yù)測方法在組合預(yù)測模型中的權(quán)重,從而使新的組合預(yù)測模型能充分利用各個體預(yù)測方法所包含的顯信息和隱信息, 使預(yù)測結(jié)果更科學(xué)、更客觀。本研究還通過對玉米蚜種群動態(tài)的研究測試,證明了模型的的可靠性。將組合模型應(yīng)用于害蟲種群生態(tài)研究,可為害蟲的預(yù)測預(yù)報提供新的方法,提高測報的可信性。
信息熵是Shannon信息論中的重要概念[10],是把熵作為一個隨機事件的“不確定性”或信息量的量度。信息量是信息論的中心概念,是信息論度量信息的基本出發(fā)點,是把獲得的信息看作用以消除不確定性的因素。因此信息量的多少,可以用被消除的不確定性的大小來表示,而隨機事件不確定性的大小可以用其概率分布來描述。
通過概率空間來描述信息量,設(shè)設(shè)有一離散型隨機變量X,其n個可能的取值為x1,x2,…,xn,每一取值出現(xiàn)的概率分別為p1,p2,…,pn。則X的概率空間可表示為[X,P],用pi表示事件{X=xi}發(fā)生的概率,且0≤pi≤1。[X,P]完整地描述了由X所代表的離散信源的特性,也被稱為X的信源空間。設(shè)稱為信息函數(shù),表示{X=xi}事件發(fā)生之前表示其不確定性;若{X=xi}事件發(fā)生后則表示xi的自信息量。
I(xi)=-logpi(i=1,2,…,n)
組合模型的核心問題是如何確定所組合的各單一模型的權(quán)重,目前較多采用的是人為定義、負變、最小二乘等方法確定權(quán)重。這些方法,雖在一定程度上解決了權(quán)值求解問題,然而卻沒能很好地顧及權(quán)值所隱含的信息度量問題。
于是得到m個模型的加權(quán)組合預(yù)測模型
利用信息論中熵的定義來求解模型中的W,根據(jù)熵的定義可以得出
預(yù)測誤差衡量的是預(yù)測值偏離實際值的程度,因此在這里取絕對值
對應(yīng)的熵權(quán)應(yīng)該為
但是在求權(quán)重的時候注意這個問題,也就是求權(quán)重的原則是誤差的熵的絕對值越大對應(yīng)的權(quán)重應(yīng)該越小,所以求出熵權(quán)后對其進行一定的變換,求倒數(shù)。所以所求權(quán)重為
利用求出的權(quán)重帶入組合模型,得到組合預(yù)測誤差值以及誤差平方和。求出組合預(yù)測誤差求出組合預(yù)測值。誤差越小權(quán)重越大。
本研究以分析山東寧陽縣1989~2000年的玉米蚜種群發(fā)生情況為例(所用數(shù)據(jù)由山東寧陽縣植保站提供)。玉米蚜的發(fā)生受多種因素制約,如氣象因素(溫度、降水、相對濕度、日照時數(shù)等)、蟲源基數(shù)、當(dāng)年小麥的種植面積、耕作制度以及灌水條件等等。由于當(dāng)年小麥種植面積數(shù)據(jù)不完整,耕作制度和灌水條件也無法作定量的分析,這些方面的因素?zé)o法用于預(yù)測預(yù)報。這里選擇用7~9月份的月平均氣溫、月平均降水量、月平均相對濕度,卵的數(shù)量作為預(yù)測因子。
先采用多元線性回歸模型F1,該模型簡單易懂、便于操作計算,目前在國內(nèi)害蟲測報中占統(tǒng)治地位,然而害蟲的發(fā)生與預(yù)測因子間并不是單純的線性關(guān)系。多元多項式回歸模型F2可以看作是多元線性回歸的改進,然而卻主要顧及統(tǒng)計方面的知識,一定程度上忽略了生物學(xué)因素。BP模型F3是處理非線性問題較好的工具,然而該模型更適合處理復(fù)雜的大規(guī)模的非線性動態(tài)時變系統(tǒng)問題。應(yīng)用這3種模型對玉米蚜種群發(fā)生序列進行預(yù)測,將得到的預(yù)測值以及計算得到的誤差平方和(Error Sum Squares, SSE)列于表1。
表1 各模型預(yù)測值、誤差平方和以及單項模型權(quán)重Table 1 Forecasting value,SSE of each model and weight of single model
再采用前面所建立的組合模型,對該問題進行模擬分析,運用1.2中的算法步驟確定各單一模型的權(quán)值,可得組合模型F=0.384F1+0.325F2+ 0.291F3,同樣將處理結(jié)果列于表1。
由表1可以看出,組合模型的預(yù)測結(jié)果明顯優(yōu)于用單一模型的預(yù)測結(jié)果;再從計算的誤差平方和看,組合模型要明顯小于其他單項模型。可以判定組合預(yù)測模型在農(nóng)業(yè)害蟲種群動態(tài)的預(yù)測中是切實可行的。組合預(yù)測模型應(yīng)用于害蟲預(yù)測預(yù)測,以期為研究害蟲生態(tài)提供一種新的方法。
組合預(yù)測是研究復(fù)雜系統(tǒng)非線性變化的十分有效的方法,通過對單項模型的適當(dāng)組合,充分利用了原始數(shù)據(jù)中的信息,避免了單一理論方法的局限性,提高了模型的精度,使得預(yù)測誤差有很大程度的減小,對歷史數(shù)據(jù)的擬合度有很大程度的提高。在對組合預(yù)測模型進行優(yōu)化時,不同方法得到的結(jié)果不同,尋找適合具體研究對象的優(yōu)化方法是組合模型研究的重點。
在應(yīng)用組合預(yù)測模型時,要充分研究預(yù)測對象的特點和變化規(guī)律,采用能夠反映預(yù)測對象變化特點的單項預(yù)測方法。從上述結(jié)果可以看出,組合預(yù)測模型比其他單項預(yù)測模型有更高的預(yù)測精度,達到了運用組合預(yù)測尋求更好預(yù)測結(jié)果的目的。同時說明運用熵權(quán)法尋求組合預(yù)測模型的權(quán)重系數(shù)是有效的。目前的農(nóng)業(yè)害蟲預(yù)測預(yù)報仍然停留在尋求精確的數(shù)學(xué)模型以便最大限度提高預(yù)測精度的階段。組合預(yù)測由于其綜合利用各單項模型的預(yù)測信息,能夠進一步提高預(yù)測精度,受到許多預(yù)測專家的青睞。
在統(tǒng)計預(yù)測預(yù)報中,尋求最好的模型擬合效果仍然是農(nóng)業(yè)害蟲預(yù)測預(yù)報中的主要思想。然而農(nóng)業(yè)害蟲的發(fā)生發(fā)展有著深刻的環(huán)境制約,而環(huán)境的變化是很難把握的,很難運用精確的數(shù)字或者模型進行描述,因此在追求預(yù)測精度逐步提高的同時也要考慮農(nóng)業(yè)害蟲發(fā)生發(fā)展的模糊性和復(fù)雜性。農(nóng)業(yè)害蟲種群動態(tài)受到各種因素的制約,各種因素往往互相影響,很難用精確的數(shù)學(xué)語言進行描述,具有很強的模糊性,在運用組合預(yù)測模型時要充分考慮害蟲種群動態(tài)的這種特點,綜合利用預(yù)測對象提供的各種信息,最大限度的提高預(yù)測的精度。針對農(nóng)業(yè)害蟲種群的特點 ,在應(yīng)用組合預(yù)測模型進行預(yù)測時,如果能夠?qū)⒛:龜?shù)學(xué)[11]、灰色理論[12]等現(xiàn)代數(shù)學(xué)方法結(jié)合起來,該方法將會有廣闊的應(yīng)用前景,這有待進一步的研究。
[1]馬 飛, 程遐年. 害蟲預(yù)測預(yù)報研究進展(綜述)[J].安徽農(nóng)業(yè)大學(xué)學(xué)報,2001, 28 (1): 92~97.
[2]唐小我.預(yù)測理論及其應(yīng)用[M].成都:電子科技大學(xué)出版社,1992.
[3]Bates J M, Granger C W J. Combination of forecasts[J]. Poerations Research Quarterly, 1969,20(4): 451~468.
[4]張 星, 吳菊薪, 陳 惠,等. 基于熵權(quán)的福建糧食產(chǎn)量組合預(yù)測模型[J]. 中國農(nóng)業(yè)氣象, 2008, 29 (2) : 194~196.
[5]謝正文, 胡漢華. 基于熵權(quán)的灰色沉降組合預(yù)測模型及應(yīng)用[J]. 礦業(yè)研究與開發(fā), 2007, 27(4): 12~13.
[6]陳華友. 熵值法及其在確定組合預(yù)測權(quán)系數(shù)中的應(yīng)用[J]. 安徽大學(xué)學(xué)報(自然科學(xué)版), 2003, 27(4): 1~6.
[7]劉兵軍. 電力負荷組合預(yù)測權(quán)重的確定[J]. 電力情報, 2002,(2): 16~17.
[8]馬永開, 唐小我. 線性組合預(yù)測模型優(yōu)化問題研究[J]. 系統(tǒng)工程理論與實踐. 1998,(9): 110~114.
[9]熊崇俊, 寧宣熙, 潘穎莉. 基于熵的組合預(yù)測法研究[J]. 科技進步與對策, 2006,(4): 68~69.
[10]Shannon C E. A mathematical theory of communication[J]. The Bell System Technical Journal, 1948, 379~423.
[11]陳國華, 陳 收, 汪壽陽. 區(qū)間數(shù)模糊投資組合模型[J]. 系統(tǒng)工程, 2007, 25(8): 34~37.
[12]謝孝如, 蔣惠園, 申耀偉. 基于并聯(lián)灰色-線性回歸組合模型的客運量預(yù)測[J]. 鐵道運輸與經(jīng)濟, 2008, 30(8): 92~94.
2008-12-29
梁 鈴(1981-),女(仫佬族),廣西河池人,理學(xué)碩士,助教,主要從事分子生物學(xué)研究.
10.3969/j.issn.1673-1409(S).2009.01.002
S431.9
A
1673-1409(2009)01-S005-03