田萬銀,徐華潮
(浙江農林大學林業(yè)與生物技術學院,浙江 臨安 311300)
基于相空間重構及GRNN的海防林害蟲預測及效果檢驗
(浙江農林大學林業(yè)與生物技術學院,浙江 臨安 311300)
考慮到海防林環(huán)境氣候、動植物組成的特殊性及林業(yè)害蟲發(fā)生的非線性、復雜性、無規(guī)律性,通過重構非線性時間序列的相空間并將輸出向量作為廣義回歸神經網絡(GRNN, Generalized Regression Neural Network)的輸入向量對海防林害蟲的發(fā)生進行預測;并使用仙居縣1983-2011年的馬尾松毛蟲(Dendrolimus punctatus)實測數據對該預測方法進行仿真檢驗:1983-2007年蟲害數據用于重構相空間及訓練神經網絡,而2008-2011年的數據用于蟲害發(fā)生的預測檢驗。結果表明,在將仙居縣馬尾松毛蟲的危害程度劃分為四個等級的前提下,預測方法預測精度較高,除了對 2008年馬尾松毛蟲危害程度的預測出現(xiàn)一個數量級的偏差外,其余的預測準確率均為100%。
海防林;相空間重構;混沌時間序列;GRNN;仿真
1989年,林業(yè)部為了保障沿海地區(qū)的生態(tài)安全和經濟社會發(fā)展而啟動了沿海防護林體系工程。該工程對改善生態(tài)環(huán)境,維護生態(tài)平衡,保護沿海人民生存和發(fā)展起著決定性作用[1]。然而,相比于內陸,沿海防護林樹種單一,多以人工純林為主,加上臺風的輔助作用,使得病蟲害較易大范圍發(fā)生。因此,及時有效地對沿海防護林害蟲的發(fā)生進行監(jiān)測和防治十分必要。林業(yè)病蟲害預測預報工作是在病蟲害尚未對林業(yè)造成重大損失之前對病蟲害的發(fā)生狀況和增長趨勢進行預測,從而為病蟲害防治工作提供一定參考依據的一系列技術手段。長期以來,森林病蟲害的預測方法并不少見,如逐步回歸分析[2]、判別分析[3]、模糊聚類分析[4]、馬爾可夫鏈分析[5]、區(qū)劃分析[6]、灰色系統(tǒng)分析[7]以及神經網絡[8]等,董振輝等人甚至還開發(fā)出了病蟲害有蟲面積測報的專用軟件[9]。然而,沿海防護林作為一個特殊的林業(yè)體系,無論是其環(huán)境氣候還是其動植物組成都有別于普通的內陸森林,因而傳統(tǒng)的森林病蟲害預測方法對沿海防護林并不適用。
基于以上問題并充分考慮到林業(yè)害蟲發(fā)生的非線性、無規(guī)律性等特征,本文融合當前熱門的兩種非線性時間序列預測方法,即相空間重構[10-11]及廣義回歸神經網絡(GRNN, Generalized Regression Neural Network)[12-15]對沿海防護林害蟲的發(fā)生進行預測預報。相關研究表明,具有混沌特性的非線性時間序列短期是可預測的,本文通過重構混沌時間序列的相空間,使用輸出向量作為GRNN的輸入向量對害蟲的發(fā)生進行預測并使用沿海城市仙居縣的馬尾松毛蟲(Dendrolimus punctatus)有蟲面積對該測報方法進行效果檢驗?;谙嗫臻g重構及GRNN的害蟲預測方法是林業(yè)特別是海防林害蟲監(jiān)測方面的嶄新嘗試,本研究旨在為該領域的更深入研究提供一定的理論基礎及技術支撐。
1.1 相空間重構
時間序列的相空間重構即由低維時間序列重構出一個多維的確定性相空間,利用混沌相空間重構理論可以還原害蟲發(fā)生時間序列的非線性動力特性,然后使用一定的預測方法可以進行短期害蟲預測。
Takens定理[16~17]認為系統(tǒng)中任一分量的演化都是由與之相互作用著的其他分量所決定的。這些相關分量的信息隱含在任一分量的發(fā)展過程中,重構系統(tǒng)相空間只需考察一個分量,然后通過某些固定時延點上的觀測值找到m維向量后就可以重構出一個等價的相空間。所以,選擇適當的嵌入維數m和時間延遲τ是相空間重構的關鍵。目前計算時間延遲的方法較多,如自相關系數法[18~19]、互信息法[20~21]、C-C法[22]等。計算嵌入維數的方法也有不少,如飽和關聯(lián)維數(Grassberg-Procaccia,G-P)法[23]、偽最近鄰域法、真實矢量場法和Cao方法等。這些方法各有千秋,本文采用自相關系數法計算相空間的時間延遲,采用Cao方法計算嵌入維數。
實際應用中的數據常受噪聲污染,降噪的目的是使數據變得“干凈”以利于對數據進行分析檢測。在重構相空間之前,本文使用小波變換對數據進行降噪處理[24-25]。
1.2 混沌檢測
混沌時間序列判別的基本方法有:功率譜法、Hurst指數法、Lyapunov指數法、關聯(lián)維數法以及Kolmogorov熵等。本文選用最為常用的Lyapunov指數法檢測非線性時間序列的混沌特性。Lyapunov指數是相空間中相近軌道的平均收斂性或平均發(fā)散性的一種度量,是研究混沌的一個重要參數。若系統(tǒng)最大的Lyapunov指數λ1>0,則系統(tǒng)一定是混沌狀態(tài)。計算Lyapunov指數的方法有Jacobian法、Wolf法、小數據量法等,其中以Wolf方法和小數據量法應用最為廣泛,也最為普遍。由于小數據量法編程及操作簡單、計算量小,且對小數據組計算可靠,本文使用小數據量法計算Lyapunov指數。
GRNN是美國學者Donald F. Spect在1991年提出的,它是徑向基神經網絡的一種,GRNN在能力和學習速度上較RBF網絡有更強的優(yōu)勢,網絡最后收斂于樣本量積聚較多的優(yōu)化回歸面,并且在樣本數據較少時,預測效果也較好。此外,GRNN網絡還可以處理不穩(wěn)定的數據。因此,GRNN在信號過程、教育產業(yè)、能源、控制決策系統(tǒng)、金融領域、生物工程等各個領域均得到了廣泛的應用[26-27]。本文使用相空間的輸出向量作為GRNN的輸入向量對海防林害蟲進行預測。
本研究使用浙江省仙居縣森防站提供的 1983-2011年馬尾松毛蟲有蟲面積實測數據進行預測仿真(見表 1)。仙居縣地處浙江省東南部,靠近東海,位于臺州市的西部,東連臨海、黃巖,南鄰永嘉縣,西接縉云縣,北靠東陽市、磐安縣和天臺縣。仙居縣屬于典型的沿海城市,該縣海防林眾多,其中松科植物占據總量的60%以上,該縣的馬尾松毛蟲發(fā)生較早,記錄也較完整。本文使用1983-2007年的有蟲面積數據重構相空間,使用2008-2011年的有蟲面積數據作預測檢驗。
表1 馬尾松毛蟲歷年有蟲面積hm2
3.1 小波降噪
在重構相空間之前,首先使用小波變換對仙居縣 1983-2007年馬尾松毛蟲有蟲面積數據進行降噪處理,輸出結果如圖1。
由圖1可看出,經小波降噪處理后的數據明顯好于原始數據。
3.2 時間延遲及嵌入維數計算
3.2.1 計算時間延遲 自相關系數法計算時間延遲的基本思路是當時間序列的自相關函數下降到初始值的1-1/e時為所確定的時間延遲τ。通過MatlabR2012a編程得到結果如圖2。
圖2中,橫軸表示最大時間延遲,縱軸表示自相關函數。當自相關函數下降到初始值的1-1/e倍時所對應的時間延遲為4,即τ = 4。
圖1 小波降噪
圖2 時間延遲
3.2.2 計算嵌入維數 通過Cao方法判定最小嵌入維數的方法是,當m逐漸增加到E1停止變化或變化波動較小時,m即為最小嵌入維數。通過MatlabR2012a編程后,結果如圖3所示。
由圖3可確定時間序列的最小嵌入維數m為5。
圖3 嵌入維數
3.3 Lyapun ov指數計算
為了判斷仙居縣1983-2007年馬尾松毛蟲有蟲面積是否具有混沌特性,使用小數據量算法計算時間序列Lyapunov指數(表示為λ1),若λ1>0,則該時間序列為混沌時間序列。通過Matlab編程并將τ及m代入計算得λ1=16.13>0,說明有蟲面積時間序列的演變具有混沌特性。
3.4 相空間重構
設1983-2007年共25 a馬尾松毛蟲有蟲面積一維時間序列為X(t0),X(t1),…,X(ti),…,X(tn),首先使用MatlabR2012a編程對時間序列進行相空間重構,相空間重構的輸出結果由式(1)得出。
由于已知τ=4,m=5。因此,原始混沌時間序列經相空間重構后輸入向量結果如表2。
表2 有蟲面積相空間重構結果hm2
3.5 GRNN 預測
由相空間重構結果可確定廣義回歸神經網絡的輸入向量(表2),輸出向量可由式(2)求得:
將τ = 4,m = 5代入(2)式得:
Y1= X21= 1 048,Y2= X22= 746,Y3= X23= 404,Y4= X24= 257,Y5= X25= 436,Y6= X26,Y7= X27,Y8= X28, Y9= X29。使用前5組輸入及輸出向量作為廣義回歸神經網絡的訓練數據,后4組數據作為預測數據。依據馬尾松毛蟲有蟲面積與對林業(yè)危害程度的關系,將馬尾松毛蟲的危害程度劃分為三級,即有蟲面積小于 500 hm2時,危害程度為極輕微,劃為一級;蟲口密度為500 ~ 1 000 hm2時,危害程度為輕微,劃為二級;有蟲面積大于1 000 hm2時為嚴重,劃為三級。使用MatlabR2012a編程后,最終廣義回歸神經網絡的預測輸出結果見圖4、表3。
圖4 預測值與實際值擬合情況
表3 危害程度擬合情況
由GRNN的預測結果可看出,除了2008年對馬尾松毛蟲危害程度的預測出現(xiàn)一個數量級的偏差外,其余基于相空間重構與GRNN的仙居縣馬尾松毛蟲的預測均較準確。經分析,一方面,仙居縣屬于浙江沿海城市,自然災害頻繁,剛好2008年該縣就遭遇了較為嚴重的臺風襲擊,或許因此而導致預測結果出現(xiàn)了一定的偏差。另一方面,可能本文使用的仿真數據量較少而影響了相空間重構,進一步影響了GRNN的訓練,最終導致GRNN的預測偏差。
相空間重構及廣義回歸神經網絡均是研究非線性問題的熱門方法,本文將二者結合起來對海防林害蟲的發(fā)生進行預測更是較為嶄新的嘗試。與傳統(tǒng)方法相比,重構相空間能夠估計出一維時間序列的演化信息并把一維時間序列拓展為包含著各態(tài)信息的多維序列,從而使預測結果跟實際值更加吻合;另外,使用相空間重構的輸出向量作為神經網絡的輸入值避免了選取神經網絡輸入參數時的隨意性;除此之外,最重要的是,沿海防護林作為一個特殊的林業(yè)體系,其環(huán)境氣候、動植物組成都有別與內陸森林,因而本文有針對性地對沿海防護林害蟲的發(fā)生進行預測預報很有意義。
本文中的預測方法在用于對仙居縣馬尾松毛蟲的預測檢驗過程中,由于各方面的原因而導致預測值與實際值出現(xiàn)了較為輕微的偏差,但這并不影響整套預測方法的展示過程。該套預測方法在實際使用過程中,還應根據實際情況選取合適的方法計算各參數值??傊?,沿海防護林病蟲害的預測預報是一項長期而艱巨的任務,作為一個特殊的林業(yè)體系,其病蟲害的預測技術也不應拘泥于傳統(tǒng)的病蟲害預測方法,應具體問題具體分析。
參考文獻:
[1] 谷建才, 陸貴巧, 么鳳居. 論林業(yè)生態(tài)環(huán)境建設的主體地位[J]. 林業(yè)科學, 2000, 36(5): 127-132.
[2] 薛賢清. 在馬尾松毛蟲測報中應用逐步回歸電算方法的研究[J]. 林業(yè)科學, 1984, 20(1): 42-49.
[3] 薛賢清, 馮晉臣, 張石新, 等. 馬尾松毛蟲定量測報的判別分析模型[J]. 南京林產工業(yè)學院學報, 1982(1): 134-153.
[4] 薛賢清, 楊幺明, 史順平, 等. 模糊聚類分析在林業(yè)害蟲測報中應用的研究[J]. 廣東林業(yè)科技, 1986(5): 1-6.
[5] 江土玲, 金崇華. 微電腦在馬尾松毛蟲預測預報中的應用[J]. 森林病蟲通訊, 1986(3): 23-24.
[6] 魏初獎, 莊晨輝, 謝大洋, 等. 福建省馬尾松毛蟲災區(qū)區(qū)劃及其應用[J]. 南京林業(yè)大學學報: 自然科學版, 2002, 26(3): 35-39.
[7] 陳繪畫, 崔相富, 朱壽燕, 等. 馬尾松毛蟲發(fā)生量灰色系統(tǒng)模型的建立及其預報[J]. 東北林業(yè)大學學報, 2004, 32 (4): 19-21.
[8] 陳繪畫, 朱壽燕, 崔相富. 基于人工神經網絡的馬尾松毛蟲發(fā)生量預測模型的研究[J]. 林業(yè)科學研究, 2003, 16(2): 159-165.
[9] 董振輝, 趙鐵良, 閻峻, 等. 森林病蟲害監(jiān)測預報軟件的開發(fā)及應用[J]. 中國森林病蟲, 2002, 21(2): 6-9.
[10] Ham F M, Kostanic I. Principles of Neurocomputing for Science& Engineering[M]. Mc Graw-Hil, 2003.
[11] 呂金虎, 陸君安, 陳士華. 混沌時間序列分析及其應用[M]. 武漢: 武漢大學出版社, 2002.
[12] Specht D F. A general regression neural network[J]. IEEE Transact Neural Networks, 1991, 2(6): 568-576.
[13] Tomandl D, Schober A. A modified general regression neural network (MGRNN) with new, efficient training algorithms as a robust‘black box’-tool for data analysis[J]. Neural Networks, 2001, 14(4): 1 023-1 034.
[14] Chtioui Y, Panigrahi S, Francl L. A generalized regression neural network and its application for leaf wentness prediction to forecast plant disease[J]. Chemomet Intellig Lab Syst. 1999, 48(1): 47-58.
[15] Leung M T, Chen A S, Daouk H. Forecasting exchange rates using general regression neural networks[J]. Comput Operat Res, 2000, 27(4): 1 093-1 110.
[16] Specht D F, Romsdahl H. Experience with adaptive probabilistic neural networks and adaptive general regression neural networks[J]. Proc IEEE World Congr on Comput Intellig, 1994, 2: 1203-1208.
[17] Farzaneh Maleki, Babak Beheshti, Amirhossein Hajihosseini, et al. The Bogdanov Takens bifurcation analysis on a three dimensional recurrent neural network[J]. Neurocomputing, 2010, 73(16-18) : 3066-3078.
[18] Isar Nejadgholi, Mohammad Hasan Moradi, Fatemeh Abdolali. Using phase space reconstruction for patient independent heartbeat classification in comparison with some benchmark methods[J]. Comput Biol Med, 2011, 41(6): 411-419.
[19] Abarbanel H D I, Brown R, Sidorowich J J, et al . The analysis of observed data in physical systems[J]. Rev Mod Phy,1993 ,65 (4) :1331-1392.
[20] Theiler J . Estimating fractal dimension[J]. J Opt Soc Am A , 1990 ,7 (6) :1055-1073.
[21] Fraser A M, Swinney H L. Independent coordinates for strange attractors from mutual in formation[J]. Phys Rev A , 1986 ,33 :1134-1140.
[22] Rosenstein M T, Collins J J, Deluca C J. Reconstruction expansion as a geometry-based framework for choosing proper delay times[J]. Phys D, 1994(73): 82-98.
[23] Kim H S, Eykholt R, Salas J D. Nonlinear dynamics, delay times, and embedding windows [J]. Physica D. 1999, 127(1): 48-60.
[24] Grassberger P, Procaccia I. Measuring the strangeness of strange attractors[J]. Physica D, 1983, 9: 189-208.
[25] Anooshiravan Ansari, Asadollah Noorzad, Hamid Zafarani, et al. Correction of highly noisy strong motion records using a modified wavelet denoising method[J]. Soil Dynam Earthquak Engin, 2010, 30(11): 1168-1181.
[26] Chanerley A A, Alexander N A. Correcting data from an unknown accelerometer using recursive least squares and wavelet denoising[J]. Comput Struct, 2007, 85(21~22): 1679-1692.
[27] 張德豐. MATLAB神經網絡應用設計[M]. 北京: 機械工業(yè)出版社, 2009.
[28] 史峰, 王小川, 郁磊, 等. MATLAB神經網絡30個案例分析[M]. 北京: 北京航空航天大學出版社, 2010.
Coastal Protection Forest Pest Forecasting and Verification Based on Phase Space Reconstruction and GRNN
TIAN Wan-yin,XU Hua-chao
(School of Forestry and Biotechnology, Zhejiang A & F University, Lin’an 311300, China)
In this paper, reconstructed the phase space of the nonlinear time series and used the output vector as the input vector of Generalized Regression Neural Network (GRNN) to predict the occurrence of coastal protection forest pests. The specific method was using wavelet transform, noise reduction processing of the raw data, then calculate the time delay, embedding dimension and Lyapunov exponent, reused calculated data reconstruction phase space. Finally, using the GRNN to predict the test. Simulation test data was from the Xianju County from 1983 to 2011. Specific ideas: pest data of 1983-2007 for the reconstruction phase space and train the neural network, data of 2008-2011 for pest prediction test. The result showed that the prediction has higher prediction accuracy, 2008 (forecast deviation is only an order of magnitude),the rest of the forecast accuracies are all 100%. In short, the phase space reconstruction and Generalized Regression Neural Networks are all popular method to research nonlinear problems, this paper combined them as a new attempt to predict the occurrence of coastal protection forest pests.
coastal protection forest; phase space reconstruction; chaotic time series; GRNN; simulation
S727.2
A
1001-3776(2014)01-0065-05
2013-09-26;
2014-01-17
浙江省科技廳重大科技專項重點項目(2010C12029)
田萬銀(1985-),男,貴州畢節(jié)人,碩士,從事森林昆蟲學研究:通訊作者。