張承慧,錢振松,孫文星,姬 鵬,胡 婧
(1. 山東大學(xué)控制科學(xué)與工程學(xué)院,濟(jì)南 250061;2. 山東師范大學(xué)管理與經(jīng)濟(jì)學(xué)院,濟(jì)南 250014;3. 中國科學(xué)院地理科學(xué)與資源研究所,北京 100101)
赤潮預(yù)測是當(dāng)今國內(nèi)外赤潮研究領(lǐng)域中一個重要研究方向.近年來赤潮頻繁爆發(fā),破壞了正常的海洋生態(tài)系統(tǒng)平衡,嚴(yán)重危害了海洋漁業(yè)資源和海產(chǎn)養(yǎng)殖業(yè),并造成了巨大的經(jīng)濟(jì)損失,因此,開展赤潮預(yù)測研究有重要意義和實(shí)際應(yīng)用價值.目前,已有多位學(xué)者利用神經(jīng)網(wǎng)絡(luò)算法構(gòu)建了不同的赤潮預(yù)測模型[1-5],取得了一定研究成果.其中Joseph等建立了基于BP神經(jīng)網(wǎng)絡(luò)的赤潮預(yù)測預(yù)警模型[3];馬玉梅等[4]采用了附加動量法的 BP網(wǎng)絡(luò)算法對赤潮進(jìn)行預(yù)測預(yù)警;王洪禮等[5]建立了基于模糊神經(jīng)網(wǎng)絡(luò)赤潮預(yù)測模型.但是現(xiàn)有基于神經(jīng)網(wǎng)絡(luò)的赤潮預(yù)測模型大多采用標(biāo)準(zhǔn) BP學(xué)習(xí)算法,并且多為單項預(yù)測模型,存在預(yù)測精度低、穩(wěn)定性差和信息利用率低的問題.
針對目前赤潮神經(jīng)網(wǎng)絡(luò)預(yù)測模型的不足,筆者提出了一種赤潮組合預(yù)測模型,該模型基于誘導(dǎo)有序加權(quán)平均(induced ordered weighted average,IOWA)算子與Levenberg-Marquardt back propagation(LMBP)神經(jīng)網(wǎng)絡(luò)算法.首先針對赤潮頻發(fā)的特點(diǎn)選擇輸入變量,進(jìn)而通過多組對比實(shí)驗(yàn)確定最優(yōu)LMBP網(wǎng)絡(luò)結(jié)構(gòu),然后引入IOWA算子,將單項LMBP神經(jīng)網(wǎng)絡(luò)預(yù)測的輸出結(jié)果按照擬合精度的高低順序賦權(quán),建立赤潮組合預(yù)測模型,并給出確定最優(yōu)權(quán)值的計算方法.
人工神經(jīng)網(wǎng)絡(luò)理論在處理非線性模式識別方面已表現(xiàn)出了很好的特性,BP網(wǎng)絡(luò)是目前應(yīng)用最為廣泛的一種前饋神經(jīng)網(wǎng)絡(luò)模型,具有較強(qiáng)的自學(xué)習(xí)能力和處理非線性問題的能力.但是標(biāo)準(zhǔn)BP算法的收斂速度慢,且在訓(xùn)練過程中易陷入局部極小點(diǎn),從而導(dǎo)致模型精度不高[6].1994年,Hagan等[7]首次提出使用L-M數(shù)值優(yōu)化算法對BP網(wǎng)絡(luò)進(jìn)行改進(jìn),在一定程度上克服了標(biāo)準(zhǔn)BP算法的上述缺點(diǎn).
圖1所示為S1維輸入、S3維輸出的BP網(wǎng)絡(luò),上一層的輸出為下一層的輸入,網(wǎng)絡(luò)結(jié)構(gòu)為 S1-S2-S3,字母上標(biāo)表示網(wǎng)絡(luò)層序號.
圖1 前向神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Multi-layer feed-forward neural network structure
對于一個 M 層的神經(jīng)網(wǎng)絡(luò),其前向傳播過程可以表示為
式中:k=0,1,…,M-1;n 為 k+1 層輸入;a 為該層的輸出;f為傳遞函數(shù);w為兩層神經(jīng)元之間的權(quán)值;b為閾值.
針對常用單項預(yù)測模型信息源利用不夠廣泛的問題,Bates等[8]于 1969年首次系統(tǒng)闡述了組合預(yù)測的概念,并證明了2種或2種以上無偏的單項預(yù)測模型可以組合出優(yōu)于每個單項模型的預(yù)測結(jié)果,從而有效提高了預(yù)測精度,改善了預(yù)測結(jié)果.因此,組合預(yù)測受到國內(nèi)外預(yù)測學(xué)者的重視.然而,盡管傳統(tǒng)組合預(yù)測模型能夠在一定程度上綜合各個單項模型的有效信息,優(yōu)化單項預(yù)測結(jié)果,但是其問題在于:同一單項模型在某一樣本區(qū)間上各個時刻的加權(quán)平均系數(shù)是相同的.針對上述問題,Yager[9-10]于 1999年提出了誘導(dǎo)有序加權(quán)平均(IOWA)算子,依據(jù)各單項預(yù)測模型在不同時刻預(yù)測精度的高低來賦權(quán),很好地克服了此問題.
定義表明 IOWA算子是對誘導(dǎo)值 v1, v2, v3,… ,vm按從大到小順序排列后所對應(yīng)的 a1, a2, a3,… ,am中的數(shù)進(jìn)行有序加權(quán)平均,wi與數(shù) ai的大小和位置無關(guān),而與其誘導(dǎo)值 vi所在的位置有關(guān).
3.1.1 數(shù)據(jù)樣本選取與數(shù)據(jù)規(guī)范化預(yù)處理
2007年 7—8月間,煙臺四十里灣海域爆發(fā)了赤潮,持續(xù)時間達(dá) 1個月.期間國家海洋局北海分局煙臺海洋環(huán)境監(jiān)測中心站對該海域進(jìn)行了有效監(jiān)測.本文選取47組完整數(shù)據(jù),并將前37組樣本用作網(wǎng)絡(luò)訓(xùn)練樣本,后10組樣本用作網(wǎng)絡(luò)測試樣本,部分監(jiān)測數(shù)據(jù)如表 1所示.監(jiān)測的 10種理化因子為:水溫、透明度、pH值、鹽度、化學(xué)耗氧量(COD)、溶解氧(DO)、磷酸鹽、總氮、葉綠素a和浮游植物密度.
為了滿足LMBP網(wǎng)絡(luò)輸入輸出對數(shù)據(jù)的要求,同時避免測試結(jié)果出現(xiàn)較大誤差,在進(jìn)行訓(xùn)練網(wǎng)絡(luò)及測試前,必須要對輸入輸出數(shù)據(jù)進(jìn)行統(tǒng)一的規(guī)范化處理,按式(3)進(jìn)行規(guī)范化處理,使其在 0.1~1.0范圍內(nèi).
表1 北海分局四十里灣部分監(jiān)測數(shù)據(jù)Tab.1 Partial monitoring data of Yantai Sishili Bay collected by North China Sea branch, SOA
3.1.2 選取輸入變量、激勵函數(shù)并確定最優(yōu) LMBP網(wǎng)絡(luò)結(jié)構(gòu)
到目前為止,在世界范圍內(nèi)赤潮發(fā)生機(jī)制方面的研究尚未取得重要突破,因此對煙臺四十里灣海域進(jìn)行赤潮預(yù)測的建模過程中,為了能得到更加準(zhǔn)確的預(yù)測結(jié)果,選擇模型的輸入亦是一個難點(diǎn).
由于理化因子的測量誤差不可避免,輸入越多,引入的干擾就可能越多,特別是無關(guān)因子的引入,不僅會導(dǎo)致模型的精度降低,更會延長網(wǎng)絡(luò)的訓(xùn)練時間,因此本文選取單個理化因子作為網(wǎng)絡(luò)輸入,即分別以水溫、透明度、pH值、鹽度、化學(xué)耗氧量(COD)、溶解氧(DO)、磷酸鹽、總氮和葉綠素a作為LMBP網(wǎng)絡(luò)的輸入.
不同的激勵函數(shù)對網(wǎng)絡(luò)的性能如收斂速度等也有重要影響,但是目前并沒有完善的理論來確定網(wǎng)絡(luò)激勵函數(shù),故本文中采用實(shí)驗(yàn)方法,以10次網(wǎng)絡(luò)誤差(mean squared error,MSE)的平均值最低為目標(biāo),最終選取 tansig、purelin分別作為隱含層、輸出層的激勵函數(shù).具體結(jié)果如表2所示.
表2 不同隱含層、輸出層激勵函數(shù)選取的實(shí)驗(yàn)結(jié)果Tab.2 Average MSE of different hidden and output activate functions
由于單隱層的 BP網(wǎng)絡(luò)即可以逼近任意的非線性映射,故在本文實(shí)驗(yàn)中采用了單隱層的網(wǎng)絡(luò)結(jié)構(gòu),并以均方誤差MSE最小為原則,通過多次比對實(shí)驗(yàn),確定最優(yōu)隱含層神經(jīng)元的個數(shù).
基于以上方法,采用 MATLAB,7編程,以批處理方式進(jìn)行網(wǎng)絡(luò)訓(xùn)練,網(wǎng)絡(luò)誤差指標(biāo)設(shè)定為 0.005,最大訓(xùn)練次數(shù)設(shè)定為 200次,分別以 tansig、purelin作為隱含層、輸出層的激勵函數(shù),最終確定了 9組分別以單個理化因子為輸入的、浮游植物密度為輸出的、單隱層的單項LMBP神經(jīng)網(wǎng)絡(luò),具體見表3.
表3 輸入變量組合及最優(yōu)LMBP網(wǎng)絡(luò)結(jié)構(gòu)Tab.3 Groups of input variables and the optimal structure Tab.3 of LMBP neural networks
本文提出的組合預(yù)測模型,首先構(gòu)造了9個單入單出LMBP網(wǎng)絡(luò)預(yù)測模型,然后利用IOWA算子將9個單項網(wǎng)絡(luò)輸出的浮游植物密度預(yù)測值進(jìn)行集結(jié),最后以均方誤差 MSE和平均相對誤差(mean relative percentage error,MRPE)作為評價指標(biāo),評價該組合預(yù)測模型的預(yù)測效果,并通過擬合對比圖進(jìn)行直觀顯示.結(jié)構(gòu)如圖2所示.
下面將詳細(xì)論述如何利用 IOWA算子進(jìn)行信息集結(jié),共需經(jīng)過誘導(dǎo)因子計算、誤差信息方陣計算、最優(yōu)化模型建立和最優(yōu)權(quán)系數(shù)計算4個步驟.
圖2 IOWA算子組合預(yù)測模型結(jié)構(gòu)Fig.2 Structure of combination forecast model based on Fig.2 IOWA operator
3.2.1 計算誘導(dǎo)因子
設(shè)某參數(shù)序列的測量值為 { xt, t = 1 ,2,… ,N },設(shè)有m種可行的單項預(yù)測方法對其進(jìn)行預(yù)測,其中第 i種預(yù)測方法第 t時刻的預(yù)測值為 xit,并有 i = 1,2,… ,m,t = 1,2,… ,N.則 ait表示第i個預(yù)測模型第t時刻的預(yù)測精度,顯然ait∈ [ 0 , 1].把預(yù)測精度 ait看成預(yù)測值 xit的誘導(dǎo)值,這樣第 t時刻 m種單項預(yù)測模型預(yù)測精度和其對應(yīng)的預(yù)測值就構(gòu)成了m個二維數(shù)組,即
設(shè)W=(w , w , w , … ,w )T為單項預(yù)測模型在組合
1 2 3m預(yù)測中的有序加權(quán)平均向量,將 m個單項預(yù)測模型第t時刻預(yù)測精度序列 a1t, a2t, a3t, … ,amt按從大到小的順序排列,設(shè) a - index(it)是第 t時刻第 i個大的預(yù)測精度的下標(biāo),根據(jù)IOWA算子定義,則式(5)稱為由預(yù)測精度序列 a1t, a2t, a3t, … ,amt產(chǎn)生的誘導(dǎo)有序加權(quán)平均組合預(yù)測值[11].
取表 3所得最優(yōu) LMBP網(wǎng)絡(luò) 10次實(shí)驗(yàn)的平均輸出值,作為組合預(yù)測模型的輸入,根據(jù)式(4)計算誘導(dǎo)因子,具體如表4所示.
表4 誘導(dǎo)因子Tab.4 Induced index of 10 different LMBP neural networks
3.2.2 計算誤差信息方陣
令 ea-index(it)= xt-xa-index(it),于是N個模型總的預(yù)測
誤差平方和F為
因此,新的誘導(dǎo)有序加權(quán)平均組合預(yù)測模型可表示為
3.2.3 計算最優(yōu)權(quán)系數(shù)
根據(jù)式(7),得出最優(yōu)化模型,即
計算得出組合預(yù)測模型最優(yōu)權(quán)系數(shù)為 l1=0,l2=0,l3=0,l4=0,l5=0,l6=0,l7=0.788 9,l8=0.211 1,l9=0.
組合預(yù)測模型的IOWA最優(yōu)權(quán)系數(shù)表明,輸入分別為磷酸鹽、總氮的2個單輸入單輸出LMBP網(wǎng)絡(luò)預(yù)測模型的權(quán)系數(shù)為非零,其他7個單輸入單輸出LMBP網(wǎng)絡(luò)預(yù)測模型的權(quán)系數(shù)為零.其意思是指組合預(yù)測值是分別為磷酸鹽、總氮的2個單輸入單輸出LMBP網(wǎng)絡(luò)預(yù)測模型預(yù)測值的最優(yōu)線性加權(quán)值,其他的單項預(yù)測模型預(yù)測值為冗余信息,即煙臺四十里灣海域赤潮的頻繁爆發(fā)與磷酸鹽和總氮的濃度密切相關(guān),而與其他理化因子的濃度相關(guān)不大.顯然,即使傳統(tǒng)的模型與本文提出的IOWA算子最優(yōu)組合預(yù)測模型獲得相同的預(yù)測結(jié)果,其實(shí)際含義也是不同的.
表5 誤差信息方陣ETab.5 Square matrix of error E
為了驗(yàn)證組合預(yù)測模型(記為 IOWA 模型)的有效性,本文根據(jù)相同的方法構(gòu)造了 3個 LMBP網(wǎng)絡(luò)預(yù)測模型:輸入為磷酸鹽、網(wǎng)絡(luò)結(jié)構(gòu)為 1-8-1的單輸入單輸出 LMBP網(wǎng)絡(luò)預(yù)測模型(記為 L-LMBP模型);輸入為總氮、網(wǎng)絡(luò)結(jié)構(gòu)為 1-7-1的單輸入單輸出LMBP網(wǎng)絡(luò)預(yù)測模型(記為 D-LMBP模型);輸入為磷酸鹽和總氮、網(wǎng)絡(luò)結(jié)構(gòu)為 2-6-1的雙輸入單輸出LMBP網(wǎng)絡(luò)預(yù)測模型(記為LD-LMBP模型).選取6組測試樣本進(jìn)行測試,采用MATLAB 7編程,以批處理方式進(jìn)行網(wǎng)絡(luò)訓(xùn)練,網(wǎng)絡(luò)誤差指標(biāo)設(shè)定為 0.005,最大訓(xùn)練次數(shù)設(shè)定為 200次,分別以 tansig、purelin作為隱含層、輸出層的激勵函數(shù),以 MRPE和 MSE作為評價指標(biāo)對 4個模型預(yù)測效果進(jìn)行評價.最終的實(shí)驗(yàn)結(jié)果如表6所示.
表6 預(yù)測模型預(yù)測性能對比Tab.6 MRPE and MSE for 4 different models
從表 6可以看出,L-LMBP模型、D-LMBP模型及LD-LMBP模型預(yù)測結(jié)果的平均相對誤差(MRPE)和均方誤差(MSE)均大于 IOWA模型的平均相對誤差 2.77% 和均方誤差 7.866,3×10-4.這充分說明基于IOWA算子的最優(yōu)組合預(yù)測模型能夠有效提高赤潮預(yù)測精度,改善預(yù)測效果.
圖 3~圖 6是 4種預(yù)測模型預(yù)測的浮游植物密度值與真實(shí)樣本值的對比,縱坐標(biāo)均為浮游植物密度,橫坐標(biāo)均為測試樣本號.從圖 3中可以看出組合模型預(yù)測值與目標(biāo)值非常接近,預(yù)測效果良好;其他3種模型預(yù)測值在某些時刻誤差相對較大,表明其穩(wěn)定性有待提高.圖 4為組合預(yù)測模型預(yù)測值與真實(shí)樣本值的對比,圖 5為 2種單輸入的 LMBP模型預(yù)測值與真實(shí)值的對比,圖 6為雙輸入的 LMBP模型預(yù)測值與真實(shí)值的對比.
圖3 4種模型預(yù)測值與真實(shí)值對比Fig.3 Comparison of real and four models predicted values
圖4 IOWA預(yù)測值與真實(shí)值對比Fig.4 Comparison of real and IOWA model predicted values
圖5 L-LMBP、D-LMBP預(yù)測值與真實(shí)值對比Fig.5 Comparison of real and L-LMBP,D-LMBP predicted values
本文提出的赤潮組合預(yù)測模型,采用煙臺四十里灣赤潮監(jiān)測數(shù)據(jù)進(jìn)行實(shí)驗(yàn),對浮游植物密度進(jìn)行預(yù)測,取得了較好的預(yù)測效果,均方誤差為7.866,3×10-4,并且表明了煙臺四十里灣海域赤潮的頻繁爆發(fā)與磷酸鹽及總氮兩個理化因子密切相關(guān).將本模型預(yù)測結(jié)果與 LMBP神經(jīng)網(wǎng)絡(luò)模型預(yù)測結(jié)果進(jìn)行對比,實(shí)驗(yàn)結(jié)果充分證明,本文提出的組合預(yù)測模型預(yù)測更加穩(wěn)定,預(yù)測精度更高.
[1]Lek S,Guégan J F. Artificial neural networks as a tool inecological modeling:An introduction[J].Ecological Modeling,1999,120(23):65-73.
[2]Velo-Suárez L,Gutiérrez-Estrada J C. Artificial neural network approaches to one-step weekly prediction ofDinophysis acuminatablooms in Huelva(Western Andalucía,Spain)[J].Harmful Algae,2007,6(3):361-371.
[3]Lee J H W,Yan H,Dickman M,et al. Neural network modeling of coastal algal blooms[J].Ecological Modeling,2003,159(2/3):179-201.
[4]馬玉梅,高靜宇,王清華,等. 基于人工神經(jīng)網(wǎng)絡(luò)的赤潮預(yù)測模型[J]. 海洋預(yù)報,2007,24(1):38-44.
Ma Yumei,Gao Jingyu,Wang Qinghua,et al. Forecast model for red tide on artificial neural network[J].Marine Forecasts,2007,24(1):38-44(in Chinese).
[5]王洪禮,葛 根,李悅雷. 基于模糊神經(jīng)網(wǎng)絡(luò)(FNN)的赤潮預(yù)警預(yù)測研究[J]. 海洋通報,2006,25(4):36-41.
Wang Hongli,Ge Gen,Li Yuelei. Research on the prediction of red tide based on the fuzzy neural network[J].Marine Science Bulletin,2006,25(4):36-41(in Chinese).
[6]Melesse A M,Krishnaswamy J,Zhang K. Modeling coastal eutrophication at Florida Bay using neural networks[J].Journal of Coastal Research,2008,24(2):190-196.
[7]Hagan M T,Menhaj M B. Training feedforward networks with the Marquardt algorithm[J].IEEE Trans Neural Net,1994,5(6):989-993.
[8]Bates J M,Granger C W J. The combination of forecasts[J].Operational Research Quarterly,1969,20(4):451-468.
[9]Yager R R. Induced ordered weighted averaging operators[J].IEEE Transactions on Systems,Man,and Cybernetics,1999,29(2):141-150.
[10]Yager R R. Induced aggregation operators[J].Fuzzy Sets and Systems,2003,137(1):59-69.
[11]陳華友,蔡正高. 誘導(dǎo)有序加權(quán)平均的組合預(yù)測模型及其應(yīng)用[J]. 安徽大學(xué)學(xué)報:自然科學(xué)版,2005,29(1):1-6.
Chen Huayou,Cai Zhenggao. Combined forecasting model based on induced ordered weighted averaging operator and its application[J].Journal of Anhui University:Natural Science Edition,2005,29(1):1-6(in Chinese).