劉振男,周靖楠
(貴州理工學(xué)院,貴州 貴陽 550001)
作為對農(nóng)業(yè)生產(chǎn)影響最大的一類自然災(zāi)害,干旱由于發(fā)生幾率大、持續(xù)時(shí)間久、隨機(jī)性強(qiáng)等特征,增加了對其預(yù)測與防治的難度,從而導(dǎo)致了許多環(huán)境與經(jīng)濟(jì)問題,如何提高預(yù)測干旱的精度問題成為當(dāng)今研究的一個(gè)熱點(diǎn)。隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,干旱預(yù)測的技術(shù)也經(jīng)歷了跨域式的革命,由最初的應(yīng)用歷史資料和天氣學(xué)統(tǒng)計(jì)相關(guān)、相似等方法迅速的發(fā)展到了應(yīng)用數(shù)理統(tǒng)計(jì)及計(jì)算機(jī)軟件等方法進(jìn)行預(yù)測的階段[1],其中,灰色系統(tǒng)理論[2]、森林隨機(jī)模型[3]、ARIMA模型[4]、PSO-LSSVM[5]等方法都已成功的應(yīng)用于干旱預(yù)測,而在大量現(xiàn)代研究技術(shù)手段中,人工神經(jīng)網(wǎng)絡(luò)模型(Artificial Neural Network,ANN)無疑是應(yīng)用最為廣泛、最適用于解決非線性問題的方法。劉代蘭等[6]成功的利用ANN模型對于河西走廊伏旱進(jìn)行了預(yù)測。雖然ANN的預(yù)報(bào)精度高并且本身具備較強(qiáng)的非線性擬合能力,但其也固有很多缺點(diǎn)。比如ANN的權(quán)值和閾值一般是通過隨機(jī)初始化為[-0.5,0.5]區(qū)間的隨機(jī)數(shù),這個(gè)初始化的參數(shù)對神經(jīng)網(wǎng)絡(luò)訓(xùn)練的影響很大,但是又無法準(zhǔn)確獲得,鑒于此,趙廷紅等[7]與王笑宇等[8]引入多種群遺傳算法對BP神經(jīng)網(wǎng)絡(luò)的初始的權(quán)值和閾值進(jìn)行了優(yōu)化,分別成功的應(yīng)用到了重力壩變形預(yù)測與降雨預(yù)報(bào)中,以得到更好的預(yù)測效果,但至今還沒有文獻(xiàn)描述過利用文中的改進(jìn)模型對干旱進(jìn)行預(yù)測的效果,因此,本文將MPGA-BP模型應(yīng)用到干旱預(yù)測當(dāng)中,并選取SSTA作為模型的輸入因子對越南蓋河流域的干旱進(jìn)行了預(yù)測。
BP神經(jīng)網(wǎng)絡(luò)是多層前饋神經(jīng)神經(jīng)網(wǎng)絡(luò)算法,這種算法主要是在神經(jīng)網(wǎng)絡(luò)訓(xùn)練的過程中,采用誤差反向傳播的學(xué)習(xí)算法來不斷調(diào)整神經(jīng)網(wǎng)絡(luò)的權(quán)值。由于其結(jié)構(gòu)簡單,可調(diào)整的參數(shù)多,訓(xùn)練算法靈活,可操作性高而被廣泛應(yīng)用。BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)主要由輸入層、隱含層及輸出層構(gòu)成,同層的各個(gè)節(jié)點(diǎn)之間沒有連接,不同層之間的節(jié)點(diǎn)相連接,如圖1所示。
圖1 BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
針對BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值對預(yù)測結(jié)果的影響較大,并且該值的選取隨機(jī)性大的缺點(diǎn),本文應(yīng)用多種群遺傳算法對BP神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,主要優(yōu)化初始權(quán)值、閾值、適應(yīng)度函數(shù)以及遺傳算子。
多種群遺傳算法(MPGA)較標(biāo)準(zhǔn)的遺傳算法(SGA)的不同在于:一是采用多個(gè)種群進(jìn)行尋優(yōu)并行計(jì)算,對不同種群設(shè)置不同的控制參數(shù)值;二是增加了移民算子和人工選擇算子,移民算子作為一個(gè)媒介將互異的不同種群聯(lián)系起來,它的作用是增加了各種群間的信息交互,而人工選擇算子則負(fù)責(zé)挑選各種群中最佳個(gè)體至精華種群并儲(chǔ)存,詳細(xì)原理請參見文獻(xiàn)[7,8],MPGABP的流程圖如圖2所示。
MPGA-BP神經(jīng)網(wǎng)絡(luò)主要步驟如下:
Step1:構(gòu)造BP神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)(確定待優(yōu)化的權(quán)值和閾值的數(shù)量);
Step2:對多個(gè)初始種群進(jìn)行遺傳操作(確定誤差計(jì)算公式以及適應(yīng)度函數(shù));
Step3:選擇運(yùn)算(根據(jù)適應(yīng)度值確定各個(gè)基因的選擇概率參數(shù));
圖2 MPGA-BP神經(jīng)網(wǎng)絡(luò)算法流程圖
Step4:遺傳算子操作(根據(jù)選擇算子得到的概率,對新種群進(jìn)行交叉、變異等基本操作);
Step5:移民算子操作(在新種群之間淘汰最差基因,保留最佳基因);
Step6:人工選擇算子操作(選擇存儲(chǔ)每個(gè)種群中最優(yōu)基因);
Step7:判斷終止條件(將優(yōu)化后的權(quán)值和閾值應(yīng)用到BP神經(jīng)神經(jīng)網(wǎng)絡(luò));
Step8:優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)對訓(xùn)練樣本進(jìn)行訓(xùn)練、對測試樣本進(jìn)行測試得到最終結(jié)果。
蓋河流域圖 3所示(12°02’49” – 12°36’13”N,108°40’03” – 109°11’38”E)位于越南慶和省,流域面積約 1,889 km2、流域長 62 km2、平均寬度31 km、流域平均坡度為25.5%。流域具有熱帶季風(fēng)氣候與海洋性氣候特征。流域多年平均降雨量為1,656 mm,每年5月底至12月初為雨季,9月至11月為主要降雨期,雨量占全年總降雨量的55%左右;多年的平均氣溫為26.7℃;多年蒸發(fā)量為1 200-1 800 mm/a。
降雨和溫度數(shù)據(jù):為研究越南蓋河流域的干旱情況,收集了越南慶和省慶永氣象站1983年1月至2012年12月的逐日降雨及溫度數(shù)據(jù)。
圖3 研究區(qū)域圖
SSTA 數(shù)據(jù):NinoW 區(qū)域(15°N-0°S;130°E-150°E)的 SSTA數(shù)據(jù)搜集自 http://apdrc.soest.hawaii.edu。該數(shù)據(jù)在收集之前已經(jīng)經(jīng)過標(biāo)準(zhǔn)化處理。數(shù)據(jù)時(shí)間為1982年至2012年。
預(yù)報(bào)因子對于預(yù)測模型的成功應(yīng)用起著至關(guān)重要的作用,因此,本文選用了SSTA作為改進(jìn)模型MPGA-BP的輸入因子,因?yàn)檠芯繀^(qū)域的干旱與海氣耦合現(xiàn)象厄爾尼諾和南方濤動(dòng)(El Nino and the Southern Oscillation,ENSO)有很強(qiáng)的相關(guān)關(guān)系,特別是與太平洋海域的NinoW區(qū)域的關(guān)系最為強(qiáng)烈[9]。
McKee等[10]提出的標(biāo)準(zhǔn)降水指數(shù)(Standardized Precipitation Index,SPI)能進(jìn)行不同時(shí)間尺度的計(jì)算,是一種有效干旱監(jiān)測和評估的工具。因此,本文將使用時(shí)間尺度為3個(gè)月的SPI指數(shù)作為模型輸出因子來預(yù)測干旱,因?yàn)闀r(shí)間尺度為3個(gè)月的SPI值能夠比較準(zhǔn)確的反映季節(jié)性干旱,與農(nóng)業(yè)干旱關(guān)系密切[11]。
2.4.1 模型訓(xùn)練
本文將整理的數(shù)據(jù)集分為訓(xùn)練集與測試集兩部分,訓(xùn)練集為1983年至2008年,測試集為2009年至2012年。根據(jù)MPGA-BP神經(jīng)網(wǎng)絡(luò)算法流程圖,應(yīng)用MATLAB軟件編程,模型相關(guān)參數(shù)設(shè)置如表1所示,為了客觀評價(jià),選用統(tǒng)計(jì)回歸模型、BP神經(jīng)網(wǎng)絡(luò)與MPGA-BP神經(jīng)網(wǎng)絡(luò)進(jìn)行比較,其中,BP神經(jīng)網(wǎng)絡(luò)與MPGA-BP神經(jīng)網(wǎng)絡(luò)相同的參數(shù)設(shè)置一致,統(tǒng)計(jì)回歸模型預(yù)測利用SPSS軟件完成。預(yù)測模型結(jié)構(gòu)如表2所示。
表1 模型參數(shù)表
表2 模型結(jié)構(gòu)表
其中,SSTA在NinoW區(qū)域的值用SSTA-NW表示,SSTA-NW(1)表示與SPI相同時(shí)間段的值;SSTA-NW(2)表示的是SPI前1個(gè)月的值;SSTA-NW(3)表示SPI前2個(gè)月的值,依此類推。例如,在M2中,預(yù)測時(shí)間尺度為3個(gè)月的3月的SPI的值,采用3月的 SSTA-NW(1)、2月的 SSTA-NW(2)及1月的SSTA-NW(3)的值作為輸入因子進(jìn)行預(yù)測。鑒于篇幅原因,本文只針對模型M5的進(jìn)行詳細(xì)的評價(jià)分析,因?yàn)槟P蚆5的輸入變量數(shù)量大于其他模型,實(shí)際證明該模型的預(yù)測效果最佳。
2.4.2 結(jié)果分析
為了簡單直觀的比較各個(gè)模型性能優(yōu)劣,使用均方根誤差(Root-mean-square error,RMSE)與相關(guān)系數(shù)(Correlation coefficient,CORR)來衡量三個(gè)模型預(yù)測的精度。
通過對數(shù)據(jù)的訓(xùn)練和擬合,MPGA-BP神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)與統(tǒng)計(jì)回歸模型預(yù)測過程線如圖4所示,三種模型預(yù)測結(jié)果如表3所示,預(yù)測性能比較如表4所示.
圖4 模型預(yù)測結(jié)果對比圖
表3 預(yù)測結(jié)果表
時(shí)間 實(shí)測值 統(tǒng)計(jì)回歸 BP MPGA-BP預(yù)測值 絕對誤差 預(yù)測值 絕對誤差 預(yù)測值 絕對誤差2011月4月 0.41 0.80 0.39 0.37 0.04 0.49 0.08 2011月5月 0.87 0.64 0.23 0.70 0.17 0.77 0.10 2011月6月 0.55 0.58 0.03 0.52 0.03 0.57 0.02 2011月7月 1.05 0.61 0.44 1.02 0.03 1.07 0.02 2011月8月 0.95 0.82 0.13 0.70 0.25 1.08 0.13 2011月9月 0.43 0.80 0.37 0.38 0.05 0.50 0.07 2011月10月 0.63 0.16 0.47 0.34 0.29 0.47 0.16 2011月11月 -0.02 0.42 0.44 0.69 0.71 0.31 0.33 2011月12月 0.20 0.13 0.07 0.32 0.12 0.28 0.08 2012月1月 -0.09 0.08 0.17 -0.40 0.31 0.23 0.32 2012月2月 0.48 0.21 0.27 0.23 0.25 0.27 0.21 2012月3月 1.63 0.48 1.15 0.86 0.77 1.53 0.10 2012月4月 2.07 1.56 0.51 1.61 0.46 1.98 0.09 2012月5月 1.84 1.73 0.11 1.50 0.34 1.95 0.11 2012月6月 1.47 1.21 0.26 1.15 0.32 1.31 0.16 2012月7月 0.82 1.10 0.28 2.32 1.50 1.36 0.54 2012月8月 -0.19 0.72 0.91 0.77 0.96 0.30 0.49 2012月9月 0.50 -0.23 0.73 -0.16 0.66 0.34 0.16 2012月10月 0.08 0.52 0.44 -0.24 0.32 -0.28 0.36 2012月11月 -0.18 0.33 0.51 -0.77 0.59 -0.82 0.64 2012月12月 -0.74 -0.39 0.35 -0.75 0.01 -0.34 0.40
表4 預(yù)測性能對比表
通過對比圖4、表3、表4可以發(fā)現(xiàn),統(tǒng)計(jì)回歸模型預(yù)測的效果最差,其次是BP模型,最佳的則是MPGA-BP模型,導(dǎo)致這樣的原因是該干旱預(yù)測模型的輸入因子與輸出因子是復(fù)雜的非線性關(guān)系,而回歸模型主要適用于線性關(guān)系。圖5給出了三種模型預(yù)測誤差曲線。從圖5可知,MPGA-BP神經(jīng)網(wǎng)絡(luò)的預(yù)測誤差較BP神經(jīng)網(wǎng)絡(luò)與統(tǒng)計(jì)回歸模型的預(yù)測誤差更小,說明MPGA-BP神經(jīng)網(wǎng)絡(luò)比BP神經(jīng)網(wǎng)絡(luò)不僅精度有了提升,而且擬合度也有了一定的提高,更適用于研究區(qū)域的干旱預(yù)測,結(jié)果更可靠、性能更穩(wěn)定。
圖5 模型預(yù)測誤差對比圖
(1)MPGA-BP神經(jīng)網(wǎng)絡(luò)較BP神經(jīng)網(wǎng)絡(luò)具有明顯的性能優(yōu)勢,提高了研究區(qū)域的干旱預(yù)測的精度。
(2)MPGA-BP神經(jīng)網(wǎng)絡(luò)適用于研究區(qū)域的短期干旱預(yù)測。
(3)MPGA-BP神經(jīng)網(wǎng)絡(luò)的運(yùn)行時(shí)間偏慢的問題未得到解決,主要是由于遺傳算法的交叉和變異概率為一常量,導(dǎo)致子代個(gè)體產(chǎn)生隨機(jī)性大,父代優(yōu)良基因易被破壞,如何解決上述問題,加快遺傳算法的全局尋優(yōu)能力是今后重點(diǎn)研究的一個(gè)問題。
參考文獻(xiàn):
[1]遲道才,張?zhí)m芬,李雪,等.基于遺傳算法優(yōu)化的支持向量機(jī)干旱預(yù)測模型[J].沈陽農(nóng)業(yè)大學(xué)學(xué)報(bào),2013,44(2):190-194.
[2]劉代勇,梁忠民,趙衛(wèi)民,等.灰色系統(tǒng)理論在干旱預(yù)測應(yīng)用中的應(yīng)用研究[J].水力發(fā)電,2012,38(2):10-12.
[3]吳晶,陳元芳,余勝男.基于隨機(jī)森林模型的干旱預(yù)測研究模型[J].中國農(nóng)村水利水電,2016,11:17-22.
[4]白致威,張雷,王杰,等.基于ARIMA模型的云南氣象干旱預(yù)測研究[J].人民長江,2015,46(15):6-9.
[5]孟錦根.基于PSO-LSSVM的干旱區(qū)中長期降水預(yù)測模型研究[J].長江科學(xué)院院報(bào),2016:20160010-20160010.
[6]劉洪蘭,張強(qiáng),張俊國,等.BP神經(jīng)網(wǎng)絡(luò)模型在伏旱預(yù)測中的應(yīng)用-以河西走廊為例[J].中國沙漠,2015,35(2):474-478.
[7]趙廷紅,張賽.基于MPGA-BP的重力壩變形預(yù)測研究[J].蘭州理工大學(xué)學(xué)報(bào),2016,42(5):122-127.
[8]王笑宇,劉暢,王國玖,等.基于 MPGA-BP模型的降雨預(yù)報(bào)研究[J].水電能源科學(xué),2017,35(4):6-9
[9]Nguyen L.B.,Li Q.F.,Nguyen V.T.Effects of ENSO on SPEI/SPI drought indices in the Vietnam Songcai basin[J].Advanced Civil,Urban and Environmental Engineering,2014,157:453-464.
[10]McKee,T.B.,Doesken,N.J. ,Kleist,J.The relationship of drought frequency and duration to time scales[C].In:8th Conf.on Applied Climatology,Anaheim,California,1993,179-184.
[11]車少靜,李春強(qiáng),申雙和.基于SPI的近41年(1965-2005)河北省旱澇時(shí)空特征分析[J].中國農(nóng)業(yè)氣象,2010,31(1):137-143.