霍麗峰
(晉中市水文水資源勘測分局,山西 晉中 030600)
我國目前國內(nèi)人均水資源僅為世界人均水平的不到30%,全國用水緊張是近幾年制約國內(nèi)經(jīng)濟(jì)發(fā)展的重要因素之一[1-2]。降雨是補(bǔ)給地表水資源的主要途徑之一,掌握降雨的一般規(guī)律,對國內(nèi)水資源管理有著重要的意義[3]。在水文預(yù)報中,將預(yù)見期為3~15d的降雨預(yù)報稱為中期降雨預(yù)報,而預(yù)見期在15d以上的降雨預(yù)報為長期降雨預(yù)報,目前國內(nèi)對中長期降雨預(yù)報的研究較滯后,成熟度不高[4]。由于中長期降雨預(yù)報過程中涉及到的因素較多,人文、地理等因素均可能影響降雨預(yù)報的最終結(jié)果,因此找出合理的方法進(jìn)行降雨預(yù)報,對國內(nèi)水資源評價及防災(zāi)防洪措施制定有著突出的指導(dǎo)意義[5]。
目前神經(jīng)網(wǎng)絡(luò)模型由于其計算速度快,精度高,已逐漸應(yīng)用到了降雨預(yù)報領(lǐng)域中[6]。
梁國華等[7]基于BP神經(jīng)網(wǎng)絡(luò)模型對旬降雨進(jìn)行了預(yù)報,指出BP模型模擬精度較高,但對5d以上的降雨預(yù)報模擬精度較差;劉樂等[8]基于PCA法改進(jìn)了BP神經(jīng)網(wǎng)絡(luò)模型,改進(jìn)后的模型測試預(yù)報率明顯提高,較原模型提高了50%以上;丁晶等[9]基于人工神經(jīng)網(wǎng)絡(luò)模型預(yù)報月徑流量,結(jié)果表明,人工神經(jīng)網(wǎng)絡(luò)模型用作過渡期徑流預(yù)報可行,且效果優(yōu)于多元回歸方法。
RBF神經(jīng)網(wǎng)絡(luò)模型與BP神經(jīng)網(wǎng)絡(luò)模型是應(yīng)用較廣泛的模型,但2種模型均存在一定的問題。BP網(wǎng)絡(luò)模型收斂速度慢,容易陷入局部極小值,造成計算結(jié)果的不準(zhǔn)確,RBF神經(jīng)網(wǎng)絡(luò)模型則需要較大的數(shù)據(jù)量進(jìn)行訓(xùn)練,否則其精度較低[10-11],同時目前對降雨中長期預(yù)報的模型研究較少。本文基于遺傳算法,分別對RBF神經(jīng)網(wǎng)絡(luò)模型和BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行優(yōu)化,用于預(yù)報中長期降雨,同時可比較4種模型的預(yù)報精度,得出最優(yōu)模型。
將遺傳算法原理應(yīng)用到BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)模型中,可分為3步:
首先,確定神經(jīng)網(wǎng)絡(luò)計算結(jié)構(gòu),確定模型計算長度。本次降雨預(yù)報模型中,神經(jīng)網(wǎng)絡(luò)計算結(jié)構(gòu)指的是模型降雨實(shí)測數(shù)據(jù),確定的實(shí)測數(shù)據(jù)回歸變化趨勢,系統(tǒng)自動形成回歸模型結(jié)構(gòu)。
其次,每個個體通過自適應(yīng)函數(shù)計算個體適應(yīng)度值,找出最優(yōu)解。基于遺傳算法中的交叉、變異處理,優(yōu)化2個神經(jīng)網(wǎng)絡(luò)的權(quán)重賦值計算,通過模型計算權(quán)重,與輸入樣本的個體適應(yīng)度相乘,得出輸出結(jié)果,通過公式(1)計算每個樣本的個體適應(yīng)度:
(1)
式中,Y—表樣本的個體適應(yīng)度值;a—系數(shù);Ei、Fi—第i個節(jié)點(diǎn)的期望輸出和預(yù)測輸出,n—樣本數(shù)量。
通過交叉、變異等處理,選擇合適的個體適應(yīng)度,其中每個個體的選擇概率Pi可用下式計算,最終得出輸出層結(jié)果[12]:
(2)
最后是神經(jīng)網(wǎng)絡(luò)預(yù)測模型的建立,通過計算每個指標(biāo)樣本的個體適應(yīng)度,選出最優(yōu)解,通過模型自動計算每個樣本與實(shí)測值的誤差,驗證預(yù)測值是否滿足要求,若滿足則輸出最終結(jié)果。通過上述步驟,對中長期降雨進(jìn)行預(yù)報。本文用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)(GA-BP)模型和RBF神經(jīng)網(wǎng)絡(luò)模型(GA-RBF),比較不同模型的計算精度。
本文模型模擬結(jié)果評價指標(biāo)體系采用相對均方根誤差(RMSE)、相對誤差(RE)、模型效率系數(shù)(Ens)和決定系數(shù)(R2)綜合分析精度,具體公式如下:
(3)
(4)
(5)
(6)
由于評價指標(biāo)過多,單一的評價指標(biāo)對許多具有不同統(tǒng)計指標(biāo)的模型進(jìn)行排序或比較是很困難的,因此引入全球績效指標(biāo)(GPI)對模型模擬結(jié)果進(jìn)行綜合評價。在計算時需對所有指標(biāo)的值都進(jìn)行了縮放,以防止任何特定統(tǒng)計指標(biāo)出現(xiàn)顯著影響,具體過程見文獻(xiàn)[13]。
GPI指數(shù)的計算公式如下:
(7)
式中,αj—常數(shù),RMSE和RE取1,Ens和R2取-1;gj—不同指標(biāo)的縮放值的中位數(shù);yij—不同指標(biāo)的尺度值。
表1為不同模型計算的中期降雨的精度對比。由表1可以看出,BP模型的計算精度總體低于RBF模型,用遺傳算法改進(jìn)后的GA-RBF模型計算精度同樣高于GA-BP模型。BP模型的RMSE為0.684mm/d,而相對誤差RE達(dá)到了35.78%,綜合GPI指數(shù)來看,GPI為-0.54,其值最小,表明BP模型的精度最低;RBF模型RMSE為0.501mm/d,RE為22.17%,GPI為-0.17,較BP模型精度明顯提高;改進(jìn)后的BP模型和RBF模型GPI分別達(dá)到了0.16和0.47,表明在中期降雨預(yù)報中,RBF模型的計算精度高于BP模型,GA-RBF模型計算精度高于GA-BP模型,GA-RBF模型計算精度最高,可作為降雨中期預(yù)報的模型使用。
表1 中期降雨預(yù)報計算精度對比
圖1為不同模型長期降雨預(yù)報趨勢分析對比。由圖1可以看出,不同模型模擬值與實(shí)測值的變化趨勢基本一致,均呈現(xiàn)開口向下的拋物線型式,降雨主要集中在了每年的3—10月的主要作物生長期,占全年降雨的68.74%左右。改進(jìn)后的GA-BP模型和GA-RBF模型更接近實(shí)測曲線,BP模型曲線在第20個月的時候誤差最高,達(dá)到了27.38%,RBF模型在第20個月和第30個月的誤差較高,分別達(dá)到了26.37%和21.74%。圖中可以清晰看出,GA-BP模型和GA-RBF模型的計算精度明顯較高。
表2為不同模型計算的長期降雨的精度對比。由表2可以看出,不同模型在長期降雨預(yù)報中的精度要明顯高于中期降雨預(yù)報,BP模型、RBF模型、GA-BP模型和GA-RBF模型GPI均有了明顯提高。在長期降雨預(yù)報中,GA-BP模型和GA-RBF模型的計算精度基本一致,GA-RBF模型的計算精度略高,GPI達(dá)到了0.63,而BP模型和RBF模型的計算精度較低,GPI分別為0.27和0.35。表明在長期降雨預(yù)報中,GA-RBF模型的計算精度最高,可作為降雨長期預(yù)報的模型使用。
圖1 長期降雨預(yù)報趨勢分析
計算模型RMSE/(mm/d)RE/%EnsR2GPI指數(shù)BP模型0.48517.480.7930.7870.27GA-BP模型0.2988.670.9710.9780.51RBF模型0.40115.730.8710.8380.35GA-RBF模型0.1975.770.9760.9690.63
本文研究了降雨中長期預(yù)報的標(biāo)準(zhǔn)模型,計算結(jié)果顯示通過遺傳算法優(yōu)化后的RBF神經(jīng)網(wǎng)絡(luò)模型在降雨中長期預(yù)報中表現(xiàn)出了較高的精度,其全球績效指標(biāo)GPI指數(shù)最高,可作為中長期降雨預(yù)報中的標(biāo)準(zhǔn)模型使用。遺傳算法通過模擬達(dá)爾文生物進(jìn)化論的自然選擇和生物進(jìn)化過程的計算模型,更方便了神經(jīng)網(wǎng)絡(luò)模型選取最優(yōu)解,同時貝葉斯概率原理可通過后驗分布的計算結(jié)果迭代算出模型先驗分布的計算結(jié)果,在今后的研究中可將貝葉斯原理應(yīng)用于神經(jīng)網(wǎng)絡(luò)模型中,綜合比較降雨中長期降雨預(yù)報計算精度,進(jìn)一步得出標(biāo)準(zhǔn)模型。