劉 倪,葉金印
(1.南京大學大氣科學學院,江蘇南京 210093;2.淮河流域氣象中心,安徽蚌埠 233000)
基于RBF神經(jīng)網(wǎng)絡馬爾可夫模型的淮河流域汛期暴雨量預測
劉 倪1,2,葉金印2
(1.南京大學大氣科學學院,江蘇南京 210093;2.淮河流域氣象中心,安徽蚌埠 233000)
利用淮河流域1960-2007年172個臺站汛期(6-9月)逐日降水資料,選取40個代表站,統(tǒng)計出代表站48年間逐年汛期暴雨量并建立時間序列,針對RBF神經(jīng)網(wǎng)絡和馬爾可夫預測的優(yōu)缺點,建立起RBF神經(jīng)網(wǎng)絡與馬爾可夫模型相耦合的預測模型,并將該模型應用于淮河流域2006-2007年汛期暴雨量預測,預測結果令人滿意。
RBF神經(jīng)網(wǎng)絡;馬爾可夫模型;暴雨量預測
淮河干流發(fā)源于河南省桐柏山,東流經(jīng)豫、皖、蘇三省,在江蘇三江營入長江,全長1000 km,總落差200m,平均比降約萬分之二?;春恿饔蚨嗄昶骄涤炅繛?83mm,50%~80%的降雨量集中在6-9月,且降雨年際變化大,豐水年的雨量多達枯水年的5倍;地區(qū)分布也不均勻,北部沿黃地區(qū)平均年降雨量為600~700mm,而南部及西部山區(qū)平均年降雨量可達900~1400mm。
淮河流域地理位置特殊,氣候條件復雜,流域平原廣闊,地勢低平,洼地易澇面積廣,人水爭地矛盾突出,加之歷史上黃河長期奪淮,使淮河失去了獨立的入海通道,造成淮河水系紊亂,環(huán)境惡化,加重了其水旱災害,這些因素共同決定了淮河流域是一個水旱災害頻繁發(fā)生的地區(qū)?;春又饔騼?nèi)跨省河道多,河流上下游、左右岸、干支流等水事關系復雜,矛盾多,各方利益難以平衡,治理工作難度大;且干旱和水污染問題也十分突出。因此,研究淮河流域暴雨預測方法就顯得尤為重要且迫切。本文利用RBF神經(jīng)網(wǎng)絡與馬爾可夫鏈預測的優(yōu)勢,建立一個基于RBF神經(jīng)網(wǎng)絡與馬爾可夫鏈的組合預測模型,并利用該模型對淮河流域2006-2007年汛期暴雨量進行預測,驗證其可行性,以期為相關研究提供參考。
本文所用資料為淮河流域氣象中心整編的淮河流域4?。ê幽?、江蘇、安徽、山東)172個監(jiān)測站1960-2007年汛期(6-9月)逐日氣象資料,以此為基礎統(tǒng)計出淮河流域40個代表站逐年汛期暴雨量并建立時間序列。代表站點的選擇主要依據(jù)以下標準:一是由于各站建站年代參差不齊,本著使所建時間序列盡可能長的原則,選取1960年及以前建站的站點,排除1961年及更晚建的站點;二是剔除51年中站點變動較大的測站;三是臺站等級要高,盡量選擇基準站和基本站。
RBF神經(jīng)網(wǎng)絡是由Moody和Darken在1989年提出的,它模擬了人腦中局部調(diào)整、相互覆蓋接受域的神經(jīng)網(wǎng)絡結構,具有很強的生物背景和逼近任意非線性函數(shù)的能力。它是一種三層前饋式神經(jīng)網(wǎng)絡,其拓撲結構如圖1所示。根據(jù)圖中箭頭從左到右分別為輸入層、隱含層和輸出層。輸入層節(jié)點只傳遞輸入信息到隱含層,隱含層節(jié)點對輸入信號在局部產(chǎn)生響應,即當輸入信號靠近基函數(shù)的中央范圍時隱含層節(jié)點產(chǎn)生較大輸出,輸出層節(jié)點通常是簡單的線性函數(shù),徑向基函數(shù)網(wǎng)絡也稱為局部感知場網(wǎng)絡。
RBF網(wǎng)絡的學習過程分為2個階段:第1階段,根據(jù)所有輸入樣本決定隱含層各節(jié)點的徑向基函數(shù)的中心值和徑向基函數(shù)的寬度;第2階段,在決定好隱含層的參數(shù)后,根據(jù)樣本,求出輸出層的權值。由此可見,確定中心和權值是RBF的關鍵任務。事實上,一旦確定了徑向基函數(shù)的中心,則對于所有的訓練樣本而言,基函數(shù)和預期輸出是已知的,輸出權值可以由最小二乘法等方法求出。因此建立RBF神經(jīng)網(wǎng)絡的核心問題是根據(jù)給定的訓練樣本確定徑向基函數(shù)的中心。
圖1 徑向基網(wǎng)絡的結構
馬爾可夫鏈是一種特殊的隨機過程,其基本原理是:按照某系統(tǒng)的發(fā)展,時間可離散為n=0,1,2,3,…,對每個系統(tǒng)的狀態(tài)可用隨機變量表示,并且對應一定的概率,稱為狀態(tài)概率。當系統(tǒng)由某一階段狀態(tài)轉(zhuǎn)移到另一階段狀態(tài)時,在這個轉(zhuǎn)移過程中,存在著轉(zhuǎn)移的概率,稱之為轉(zhuǎn)移概率。馬爾可夫鏈預測是根據(jù)初始的狀態(tài)概率向量和狀態(tài)轉(zhuǎn)移矩陣來推測某一變量未來某一時期所在狀態(tài)的一種方法。
3.1 狀態(tài)劃分
根據(jù)馬爾可夫鏈將數(shù)據(jù)劃分為多個不同的狀態(tài),分別用E1,E2,…,Em來表示,并且狀態(tài)轉(zhuǎn)移只在t1,t2,…,tm等可數(shù)時刻發(fā)生。
3.2 狀態(tài)轉(zhuǎn)移概率
馬爾可夫鏈由狀態(tài)Ei經(jīng)過K步轉(zhuǎn)移到狀態(tài)Ej的轉(zhuǎn)移概率用Pij(k)表示:
Pij(k)=mij(k)/Mi。
式中,Mi表示狀態(tài)Ei出現(xiàn)的總次數(shù),mij(k)表示狀態(tài)Ei經(jīng)過K步轉(zhuǎn)移到狀態(tài)Ej的次數(shù),m為劃分的狀態(tài)的數(shù)目,則一步狀態(tài)轉(zhuǎn)移概率矩陣如下:
反復使用C-K方程(切普曼-柯爾莫哥洛夫方程),則K步的轉(zhuǎn)移概率矩陣為:
3.3 預測模型
若某一變量初始狀態(tài)Ei的初始向量為P(0),經(jīng)過K步轉(zhuǎn)移后的狀態(tài)向量為:
優(yōu)選法是以較少的試驗次數(shù)找到最優(yōu)方案的方法,其中最常用的就是黃金分割法。黃金分割率可以有效地應用于最優(yōu)方案的選擇。將其推廣,黃金分割率亦可以有效地應用于馬爾可夫鏈狀態(tài)區(qū)間的劃分。設某指標z的均值為Z,黃金分割率A=0.618,則該指標可按下式計算分割點N,實現(xiàn)t個量級的劃分:
其中,s和量級t可依據(jù)指標z的值域大小來選取。
5.1 建模原理
RBF神經(jīng)網(wǎng)絡馬爾可夫預測的基本思路:首先建立RBF神經(jīng)網(wǎng)絡預測模型,再運用馬爾可夫模型,對由RBF神經(jīng)網(wǎng)絡預測得到的結果進行分析,探明其誤差的波動幅度與波動發(fā)展趨勢,獲得誤差的狀態(tài)轉(zhuǎn)移概率矩陣,并據(jù)此矩陣對RBF神經(jīng)網(wǎng)絡預測結果進行修正,每個預測值被修正為一組由概率狀態(tài)表示的預測區(qū)間值。
5.2 RBF神經(jīng)網(wǎng)絡模型建模
首先應用相關分析計算,求得年汛期暴雨量數(shù)據(jù)的自相關系數(shù)。結果表明,年汛期暴雨量與其之前1,2,5,6,7年的相關度最大。因此,選取前1,2,5,6,7年的汛期暴雨量資料(5個數(shù)據(jù))作為RBF輸入,當年的汛期暴雨量作為網(wǎng)絡輸出,以此構造RBF神經(jīng)網(wǎng)絡模型。選擇1967-2007年的年汛期暴雨量數(shù)據(jù)作為樣本,進行RBF神經(jīng)網(wǎng)絡的訓練擬合。并利用訓練好的RBF神經(jīng)網(wǎng)絡預測1967-2007年的年汛期暴雨量,以驗證該方法的有效性,預測結果見表1。
5.3 劃分狀態(tài)區(qū)間
計算得到RBF預測值的歸一化相對誤差均值為0.213,采用黃金分割率法對狀態(tài)區(qū)間進行劃分。考慮到數(shù)據(jù)量較多的實際情況,公式取s=-1,1和0,可得區(qū)間[0,0.1316],(0.1316,0.213],(0.213,0.3447],(0.3447,1]。再利用X=Xmin+X’(Xmax-Xmin)式將各區(qū)間還原最終馬爾可夫狀態(tài)區(qū)域劃分為如下4種狀態(tài):[-0.188,-0.0621],(-0.0621,0.0158],(0.0158,0.1419]和(0.1419,0.769]。
表1 RBF神經(jīng)網(wǎng)絡汛期暴雨量預測結果
5.4 “馬氏性”檢驗
計算出統(tǒng)計量X2=19.88。取置信度a=0.05,查表得X((m-1)2)=16.919,可知X2>((m-1)2),認為該年暴雨量序列符合“馬氏性”。
5.5 計算轉(zhuǎn)移概率矩陣
由劃分好的狀態(tài)區(qū)間,求得一步概率轉(zhuǎn)移矩陣:
兩步狀態(tài)轉(zhuǎn)移矩陣為:
2005年作為初始狀態(tài)向量為:P(0)=[0,0.75,0.25,0],則下一年(2006年)的狀態(tài)為:P(0)×P(1)=[0.1365,0.412,0.3925,0.059],再用公式:
求得預測值的值域區(qū)間。式中Xt(0)為RBF網(wǎng)絡的預測值;X(0)(t)為還原后的預測值;q為原狀態(tài)區(qū)間的分界值。
由Xt(0)(2006)=247.163,可得待測年預測值區(qū)間[208.05,232.712],(232.712,251.13],(251.13,288.035],[288.035,1069.97],且預測值處于上述區(qū)間的概率分別為13.65%,41.2%,39.25%,5.9%,可知X(0)(2006)處于(251.13,288.035]的概率最大,所以?。?51.13,288.035]為待測值的預測區(qū)間。
類似地,Xt(0)(2007)=362.392,X(0)(2007)處于區(qū)間[305.044,341.203],(341.203,368.21],(368.21,422.319],[422.319,1568.797]的概率分別為13.39%,48.59%,32.81%,5.21%,可知X(0)(2007)處于(341.203,368.21]的概率最大,所以取(341.203,368.21]為待測值的預測區(qū)間。
表2可知,2年的實測值剛好皆以最大概率落入所屬區(qū)間內(nèi),可見預測方法成功,達到了較高的預測準精度,從而說明RBF經(jīng)網(wǎng)絡馬爾可夫模型可應用于淮河流域汛期暴雨預測。
表2 神經(jīng)網(wǎng)絡預測與馬爾科夫神經(jīng)網(wǎng)絡預測結果比較
由表2可知,RBF神經(jīng)網(wǎng)絡馬爾可夫模型預測誤差較RBF神經(jīng)網(wǎng)絡預測誤差要小,可見前者預測精度更高,而且前者給出了預測區(qū)間及對應的概率,比直接使用RBF神經(jīng)網(wǎng)絡更能反映汛期暴雨量的變化狀態(tài),更有說服力。
本文利用RBF神經(jīng)網(wǎng)絡與馬爾可夫鏈預測的優(yōu)勢,建立了基于RBF神經(jīng)網(wǎng)絡與馬爾可夫鏈的組合預測模型,并運用該模型對淮河流域2006-2007年汛期暴雨量進行了預測。計算結果分析表明,基于RBF神經(jīng)網(wǎng)絡的馬爾科夫模型預測效果較好。該方法預測精度高,簡便實用,可操作性強。此外,本文嘗試利用黃金分割法對狀態(tài)區(qū)間進行劃分,經(jīng)驗證,方法可行。
[1] 孫才志,林學鈺.降水預測的模糊權馬爾可夫模型及應用[J].系統(tǒng)工程學報,2003,18(4):294-299.
[2] 劉倪,夏偉,吳曉蔚,等.幾種參考作物蒸散量計算方法的比較[J].河北科技大學學報,2009,30(1):17-24.
[3] 仲遠見,李靖,王龍.改進馬爾可夫鏈降雨量預測模型的應用[J].濟南大學學報:自然科學版,2009,23(4):402-405.
[4] 沈永梅,丁衛(wèi)林.加權馬爾可夫鏈預測模型在降水量預測中的應用[J].江蘇工業(yè)學院學報,2009,21(2):54-56.
[5] 王學雷,邵惠鶴,李亞芬.一種徑向基函數(shù)神經(jīng)網(wǎng)絡在線訓練算法及其在非線性控制中的應用[J].信息與控制,2001,30(3):249-253.
[6] 顧明.多層神經(jīng)網(wǎng)絡在入侵檢測中的應用[J].計算機工程與設計,2007,28(8):1792-1794.
[7] 胡江林,涂松柏,馮光柳.基于人工神經(jīng)網(wǎng)絡的暴雨預報方法探討[J].熱帶氣象學報,2004,19(4):422-428.
(責任編輯:高 峻)
S421
A
0528-9017(2014)08-1256-04
文獻著錄格式:劉倪,葉金印.基于RBF神經(jīng)網(wǎng)絡馬爾可夫模型的淮河流域汛期暴雨量預測[J].浙江農(nóng)業(yè)科學,2014(8):1256-1259.
2014-04-01
劉 倪(1983-)男,安徽舒城人,工程師,從事天氣預報研究工作。E-mail:121265225@qq.com。