□劉曉璐(河北省石家莊水文水資源勘測局)
水文預(yù)報(bào)時(shí)間序列神經(jīng)網(wǎng)絡(luò)模型
□劉曉璐(河北省石家莊水文水資源勘測局)
水文時(shí)間序列表述的是水文水資源系統(tǒng)在氣象環(huán)境、流域下墊面以及人類活動(dòng)等因素綜合作用后的輸出結(jié)果,其變化規(guī)律呈現(xiàn)隨機(jī)性和確定性特點(diǎn)。在大尺度條件下,水文時(shí)間序列的傳統(tǒng)預(yù)報(bào)模型簡單,且很少考慮環(huán)境噪音因素的影響。伴隨現(xiàn)代化科學(xué)技術(shù)的快速進(jìn)步,國民經(jīng)濟(jì)的管理部門提出了更高的水文水資源預(yù)報(bào)要求,在要求短期預(yù)報(bào)更精準(zhǔn)的基礎(chǔ)上,對中長期預(yù)報(bào)的要求要越來越嚴(yán)格。由于受到相關(guān)科技水平的制約和諸多復(fù)雜因素的影響,當(dāng)前的中長期水文水資源預(yù)報(bào)還處于發(fā)展、探究階段。
水文預(yù)報(bào);時(shí)間序列;神經(jīng)網(wǎng)絡(luò)
水文水資源預(yù)報(bào)表述了水文水資源系統(tǒng)所測的實(shí)時(shí)數(shù)據(jù)以及根據(jù)實(shí)時(shí)數(shù)據(jù)預(yù)測的水文水資源的變化特征的實(shí)測數(shù)據(jù)和變化特征。水文本質(zhì)是一種自然表現(xiàn)跡象,水文時(shí)間序列是對其進(jìn)行觀測后得出的一個(gè)信息樣本,具有離散信號特性。水文時(shí)間序列通常包含兩種成分:一種為確定性成分,具體表現(xiàn)為水文資源的周期性變化和發(fā)展趨勢變化;另一種為隨機(jī)性成分,具體表現(xiàn)為水文資源的純隨機(jī)變化和相依性特點(diǎn)。運(yùn)用不同的數(shù)學(xué)模型去表述水文現(xiàn)象成分,已成為水文時(shí)間序列研究的重點(diǎn)內(nèi)容。
當(dāng)前的水文資源時(shí)間序列預(yù)報(bào)中,應(yīng)用的數(shù)學(xué)模型可分為兩大類:第一大類為用于平穩(wěn)性時(shí)間序列的分析模型,主要有MA(滑動(dòng)平均模型)、AR(自回歸模型)、ARMA(自回歸滑動(dòng)平均模型)等主;第二大類為具備非線性辨識能力的模型,如:雙線性模型和神經(jīng)網(wǎng)絡(luò)模型。從實(shí)質(zhì)上看,自然水文過程具有顯著的不平穩(wěn)性,其時(shí)間序列呈現(xiàn)出顯著非線性特征,因而,根據(jù)水文時(shí)間序列預(yù)報(bào)的數(shù)學(xué)模型特點(diǎn),能準(zhǔn)確表達(dá)水文時(shí)間序列的實(shí)際特征的神經(jīng)網(wǎng)絡(luò)模型最具優(yōu)勢。通常情況下,水文時(shí)間序列預(yù)報(bào)的神經(jīng)網(wǎng)絡(luò)數(shù)學(xué)模型的基本定義為:
式中:Xt為t時(shí)刻之前的不間斷n個(gè)時(shí)間點(diǎn)的時(shí)間序列來預(yù)測t時(shí)刻的相關(guān)未知量,Gt為t時(shí)刻時(shí)間序列數(shù)學(xué)模型的誤差值。
不同時(shí)刻的同一水文要素都存在較大數(shù)值差別,比如:洪峰流量數(shù)值經(jīng)常是基流量數(shù)值的成百上千倍,這種差異的存在,就會(huì)導(dǎo)致水文時(shí)間序列神經(jīng)網(wǎng)絡(luò)數(shù)學(xué)模型的輸入樣本存在較大的數(shù)量級差別。所以在神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練中,必須參照全局?jǐn)?shù)據(jù)誤差修正網(wǎng)絡(luò)模型權(quán)重。為了同時(shí)滿足小樣本和大樣本的要求,就必須通過增加模型的訓(xùn)練次數(shù)來修正網(wǎng)絡(luò)權(quán)重值。
除上述外,各訓(xùn)練樣本在不同量級上存在不一樣的分配。訓(xùn)練后,網(wǎng)絡(luò)權(quán)重保存的信息能夠呈現(xiàn)出訓(xùn)練樣本中占比較高的樣本特點(diǎn)。實(shí)踐中,若輸入量和訓(xùn)練樣本中占比偏高的數(shù)量級樣本,則擁有理想的預(yù)測效果。否則,效果則比較差。怎樣加快神經(jīng)網(wǎng)絡(luò)訓(xùn)練,降低訓(xùn)練樣本分配于不同量級上對神經(jīng)網(wǎng)絡(luò)帶來的影響,這是水文時(shí)間序列引進(jìn)神經(jīng)網(wǎng)絡(luò)必然要思考的問題。本研究通過梳理前人的研究成果,提出了以趨勢辨識理論為主導(dǎo)的神經(jīng)網(wǎng)絡(luò)模型。
隨機(jī)函數(shù),一般是根據(jù)時(shí)間t選擇離散值,因而叫做隨機(jī)或者是時(shí)間序列。具體來看,離散型隨機(jī)過程即叫做時(shí)間序列。水文時(shí)間序列X,通常包含確定性、隨機(jī)性兩個(gè)主要成分。通過線性疊加對水文時(shí)間序列予以描述,可得下式:
式中:iV為確定性非周期成分(如趨勢、突變或者是跳躍);確定性周期成分,即純隨機(jī)成分。
水文時(shí)間序列主要研究因變量(預(yù)報(bào)對象)內(nèi)在變化所遵循的某種規(guī)律,但并沒有牽涉到其他變量。換句話說,水文時(shí)間序列即從因變量身上提取和未來掛鉤的某些信息。
若某水文序列適應(yīng)平穩(wěn)性要求,則其統(tǒng)計(jì)特性不會(huì)根據(jù)絕對時(shí)間的改變而發(fā)生改變。預(yù)報(bào)實(shí)際上是構(gòu)建前后期數(shù)據(jù)相適應(yīng)的定量關(guān)系式,以線性模型最具典型。
設(shè)有一中心化的水文平穩(wěn)序列:
式中:Xt′代表前1個(gè)到前P個(gè)時(shí)間間隔之間的數(shù)據(jù),和加權(quán)系數(shù)之間的乘積相加。白噪聲,通??勺鳛閿M合誤差,也就是:
式中:at~N(0,σ2);假設(shè)at和之前所得的觀測數(shù)據(jù)X′n(n<t)沒有關(guān)聯(lián),則:
該模型,又被叫做階自回歸模型,稱AR(p)。
自回歸模型,是由GV.yule最早予以提出,時(shí)間為1927年。他將諧波序列和隨機(jī)噪聲相互疊加的過程,稱為自回歸過程。1931年,將該種模型產(chǎn)生的序列叫做相關(guān)項(xiàng)序列。1944年,M.GKendall將其命名為線性自回歸序列。目前,通常叫做自回歸模型。.AR(p)數(shù)學(xué)表達(dá)式,可改寫:
人工神經(jīng)網(wǎng)絡(luò),通過學(xué)習(xí)能夠?qū)θ我夥蔷€性進(jìn)行映射,以預(yù)報(bào)非線性系統(tǒng),其具有顯著的優(yōu)越性。熟悉的人工神經(jīng)網(wǎng)絡(luò)模型,主要包含BP、RBF模型。
2.3.1 BP網(wǎng)絡(luò)
BP網(wǎng)絡(luò),又被叫做多層前饋神經(jīng)網(wǎng)絡(luò)。根據(jù)網(wǎng)絡(luò)權(quán)值遵循的調(diào)整規(guī)則,選擇后向傳播學(xué)習(xí)算法,也就是BP學(xué)習(xí)算法。
BP網(wǎng)絡(luò),包含3層甚至更多的神經(jīng)網(wǎng)絡(luò)。BP網(wǎng)絡(luò)主要由輸入層、輸出層以及中間層(隱層)三個(gè)部分組成,每層均包含多個(gè)節(jié)點(diǎn)。上下量層相互連接,每層神經(jīng)元?jiǎng)t相互開放。當(dāng)網(wǎng)絡(luò)接收學(xué)習(xí)樣本后,神經(jīng)元對應(yīng)的激活值便會(huì)從輸入層,通過中間層直接傳播到輸出層,輸出層對應(yīng)得各神經(jīng)元便能夠響應(yīng)網(wǎng)絡(luò)輸入指令。根據(jù)降低目標(biāo)輸出和具體誤差,通過中間層分別對各連接權(quán)值予以修正,然后可返回到輸出層。該算法也被叫做“誤差逆?zhèn)鞑ニ惴ā?,又被稱為BP算法。該誤差修正的持續(xù),有助于更好地提升網(wǎng)絡(luò)響應(yīng)輸入模式的準(zhǔn)確率。
2.3.2 RBF網(wǎng)絡(luò)
20世紀(jì)80年代末期,J.Moody、C.Darken兩人首次提出徑向基函數(shù)RBF神經(jīng)網(wǎng)絡(luò)(又被叫做徑向基網(wǎng)絡(luò))。作為三層前饋網(wǎng)絡(luò),它包含單隱層。實(shí)踐表明,徑向基網(wǎng)絡(luò)可以通過任意精度向所有連續(xù)函數(shù)予以逼近。
目前,學(xué)者已提出神經(jīng)網(wǎng)絡(luò)相關(guān)的多種模型,最常見的,有反向傳播、最小能量、自適應(yīng)共振和雙向聯(lián)想模型等諸多模型。現(xiàn)實(shí)中,上述模型均發(fā)揮十分重要的作用。神經(jīng)元,是難度較小的處理元件。神經(jīng)網(wǎng)絡(luò)中,通過神經(jīng)元來處理各類信息。單個(gè)神經(jīng)元包含多種輸入通道,信息利用該類通道便可輸入至神經(jīng)元,相加和轉(zhuǎn)換函數(shù)后便能夠?qū)⑿畔⒊晒敵觥T摲N輸出信息,加權(quán)后可向下個(gè)神經(jīng)元予以傳輸。不同神經(jīng)元,利用通道可實(shí)現(xiàn)有效連接。
圖1 前向式多層網(wǎng)絡(luò)圖
式中:{Zt},t=1,2,…用以代表平穩(wěn)時(shí)間序列;a1,…,an代表常數(shù)或者時(shí)變參數(shù);根據(jù)誤差方差最小值,或者是AIC準(zhǔn)則最終明確模型。水文預(yù)報(bào)時(shí)間序列相關(guān)的單輸入模型,如下:
式中:Zt為t=1,2,…,N;N表示序列樣本容量;Z表示非線性函數(shù);kεt+k代表任意正整數(shù)(也就是預(yù)報(bào)步數(shù));根據(jù)神經(jīng)網(wǎng)絡(luò)(圖2)中包含的非線性映射予以實(shí)現(xiàn)。
圖2 單輸出水文預(yù)報(bào)時(shí)序神經(jīng)網(wǎng)絡(luò)圖
圖l中,擁有隱含層(也就是中間層)。隱含層中,囊括很多非線性狀態(tài)的隱含元。正因?yàn)殡[含元的上述特征,導(dǎo)致網(wǎng)絡(luò)輸入/出間產(chǎn)生的映射同樣具有非線性,且相對較復(fù)雜,這為構(gòu)建水文預(yù)報(bào)時(shí)間序列模型帶來了幫助。圖中x,i(=1,…,。)主要代表輸入數(shù)據(jù);y,(j一1,一m)則代表輸出數(shù)據(jù);h、(k一1,一n m)則用以代表隱含元輸出值。其關(guān)系如下表:
根據(jù)經(jīng)驗(yàn)、知識層次等,在闡述系統(tǒng)發(fā)展所具有的變化規(guī)律前提下,通過水文水資源、數(shù)學(xué)、計(jì)算機(jī)等理論及相關(guān)方法,可預(yù)報(bào)水文水資源系統(tǒng)在未來某個(gè)階段內(nèi)潛在的變化趨勢,從而為水文決策系統(tǒng)提供可靠的保障。通常,預(yù)報(bào)方法需要構(gòu)建1個(gè)模型,且包含較多的樣本數(shù)據(jù),用以明確模型參數(shù)。不過部分情況下很難明確模型的結(jié)構(gòu)。所以,相關(guān)人員應(yīng)重視研究新的建模方法。
TV124
B
1673-8853(2017)10-0043-02
劉曉璐(1981.12-),女,工程師,主要從事水文情報(bào)預(yù)報(bào)、旱情監(jiān)測、地下水監(jiān)測等方面工作。
2017-8-7
編輯:劉 青