計亞麗,賈克力,李暢游,吳 用,楊 芳,尹琳琳
(內(nèi)蒙古農(nóng)業(yè)大學 水利與土木建筑工程學院,呼和浩特 010018)
降水的形成受到海陸位置、地形、氣壓帶、風帶、季風、氣旋、洋流、下墊面及人類活動的因素的影響,是一個非常復雜的非線性系統(tǒng)[1]。混沌理論(Chaos Theory)是確定性和內(nèi)在隨機性的一體,揭示了系統(tǒng)運動中有序與無序間相互轉(zhuǎn)化的辯證關系。目前,在水科學領域,混沌理論主要應用在水文時間序列性質(zhì)的判定和非線性預測模型上[2-5]。為了在高維空間中恢復混沌吸引子,Takens提出了嵌入定理和相空間重構(gòu)的理論,研究者們在此基礎上提出了諸多具有混沌特性的水文時間序列預測模型。其中,最小二乘支持向量機(Least Squares Support Vector Machine,LS-SVM)是在支持向量機的基礎上采用二次損失函數(shù)的一種改進算法,利用等式約束取代支持向量機的不等式約束。LS-SVM把支持向量機的訓練轉(zhuǎn)化為線性方程組的求解,避免了求解二次規(guī)劃問題,降低了計算過程的復雜度,極大地提高了訓練速率,在非線性預測方面和模式識別領域的應用日漸廣泛。徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡預測模型是一個具有輸入層、隱含層、輸出層的3層網(wǎng)絡結(jié)構(gòu)的前饋型人工神經(jīng)網(wǎng)絡預測模型,具有較強的非線性預測能力[6]。本文依據(jù)相空間重構(gòu)理論對烏爾遜河流域的月降雨時間序列進行混沌性判斷,然后使用上述兩種混沌時間序列預測模型對烏爾遜河流域的月降雨時間序列進行比較研究。
相空間重構(gòu)是水文現(xiàn)象混沌性識別和非線性預測的前提。相空間重構(gòu)目的在于刻畫出水文系統(tǒng)的混沌吸引子的關聯(lián)度,揭示傳統(tǒng)方法無法展示的水文時間序列變化規(guī)律。
按照Takens定理[7],采用延遲坐標法,對混沌時間序列{x1,x2,x3,…,xN}進行相空間重構(gòu):
其中Yi向量序列的長度為M=N-(m-1)τ,τ為延遲時間,m為嵌入維數(shù)。在相空間重構(gòu)時,關鍵在于確定延遲時間τ和嵌入維數(shù)m的確定,嵌入維數(shù)m應符合m≥2D+1(D為吸引子維數(shù))。
對于延遲時間τ的選擇,目前有很多方法,最常用的有自相關函數(shù)法、互信息法和廣義相關積分法。由于自相關函數(shù)法計算簡單,對數(shù)據(jù)量的要求不大,因此使用最為廣泛。
自相關函數(shù)法延遲時間τ計算公式為:
式中 rτ為滯時τ時的自相關系數(shù)值;x1,x2, …,xN為月降雨時間序列,x軃為時間序列均值。
對于嵌入維數(shù)的確定,目前亦有很多方法,其中飽和關聯(lián)維數(shù)法(簡稱C-P法)由于概念明確、直觀而備受研究者偏愛。
式中 Xi,Xj為重構(gòu)狀態(tài)空間中的相點;M為重建后的狀態(tài)空間數(shù)據(jù)點的數(shù)目, 即M=N-(m-1)τ;m為狀態(tài)空間嵌入維數(shù);r為以Xi為中心的m嵌入空間中的球體的半徑;H為Heaviside函數(shù),是一個單位階躍函數(shù),即:x≤0時,H(x)=0,x>0時,H(x)=1;‖Xi-Xj‖為歐氏距離;C(r)為關聯(lián)積分,即所有相空間的點對中,距離小于r的數(shù)目在所有相點中所占的比例。
水文時間序列的混沌特性識別方法主要有飽和關聯(lián)維數(shù)法、最大Lyapunov指數(shù)法、Kolmogorov熵法等。主要使用動力系統(tǒng)在整個吸引子或無窮長的軌道上平均后得到的特征量[4]。使用Lyapunov指數(shù)法判斷非線性復雜動力系統(tǒng)是否具有混沌特性[8],必須滿足:①至少存在一個正的Lyapunov指數(shù);②至少有一個Lyapunov指數(shù)等于0;③Lyapunov指數(shù)之和為負[7]。最大Lyapunov指數(shù)的計算公式為:
設混沌時間序列經(jīng)重構(gòu)后的M個輸入輸出數(shù)據(jù)對為[Xi(n),Yi(n)],Xi(t)∈Rm,yi(t)∈R,i=1,2,…M。
(1)根據(jù)相空間重構(gòu)理論計算出最小嵌入維數(shù)m和最佳延遲時間τ,重構(gòu)相空間。本文采用自相關系數(shù)法選取延遲時間τ,采用飽和關聯(lián)維數(shù)法中常用C-P算法確定最小嵌入維數(shù)m;
(2)構(gòu)造樣本數(shù)據(jù)對:
式中 Xi(i=1,2,…,M)為預測輸入數(shù)據(jù);yi(i=1,2,…,M)為其所對應的輸出數(shù)據(jù)。
(3)對于已給定的混沌時間序列訓練樣本數(shù)據(jù)集,(Xi,yi),i=1,2,…,M,可利用高維空間中的線性函數(shù)來擬合樣本。
非線性映射準(xi)把時間序列數(shù)據(jù)集從輸入空間映射到特征空間,是為了將輸入空間的非線性擬合問題轉(zhuǎn)化為高維特征空間中的線性擬合問題,并且把相應的預測問題轉(zhuǎn)化為優(yōu)化問題,LS-SVM的優(yōu)化目標函數(shù)為:
用最小二乘法求出系數(shù)αi和常值偏差b,得出混沌時間序列LS-SVM預測模型:
RBF主要是基于神經(jīng)網(wǎng)絡的函數(shù)非線性逼近功能對降雨時間序列進行分析預測的。在RBF神經(jīng)網(wǎng)絡中,隱含層神經(jīng)元通過基函數(shù)執(zhí)行一種非線性變化,將輸入空間映射到一個新的特征空間,輸出層神經(jīng)元則在這個新的特征空間中實現(xiàn)數(shù)據(jù)的線性加權(quán)組合。RBF神經(jīng)網(wǎng)絡預測模型中使用的基函數(shù)仍然是徑向基核函數(shù),并且其徑向基核函數(shù)的中心向量被定義為網(wǎng)絡輸入層到連接層的權(quán)向量[13-14]。對于任意輸入向量X∈RN,RN為輸入樣本集,則隱含層單元的輸出為:
式中 Ri(x)為隱含層第i個單元的輸出;X為N維輸入向量;Ci為隱含層第i個單元徑向基核函數(shù)的中心點;σi為第i個隱含層神經(jīng)元的歸一化參數(shù);m為隱含層神經(jīng)元數(shù)。
使用RBF神經(jīng)網(wǎng)絡模型進行預測,需要通過學習和訓練來確定徑向基核函數(shù)的中心點Ci,σi,和網(wǎng)絡權(quán)值等參數(shù),一般按如下步驟進行:
(1)采用K-means聚類方法對訓練樣本是輸入量進行聚類,找出聚類中心Ci和σi參數(shù);
(2)在確定了Ci和σi后,RBF神經(jīng)網(wǎng)絡預測模型從輸入到輸出就成了一個線性方程組:
式中 r為輸出神經(jīng)元數(shù);ωik為網(wǎng)絡權(quán)值。
此時,可以通過最小二乘法來求解網(wǎng)絡的權(quán)值ωik。
烏爾遜河流域是呼倫湖流域的子流域,流域面積5980.7km2,位于內(nèi)蒙古東北部,流域內(nèi)主要是平坦草原,降雨主要被植被截留和土壤吸收,近年來水量有逐漸減小的趨勢,降雨對其有很大影響。
本文主要研究烏爾遜河流域坤都冷水文站1961~2007年的實測月降雨資料,時間序列長度為564個,滿足混沌特性分析所需要的時間序列長度。
4.2.1 采用自相關函數(shù)確定延遲時間
一般情況下,當自相關函數(shù)隨滯時衰減明顯時,延遲時間取自相關函數(shù)第1次通過零點時所對應的滯時。當滯時很大自相關函數(shù)才趨于零時,延遲時間τ取自相關函數(shù)第1次小于時所對應的滯時[6,10]。本文取自相關函數(shù)第1次通過零點時所對應的滯時為延遲時間τ。得出烏爾遜河流域月降雨時間序列的最佳延遲時間為τ=2。
4.2.2 確定嵌入維數(shù)
確定嵌入維數(shù)時,使嵌入維數(shù)m=2,3,4…,以1為變幅逐漸增加,繪制lnC(r)~lnr關系圖,如果存在無標度區(qū),即直線段,則表明時間序列樣本存在混沌特性,且直線段的斜率,就是關聯(lián)維數(shù)D(m)[15-16]。 借助matlab工具進行計算。 圖1是烏爾遜河流域月降雨時間序列時間序列的lnC(r)~lnr關系圖。圖2可以看出,隨嵌入維數(shù)m的增大,關聯(lián)維數(shù)D(m)趨于穩(wěn)定,當m≥8時,關聯(lián)維數(shù)出現(xiàn)飽和D=3.1119。符合Takens定理的m≥2D+1條件。由此可見,烏爾遜河流域月降雨時間序列具有混沌特性,同時,使用最大Lyapunov指數(shù)法,由公式(4)計算,得到最大Lyapunov指數(shù)為0.0782。最大Lyapunov指數(shù)大于0,表明具有混沌特性[17-19]。
圖1 lnC(r)~lnr關系圖
圖2 D~m關系圖
由相空間重構(gòu)和混沌特性識別可知,烏爾遜河流域月降雨時間序列具有混沌特性,因此,使用LS-SVM預測模型和RBF神經(jīng)網(wǎng)絡預測模型對烏爾遜河流域月降雨混沌時間序列進行模擬和預測。利用前552個數(shù)據(jù)作為訓練數(shù)據(jù),后12個數(shù)據(jù)作為擬合數(shù)據(jù),使用MATLAB的LS-SVM工具箱對LS-SVM預測模型進行學習,在擬合、預測精度目標控制下進行優(yōu)選,最后確定模型參數(shù)為γ=10,σ=0.458;使用DPS(DPS9.50)數(shù)據(jù)處理系統(tǒng)中的RBF神經(jīng)網(wǎng)絡預測模型進行網(wǎng)絡學習[6],并依據(jù)誤差變化過程確定出合理的網(wǎng)絡結(jié)構(gòu),最終確定出烏爾遜河月降雨時間序列的RBF神經(jīng)網(wǎng)絡預測模型的輸入層節(jié)點數(shù)為8,隱含層節(jié)點數(shù)為6,輸出層節(jié)點數(shù)為1。
表1為2007年烏爾遜河流域月降雨時間序列LS-SVM和RBF神經(jīng)網(wǎng)絡預測模型的預報結(jié)果。
表1 LS-SVM和RBF神經(jīng)網(wǎng)絡模型預測結(jié)果比較
(1)LS-SVM的混沌時間序列預測模型在水文系統(tǒng)的時間序列預測方面還沒有完全成熟,處于試驗探索階段。根據(jù)混沌時間序列固有的確定性和非線性,LS-SVM能夠把輸入向量映射到高維特征空間中來提取數(shù)據(jù)之間的信息。利用混沌系統(tǒng)的相空間重構(gòu)理論,建立LS-SVM的混沌時間序列預測模型。但是應用在年降雨量不足300mm,且降雨主要集中在7、8月份的干旱、半干旱地區(qū),其預測精度還不能達到滿意的程度,有待進一步研究。
(2)RBF神經(jīng)網(wǎng)絡預測模型雖然在DSP(9.50)數(shù)據(jù)處理系統(tǒng)中已經(jīng)能夠應用,并能夠進行簡單快捷的運算,在如降雨量較小的1、2月份及11、12月份,擬合誤差較大,有待進一步改進。
(3)有待建立適于干旱半干旱地區(qū)的簡便、訓練速度快、擬合精度高的降雨時間序列預測模型。
[1]陳超君,倪長健.攀西地區(qū)月降水時序非線性特性分析[J].高原山地氣象研究,2011,31(2): 26-30.
[2]于國榮,夏自強.混沌時間序列支持向量機模型及其在徑流預測中應用[J].水科學進展,2008,19(1):116-122.
[3]李紅霞,許士國,范垂仁.月徑流序列的混沌特征識別及Volterra自適應預測法的應用[J].水利學報,2007,38(6):760-766.
[4]Sivakumar B.Chaos theory in geophysics:past, present and future[J].Chaos, Solitons and Fractals,2004,19(22):441-462.
[5]李紅霞,許士國,徐向舟,等.混沌理論在水文領域中的研究現(xiàn)狀及展望[J].水文,2007,27(6):1-5.
[6]唐啟義.DPS數(shù)據(jù)處理系統(tǒng)實驗設計、統(tǒng)計分析及數(shù)據(jù)挖掘[M].北京:科學出版社,2010.
[7]Taken S F.Detecting strang attractors in turbulence [J].Lecture Notes in Mathematics,1981,898:366-381.
[8]呂金虎,陸君安,陳士華.混沌時間序列分析及其應用[M].武漢:武漢大學出版社,2002.
[9]任磊,岳春芳,何訓江.RBF神經(jīng)網(wǎng)絡模型在金溝河流域徑流預測中的應用[J].水資源與水工程學報,2011,22(1):94-97.
[10]黃如國,苪孝芳.流域降雨徑流時間序列的混沌識別及其預測研究進展[J].水科學進展,2004,15(2):255-260.
[11]羅偉,習華勇.基于最小二乘支持向量機的降雨量預測[J].人民長江,2008,39(19): 29-31.
[12]羅芳瓊,吳建生,金龍.基于最小二乘支持向量機集成的降水預報模型[J].熱帶氣象學報,2011,27(4):577-584.
[13]張俊艷,韓文秀.基于RBF神經(jīng)網(wǎng)絡的城市需水量預測研究[J].內(nèi)蒙古農(nóng)業(yè)大學學報,2006,27(2):90-92.
[14]農(nóng)吉夫,金龍.基于MATLAB的主成分RBF神經(jīng)網(wǎng)絡降水預報模型[J].熱帶氣象學報,2008,24(6): 713-717.
[15]吳麗娜,黃領梅,沈冰,等.月徑流序列混沌特性識別及預測[J].水資源與水工程學報,2010,21(5):28-30.
[16]路劍飛,陳子桑.月降雨序列的混沌判定的合理性分析[J].水電能源科學,2011,29(3): 9-13.
[17]馬細霞,穆浩澤.基于混沌分析的月徑流序列耦合預測模型及其應用[J].水力發(fā)電學報,2010,29(6):41-46.
[18]郁俊莉,王其文.Lyapunov指數(shù)混沌特性判定研究[J].武漢理工大學學報,2004,20(2):90-92.
[19]陳繼光.基于Lyapunov指數(shù)的觀測數(shù)據(jù)短期預測[J].武漢理工大學學報,2001(9):64-67.