屈磊磊等
摘要通過對1978~2012年湞江歷年年徑流量數(shù)據(jù)分析,建立時間序列模型。在模型的建立過程中,使用SPSS軟件,對不同階數(shù)的ARIMA模型進(jìn)行比較,按照最小信息量原則選擇最優(yōu)模型ARIMA(4,1,0),并且使用該模型對2013~2016年徑流量進(jìn)行預(yù)測。
關(guān)鍵詞時間序列分析;ARIMA;SPSS;年徑流量
中圖分類號S11文獻(xiàn)標(biāo)識碼A文章編號0517-6611(2015)21-023-02
水文預(yù)報直接為防汛搶險、水資源的合理利用與保護(hù)、水利工程的建設(shè)和調(diào)度運行管理以及工農(nóng)業(yè)生產(chǎn)提供服務(wù)。這是水文研究的重要內(nèi)容。徑流量預(yù)測是水資源系統(tǒng)分析中一個很重要的內(nèi)容,可以為水資源合理開發(fā)和優(yōu)化利用、區(qū)域社會經(jīng)濟(jì)規(guī)劃的制定提供必要的導(dǎo)向,尤其是對水庫合理調(diào)度的指導(dǎo)意義不容忽視。年徑流量的預(yù)報對于制定生產(chǎn)計劃、防洪、抗旱、發(fā)電、水資源的規(guī)劃管理和綜合利用有著十分重要的意義。
1時間序列模型
目前,對徑流量的預(yù)測方法有回歸分析模型[1]、人工神經(jīng)網(wǎng)絡(luò)[2-4]、模糊數(shù)學(xué)模型[5-6]、灰色系統(tǒng)模型[7-8]以及時間序列模型[9-11]。但是,徑流形成固有的不確定性和復(fù)雜性使得人們對徑流過程演變認(rèn)識、模擬、預(yù)測具有非唯一性,且徑流量本身存在很多不確定因素及很強的波動性,使得有些方法的預(yù)測精度往往不高。
時間序列分析屬于概率統(tǒng)計學(xué)科的一個重要分支,近些年得到迅速發(fā)展,其實際應(yīng)用遍及自然科學(xué)、社會科學(xué)以及工程技術(shù)的諸多領(lǐng)域。時間序列分析的若干理論已經(jīng)相當(dāng)成熟,特別是對于線性平穩(wěn)時間序列,其多種模型己被廣泛應(yīng)用于各領(lǐng)域的控制和預(yù)測。
時間序列分析不通過其他變量對所觀測時間序列{Xt}的行為做結(jié)構(gòu)性解釋分析,而是根據(jù)數(shù)據(jù)自身特點,為它建立一個能夠反映時間序列過去行為的模型,以幫助我們預(yù)測未來行為。
我們把具有如下結(jié)構(gòu)的模型稱為自回歸移動平均模型,簡記為ARMA(p,q)。
xt=0+1xt-1+…+pxt-p+εt-θ1εt-1-…-θqεt-q
p≠0,θq≠0
E(εt)=0,Var(εt)=σ2ε,E(εtεs)=0,s≠t
Extεt=0,s<1
若0=0,則該模型被稱為中心化ARMA(p,q)模型。缺省默認(rèn)條件,中心化ARMA(p,q)模型可以簡寫為xt=1xt-1+…+pxt-p+εt-θ1εt-1-…-θqεt-q。
其中,{xt}為平穩(wěn)的時間序列;
{εt}為白噪聲序列;
1,2,…p,θ1,θ2,…θq為常數(shù)。
ARIMA(p,q)模型的實質(zhì)就是差分運算與ARMA模型的組合。這說明任何非平穩(wěn)序列只要通過適當(dāng)階數(shù)的差分實現(xiàn)差分后平穩(wěn),就可以對差分后序列進(jìn)行ARMA模型擬合。
2使用時間序列模型建模
韶關(guān)市地處粵北山區(qū),水資源年際變化大,年內(nèi)分配不均,受氣候、水文和地理條件的制約,在洪水期易產(chǎn)生山洪而枯水期又易出現(xiàn)旱災(zāi)。自建國以來,韶關(guān)市旱情較嚴(yán)重的年份有1955、1963、1977、1986、2004、2009年,尤其是2001~2004年的多年連旱對韶關(guān)市經(jīng)濟(jì)發(fā)展和人們的日常生活造成重大損失。
圖1為1978~2012年湞江年徑流量數(shù)據(jù)折線圖。由圖2可知,湞江歷年年徑流量稍有遞增趨勢,各階的自相關(guān)和偏自相關(guān)系數(shù)有一定的規(guī)律性,大都取負(fù)值,而非在零值附近波動。因此,對原始序列進(jìn)行一階差分,對一階差分后數(shù)據(jù)做出自相關(guān)和偏自相關(guān)系數(shù)圖形。
圖3顯示一階差分后數(shù)據(jù)自相關(guān)系數(shù)拖尾,偏自相關(guān)系數(shù)可以近似看成四階截尾。因此,選擇ARIMA(2,1,0),ARIMA(3,1,0),ARIMA(4,1,0)以及ARIMA(5,1,0)模型。綜合比較模型參數(shù),選擇較優(yōu)模型。模型參數(shù)見表1。BIC準(zhǔn)則適用于樣本數(shù)據(jù)較少的問題,目的是判斷預(yù)測目標(biāo)的發(fā)展過程與哪一隨機過程最接近。具體的使用原則是在規(guī)定
范圍內(nèi)選擇BIC值最小的模型。選擇ARIMA(4,1,0)建立
模型,模型參數(shù)如表2所示。
用對信息的提取是否充分來判斷模型的有效性,使用LjungBox檢驗統(tǒng)計量,判斷法則為當(dāng)檢驗統(tǒng)計量的P值大于顯著性水平α?xí)r,認(rèn)為殘差是白噪聲序列,否則說明殘差
序列中還殘留著相關(guān)信息,擬合模型不顯著。由表1可知,
當(dāng)使用ARIMA(4,1,0)模型建模時,其LjungBox統(tǒng)計量的顯著性(α)為0.721,遠(yuǎn)大于顯著性水平α(取α=0.05),可以認(rèn)為殘差是白噪聲序列。進(jìn)而,圖4給出建立ARIMA(4,1,0)模型之后殘差的自相關(guān)和偏自相關(guān)序列圖,基本在零值附近波動,則模型有效。
當(dāng)使用ARIMA(4,1,0)模型建模時,其模型參數(shù)見表2。參數(shù)檢驗結(jié)果顯示,AR(1)、AR(2)、AR(3)、AR(4)系數(shù)均顯著。使用ARIMA(4,1,0)模型對湞江2013~2016年年徑流量進(jìn)行預(yù)測,預(yù)測2013、2014、2015及2016年年徑流量分別為51.46億、58.88億、6012億以及63.09億m3。其置信上限、置信下限見表3。把歷年觀察值數(shù)據(jù)、擬合值以及預(yù)測值曲線繪制到同一個坐標(biāo)軸中,如圖5所示。
3結(jié)論
通過對ARIMA模型理論的介紹和研究,對湞江年徑流量建立多個ARIMA模型。按照一定的原則,選擇較優(yōu)的模型,并且對模型參數(shù)進(jìn)行估計,對近4年的年徑流量做預(yù)報分析。
水文預(yù)報的方法很多,然而對于中長期預(yù)報,目前還沒有一種模型對所有的水文序列適用。預(yù)報模型的適用性至今仍是有待深入研究的問題。對于一個具體水文序列長期預(yù)報問題,往往通過對具體的數(shù)據(jù)進(jìn)行分析、嘗試、檢驗等步驟,最終找到較適合的預(yù)報模型。
參考文獻(xiàn)
[1] 顧綺儀.長期水文統(tǒng)計預(yù)報方法在長江大通站徑流預(yù)報中的應(yīng)用[J].應(yīng)用技術(shù),2005,3(1):42-43.
[2] 蔡煜東,許偉杰.自組織人工神經(jīng)網(wǎng)絡(luò)在鄱陽湖年最高水位長期預(yù)報中的應(yīng)用[J].水文科技情報,1993,10(2):27-29.
[3] 鐘登華,王仁超,皮鈞.水文預(yù)報時間序列神經(jīng)網(wǎng)絡(luò)模型[J].水利學(xué)報,1995(2):69-75.
[4] 張利平,王德智,夏軍.白山水庫徑流中長期預(yù)報研究與應(yīng)用[J].水電能源科學(xué),2002(3):18-20.
[5] 陳守煜.中長期水文預(yù)報綜合分析理論模式與方法[J].水利學(xué)報,1997(8):15-32.
[6] 白子巖.模糊模式識別法在中長期預(yù)報中的應(yīng)用[J].水利水電技術(shù),1999,30(2):50-51.
[7] 謝科范.評灰色系統(tǒng)理論[J].系統(tǒng)工程,1991,9(4):49-52.
[8] 夏軍.灰色系統(tǒng)水文學(xué)理論方法及應(yīng)用[M].武漢:華中理工大學(xué)出版社,1999:36-47.
[9] 洪時中.非線性時間序列分析的最新進(jìn)展及其在地球科學(xué)中的應(yīng)用前景[J].地球科學(xué)進(jìn)展,1999,14(6):559.
[10] OOMS M,F(xiàn)RANSES P H.A seasonal periodic long memory model for monthly river flows[J].Environmental Modeling&Software,2001,16:559-569.
[11] 張小靜.函數(shù)系數(shù)自回歸模型在水文預(yù)報中的應(yīng)用[D].西安:西安理工大學(xué),2007.