王雪玉
(黑龍江省大慶水文局,黑龍江 大慶 163000)
長期以來,為了得到確定性的輸出數(shù)據(jù),人們已經(jīng)習(xí)慣了根據(jù)輸入的資料來建立確定性的水文模型。但近幾年來越來越多的水文研究工作者們嘗試著突破傳統(tǒng)的思維模式, 采用模糊數(shù)學(xué)、隨機(jī)理論、貝葉斯理論等一系列新理論和新方法,積極探索和發(fā)現(xiàn)采用水文模型結(jié)構(gòu)以及參數(shù)估計等方法所帶來的不確定性, 并取得了許多研究成果[1-2]。本文基于建三江地區(qū)30 a的降雨量數(shù)據(jù)進(jìn)行隨機(jī)性分析。
首先采用非線性擬合的方法,對建三江管局30 a月降雨量及年降雨量資料進(jìn)行不確定分析[3-4]。分析過程中,使用MATLAB軟件編程計算,由于月降雨量和年降雨量數(shù)據(jù)樣本離散程度比較大,改為對樣本進(jìn)行概率密度圖的擬合,以此來減弱影響性。對建三江管局全年實測數(shù)據(jù)概率分布與各月及年降雨量正態(tài)分布擬合函數(shù)參數(shù)如圖1、表1所示。
圖1 全年實測數(shù)據(jù)概率分布
表1 各月及年降雨量正態(tài)分布擬合函數(shù)參數(shù)
結(jié)果表明,以核密度估計輔助分析,擬合曲線符合正態(tài)分布函數(shù)。
自相關(guān)分析是研究水文序列內(nèi)部線性相依性質(zhì)的統(tǒng)計技術(shù),是進(jìn)行時間序列分析的有效方法,它簡單易行、較為直觀。利用自相關(guān)分析法可以測定時間序列的隨機(jī)性和平穩(wěn)性,以及時間序列的季節(jié)性。常用自相關(guān)系數(shù)和自相關(guān)圖研究這種性質(zhì)。
對實測數(shù)據(jù)使用AR自回歸模型預(yù)報,并對該區(qū)域年降雨量進(jìn)行預(yù)報。求出預(yù)測值相對誤差,看是否在容許范圍之內(nèi),是否可以作為預(yù)報值使用。若可以作為預(yù)報值使用,則將不確定性分析的成果應(yīng)用在預(yù)報上,模擬出10次30 a周期的數(shù)據(jù)。再將模擬數(shù)據(jù)輸入到自回歸模型中運(yùn)算,得出預(yù)測相對誤差均值。
由于自回歸模型方便計算,易于編程,所以采用MATLAB編程計算,計算結(jié)果準(zhǔn)確且易于表達(dá)。首先觀察實測數(shù)據(jù)的離散程度,將處理過后的數(shù)據(jù)進(jìn)行自相關(guān)及偏相關(guān)分析。如圖2和圖3所示。
圖2 自相關(guān)分析
圖3 偏相關(guān)分析
由自相關(guān)分析圖2可以看出“拖尾性”,滿足置信區(qū)間的為4階或其左右。但是不足以判斷自相關(guān)階數(shù),從偏相關(guān)分析圖3可以看出大致“截尾性”,判斷階數(shù)在4階左右。但是無法確定出準(zhǔn)確的階數(shù)。需要對序列樣本進(jìn)行AIC法則檢測。檢測結(jié)果如表2所示。
AIC法則檢測后,發(fā)現(xiàn)3階的值才是最小的,所以可以定階數(shù)為3。運(yùn)行AR自相關(guān)模型程序進(jìn)行樣本的逼近擬合,并預(yù)報最后兩年的年降雨量。如圖4所示。
表2 AIC法則檢驗表
圖4 AR(3)年降雨量計算結(jié)果過程線
經(jīng)計算,2009年預(yù)測值為418.19 mm,實測值為572.70 mm,2010年預(yù)測值為556.67 mm,實測值為503.10 mm。兩次預(yù)測值與實際值的相對誤差為18.81%,小于20%。預(yù)測值在容許范圍內(nèi),可以用來預(yù)報年降雨量。
由于自回歸模型是基于實測數(shù)據(jù)預(yù)報的,結(jié)果是確定性的,誤差值一般比較高。為降低預(yù)報誤差,基于之前對建三江月降雨量的不確定性分析,做出如下假設(shè):以1981—2010年這30 a為1個周期,通過計算機(jī)模擬,模擬出10個周期的降雨量序列樣本,也就是重現(xiàn)這30 a 10次,預(yù)報10次并綜合分析預(yù)報結(jié)果。對每一年的每一個月取符合分布的10個隨機(jī)數(shù),再將12個月的隨機(jī)數(shù)求和即為模擬年的年降雨量。這樣,總共可以模擬出300 a的數(shù)據(jù)樣本,也就是10個30 a周期。對這10個30 a重復(fù)進(jìn)行AR自回歸模型運(yùn)算,將結(jié)果整理如表3、表4所示。
表3 模型預(yù)測數(shù)據(jù)
注:W為自回歸方程的系數(shù);at為白噪聲;MAPE為平均絕對百分誤差,%。
表4 各種情況下MAPE對比
10次模擬之后,平均絕對百分誤差為18.34%,比實測數(shù)據(jù)降低了0.47個百分點(diǎn)。
通過10次模擬30 a周期,可以得到10組回歸方程。也就是說,可以得到10組參數(shù)??紤]到除了樣本數(shù)據(jù)的不確定性以外,參數(shù)也可能存在不確定性,所以對10組參數(shù)進(jìn)行優(yōu)化。排除2組2階參數(shù),在剩余8組參數(shù)中選擇最優(yōu)2組參數(shù)取均值。用優(yōu)化過后的系數(shù)重新構(gòu)建自回歸方程并預(yù)測。
優(yōu)化后預(yù)測出的平均絕對百分誤差為17.99%,比實測數(shù)據(jù)降低了0.82個百分點(diǎn)。
本文對水文不確定性研究的主要方法和內(nèi)容進(jìn)行總結(jié)和比較。采用了非線性擬合技術(shù)對建三江月降雨量進(jìn)行的隨機(jī)分布進(jìn)行了研究。利用自相關(guān)技術(shù)以及AR自回歸模型對年降雨量時間序列的預(yù)報進(jìn)行了研究。
(1)用非線性擬合對建三江月降雨量進(jìn)行不確定性分析,得出30 a的各個月份降雨量概率密度服從正態(tài)函數(shù)分布。此外,通過核密度估計輔助擬合,發(fā)現(xiàn)內(nèi)核函數(shù)為正態(tài)分布函數(shù)的核密度函數(shù)擬合效果最佳,服從正態(tài)分布。
(2)對實測數(shù)據(jù)使用AR自回歸模型預(yù)報,預(yù)測值相對誤差為18.81%,在容許范圍之內(nèi),可以作為預(yù)報值使用。將不確定性分析的成果應(yīng)用在預(yù)報上,模擬出10次30 a周期的數(shù)據(jù)。將模擬數(shù)據(jù)輸入到自回歸模型中運(yùn)算,得出的預(yù)測相對誤差均值為18.34%,誤差縮小。考慮到除了樣本數(shù)據(jù)不確定性對預(yù)測結(jié)果的影響,參數(shù)的不確定性也應(yīng)該考慮。再通過對參數(shù)的優(yōu)化,取2組誤差最小的參數(shù)均值重新建立自回歸模型預(yù)測,預(yù)測值相對誤差減小至17.99%。
(3)通過增加模擬的次數(shù)可以將預(yù)報誤差縮小,對參數(shù)的優(yōu)化也可以將預(yù)報誤差縮小。由此可以設(shè)想,通過計算機(jī)進(jìn)行大量的重現(xiàn)期模擬可以將誤差縮小到一個極限值,有待進(jìn)一步研究。