李 虎,洪文彬,臧永順,宋穎玲
(1.遼寧省水文水資源勘測局大連分局,遼寧 大連 100000;2.中水東北勘測設(shè)計研究有限責(zé)任公司,吉林 長春 130021)
有1951—2006年74項氣象環(huán)流因子,從提前1~5年的74項氣象因子中挑選因子建立模型。
有1951—2008年烏江渡水電站逐月入庫流量,用1951—2006年流量系列建立模型,對2007年、2008年逐月流量進(jìn)行試預(yù)報。用各月流量最大值、最小值、均值、離差系數(shù)等反映其統(tǒng)計特征。均值反映序列的平均情況,離差系數(shù)反映序列的離散程度。設(shè)徑流距平百分率為R(%)。用于確定預(yù)報方程的1951-2006年烏江渡,逐月入庫徑流量的統(tǒng)計特征,及2007年、2008年各月流量距平百分率,見表1。
按國際通用標(biāo)準(zhǔn)定義,R≥50%為澇,R=25%~50%為偏澇,R=-25%~25%為正常,R=-25%~-50%為偏旱,R≤-50%為旱[1]。2007年 1月、3月、5月,2008年2月、11月流量R絕對值遠(yuǎn)大于50%,屬異常,可能影響整體預(yù)報效果,特別是上述各月流量的預(yù)報可能會有較大誤差。3月、4月、5月離差系數(shù)較大,說明流量離散程度大,給預(yù)報帶來很大難度。
2.1.1 逐步回歸原理
表1 1951—2006年烏江渡逐月入庫流量的統(tǒng)計特征及預(yù)報年月流量距平百分率
逐步回歸法[2]按對預(yù)報對象影響顯著的程度逐步挑選因子。方差貢獻(xiàn)是衡量因子對預(yù)報對象重要性的指標(biāo),要求當(dāng)步挑選出的因子是能使殘差平方和下降最多的一個,并且通過指定信度的顯著性檢驗——F檢驗。如果后面的因子引入后會引起前面因子對預(yù)報對象的顯著作用減小,則在已建立的過渡方程中把這一因子剔除。每引入或剔除一個因子都要做相應(yīng)的F檢驗,直至方程既不能引入也不能剔除為止。
用單相關(guān)系數(shù)法通過0.02置信度檢驗的預(yù)報因子,F(xiàn)值信度為0.05。
2.1.2 時間序列分析
時間序列分析[3]是在分析時間序列變量的基礎(chǔ)上,運用一定的數(shù)學(xué)方法建立預(yù)測模型,使時間序列向外延伸,從而獲得序列的發(fā)展變化趨勢,確定變量的預(yù)測值。文中使用的是p階自回歸模型,模型階數(shù)是根據(jù)AIC準(zhǔn)則來確定的。
2.1.3 周期均值疊加法
一個水文序列總可以把它看成是有限個有不同周期的周期波互相重疊而形成的過程。只要根據(jù)實測的數(shù)據(jù),分析識別出水文序列所含的周期,而且這些周期在預(yù)測區(qū)間內(nèi)保持不變的話,就可以根據(jù)分析出來的周期分別進(jìn)行外延,再疊加起來進(jìn)行預(yù)報,這種方法稱為周期疊加[4]。
2.1.4 多元線性回歸
多元線性回歸方程的參數(shù)估計中,最小二乘法是最常用的。由觀測值確定回歸系數(shù)β0,β1,…,βm,的估計 b0,b1,…,bm,得到因變量 yt對自變量x1t,x2t,…,xmt的線性回歸方程,對回歸效果進(jìn)行統(tǒng)計檢驗,最后利用回歸方程進(jìn)行預(yù)報[5]。
式中:yt為對yt的估計;et為誤差估計。
2.1.5 嶺回歸
嶺回歸是一種有偏估計,旨在克服最小二乘算法中自變量之間多重線性相關(guān)的問題。雖然嶺回歸所得的殘差平方和比最小二乘回歸要大,但它對病態(tài)數(shù)據(jù)相對地更為適用。鑒于其特殊的作用,嶺回歸被應(yīng)用于某些領(lǐng)域[6-7]。
組合預(yù)報在現(xiàn)有單一預(yù)報系統(tǒng)基礎(chǔ)上運用模型加權(quán)法[8],通過模型權(quán)系數(shù)放大某個模型的優(yōu)點,減少其缺點對預(yù)報結(jié)果的影響,把多個模型的優(yōu)點組合起來,避免了對某流域最優(yōu)預(yù)報模型選擇的爭論,也可以在某種程度上提高洪水預(yù)報精度,并且大大增強了洪水預(yù)報結(jié)果的穩(wěn)定性[10]。
將幾種模型的預(yù)報結(jié)果分別乘以模型所對應(yīng)的權(quán)重系數(shù),然后相加得到最終的預(yù)報結(jié)果。預(yù)報結(jié)果Qt由下式給出[9]:
表2 各模型擬合合格率%
定義:相對誤差等于(輸出值-實測值)實測值;相對誤差不大于30%為通過;合格率為相對誤差不大于30%的個數(shù)比總數(shù);擬合合格率不小于70%的方程可以用作預(yù)報。
表2可見總體擬合效果最好為逐步回歸,合格率92.6%,最差為嶺回歸,合格率80.9%。周期均值疊加的4月、5月、多元線性回歸的3月、嶺回歸的3月可能因模型自身問題受流量離散程度影響較大,合格率未通過70%的要求,不能用來預(yù)報。
模型各有優(yōu)缺點,綜合2007年、2008年預(yù)報精度最高為逐步回歸,合格率為70.8%,最低為周期均值疊加,合格率僅33.3%。
挑選擬合效果最好的逐步回歸、時間序列,最差的多元線性回歸、嶺回歸,預(yù)報效果最好的逐步回歸、多元線性回歸,最差的時間序列、周期均值疊加模型,及個別月不能預(yù)報的嶺回歸、周期均值疊加模型共5組分別預(yù)報。
經(jīng)過試算,確定各模型權(quán)重見表3,組合后的各月及平均擬合、預(yù)報合格率。
結(jié)果表明:5種組合平均擬合合格率均比其組分模型高,最高93.8%,最低82.4%,且組合后各月合格率均大于70%,可用做預(yù)報,修復(fù)了原模型中不能預(yù)報的方程。
表3 組合預(yù)報中各模型權(quán)重
5種組合預(yù)報合格率均比其組分模型高,最高為75%,最低為41.7%,有一定幅度提高。大部分月預(yù)報精度有所提高。2007年3月組合2預(yù)報誤差小于30%達(dá)到合格,5月組合2、組合3、組合5預(yù)報合格,2008年3月組合1、組合5預(yù)報合格,可見組合2、組合5對異常月預(yù)報較準(zhǔn),可能因其包含嶺回歸得以更靠近異常值。
通過實際應(yīng)用和研究,發(fā)現(xiàn)水文模型組合預(yù)報有如下優(yōu)點:
1)方法簡單實用易理解,權(quán)重可根據(jù)需要修改,無需估計參數(shù),能應(yīng)用于各種類型的水文模型,便于推廣。
2)組合預(yù)報能使擬合、預(yù)報精度得到提高,對原模型無論是總體平均還是細(xì)部逐月都有很好的修正作用,并且使預(yù)報結(jié)果更加穩(wěn)定。在洪水預(yù)報系統(tǒng)中有一定的實踐應(yīng)用價值,可充當(dāng)一種有利的輔助方法。
3)文中用5種模型按需要進(jìn)行了5種組合,對比發(fā)現(xiàn)效果很好,但不能說它是任意適用的,其他水文模型組合方式是否有效仍需更多的實踐驗證。
[1]葉瑾琳,王紹武.近百年全球降水變化[A].85-913項目02課題論文編委會.氣候變化規(guī)律及其數(shù)值模擬研究論文[C].北京:氣象出版社,1996.
[2]湯成友,郭麗娟,王瑞.水文時間序列逐步回歸隨機組合預(yù)測模型及其應(yīng)用[J].水利水電技術(shù),2007,38(6):1-4.
[3]湯成友,官學(xué)文,張世明.現(xiàn)代中長期水文預(yù)報方法及其應(yīng)用[M].北京:中國水利水電出版社,2008:1-7,80-88.
[4]范鐘秀.中長期水文預(yù)報[M].南京∶河海大學(xué)出版社,1999:1-3,6-20,21-37.
[5]魏鳳英.現(xiàn)代氣候統(tǒng)計診斷與預(yù)測技術(shù)[M].北京:氣象出版社,1999:188.
[6]藍(lán)永超,王新民.嶺回歸分析在融雪徑流預(yù)報中的應(yīng)用[J].冰川凍土,1992,14(1):19-24.
[7]陳科,辛忠禮.嶺回歸法在單位線估計中的應(yīng)用[J].四川水力發(fā)電,1995(1):84-87.
[8]楊小柳.實時洪水預(yù)報方法綜述[J].水文,1996(4):12-13.
[9]黃志強,李柏宏,凌仙華.水文模型組合預(yù)報應(yīng)用研究[J].浙江水利水電??茖W(xué)校學(xué)報.2009,21(1):30-33.