李 博,李克鋒,王 莉
(1.四川大學水力學與山區(qū)河流開發(fā)保護國家重點實驗室,四川 成都 610065;2.中國水電顧問集團成都勘測設計研究院,四川 成都 610072)
至今,人們還不能用數(shù)學物理方法嚴格地描述水文過程的每一個子過程。因此,對中長期水文預報[1]的研究,仍處于探索、發(fā)展階段。國內外中長期水文預測方法包括傳統(tǒng)方法(包括天氣學方法、成因分析方法和水文統(tǒng)計法)和不確定方法(包括人工神經網絡方法、模糊分析預測技術、灰色系統(tǒng)理論及這些方法的相互耦合等)。目前,還沒有一種模型對所有的水文序列來說都是適用的[2-4]。鑒此,本文以嘉陵江流域中游段為研究區(qū)域,通過分析嘉陵江流域中游段亭子口站、金銀臺站的年徑流資料,建立人工神經網絡模型、最近鄰抽樣回歸模型、自回歸模型和均生函數(shù)模型對其年徑流進行預測,并分析比較各個預測效果,提出適于嘉陵江流域中游段年徑流預測模型,為梯級庫群優(yōu)化調度提供參考。
嘉陵江流域位于秦嶺山脈以南的西南季風區(qū),屬亞熱帶季風氣候。因受東南、西南暖濕氣流影響,大部分地區(qū)屬暖濕亞熱帶季風氣候。研究流域徑流主要來源于降水,其次為地下水和融雪水補給,5~10月降水量占全年的80%左右,10月以后~翌年2月逐漸減少,3月、4月則又逐漸增加。該流域徑流年內分配與降水量大體一致,以地表徑流為主,地下徑流不太豐沛,豐水期流量遠大于枯水期流量。
嘉陵江流域中游段年平均流量變化較大,以該流域段亭子口站1954年~2007年共54年的逐月平均流量資料和金銀臺站1952年~1991年共40年的逐月平均流量資料(由于金銀臺航電樞紐的興建,原金銀臺水文站位于其庫區(qū),該站撤消,之后流量資料缺失,故本文選取此時間段的水文資料作為研究對象)分析兩者的徑流變化規(guī)律[5]得出:亭子口站年徑流變差系數(shù)Cv為0.34,偏態(tài)系數(shù)Cs為0.63,最大年平均流量為1 120 m3/s,最小年平均流量為287 m3/s,兩者之比為3.90;金銀臺站年平均流量變化情況與亭子口類似,年徑流變差系數(shù)Cv為0.30,偏態(tài)系數(shù)Cs為1.53,最大年平均流量為1 290 m3/s,最小年平均流量為377 m3/s,兩者之比為3.42。圖1給出了亭子口站和金銀臺站年平均流量。
圖1 年流量年際變化
BP神經網絡是以Sigmoid函數(shù)作為各層的激勵函數(shù),采用每輸入一個樣本就回傳誤差并調整權重的單樣本處理誤差方法。以嘉陵江流域中游段代表站長系列的年徑流資料為數(shù)據源,將年徑流序列自身作為模型的輸入,通過試錯來確定隱層節(jié)點數(shù),采用典型的三層BP網絡結構來進行本次年徑流預測。
選取亭子口站1954年~2007年共54年的年徑流序列,前49年(1954年~2002年)的實測資料用來建立模型,后5年(2003年~2007年)作為模型的檢驗期。通過反復調整模型參數(shù),進行試算,選定8-6-1(輸入層節(jié)點數(shù)為8,隱層節(jié)點數(shù)為6,輸出層節(jié)點數(shù)為1)的模型結構,動量系數(shù)α為0.88,學習系數(shù)η為0.18,訓練次數(shù)為2 000次。類似地,選取金銀臺站1952年~1991年共40年的年徑流實測序列,取前35年(1952年~1986年)的實測資料建立模型,后5年(1987年~1991年)作為模型的檢驗期。選定6-5-1(輸入層節(jié)點數(shù)為6,隱層節(jié)點數(shù)為5,輸出層節(jié)點數(shù)為1)的模型結構,動量系數(shù)α為0.90,學習系數(shù)η為0.20,訓練次數(shù)仍為2 000次。
參照GB/T 22482—2008《水文情報預報規(guī)范》中對中長期徑流預報精度評定要求,年徑流預測許可誤差取其多年同期實測變幅的10%,本文其他模型也采用此標準。兩站的預測結果見表1及圖2。
表1 亭子口站、金銀臺站BP網絡模型預測精度%
圖2 BP網絡模型年徑流預測效果
由表1和圖2可知,亭子口的模型預測效果令人滿意,擬合誤差大多都在10%以下,擬合階段的擬合合格率達到了97.56%,預測值曲線基本上與實測值曲線重合,但預測階段精度較低為40%,這可能是由于亭子口建模系列較長,使模型陷入了過擬合情況。金銀臺的模型擬合合格率為89.66%,擬合效果亦較好,雖然擬合最大誤差達到了29.42%,但它的預測階段精度較高為60%。從圖2也可以看出,在后5年的檢驗期,雖然1989年的預測值與實測值偏差較大,但金銀臺站預測值與實測值的變化趨勢是一樣的。總體上,對嘉陵江流域中游段年徑流預測預見期較長、徑流序列不穩(wěn)定的預測來說,此三層BP網絡模型的穩(wěn)定性和預測效果較好,可以用于該研究流域的年徑流預測。
最近鄰抽樣回歸模型(Nearest Neighbor Boot-strapping Regressive Model,NNBR)是時間序列模型的一種,它是一類基于數(shù)據驅動的,不需要識別參數(shù)的非參數(shù)模型[1]。
采用單因子最近鄰抽樣回歸模型對嘉陵江流域中游段的年徑流進行預測,其亭子口站、金銀臺站徑流系列預測方法的選取同上(見2.1節(jié))。通過模型參數(shù)試錯,前者最終選取特征矢量維數(shù)P等于19,最近鄰數(shù)K等于2。后者選擇特征矢量維數(shù)P為11,最近鄰數(shù)K為10。
模型預測的精度、效果和結果見表2及圖3。
表2 亭子口站、金銀臺站最近鄰抽樣回歸模型預測精度 %
圖3 最近鄰抽樣回歸模型年徑流預測效果
由表2、圖3可以得出,采用單因子抽樣回歸模型對嘉陵江流域中游段的年徑流進行預測,模型的擬合精度和預測精度都較好。亭子口站的模型擬合平均誤差小于10%,預測值曲線與實測曲線相差不大,運動趨勢較吻合。金銀臺站雖然擬合合格率只有36%,但是模型擬合曲線運行趨勢與實際運行曲線類似,模型檢驗合格率比較高,達到了80%,只有1991年的預測值偏大過多,若優(yōu)化參數(shù)改進模型,模型擬合效果和檢驗結果可以更好。總體上,該模型可用于嘉陵江中游段年徑流預測。
自回歸模型[6](Automatic Regressive Model,AR)屬于時間序列預測技術的一種,不僅能反映水文序列的一些主要統(tǒng)計特性,而且是從水文現(xiàn)象的物理成因分析和概化而建立的隨機模型,其參數(shù)具有一定的物理意義,被廣泛地應用于中長期預報。
根據嘉陵江流域中游段年徑流序列,建立傳統(tǒng)的線性平穩(wěn)自回歸模型進行年徑流預測研究。其亭子口站、金銀臺站徑流系列預測方法的選取同2.1節(jié)。前者通過AIC(Akaike Information Criterion)準則[1]計算,選定3階自回歸模型進行計算,即采用AR(3)。后者經過試算優(yōu)選,采用4階自回歸模型。模型參數(shù)取值情況見表3。
模型預測的精度和預測效果分別見表4、圖4。
表4 亭子口站、金銀臺站自回歸模型預測精度 %
圖4 自回歸模型年徑流預測效果
表3 亭子口站、金銀臺站年徑流序列自回歸模型參數(shù)
從表4、圖4中可以看出,亭子口站和金銀臺站分別采用3階和4階自回歸模型進行年徑流預測時,擬合誤差和預測誤差都較大,擬合最大誤差超過50%,檢驗的平均誤差也高于 《水文情報預報規(guī)范》要求的10%。兩者擬合趨勢都圍繞著均值上下波動,沒有確切地反映出實際徑流的運動趨勢。顯然,自回歸模型不適用于該研究流域的年徑流預測。
均生函數(shù)模型[7,10],由時間序列根據不同的時間間隔來計算均值,并生成一組同期函數(shù),最后用原時間序列與這組同期函數(shù)建立回歸預測方程。
采用均生函數(shù)模型對嘉陵江流域中游段進行年徑流預測,其亭子口站、金銀臺站徑流系列預測方案的選取同上(見2.1節(jié))。
模型預測的精度和預測效果見表5、圖5。
表5 亭子口站、金銀臺站均生函數(shù)模型預測精度%
圖5 均生函數(shù)模型年徑流預測效果
從表5可以看出,用均生函數(shù)模型對嘉陵江流域中游段進行徑流預測,擬合誤差和預測誤差都較大。其中,亭子口站模型擬合最大誤差超過65%,金銀臺站模型檢驗最大誤差達到了61.85%,平均誤差均超過了 《水文情報預報規(guī)范》要求的10%;從圖5可看出,模型的擬合趨勢與徑流實際走勢完全不符。因此,均生函數(shù)模型也并不適用于嘉陵江流域中游段年徑流預測。
本文根據嘉陵江實測徑流資料,引入人工神經網絡模型、最近鄰抽樣回歸模型、自回歸模型以及均生函數(shù)模型對嘉陵江流域中游段年徑流進行預測,得出的主要結論如下:
(1)嘉陵江流域中游段地區(qū)的年徑流序列的年際變化大,自相關系數(shù)較小,徑流序列前后相依性弱,是一非平穩(wěn)隨機系列。徑流的年內分配不均勻,豐水期流量遠大于枯水期流量。
(2)嘉陵江中游段年徑流預測結果中,人工神經網絡模型預測擬合合格率達到85%以上,預測效果令人滿意;最近鄰抽樣回歸模型預測擬合曲線運行趨勢與實際運行曲線運動趨勢較吻合,預測效果較好;自回歸模型預測的擬合誤差和預測誤差都較大,擬合趨勢圍繞著均值上下波動,沒有確切地反映出實際徑流的運動趨勢;均生函數(shù)模型預測的擬合趨勢與徑流實際走勢完全不符,亭子口站模型擬合最大誤差超過65%,金銀臺站模型檢驗最大誤差達到了61.85%。
(3)針對嘉陵江流域中游段年徑流這種年際變化大、無基本規(guī)律可循的序列來說,人工神經網絡模型和最近鄰抽樣回歸模型預測效果優(yōu)于自回歸模型與均生函數(shù)模型,且預測效果較好,可用于嘉陵江中游段年徑流預測。
[1]湯成友,官學文,張世明.現(xiàn)代中長期水文預報方法及其應用[M].北京:中國水利水電出版社,2008.
[2]何新林,宋玲,鄭旭榮.徑流中長期預報的灰色預測方法[J].石河子大學學報:自然科學版,1997,1(3):234-237.
[3]袁秀娟,夏軍.徑流中長期預報的灰色系統(tǒng)方法研究[J].武漢水利電力大學學報,1994,27(4):367-375.
[4]何新林,董先軍,周建偉.瑪納斯河春季徑流量中長期預報的灰色預測模式[J].石河子大學學報:自然科學版,1998,2(3):227-230.
[5]劉光文,等.水文分析與計算[M].北京:中國工業(yè)出版社,1963.
[6]丁晶,鄧育仁.隨機水文學[M].成都:成都科技大學出版社,1988.
[7]曹鴻興,魏鳳英.基于均值生成函數(shù)的時間序列分析[J].數(shù)值計算與計算機應用,1991,6(2):82-89.
[8]苗春生,周桂香,鄭興華.一種新的均生函數(shù)預測模型[J].預測,2001,20(2):72-74.
[9]覃志年.均生函數(shù)逐步回歸模型在降溫、降水長期過程預測中的應用[J].廣西氣象,2003,24(1):15-17.
[10]楊瑞峰,劉慶民.均生函數(shù)模型在長期天氣預測中的應用[J].河南氣象,2004(1):23-24.