何 洋,紀(jì)昌明,田開(kāi)華,張驗(yàn)科,李傳剛(.華北電力大學(xué)可再生能源學(xué)院,北京 006;.雅礱江流域水電開(kāi)發(fā)有限公司,成都 60056)
隨著信息與預(yù)報(bào)技術(shù)的發(fā)展,徑流預(yù)報(bào)的預(yù)報(bào)方法逐漸豐富,預(yù)報(bào)精度也逐步提高。但由于流域徑流受水文、下墊面、人類活動(dòng)及水文模型等因素的影響,徑流預(yù)報(bào)結(jié)果的不確定性十分明顯,預(yù)報(bào)誤差不可避免[1]。
對(duì)徑流預(yù)報(bào)誤差統(tǒng)計(jì)特性的研究包括對(duì)其分布規(guī)律和誤差出現(xiàn)不確定度的研究?jī)蓚€(gè)方面。目前,大多數(shù)文獻(xiàn)主要利用參數(shù)估計(jì)[2]、非參數(shù)估計(jì)[3]和統(tǒng)計(jì)圖形[4]等方法分析洪水預(yù)報(bào)誤差的分布特性,通常認(rèn)為其預(yù)報(bào)誤差服從或近似服從正態(tài)、對(duì)數(shù)正態(tài)和Laplace等分布形式。但這些方法均無(wú)法直接推導(dǎo)出洪水預(yù)報(bào)誤差的先驗(yàn)分布,帶有明顯的主觀性。最大熵法能依據(jù)有限的歷史徑流序列,推求一種最小有偏概率分布,并與直接概率方法得到的結(jié)果相一致,其結(jié)果具有無(wú)偏性和客觀性,因而被廣泛應(yīng)用于水科學(xué)領(lǐng)域[5]。文獻(xiàn)[6]建立了洪水總量預(yù)報(bào)誤差分布的極大熵模型,分析不同預(yù)報(bào)誤差的分布規(guī)律,結(jié)果表明通過(guò)極大熵模型能求得一個(gè)與已知預(yù)報(bào)誤差序列擬合較好的分布;文獻(xiàn)[7]采用最大熵原理,計(jì)算了我國(guó)濕潤(rùn)和半濕潤(rùn)地區(qū)部分典型水庫(kù)的凈雨、洪峰流量和峰現(xiàn)時(shí)間預(yù)報(bào)相對(duì)誤差的概率密度函數(shù),結(jié)果表明最大熵法研究洪水預(yù)報(bào)誤差分布是可行的;文獻(xiàn)[8]詳細(xì)闡明了推求洪水預(yù)報(bào)誤差分布的問(wèn)題本質(zhì)及最大熵原理的適用性分析,結(jié)果表明最大熵原理在推求洪水預(yù)報(bào)誤差分布時(shí)是合理可行的,且洪水預(yù)報(bào)作為徑流預(yù)報(bào)的一部分,因而它也間接證明了徑流預(yù)報(bào)同樣適用最大熵原理。但上述文獻(xiàn)均僅推求徑流預(yù)報(bào)整個(gè)誤差系列的分布規(guī)律,且未能在此基礎(chǔ)上以概率形式定量描述徑流預(yù)報(bào)的不確定性,其實(shí)用性不高。為此,本文以官地水庫(kù)為研究對(duì)象,以其不同預(yù)見(jiàn)期的歷史徑流預(yù)報(bào)資料為數(shù)據(jù)基礎(chǔ),應(yīng)用最大熵原理,建立徑流預(yù)報(bào)誤差的最大熵模型,開(kāi)展徑流預(yù)報(bào)誤差分布規(guī)律的研究,同時(shí)考慮流域徑流年內(nèi)豐枯變化對(duì)其分布規(guī)律的影響,對(duì)整個(gè)徑流的誤差序列進(jìn)行分時(shí)期研究,從而更好地掌握徑流預(yù)報(bào)誤差的分布規(guī)律。
為了解決不確定性問(wèn)題,科學(xué)家E T Jaynes[9]在信息論中引入最大熵原理,它是根據(jù)樣本信息對(duì)某個(gè)未知分布做出推斷的一種方法。其準(zhǔn)則是在以不完整信息作為依據(jù)進(jìn)行推斷時(shí),承認(rèn)已知事物,且不對(duì)未知事物做任何假設(shè),在所有的可行解中選擇熵最大的一個(gè)解,其解是唯一的,且同為指數(shù)函數(shù)的形式。
設(shè)x為徑流預(yù)報(bào)相對(duì)誤差(以下簡(jiǎn)稱“誤差”)系列:
(1)
其概率密度函數(shù)為f(x),建立最大熵模型[10]:
(4)
x≥a或x≤b
(5)
其中x=G(x1,x2,…,xn)
(6)
式中:n為徑流預(yù)報(bào)的系列長(zhǎng)度;qi、Qi分別為徑流系列的預(yù)測(cè)值和實(shí)測(cè)值;Ω為徑流預(yù)報(bào)誤差x所在的集合;m為矩的階數(shù);mi表示第i階原點(diǎn)矩;a、b為保證x有意義的誤差上下限。
該模型表示在滿足已知信息約束下,以熵最大為準(zhǔn)則求得徑流預(yù)報(bào)誤差的概率密度函數(shù)。
(7)
(8)
或
(9)
式(9)是基于最大熵原理得到的概率密度函數(shù)的解析形式。將其代入式(3)中解得:
(10)
或
(11)
將式(10)對(duì)λi微分,并考慮到式(4)和式(9),可得:
(12)
為求解各個(gè)λi,可建立一個(gè)聯(lián)立方程組,將式(11)對(duì)λi微分,可得:
(13)
由式(12)和式(13)可得:
(14)
通過(guò)式(14)可求解λ1,λ2,…,λm,代入式(11)求出λ0。為了便于數(shù)值求解,將式(14)改為:
(15)
式中:Ri為殘差,可用數(shù)值計(jì)算方法使其趨于零,用非線性規(guī)劃求這些殘差平方核定最小值,就可得到問(wèn)題的解:
(16)
為了用非線性規(guī)劃求解在算法中還要假定有一個(gè)初始點(diǎn),文獻(xiàn)[10]提供了四種不同的確定初始點(diǎn)的方法,分別為假設(shè)分布是正態(tài)、假設(shè)分布是均勻、綜合協(xié)調(diào)法和逐步起點(diǎn)法,可由算法按給定的順序依次試用。當(dāng)R<ε(ε為規(guī)定的允許誤差)或所有的|Rj|<ε時(shí)認(rèn)為上式收斂,從而求解出λ0,λ1,λ2,…,λm,最后求出最大熵概率密度函數(shù)的唯一解析表達(dá)式。其流程圖如圖1。
圖1 求解最大熵概率密度函數(shù)流程圖Fig.1 Flow chart of maximum entropy probability density function
官地水庫(kù)是雅礱江卡拉至江口河段水電規(guī)劃五級(jí)開(kāi)發(fā)方式的第3個(gè)梯級(jí)電站。水庫(kù)正常蓄水位1 330 m,正常蓄水位對(duì)應(yīng)庫(kù)容7.292億m3,最大調(diào)節(jié)庫(kù)容1.232 億m3,為日調(diào)節(jié)水庫(kù),總裝機(jī)容量240萬(wàn)kW,設(shè)計(jì)多年平均發(fā)電量為110.160 億kWh。該水庫(kù)位于雅礱江流域下游,流域降水具有明顯的季節(jié)性變化,徑流的年際、年內(nèi)豐枯變化與降雨季節(jié)變化趨勢(shì)一致,按徑流量及補(bǔ)給來(lái)源可大致分為:汛期7-9月、汛枯過(guò)渡期10月、枯汛過(guò)渡期5月和6月、枯水期11月-翌年4月[11],具體劃分結(jié)果見(jiàn)表1。目前,官地水庫(kù)在當(dāng)日早8∶00和晚8∶00分別進(jìn)行一次徑流預(yù)報(bào),預(yù)見(jiàn)期分別為6、12、18、24 h,利用不同預(yù)見(jiàn)期的預(yù)報(bào)成果,制定明日發(fā)電計(jì)劃。因此,研究不同預(yù)見(jiàn)期的預(yù)報(bào)誤差分布規(guī)律能促進(jìn)發(fā)電計(jì)劃編制的合理性。本文選取該水庫(kù)2012年3月-2014年12月不同預(yù)見(jiàn)期的新安江模型徑流預(yù)報(bào)成果進(jìn)行誤差分布研究。不同預(yù)見(jiàn)期的徑流預(yù)報(bào)相對(duì)誤差的統(tǒng)計(jì)描述量見(jiàn)表2,其中確定性系數(shù)表示徑流預(yù)報(bào)過(guò)程的離散程度,計(jì)算結(jié)果表明其預(yù)報(bào)精度均達(dá)到甲等(大于0.9),符合規(guī)定。
表1 官地水庫(kù)徑流序列時(shí)期劃分表Tab.1 Guandi reservoir runoff period division table
表2 不同預(yù)見(jiàn)期的徑流預(yù)報(bào)相對(duì)誤差的統(tǒng)計(jì)描述量Tab.2 Statistical description of relative error of runoff forecasting for different forecast periods
以官地水庫(kù)整個(gè)時(shí)期的徑流系列為例。最大熵模型計(jì)算徑流預(yù)報(bào)誤差分布規(guī)律時(shí),樣本估計(jì)總體統(tǒng)計(jì)參數(shù)的3階以上的原點(diǎn)矩與理論值偏差較多,其抽樣誤差較大,因此僅采用序列的前3階原點(diǎn)矩建立約束條件,計(jì)算其整個(gè)時(shí)期不同預(yù)見(jiàn)期的徑流預(yù)報(bào)相對(duì)誤差的3階原點(diǎn)矩,見(jiàn)表3;建立官地水庫(kù)徑流預(yù)報(bào)誤差分布的最大熵模型,經(jīng)驗(yàn)證可利用逐步起點(diǎn)法假定初始點(diǎn),將1.2[μ-5σ,μ+5σ]作為誤差域[12],并采用非線性規(guī)劃求解函數(shù)推求式中的Lagrange乘子,結(jié)果見(jiàn)表4。
表3 不同預(yù)見(jiàn)期的徑流預(yù)報(bào)誤差原點(diǎn)矩Tab.3 The origin moment of runoff forecast errors in different forecast periods
表4 不同預(yù)見(jiàn)期的徑流預(yù)報(bào)誤差Lagrange乘子Tab.4 Lagrange multiplier of Runoff forecasting error of different forecast period
由表4可確定官地水庫(kù)不同預(yù)見(jiàn)期的徑流預(yù)報(bào)誤差的最大熵概率密度函數(shù),函數(shù)式如下(設(shè)x1、x2、x3、x4分別表示預(yù)見(jiàn)期為6、12、18、24 h的徑流預(yù)報(bào)相對(duì)誤差序列),并繪制不同預(yù)見(jiàn)期徑流預(yù)報(bào)誤差的最大熵分布曲線,同時(shí)給出其理論正態(tài)分布曲線和樣本直方圖作為對(duì)比,見(jiàn)圖2。
f(x1)=exp(-2.982 6-0.020 9x1-0.008 2x21+
1.035 3×10-4x31),x1∈[-55.9,56.2]
(17)
f(x2)=exp(-3.008 0-0.016 0x2-0.007 9x22+
1.154 0×10-4x32),x2∈[-59.3,60.9]
(18)
f(x3)=exp(-3.158 2-0.005 3x3-0.005 7x23+
5.553 7×10-6x33),x3∈[-63.8,66.5]
(19)
f(x4)=exp(-3.193 9-0.006 1x4-0.005 3x24+
1.597 9×10-6x34),x4∈[-73.2,73.1]
(20)
圖2 不同預(yù)見(jiàn)期的最大熵分布曲線、正態(tài)分布曲線和樣本直方圖的對(duì)比圖Fig.2 Comparison diagram of the maximum entropy distribution curves and normal distribution curves and sample histogram in different forecast period
由圖2可看出,對(duì)于不同的預(yù)見(jiàn)期,徑流預(yù)報(bào)誤差的樣本直方圖的形狀均呈中間高,兩邊低,左右基本對(duì)稱,初步表明徑流預(yù)報(bào)誤差系列呈正態(tài)分布;最大熵曲線與理論正態(tài)分布曲線基本吻合,兩曲線形狀、走勢(shì)相差不大,表明得到的最大熵曲線是比較合理的;相比于理論正態(tài)曲線,最大熵曲線的形狀更“高瘦”,預(yù)報(bào)誤差集中度更高,曲線最大概率值更大,且更接近樣本直方圖的最大概率值,這符合熵集中原理,即預(yù)報(bào)誤差的絕大部分可能狀態(tài)都集中在最大熵狀態(tài)附近;最大熵曲線與樣本直接圖一樣其誤差均有上下限,而理論正態(tài)曲線的積分區(qū)間為±∞。因此,相比于理論正態(tài)曲線,最大熵曲線擬合效果更好,更符合實(shí)際情況。
考慮流域徑流年內(nèi)豐枯變化對(duì)其預(yù)報(bào)誤差分布的影響,分別計(jì)算官地水庫(kù)枯水期、汛期和過(guò)渡期的6、12、18和24 h的徑流預(yù)報(bào)誤差的最大熵概率密度函數(shù),并繪制不同時(shí)期及不同預(yù)見(jiàn)期的徑流預(yù)報(bào)誤差最大熵曲線,分別見(jiàn)圖3和圖4。
圖3 不同時(shí)期的最大熵曲線對(duì)比圖Fig.3 The contrast diagram of Maximum entropy distribution curves of different period
圖4 不同預(yù)見(jiàn)期的最大熵曲線對(duì)比圖Fig.4 The contrast diagram of Maximum entropy distribution curves of different forecast periods
(1)由圖3可看出,對(duì)于不同時(shí)期,隨著預(yù)見(jiàn)期的增加,其最大熵曲線的形狀基本上均由“高瘦型”逐漸變?yōu)椤鞍中汀?,曲線的最大概率值逐漸降低,均值附近的誤差分布集中度逐漸降低,表明對(duì)于同一時(shí)期做出的徑流預(yù)報(bào),隨著預(yù)見(jiàn)期增加,預(yù)報(bào)精度降低,其不確定性增加。表5列出了不同時(shí)期、不同預(yù)見(jiàn)期及不同置信區(qū)間預(yù)報(bào)誤差的置信度。由表5可知,當(dāng)預(yù)見(jiàn)期為12、18和24 h時(shí),相比于整個(gè)時(shí)期、枯水期或過(guò)渡期,汛期的預(yù)報(bào)誤差在相應(yīng)置信區(qū)間內(nèi)的置信度差異較小,與預(yù)見(jiàn)期為6 h相應(yīng)的置信度差異較大,但從區(qū)間③開(kāi)始,隨著置信區(qū)間的加大,各個(gè)預(yù)見(jiàn)期置信度的增加幅度均比較緩慢,表明汛期各個(gè)預(yù)見(jiàn)期的預(yù)報(bào)誤差分布均比較集中,預(yù)報(bào)精度較高。這主要是因?yàn)槭芙邓陜?nèi)分配不均勻的影響,相比于枯水期和過(guò)渡期,汛期的徑流大且波動(dòng)性強(qiáng),隨著預(yù)見(jiàn)期的增加,徑流預(yù)報(bào)值的隨機(jī)性更強(qiáng),變化幅度更大,使其最大熵曲線變化更大。但就整體上而言,不同時(shí)期、不同預(yù)見(jiàn)期預(yù)報(bào)誤差位于[-20%,20%]置信區(qū)間的置信度基本達(dá)到0.95左右(僅24 h預(yù)見(jiàn)期的枯水期置信度最低為0.914),預(yù)報(bào)精度均達(dá)到甲等。
(2)由圖4和表5可看出,對(duì)于不同預(yù)見(jiàn)期,其最大熵曲線基本上是汛期最“高瘦”、過(guò)渡期次之、整個(gè)時(shí)期再次之、枯水期最“矮胖”,對(duì)應(yīng)地,其預(yù)報(bào)精度由高到低依次為汛期、過(guò)渡期、整個(gè)時(shí)期和枯水期。當(dāng)預(yù)見(jiàn)期為6 h時(shí),相應(yīng)的預(yù)報(bào)誤差位于區(qū)間③的置信度分別為0.958、0.837、0.796和0.677,其差異較大,汛期預(yù)報(bào)誤差的置信度遠(yuǎn)高于其他時(shí)期,且置信區(qū)間越大,其差異越小。這主要是由于受防洪需要,雖然汛期流量大且波動(dòng)性強(qiáng),但現(xiàn)有的新安江模型在多年的實(shí)際預(yù)報(bào)工作中已能較好地發(fā)掘該時(shí)期的徑流規(guī)律,使其預(yù)報(bào)精度高于其他時(shí)期;過(guò)渡期徑流主要受降雨和河槽蓄水補(bǔ)給等影響,其流量波動(dòng)較強(qiáng),造成該時(shí)期預(yù)報(bào)精度較低,預(yù)報(bào)不確定性較大;枯水期由于其流量極小,預(yù)報(bào)產(chǎn)生的較小差異也將造成其相對(duì)誤差值的較大變化,使該時(shí)期的預(yù)報(bào)精度最低,不確定性最大。
表5 不同時(shí)期、不同預(yù)見(jiàn)期及不同置信區(qū)間預(yù)報(bào)誤差的置信度Tab.5 The confidence of prediction error of different period, different forecast period and different confidence interval
注:置信區(qū)間的單位為“%”。
(3)對(duì)整個(gè)時(shí)期而言,盡管預(yù)見(jiàn)期不同,其最大熵曲線總是介于枯水期、汛期和過(guò)渡期之間。整個(gè)時(shí)期預(yù)報(bào)的不確定性是各個(gè)時(shí)期綜合作用的結(jié)果,盡管汛期預(yù)報(bào)的不確定性很小,但由于枯水期預(yù)報(bào)不確定性較大,從而增加了整體預(yù)報(bào)結(jié)果的不確定性。因此,在進(jìn)行徑流預(yù)報(bào)工作時(shí),應(yīng)充分考慮不同時(shí)期的預(yù)報(bào)誤差分布規(guī)律對(duì)其預(yù)報(bào)結(jié)果的影響,從而提高徑流預(yù)報(bào)的精度。
為了評(píng)判最大熵分布在官地水庫(kù)徑流預(yù)報(bào)誤差分布研究中的適用性,本文以整個(gè)徑流序列為例,將最大熵曲線與理論正態(tài)曲線的擬合效果進(jìn)行對(duì)比分析,分別采用判定系數(shù)(coefficient of determination,ηCOD)和均方根誤差(root mean square error,εRMSE)[13]以量化各曲線的擬合優(yōu)度,并分別計(jì)算不同預(yù)見(jiàn)期的最大熵曲線和理論正態(tài)曲線的熵值,計(jì)算結(jié)果見(jiàn)表6。計(jì)算公式分別入下:
(21)
(22)
(23)
(24)
由表6可知,對(duì)于整個(gè)時(shí)期的徑流序列,預(yù)見(jiàn)期分別為6、12、18、24 h時(shí),最大熵的熵值均比正態(tài)分布的小,表明由最大熵法確定的誤差分布曲線的不確定性更??;最大熵法的判定系數(shù)均比正態(tài)分布的大,而均方根誤差均比正態(tài)分布的小,表明最大熵法在擬合徑流預(yù)報(bào)誤差時(shí)效果更好,各個(gè)時(shí)期的最大熵曲線適用性判斷結(jié)果類似??梢?jiàn),最大熵法作為一種對(duì)未知分布進(jìn)行推斷的方法,其不確定性小,擬合效果比標(biāo)準(zhǔn)正態(tài)分布的更好,說(shuō)明該方法在對(duì)徑流預(yù)報(bào)相對(duì)誤差分布的研究是合理可行的。
表6 最大熵分布和正態(tài)分布的適用性判斷表Tab.6 The applicability judgment table of maximum entropy distribution and normal distribution
通過(guò)最大熵模型對(duì)官地水庫(kù)2012年3月-2014年12月不同預(yù)見(jiàn)期的入庫(kù)徑流預(yù)報(bào)誤差系列進(jìn)行研究,結(jié)果表明最大熵法在擬合徑流預(yù)報(bào)誤差分布時(shí),其熵值最小,擬合效果更好,適用性也更強(qiáng);同時(shí),考慮流域徑流年內(nèi)的豐枯變化,分別計(jì)算了不同預(yù)見(jiàn)期的整個(gè)時(shí)期、枯水期、汛期和過(guò)渡期的最大熵概率密度函數(shù)及其分布曲線,并給出不同置信區(qū)間下的置信度,其中預(yù)報(bào)誤差位于[-20%,20%]置信區(qū)間的置信度基本達(dá)到0.95以上,預(yù)報(bào)精度達(dá)到甲等,預(yù)報(bào)精度由高到低依次為汛期、過(guò)渡期、整個(gè)時(shí)期和枯水期,且各個(gè)時(shí)期預(yù)報(bào)誤差的不確定性均隨著預(yù)見(jiàn)期的增加而增大。但由于官地水庫(kù)現(xiàn)有的徑流系列較短,本文僅考慮按時(shí)期對(duì)徑流系列進(jìn)行劃分,待徑流系列的逐步延長(zhǎng),可考慮按流量級(jí)別對(duì)其劃分,求出不同流量級(jí)別下的徑流預(yù)報(bào)誤差最大熵概率密度函數(shù),探索不同流量級(jí)別的徑流預(yù)報(bào)誤差分布規(guī)律,從而更好的掌握徑流預(yù)報(bào)誤差的分布規(guī)律,更加合理的編制其發(fā)電計(jì)劃。
□
[1] 朱星明,安 波,王成明,等.水庫(kù)流域入庫(kù)洪水預(yù)報(bào)誤差分析[J].水文,1997,(6):21-25.
[2] 左保河.實(shí)時(shí)洪水預(yù)報(bào)過(guò)程中的誤差分布特性研究[J].華北水利水電學(xué)院學(xué)報(bào),1997,18(2):42-47.
[3] 劉心愿,郭生練,李 響,等.考慮水文預(yù)報(bào)誤差的三峽水庫(kù)防洪調(diào)度圖[J].水科學(xué)進(jìn)展,2011,22(6):771-779.
[4] 董前進(jìn),傅建彬,陳森林.基于統(tǒng)計(jì)圖形的入庫(kù)流量預(yù)報(bào)誤差分布規(guī)律[J]. 水電能源科學(xué),2011,29(4):5-7.
[5] Singh V P. The use of entropy in hydrology and water resources[J].Hydrological Processes,1997,(11):587-626.
[6] 周惠成,李麗琴,王本德. 洪水預(yù)報(bào)誤差分布的極大熵法[J].大連理工大學(xué)學(xué)報(bào),2007,47(3):408-413.
[7] 刁艷芳,王本德,劉 冀.基于最大熵原理方法的洪水預(yù)報(bào)誤差分布研究[J].水利學(xué)報(bào),2007,38(5):591-595.
[8] 董前進(jìn),陳森林,王先甲.最大熵原理的洪水預(yù)報(bào)誤差分布規(guī)律推求——以三峽水庫(kù)為例[J].武漢大學(xué)學(xué)報(bào)(工學(xué)版),2012,45(4):418-422.
[9] Jaynes E T. Information theory and statistical mechanics[J].The Physical Review,1957,106(4):620-630.
[10] J N 希德?tīng)?工程概率設(shè)計(jì)——原理與應(yīng)用[M].北京:科學(xué)出版社,1989:97-119.
[11] 唐國(guó)磊. 考慮徑流預(yù)報(bào)及其不確定性的水電站水庫(kù)調(diào)度研究[D]. 遼寧大連:大連理工大學(xué),2009.
[12] 刁艷芳.雙標(biāo)準(zhǔn)的水庫(kù)防洪預(yù)報(bào)調(diào)度方式研究及其應(yīng)用[D]. 遼寧大連:大連理工大學(xué),2010.
[13] 葉 林,朱 遠(yuǎn),趙永寧,等.風(fēng)能資源分布特性的改進(jìn)最大熵方法[J].中國(guó)電機(jī)工程學(xué)報(bào),2014,34:6 093-6 100.