戴領(lǐng) 駱光磊 周建中
摘要:
現(xiàn)有水庫調(diào)度模擬模型在長時(shí)段模擬時(shí)存在嚴(yán)重的誤差累積,極大影響模型模擬精度。針對(duì)上述問題,首先建立了基于隨機(jī)森林和貝葉斯優(yōu)化理論的水庫調(diào)度規(guī)則提取模型,進(jìn)一步引入概率性預(yù)測方法,提出了一種基于分位數(shù)回歸森林的水庫調(diào)度滾動(dòng)模擬方法,以預(yù)測區(qū)間分位數(shù)為媒介將概率預(yù)測信息傳遞至下一時(shí)刻,最后以二灘水庫和觀音巖水庫為研究實(shí)例,對(duì)比分析了點(diǎn)預(yù)測模型滾動(dòng)模擬結(jié)果以及多步模擬模型結(jié)果。研究表明:所提出的基于分位數(shù)回歸森林的水庫調(diào)度滾動(dòng)模擬方法能夠有效降低模擬累積誤差,提高長時(shí)段模擬精度,相對(duì)于直接采用確定性的調(diào)度規(guī)則進(jìn)行滾動(dòng)模擬,該方法在同等指標(biāo)要求下模擬時(shí)段延長3~5 d,在相同模擬天數(shù)情況下,各項(xiàng)指標(biāo)均提升5%~10%。
關(guān) 鍵 詞:
水庫調(diào)度; 滾動(dòng)模擬; 隨機(jī)森林; 分位數(shù)回歸森林; 貝葉斯優(yōu)化
中圖法分類號(hào): TV391
文獻(xiàn)標(biāo)志碼: A
DOI:10.16232/j.cnki.1001-4179.2023.07.031
0 引 言
隨著國民經(jīng)濟(jì)發(fā)展對(duì)電力需求的快速增長,水能資源開發(fā)與利用逐漸加快[1]。流域內(nèi)水庫逐漸增多,梯級(jí)上下游水力聯(lián)系逐漸緊密,上游水庫出庫流量在下游水庫入庫流量中的占比增大,導(dǎo)致下游水庫調(diào)度運(yùn)行難度增加,嚴(yán)重影響了下游水庫綜合效益發(fā)揮。為此,在目前流域大規(guī)模水庫群逐步投產(chǎn)運(yùn)營的背景下,開展水庫調(diào)度運(yùn)行模擬模型研究,在短期尺度上,下游水庫可以提前預(yù)知上游水庫出庫過程,獲得更加精確的預(yù)報(bào)入庫流量,從而提前制定更加合理的水庫蓄泄過程,提高水庫綜合效益;在中長期尺度上,可以獲知上游水庫在任意來水條件下的調(diào)蓄過程,明晰上游水庫調(diào)度運(yùn)行對(duì)下游水庫入庫流量、年發(fā)電量等因素的影響。同時(shí),對(duì)流域整體而言,有利于探索流域大規(guī)模水庫群聯(lián)合調(diào)度理論,為流域梯級(jí)水庫群聯(lián)合運(yùn)行、水資源優(yōu)化配置提供科學(xué)指導(dǎo)[2]。
目前,水庫模擬調(diào)度模型常采用調(diào)度圖方式。范繼輝[3]結(jié)合馬斯京根演進(jìn)方法和水庫調(diào)度圖建立了長江上游水庫群模擬調(diào)度模型,通過設(shè)置不同的運(yùn)行情景,分析了上游水庫群不同蓄水時(shí)機(jī)下三峽水庫來水發(fā)電響應(yīng)過程。戴明龍[4]基于長江上游水庫群調(diào)度圖建立了上游水庫群協(xié)同“還原-模擬-演算”模型,模擬上游各梯級(jí)水庫的蓄水運(yùn)行,得到不同水平年經(jīng)上游水庫調(diào)節(jié)后的下游控制站徑流,進(jìn)而分析了上游水庫運(yùn)行對(duì)下游水文變異的影響。然而,在實(shí)際調(diào)度中,調(diào)度圖僅作為參考,調(diào)度人員會(huì)根據(jù)當(dāng)前水位、來水等信息修正決策,真實(shí)調(diào)度過程往往與調(diào)度圖相差甚遠(yuǎn)。已建水庫通過多年運(yùn)行,積累了大量水文數(shù)據(jù)以及水庫歷史運(yùn)行數(shù)據(jù),這些數(shù)據(jù)中蘊(yùn)藏著大量的規(guī)律性信息,反映了水庫調(diào)度人員多年人工經(jīng)驗(yàn)和決策智慧。而機(jī)器學(xué)習(xí)算法擅長從大量數(shù)據(jù)中挖掘隱含規(guī)律,具有極強(qiáng)的非線性擬合能力。因此,隨著數(shù)據(jù)挖掘理論不斷發(fā)展,基于機(jī)器學(xué)習(xí)算法的水庫調(diào)度模擬模型逐漸嶄露頭角并得到推廣。駱光磊[5]基于改進(jìn)深度神經(jīng)網(wǎng)絡(luò),考慮水庫運(yùn)行約束,構(gòu)建了金沙江中游觀音巖水庫、雅礱江錦屏一級(jí)、二灘水庫群模擬調(diào)度模型,實(shí)現(xiàn)了庫群旬尺度年運(yùn)行過程模擬。湯正陽等[6]收集了溪洛渡水電站的調(diào)度運(yùn)行數(shù)據(jù),基于RNN,LSTM,GRU3種循環(huán)神經(jīng)網(wǎng)絡(luò),學(xué)習(xí)電站現(xiàn)有調(diào)度規(guī)則,構(gòu)建了溪洛渡水庫的出流量預(yù)測模型,并探究不同參數(shù)設(shè)定對(duì)模型精度和計(jì)算速度的影響,對(duì)比了3種模型的模擬性能,分析了影響水庫調(diào)度的主要因素。Chaves等[7]采用人工神經(jīng)網(wǎng)絡(luò)模擬水庫調(diào)度系統(tǒng)。Zhu等[8]提出了一種基于人工智能算法和系統(tǒng)動(dòng)力學(xué)模型的梯級(jí)水庫自適應(yīng)仿真模型,所提模型可以有效地反映系統(tǒng)運(yùn)行的動(dòng)態(tài)變化,實(shí)現(xiàn)各種條件下系統(tǒng)運(yùn)行和自適應(yīng)調(diào)度決策的精細(xì)模擬。然而,現(xiàn)有研究中大多數(shù)水庫調(diào)度模擬模型均為單步模擬模型,即模型只能獲得下一個(gè)時(shí)刻模擬值,而如果要獲得長序列模擬值,即t+1,t+2,…t+n時(shí)刻模擬值,則需要進(jìn)行多步模擬。目前多步模擬主要有兩種方法:① 直接利用t時(shí)刻及之前的狀態(tài),構(gòu)建n個(gè)模型,分別預(yù)測t+1,t+2,…,t+n時(shí)刻輸出值,集成n個(gè)模型實(shí)現(xiàn)多步模擬。該方法主要缺點(diǎn)是需要構(gòu)建多個(gè)模型,且時(shí)段越長,輸入輸出因子間相關(guān)性會(huì)降低,模型精度無法保證;② 將t+1時(shí)刻模型預(yù)測值當(dāng)做已知量代入到原模型中,預(yù)測t+2時(shí)刻輸出值,以此類推獲得t+n時(shí)刻輸出值。該方法可以實(shí)現(xiàn)無限制時(shí)長的預(yù)測,但是t+1時(shí)刻模型輸出誤差會(huì)代入到模型中加大t+2時(shí)刻模型預(yù)測誤差,多次滾動(dòng)會(huì)使誤差累積,從而降低模型精度。
為此,本文針對(duì)第2種多步模擬方法,為降低模擬模型累積誤差,提出一種基于分位數(shù)回歸森林和貝葉斯優(yōu)化理論的水庫調(diào)度滾動(dòng)模擬方法,首先建立基于隨機(jī)森林和貝葉斯優(yōu)化理論的調(diào)度規(guī)則提取模型作為對(duì)比模型,在此基礎(chǔ)上,綜合考慮上述兩種多步模擬方法,分別構(gòu)建水庫調(diào)度多步模擬和基于分位數(shù)回歸森林的滾動(dòng)模擬模型,最后以二灘水庫和觀音巖水庫作為研究對(duì)象進(jìn)行驗(yàn)證。
1 基于隨機(jī)森林和貝葉斯優(yōu)化理論的水庫調(diào)度規(guī)則提取模型
1.1 隨機(jī)森林
隨機(jī)森林(Random Forests,RF)算法最早由Brieman等學(xué)者于2001年提出[9],是一種基于決策樹和自舉匯聚法(Bagging)的集成模型,適用于解決小樣本、高維度特征數(shù)據(jù)分類和回歸問題,對(duì)于存在噪聲和缺失值的觀測數(shù)據(jù)具有很好的魯棒性[10]。其主要原理是:首先通過樣本的有放回抽樣產(chǎn)生多組訓(xùn)練集,然后根據(jù)訓(xùn)練集數(shù)據(jù)隨機(jī)選擇特征生成決策樹,最后將多棵決策樹的結(jié)果進(jìn)行投票選擇或取均值獲得最終結(jié)果。
1.2 貝葉斯優(yōu)化
超參數(shù)優(yōu)化是機(jī)器學(xué)習(xí)領(lǐng)域一大重難點(diǎn),旨在尋找使算法在驗(yàn)證集上表現(xiàn)性能最佳的超參數(shù)組合。超參數(shù)與一般模型參數(shù)不同,需在訓(xùn)練前設(shè)置,決定模型架構(gòu),如支持向量機(jī)中的懲罰系數(shù),神經(jīng)網(wǎng)絡(luò)層數(shù)、節(jié)點(diǎn)數(shù)等[11]。隨著機(jī)器學(xué)習(xí)算法模型愈加復(fù)雜、訓(xùn)練樣本逐漸增加,單次模型訓(xùn)練時(shí)間成本越來越高。因此,為提高搜索效率,貝葉斯優(yōu)化算法應(yīng)運(yùn)而生。它首先基于目標(biāo)函數(shù)過去評(píng)估結(jié)果建立代理模型,進(jìn)而通過采集函數(shù)尋找代理模型期望收益最大的超參數(shù),然后將超參數(shù)與評(píng)估結(jié)果作為輸入更新代理模型,以此往復(fù)交替進(jìn)行,最終獲得目標(biāo)值最優(yōu)的超參數(shù)。相對(duì)于隨機(jī)或網(wǎng)格搜索,貝葉斯優(yōu)化算法使用不斷更新的代理模型,并通過推斷已有結(jié)果來“集中”更有希望的超參數(shù),從而大大減少了調(diào)參時(shí)間[12]。
1.3 調(diào)度規(guī)則提取模型
水庫調(diào)度決策與水位、入庫流量、出庫流量、出力、負(fù)荷、預(yù)報(bào)流量等因素密切相關(guān),考慮到水庫出力、負(fù)荷、預(yù)報(bào)流量數(shù)據(jù)難以獲取,本文選擇時(shí)段數(shù)、水庫前期水位、入庫流量、出庫流量以及當(dāng)前時(shí)段入庫流量作為影響因子構(gòu)成輸入因子集,考慮到時(shí)段數(shù)和水庫前一時(shí)刻狀態(tài)以及當(dāng)前時(shí)段入庫流量與當(dāng)前時(shí)段決策關(guān)系最為密切,因此將其作為模型輸入必選因子,對(duì)剩余因子采用互信息方法定量評(píng)估其與輸出因子間的相關(guān)性并將其作為備選因子,然后采用隨機(jī)森林算法構(gòu)建調(diào)度規(guī)則提取模型,最后采用貝葉斯超參數(shù)優(yōu)化算法中的樹形Parzen評(píng)估器同時(shí)優(yōu)化輸入因子選擇個(gè)數(shù)與隨機(jī)森林算法超參數(shù),尋找模型效果最優(yōu)的超參數(shù)組合。模型具體步驟及流程(圖1)如下:
步驟1:從水庫調(diào)度運(yùn)行數(shù)據(jù)中挑選時(shí)段數(shù)T、前期水位H、入庫流量Q、出庫流量q等特征組建模型輸入因子集,選擇當(dāng)前時(shí)段末水位作為模型輸出,選擇時(shí)段數(shù)、前1時(shí)段入庫、出庫、末水位及當(dāng)前時(shí)段入庫作為必選輸入因子,選擇前2~10時(shí)段入庫流量Qt-2~10、出庫流量qt-2~10、末水位Ht-2~10構(gòu)成備選輸入因子集,計(jì)算備選輸入因子集中各因子與輸出變量間的互信息并排序。
步驟2:將備選輸入因子個(gè)數(shù)M與隨機(jī)森林算法超參數(shù)最大深度、最小樣本數(shù)、決策樹個(gè)數(shù)組合成超參數(shù)集。備選輸入因子個(gè)數(shù)M表示在備選因子集中選擇互信息值排序靠前的M個(gè)因子與必選輸入因子構(gòu)成模型輸入。
步驟3:根據(jù)模型輸入輸出構(gòu)造數(shù)據(jù)樣本并劃分訓(xùn)練集和測試集,以訓(xùn)練集上交叉驗(yàn)證的均方根誤差均值最小為目標(biāo)函數(shù),采用樹形Parzen估計(jì)器優(yōu)化模型超參數(shù)。
步驟4:選用步驟3中最優(yōu)超參數(shù)重新對(duì)模型進(jìn)行訓(xùn)練,計(jì)算模型在測試集上的各項(xiàng)指標(biāo),評(píng)估模型效果。
2 基于分位數(shù)回歸森林的水庫調(diào)度滾動(dòng)模擬方法
2.1 分位數(shù)回歸森林
分位數(shù)回歸森林(Quantile Regression Forests,QRF)是在隨機(jī)森林算法基礎(chǔ)上結(jié)合分位數(shù)回歸(Quantile Regression,QR)的改進(jìn)模型[13],其不僅能夠獲得預(yù)測結(jié)果的條件均值,還能得到預(yù)測結(jié)果的條件概率分布,被廣泛應(yīng)用于負(fù)荷預(yù)測、風(fēng)速區(qū)間預(yù)測領(lǐng)域[14-16]。算法實(shí)現(xiàn)的主要步驟如下:
步驟1:根據(jù)隨機(jī)森林算法,生成N棵決策樹,記錄每棵決策樹每個(gè)葉子節(jié)點(diǎn)上所有訓(xùn)練樣本;
步驟2:對(duì)于給定的新樣本X*,獲取其在隨機(jī)森林每棵樹的葉子點(diǎn)ln,如圖2所示,計(jì)算每棵決策樹上所有樣本的權(quán)重wi,n,公式如下:
wi,n=1/k,Xi∈R(ln)0,XiR(ln)(1)
式中:k為ln葉子節(jié)點(diǎn)上的訓(xùn)練樣本子集R(ln)數(shù)據(jù)量,Xi為訓(xùn)練樣本。
3 實(shí)例研究
本文分別以二灘水庫和觀音巖水庫為研究對(duì)象。二灘水庫位于雅礱江下游,壩址以上流域面積11.64萬km2,約占雅礱江整個(gè)流域面積的90%,壩址處多年平均流量1 670 m3/s,年徑流量52.7 km3;觀音巖水庫位于金沙江中游,位于云南省華坪縣與四川省攀枝花市的交界處,上游接魯?shù)乩娬荆掠尉嗯手ㄊ?7 km,各水庫基本信息見表1。研究分別采用2014~2019年數(shù)據(jù)為訓(xùn)練數(shù)據(jù),2020年數(shù)據(jù)作為測試數(shù)據(jù),時(shí)間尺度為日尺度。根據(jù)第1節(jié)所提方法建立水庫調(diào)度規(guī)則提取模型(記為RF模型),圖4~5與表2分別為二灘和觀音巖水庫在測試集上各評(píng)價(jià)指標(biāo)結(jié)果,由圖表可知,各水庫單步模擬精度均較高。
圖6~7分別為二灘和觀音巖水庫QRF模型在70%,80%,90%置信區(qū)間(Probability Intervals,PIs)下單步模擬結(jié)果。由圖可知,某些時(shí)段分位數(shù)預(yù)測值相同,且模擬值的區(qū)間寬度越小,分位數(shù)模擬值相同時(shí)段長度也越短。其主要原因是:這些時(shí)段水位變化幅度不大,入庫流量等其他特征區(qū)分程度不明顯,從而導(dǎo)致隨機(jī)森林模型將其劃分至同一葉子節(jié)點(diǎn),而分位數(shù)回歸森林采用葉子節(jié)點(diǎn)上樣本權(quán)重作為頻率估計(jì)分位數(shù)模擬值,故其分位數(shù)相同,同時(shí),模擬區(qū)間寬度越小,證明該時(shí)段樣本越集中,相鄰時(shí)段樣本區(qū)別越大,所在的葉子節(jié)點(diǎn)數(shù)不同從而其分位數(shù)預(yù)測值不同。此外,二灘水庫預(yù)測區(qū)間寬度非汛期時(shí)段較汛期小,其主要原因是水庫在高水位運(yùn)行期水位基本保持不變,而汛期由于防洪調(diào)度需求,相同時(shí)段水位變化較大,需要較寬區(qū)間才能覆蓋所有樣本。相反,觀音巖水庫為周調(diào)節(jié)水庫,水庫全年無明顯的蓄水與消落時(shí)期,日間波動(dòng)幅度較大,相同時(shí)段的樣本較為分散,其區(qū)間寬度較二灘水庫要大。表3為不同置信度下區(qū)間預(yù)測指標(biāo)值,由表3可知,給定置信度下的PICP指標(biāo)基本大于該置信度,預(yù)測結(jié)果可靠。區(qū)間覆蓋率PICP指標(biāo)隨給定置信度的增大而增大,但同時(shí)區(qū)間平均寬度PINAW指標(biāo)也隨之增大,95%置信度下,預(yù)測區(qū)間基本覆蓋所有實(shí)測值??傮w而言,各水庫QRF模型輸出的不同置信區(qū)間很好地覆蓋了實(shí)測水位曲線,區(qū)間模擬效果較好。
進(jìn)一步依托上述2個(gè)模型,設(shè)置3套模擬方案:方案一,采用二灘水庫單步模擬模型滾動(dòng)模擬n個(gè)時(shí)段。方案二,分別用以后n個(gè)時(shí)段末水位為輸出,重新率定模型,直接模擬后n個(gè)時(shí)段的調(diào)度過程,并通過水庫調(diào)度計(jì)算判斷是否滿足調(diào)度基本約束(水位上下限,出庫上下限),進(jìn)行水位修正。方案三,采用所提方法進(jìn)行滾動(dòng)模擬n個(gè)時(shí)段。上述方案中n取50,方案一和方案三分別以2020年1月1日至11月19日為起始時(shí)刻進(jìn)行滾動(dòng)模擬,從而獲得不同模擬時(shí)長下水位模擬值,方案二以2020年以前數(shù)據(jù)為訓(xùn)練集,2020年數(shù)據(jù)為測試集,模型訓(xùn)練過程與第2節(jié)相同,方案三中模擬方法預(yù)測水位分位數(shù)步長Δ=1,PINAW指標(biāo)權(quán)重η=50。
圖8~9為不同方案在不同模擬時(shí)長下各水庫各指標(biāo)變化圖。由圖可知:兩水庫各方案指標(biāo)變化趨勢保持一致。方案一和方案三以原始單步模擬模型輸出作為下一時(shí)段單步模擬模型輸入進(jìn)行滾動(dòng)模擬,隨著模擬時(shí)段增加,累積誤差逐漸增大,模擬過程逐步偏離實(shí)際過程,滾動(dòng)模擬效果逐漸變差;方案二各評(píng)估指標(biāo)變化趨勢一致,均表現(xiàn)為模型效果首先急速下降,最后趨于穩(wěn)定,但二灘水庫確定性系數(shù)隨模擬時(shí)長增加維持在0.85以上,而觀音巖水庫較差,隨著模擬時(shí)長增加,各項(xiàng)評(píng)價(jià)指標(biāo)急劇下降,模型基本失效。對(duì)比3種模擬方案,在模擬時(shí)長較短時(shí)方案三模擬效果優(yōu)于方案一和二,其主要原因是:水庫QRF模型在區(qū)間覆蓋率滿足要求的基礎(chǔ)上區(qū)間寬度較小。區(qū)間寬度越小,說明該葉子節(jié)點(diǎn)樣本越集中,其不同預(yù)測分位數(shù)間的差距較小,預(yù)測結(jié)果越接近真實(shí)值,同時(shí)式(8)中各輸入?yún)^(qū)別越小,則模型大部分輸出落在隨機(jī)森林相同葉子節(jié)點(diǎn)上,從而減少了參與分位數(shù)計(jì)算的訓(xùn)練樣本數(shù)量,進(jìn)一步降低了下一時(shí)刻的模擬區(qū)間寬度;在模擬時(shí)長較長時(shí),方案二的模擬精度遠(yuǎn)遠(yuǎn)高于方案一和三,其主要原因是:當(dāng)模擬時(shí)段較長時(shí),時(shí)段誤差逐步累積,水位偏差逐步變大,而前期水位對(duì)RF和QRF模型輸出值影響較大,即使方案一和方案三在模擬過程中添加了后期實(shí)際入庫流量信息,也無法較大改善模擬效果??傮w而言,方案二完全通過數(shù)據(jù)挖掘的方式,相對(duì)方案一和方案二,缺少了后面時(shí)段的真實(shí)入庫信息的加入,其在滾動(dòng)模擬時(shí)段較短時(shí)模擬效果沒有方案一和方案二好,但隨著模擬時(shí)長增加,方案一和三時(shí)段累積誤差逐步占主導(dǎo)作用,此時(shí)方案二的模擬效果較好。但由于方案二模擬時(shí)采用的是純數(shù)據(jù)挖掘方式,模擬效果受數(shù)據(jù)系列影響較強(qiáng),不確定性程度較大,缺少物理意義支撐,且其無法使用預(yù)報(bào)信息,使用靈活性不如方案一和三。此外,方案三模擬效果持續(xù)優(yōu)于方案一,在同等指標(biāo)要求下,方案三滾動(dòng)模擬時(shí)段延長3~5 d,在相同模擬天數(shù)情況下,各項(xiàng)評(píng)價(jià)指標(biāo)均提升5%~10%,表明所提方法能夠有效降低滾動(dòng)模擬累積誤差,提高水庫調(diào)度長時(shí)段模擬精度。
4 結(jié) 論
本文分別以二灘水庫和觀音巖水庫為研究對(duì)象,首先建立了基于隨機(jī)森林和貝葉斯超參數(shù)優(yōu)化的水庫調(diào)度規(guī)則提取模型,依據(jù)兩種不同的多步模擬策略,建立了水庫調(diào)度滾動(dòng)模擬模型。在此基礎(chǔ)上,考慮到概率預(yù)測方法能夠獲取模型預(yù)測值更多信息,提出了一種基于分位數(shù)回歸森林的水庫調(diào)度滾動(dòng)模擬方法,最后,對(duì)比分析了所提方法與兩類多步模擬模型的模擬效果。研究結(jié)果表明:基于隨機(jī)森林和貝葉斯超參數(shù)優(yōu)化的水庫調(diào)度規(guī)則提取模型效果較好,精度較高;通過構(gòu)建多個(gè)模型實(shí)現(xiàn)多步模擬方法在模擬時(shí)段較短時(shí)模擬效果較差,較長時(shí)段模擬效果較好,但該方法模擬效果受數(shù)據(jù)系列影響較強(qiáng),不確定性程度較大,且使用靈活性差;本文所提基于分位數(shù)回歸森林的水庫調(diào)度滾動(dòng)模擬方法能夠有效降低模擬累積誤差,提高長時(shí)段模擬精度。
本文所提方法的核心在于在水庫調(diào)度模擬中引入概率性預(yù)測方法,利用預(yù)測區(qū)間內(nèi)的所有分位數(shù)作為下一時(shí)刻的輸入,從而在一定程度上減弱滾動(dòng)模擬累積誤差,因此本文所提方法中的概率預(yù)測方法不局限于隨機(jī)森林算法,任意類型的概率性預(yù)測方法均可使用。此外,受研究者工程經(jīng)驗(yàn)、理論水平和研究時(shí)間的限制,尚存在一些研究難點(diǎn)需要在今后的研究工作中進(jìn)一步突破,特別是需針對(duì)不同時(shí)期分別建立相應(yīng)模擬模型,以進(jìn)一步提高模型模擬精度,提升方法的適用性。
參考文獻(xiàn):
[1] 彭才德.“十三五”水電發(fā)展及展望[J].中國電力企業(yè)管理,2019,(4):34-36.
[2] 戴領(lǐng).梯級(jí)水庫群調(diào)度運(yùn)行對(duì)下游水庫防洪發(fā)電影響分析[D].武漢:華中科技大學(xué),2021.
[3] 范繼輝.梯級(jí)水庫群調(diào)度模擬及其對(duì)河流生態(tài)環(huán)境的影響:以長江上游為例[D].成都:中國科學(xué)院·水利部成都山地災(zāi)害與環(huán)境研究所,2007.
[4] 戴明龍.長江上游巨型水庫群運(yùn)行對(duì)流域水文情勢影響研究[D].武漢:華中科技大學(xué),2017.
[5] 駱光磊.基于深度學(xué)習(xí)的流域水庫群調(diào)度模擬方法研究與系統(tǒng)實(shí)現(xiàn)[D].武漢:華中科技大學(xué),2020.
[6] 湯正陽,張迪,林俊強(qiáng),等.基于循環(huán)神經(jīng)網(wǎng)絡(luò)算法的水庫調(diào)度模擬[J].水電能源科學(xué),2021,39(5):83-86,70.
[7] CHAVES P,CHANG F J.Intelligent reservoiroperation system based on evolving artificial neural networks[J].Advances in Water Resources,2008,31(6):926-936.
[8] ZHU B,LIU J,LIN L,et al.Cascade reservoirs adaptive refined simulation model based on the mechanism-AI coupling modeling paradigm[J].Journal of Hydrology,2022,612(B):128229.
[9] BREIMAN L.Random forests[J].Machine learning,2001,1(45):5-32.
[10] LIAW A,MATTHEW W.Classification and regression by randomforest[J].Forest,2002(2/3):18-22.
[11] 浮盼盼,司琪,王鑫賽.機(jī)器學(xué)習(xí)算法的超參數(shù)優(yōu)化:理論與實(shí)踐[J].電腦編程技巧與維護(hù),2020(12):116-117.
[12] BERGSTRA J,BARDENET R,KGL B,et al.Algorithms for Hyper-Parameter Optimization[C]∥25th Annual Conference on Neural information Processing Systems.NIPS Fund.Granada:NIPS Fund,2011.
[13] ROGER K,HALLOCK K F.Quantile Regression[J].Journal of Economic Perspectives,2001,15(4):143-156.
[14] 孫國強(qiáng),梁智,俞娜燕,等.基于EWT和分位數(shù)回歸森林的短期風(fēng)電功率概率密度預(yù)測[J].電力自動(dòng)化設(shè)備,2018,38(8):158-165.
[15] HE F F,ZHOU J Z,MO L,et al.Day-ahead short-term load probability density forecasting method with a decomposition-based quantile regression forest[J].Applied Energy,2020:262114396.
[16] HE Y Y,QIN Y,WANG S,et al.Electricity consumption probability density forecasting method based on LASSO-Quantile Regression Neural Network[J].Applied Energy,2019:233-234565-575.
[17] ABBAS K,NAHAVANDI S,CREIGHTON D,et al.Lower upper bound estimation method for construction of neural network-based prediction intervals[J].IEEE transactions on neural networks,2011,22(3),337-346.
(編輯:江 文)
Rolling simulation method of reservoir operation based on Quantile Regression Forest
DAI Ling1,LUO Guanglei2,ZHOU Jianzhong3
(1.CISPDR Corporation,Wuhan 430010,China;2.CCCC Second Harbor Consultants Co.,Ltd.,Wuhan 430061,China; 3.School of Civil and Hydraulic Engineering,Huazhong University of Science and Technology,Wuhan 430010,China)
Abstract:
It is difficult for existing reservoir operation simulation models to avoid error accumulation in multi-step simulation,which seriously affects the long-term simulation accuracy of the models.In view of the above problems,firstly,a reservoir operation rule extraction model based on random forest and Bayesian optimization theory was established.Then the probabilistic prediction method was further introduced and a rolling simulation method of reservoir operation based on Quantile Regression Forest was proposed,which used the quantile of the prediction interval as the medium to transmit the probabilistic prediction information to the next time.Finally,Ertan and Guanyinyan Reservoirs were computed by this model,and the results of the rolling simulation of the point prediction model and multi-step simulation model were compared and analyzed.The case study showed that the proposed rolling simulation method of reservoir operation based on Quantile Regression Forest could effectively reduce the cumulative error of simulation and improve the accuracy of the long-term simulation.Compared with the rolling simulation using deterministic scheduling rules directly,the proposed method could extend the simulation period by 3~5 days under the same index requirements,and all indicators could increase by 5%~10% under the same simulation days.
Key words:
reservoir operation;rolling simulation;random forest;Quantile Regression Forest;Bayesian optimization