亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Copula熵-隨機森林的中長期徑流預報研究

        2021-12-09 23:12:01黃朝君賈建偉秦赫王棟
        人民長江 2021年11期
        關鍵詞:丹江口水庫

        黃朝君 賈建偉 秦赫 王棟

        摘要:預測因子作為中長期預報模型的輸入項,是影響預報結果精度的關鍵要素。為進一步提高預報精度,提出了一種Copula熵與隨機森林模型相結合的中長期徑流預報方法。該方法首先采用Copula熵指標對預測因子進行篩選,然后將選取的預測因子作為輸入項,導入隨機森林模型中對月徑流進行相應預測。將該方法應用于漢江流域丹江口水庫的逐月入庫徑流預報中,并與相關系數(shù)篩選法進行對比。結果表明:基于Copula熵指標篩選出的預測因子對應的模擬結果具有更高的精度,尤其對于汛期而言,其模擬值與實測值的擬合優(yōu)度顯著優(yōu)于比選方法,說明其篩選出的預測因子具有更好的合理性。

        關鍵詞:中長期徑流預報; 預測因子; 大氣環(huán)流因子; Copula熵; 隨機森林模型; 丹江口水庫

        中圖法分類號: TV211.1+2

        文獻標志碼: A

        DOI:10.16232/j.cnki.1001-4179.2021.11.013

        0引 言

        中長期徑流預報作為水文預報的重要組成部分,是指依據(jù)已知信息對預見期為月、季、年尺度的徑流要素進行定性或定量的預測[1-5]。與短期徑流預報相比,其預報結果可為水利管理部門提供更為充足的決策時間,在水庫調度、防洪減災及水資源綜合管理等工作中發(fā)揮重要作用[6-8]。

        目前,針對中長期徑流預報已有大量研究,尤其隨著人工智能與數(shù)據(jù)挖掘技術的快速發(fā)展,大量機器學習算法被應用于該領域。如酈于杰等[9]采用支持向量機對漢江流域皇莊站的長期徑流過程進行了預報,并對預報結果的不確定性進行了相應分析;許斌等[10]以丹江口水庫為例,比較了隨機森林與梯度提升樹兩種機器學習模型的預報精度;謝帥等[11]將LASSO回歸與支持向量機相耦合,并應用于龍羊峽水庫入庫徑流預報研究中;Huang等[12]將多種機器學習算法與BMA方法相結合,開展了基于多模型耦合的漢江流域中長期徑流預報研究;鄭炎輝等[13]采用隨機森林與RBF人工神經(jīng)網(wǎng)絡模型開展了新豐江水庫枯季入庫徑流中長期預報研究;王棟等[14]將經(jīng)驗模態(tài)分解方法與BP神經(jīng)網(wǎng)絡相結合,對青海省湟水河流域月徑流過程進行了預測;仕玉治等[15]將相關向量機、支持向量機及自動回歸滑動平均模型應用于南方兩水庫入庫月徑流中長期預報研究中,并比較了三者的精度差異。然而,上述研究大都側重于預報模型的選取,對預報因子篩選普遍采用相關系數(shù)法,只考慮了預測因子與預測變量間的線性關系,缺乏對兩者間非線性相關性的探索。

        本文提出了一種基于Copula熵與隨機森林模型相結合的中長期徑流預報方法,并將其應用于漢江流域丹江口水庫的入庫徑流預報研究中。該方法首先采用Copula熵指標對預報因子進行篩選,在此基礎上采用隨機森林模型對長預見期月徑流過程進行相應預報。該預報方法結果精度更高,可為水利管理部門提供更為可靠的決策依據(jù)。

        1計算方法

        1.1Copula熵理論

        1.1.1互信息(MI)

        作為描述不同變量間相互聯(lián)系的互信息指標源于信息理論學,其反映了不同變量間共有信息的大小,即互信息越大,兩者相關性越強,反之則越弱[16]。假定隨機變量X與Y間存在一定聯(lián)系,則兩者間互信息可通過公式(1)計算。

        式中:xi及yi分別為隨機變量X與Y的樣本,N為樣本容量。

        由式(1)不難發(fā)現(xiàn),當X與Y互不相關時,MI值接近于0,而當X與Y呈現(xiàn)函數(shù)關系時,MI值將接近于正無窮。與其他相似性指標相比,互信息指標不僅可以反映變量間的非線性相關性,且隨機變量的任意可逆變換不改變互信息的大小。

        1.1.2Copula熵

        互信息指標具有較強的信息挖掘能力,但實際研究中不同隨機變量間的聯(lián)合分布往往是偏態(tài)且非均質性的,因此難以找到合適的分布類型對其進行擬合。為解決該問題,MA等[17]引入Copula理論,結合互信息原理提出了Copula熵指標。記u=F(x),v=F(y)分別為隨機變量X與Y的邊緣分布條件,則相應Copula熵值可通過公式(2)計算。

        1.1.3預報因子篩選

        基于Copula熵理論,在相關系數(shù)顯著性檢驗的基礎上,充分考慮不同變量與預測值間的非線性關系,來篩選合理的預測因子,具體步驟如下:

        (1) 通過理論分析,搜集會對預測變量產(chǎn)生影響的所有可能變量。

        (2) 計算所有初選因子與預測變量間的相關系數(shù),并對兩者的相關性進行顯著性檢驗,挑選出顯著性變量作為備選因子。

        (3) 利用公式(2)逐一計算備選因子與月徑流間的Copula熵值,并計算各因子對應的Hampel值。

        (4) 依據(jù)Hampel準則,篩選合格的預測因子;若合格因子超過10個,則僅選取熵值排序前10的預測因子;若不足10個,則所有變量即為最終預測因子。

        1.2隨機森林模型

        隨機森林是Breiman于2001年提出的一種袋裝法與分類回歸樹(CART)相結合的并行增強機器學習算法[20]。作為一種白箱模型,隨機森林通過采用自舉法(Bootstrapping)對原始數(shù)據(jù)進行大量采樣,并對各生成樣本分別建立決策樹,通過改變變量取值來判斷決策樹的變化,在此基礎上綜合考慮整個決策森林的變化結果。最終,該算法通過對所有決策樹的預測進行組合來獲取模型模擬結果。具體步驟如下:

        (1) 采用自助采樣法對含m個樣本的數(shù)據(jù)集進行T輪采樣。

        (2) 對每一輪采樣結果進行訓練時引入隨機屬性選擇,即先從回歸樹的每個節(jié)點的屬性集合(假設共有d個屬性)中隨機選擇一個包含k個屬性的子集,再從該子集中根據(jù)最優(yōu)屬性劃分,從而擬合各個分類回歸樹。

        2實例驗證

        2.1研究區(qū)域概況

        漢江是長江中游最大的支流,干流流經(jīng)陜西、湖北兩省,于武漢市注入長江,干流全長1 577 km,流域面積約15.9萬km2。流域地勢西高東低,由西部的中低山區(qū)向東逐漸降至丘陵平原區(qū)。

        丹江口水庫位于漢江干流上游,是南水北調中線工程的水源地,具有防洪、供水、發(fā)電、灌溉、航運、養(yǎng)殖等綜合功能。水庫以上流域面積約9.52萬km2,占漢江流域的60%,多為高山丘陵區(qū),屬北亞熱帶季風氣候區(qū),年降水量700~1 800 mm,年徑流深300~900 mm。降水是徑流的主要來源,兩者年內(nèi)分配不均勻、年際變化較大。

        研究選取丹江口水庫1956~2016年天然徑流全年12個月數(shù)據(jù),對各月流量過程進行模擬。丹江口水庫天然入庫徑流由長江水利委員會水文局提供:丹江口建庫前1956~1966年采用黃家港實測資料;建庫后的1967~2016年,基于黃家港實測資料,考慮上游水庫調蓄、引水量、庫面蒸發(fā)、上游工農(nóng)業(yè)及生活耗水等因素,根據(jù)水量平衡原理進行還原。

        2.2預測因子篩選

        考慮到各月流量過程影響成因存在一定差異,研究對丹江口水庫入庫天然徑流全年12個月分別篩選預測因子,以選取的預測因子作為模型輸入項,對各月流量過程進行模擬。

        已有研究表明,大氣環(huán)流與長期水文過程間存在密切關系,其異常現(xiàn)象將導致水文過程發(fā)生不同程度的變化。因此,本次研究將國家氣象局氣候中心提供的130項環(huán)流指數(shù)納入預測因子的初選范疇??紤]大氣環(huán)流因子與徑流過程間的遙相關性,以徑流過程發(fā)生前一年各月變量作為初選因子。其中,為驗證基于Copula熵理論的預測因子篩選方法,研究設置了相應比選方案,該方案采用相關系數(shù)指標進行篩選,挑選出相關系數(shù)最大的10個變量作為預報因子。

        以汛期7月平均流量為例,兩種方案選定的預報因子如表1所列,其中方案1為比選方案,方案2為基于Copula熵理論的預報因子篩選方案。由表1可以看出,對于7月而言,2種方案所選因子主要差異在于第9項與第10項?;贑opula熵理論的方案2挑選了南海副高脊線位置指數(shù)和印度洋偶極子指數(shù)。這兩項變量雖然與7月徑流過程的線性相關系數(shù)并不突出,但大量學者從物理成因角度對兩者與長江流域夏季洪澇災害間的關系進行了深入剖析。如印度洋偶極子,已有文獻認為印度洋偶極子事件與弱厄爾尼諾現(xiàn)象共同促使了海洋羅斯貝波與溫躍層的下沉現(xiàn)象,引發(fā)了西北太平洋地區(qū)反氣旋異常,并加劇了東亞上空的西風急流,從而導致長江中下游夏季暴雨頻發(fā)現(xiàn)象的產(chǎn)生[21];而南海副高活動則是通過增大西太平洋副熱帶高壓“北抬西升”效應,在冷暖空氣相互作用下,導致漢江上游易產(chǎn)生持續(xù)的強降雨,從而形成大洪水[22]??紤]文章篇幅問題,其他月份對應預報因子篩選結果及對比并未展示在本文中。

        2.3模型結果分析

        本次研究將1956~2006年作為模型率定期,2007~2016年作為驗證期,將2.2節(jié)中不同方案對應預測因子導入隨機森林模型中,對丹江口水庫逐月徑流過程進行模擬預測。為充分利用有限的資料并防止出現(xiàn)參數(shù)過擬合現(xiàn)象,研究采用留一交叉驗證方法,將逐次模擬值與實測值間MAPE值最小作為優(yōu)化目標,確定了最優(yōu)參數(shù),最終不同方案對應模的擬結果及相應精度指標如圖1~2所示及表2所列。

        由表2結果可知,基于兩種方案篩選出的預測因子,采用隨機森林模型對丹江口水庫月徑流過程進行模擬,均取得較好的模擬效果。具體來看,率定期內(nèi)兩種方案Symbol值均大于80%,MAPE值小于30%,DC值大于0.8,而驗證期的結果精度則略差于率定期,其中Symbol值較之率定期下降10%~14%,MAPE值變幅最大,整體提升20%~25%,DC值較之率定期下降0.20~0.21。對比2種方案,3種指標均表明方案2對應模擬精度顯著優(yōu)于方案1,這一現(xiàn)象說明方案2篩選的預報因子組合更加合理。

        圖1給出了丹江口水庫實測與模擬月流量過程對比圖,其結果表明在率定期及驗證期內(nèi),豐水年份的模擬值略微偏小,而平水年及枯水年的模擬值略微偏大,對比圖1(a)與圖1(b),不難看出方案2對應的模擬結果對汛期徑流的模擬性能要顯著優(yōu)于方案1。此外,通過對比率定期與驗證期實測值與模擬值的散點圖(見圖2)可以看出,率定期及驗證期的下半部分散點會略高于45°線,上半部分布散點則會略低于45°線,但所有散點都較為均勻分布在45°線附近,說明對應精度尚可。對比2種方案模擬結果可知,方案2對應結果整體更優(yōu),尤其對于汛期而言,其模擬結果與實測值更為接近。

        為進一步比較不同方案模擬精度在年內(nèi)的變化特征,本次研究還計算了驗證期內(nèi)各月份對應模擬值與實測值間的相對誤差,如圖3所示。結果表明:除少數(shù)極端值外,方案1對應模擬結果的相對誤差值絕大多數(shù)處于-65%~226%,而方案2對應模擬結果的相對誤差則整體處于-57%~161%之間。同時,兩種方案對應模擬結果精度的差異主要處于汛期內(nèi)(6~10月),這與上述結果得到的結論相互印證,說明方案2篩選出的預測因子組合對于預測來水量較大的汛期月份精度更高。

        3結 論

        本文提出了一種Copula熵與隨機森林模型相結合的中長期徑流預報方法,為了評估該方法的預測精度,研究將其應用于漢江流域丹江口水庫逐月徑流預報中,并將相關系數(shù)篩選法作為比選方案進行對比,結果表明:

        (1) 以不同方案篩選的預測因子作為輸入項,隨機森林模型對于丹江口水庫逐月徑流的預測結果均取得了較高的精度,說明該模型能較好地應用于丹江口水庫的中長期預報研究中。

        (2) 對比2種方案的模擬結果,不難看出基于Copula熵篩選的預報因子對應預測精度顯著高于比選方案,尤其對于汛期而言,前者的預測值與實測值擬合優(yōu)度更好,說明采用Copula熵指標篩選的預測因子組合具有更好的合理性。

        參考文獻:

        [1]林劍藝,程春田.支持向量機在中長期徑流預報中的應用[J].水利學報,2006,37(6):681-686.

        [2]楊旭,欒繼虹,馮國章.中長期水文預報研究評述與展望[J].西北農(nóng)業(yè)大學學報,2000,(6):203-207.

        [3]王文,馬駿.若干水文預報方法綜述[J].水利水電科技進展,2005,25(1):56-60.

        [4]王富強,霍風霖.中長期水文預報方法研究綜述[J].人民黃河,2010,32(3):25-28.

        [5]張利平,王德智,夏軍,等.基于氣象因子的中長期水文預報方法研究[J].水電能源科學,2003,21(3):4-6.

        [6]冉篤奎,李敏,武晟,等.丹江口水庫中長期徑流量的多模型預報結果分析及綜合研究[J].水利學報,2010,41(9):1069-1073.

        [7]李紅波,夏潮軍,王淑英.中長期徑流預報研究進展及發(fā)展趨勢[J].人民黃河,2012,34(8):36-38,40.

        [8]陳柯兵,郭生練,王俊,等.長江上游ECMWF降水和徑流預報產(chǎn)品評估[J].人民長江,2020,51(3):73-80.

        [9]酈于杰,梁忠民,唐甜甜.基于支持向量回歸機的長期徑流預報及不確定性分析[J].南水北調與水利科技,2018,16(3):45-50.

        [10]許斌,楊鳳根,酈于杰.兩類集成學習算法在中長期徑流預報中的應用[J].水力發(fā)電,2020,46(4):21-24,34.

        [11]謝帥,黃躍飛,李鐵鍵,等.LASSO回歸和支持向量回歸耦合的中長期徑流預報[J].應用基礎與工程科學學報,2018,26(4):709-722.

        [12]HUANG H,LIANG Z,LI B,et al.Combination of Multiple Data-Driven Models for long-term monthly runoff predictions based on Bayesian Model Averaging[J].Water Resources Management,2019,33(9):3321-3338.

        [13]鄭炎輝,張力瀾,田兆偉,等.基于隨機森林和RBF人工神經(jīng)網(wǎng)絡模型的新豐江水庫枯季入庫徑流中長期預報[J].人民珠江,2020,41(5):33-37.

        [14]王棟,魏加華,章四龍,等.基于CEEMD-BP模型的水文時間序列月徑流預測[J].北京師范大學學報(自然科學版),2020,56(3):376-386.

        [15]仕玉治,彭勇,周惠成.基于相關向量機的中長期徑流預報模型研究[J].大連理工大學學報,2012,52(1):79-84.

        [16]趙銅鐵鋼,楊大文.神經(jīng)網(wǎng)絡徑流預報模型中基于互信息的預報因子選擇方法[J].水力發(fā)電學報,2011,30(1):24-30.

        [17]MA J,SUN Z Q.Mutual information is Copula Entropy[J].Tsinghua Science and Technology,2011,16(1):51-54.

        [18]溫云亮,李艷玲,黃春艷,等.基于Copula熵理論的干旱驅動因子選擇[J].華北水利水電大學學報(自然科學版),2019,40(4):51-56.

        [19]陳璐,葉磊,盧韋偉,等.基于Copula熵的神經(jīng)網(wǎng)絡徑流預報模型預報因子選擇[J].水力發(fā)電學報,2014,33(6):25-29,90.

        [20]BREIMAN L.Random forests[J].Machine Learning,2001,45(1):5-32.

        [21]ZHOU Z Q,XIE S P,ZHANG R.Historic Yangtze flooding of 2020 tied to extreme Indian Ocean conditions[J].Proceedings of the National Academy of Sciences,2021,118(12):e2022255118.

        [22]陶玫,蔣薇,項瑛,等.1998和2010年長江流域汛期洪澇成因對比分析[J].氣象科學,2012,32(3):282-287.

        (編輯:謝玲嫻)

        Abstract:As the key input of hydrological model for medium and long-term runoff forecast,forecast factors play an important role in improving the forecast accuracy.In order to further improve the accuracy of forecast results,we proposed a medium and long-term runoff forecast method combined with the Copula entropy and random forest model.For this method,the forecast factors were first selected based on the Copula entropy index,and the selected factors were used as input items and imported into the random forest model to simulate and forecast monthly runoff series.Finally,this method was applied to predict the monthly runoff series of the Danjiangkou Reservoir in Hanjiang River Basin,and compared with the correlation coefficient screening selection method.The results showed that the forecast results corresponding to the Copula entropy theory had a higher accuracy in forecasting monthly runoff series.Especially for flood season,the fitting effect of the simulated value and the measured value of this method was significantly better than that of the correlation coefficient method,indicating that the screened forecast factors are more reasonable.

        Key words:medium and long-term runoff forecast;forecast factors;global circulation factor;Copula entropy;random forest model;Danjiangkou Reservoir

        猜你喜歡
        丹江口水庫
        丹江口庫區(qū)及上游地區(qū)綠色發(fā)展促進水質保護的對策建議
        香根草在丹江口庫區(qū)消落帶治理的應用研究
        丹江口水庫大壩加高后壩下游水溫時空變化規(guī)律研究
        河南科技(2020年20期)2020-08-25 02:03:16
        智慧無人船在丹江口水庫水文泥沙監(jiān)測中的應用
        河長制背景下丹江口水庫庫區(qū)管理協(xié)同策略分析
        2017年丹江口水庫精細化調度實踐與探討
        人民長江(2019年3期)2019-10-20 04:50:19
        基于PCA睵SO睸VR的丹江口水庫年徑流預報研究
        基于PSO睸VR的丹江口年徑流預報
        丹江口水庫的水資源管理與保護概述
        科學與財富(2018年8期)2018-05-09 01:30:10
        水庫移民農(nóng)地流轉與生計恢復問題及對策研究
        未满十八勿入av网免费| 日日澡夜夜澡人人高潮| 亚洲av无码乱观看明星换脸va | 亚洲一区二区三区av在线免费| 免费毛片一区二区三区女同| 成av人片一区二区久久| 97一期涩涩97片久久久久久久| 狠狠综合久久av一区二区| 亚洲av永久无码精品秋霞电影影院| 久久婷婷五月国产色综合| 在办公室被c到呻吟的动态图 | 日本一区二区在线免费视频| 久久婷婷人人澡人人爽人人爱| 国产精品国产三级国av| 亚洲精品综合第一国产综合| 中文字幕一区,二区,三区| 国产精品一区二区韩国av| 隔壁老王国产在线精品| 久久久久久久岛国免费观看| 久久青草免费视频| 日本一级淫片免费啪啪| 免费看黄片的视频在线观看| 国产精品无码一区二区三区| 18无码粉嫩小泬无套在线观看 | 国产精品成人av电影不卡| 亚洲女同精品一区二区久久 | 国产黄污网站在线观看| 久久久久亚洲av无码专区首jn| 亚洲熟女少妇一区二区三区青久久| 午夜被窝精品国产亚洲av香蕉 | 亚洲伊人av天堂有码在线| 在线看无码的免费网站| 婷婷亚洲综合五月天小说| 69堂在线无码视频2020| 免费看黄视频亚洲网站| 免费a级毛片无码a∨中文字幕下载| 国产山东熟女48嗷嗷叫| 色窝窝手在线视频| 亚洲一区二区三区免费网站| 国产xxx69麻豆国语对白| 国产女人成人精品视频|