亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        月徑流預(yù)報(bào)建模方法對比分析
        ——以嘉陵江北碚站為例

        2022-10-06 03:12:26怡,陳芳,王鵬,邱
        人民長江 2022年9期
        關(guān)鍵詞:方法模型

        陳 雪 怡,陳 元 芳,王 文 鵬,邱 鵬

        (1.河海大學(xué) 水文水資源學(xué)院,江蘇 南京 210098; 2.重慶市水文監(jiān)測總站,重慶 401147)

        0 引 言

        準(zhǔn)確的中長期水文預(yù)報(bào)對流域水旱災(zāi)害防御、水資源綜合利用、河湖水環(huán)境保護(hù)等水利業(yè)務(wù)工作具有重要意義[1]。根據(jù)預(yù)報(bào)變量的不同,徑流預(yù)報(bào)可以劃分為兩類[2]:一類是基于單變量的水文預(yù)報(bào),即發(fā)掘水文要素自身演變規(guī)律,常見的方法有時(shí)間序列法[3-4]、周期疊加法等;另一類是基于多變量的水文預(yù)報(bào),即發(fā)掘大氣環(huán)流、海陸狀況等成因變量與水文要素之間的聯(lián)系,常見的方法有隨機(jī)森林[5]、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)[6]等。近年來,這兩類方法在中長期徑流預(yù)報(bào)中都有廣泛的應(yīng)用[7]。Fan等[8]建立自回歸求和滑動(dòng)平均模型預(yù)測了塔里木河干流徑流量,并分析了溫度與降水對其的影響。Wang等[9]將經(jīng)驗(yàn)?zāi)B(tài)分解法與時(shí)間序列法相結(jié)合,對黃河上游進(jìn)行長期徑流預(yù)測。林劍藝等[10]將支持向量機(jī)應(yīng)用于中長期預(yù)報(bào)中,在建模過程中引入徑向基核函數(shù)簡化非線性問題的求解,并應(yīng)用SCE-UA算法辨識(shí)支持向量機(jī)的參數(shù)。趙文秀等[11]采用隨機(jī)森林模型篩選預(yù)報(bào)因子,將篩選后的因子作為RBF神經(jīng)網(wǎng)絡(luò)的輸入層進(jìn)行長期徑流預(yù)報(bào)。綜上,國內(nèi)外學(xué)者對兩類預(yù)報(bào)方法均進(jìn)行了大量探索,但何種方法更優(yōu)并沒有統(tǒng)一的結(jié)論。實(shí)際上,在具體流域的預(yù)報(bào)工作中,仍有必要綜合考慮預(yù)報(bào)要素的水文特性、預(yù)報(bào)因子的可獲得性、預(yù)報(bào)方法的穩(wěn)健性等因素,通過定量對比分析選取合適的方法建立預(yù)報(bào)模型,實(shí)現(xiàn)精度可靠的中長期水文預(yù)報(bào)。

        因此,本文以嘉陵江流域北碚水文站為例,建立基于時(shí)間序列模型與成因驅(qū)動(dòng)的徑流預(yù)報(bào)模型;同時(shí)應(yīng)用時(shí)變權(quán)重方法,集合單一模型進(jìn)行組合預(yù)報(bào),通過對比單變量與多變量、單一與組合模型預(yù)報(bào)結(jié)果,分析引入多變量與組合模型是否有利于提高徑流預(yù)報(bào)容錯(cuò)能力、穩(wěn)定性與精度,研究成果可為徑流預(yù)報(bào)的建模策略提供參考。

        1 研究方法

        本文選擇時(shí)間序列法作為單變量預(yù)報(bào)方法,隨機(jī)森林、BP神經(jīng)網(wǎng)絡(luò)與多元線性回歸作為多變量預(yù)報(bào)方法,并采用組合預(yù)報(bào)方法對單一模型的權(quán)重進(jìn)行實(shí)時(shí)調(diào)整從而對月徑流預(yù)報(bào)結(jié)果進(jìn)行優(yōu)化。方法流程如圖1所示。

        1.1 水文時(shí)間序列預(yù)報(bào)方法

        時(shí)間序列分析方法最早由耶爾于1927年提出。水文時(shí)間序列預(yù)報(bào)就是依據(jù)水文過程在相鄰時(shí)間截口之間時(shí)序相依的統(tǒng)計(jì)特征,建立由序列前期值驅(qū)動(dòng)的水文狀態(tài)量預(yù)報(bào)模型。對于平穩(wěn)的時(shí)間序列,可以構(gòu)建自回歸模型(Autoregressive Model,AR)、滑動(dòng)平均模型(Moving Average Model,MA)與自回歸滑動(dòng)平均模型(Auto-Regressive Moving Average Model,ARMA)[12]。自回歸滑動(dòng)平均模型,記為ARMA(p,q),具有以下結(jié)構(gòu):

        (1)

        式中:xt為平穩(wěn)時(shí)間序列;εt為白噪聲序列;φp,θq為模型參數(shù),常用尤爾-沃爾克法估計(jì);對于中心化序列xt,φ0=0。

        對于非平穩(wěn)的水文序列,通過差分運(yùn)算將原序列轉(zhuǎn)化為平穩(wěn)序列,再通過白噪聲檢驗(yàn)后與ARMA模型組合,得到自回歸滑動(dòng)平均求和模型(Autoregressive Integrated Moving Average Model,ARIMA),記為ARIMA(p,d,q)。

        1.2 成因驅(qū)動(dòng)的多變量預(yù)報(bào)方法

        基于成因驅(qū)動(dòng)的多變量預(yù)報(bào)模型是從徑流成因的角度構(gòu)建能夠反映驅(qū)動(dòng)因子與預(yù)報(bào)要素之間關(guān)系的多元相關(guān)預(yù)報(bào)模型,應(yīng)用此類方法時(shí)驅(qū)動(dòng)因子的篩選與預(yù)報(bào)模型的選擇至關(guān)重要。首先根據(jù)徑流的物理成因選擇88項(xiàng)大氣環(huán)流指數(shù)、26項(xiàng)海溫指數(shù)、16項(xiàng)其他氣象指數(shù)和月降水量作為初選影響因子,計(jì)算前一水文年各因子與徑流量的相關(guān)系數(shù),剔除無物理背景、不顯著相關(guān)的影響因子并進(jìn)行排序。對排序前50的影響因子構(gòu)建隨機(jī)森林模型,計(jì)算未被袋裝法選中的樣本(OOB數(shù)據(jù))打亂前后均方誤差的增加量(IncMSE)來定量評價(jià)因子的重要性[13],取IncMSE排位靠前的因子作為預(yù)報(bào)模型輸入變量。本文對比分析的模型為隨機(jī)森林、BP神經(jīng)網(wǎng)絡(luò)與多元線性回歸。

        隨機(jī)森林(Random Forest,RF)最早由Breiman于21世紀(jì)初提出[14]。隨機(jī)森林由多棵決策樹構(gòu)成,其基本思想為:從原始樣本中隨機(jī)多次抽取樣本,對每個(gè)重抽樣本都建立決策樹模型,組合多棵決策樹對應(yīng)變量的估計(jì)結(jié)果,當(dāng)應(yīng)變量的綜合估計(jì)結(jié)果在樣本訓(xùn)練集和驗(yàn)證集表現(xiàn)俱佳時(shí),就構(gòu)成了隨機(jī)森林模型[15-16]。

        BP神經(jīng)網(wǎng)絡(luò)模型具有3層結(jié)構(gòu):輸入層、隱含層和輸出層。輸入層中每個(gè)神經(jīng)元對應(yīng)一項(xiàng)驅(qū)動(dòng)因子,隱含層神經(jīng)元個(gè)數(shù)通過“試錯(cuò)法”調(diào)整,輸出層神經(jīng)元個(gè)數(shù)為預(yù)報(bào)對象個(gè)數(shù)。將正向誤差反向傳播至網(wǎng)絡(luò)層,調(diào)整連接節(jié)點(diǎn)權(quán)重,不斷重復(fù)直至輸出結(jié)果誤差函數(shù)達(dá)到最小[17-18]。

        多元線性回歸就是建立多個(gè)自變量與因變量之間的回歸方程,一般以誤差平方和為目標(biāo)使用最小二乘法估計(jì)參數(shù),數(shù)學(xué)表達(dá)式為

        y=α0+α1x1+α2x2+…+αnxn+ε

        (2)

        式中:αn為回歸系數(shù);xn為驅(qū)動(dòng)因子值;ε為模型誤差。

        1.3 時(shí)變權(quán)重組合預(yù)測

        權(quán)重組合預(yù)測將“好而不同”的單一模型預(yù)報(bào)結(jié)果加權(quán)求和,以獲得更準(zhǔn)確的預(yù)報(bào)效果。根據(jù)權(quán)重是否隨時(shí)間改變,可以分為定常權(quán)重與時(shí)變權(quán)重兩類。定常權(quán)重是指保持各單一模型的權(quán)重不變進(jìn)行組合,該類方法的研究較成熟,但在某些時(shí)段組合預(yù)測精度較單一模型更差。時(shí)變權(quán)重則隨著不同模型性能的變化而進(jìn)行權(quán)重調(diào)整,通過動(dòng)態(tài)預(yù)報(bào)有效規(guī)避定常權(quán)重組合預(yù)測常介于最優(yōu)與最劣模型間的問題[19]。本文選擇時(shí)變權(quán)重方法中的時(shí)變誤差平方和(TSSE)方法,根據(jù)預(yù)報(bào)前序時(shí)段的誤差來確定局部預(yù)報(bào)時(shí)段的動(dòng)態(tài)權(quán)重,公式如下:

        (3)

        (4)

        1.4 預(yù)測性能評價(jià)指標(biāo)

        采用合格率(QR,預(yù)報(bào)值與實(shí)際值相對誤差在±20%之間為合格)、平均絕對百分比誤差(MAPE)、平均相對誤差(MRE)、均方根誤差(RMSE)和決定系數(shù)(R2)5項(xiàng)指標(biāo)作為評價(jià)模型預(yù)報(bào)精度的指標(biāo)。采用均方根誤差變化量(ΔRMSE)作為評價(jià)模型穩(wěn)定性的指標(biāo)。具體計(jì)算公式見文獻(xiàn)[19]。

        2 實(shí)例應(yīng)用

        2.1 研究區(qū)域與數(shù)據(jù)

        本文預(yù)報(bào)對象為嘉陵江北碚站汛期月徑流量,其月徑流量數(shù)據(jù)來源于《中華人民共和國水文年鑒》。計(jì)算武都、略陽、廣元、萬源、閬中、巴中、達(dá)縣、遂寧、高坪區(qū)和沙坪壩10個(gè)氣象站(見圖2)的算術(shù)平均降水量作為代表降水量,數(shù)據(jù)來源于中國氣象數(shù)據(jù)網(wǎng)。收集全球逐月百項(xiàng)氣象指數(shù),數(shù)據(jù)來源于國家氣候中心。本文以1979~2006年為訓(xùn)練期,以2007~2019年為測試期。

        由于嘉陵江中下游地區(qū)的大規(guī)模水土流失綜合治理、水庫水電站等大型水利設(shè)施的修建等人類活動(dòng)對下墊面條件的影響,嘉陵江的實(shí)測徑流序列發(fā)生了突變,不能代表天然徑流狀況。因此考慮方差修正的預(yù)置白方法和Mann-Kendall檢驗(yàn)對北碚站訓(xùn)練期降水序列與徑流序列進(jìn)行分析與一致性修正[20-22],發(fā)現(xiàn)北碚站汛期(6~8月)降水量沒有明顯突變,而徑流量在1986年發(fā)生了突變,如圖3所示。

        繪制訓(xùn)練期徑流量-降水量雙累計(jì)曲線圖,根據(jù)突變前雙累計(jì)曲線回歸方程對突變后徑流進(jìn)行修正,如圖4所示。按照修正前后總徑流量的比例對各月徑流量同倍比縮放,生成還原后的天然月徑流量序列。對修正后的月徑流量序列再進(jìn)行突變檢驗(yàn),未發(fā)現(xiàn)新的突變點(diǎn),滿足一致性條件。

        2.2 單變量與多變量模型預(yù)報(bào)效果

        以經(jīng)過還原得到的北碚站6~8月天然徑流量作為目標(biāo)變量,構(gòu)建預(yù)報(bào)模型。對于單變量預(yù)報(bào)模型,參數(shù)p、q根據(jù)d階差分序列的自相關(guān)圖和偏相關(guān)圖初選,再結(jié)合模型AIC準(zhǔn)則進(jìn)行確定,分別為ARIMA(2,2,0)、ARIMA(6,2,0)和ARIMA(1,1,0)。對于多變量預(yù)報(bào)模型,對初選因子按照IncMSE指標(biāo)進(jìn)行排序,選擇指標(biāo)值明顯大于其他因子的因子集作為預(yù)報(bào)因子,6月和8月選定前8項(xiàng)因子,7月選定前7項(xiàng)因子,作為模型的輸入變量,其具體名稱如表1所列。經(jīng)過反復(fù)測試,增加剩余因子不足以明顯改善解釋能力,反而增加模型復(fù)雜度,降低模型的泛化能力。構(gòu)建隨機(jī)森林模型時(shí),對隨機(jī)森林模型的兩個(gè)待選參數(shù)進(jìn)行優(yōu)化,即子決策樹數(shù)量Ntree與回歸樹節(jié)點(diǎn)劃分?jǐn)?shù)Mtry。挑選使OOB數(shù)據(jù)泛化誤差最小時(shí)的Mtry值作為最優(yōu)參數(shù),確定Mtry后代入使模型誤差基本穩(wěn)定的Ntree值作為最優(yōu)參數(shù)。本文中各月隨機(jī)森林模型Mtry分別取4,4和3,Ntree均取1 000。構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型時(shí),隱含層神經(jīng)元個(gè)數(shù)用試錯(cuò)法比選,使得訓(xùn)練誤差和測試誤差最小,網(wǎng)絡(luò)結(jié)構(gòu)分別為8-4-1,7-5-1和8-5-1。

        表1 北碚站月徑流預(yù)報(bào)因子Tab.1 Monthly runoff forecast factors of Beibei Station

        單變量與多變量預(yù)測模型的散點(diǎn)圖如圖5所示,4種模型的預(yù)測值都均勻分布在1∶1線的兩側(cè),且在不同月份內(nèi)同一模型都表現(xiàn)出相似的準(zhǔn)確性與適應(yīng)性。對于不同變量的預(yù)報(bào)模型,基于多變量的預(yù)報(bào)模型精度優(yōu)于基于單變量的預(yù)報(bào)模型。相對而言,ARIMA預(yù)報(bào)徑流量的點(diǎn)據(jù)分布更為分散,說明其擬合程度相比多變量預(yù)報(bào)模型較差?;趦煞N模式下的徑流預(yù)報(bào)的MAPE箱形圖如圖6所示。由圖可知,單變量ARIMA模型的MAPE值中位數(shù)約為40%,而3種多變量模型的MAPE值中位數(shù)均小于20%,說明多變量預(yù)測模型具有更好的預(yù)報(bào)精度。因此,從徑流成因角度盡可能地挖掘潛在的氣候驅(qū)動(dòng)因子,增加預(yù)報(bào)模型的信息量,對提高徑流預(yù)報(bào)精度是有利的。

        綜合對比3種多變量模型的預(yù)報(bào)性能,如表2所列。從預(yù)測精度上看,RF在訓(xùn)練期的合格率最高、MRE與RMSE最低,在不同時(shí)段下合格率達(dá)到了82%以上、MRE在13%以下;BP在測試期的合格率最高、MRE與RMSE最低,在不同時(shí)段下合格率達(dá)到了76%以上、MRE在18%以下??傮w上RF與BP模型表現(xiàn)均優(yōu)于多元線性回歸模型。從數(shù)據(jù)離散程度上看,RF的R2最接近1,說明其擬合程度最優(yōu)。從模型穩(wěn)定性上看,BP的ΔRMSE最小,7月與8月測試期的RMSE小于訓(xùn)練期,指示該模型具有較強(qiáng)的泛化能力??傊?,在多變量預(yù)測模型中RF和BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)報(bào)性能優(yōu)于傳統(tǒng)的多元線性回歸模型。

        表2 不同模型預(yù)報(bào)精度Tab.2 Forecast accuracy of different models

        2.3 組合模型預(yù)報(bào)效果

        目前能夠公開獲取且滿足時(shí)效性要求的徑流成因要素還比較有限,相關(guān)預(yù)報(bào)模型的建模依據(jù)仍以小容量樣本為主,模型泛化容易出現(xiàn)過擬合情況。根據(jù)統(tǒng)計(jì)學(xué)原理,集成單一模型的預(yù)報(bào)結(jié)果,可以減少模型泛化的方差,有效降低預(yù)報(bào)不確定性。因此,選擇對序列趨勢模擬較準(zhǔn)確的3種多變量模型進(jìn)行組合預(yù)報(bào),根據(jù)前文權(quán)重計(jì)算方法得到權(quán)重取值如圖7所示。總體而言,RF模型的預(yù)報(bào)誤差較小,組合權(quán)重占優(yōu),但隨著預(yù)報(bào)時(shí)刻推移,各模型的組合權(quán)重會(huì)沿程發(fā)生變化。多元線性回歸模型的權(quán)重呈現(xiàn)出平穩(wěn)的特征,而兩種機(jī)器學(xué)習(xí)模型的權(quán)重在各月都表現(xiàn)出非平穩(wěn)特征,且在訓(xùn)練期和測試期都有明顯變化趨勢。RF模型的權(quán)重呈現(xiàn)先增大后減小的趨勢,說明其預(yù)報(bào)誤差在訓(xùn)練期呈現(xiàn)減小趨勢,到了測試期開始呈現(xiàn)增大趨勢,而BP模型則與之相反,這也驗(yàn)證了RF模型泛化能力差而BP模型穩(wěn)定性強(qiáng)的特點(diǎn)。

        圖8比較了3種多變量模型和組合模型的預(yù)報(bào)性能。經(jīng)組合預(yù)報(bào)后,訓(xùn)練期合格率達(dá)到了89%以上、MRE在13%以下;測試期合格率達(dá)到了84%以上、MRE在15%以下。合格率在訓(xùn)練期與測試期均得到了明顯提高,高于或接近于最優(yōu)的單一模型;定量誤差在7月測試期時(shí)劣于BP神經(jīng)網(wǎng)絡(luò)模型,在其他月份各時(shí)期都有明顯下降趨勢,低于或接近于單一最優(yōu)模型。因此,時(shí)變權(quán)重組合預(yù)報(bào)方法能有效集合單一預(yù)測方法提供的信息,結(jié)合各模型的優(yōu)點(diǎn),進(jìn)一步提高基于多變量的預(yù)測模型的精度。

        3 結(jié) 論

        本文以北碚站月徑流量預(yù)報(bào)為例,對比不同建模方法的預(yù)報(bào)性能,得到以下結(jié)論。

        (1) 從單變量與多變量模型選擇上看:多變量預(yù)報(bào)法優(yōu)于單變量預(yù)報(bào)法。多變量預(yù)報(bào)模型的MAPE中位數(shù)均小于20%,說明從徑流成因角度挖掘潛在預(yù)報(bào)因子、增加樣本信息量,是提高月徑流預(yù)報(bào)精度的有效途徑之一。

        (2) 從不同多變量模型表現(xiàn)上看:RF與BP模型在定量誤差與模型穩(wěn)定性方面均表現(xiàn)較好,說明針對成因機(jī)制復(fù)雜,樣本空間非線性可分的預(yù)報(bào)對象,非線性映射模型常優(yōu)于線性回歸模型。

        (3) 從單一與組合模型上看:時(shí)變權(quán)重能有效集合各單一模型的優(yōu)勢,使組合后的預(yù)報(bào)精度在訓(xùn)練期與測試期都高于或接近于最優(yōu)的單一模型,在有效減小預(yù)報(bào)誤差的同時(shí)提高了模型的穩(wěn)定性。

        本文探討了天然徑流量預(yù)報(bào)的建模方法,但在實(shí)際預(yù)報(bào)業(yè)務(wù)中,仍需進(jìn)一步從水保措施治理面積、大中型水利工程建設(shè)數(shù)量、用水量、水庫蓄水量等因素,定量分析人類活動(dòng)對月徑流量的影響及其與時(shí)間的關(guān)系,將天然徑流量的預(yù)報(bào)結(jié)果與人類活動(dòng)影響導(dǎo)致的變化量相結(jié)合,得到月徑流過程的實(shí)際變化,以提高預(yù)報(bào)模型的實(shí)用性。

        猜你喜歡
        方法模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        學(xué)習(xí)方法
        可能是方法不對
        3D打印中的模型分割與打包
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢方法
        国产精品久久久久久亚洲av| 成人国产高清av一区二区三区| 国内久久婷婷六月综合欲色啪| 国产精品美女久久久久av福利| 伊人色综合九久久天天蜜桃| 999久久久免费精品国产牛牛| 少妇呻吟一区二区三区| 公和我做好爽添厨房| 另类内射国产在线| 久久精品国产6699国产精| 手机免费在线观看日韩av| 五月色婷婷丁香无码三级| 精品人妻va出轨中文字幕| 国产欧美日韩在线观看一区二区三区| 亚洲一区二区日韩在线| 中文字幕无码乱人伦| 亚洲处破女av日韩精品| 一区二区韩国福利网站| 亚洲女人天堂成人av在线| 国产一区二区三区小说| 女人夜夜春高潮爽a∨片传媒 | 国产精品自拍视频在线| 精品久久久久久无码中文野结衣 | 欧美人和黑人牲交网站上线| 国产精品久久码一区二区 | 精品国产一区二区三区av免费 | 丰满岳乱妇久久久| 欧美在线观看www| 午夜免费观看国产视频| 精品久久久久久无码中文字幕| 国产欧美VA欧美VA香蕉在| 人妻少妇精品视频中文字幕国语| 国产自拍av在线观看视频| 国产熟女露脸大叫高潮| 美女超薄透明丝袜美腿| 亚洲精品在线一区二区| 玩弄丰满奶水的女邻居| 无码国产精品一区二区免费97| 免费看黄在线永久观看| 精品无码久久久久久久久| 成人无码一区二区三区网站|