韋彥玲,王 飛,陳 晶,高澤坤,高 凱,顧世祥,
(1.云南農(nóng)業(yè)大學(xué)城鄉(xiāng)水安全與節(jié)水減排高校重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650201;2.云南秀川水利水電勘察設(shè)計(jì)有限公司,云南 昆明 650021;3.云南省水利水電勘測(cè)設(shè)計(jì)研究院,云南 昆明 650021)
天然湖泊水位的變化是流域降水、徑流、蒸發(fā)、氣溫、風(fēng)速、水資源管理、湖泊管理等諸多自然-社會(huì)二元因素共同作用的結(jié)果[1],存在非常復(fù)雜的非線性關(guān)系和不確定性。建立具有物理意義的數(shù)字孿生流域分布式水文模型是無限逼近湖泊水位變化真值的理想化途徑。但各類用水消耗等基礎(chǔ)資料條件、各個(gè)因子變量交互作用刻畫都影響到輸出結(jié)果質(zhì)量。SVR和BP模型是常用的機(jī)器學(xué)習(xí)模型,可以較好地捕捉湖泊水位復(fù)雜的非線性關(guān)系[2-3],但無法考慮時(shí)序變化[4-5],且多為灰箱或黑箱模型,利用數(shù)據(jù)值實(shí)現(xiàn),不干擾數(shù)據(jù)的統(tǒng)計(jì)分布和內(nèi)部關(guān)系以及問題的物理性質(zhì),容易出現(xiàn)過擬合問題且多不能給出明確的解析表達(dá)式[6]。基于Copula的建模方法中,Vine Copula是一種統(tǒng)計(jì)動(dòng)力學(xué)模型,可將高維的聯(lián)合分布分解為二元聯(lián)結(jié)的層次結(jié)構(gòu),能有效地描述高維變量之間的相依性,并在洪水特征、降雨徑流模擬、湖泊水位、干旱預(yù)測(cè)等成功應(yīng)用[7-10]。在實(shí)際預(yù)測(cè)中,單一模型預(yù)測(cè)結(jié)果存在較大不確定性,不能充分捕捉數(shù)據(jù)特征[11],且都有自身的優(yōu)缺點(diǎn)。為克服單一模型的局限性,國(guó)內(nèi)外學(xué)者構(gòu)建了組合預(yù)測(cè)模型來整合單一模型發(fā)揮優(yōu)勢(shì)[5,12-14],但是確定性的組合模型無法定量評(píng)估模型結(jié)構(gòu)的不確定性。
貝葉斯模型平均(BMA)是一種基于貝葉斯統(tǒng)計(jì)學(xué)的模型選擇方法,在提供精度更高的預(yù)測(cè)結(jié)果的同時(shí),還能提供可靠的預(yù)測(cè)概率,定量評(píng)價(jià)模型結(jié)構(gòu)不確定性對(duì)預(yù)測(cè)結(jié)果的影響[15-16]。BMA也被廣泛應(yīng)用于水文學(xué)領(lǐng)域,如Wei等基于BMA算法整合不同數(shù)據(jù)源降水信息,結(jié)果表明BMA集成降水產(chǎn)品表現(xiàn)出更好的性能[17]。Yang等通過BMA方法在8個(gè)ET模型的基礎(chǔ)上對(duì)日ET估算改進(jìn),結(jié)果表明BMA方法優(yōu)于個(gè)體ET模型[18]。俞明哲等利用BMA方法構(gòu)建全球尺度洪水中長(zhǎng)期預(yù)報(bào)模型,有效減小模型不確定性[19]。周婷等基于BMA方法對(duì)ELM、SVM、MARS3種模型的徑流預(yù)測(cè)結(jié)果組合,獲取可靠的中長(zhǎng)期日徑流預(yù)測(cè)結(jié)果[20]。然而目前基于機(jī)器學(xué)習(xí)模型和統(tǒng)計(jì)動(dòng)力學(xué)模型結(jié)合的BMA集成預(yù)測(cè)長(zhǎng)時(shí)序湖泊水位的研究較少。本文針對(duì)流域各類用水消耗信息缺失條件下,引入貝葉斯隨機(jī)預(yù)測(cè)方法,對(duì)選擇氣象水文因素與前1月水位作為變量的Vine Copula、BP和SVR模型的預(yù)測(cè)結(jié)果構(gòu)建了貝葉斯模型平均(BMA)對(duì)長(zhǎng)時(shí)序湖泊水位進(jìn)行集成預(yù)測(cè),提高預(yù)測(cè)精度,并以杞麓湖為例檢驗(yàn),以期為湖泊水位調(diào)控、干旱預(yù)警管理、水生態(tài)保護(hù)治理等提供參考。
杞麓湖是云貴高原上一個(gè)封閉型高原湖泊,是關(guān)系通??h經(jīng)濟(jì)和民生的“母親湖”,為當(dāng)?shù)刂苓呣r(nóng)業(yè)提供灌溉,具有調(diào)蓄、防洪、養(yǎng)殖和調(diào)節(jié)氣候等功能。杞麓湖盆區(qū)地處低緯高原,屬于亞熱帶半濕潤(rùn)季風(fēng)氣候,四季不分明,冬無嚴(yán)寒,夏無酷暑,四季如春,主要分干濕兩季。自20世紀(jì)80年代中后期以來,杞麓湖水質(zhì)受污染的程度日趨嚴(yán)重[21]。2010年前后連續(xù)幾年的干旱造成杞麓湖天然補(bǔ)水減少、湖泊及流域地下水位較低,流域水生態(tài)安全面臨嚴(yán)重威脅,湖泊治理與保護(hù)形勢(shì)至今仍然十分嚴(yán)峻。
①通海氣象站1964—2019年逐月降水、溫度、蒸發(fā)等觀測(cè)資料;②經(jīng)過徑流還原分析得到的杞麓湖1964—2019年逐月入湖徑流量數(shù)據(jù);③杞麓湖1964—2019年逐月實(shí)測(cè)水位。
從水文循環(huán)的角度分析,水位變化主要受降水、溫度、蒸發(fā)、徑流以及前期水位的影響。將降水(P)、溫度(T)、蒸發(fā)(E)、徑流(F)、前一月水位(Zt-1)作為解釋變量,分別構(gòu)建Vine Copula、BP、SVR模型進(jìn)行長(zhǎng)時(shí)序水位預(yù)測(cè)。Vine Copula、BP、SVR的3種模型預(yù)測(cè)值分別用V1-V3表示。
V1(t)=VC(Z(t-1),P(t),E(t),F(xiàn)(t),T(t))
(1)
V2(t)=BP(Z(t-1),P(t),E(t),F(xiàn)(t),T(t))
(2)
V3(t)=SVR(Z(t-1),P(t),E(t),F(xiàn)(t),T(t))
(3)
BMA方法是利用貝葉斯統(tǒng)計(jì)理論建立的概率預(yù)報(bào)模型,具體公式推導(dǎo)參見文獻(xiàn)[22-24]。它的基本原理如下:設(shè)目標(biāo)月份的水位(即預(yù)測(cè)變量)為X1,給定觀測(cè)值Z=(Z1,Z2,…,Zt),則BMA(VC,BP,SVR)模型的預(yù)測(cè)變量X1的概率密度函數(shù)表達(dá)式為
(4)
(5)
(6)
圖1 組合模型湖泊水位預(yù)測(cè)流程圖
為評(píng)估模型預(yù)測(cè)杞麓湖水位的效果,采用平均偏差(ME)、均方根誤差(RMSE)、符合指數(shù)(IA)、Nash-Sutcliffe效率系數(shù)(NSE)等4個(gè)常用的誤差統(tǒng)計(jì)指數(shù)。
在模型構(gòu)建中,將70%的數(shù)據(jù)樣本作為訓(xùn)練集,30%的數(shù)據(jù)樣本作為驗(yàn)證集。將單一模型和組合模型實(shí)測(cè)值與預(yù)測(cè)值對(duì)比并計(jì)算統(tǒng)計(jì)指數(shù),如圖2所示。在單一模型中,Vine Copula模型預(yù)測(cè)精度最高,BP和SVR模型預(yù)測(cè)精度相差不大,但是SVR模型預(yù)測(cè)精度稍微高于BP模型。BMA(VC,BP,SVR)模型預(yù)測(cè)精度都高于單一模型Vine Copula、BP和SVR模型,其ME、RMSE、IA和NSE分別是0.05,0.15,0.991,0.962。BMA(VC,BP,SVR)模型得到的Vine Copula、BP和SVR模型權(quán)重分別為0.39、0.26、0.35,可看出模型預(yù)測(cè)精度越高,在BMA構(gòu)建的模型中所占的權(quán)重也較高。
圖2 (VC,BP,SVR)不同模型對(duì)實(shí)測(cè)值的泰勒?qǐng)D
將各模型預(yù)測(cè)水位和實(shí)測(cè)水位對(duì)比,如圖3所示。對(duì)水位的變化過程各模型均能較好描述,預(yù)測(cè)水位的趨勢(shì)基本與觀測(cè)水位一致,BP(R=0.97)和SVR(R=0.97)模型的水位預(yù)測(cè)值與實(shí)測(cè)值偏離較大,Vine Copula模型和BMA(VC,BP,SVR)模型預(yù)測(cè)序列與觀測(cè)序列基本重疊,但是在一些出現(xiàn)峰值的情況預(yù)測(cè)結(jié)果不理想,與觀測(cè)序列有些偏差。在一些個(gè)別年份BMA(VC,BP,SVR)模型預(yù)測(cè)誤差大于單個(gè)模型,主要體現(xiàn)在BP和SVR模型的水位預(yù)測(cè)值與實(shí)測(cè)值偏離較大的月份,這可能是因?yàn)锽MA的權(quán)重值是由3種模型訓(xùn)練集數(shù)據(jù)獲得的,權(quán)重的不穩(wěn)定性會(huì)導(dǎo)致測(cè)試集個(gè)別月份預(yù)測(cè)效果減弱,同時(shí)在3種預(yù)測(cè)模型中預(yù)測(cè)效果較差的月份占比較多,會(huì)降低組合預(yù)測(cè)精度,甚至低于單一模型中預(yù)測(cè)精度最好的模型。在整體預(yù)測(cè)中,BMA(VC,BP,SVR)(R=0.99)模型預(yù)測(cè)精度高于Vine Copula(R=0.98)。
圖3 (VC,BP,SVR)不同模型逐月水位預(yù)測(cè)值與實(shí)測(cè)值時(shí)間序列對(duì)比圖
VC,BP,SVR,BMA等不同模型預(yù)測(cè)誤差統(tǒng)計(jì)見表1,在單個(gè)模型中BP模型相對(duì)誤差小于15%、20%、25%的占比最多,SVR模型在相對(duì)誤差小于25%的占比高于Vine Copula模型,這表明BP和SVR模型對(duì)時(shí)間序列的局部特征捕捉能力更強(qiáng),可以避免重要特征丟失;而Vine Copula模型在相對(duì)誤差5%和10%的占較多,可以較好捕捉時(shí)間序列的時(shí)序特征,在整體上和極值的預(yù)測(cè)結(jié)果更加準(zhǔn)確。BMA(VC,BP,SVR)模型可以整合單一模型預(yù)測(cè)優(yōu)勢(shì),使相對(duì)誤差小于15%的占比得到提升,提取更多數(shù)據(jù)特征,提高預(yù)測(cè)精度。
表1 不同方法模型的預(yù)測(cè)誤差比較
VC,BP,SVR,BMA不同模型誤差如圖4所示,誤差大部分在[-0.4,0.4]范圍波動(dòng),其中Vine Copula模型平均誤差較接近于0軸,但是個(gè)別誤差偏離0軸較大;BP和SVR模型誤差分布比較均勻,偏離0軸較大,使得預(yù)測(cè)精度較低;而BMA(VC,BP,SVR)模型的誤差分布偏離0軸較小,誤差分布比較均勻,圍繞平均值上下波動(dòng)。從整體看BMA(VC,BP,SVR)模型能夠綜合各模型優(yōu)勢(shì),穩(wěn)定準(zhǔn)確地預(yù)測(cè)杞麓湖水位變化。
圖4 (VC,BP,SVR)不同模型預(yù)測(cè)誤差分布
為了驗(yàn)證BMA方法對(duì)預(yù)測(cè)效果的提升,還構(gòu)建了BMA(BP,SVR)模型,誤差統(tǒng)計(jì)指數(shù)如圖5所示??煽吹紹MA(BP,SVR)模型ME,RMSE,IA,NSE值分別為0.01,0.163,0.989,0.953,預(yù)測(cè)精度高于單一模型BP和SVR模型。水位過程線對(duì)比如圖6所示,可看到BMA(BP,SVR)(R=0.98)模型偏離實(shí)測(cè)水位較小,更接近于實(shí)測(cè)水位的峰值點(diǎn)和極值點(diǎn)。總體而言,不管BMA(VC,BP,SVR)模型還是BMA(BP,SVR)模型的預(yù)測(cè)精度都大于單一模型,對(duì)水位特征捕捉更充分,也進(jìn)一步說明了BMA在多模型預(yù)測(cè)中提高預(yù)測(cè)精度的優(yōu)越性。
圖5 (BP,SVR)不同模型對(duì)實(shí)測(cè)值的泰勒?qǐng)D
圖6 (BP,SVR)不同模型逐月水位預(yù)測(cè)值與實(shí)測(cè)值時(shí)間序列對(duì)比圖
基于區(qū)間寬度和覆蓋率兩個(gè)指標(biāo)對(duì)BMA(VC,BP,SVR)模型預(yù)測(cè)序列的95%置信區(qū)間來分析結(jié)果的不確定性,評(píng)估模型性能。水位實(shí)測(cè)值(Z)、BMA(VC,BP,SVR)水位預(yù)測(cè)序列以及95%水平的置信區(qū)間如圖7所示,可看到95%置信區(qū)間內(nèi)有大部分的水位實(shí)測(cè)值,只有66個(gè)值在不確定性區(qū)間外,其水位實(shí)測(cè)值的區(qū)間覆蓋率達(dá)90%,表明95%置信區(qū)間效果較好,不確定性較小??傮w上可以看出,BMA(VC,BP,SVR)在濕季(5—10月)有56個(gè)實(shí)測(cè)值在置信區(qū)間外,而干季(11月—次年4月)只有10個(gè)實(shí)測(cè)值在置信區(qū)間外,且濕季的區(qū)間寬度比干季的大,說明水位預(yù)測(cè)精度在干季要高于濕季,且濕季水位預(yù)測(cè)的不確定性較大,還需要從模型結(jié)構(gòu)中關(guān)于濕季的預(yù)測(cè)方法進(jìn)一步改進(jìn)。濕季水位預(yù)測(cè)不確定性較大的原因可能是濕季降水比較多,降水和入湖徑流各月份之間波動(dòng)較大,3個(gè)模型不能對(duì)這一降雨徑流過程進(jìn)行準(zhǔn)確、有效地描述,由此造成濕季預(yù)測(cè)結(jié)果的偏差。
圖7 BMA(VC,BP,SVR)模型預(yù)測(cè)逐月水位的95%不確定性區(qū)間
在流域各類用水消耗信息缺失條件下,利用降水、溫度、蒸發(fā)、徑流以及前1月水位作為水位的預(yù)測(cè)因子構(gòu)建Vine Copula、BP和SVR模型獲得水位預(yù)測(cè)值,基于貝葉斯統(tǒng)計(jì)理論將機(jī)器學(xué)習(xí)模型和統(tǒng)計(jì)動(dòng)力學(xué)模型結(jié)合構(gòu)建BMA(VC,BP,SVR)和BMA(BP,SVR)模型,并應(yīng)用到杞麓湖來提高長(zhǎng)時(shí)序湖泊水位預(yù)測(cè)精度和不確定性分析。
(1)BMA方法都能夠在一定程度上集合不同模型優(yōu)勢(shì),提高預(yù)測(cè)精度。BP和SVR模型對(duì)時(shí)間序列的局部特征捕捉能力較強(qiáng),Vine Copula模型對(duì)時(shí)間序列的時(shí)序特征描述更好,BMA(VC,BP,SVR)和BMA(BP,SVR)模型預(yù)測(cè)精度高于單一模型,但還是對(duì)一些峰值捕捉不好。
(2)95%置信區(qū)間表明,BMA(VC,BP,SVR)模型區(qū)間覆蓋率達(dá)90%,不確定性較小。
(3)濕季降水比較多,降水和入湖徑流各月份之間波動(dòng)較大,BMA(VC,BP,SVR)模型濕季水位預(yù)測(cè)精度低于干季,且不確定性較大。
(4)在進(jìn)行流域長(zhǎng)時(shí)序水位預(yù)報(bào)時(shí),考慮影響水位變化的物理基礎(chǔ)和各因素并選擇合適的預(yù)報(bào)因子,同時(shí)綜合多種預(yù)報(bào)方法,可有效降低長(zhǎng)期水位預(yù)報(bào)的不確定性。此外,研究采用預(yù)見期為1個(gè)月,可滿足多模型綜合預(yù)報(bào)方法在該研究區(qū)有效性的論證,而該方法在不同預(yù)見期的有效性可能會(huì)有所區(qū)別,還需結(jié)合實(shí)際調(diào)度需求進(jìn)一步檢驗(yàn),探索不同預(yù)見期下的最優(yōu)預(yù)報(bào)方案,以更加合理地指導(dǎo)水位調(diào)度。