王 超
(河北省石家莊水文水資源勘測(cè)局,石家莊 050051)
水資源預(yù)測(cè)是區(qū)域水資源規(guī)劃管理的基礎(chǔ),受氣候變化密切影響,水資源表現(xiàn)出時(shí)間波動(dòng)性與突變性,這給預(yù)測(cè)研究帶來一定挑戰(zhàn)。本文基于時(shí)間序列數(shù)據(jù)集的新型建模方案 (empirical dynamic modelling,EDM),闡述模型原理與建模過程,為水資源預(yù)測(cè)開拓新思路。
經(jīng)驗(yàn)動(dòng)態(tài)模型 (empirical dynamic modelling,EDM)是針對(duì)時(shí)間序列環(huán)境變量的動(dòng)態(tài)建模分析方法,該方法擴(kuò)展了傳統(tǒng)的復(fù)雜矩陣中定義為平衡系統(tǒng)到動(dòng)態(tài)系統(tǒng)過程中處于平衡狀態(tài)[1-2]。 傳統(tǒng)雅克比矩陣是一個(gè)線性化方程組,矩陣之間部矢量交互通常是安裝一定模式設(shè)計(jì)的固定系數(shù)。 然而在實(shí)際生態(tài)系統(tǒng)中幾乎不存在靜態(tài)平衡,更為普遍的是表現(xiàn)為非線性行為。 EDM框架強(qiáng)調(diào)系統(tǒng)狀態(tài)隨生態(tài)系統(tǒng)向量狀態(tài)的變化而變化,并具有時(shí)間動(dòng)態(tài)序列特征。EDM的內(nèi)涵豐富,主要包含非線性動(dòng)力學(xué)識(shí)別、CCM動(dòng)態(tài)歸因、生態(tài)序列預(yù)測(cè)等內(nèi)容。
本文主要應(yīng)用EDM原理中的S-map和CCM算法進(jìn)行論述。
S-map是基于時(shí)間滯后信息的一種系統(tǒng)動(dòng)力學(xué)回歸模型,其框架如式(1):
S-map通過線性逼近已經(jīng)完成在對(duì)引子流形上的每個(gè)局部位置x(t*)的權(quán)重設(shè)計(jì)[3]。 在吸引子流形上,對(duì)于更接近目標(biāo)點(diǎn)x(t*)的向量,權(quán)重更大,其中參數(shù)k是權(quán)重的控制參數(shù)之一,d為平均距離,權(quán)重計(jì)算如式(2):
交叉收斂映射CCM (Convergent Cross Mapping,CCM)算法是EDM框架的重要內(nèi)容之一,由Sugihara等[4]于2012年在《Science》上公開發(fā)表的新型因果關(guān)系檢測(cè)方法。 區(qū)別于格蘭杰等因果關(guān)系檢驗(yàn)的互相關(guān)函數(shù)與信息熵傳遞內(nèi)核。 CCM是基于Takens嵌入定理,Mx和My是同胚胎中M中的影子流形,它們均是通過對(duì)原始序列x,y的時(shí)滯信息重構(gòu)得到的,由此產(chǎn)生了Mx與My之間的連續(xù)映射,若Mx對(duì)My有因果關(guān)系,則能夠在My上找到Mx的過程標(biāo)簽。 對(duì)于n維系統(tǒng)M中關(guān)聯(lián)變量Mx,My,構(gòu)建影子流形如式(3):
式中 E為嵌入維數(shù);τ為時(shí)滯步長。
若在Mx上找到系列與My,k0對(duì)應(yīng)的流形,My,k0流形平均距離函數(shù)如式(4)~式(5):
式中 k為時(shí)間序列集的長度,i,j∈k。
若Mx在My上的映射收斂到0~1之間,表明Mx是My的歸因。
通過《河北年鑒》中提取衡水市水資源總量年值(1970~2018年),并以此作為目標(biāo)變量進(jìn)行預(yù)測(cè)分析。水資源總量(WR)的變化與氣候變化密切相關(guān),通過文獻(xiàn)分析[4-5],選擇若干高頻變量作為預(yù)測(cè)因子,分別是年降雨量 (Pre)、 年平均溫度 (Tem)、 濕度(Mois)、日照時(shí)數(shù)(Hour)、蒸發(fā)量(ET),氣象因子數(shù)據(jù)來源于中國氣象中心,運(yùn)用R語言實(shí)現(xiàn)水資源的預(yù)測(cè)分析研究。
EDM方法的應(yīng)用性具有嚴(yán)格標(biāo)準(zhǔn),不僅要求數(shù)據(jù)集為連續(xù)性的時(shí)間序列變量,還要求事物本身符合動(dòng)力學(xué)特征。 rEDM開源程序包中設(shè)計(jì)了相關(guān)檢測(cè)程序,通過S-map算法中的權(quán)重參數(shù)k進(jìn)行迭代,對(duì)比不同迭代結(jié)果中預(yù)測(cè)值與實(shí)際值的相關(guān)系數(shù)(rEDM中規(guī)定相關(guān)系數(shù)用rho標(biāo)識(shí))。 當(dāng)k為0時(shí),狀態(tài)系統(tǒng)中吸引子流形各點(diǎn)的權(quán)重相同,此時(shí)的S-map算法簡化為標(biāo)準(zhǔn)的線性模型,當(dāng)k大于0時(shí),則為非線性預(yù)測(cè)模型。 如圖1(b),rho在k大于0時(shí)的值均高于k為0時(shí)rho的值,說明線性動(dòng)力學(xué)的存在,即運(yùn)用EDM原理建立衡水市水資源總量的動(dòng)態(tài)模型具有良好的適用性。另外,時(shí)滯步長表征了非線性預(yù)測(cè)的長度,如圖1(a),當(dāng)步長為5時(shí),rho達(dá)到最高水平,因此在后續(xù)的預(yù)測(cè)中選定該參數(shù)為5。
圖1 非線性動(dòng)力學(xué)識(shí)別
嵌入維數(shù)定義為重構(gòu)吸引子流形所需的變量維數(shù),其不僅僅所指預(yù)測(cè)變量個(gè)數(shù),包含相關(guān)變量的時(shí)滯子集,如圖2,圖中橫坐標(biāo)為嵌入維數(shù)大小(E),縱坐標(biāo)為基于S-map 的預(yù)測(cè)值與實(shí)際值的相關(guān)系數(shù)rho,rho越大,說明嵌入維數(shù)最優(yōu)。 其中在WR,Pre兩變量中,最佳嵌入維數(shù)為8和2;在WR和Tem組合中最優(yōu)值為8和4;Mois在最佳嵌入維數(shù)為4;Hour和ET則均為7。 嵌入維數(shù)的大小決定模型的復(fù)雜程度,若其值過大,則會(huì)導(dǎo)致狀態(tài)空間過密和信息重疊,并損失動(dòng)力結(jié)構(gòu)性規(guī)律; 反之過小則產(chǎn)生狀態(tài)空間依賴性不足,預(yù)測(cè)精度較低。 通過rEDM程序號(hào)中的simplex函數(shù)可給出最佳嵌入維數(shù)的平衡選擇。
圖2 嵌入維數(shù)選擇
經(jīng)參數(shù)優(yōu)化后運(yùn)用rEDM中的CCM_test函數(shù)對(duì)衡水市水資源總量WR與氣候環(huán)境因子之間的歸因識(shí)別。 如圖3,圖中橫坐標(biāo)為時(shí)間序列數(shù)據(jù)集的時(shí)間變化; 縱坐標(biāo)為各單變量通過時(shí)滯構(gòu)建吸引子流形后的點(diǎn)值與原來點(diǎn)值的相關(guān)性系數(shù)。
圖3 基于CCM的雙變量動(dòng)態(tài)交互
圖3(a)中Pre在WR上的投影系數(shù)值為0.3,WR在Pre上的投影系數(shù)為0.2,均介于0~0.5,表明二者互為動(dòng)力學(xué)因果關(guān)系,即降水量是水資源量的因,同時(shí)水資源量也是降水量的因,說明二者互為影響。 其中Tem map WR 0.01,說明溫度的變化是區(qū)域水資源變化的顯著性成因(P<0.05);同時(shí)水資源量的變化也會(huì)引起溫度的變化(WR map Tem 0.2),但這一過程并不顯著。 大氣濕度與水資源量之間互為成因,其中濕度對(duì)水資源量的投影值(Mois map WR)為0.03;水資源量對(duì)濕度的投影值(WR map Mois)為0.02;歸因均達(dá)到顯著水平。 日照時(shí)數(shù)對(duì)水資源量具有一定影響 (Hour map WR 0.3),前者是引起后者變化的原因;而后者不會(huì)引起前者的變化(WR map Hour 0.6,P>0.5)。 圖3(e)中ET與WR交叉收斂特征十分明顯,二者互相投影值分別為0.01,0.02;通過5%水平信度檢驗(yàn),說明蒸發(fā)變化是衡水市水資源量變化的顯著性原因;同時(shí)后者也是前者的成因。
rEDM程序中基于EDM原理設(shè)計(jì)了圖4中非線性動(dòng)力學(xué)預(yù)測(cè)方法,分別是Simplex、S-map、multivariate、multi-view等,Chun-Wei Chang等[6]研究表明以multiview的預(yù)測(cè)效果最佳,因此本文選擇該方法對(duì)1971~2018年衡水市水資源總量變化進(jìn)行時(shí)間性預(yù)測(cè),結(jié)果如圖4。
圖4 基于multi-view的衡水市水資源總量預(yù)測(cè)
從圖4(a)可知,multi-view模擬的水資源總量年值能夠較好地?cái)M合其實(shí)際變化,雖然有誤差存在,但均較??;依據(jù)圖4(b)可知,實(shí)際值與預(yù)測(cè)值之間的相關(guān)系數(shù)高度0.95,Mae和RMSE為0.71億,1.01億m3,表明預(yù)測(cè)精度較高,預(yù)測(cè)結(jié)果可靠。
(1)水資源是氣候系統(tǒng)耗散過程中的矢量之一,水資源的時(shí)空變化與氣候變化密切相關(guān),通過建立氣候因子與水資源總量之間的關(guān)系模型能夠較好地開展水資源預(yù)測(cè)。
(2)介紹了應(yīng)用EDM原理對(duì)衡水市水資源進(jìn)行預(yù)測(cè)的實(shí)證方案,建模過程表明水資源時(shí)序變化更加符合非線性特征,相對(duì)于傳統(tǒng)線性模型,EDM模型具有一定的適用性;EDM框架中的CCM算法檢測(cè)出了該市水資源變化的成因,從投影值來看,蒸發(fā)與溫度的影響其顯著成因(P<0.05),雖然大氣濕度、降水量、日照時(shí)數(shù)對(duì)其具有一定影響,但并不顯著。