黃華平,尹開霞,靳高陽
(中水珠江規(guī)劃勘測設計有限公司,廣東 廣州 510610)
準確的降水空間分布信息是理解不同尺度范圍內水量及能量變化過程的前提條件,對于區(qū)域水文水資源分析及管理、洪澇災害預測及防治和生態(tài)環(huán)境治理等關鍵問題具有重要意義[1]。根據(jù)有限的雨量站觀測資料進行空間插值是探索降水空間特征的有效手段,也是當前水科學研究的熱點問題[2-5]。
目前,針對降水的空間插值已有大量研究,依據(jù)其原理可以大致分為三類,包括“確定性插值方法”“空間統(tǒng)計學方法”及“其他方法”[6]。確定性空間插值方法中最具代表性的是泰森多邊形法、等雨量線法及反距離加權法[7-8]。這類方法一般采用均化處理來描述降水空間特征變化,以便水文模型的產流計算。其特點是原理簡單且運算速度快,但結果易受控于距離較近的站點[9]。而空間統(tǒng)計學方法則以區(qū)域化變量為基礎,致力于利用相鄰觀測點間的相互關系來對未知點進行估計[10]??死锝鸱ㄅc其變種方法均屬于此范疇內。該類方法具有堅實的科學理論基礎,因此較之確定性插值方法受到更廣泛的重視。但其缺點也不容忽視,如原理復雜且假設過于理想化、理論半變異函數(shù)選取主觀化及結果易產生“平滑效應”等[11]。第三類是基于非線性科學理論的插值方法,充分考慮了降水具有隨機性與模糊性的雙重特征,并以此對降水空間特征進行刻畫,具體包括了信息熵法、貝葉斯最大熵法、互信息理論及信息擴散理論等理論方法[12-14]。該類方法無需過多的理論假設,且能提供更多的降水空間信息,但與前兩者相比,相關研究較少。
本文介紹了一種基于信息擴散理論的空間插值模型,針對模型中的關鍵參數(shù)-窗寬值,考慮已有經驗公式法難以合理估計偏態(tài)分布樣本參數(shù)的不足,提出了一種粒子群算法與交叉驗證相結合的最優(yōu)窗寬估計方法。研究以黃河源區(qū)為例,在綜合分析流域降水空間分布特征的基礎上,分別對2種信息擴散插值模型關于年、季、月及日降水量的插值精度進行評估,并引入了4種常用的空間插值方法作為參照。
記M={X,Y}為雨量隨機場,X為任意點位置,Y為該點降水量。假定該隨機場內存在分布函數(shù)f(X,Y),其反映了空間內的降水信息分布密度,則降水量Y=yj關于觀測點X=xi的條件密度函數(shù)依據(jù)全概率公式可表示為:
(1)
(2)
最終,對隸屬度函數(shù)進行去模糊化即可得到對應估計值,見式(3):
(3)
由式(1)—(3)不難發(fā)現(xiàn),該模型重點在于如何估計降水信息分布密度函數(shù)f(X,Y)?;谟炅空军c觀測資料m={xi,yi,i=1,2,…,n}(n為雨量站數(shù)量),可采用信息擴散理論對該密度函數(shù)進行無偏估計,見式(4):
(4)
式中,hx與hy分別為X與Y維度對應的窗寬值。
最終,將式(4)代式(1)—(3)中,即可確定雨量隨機場內任意點處降水量隸屬度函數(shù),并實現(xiàn)降水插值計算。
確定上述插值模型后,還需估計模型內關鍵參數(shù)——窗寬值。目前,已有估計方法存在結果非最優(yōu)參數(shù)或原理過于復雜等問題[13,15-16]。因此,本文簡要介紹其中的經驗窗寬公式法,并提出一種基于粒子群算法與交叉驗證相結合的最優(yōu)窗寬估計方法。該方法較之已有方法無過多繁瑣公式推導,且插值精度較高。
1.2.1經驗窗寬公式法
基于“平均距離模型”與“兩點擇近原則”,黃崇福[17]推導了窗寬h的經驗計算公式。
(5)
式中,a=min(li);b=max(li);i=1,2,…,n。不難看出,窗寬大小僅與觀測樣本的數(shù)量、各維度上最大值和最小值相關。
該方法具有計算快速且簡便的優(yōu)點,但其僅是對單變量擴散函數(shù)進行推導得到的,而對于插值過程中需要解決的多元問題,該方法并不能保證參數(shù)結果的最優(yōu)性。并且當觀測樣本為非對稱、非正態(tài)結構時,該參數(shù)估計方法將產生較大偏差。而降水在空間上往往服從偏態(tài)分布,因此采用經驗窗寬公式法推求相關參數(shù)難免存在一定偏差。
1.2.2基于PSO-CV算法的最優(yōu)窗寬估計法
為克服已有方法的不足,本文提出一種基于粒子群算法與交叉驗證相結合的最優(yōu)窗寬估計方法。該方法通過采用留一交叉驗證法,逐一計算估計值與實測值間的絕對誤差,并將整個過程中的絕對誤差之和作為目標函數(shù),采用粒子群算法對該目標函數(shù)進行最小尋優(yōu),具體步驟如下。
步驟一確定目標函數(shù)。累計每次“留一交叉驗證法”估計值與實際值間的絕對誤差,將其最小化作為算法的優(yōu)化準則,見式(6):
(6)
式中,Pobs(si)與Pest(si)分別為點si處的觀測值與估計值。
步驟三迭代更新。在迭代過程中,每個粒子依據(jù)歷史所處的最優(yōu)位置和整個群體的最優(yōu)位置,結合隨機擾動來確定下一步的移動,具體為:
(7)
步驟四確定最優(yōu)窗寬。當粒子群迭代到最大迭代次數(shù)時,即停止迭代計算。此時,選擇目標函數(shù)最小值對應粒子的位置h=(h1,h2,…,hn)(n為待尋優(yōu)參數(shù)個數(shù))作為整個觀測樣本的最優(yōu)窗寬值。
a)均方根誤差(RMSE)。RMSE值是實測數(shù)據(jù)和插值結果之間偏差平方均值的平方根,反映空間插值方法的精準度,其值越小,說明插值結果和實測數(shù)據(jù)越接近,計算公式為:
(8)
b)絕對偏差(ABIAS)。ABAIS值是插值結果與實測數(shù)據(jù)之間誤差絕對值與實測數(shù)據(jù)均值的比值,反映了插值結果相對于實測數(shù)據(jù)的偏差程度,計算公式為:
(9)
c)相關系數(shù)(CC)。CC值描述了插值結果與實測數(shù)據(jù)之間的線性相關程度,其值越接近于1,表明兩者相關性程度越高,計算公式為:
(10)
本文以黃河源區(qū)為例,搜集了源區(qū)內及附近區(qū)域17個氣象站和5個水文站1986—2015年逐日降水數(shù)據(jù),源區(qū)基本概況及站點分布見圖1。研究引入了反距離加權法(IDW)、普通克里金法(OK),泛克里金法(DUK)及考慮高程的協(xié)克里金法(COK)作為對比參照,比較且評估了上述2種信息擴散插值模型,即經驗信息插值模型(EMP)及基于PSO-CV算法的最優(yōu)信息插值模型(OPT)。首先,研究對黃河源區(qū)多年平均年及各季降水量的空間分布特征進行了綜合分析,在此基礎上采用留一交叉驗證法分別從年、季、月與日4種時間尺度對各空間插值方法的精度進行了比較與評價。
圖1 研究區(qū)位置及水文、氣象站點分布
為比較不同插值方法結果的空間差異性,研究先將22個站點作為已知數(shù)據(jù),對源區(qū)多年平均年及各季降水量的空間分布特征進行估計,考慮到流域面積較大,此次采用地區(qū)性插值法,即選取各未知點距離最近的10個站點進行插值估計。圖2提供了不同方法對應多年平均年降水量空間分布,整體來看,6種方法刻畫的年降水量空間分布特征基本相似,均呈現(xiàn)“南高北低,東高西低”的基本特征,年降水整體呈現(xiàn)帶狀分布,東南部降水量大,西北部降水量小。對比不同插值方法的空間分布特性,可以發(fā)現(xiàn)圖2b克里金法和圖2d協(xié)克里金法差異很小,而2種信息擴散插值方法除部分細節(jié)外,整體也較為類似。不同方法的主要差異在于源區(qū)西北部。具體來看,普通克里金法和協(xié)克里金法對應年降水量在該地區(qū)顯著大于其他方法,而2種信息擴散插值方法對于該地區(qū)的估計值則小于其他方法。對比2種信息擴散插值方法,可以發(fā)現(xiàn)圖2f最優(yōu)信息插值模型在西北區(qū)域和東南區(qū)域均略大于圖2e經驗信息插值模型??紤]到文章篇幅,其他季節(jié)降水量的空間分布未展示在本文中。
a)IDW
各方法對應年及季節(jié)性面平均降水量見表1。其中,春季面平均降水量為93~103 mm,夏季面平均降水量為280~293 mm,秋季面平均降水量為111~119 mm,冬季面平均降水量為12~14 mm,全年面平均降水量為498~521 mm。比較不同插值方法的面平均雨量,不難發(fā)現(xiàn)對于全年和各季,普通克里金法和協(xié)克里金法對應面平均降水量均大于其他4種方法,且差異較大,其他4種方法差異較小。對比經驗信息插值模型和最優(yōu)信息插值模型2種模型,可發(fā)現(xiàn)后者對應面平均降水量在夏季和冬季小于前者,在其他季節(jié)大于前者。
表1 不同插值方法對應流域面平均季節(jié)性及年降水量 單位:mm
為了精確評估信息擴散插值模型的插值精度,研究采用留一交叉驗證法對年、季、月及日降水數(shù)據(jù)進行相應插值研究,并以1.3節(jié)中精度指標為依據(jù),對應結果如下。
2.2.1年及季節(jié)性降水量
各插值方法對應多年平均年及季節(jié)性降水量插值精度見圖3。從絕對偏差來看,各方法對于全年和夏季降水量的插值精度最高,ABIAS值約為10%,而后依次是秋季、春季,精度最差的是冬季,ABIAS值達到了28%;全年、春季和秋季降水量對應的相關系數(shù)相當,整體在0.85左右,夏季降水量對應的CC值最低,僅為0.71。
a)相關系數(shù)
不同方法對比結果表明,對于全年、春、夏和冬季降水量而言,最優(yōu)信息插值模型對應插值精度顯著優(yōu)于其他方法,而對于秋季降水量的插值精度也僅次于泛克里金法。經驗信息插值模型對應插值精度在絕大多數(shù)情況下與泛克里金法相當,普通克里金法與考慮高程因素的協(xié)克里金法整體精度相近,但部分季節(jié)協(xié)克里金法精度甚至要低于普通克里金法,說明考慮高程影響對于分析黃河源區(qū)全年及季節(jié)性降水空間分布特征的作用較小。反距離加權法的插值精度變幅較大,對于全年、春季和冬季降水量的插值精度尚可,但對于夏季和秋季降水量的插值精度會差于其他方法。
2.2.2月降水量
各插值方法對應多年平均月降水量插值精度見圖4。從ABIAS來看,所有方法關于5—10月(降水較大月份)的插值精度會顯著大于其他月份,前者的ABIAS處于0.08~0.18范圍內,而后者的ABIAS處于0.15~0.45范圍內。對比CC結果可發(fā)現(xiàn),7、8、12月對應CC較小,均處于0.55左右;10、11月對應CC較大,均處于0.9左右,其他月份對應CC差異不大,整體處于0.7~0.8范圍內。
a)CC
不同方法對比結果表明,最優(yōu)信息插值模型對于絕大多數(shù)月份的插值精度會高于其他方法,全年平均 CC為0.80,ABIAS為0.17,RMSE為6.13。經驗信息插值模型、普通克里金法和泛克里金法3種方法的插值精度相當,全年平均CC為0.75~0.77,ABIAS為0.18~0.20,RMSE為6.45~6.91;反距離加權法和協(xié)克里金法的插值精度略差于其他4種方法,兩者全年平均CC分別為0.72和0.71,ABIAS為0.21和0.22,RMSE為8.09和8.88。
2.2.3日降水量
考慮日降水量的年際差異較大,且存在大量“零值”,為盡可能保證日降水數(shù)據(jù)的特性,本次研究直接將1986年1月1日至2015年12月31日的逐日降水量過程作為實驗數(shù)據(jù),用于比較不同空間插值方法的精度,具體結果見圖5。該圖提供了22個站點的不同精度指標分布特性,不難看出,各插值方法對應精度指標均顯著差于年、季和月降水量,且不同插值方法間精度差異也不大,這一現(xiàn)象說明了日降水空間插值計算的難度要顯著高于年、季和月降水量。
a)CC
不同方法對比結果表明,最優(yōu)信息插值模型的精度要略優(yōu)于其他5種方法,22個站點平均CC為0.53,ABIAS為0.95,RMSE為3.21。普通克里金法、泛克里金法、考慮高程因素的協(xié)里金法和經驗信息插值模型間差異不大,平均CC為0.51~0.52,ABIAS為0.97~0.99,RMSE為3.26~3.30。反距離加權法對應精度略差于其他5種方法,平均CC為0.49,ABIAS為1.00,RMSE為3.38。與年、季和月降水量相似,日降水量的插值結果同樣表明,考慮高程因素并不能有效地提高空間插值方法的精度。
a)整體來看,基于PSO-CV算法的最優(yōu)信息擴散插值模型精度要顯著高于其他方法。除反距離加權法精度略低外,其他4種方法在黃河源區(qū)的插值效果相差不大,多數(shù)情況下精度指標值差異在10%以內。不同方法間的精度差異程度隨著時間尺度的減小而減小。
b)對年降水量而言,各方法均能反映黃河源區(qū)“南高北低,東高西低”的空間分布特征。而源區(qū)對應年及各季面平均降水量結果表明,普通克里金與協(xié)克里金法估計值較之其他方法大致偏大4%~12%,其他方法估計值間的差異較小。
c)對比普通克里金法與考慮高程因素的協(xié)克里金法,不難發(fā)現(xiàn)兩者精度差異較小,在部分情況下,協(xié)克里金法精度甚至更低。因此,考慮高程因素影響對于分析黃河源區(qū)內降水量空間分布特征的意義不大。