蓋姜坤 解恒燕 鄭 鑫
(黑龍江八一農(nóng)墾大學(xué)土木水利學(xué)院,黑龍江 大慶 163319)
降水作為最重要的氣象信息之一,是驅(qū)動大陸水文過程的水文循環(huán)中最相關(guān)的因子[1]。獲取詳盡的空間降水信息是農(nóng)業(yè)生產(chǎn)、水文分析、旱澇災(zāi)害預(yù)測、水資源管理以及生態(tài)環(huán)境治理的首要任務(wù)[2]。降水量主要通過氣象觀測站進行獲取,但由于地形地貌、經(jīng)濟技術(shù)等因素,導(dǎo)致氣象觀測站點存在數(shù)量稀疏、分布不均等現(xiàn)象,因此,很多區(qū)域缺少詳細且精準的降水信息。根據(jù)已知氣象站點觀測的降水量進行空間插值是獲取區(qū)域降水數(shù)據(jù)的常用手段之一[3],主要的空間插值方法有反距離權(quán)重法(IDW)、克里金法(Kriging)、樣條函數(shù)法(Spline)。莫躍爽等[4]對貴州省17個氣象站點的降水數(shù)據(jù)進行插值分析,研究表明普通克里金法對月降水量的插值精度最高。解恒燕等[5]對美國Upper Sangamon 流域9 個氣象站點月降水量進行插值分析,結(jié)果發(fā)現(xiàn)反距離權(quán)重法插值效果較好。張瑋瑋等[6]對浙江省68個國家氣象觀測站的氣象數(shù)據(jù)進行插值,研究發(fā)現(xiàn)Anusplin 法的插值精度更高。符靜等[7]對湖南省87 個氣象站點的年均降水量進行插值,結(jié)果發(fā)現(xiàn)反距離權(quán)重法插值精度較高。綜上所述,由于研究區(qū)域的地理地形特點,降水空間插值方法具有不同的適用性。黑龍江省烏裕爾河流域地形起伏較大,區(qū)域降水較少,而且氣象觀測點稀少,研究該流域的降水空間分布對水資源開發(fā)利用、生態(tài)環(huán)境綜合治理等具有十分重要的意義。本研究以黑龍江省烏裕爾河流域北安段15 個氣象站點2010—2021 年的月降水量為基礎(chǔ)數(shù)據(jù),采用反距離權(quán)重法、普通克里金法和以高程為協(xié)變量的薄板樣條函數(shù)法進行降水空間插值,利用留一法交叉驗證比較每種方法的插值精度,選出滿足實際需求的降水插值方法,以期為整個區(qū)域降水數(shù)據(jù)的獲取提供有效途徑。
烏裕爾河流域位于黑龍江省西部(東經(jīng)125°25'~128°30',北緯47°40'~48°20'),境內(nèi)地勢東北高、西南低,屬于低山丘陵地區(qū),海拔在100~800 m之間。烏裕爾河流域?qū)儆谥袦貛Т箨懶约撅L(fēng)氣候,夏季溫?zé)岫嘤?,冬季寒冷干燥,多年平均降水量?96.7 mm,6—9月的降水占全年降水量的80%。本研究選取2010—2021年烏裕爾河流域北安段15個氣象站點觀測的逐日降水量,降水資料來源于黑龍江省北安農(nóng)墾管理局氣象臺,經(jīng)數(shù)據(jù)質(zhì)量控制,保證了觀測數(shù)據(jù)的連續(xù)性和代表性,通過累計求和,計算得到月降水量,經(jīng)統(tǒng)計分析,該區(qū)域降水量具有較高的一致性,氣象站點分布見圖1。
圖 烏裕爾河流域北安段氣象站點位置分布
1.2.1 反距離權(quán)重法。反距離權(quán)重法(Inverse Distance Weighting,IDW),是以待插點與其他樣本點之間距離為權(quán)重的插值方法[8]。該方法是基于“地理第一定律”的基本假設(shè),距離越近,則相似性越高,權(quán)重系數(shù)越大,反距離權(quán)重法計算為式(1)、式(2)和式(3)。
式中:Z(xi)是已知點的實測值;λi是權(quán)重系數(shù);Z(x0)是待插點的估計值;di是待插點到第 i 點的距離;n是樣本點的數(shù)量;p是指數(shù)值。
1.2.2 普通克里金法。普通克里金法(Ordi?nary Kriging,OK),是以變異函數(shù)理論和結(jié)構(gòu)分析為基礎(chǔ),在有限區(qū)域內(nèi)對區(qū)域化變量進行無偏、最優(yōu)估計的一種方法[9]。半變異函數(shù)通過曲面函數(shù)進行擬合,從而得到最優(yōu)權(quán)重系數(shù),普通克里金法計算為式(4)。
1.2.3 樣條函數(shù)法。樣條函數(shù)法(Spline)是通過利用最小化表面總曲率來估計待插點的數(shù)值[10],本研究采用規(guī)則樣條函數(shù)擬合插值曲面,樣條函數(shù)法計算為式(5)。
式中:Z是估計值;n是樣本點的數(shù)量;λi是線性方程的系數(shù);di是待插點到第 i 點的距離;T(x,y)是樣本點的位置。
1.2.4 Anuspian插值法。Anusplin法是基于普通薄盤和局部薄盤樣條函數(shù)插值理論,引入線性協(xié)變量子模型[11]。本研究以高程為協(xié)變量,利用Anusplin 軟件包進行空間插值,Anusplin 插值法計算為式(6)。
式中:Zi是估計值;xi是自變量;f(xi)是光滑函數(shù);yi是協(xié)變量;b 是協(xié)變量的系數(shù);ei是自變量隨機誤差。
本研究采用留一法交叉驗證來評價插值方法的精度,即預(yù)先假設(shè)某個觀測點實測數(shù)據(jù)未知,利用剩余的樣本點的實測數(shù)據(jù)插值計算,從而得到待插點的估計值,然后計算實測值與估計值的誤差[12]。插值精度的評價指標包括平均絕對誤差(MAE)、均方根誤差(RMSE)。MAE、RMSE 數(shù)值越小,則插值精度越高,誤差計算為式(7)、式(8)。
式中:Yi是插值估計值;Xi是實際觀測值;n 是參證點的個數(shù)。
分別應(yīng)用 IDW、OK、Spline、Anusplin 4 種空間插值方法,對烏裕爾河流域北安段15 個氣象站點的月降水量進行插值,通過交叉驗證對插值精度進行評價,得到每個月的誤差結(jié)果,平均絕對誤差、均方根誤差分別見圖2、圖3。
圖2 月降水量平均絕對誤差結(jié)果
圖3 月降水量均方根誤差結(jié)果
由圖2、圖3可知,月降水量MAE的排序為IDW>Spline>OK>Anusplin,其值分別為11.05 mm、10.59 mm、10.52 mm、5.61 mm;RMSE 的排序為 IDW>Spline>OK>Anusplin,其值分別為 13.87 mm、13.27 mm、13.16 mm、7.27 mm。由此可以發(fā)現(xiàn),Anusplin 插值法得到的誤差明顯小于其他3 種插值方法,Anusp?lin 插值法的插值精度最高。4 種插值方法MAE、RMSE 月變化特征明顯,1—7 月呈現(xiàn)上升趨勢,7—12月呈現(xiàn)下降趨勢,這與烏裕爾河流域的月降水分布一致,月降水量越大,則插值誤差也越大。結(jié)果表明:對于月降雨量,不論降雨量的多少,Anusplin方法插值效果優(yōu)于IDW、Spline、OK,4 種方法的插值誤差總體上隨著降水量的增多而增大。
為判斷4 種插值方法對單個氣象站點是否有相同的適用性,選取具有季節(jié)代表性的1 月、4 月、7月降水量進行分析,通過對氣象站點估計值與實測值的比較,得到不同氣象站點的最優(yōu)插值方法,1月、4月、7月降水量的結(jié)果見圖4。
由圖4 可知,雖然總體上Anusplin 的估計值較其他三種方法更接近實測值,但就具體站點來說,不同站點的最優(yōu)插值方法存在季節(jié)和站點差異。例如,1月和4月降水量,紅星站點和建設(shè)站點實測值分別為19.67 mm、19.20 mm,Spline 預(yù)測值(18.65 mm、19.78 mm)較Anusplin 預(yù)測值(18.12 mm、20.26 mm)誤差更小;就7月而言,二龍山站點、引龍河站點和趙光站點OK插值方法的誤差最小。對整體插值效果較好的Anusplin并非對每個站點的插值效果都好。
圖4 1月、4月和7月降水量實測值和預(yù)測值比較
①從研究區(qū)域的整體性來看,Anusplin 方法插值效果優(yōu)于IDW、Spline、OK,4 種方法的插值誤差均隨月降水量的增多而逐漸增大。
②從研究區(qū)域各個站點來看,總體上Anusplin的估計值較其他三種方法更接近實測值,不同站點的最優(yōu)插值方法也存在季節(jié)和站點差異。在1 月、4 月中,紅星站點和建設(shè)站點Spline 的誤差最小,在7 月中,二龍山站點、引龍河站點和趙光站點OK 的誤差最小。
由于降水受研究區(qū)域地理地形的影響較大,具有空間變異性,將高程等地形因子引入空間插值模型,考慮地理地形對降水的影響,可以提高降水插值精度。以高程為協(xié)變量的Anusplin 法適用于地形較為復(fù)雜的研究區(qū)域,這對我國其他地區(qū)插值方法的研究具有一定借鑒意義。