崔琴芳,楊 耘,2,劉 艷,董佰山
(1.長安大學地質工程與測繪學院,陜西 西安 710054;2.西部礦產資源與地質工程教育部重點實驗室,陜西 西安 710054;3.中國氣象局烏魯木齊沙漠氣象研究所,新疆 烏魯木齊 830002)
水資源是人類賴以生存和生產的最基本物質基礎,降水則是主要的來源,由于人力、物力和財力有限導致氣象站點分布不均勻,導致大部分區(qū)域空間的降水數(shù)據(jù)無法直接獲取。新疆瑪納斯河流域地形復雜多變,不便于氣象觀測點的布設,并且降雨季節(jié)分布極不均勻,因此采用空間數(shù)據(jù)的插值方法來推測相鄰地區(qū)降水量顯得尤為重要。進行空間插值研究時,應充分考慮插值過程中對降雨有重要影響的地形等因子。
常規(guī)的降水量空間插值方法有:樣條函數(shù)插值(Spline)、反距離權重插值(IDW,inverse distance weighted)、克里金插值(Kriging)、趨勢面插值(Trend)等[1-7],但是在地形地貌復雜多樣、氣象站點分布稀疏的地區(qū)對降水量空間分布模擬的吻合程度不高,無法滿足相對精度要求。地理加權回歸克里格(GWRK,geographically weighted regression kriging)是地理加權回歸(GWR,geographically weighted regression)與回歸克里格(RK,regression kriging)的結合,用地理加權回歸克里格(GWRK)中的局部回歸代替回歸克里格(RK)中的全局回歸,而殘差仍采用克里格插值的一種混合插值方法[8-11],能夠在顧及回歸關系空間非平穩(wěn)性的同時考慮回歸殘差的空間自相關。
瑪納斯河流域位于 85°01′~ 86°32′E,43°27′~45°21′N,地處歐亞大陸腹地,新疆天山北麓、準噶爾盆地南緣,屬內陸干旱區(qū),年平均氣溫6.8 ℃,年降水量110~200 mm,流域內土壤主要類型為灰漠土,地表過程復雜,是北疆地區(qū)的一個典型流域(見圖1)。該流域地形呈南高北低走勢,源頭海拔5 000~5 500 m,山地垂直地帶性特征十分明顯。
研究采用瑪納斯河流域21個氣象站的月平均降水量(2015年3月)數(shù)據(jù),數(shù)據(jù)精度0.1 mm;在地理空間數(shù)據(jù)云下載MODIS月植被指數(shù)數(shù)據(jù)產品MOD13A3,精度為1 km;同時下載數(shù)字高程模型(DEM,digital elevation model),精度為30 m,然后對DEM高程數(shù)據(jù)進行1 km×1 km重采樣后,再提取出坡度、坡向圖。最后根據(jù)每個站點所在的地理坐標位置提取相應的海拔、坡度、坡向以及植被指數(shù)。
圖1 研究區(qū)氣象站點分布Fig.1 Distribution of study areas and meteorological stations
研究所用軟件平臺:SPSS;GS+;ArcGIS 10.2;GWR 4.0。根據(jù)研究區(qū)地形地貌特征可知,地形特征是影響降水量空間分布的主要因素,因此,選擇表達地形的海拔、坡度、坡向[4]以及可以反映降水量空間分布的歸一化植被指數(shù)共4個影響因子作為輔助變量,來進行回歸克里格、地理加權回歸克里格以及混合地理加權回歸克里格3種方法空間插值。
(1)
地理加權回歸克里格(GWRK)是地理加權回歸(GWR)與回歸克里格(RK)方法相結合,GWR模型是對OLR模型的擴展,將RK中的全局線性回歸用GWR中的局部回歸代替,對空間非平穩(wěn)性進行量化,位置x0處目標變量對環(huán)境變量的回歸系數(shù)不再是常數(shù),而是用空間權重函數(shù)(空間位置的函數(shù)),研究中采用bi-squarev函數(shù)作為空間權重函數(shù)[5],在點x(ui,vi)處的GWR模型為
i=1,2,…,n
(2)
其中:(ui,vi)為第i個測站點的坐標;βk(ui,vi)是第i個測站點上的第k個回歸參數(shù),是關于地理位置的函數(shù);εi~N(0,σ2)。為表示方便,將βk(ui,vi)簡寫為βik。
混合地理加權回歸(MGWR,mixed geographically weighted regression)是在GWR模型的基礎上提出來的,其公式為
(3)
GWR模型適合用在解釋變量具有明顯的空間非平穩(wěn)性下進行建模,但是在許多實際問題中,解釋變量中往往既包括全局變量,又包括局部變量,解釋變量中有些可能不具有空間非平穩(wěn)性,或者空間非平穩(wěn)性較小可忽略不計[4-6]。降水的影響因素中可能同時包含空間平穩(wěn)性和非平穩(wěn)性2種類型,故使用MGWR模型進行降水量的空間分布特征分析。
月平均降水量混合地理加權回歸克里格插值過程:利用GWR4.0軟件建立月平均降水量與4個影響因子間的GWR模型,并對回歸變量進行空間變異性檢驗,當DIFF標準在0~2之間時,說明變量的空間變異性較弱,這時候將該變量作為全局回歸變量建立了式(3)的混合地理加權回歸模型,得到地理加權回歸模擬的趨勢項表面;然后對模型中代表隨機性的殘差進行地統(tǒng)計分析和普通克里金插值,得到殘差項表面;最后將兩表面進行柵格運算[1],得到月平均降水量的空間插值結果。
描述性統(tǒng)計便于描述測量樣本的各種特征及其所代表的總體特征。對研究區(qū)內21個氣象站點月平均降水量的觀測數(shù)據(jù)進行了描述性統(tǒng)計,結果見表1。由表1可知,瑪納斯河流域3月份的降水量在0.2~33.4 mm之間,平均降水量12.186 mm;變異系數(shù)達到43.58%,屬于中等變異,月平均降水量近似服從正態(tài)分布。
電阻率值為3.64~11.22 Ωm,聲波時差為231.58~302.57 μs/m。從電測曲線解釋成果可以看出視電阻率值有升高現(xiàn)象,同時聲波時差值變小。
表1 月平均降水量描述性統(tǒng)計
根據(jù)逐步回歸結果,研究采用海拔、坡度、坡向以及植被指數(shù)4個環(huán)境變量對月平均降水量進行插值研究(見表2),同時環(huán)境變量的方差膨脹因子(VIF,variance inflation factor)均小于10,說明環(huán)境變量間不存在多重共線性問題,可進行建模實驗。
表2 環(huán)境變量及共線性檢驗
(1) 回歸克里格插值 建立基于普通線性回歸的全局回歸克里格進行逐步回歸分析,平均降水量與4個環(huán)境變量間的回歸關系為
yi=8.951+0.017×SLOPE+0.338×ASPECT+15.735×NDVI-0.002×DEM,
(4)
普通線性回歸所得到的系數(shù)都是常數(shù),表達了各環(huán)境變量對目標變量在研究區(qū)范圍內影響的平均值,回歸模型的R2為0.776,調整R2為0.765。
(2) 地理加權回歸插值 根據(jù)GWR4.0軟件所得加權回歸結果,建立降水量與環(huán)境變量之間的地理加權回歸模型:
yi=β0i+β1iSLOPE1i+β2iASPECT2i+
β3iNDVI3i+β4iDEM4i+εi。
(5)
然后對其地理加權逐步回歸所得的每個環(huán)境變量的系數(shù)值在ArcGIS中可視化,這樣便能知道每個環(huán)境變量在不同的地理空間上對平均降水量的變化,GWR模型的每個環(huán)境影響因子的回歸系數(shù)顯示如圖2所示。
(3) 混合地理加權回歸模型 研究對地理加權回歸變量的空間變異性檢驗進行了分析(見表3)。由表3可知,海拔DIFF值為0.302 1,坡向DIFF值為1.281 1,得出這2個環(huán)境變量空間變異值較弱,因此將DEM與ASPECT設為全局變量,來提高模型模擬的精度,建立混合地理加權回歸模型:
yi=β0i+β1iSLOPEi+β2ASPECTi+
β3iNDVIi+β4DEMi+εi,
(6)
其中:常數(shù)項是變常量;DEM、ASPECT為全局變量;其余為局部變量,且存在較強的空間變異性。地理加權回歸模型的R2為0.826,調整的R2為0.804。
在GS+軟件中對3種回歸模型的回歸殘差進行半方差函數(shù)分析(見表4),由表4可以看出,3種回歸模型的各半方差函數(shù)的塊基比均小于25%,說明各回歸后的殘差存在比較強的空間自相關性,可以使用克里格對其進行空間插值。在ArcGIS中選擇合適的模型對殘差進行克里格插值,得到殘差的空間分布。
將氣象觀測點降水量數(shù)據(jù)分為2個部分(見圖1),一部分(80%的點)用于建模,另一部分(剩下的20%的點)用于驗證,選擇平均絕對誤差(MAE,mean absolute error)進行3種不同插值方法的插值精度的比較,評價指標為
(7)
其中:n為驗證站點的個數(shù);y1i為第i個站點的實際降水量值;yi2為第i個驗證站點的預測模擬值,值越接近于0說明模型精度越高[8-9],結果顯示mGWRK、GWK、RK方法的平均絕對誤差依次增大,表明其模擬精度依次降低,基于局部回歸的mGWRK插值精度最高。
對2015年12個月的月平均降水量利用混合地理加權回歸克里格方法進行插值,插值時選擇合適的局部變量、全局變量來進行插值研究,具體屬性設置見表6,得到的月平均降水量空間插值分布如圖3所示。
圖2 地理加權回歸系數(shù)Fig.2 Geographically weighted regression coefficient
表3 地理加權回歸模型變量空間變異性檢驗
表4 RK法殘差半變異函數(shù)模型對比
表5 RK、GWRK、mGWRK方法插值精度
由圖3可知,2015年新疆瑪納斯河流域全年降水量分布不均勻,雨量較為稀少,降水量主要分布在夏季,其次是春季,秋季、冬季降水量偏少。降水主要集中在4月至8月,期間降水量占全年降水量的60%,其中7月降水量最多;瑪納斯河流域降水量總體上與我國西北地區(qū)氣候變化趨勢相一致。
表6 mGWRK模型回歸變量屬性設置
圖3 月平均降水量空間分布Fig.3 Monthly average precipitation spatial distribution
研究選取新疆瑪納斯河流域為研究對象,該研究區(qū)地形地貌復雜多變。以2015年整年的月平均降水量為例,采用回歸克里格(RK)、地理加權回歸克里格(GWRK)、混合地理加權回歸克里格(mGWRK)3種方法對其進行了插值。結果表明,研究采用的混合地理加權回歸模型降水量插值精度優(yōu)于回歸克里格和地理加權回歸克里格,由于在實際的應用中并不是所有的回歸變量在空間上都存在空間變異性。因此便需要對不同的回歸關系設置回歸變量的不同屬性,即局部還是全局回歸變量,這樣才能正確表達模型中回歸變量與因變量的空間關系,最后分析利用混合地理加權回歸克里格模型對2015年全年降水量插值的空間分布結果。