(1.南京工業(yè)大學(xué) 測(cè)繪科學(xué)與技術(shù)學(xué)院,江蘇 南京 211816; 2.大連市勘察測(cè)繪研究院有限公司,遼寧 大連 116021)
徑向基函數(shù)插值(Radial Basis Functions, RBF)為典型的精確性插值算法,它要求插值表面經(jīng)過(guò)所有已知采樣點(diǎn),插值表面比較平滑,在DEM建模[1-3]、巖體變形[4]、水文預(yù)報(bào)[5]中獲得有效應(yīng)用。選用合適的徑向基插值參數(shù)是保證DEM插值效果的前提,為此一些學(xué)者對(duì)其進(jìn)行了深入研究。和嫻等對(duì)不同地形條件下徑向基核函數(shù)的適用性進(jìn)行了探討[6]。對(duì)于光滑因子取值而言,相關(guān)文獻(xiàn)提出了數(shù)值近似表達(dá)法[2,7-8]、交叉驗(yàn)證法[9]、遞歸算法[10]等,文獻(xiàn)[11]根據(jù)地貌類型、采樣密度和插值算法對(duì)規(guī)則格網(wǎng)精度影響的研究,認(rèn)為多重二次曲面和多重對(duì)數(shù)徑向基函數(shù)應(yīng)使用接近于零的光滑因子,反多重二次曲面、自然三次樣條曲面和薄板樣條曲面徑向基函數(shù)則應(yīng)使用非常大的光滑因子。對(duì)于徑向基搜索方式,張錦明等采用ASTER GDEM數(shù)據(jù)源基于多重對(duì)數(shù)徑向基函數(shù)對(duì)搜索方向和搜索點(diǎn)數(shù)進(jìn)行實(shí)驗(yàn)分析,結(jié)果表明光滑因子為零時(shí),采用四方向并適當(dāng)增加搜索點(diǎn)數(shù)對(duì)提高插值精度更有效[12]。
不同地貌類型區(qū)適用不同類型核函數(shù),那么不同類型核函數(shù)在搜索方式設(shè)置上是否存在差異值得研究。為此,本文在上述研究基礎(chǔ)上,擬對(duì)常用的5種徑向基核函數(shù)插值時(shí)搜索方向和搜索點(diǎn)數(shù)進(jìn)行優(yōu)選分析,以消除搜索方式參數(shù)設(shè)置的不確定性,從而為DEM徑向基插值參數(shù)選擇提供參考和指導(dǎo)。
本文選用平原、丘陵和山地3種不同地貌類型區(qū),其地形特征描述參數(shù)如表1所示。從表1中可以看出,實(shí)驗(yàn)所選取的3個(gè)樣區(qū)地表高程集中于平均數(shù)附近,平原和丘陵地區(qū)處于正偏度狀態(tài),山地地區(qū)高程差值最大,處于負(fù)偏度狀態(tài)。實(shí)驗(yàn)數(shù)據(jù)為1∶2 000地形圖矢量散點(diǎn)和等高線。
徑向基函數(shù)算法是一系列精確插值方法的組合,這種插值方法類似于將橡膠膜的徑向基表面穿過(guò)各個(gè)已知采樣點(diǎn),并保證表面的總曲率最小[13]。徑向基核函數(shù)在插值過(guò)程中決定采樣點(diǎn)權(quán)重分配方案,對(duì)插值效果有著重要影響[14-15]。本文選用常用的5種核函數(shù)(見(jiàn)表2)進(jìn)行實(shí)驗(yàn)分析。式中,h為由點(diǎn)(x,y)到第i個(gè)數(shù)據(jù)點(diǎn)的距離;R2為用戶指定的平滑因子,平滑因子越大,山頂?shù)雀呔€則越平滑。5種核函數(shù)都是準(zhǔn)確的插值器,都能適應(yīng)本實(shí)驗(yàn)中的離散采樣點(diǎn)數(shù)據(jù)。
表1 實(shí)驗(yàn)樣區(qū)地形描述參數(shù)統(tǒng)計(jì)Tab.1 The description of study sites
表2 常用5種徑向基核函數(shù)Tab.2 The five frequently-used RBF kernel functions
2.2.1搜索點(diǎn)數(shù)實(shí)驗(yàn)設(shè)計(jì)
搜索點(diǎn)數(shù)(Search Point)是指參與內(nèi)插計(jì)算的采樣點(diǎn)個(gè)數(shù)。在對(duì)參與計(jì)算的采樣點(diǎn)進(jìn)行選擇時(shí),應(yīng)考慮所選點(diǎn)是否具有代表性,同時(shí)也要避免選擇過(guò)多采樣點(diǎn)參與計(jì)算,從而造成插值速度變慢。內(nèi)插過(guò)程中,無(wú)論是搜索半徑控制,還是搜索方向限制,究其本質(zhì)都是為了控制參與計(jì)算采樣點(diǎn)個(gè)數(shù)的問(wèn)題。所以,搜索點(diǎn)數(shù)選擇也是影響內(nèi)插質(zhì)量重要因素之一,最優(yōu)搜索點(diǎn)數(shù)范圍也應(yīng)隨地貌類型區(qū)的差異而改變。
為了探究徑向基插值中最優(yōu)搜索點(diǎn)數(shù),實(shí)驗(yàn)中采用固定搜索方向和光滑因子,搜索點(diǎn)數(shù)設(shè)置包括兩個(gè)方面:一是單向改變上、下限值,即固定上限減小下限和固定下限增大上限;二是雙向改變上、下限值,即同時(shí)增大上、下限和同時(shí)減小上、下限。基于上述實(shí)驗(yàn)方案研究搜索點(diǎn)數(shù)對(duì)插值效果的影響,探尋不同地形條件下搜索點(diǎn)數(shù)最優(yōu)參數(shù)范圍。
2.2.2搜索方向?qū)嶒?yàn)設(shè)計(jì)
搜索方向(Search Direction)是指在搜索采樣點(diǎn)時(shí)增加考慮方向因素。當(dāng)采樣點(diǎn)呈不規(guī)則分布時(shí),預(yù)測(cè)點(diǎn)周?chē)赡艹霈F(xiàn)某個(gè)方向采樣點(diǎn)不足,而另一個(gè)方向采樣點(diǎn)過(guò)量的現(xiàn)象,從而對(duì)內(nèi)插效果產(chǎn)生影響。因此,限制搜索方向可以盡可能地滿足各個(gè)方向?qū)Σ蓸狱c(diǎn)數(shù)量的要求。
DEM插值精度與搜索方向關(guān)系密不可分,傳統(tǒng)的空間插值很少考慮各個(gè)方向變化,通常在進(jìn)行DEM 內(nèi)插時(shí),默認(rèn)選擇四方向搜索。但是不同地形條件對(duì)搜索方向敏感度具有較大差異,并非所有地貌類型都適合四方向搜索。因此在進(jìn)行空間內(nèi)插時(shí),需要考慮不同搜索方向?qū)?nèi)插結(jié)果的影響。本次實(shí)驗(yàn)分別從無(wú)方向、四方向、四方向45°旋轉(zhuǎn)、八方向等四個(gè)搜索方向進(jìn)行內(nèi)插計(jì)算,進(jìn)而探討搜索方向?qū)?nèi)插精度的影響,尋找適合不同地形條件的最佳搜索方式組合(見(jiàn)圖1)。
圖1 搜索方向?qū)嶒?yàn)設(shè)計(jì)Fig.1 The search directions for the experiment
2.2.3精度評(píng)價(jià)方案
考慮到 DEM 中誤差(RMSE: root mean square error)是目前通用的DEM 質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn),本文將RMSE作為評(píng)價(jià)DEM內(nèi)插精度的主要指標(biāo)。該方法可以從整體意義上描述地形參數(shù)與其真值的離散程度,中誤差越小,預(yù)測(cè)值越接近真實(shí)值,模擬效果越好。中誤差的計(jì)算公式為
(1)
式中,zk為假設(shè)預(yù)留樣本點(diǎn)的實(shí)際高程,ZK為內(nèi)插DEM上對(duì)應(yīng)預(yù)測(cè)點(diǎn)的高程值,n為布設(shè)檢驗(yàn)點(diǎn)的個(gè)數(shù)。
(1) 根據(jù)插值需要,將每個(gè)實(shí)驗(yàn)樣區(qū)原始等高線數(shù)據(jù)進(jìn)行預(yù)處理得到離散采樣點(diǎn),并將其分為訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集兩部分,其中85%采樣點(diǎn)作為訓(xùn)練數(shù)據(jù)集生成插值表面,預(yù)留15%采樣點(diǎn)作為測(cè)試數(shù)據(jù)集,用以評(píng)測(cè)插值精度。平原區(qū)、丘陵區(qū)和山地區(qū)訓(xùn)練數(shù)據(jù)集點(diǎn)數(shù)分別為6 735,15 538,42 752,測(cè)試數(shù)據(jù)集點(diǎn)數(shù)分別為1 189,2 742,7 545。
(2) 根據(jù)實(shí)驗(yàn)方案中搜索點(diǎn)數(shù)和搜索方向不同取值,使用訓(xùn)練數(shù)據(jù)集應(yīng)用上述5種徑向基核函數(shù)分別建立5 m分辨率的格網(wǎng)DEM;然后將預(yù)留樣本點(diǎn)作為檢查點(diǎn),計(jì)算殘差值,并生成每個(gè)實(shí)驗(yàn)樣區(qū)殘差中誤差值。
(3) 分析探討不同實(shí)驗(yàn)樣區(qū)搜索點(diǎn)數(shù)和搜索方向?qū)EM徑向基插值精度的影響規(guī)律,在此基礎(chǔ)上確定搜索方式的最優(yōu)取值區(qū)間。
在進(jìn)行搜索點(diǎn)數(shù)分析實(shí)驗(yàn)時(shí),搜索方向采用常用默認(rèn)的四方向搜索,同時(shí)不考慮光滑因子的影響,即將光滑因子值設(shè)定為0。
3.1.1單向改變搜索點(diǎn)數(shù)上下限值
一方面固定搜索點(diǎn)數(shù)上限值為15,不斷減小下限值,分別設(shè)置為3~15,7~15,10~15,13~15;另一方面固定搜索點(diǎn)數(shù)下限值為10,不斷增大上限值,分別設(shè)置為10~15,10~18,10~21,內(nèi)插生成3種地形樣區(qū)5 m分辨率的DEM,其中誤差值變化如圖2所示。
(1)當(dāng)降低搜索點(diǎn)數(shù)下限值時(shí),同種徑向基核函數(shù)在同一地形樣區(qū)中得到的DEM高程中誤差值變化較小,但在不同地貌類型區(qū)中得到的DEM高程中誤差值則存在顯著差別。其中,5種徑向基核函數(shù)在平原樣區(qū)得到的高程中誤差值均小于其他地貌類型區(qū),中誤差最大值都出現(xiàn)在山地樣區(qū)。針對(duì)地貌類型區(qū)而言,平原樣區(qū)中,5種徑向基核函數(shù)得到的DEM高程中誤差值大小順序?yàn)門(mén)PSF=NCSF (2)當(dāng)增大搜索點(diǎn)數(shù)上限值時(shí),同種徑向基核函數(shù)在同一地形樣區(qū)中生成的DEM高程中誤差值存在差異,但并沒(méi)有呈現(xiàn)單調(diào)遞增或單調(diào)遞減的趨勢(shì)。MQF在山地樣區(qū)中誤差值減小,而NCSF在平原樣區(qū)當(dāng)上限值為21時(shí)中誤差值急劇上升,MLF在平原樣區(qū)中誤差值增加幅度顯著,IMQF在三種地形樣區(qū)中誤差值都出現(xiàn)不同幅度上升;相對(duì)地,TPSF對(duì)搜索上限值變化靈敏度較差。針對(duì)地貌類型區(qū)方面,平原樣區(qū)中, TPSF與MQF中誤差受搜索點(diǎn)數(shù)上限值影響較小,并且其值遠(yuǎn)小于另外3種核函數(shù);丘陵樣區(qū)中,TPSF和NCSF中誤差值較小并且基本保持不變,MQF中誤差值隨搜索點(diǎn)上限值增加降低明顯,插值精度與TPSF和NCSF近乎相同;山地樣區(qū)中,TPSF始終最小并且遠(yuǎn)小于其它核函數(shù)。 3.1.2雙向改變搜索點(diǎn)數(shù)上下限值 將搜索點(diǎn)數(shù)上、下限值分別以15,10為基準(zhǔn),調(diào)節(jié)步數(shù)為2,得到6組搜索點(diǎn)數(shù),即4~9,6~11,8~13,10~15,12~17,14~19,16~21。研究該系列搜索點(diǎn)數(shù)對(duì)不同地貌類型區(qū)DEM插值精度的影響,DEM高程中誤差值統(tǒng)計(jì)結(jié)果如圖3所示。 (1) 平原樣區(qū)中搜索點(diǎn)數(shù)雙向改變對(duì)MQF和NCSF插值效果影響不大,高程中誤差值均控制在0.3 m以下;當(dāng)鄰域搜索點(diǎn)上限值達(dá)到21時(shí),MLF和TPSF內(nèi)插得到的高程中誤差值會(huì)驟增;IMQF在該樣區(qū)插值結(jié)果幾乎呈線性增加趨勢(shì),隨著搜索點(diǎn)數(shù)上限值增加中誤差值不斷變大。 (2) 丘陵樣區(qū)中,MQF插值精度隨內(nèi)插點(diǎn)數(shù)增多得到有效提高,TPSF、NCSF和MLF,無(wú)論搜索點(diǎn)數(shù)增加或減少,中誤差值變動(dòng)幅度均較小,相比較而言,TPSF和NCSF插值效果更優(yōu)。 (3) 山地樣區(qū)中,隨著搜索點(diǎn)數(shù)增加,MQF中誤差值總體上得到有效降低,是該樣區(qū)徑向基插值核函數(shù)的首選;NCSF和TPSF插值精度也得到一定程度的提高,MLF中誤差值基本保持穩(wěn)定,而IMQF插值精度卻逐漸降低。 圖2 單向改變搜索點(diǎn)數(shù)對(duì)DEM插值精度的影響Fig.2 The impacts on DEM accuracy when either the maximum or minimum of search point number is changed 圖3 雙向改變搜索點(diǎn)數(shù)對(duì)DEM插值精度的影響Fig.3 The impacts on DEM accuracy when both the maximum and minimum of search point number are changed 圖4 搜索方向?qū)EM插值精度的影響,橫坐標(biāo)為搜索方向Fig.4 The impacts on DEM accuracy when different search directions are applied 在進(jìn)行搜索方向分析實(shí)驗(yàn)時(shí),搜索點(diǎn)數(shù)采用常用10~15個(gè),同時(shí)不考慮光滑因子的影響,即將光滑因子值設(shè)定為0,采用無(wú)方向、四方向、四方向45°旋轉(zhuǎn)和八方向搜索進(jìn)行徑向基函數(shù)插值,生成的DEM中誤差如圖4所示。 (1) 平原樣區(qū)中,搜索方向?qū)Σ逯到Y(jié)果影響較小,整體上DEM高程中誤差值小于其他樣區(qū);當(dāng)搜索方向改變時(shí),MQF、TPSF、NCSF高程中誤差值相對(duì)穩(wěn)定,均保持在0.3 m以下;對(duì)于MLF和IMQF而言,當(dāng)進(jìn)行無(wú)方向和四方向45°旋轉(zhuǎn)搜索時(shí),二者具有相對(duì)較高的中誤差值,當(dāng)使用四方向以及八方向搜索時(shí),二者與另外三種核函數(shù)相比,插值精度仍然表現(xiàn)較差,但相對(duì)而言可以將插值效果控制在較為理想的范圍。 (2) 丘陵樣區(qū)中,TPSF和NCSF插值精度受搜索方向影響較小,二者高程中誤差值均在0.5 m以下并且近乎相同;IMQF中誤差值遠(yuǎn)高于其他核函數(shù),同時(shí)在不同搜索方向變化很?。籑LF和MQF在無(wú)方向以及四方向45°旋轉(zhuǎn)搜索時(shí)插值精度表現(xiàn)優(yōu)良,中誤差值在0.5 m左右,當(dāng)使用四方向以及八方向搜索時(shí),MLF中誤差值達(dá)到1.3 m和1.1 m,MQF中誤差值均在0.8 m左右。 (3) 山地樣區(qū)中,IMQF表現(xiàn)出較差的內(nèi)插效果,其中誤差值在各個(gè)搜索方向均超過(guò)1.0 m,當(dāng)使用無(wú)方向搜索時(shí)高達(dá)1.5 m;MQF較其他四種徑向基核函數(shù)的插值精度最優(yōu),在四方向45°旋轉(zhuǎn)搜索時(shí)高程中誤差值為0.5 m,較其它搜索方向降低幅度明顯; 而MLF、TPSF和NCSF插值精度受搜索方向影響并不顯著。 (1) 單向改變搜索點(diǎn)數(shù)下限值時(shí),所有核函數(shù)內(nèi)插生成的DEM高程中誤差值基本穩(wěn)定;當(dāng)增加搜索點(diǎn)數(shù)上限值時(shí),只有MQF在3種地形樣區(qū)中插值精度得到不同程度的提高,其他核函數(shù)中誤差值保持不變甚至增大。 (2) 當(dāng)同時(shí)增加搜索點(diǎn)數(shù)上下限時(shí),不同核函數(shù)插值精度在3種地形樣區(qū)呈現(xiàn)出不同變化特點(diǎn)。 (3) 當(dāng)改變搜索方向時(shí),除TPSF和NCSF中誤差值變化較小外,另外3種核函數(shù)在不同樣區(qū)也具有各自的變化規(guī)律。 綜合而言,為獲取更好的插值效果,建議平原樣區(qū)使用NCSF或TPSF核函數(shù),NCSF搜索點(diǎn)數(shù)上限值為18,TPSF搜索點(diǎn)數(shù)上限值為21;丘陵樣區(qū)同樣宜采用NCSF或TPSF核函數(shù),二者搜索點(diǎn)數(shù)上限值控制在14~21之間;山地樣區(qū)適宜采用MQF或TPSF核函數(shù)插值,MQF采用四方向45°旋轉(zhuǎn)搜索,搜索點(diǎn)數(shù)上下限值設(shè)置為16~21,而TPSF采用常用的四方向搜索,搜索點(diǎn)數(shù)可為默認(rèn)10~15個(gè),單向改變搜索點(diǎn)數(shù)對(duì)插值精度影響較小。3.2 搜索方向?qū)EM插值精度的影響
4 結(jié) 論