何立恒,鮑其勝,王 慶
(1.南京大學(xué)地理與海洋科學(xué)學(xué)院,江蘇南京210046;2.南京林業(yè)大學(xué)土木工程學(xué)院,江蘇南京210037;3.南京市測繪勘察研究院有限公司,江蘇南京210019)
在地理空間信息領(lǐng)域,為了獲得空間信息,需要實(shí)測空間數(shù)據(jù),而實(shí)測的空間數(shù)據(jù)往往是離散點(diǎn)的形式,或者是分區(qū)數(shù)據(jù)的形式[1],這些實(shí)測的空間數(shù)據(jù)集被稱為已知的空間樣本,實(shí)測的點(diǎn)則被稱為已知樣本點(diǎn)。即使實(shí)測空間數(shù)據(jù)達(dá)到相當(dāng)?shù)拿芏?,也不足以表示?fù)雜的地理空間形態(tài),亦即常規(guī)方法無法對地理空間中所有點(diǎn)進(jìn)行觀測,因此需要通過空間內(nèi)插來增補(bǔ)表達(dá)地理空間的空間數(shù)據(jù)。
空間數(shù)據(jù)內(nèi)插是用實(shí)測的空間數(shù)據(jù)來估算(預(yù)測)未知空間數(shù)值的過程[2]。根據(jù)已知的離散點(diǎn)數(shù)據(jù)或已知的分區(qū)數(shù)據(jù)來估計(jì)(推算)任意點(diǎn)或區(qū)域數(shù)據(jù)的方法稱為空間內(nèi)插,前者稱為點(diǎn)內(nèi)插,后者稱為面內(nèi)插[3]。通過內(nèi)插可以生成或補(bǔ)充已知數(shù)據(jù)的不足,廣泛應(yīng)用于等值線制作、高程模型建立、數(shù)據(jù)格網(wǎng)化和地理區(qū)域空間分析與比較研究等。
1970年,美國地理學(xué)家W.R.Tobler提出地理學(xué)第一定律,指出“任何事物都是與其他事物相關(guān)的,但是距離近的事物比距離遠(yuǎn)的事物相關(guān)性強(qiáng)”,這也是一切空間內(nèi)插方法的依據(jù)[4]??臻g內(nèi)插方法眾多,各方法又有其本身的諸多前提、參數(shù)、適用范圍等,但從本質(zhì)上說,內(nèi)插均遵循的是臨近點(diǎn)之間具有相似性這一原則[5]。就目前的研究而言,大多數(shù)的內(nèi)插是根據(jù)周圍的已知數(shù)據(jù),從這些已知數(shù)據(jù)推求一個函數(shù)關(guān)系式,使該關(guān)系式最好地逼近這些已知的空間數(shù)據(jù),并能根據(jù)該函數(shù)關(guān)系式推求出區(qū)域范圍內(nèi)其他任意點(diǎn)或任意分區(qū)的值[6]。通常被熟知和利用得較多的就是點(diǎn)內(nèi)插。
在空間點(diǎn)內(nèi)插時(shí),反距離加權(quán)插值(inverse distance weighting,IDW)具有計(jì)算相對簡單、操作便利等特點(diǎn),是常用的幾何內(nèi)插方法之一。該方法認(rèn)為與內(nèi)插點(diǎn)距離最近的若干個已知樣本點(diǎn)對內(nèi)插點(diǎn)值的貢獻(xiàn)最大,其貢獻(xiàn)大小與距離成反比[1-8]。其數(shù)學(xué)理論是加權(quán)平均,即將已知樣本點(diǎn)各數(shù)值乘以相應(yīng)的單位數(shù)(權(quán)數(shù)),然后加總求和得到總體值,再除以單位數(shù)之和。假設(shè)xi為已知樣本點(diǎn),wi為已知樣本點(diǎn)對應(yīng)的權(quán)數(shù),y為加權(quán)算術(shù)平均數(shù)(即預(yù)測值或內(nèi)插值),則加權(quán)算術(shù)平均數(shù)的計(jì)算公式為
反距離加權(quán)法中的權(quán)數(shù)wi由式(2)來確定,為
式中,PDi為內(nèi)插點(diǎn)與已知樣本點(diǎn)之間的距離;u為距離PDi的冪。
由式(1)和式(2)可得反距離加權(quán)平均數(shù)的計(jì)算公式為
反距離加權(quán)法中,需要考慮距離的冪和鄰域搜索范圍兩個影響因素[7]。Husar等[9]的研究結(jié)果表明,冪越高,內(nèi)插結(jié)果越具有平滑的效果。u即為控制參數(shù),u值越大,權(quán)重隨距離增大衰減得越快;反之,u越小,權(quán)重隨距離增大衰減得越慢,一般u取1~3[3]。同時(shí),在給定鄰域搜索范圍后,可利用的已知樣本點(diǎn)就具有確定性。從內(nèi)插方法的誤差公式可明顯得出,已知數(shù)據(jù)的間距大小是影響內(nèi)插精度的最重要因素,間距越小,精度越高[10]。
假定在內(nèi)插點(diǎn)所用的已知樣本點(diǎn)中,其中只有一個點(diǎn)距離內(nèi)插點(diǎn)很近,其他很多已知樣本點(diǎn)距離內(nèi)插點(diǎn)較遠(yuǎn),但這些較遠(yuǎn)的已知樣本點(diǎn)差不多都在同一位置(也可認(rèn)為是重復(fù)點(diǎn))。這種情形運(yùn)用反距離加權(quán)法將導(dǎo)致計(jì)算的內(nèi)插值不接近距離近點(diǎn)值。因此,探索新的加權(quán)因子,提高地理信息空間模擬的逼真性和合理性是非常必要的。
如圖1所示,假定已知樣本點(diǎn)A與內(nèi)插點(diǎn)P的距離為1個單位,點(diǎn)值為2.00,另10個已知樣本點(diǎn)B1、B2、…、B10與內(nèi)插點(diǎn) P 的距離為10個單位,點(diǎn)值均為20.00。B系列點(diǎn)是彼此很近的點(diǎn)或者就是重復(fù)點(diǎn),為了更好地反映重復(fù)點(diǎn)的影響,這里取冪值u為1(以下計(jì)算均取冪值u為1),依反距離加權(quán)算法,利用式(3)計(jì)算P點(diǎn)的內(nèi)插點(diǎn)值為=11.00,此值相對靠近較遠(yuǎn)的B系列點(diǎn)的值,不接近距離近點(diǎn)A的值。
圖1 內(nèi)插點(diǎn)位圖1
實(shí)際上,由于點(diǎn)值為20.00的點(diǎn)基本在空間同一位置,相當(dāng)于重復(fù)點(diǎn)或者就是重復(fù)點(diǎn),在實(shí)際內(nèi)插作業(yè)中所發(fā)揮的作用應(yīng)類同于一個點(diǎn),則此時(shí)內(nèi)插點(diǎn)P的值應(yīng)為3.64,此內(nèi)插值接近較近點(diǎn)A點(diǎn)值。
探索既考慮已知樣本點(diǎn)與內(nèi)插點(diǎn)之間的距離,又考慮已知樣本點(diǎn)在內(nèi)插點(diǎn)周邊的方位分布和密度的加權(quán)因子,將解決上述問題。
在土方工程量計(jì)算的野外數(shù)據(jù)采集時(shí),地形規(guī)則的地區(qū),采點(diǎn)相對稀疏,而地形變化復(fù)雜的地區(qū),點(diǎn)位采集相對密集。除了距離這個因素影響內(nèi)插點(diǎn)外,再引入夾角作為定權(quán)要素,提出反距離夾角加權(quán)算法,可以解決已知樣本點(diǎn)在內(nèi)插點(diǎn)全圓方位上分布不均及已知樣本點(diǎn)疏密不勻?qū)?nèi)插值的影響。
距離定權(quán)方式不變,夾角則選擇以內(nèi)插點(diǎn)為頂點(diǎn),內(nèi)插點(diǎn)與所有已知樣本點(diǎn)所構(gòu)成的最小角為其權(quán)值。圖1 中,以P 點(diǎn)為頂點(diǎn),P 點(diǎn)與B1、B2、…、B10這10 個點(diǎn)中任意兩點(diǎn)所構(gòu)成的夾角顯然比P點(diǎn)與B1、B2、…、B10中任意一點(diǎn)和A點(diǎn)所構(gòu)成的夾角要小得多。引入距離和夾角作為定權(quán)因子,樣本點(diǎn)的權(quán)值計(jì)算公式為
式中,pαi為夾角權(quán)因子,取內(nèi)插點(diǎn)與已知樣本點(diǎn)和其余已知樣本點(diǎn)中的最小夾角;pDi為距離權(quán)因子,取內(nèi)插點(diǎn)到已知樣本點(diǎn)的距離。
由式(1)和式(4)得反距離夾角加權(quán)平均數(shù)計(jì)算公式為
假定的距離值及樣本點(diǎn)的點(diǎn)值不變,設(shè)P點(diǎn)與A點(diǎn)和B1~B10點(diǎn)所構(gòu)成夾角的最小角為120°,P點(diǎn)與B1、B2、…、B10中任意二點(diǎn)構(gòu)成的最小夾角為0.5°,代入式(5),可得利用反距離夾角加權(quán)法計(jì)算內(nèi)插點(diǎn)的點(diǎn)值約為2.07。
此值更接近較近點(diǎn)A的值,減弱甚至消除已知樣本點(diǎn)密度不均和在內(nèi)插點(diǎn)全圓方位分布不勻?qū)?nèi)插值的影響。
反距離夾角加權(quán)算法進(jìn)行幾何內(nèi)插的步驟如下:
1)設(shè)計(jì)內(nèi)插規(guī)則,確定內(nèi)插點(diǎn)的位置。在數(shù)據(jù)內(nèi)插處理中,一般是先設(shè)計(jì)內(nèi)插規(guī)則,內(nèi)插規(guī)則確定了內(nèi)插點(diǎn)的位置。DEM構(gòu)建、數(shù)據(jù)的格網(wǎng)化、圖像變換處理等都是先設(shè)計(jì)內(nèi)插規(guī)則。圖2即為規(guī)則格網(wǎng)DEM矢量數(shù)據(jù)內(nèi)插圖,離散點(diǎn)為已知樣本點(diǎn),方格頂點(diǎn)的值需內(nèi)插得出。
圖2 規(guī)則DEM內(nèi)插格網(wǎng)點(diǎn)及已知樣本點(diǎn)值圖
2)根據(jù)內(nèi)插點(diǎn)的數(shù)據(jù)特征,選定與內(nèi)插點(diǎn)具有相同數(shù)據(jù)特征的可利用已知樣本點(diǎn),圖2中所有離散點(diǎn)即為可利用已知樣本點(diǎn)。
3)在已知樣本點(diǎn)中選取某一內(nèi)插點(diǎn)的可用點(diǎn)集S,已知樣本點(diǎn)的選取可以根據(jù)距離和數(shù)量等因素來確定,選取的原則有兩個方面:一是已知樣本點(diǎn)的位置相對內(nèi)插點(diǎn)應(yīng)盡可能均勻分布;二是所選取的參與計(jì)算內(nèi)插值的已知樣本點(diǎn)數(shù)目應(yīng)該適當(dāng)。一般是以內(nèi)插點(diǎn)為圓心,給定搜索半徑,在搜索半徑內(nèi)找已知樣本中的該內(nèi)插點(diǎn)的可用點(diǎn)集S,總數(shù)為N;若不夠點(diǎn)數(shù),便加大搜索半徑,直至搜索半徑上限或顯示已知樣本點(diǎn)不夠。若是規(guī)則內(nèi)插,搜索半徑一般為規(guī)則內(nèi)插點(diǎn)間距的1~2倍,N≥3。
4)在S中選取任意已知樣本點(diǎn)Ni,計(jì)算此內(nèi)插點(diǎn)與已知樣本點(diǎn)Ni之間的距離Di,計(jì)算此內(nèi)插點(diǎn)與Ni和S中其余已知樣本N-1個點(diǎn)的夾角,在N-1個夾角值中篩選出最小值得αi。若出現(xiàn)樣本點(diǎn)重合或在同一方向線上,此夾角值為零。為了充分利用所有的樣本點(diǎn),避免夾角權(quán)值為零而影響Wi,可以將αi給定一微小值,如10-6。
5)重復(fù)步驟4),分別求此內(nèi)插點(diǎn)與點(diǎn)集S中其余N-1個已知樣本點(diǎn)間的距離D和最小夾角α。
6)利用式(5)計(jì)算內(nèi)插點(diǎn)的內(nèi)插值。
7)重復(fù)步驟3)—步驟6),直至所有內(nèi)插點(diǎn)的內(nèi)插值計(jì)算結(jié)束。
用不同的內(nèi)插方法對圖1和圖3—圖7進(jìn)行內(nèi)插值計(jì)算。假設(shè)圖中都只有一個點(diǎn)值為2.00的已知樣本點(diǎn)A,并與內(nèi)插點(diǎn)的距離都為1;其他已知樣本點(diǎn)B1—B10的值均為20.00,并與內(nèi)插點(diǎn)的距離為10或5;樣本點(diǎn)值的單位可以為米或其他,各方法計(jì)算出的內(nèi)插值的單位與樣本點(diǎn)值的單位相同;距離和角度的單位可以是任意長度單位和角度單位。計(jì)算結(jié)果見表1。
圖3 內(nèi)插點(diǎn)位圖3
圖4 內(nèi)插點(diǎn)位圖4
圖5 內(nèi)插點(diǎn)位圖5
圖6 內(nèi)插點(diǎn)位圖6
圖7 內(nèi)插點(diǎn)位圖7
在內(nèi)插理論中,當(dāng)內(nèi)插點(diǎn)正好位于已知樣本點(diǎn)位置時(shí),可認(rèn)為內(nèi)插特征值就是該已知樣本點(diǎn)值,亦即此點(diǎn)不需要內(nèi)插。設(shè)計(jì)實(shí)例用反距離夾角加權(quán)法進(jìn)行內(nèi)插時(shí),充分考慮到內(nèi)插點(diǎn)P接近已知樣本點(diǎn)A,這樣,可假定內(nèi)插真值接近A點(diǎn)值。從表1可以看出,相對于算術(shù)平均值法和反距離加權(quán)法,反距離夾角加權(quán)法內(nèi)插結(jié)果波動范圍小,也更接近假定內(nèi)插真值,而鄰近點(diǎn)值法的值只跟最近點(diǎn)值有關(guān),無論其他樣本點(diǎn)怎樣變化。當(dāng)已知樣本點(diǎn)少于3個或在全圓方位上分布均勻時(shí),反距離夾角加權(quán)法和反距離加權(quán)法推求的值是相等的。
表1 不同內(nèi)插算法計(jì)算結(jié)果表
空間內(nèi)插是用已知樣本點(diǎn)的數(shù)據(jù)來估算內(nèi)插點(diǎn)的數(shù)值過程,把離散數(shù)據(jù)轉(zhuǎn)換成規(guī)則數(shù)據(jù)或增加內(nèi)插數(shù)據(jù)。從反距離夾角加權(quán)算法應(yīng)用在地理信息空間數(shù)據(jù)內(nèi)插中可以看出,當(dāng)已知樣本點(diǎn)只有一個時(shí),該算法相當(dāng)于最鄰近值法;當(dāng)只有兩個已知樣本點(diǎn),或者多于兩個已知樣本點(diǎn)并且點(diǎn)位在全圓方位上分布均勻時(shí),夾角權(quán)相等,該算法相當(dāng)于反距離加權(quán)法;多于兩個已知樣本點(diǎn),但已知樣本點(diǎn)密度和方位分布不均,反距離夾角加權(quán)法能減弱甚至消除其影響,保證內(nèi)插值接近近點(diǎn)值。可以說,反距離夾角加權(quán)法是鄰近值法和反距離加權(quán)法的改進(jìn)和提伸,提出的距離加夾角的定權(quán)方法能有效減弱甚至消除在內(nèi)插過程中所選定的已知樣本點(diǎn)在內(nèi)插點(diǎn)全圓方位上分布不均及已知樣本點(diǎn)疏密不勻?qū)?nèi)插值的影響?;诩訖?quán)平均理論,提出的反距離夾角加權(quán)算法將廣泛應(yīng)用在建立DEM及圖像處理等地理空間信息數(shù)據(jù)內(nèi)插中。
[1]李新,程國棟,盧玲.空間內(nèi)插方法比較[J].地球科學(xué)進(jìn)展,2000,15(3):260-265.
[2]CHANG K T著,地理信息系統(tǒng)導(dǎo)論[M].陳健飛,等譯.北京:科學(xué)出版社,2003.
[3]汪學(xué)兵,柳玲,吳中福.空間內(nèi)插方法在GIS中的應(yīng)用[J].重慶建筑大學(xué)學(xué)報(bào),2004,26(1):35-39.
[4]湯國安,劉學(xué)軍,閭國年.數(shù)字高程模型及地學(xué)分析的原理與方法[M].北京:科學(xué)出版社,2005.
[5]李胤,楊武年,楊容浩,等.基于移動曲面擬合算法和加權(quán)平均算法的DEM內(nèi)插算法改進(jìn)[J].測繪,2010,33(4):168-171.
[6]朱求安,張萬昌,余鈞輝.基于GIS的空間插值方法研究[J].江西師范大學(xué)學(xué)報(bào):自然科學(xué)版,2004,28(2):183-188.
[7]秦濤,付宗堂.ArcGIS中幾種空間內(nèi)插方法的比較[J].物探化探計(jì)算技術(shù),2007,29(1):72-75.
[8]張靖.GIS空間內(nèi)插方法與應(yīng)用研究[D].呼和浩特:內(nèi)蒙古師范大學(xué),2008.
[9]HUSAR R B,F(xiàn)ALKE SR.Uncertainty in the Spatial Interpolation of PM10 Monitoring Data in Southern California[EB/OL].[2012-09-17].http:∥capita.Wustl.edu/CAPITA/CapitaReports/CaInterp/CaINTERP.html.
[10]胡海,游漣,胡鵬,等.數(shù)字高程模型內(nèi)插方法的分析和選擇[J].武漢大學(xué)學(xué)報(bào):信息科學(xué)版,2011,36(1):82-85.