肖城龍
(重慶市勘測院,重慶 401121)
基于ArcGIS的空間數(shù)據(jù)插值方法的研究與實驗
肖城龍*
(重慶市勘測院,重慶 401121)
應(yīng)用ArcGIS軟件,通過對反距離權(quán)重插值、克里金插值、樣條插值和自然鄰域插值進行實驗和評估,討論幾種插值方法的額特點、優(yōu)劣,同時對其中的不足提出自己的改進思路,并提出未來空間插值需要考慮和提高的方面。
空間插值;反距離;樣條;自然領(lǐng)域;克里金
空間插值是一種通過已知點或分區(qū)數(shù)據(jù),推求任意點或分區(qū)數(shù)據(jù)。即利用函數(shù)f(x)在某區(qū)間中若干點的函數(shù)值,制定適當(dāng)?shù)奶囟ê瘮?shù),在這些點上取已知值,在區(qū)間的其他點上用這特定函數(shù)的值作為函數(shù)f(x)的近似值。在已觀測點的區(qū)域內(nèi)推算未知的數(shù)據(jù)的過程稱為內(nèi)插;在已觀測點的區(qū)域外估算未觀測點的數(shù)據(jù)的過程稱為外推。
假定區(qū)間[a,b]上的實值函數(shù)f(x)在該區(qū)間上n+1個互不相同點x0,x1……xn處的值是f(x0),……f(xn),要求估算f(x)在[a,b]中某點x*的值。基本思路是,找到一個函數(shù)P(x),在x0,x1……xn的節(jié)點上與f(x)函數(shù)值相同(有時,甚至一階導(dǎo)數(shù)值也相同),用P(x*)的值作為函數(shù)f(x*)的近似。其通常的做法是:在事先選定的一個由簡單函數(shù)構(gòu)成的有n+1個參數(shù)C0,C1,……Cn的函數(shù)類Φ(C0,C1,……Cn)中求出滿足條件P(xi)=f(xi)(i=0,1,……n)的函數(shù)P(x),并以P()作為f()的估值。此處f(x)稱為被插值函數(shù),x0,x1,……xn稱為插值節(jié)點,Φ(C0,C1,……Cn)稱為插值函數(shù)類,上面等式稱為插值條件,Φ(C0,……Cn)中滿足上式的函數(shù)稱為插值函數(shù),R(x)=f(x)-P(x)稱為插值余項。當(dāng)估算點屬于包含x0,x1,……xn的最小閉區(qū)間時,相應(yīng)的插值稱為內(nèi)插,否則稱為外插。這兩種方法在GIS中的使用均十分普遍,一般來說,空間位置越靠近的點更有可能獲得與實際值相似的數(shù)據(jù),而空間位置越遠的點則獲得與實際值相似的數(shù)據(jù)的可能性越小。
中誤差(root mean square error,RMSE),相對中誤差(relative root mean square error,R-RMSE),對數(shù)中誤差(log root mean square error,L-RMSE),平均誤差(mean error,ME),標(biāo)準(zhǔn)差(standard deviation,SD),精度比率(accuracy ratio,AR)。RMSE由于計算簡單、易于理解而成為使用較為廣泛的精度模型,如美國USGS的各種分辨率DEM及英國OS DEM精度都是以RMSE衡量。RMSE并不反映單個誤差的大小,而是從整體意義上描述了地形參數(shù)和其真值的離散程度,因此,RMSE的真正價值在于它提供真值可能存在的范圍。
誤差統(tǒng)計模型的建立需要合理的誤差頻率分布假設(shè),RMSE假定誤差服從均值為零的正態(tài)分布,因此RMSE不能揭示誤差中的系統(tǒng)成分。RMSE可以反映利用樣本點數(shù)據(jù)的估計靈敏度和極值效應(yīng),標(biāo)準(zhǔn)差SD代替RMSE可以消除系統(tǒng)性誤差,AR則可以比較分析不同空間尺度、不同表面的空間數(shù)據(jù)參數(shù)精度。
本實驗運用ArcGIS軟件作為分析工具,版本為ArcGIS 9.3。ArcGIS是一款可提供地理數(shù)據(jù)顯示、制圖、管理、分析、創(chuàng)建和編輯的GIS桌面軟件。ArcView部分帶有數(shù)百種可進行空間分析和地理處理任務(wù)的工具,地理處理任務(wù)包括諸如圖層疊加、緩沖區(qū)分析和數(shù)據(jù)轉(zhuǎn)換等常規(guī)的GIS操作。ArcCatalog部分可以用來組織、管理和創(chuàng)建GIS數(shù)據(jù)。ArcView中的ArcToolbox工具箱中包含了實驗所需的反距離權(quán)重插值、克里金插值、樣條插值和自然鄰域插值工具。
數(shù)據(jù)來自國際科學(xué)數(shù)據(jù)服務(wù)平臺,通過提取部分DEM數(shù)據(jù)中的高程點作為原數(shù)據(jù)即已知數(shù)據(jù)。本實驗主要是對幾種插值算法做比較,故為方便處理,提高效率,對下載的DEM數(shù)據(jù)進行處理,得到如圖1的原始數(shù)據(jù)和如圖2高程點數(shù)據(jù)。
圖1 DEM數(shù)據(jù) 圖2 提取出的高程
先對插值結(jié)果圖和原始數(shù)據(jù)圖做如圖3~圖5比較:
圖3中從左至右依次為原始數(shù)據(jù)、反距離插值、克里金插值、規(guī)則樣條插值、張力樣條和自然鄰域插值。從整體上幾種插值均保持了原來數(shù)據(jù)的基本特征,數(shù)據(jù)比較集中在50 m~70 m段,有一定的科學(xué)性,其中克里金插值效果相對其他幾種較平滑。圖4是原數(shù)據(jù)柱狀拉伸統(tǒng)計圖,圖5從左至右依次為反距離插值、克里金插值、規(guī)則樣條、張力樣條和自然鄰域插值,因為拉伸模型都相同,所以具有可比性,從圖中也可以看出,克里金插值的數(shù)據(jù)起伏波動較大。反距離插值效果和樣條插值數(shù)值特征從整體上所得的數(shù)據(jù)特征基本一致,自然鄰域最接近原始數(shù)據(jù)的數(shù)值分布特征。
圖3 插值效果圖比較
圖4 原數(shù)據(jù)柱狀拉伸統(tǒng)計圖
以上是對插值結(jié)果數(shù)值統(tǒng)計的對比分析,下面引入檢測點,采用精度模型進行評價,表1是檢驗點高程值和插值后的高程值統(tǒng)計表。
帶入精度評價模型評價時,值得注意的是反距離權(quán)重插值等確定性插值只依賴于數(shù)學(xué)模型,其驗證標(biāo)準(zhǔn)只有中誤差,而統(tǒng)計類的有多種評價體系。一般來說中誤差最小,平均誤差接近于中誤差,標(biāo)準(zhǔn)差接近于0結(jié)果最好。我們用前面給出的幾種評估模型計算如表2所示:
插值檢驗數(shù)據(jù)統(tǒng)計 表1
續(xù)表1
插值精度比較 表2
從表中可以看出幾種插值的中誤差、相對中誤差和指數(shù)中誤差是張力樣條函數(shù)較小,規(guī)則樣條函數(shù)的平均誤差和精度比率最?。豢死锝鸩逯档闹姓`差和平均誤差最大,說明克里金插值結(jié)果波動性很大;比較而言,對于該高程數(shù)據(jù),樣條插值的效果會更好。
結(jié)合幾種插值算法的參考和本次實驗,對幾種插值的特點做以下描述:反距離加權(quán)法直觀并且效率高,在已知點分布均勻的情況下插值效果好,插值結(jié)果在用于插值數(shù)據(jù)的最大值和最小值之間,但缺點是易受極值的影響??死锝鸱椒ǖ年P(guān)鍵在于權(quán)重系數(shù)的確定,該方法在插值過程中根據(jù)某種優(yōu)化準(zhǔn)則函數(shù)來動態(tài)地決定變量的數(shù)值,從而使內(nèi)插函數(shù)處于最佳狀態(tài)。克里金方法考慮了觀測的點和被估計點的位置關(guān)系,并且也考慮各觀測點之間的相對位置關(guān)系,在點稀少時插值效果比反距離權(quán)重等方法要好。所以利用克里金方法進行空間數(shù)據(jù)插值往往取得理想的效果??死锝鹚惴ㄌ峁┑陌胱儺惡瘮?shù)模型有高斯、線形、球形、阻尼正弦和指數(shù)模型等,在對氣象要素場插值時球形模擬比較好。樣條函數(shù)適用于逐漸變化的曲面,如溫度、高程、地下水位高度或污染濃度等。該方法優(yōu)點是易操作,計算量不大,缺點是難以對誤差進行估計,采樣點稀少時效果不好。自然鄰域插值以Voronoi圖為幾何基礎(chǔ),較好地反映數(shù)據(jù)的局部相關(guān)性,適用于實際資料有限、數(shù)據(jù)復(fù)雜的建模,但有效的插值范圍相對較小。當(dāng)然對空間插值而言,沒有絕佳的插值方法,只有在針對某一數(shù)據(jù)采用多種插值方法比較下選擇出來的適用方法。
對于以上幾種插值的不同特點,我們另外提出多級空間插值。其思路是先將整體空間數(shù)據(jù)集按照相應(yīng)規(guī)則劃分為若干局部區(qū)域;然后提取各局部區(qū)域的空間數(shù)據(jù)特征;再根據(jù)局部數(shù)據(jù)特征與算法匹配規(guī)則,選擇相適應(yīng)的算法及參數(shù)對局部區(qū)域進行插值運算;如果繼續(xù)進行局部插值,則將各局部數(shù)據(jù)集合并為更大范圍的局部數(shù)據(jù)集,回到步驟2,如果選擇結(jié)束則利用整體插值方法對局部數(shù)據(jù)集的插值結(jié)果進行再次插值,得到插值后的復(fù)雜空間數(shù)據(jù)集。這其中,可以將不同的插值模型混合使用,已取得良好插值效果。
一個行之有效而科學(xué)快速的插值方法相比采集同等的數(shù)據(jù)節(jié)約了大量的人力物力,顯得更具現(xiàn)實意義。雖然目前空間數(shù)據(jù)無論從數(shù)據(jù)采集還是數(shù)據(jù)插值技術(shù)上都相對完備,但要滿足未來需求,還需做下面幾個方面的考慮:一是提高算法的魯棒性和全自動性:在應(yīng)用GIS處理空間數(shù)據(jù)時,不同數(shù)據(jù)格式的訪問,如何指定數(shù)據(jù)魯棒性、指定插值方法以及如何以全自動方式選擇參數(shù)的問題,成為實際應(yīng)用中迫切需要解決的問題之一。二是多源數(shù)據(jù)集成:不同來源的數(shù)據(jù)其分辨率、精度、分布等情況不同,需要用新的數(shù)據(jù)處理方法和集成方法來優(yōu)化提取多源數(shù)據(jù)信息。三是多尺度建模和多維表達:新型多時空尺度模擬方法正在不斷發(fā)展中,多維數(shù)據(jù)技術(shù)的綜合集將促進多變元應(yīng)用的發(fā)展。最后值得一提的是精度、實用性以及計算效率是空間插值技術(shù)的根本,這是在研究整個空間數(shù)據(jù)插值技術(shù)過程都必須考慮的因素。
[1] 胡鵬,黃杏元,華一新. 地理信息系統(tǒng)教程[M]. 武漢大學(xué)出版,2005(8);7~8,117~120.
[2] 湯國安,劉學(xué)軍,閭國年. 數(shù)字高程模型及地學(xué)分析的原理與方法[M]. 科學(xué)出版社,2005(8);17,188~189.
[3] 孟耀偉,梁衡,程菊明. 多級空間數(shù)據(jù)插值及其應(yīng)用方法[J]. 許昌學(xué)院學(xué)報,2010(9).
[4] 王穎,祝民強,喬康寧. 航測數(shù)據(jù)處理中空間插值方法[J]. 測繪與空間地理信息,2011(2).
[5] Stephen J.Jeffrey,Using spatial interpolation to construct a comprehensive archive of Australian climate data[J]. Environment Modeling & Software,2001(16):309~330.
[6] Trevor C.Bailey,Interactive spatial data analysis[C]. University of Exter.
[7] 郭艷軍,潘懋,燕飛等. 自然鄰點插值方法在三維地質(zhì)建模中的應(yīng)用[J]. 解放軍理工大學(xué)學(xué)報,2009(12).
TheStudyandExperimentofSpatialDataInterpolationBasedonArcGIS
Xiao Chenglong
(Chongqing Survey Institute,Chongqing 401121,China)
Thispaper applicateseveralcommonly usedinterpolation methods(inverse distance weighted interpolation,kriginginterpolation,spline interpolation andnatural neighborinterpolation),interpolationexperiment based on ArcGIS. Assessmentoftheresultsto discussthecharacteristicsoftheamountofseveralinterpolation methods,the pros and cons,onthelack ofimprovementideas,and suggest wherespatial interpolationneed to be consideredand improved.
spatial interpolation;IDW;spline;natural neighbor;kriging
1672-8262(2017)06-71-04
P208.1
A
2017—03—09
肖城龍(1987—),男,助理工程師,主要從事測繪地理信息工作。