潘正高,趙晉陵
1.宿州學院安徽省農(nóng)業(yè)生態(tài)大數(shù)據(jù)工程實驗室宿州實驗室,安徽宿州,234000;2.安徽大學農(nóng)業(yè)生態(tài)大數(shù)據(jù)分析與應用技術(shù)國家工程研究中心,安徽合肥,230601
土壤養(yǎng)分是土壤提供植物生長所必需的營養(yǎng)元素[1-3]。了解土壤養(yǎng)分的空間分布是開展土壤試驗和配方施肥,開展精準農(nóng)業(yè)的基礎(chǔ)。緩效鉀是存在于土壤層狀硅酸鹽礦物層間的一些鉀離子,屬于非交換性鉀,是土壤有效鉀的一部分。土壤中的緩效鉀是速效鉀的儲備,當土壤中速效鉀由于作物吸收而減少時,緩效鉀就會釋放出來以補充速效鉀的缺失[4]。由于土壤養(yǎng)分分布的復雜性和樣本數(shù)據(jù)的局限性,依靠傳統(tǒng)的現(xiàn)場測量難以了解整個研究區(qū)域的養(yǎng)分分布情況??臻g插值技術(shù)可以從離散的地面真實數(shù)據(jù)中得到空間分布趨勢,極大地促進了大規(guī)模評價土壤養(yǎng)分的工作[5]。
空間插值分析是地理信息系統(tǒng)(GIS,Geographic Information System) 中常用的空間分析方法,也是GIS系統(tǒng)區(qū)別于其他信息系統(tǒng)的重要特征之一[6-7]??臻g位置距離已知觀測點越近,特征值越接近;空間位置距離已知觀測點越遠,其特征值越不可能相似。這是空間插值技術(shù)最基本的理論假設[8]。在這一理論假設的基礎(chǔ)上,學者們提出了反距離加權(quán)插值、克里金插值、樣條函數(shù)插值、趨勢曲面插值等多種插值方法。
一般情況下,研究者需要根據(jù)樣本數(shù)據(jù)的分布特點選擇不同的插值方法。本文以土壤養(yǎng)分中的緩效鉀(SAK,Slowly Available Potassium)為研究對象, 對不同插值分析方法的有效性進行比較研究,以期找出土壤中SAK的最優(yōu)插值方法。
本文收集了宿州市埇橋區(qū)農(nóng)村麥田土壤養(yǎng)分數(shù)據(jù)。采用網(wǎng)格單點采樣方法,利用亞米高分辨率GPS接收機對采樣點進行精確定位,共收集178個樣本點。利用GIS軟件ArcGIS[9]將GPS測得的采樣點記錄坐標轉(zhuǎn)換為空間坐標的空間點,并進行投影變換,生成含有緩效鉀養(yǎng)分含量信息的樣本分布。
反距離加權(quán)(IDW)插值法是使用一組采樣點的權(quán)值的線性組合來確定像素點的值[10]。權(quán)值是一個逆距離函數(shù),其函數(shù)表達式如式(1)(2)所示。
(1)
(2)
其中,ve是與采樣點(xi,yi)相關(guān)的變量值,λi是權(quán)重系數(shù),p是指數(shù)值,di0是預測點s0與已知樣點si之間的距離。樣點在預測點值的計算過程中所占權(quán)重的大小受參數(shù)p的影響,也就是說,隨著采樣點與預測值之間距離的增加,標準樣點對預測點影響的權(quán)重按指數(shù)規(guī)律減少。在預測過程中,各樣點值對預測點值作用的權(quán)重大小是成正比例的,這些權(quán)重值的總和為1。通過計算均方根的最小誤差,可以求出最佳值。因此,需要插值的曲面是具有局部因變量的曲面。該方法假定,映射變量的減小是由于受到樣本位置之間距離的影響。該方法所有的樣本點都參與未知點的Z值估計,適合樣本數(shù)據(jù)集均勻分布情況,是一種全局插值方法。它是一種精確的插值方法,即插值生成的曲面上的預測樣本點值與實測樣本點值完全相等。
克里金法是一種高級統(tǒng)計方法,通過一組Z值的離散點生成估計曲面[11]。不同于其他插值方法,克里金法采用產(chǎn)生輸出曲面的最佳估計方法,對Z值表示現(xiàn)象的空間行為進行綜合研究。它假設采樣點之間的距離或方向能夠反映出空間相關(guān)性,進而用來說明表面變化。克里金法可以通過數(shù)學函數(shù)擬合指定數(shù)量的樣本點或者指定半徑范圍內(nèi)的樣本點,以確定每個位置的輸出值,常用樣本點的數(shù)據(jù)加權(quán)和表示,如式(3)所示。
(3)
其中Z(si)為位置i的實測值,λi為位置i的未知權(quán)重,s0為未測量位置,N是測量指標。權(quán)重不僅由測點之間的距離決定,還由預測位置決定;它還取決于基于測量點的整體空間布局。該方法常用于土壤科學和地質(zhì)學中。
樣條函數(shù)插值分析法是采用數(shù)學函數(shù)來估計值,這些函數(shù)最小化了整個曲面的曲率,從而生成剛好通過輸入點的平滑曲面[12]。
樣條函數(shù)有兩種方法:正則樣條函數(shù)和張力樣條函數(shù)。正則樣條函數(shù)方法使用可能超出示例數(shù)據(jù)范圍的值來創(chuàng)建一個漸進光滑的表面。張力樣條函數(shù)法根據(jù)建?,F(xiàn)象的特點控制表面硬度。它使用樣本數(shù)據(jù)范圍內(nèi)更嚴格約束的值創(chuàng)建一個不太平滑的表面,曲面插值公式如式(4)。
(4)
其中,N是點的數(shù)量,λj是通過求解一個線性方程組得到的系數(shù),rj是點(x,y)到點j的距離。根據(jù)所選取的選項,T(x,y)和R(x,y)是不同的。
對于正則化選項,T(x,y)和R(x,y)如方程式(5)和(6)所示。
T(x,y)=a1+a2x+a3y
(5)
(6)
其中,r表示點到樣本之間的距離,τ2是權(quán)重參數(shù),K0是修正貝塞爾函數(shù),c是常數(shù)0.577215。權(quán)重參數(shù)τ2確定了在最小化過程中依附于三階導數(shù)項的權(quán)重,增大權(quán)重參數(shù)可以獲得更平滑的曲面,一般取0到0.5之間的值,使用正則化選項可以確保曲面光滑和一階導數(shù)曲面光滑。該方法主要用于計算插值曲面的二階導數(shù)的情況。
對于張力選項,T(x,y)和R(x,y)如式(7)和(8)所示。
T(x,y)=a1
(7)
(8)
其中,r是點到樣本的距離,φ2是權(quán)重參數(shù),K0是修正貝塞爾函數(shù),c表示常數(shù)0.577215。權(quán)重參數(shù)確定了在最小化過程中依附于一階導數(shù)項的權(quán)重,當權(quán)值為零時,它就是基準的板樣條函數(shù)插值方法。
趨勢插值是一種全局多項式插值方法,它能擬合由多項式函數(shù)和輸入采樣點定義的光滑曲面[13]。趨勢面將逐漸變化,并在數(shù)據(jù)中捕獲粗尺度模型。模型函數(shù)如式(9)所示。
(9)
在生成最終曲面之前,我們需要知道模型在預測未知位置的值的精度。本文采用交叉驗證的方法來測定模型的質(zhì)量[14-16]。目標模型的平均誤差(ME)應該接近于0,且具有較小的均方根誤差(RMSE)。本文以RMSE作為評價四種插值方法的指標,其公式如式(10)所示。
(10)
2.1.1 克里金插值模型的比較
普通克里金插值是應用最廣泛的克里金插值,它包括許多半方差函數(shù)類型。本文選取球面函數(shù)、指數(shù)函數(shù)和高斯函數(shù)三種模型進行插值。三種模型的預測誤差如表1所示。由表可知,指數(shù)函數(shù)模型的RMSE最小,插值效果最好。
表1 普通克里金插值模型的比較
2.1.2 樣條函數(shù)插值模型的比較
采用正則樣條函數(shù)法和張力樣條函數(shù)法進行樣條插值,預測誤差如表2所示。對比兩種插值方法的均方根誤差,張力樣條的RMSE最小。因此,張力樣條函數(shù)的插值方法更為合適。
表2 樣條插值模型的比較
本文選擇RMSE作為插補精度的比較指標。我們知道,絕對值越接近,均方根誤差就越小。表3為各種插補方法的交叉驗證結(jié)果。由表可知,克里金插值法的均方根誤差最小,其中指數(shù)函數(shù)法插值法最優(yōu)。
表3 各種插補方法的交叉驗證結(jié)果
采用不同插值方法對宿州市埇橋區(qū)土壤養(yǎng)分中緩效鉀的插值結(jié)果進行了比較,普通克里金法插值精度高于其他三種插值方法。因此,考慮到插補精度和計算過程的復雜性,普通克里金法是緩效鉀插補的最佳選擇。插值方法的選擇是數(shù)據(jù)類型和計算效率之間的平衡,任何方法都不是絕對唯一的。由于采樣點的密度、現(xiàn)場數(shù)據(jù)的取值或變化范圍、地面液體的復雜程度等因素的影響,不同插值產(chǎn)生的結(jié)果可能會有較大的差異。本文只選取了四種插值方法進行比較,其他插值方法的選擇還需要進一步研究。