陳 飛 香,戴 慧,胡 月 明*,趙 元,周 永 章
區(qū)域土壤空間抽樣方法研究
陳 飛 香1,2,3,戴 慧2,3,胡 月 明2,3*,趙 元2,3,周 永 章1
(1.中山大學(xué)地球環(huán)境與地球資源研究中心,廣東 廣州 510275;2.廣東省土地利用與整治重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 510642;3.華南農(nóng)業(yè)大學(xué),廣東 廣州 510642)
對(duì)不同空間抽樣方法進(jìn)行對(duì)比研究是尋找具有空間相關(guān)性的不同資源和調(diào)查對(duì)象的最適宜抽樣設(shè)計(jì)方案的重要手段。該文以廣東省增城市土壤鉻含量為空間要素,分別采用空間簡(jiǎn)單隨機(jī)抽樣、空間分層抽樣和三明治抽樣3種方法進(jìn)行抽樣;為便于比較3種方法的抽樣精度,設(shè)定相同樣本容量,采用Kriging插值對(duì)抽樣結(jié)果進(jìn)行精度評(píng)價(jià)。結(jié)果表明:在較為豐富的先驗(yàn)知識(shí)的情況下,三明治空間抽樣方法所抽樣點(diǎn)在預(yù)測(cè)土壤重金屬含量分布情況時(shí)得到的克里格估值誤差最小,是一種抽樣精度更高、適用范圍更廣的抽樣方案。
地統(tǒng)計(jì)分析;空間抽樣;GIS;土壤鉻含量
土壤要素空間分布一直是土壤學(xué)與地理學(xué)的研究熱點(diǎn)之一。長(zhǎng)期以來(lái),因受客觀條件所限,不能對(duì)區(qū)域內(nèi)所有位置的土壤性狀一一進(jìn)行調(diào)查,因而抽樣調(diào)查方法成為獲取土壤空間分析信息的基本方法,即從研究對(duì)象中抽出部分單位進(jìn)行分析,通過(guò)其數(shù)量特征推斷總體數(shù)量特征。目前,常用的抽樣調(diào)查方法有經(jīng)典抽樣方法和空間抽樣方法。經(jīng)典抽樣方法野外采樣點(diǎn)多,耗費(fèi)大量人力、物力和時(shí)間,因而效率低、成本高[1];空間抽樣方法是在地統(tǒng)計(jì)學(xué)支持下,設(shè)計(jì)抽樣樣點(diǎn)時(shí)考慮區(qū)域土壤空間自相關(guān)性[2],適合于具空間相關(guān)性的土壤性狀調(diào)查[3,4],廣泛應(yīng)用于耕地資源調(diào)查與監(jiān)測(cè)[5]、社會(huì)問(wèn)卷調(diào)查[6]、人均農(nóng)業(yè)總產(chǎn)值調(diào)查[7]等領(lǐng)域。
隨著抽樣技術(shù)的發(fā)展和應(yīng)用的廣泛性,抽樣過(guò)程中逐漸融入空間信息,并將其與GIS、RS技術(shù)結(jié)合,形成高效的空間抽樣方法,如空間隨機(jī)抽樣、空間分層抽樣和三明治抽樣模型。本文采用空間隨機(jī)抽樣模型、空間分層抽樣模型和三明治抽樣模型估算廣東省增城市土壤鉻含量的空間分布,并對(duì)三種方法的抽樣結(jié)果進(jìn)行精度評(píng)價(jià),選出最適合于獲取區(qū)域土壤重金屬含量空間分布信息的空間抽樣模型,進(jìn)一步完善我國(guó)區(qū)域土壤重金屬含量空間分布的抽樣研究,為土壤重金屬污染治理提供依據(jù)。
在空間簡(jiǎn)單隨機(jī)抽樣中,抽樣均值是總體均值的無(wú)偏估計(jì)。考慮到空間對(duì)象的空間自相關(guān)性,其均值估計(jì)方差需要根據(jù)空間抽樣對(duì)象的相關(guān)程度而調(diào)整。在抽樣中,主要是通過(guò)樣本點(diǎn)估計(jì)一個(gè)連續(xù)表面上的均值[3],公式為:
式中:ˉZ為均值,n為樣本量,Z(xi)為樣本值。
在分層抽樣的基礎(chǔ)上,將空間研究區(qū)域N按其空間屬性特征分成L個(gè)互不重復(fù)的類(lèi)型或?qū)?,先?jì)算研究區(qū)域總體樣本量;再利用平均分配、按各層離散方差與總體規(guī)模乘積分配等方法將樣本量按權(quán)重Wh分配到每個(gè)層內(nèi);最后在每個(gè)層內(nèi)進(jìn)行簡(jiǎn)單隨機(jī)布樣,計(jì)算各層的樣本均值(式(1))、方差(式(2))[3]和權(quán)重(式(3))。
式中:Wh是h層的權(quán)重,N是樣本量,Nh是h層中所有的樣本數(shù)。
先將研究區(qū)域劃分為多個(gè)分區(qū)(知識(shí)層),根據(jù)用戶(hù)對(duì)抽樣精度的要求計(jì)算所有層總的抽樣樣本量,依據(jù)分層抽樣樣本分配理論,將樣本分配到每個(gè)知識(shí)層;利用用戶(hù)調(diào)查的樣本值計(jì)算知識(shí)層的樣本均值和方差,并將其傳遞到報(bào)告層,得到每個(gè)報(bào)告層的樣本均值和方差[3]。報(bào)告層由用戶(hù)感興趣的空間報(bào)告單元構(gòu)成,如果抽樣結(jié)果需要在多個(gè)報(bào)告單元進(jìn)行統(tǒng)計(jì)與推斷,抽樣費(fèi)用將大大增加;報(bào)告單元的靈活性表現(xiàn)可由用戶(hù)定義,這也是三明治空間抽樣方法的一大特性,該特性既解決了經(jīng)典抽樣理論默認(rèn)只有唯一報(bào)告單元的局限性問(wèn)題,也解決了在多個(gè)報(bào)告單元布設(shè)樣本帶來(lái)的昂貴費(fèi)用問(wèn)題[3]。
根據(jù)研究區(qū)土壤類(lèi)型和地形特點(diǎn),在保證樣品代表性的前提下,在研究區(qū)電子地圖上布點(diǎn),再根據(jù)當(dāng)?shù)貙?shí)際情況用GPS手持機(jī)獲取實(shí)際坐標(biāo)。采用“X”法,在10 m半徑的范圍內(nèi)取0~20 cm耕層土壤,5個(gè)點(diǎn)混合為一土樣,共采集194個(gè)土樣;所有樣品經(jīng)風(fēng)干、剔出雜質(zhì)、研磨、分別過(guò)20目和100目篩后,采用GB/T 17137火焰原子吸收光譜法測(cè)定土壤鉻含量。
空間自相關(guān)性反映了一個(gè)區(qū)域單元上某一地理現(xiàn)象或某一屬性值與鄰近區(qū)域單元上同一現(xiàn)象或?qū)傩灾档南嚓P(guān)程度。本文利用Arc Map,采用Moran′sI系數(shù)法檢測(cè)研究區(qū)域內(nèi)土壤鉻空間自相關(guān)的指標(biāo);檢測(cè)到 Moran′sI為0.4691,且p<0.01,表明研究區(qū)域內(nèi)土壤鉻屬于空間正相關(guān),且相關(guān)性顯著。
經(jīng)典采樣技術(shù)廣泛應(yīng)用于樣本容量大小的確定,本文采用Cochran提出的純隨機(jī)采樣方法確定樣本容量,計(jì)算公式為:
式中:n為樣本容量大小,t為與顯著性水平α相對(duì)應(yīng)的標(biāo)準(zhǔn)正態(tài)偏差,Std為樣本標(biāo)準(zhǔn)差,d為樣本平均值與相對(duì)誤差(%)的乘積。
經(jīng)計(jì)算,90%、95%和99%置信水平下對(duì)應(yīng)的標(biāo)準(zhǔn)正態(tài)偏差t值依次是1.6449、1.96、2.5758,樣本標(biāo)準(zhǔn)差Std值為14.3744,樣本平均值為35.6583。為了更好地表達(dá)樣本容量的代表性,置信水平取99%,相對(duì)誤差分別取15%、10%、5%條件下得到的合理樣本容量依次為48、108、432。根據(jù)研究區(qū)域?qū)嶋H情況,本文選取相對(duì)誤差10%條件下得到的108個(gè)樣點(diǎn)進(jìn)行空間抽樣對(duì)比研究。
傳統(tǒng)的分層將屬性值相對(duì)近似的盡可能分到同一層,根據(jù)這個(gè)分層標(biāo)準(zhǔn)對(duì)空間對(duì)象分層時(shí),在同一層的對(duì)象屬性值相差可能很大。而知識(shí)層分區(qū),考慮了樣本點(diǎn)的空間信息,兼顧了同一層的對(duì)象能夠在空間上相連。目前,知識(shí)層分區(qū)的方案主要有兩類(lèi),一類(lèi)是直接利用已有的分區(qū)單元對(duì)樣本劃分,另一類(lèi)是根據(jù)單一要素或多要素相結(jié)合進(jìn)行分層。本研究主要采用第一類(lèi)方法,根據(jù)研究區(qū)土地利用類(lèi)型,將研究區(qū)分成耕地層、園地層、林地層和非農(nóng)用地4層(圖1)。報(bào)告層是用戶(hù)感興趣的空間報(bào)告單元(用戶(hù)希望了解的抽樣調(diào)查對(duì)象所分布的空間區(qū)域)的集合,當(dāng)前常見(jiàn)的報(bào)告單元有省、市、縣等行政區(qū),也可以是流域等自然帶,本研究的報(bào)告單元采用增城市行政區(qū)劃圖。
圖1 增城市知識(shí)層分區(qū)Fig.1 The partition of knowledge level in Zengcheng City
抽樣過(guò)程中,空間簡(jiǎn)單隨機(jī)抽樣不涉及分層,空間分層抽樣只涉及空間分層,三明治空間抽樣既涉及空間分層,又涉及報(bào)告單元的選取。采用SSSampling軟件包對(duì)3種抽樣方法進(jìn)行對(duì)比抽樣。
空間簡(jiǎn)單隨機(jī)抽樣樣本量取108,總體方差根14.3744,絕對(duì)誤差1.7,空間相關(guān)系數(shù)0.13,其抽樣結(jié)果如圖2a??臻g分層抽樣在分層抽樣知識(shí)層分區(qū)(圖1)的基礎(chǔ)上進(jìn)行,其樣本量108,用戶(hù)給定抽樣方差0.000045,均值標(biāo)準(zhǔn)差3.66,均值空間標(biāo)準(zhǔn)差4.15,結(jié)果如圖2b;樣點(diǎn)在各層分布情況如表1,在園地分布最少(9個(gè)),占樣本容量的8.33%,在耕地層分布最多,占樣本容量的60.19%。三明治空間抽樣也是在分層抽樣基礎(chǔ)上進(jìn)行的,其知識(shí)層如圖1,報(bào)告單元取增城市行政區(qū)劃圖;其樣本量108,用戶(hù)給定抽樣方差0.000045,知識(shí)層均值13.51,知識(shí)層均值標(biāo)準(zhǔn)差3.01,知識(shí)層均值空間標(biāo)準(zhǔn)差4.06,抽樣結(jié)果如圖2c;各層樣點(diǎn)數(shù)量分布情況如表1,抽樣點(diǎn)主要分布在耕地層,占樣本容量的62.96%,園地樣點(diǎn)分布最少,僅10個(gè)。
圖2 3種抽樣方法的抽樣結(jié)果Fig.2 Sampling results of the three sampling methods
表1 空間抽樣模型各知識(shí)層的樣點(diǎn)數(shù)分布Table 1 Sample distribution for different knowledge level of spatial sampling methods
借助地統(tǒng)計(jì)學(xué)方法,對(duì)3種方法抽樣結(jié)果進(jìn)行Kriging插值,以便評(píng)價(jià)抽樣結(jié)果的精度。Kriging方法也稱(chēng)為空間局部估計(jì)或空間局部插值,它是一種非常重要的最優(yōu)、線性、無(wú)偏空間插值方法,首先考慮的是空間屬性在空間位置上的變異分布,確定對(duì)一個(gè)待插點(diǎn)值有影響的距離范圍,用此范圍內(nèi)的采樣點(diǎn)估計(jì)待插點(diǎn)的屬性值[8]。經(jīng)柯?tīng)柲缏宸颍姑字Z(Kolomogorov-Semirnov,K.S)正態(tài)分布檢驗(yàn),土壤鉻含量滿(mǎn)足正態(tài)分布,符合采用Kriging插值的前提條件。本文采用普通克里金法(Ordinary Kriging)對(duì)抽樣結(jié)果和原始樣點(diǎn)的土壤鉻含量進(jìn)行最優(yōu)內(nèi)插,幾種插值結(jié)果如圖3所示。
圖3 不同布局樣點(diǎn)下土壤鉻含量普通Kriging插值Fig.3 The ordinary Kriging interpolation of soil Cr under different distribution of sample points
3種空間抽樣方法所抽樣點(diǎn)與原始樣點(diǎn)土壤鉻含量Kriging插值后的交叉驗(yàn)證(Cross Validation)結(jié)果見(jiàn)表2,總體上,平均誤差(ME)和標(biāo)準(zhǔn)化平均誤差(MSE)的絕對(duì)值均趨近于0,均方根誤差(RMSE)和平均標(biāo)準(zhǔn)誤差(ASE)的值都較小且較接近,表明預(yù)測(cè)結(jié)果均比較理想。但從局部驗(yàn)證差異看,不同空間抽樣方法所抽樣點(diǎn)的插值交叉驗(yàn)證(Cross Validation)結(jié)果卻有所差異。3種空間抽樣方法中,|ME|的值最接近于0(0.0973)的是三明治空間抽樣方法,最大(0.3421)的為空間簡(jiǎn)單隨機(jī)抽樣。|RMSE-ASE|大小排序?yàn)榭臻g簡(jiǎn)單隨機(jī)抽樣(1.74)>空間分層抽樣(1.44)>三明治空間抽樣模型(1.04),說(shuō)明三明治空間抽樣模型所抽樣點(diǎn)通過(guò)插值預(yù)測(cè)的結(jié)果最接近真實(shí)值。表2中各樣點(diǎn)插值的RMSSE值均大于1,說(shuō)明預(yù)測(cè)值全部被低估了,但三明治空間抽樣模型RMSSE值為1.057,最接近于1,表明被低估的程度最小。與原始樣點(diǎn)插值的交叉驗(yàn)證相比,鑒于原始樣點(diǎn)樣本量大(為208),原始樣點(diǎn)的各項(xiàng)指標(biāo)均為最理想,預(yù)測(cè)精度最高;而3種空間抽樣方法中,三明治空間抽樣方法所得樣點(diǎn)插值的精度與原始樣點(diǎn)最為接近,其次是空間分層抽樣。
表2 不同布局樣點(diǎn)下普通克里格插值估測(cè)精度Table 2 The predict accuracy of ordinary Kriging under different distribution of sample points
在區(qū)域土壤空間抽樣中,空間簡(jiǎn)單隨機(jī)抽樣、空間分層抽樣、三明治抽樣3種方法均可以設(shè)置相同樣本容量,但空間簡(jiǎn)單隨機(jī)抽樣僅考慮樣點(diǎn)自身位置,而空間分層抽樣與三明治抽樣可以利用技術(shù)人員已有經(jīng)驗(yàn),抽樣結(jié)果能滿(mǎn)足不同研究目的的需要。采用三明治抽樣方法,因其引入報(bào)告層與知識(shí)層的處理,抽樣結(jié)果具有更高的精度與效率,在對(duì)區(qū)域土壤空間要素具有較豐富先驗(yàn)知識(shí)的情況下尤為適用。
區(qū)域土壤重金屬含量抽樣是其空間預(yù)測(cè)制圖的基礎(chǔ),必須選用可靠的、高精度的抽樣方法,才能夠?yàn)樵O(shè)計(jì)科學(xué)合理的野外采樣方案提供切實(shí)的依據(jù)。本文因數(shù)據(jù)所限,未能對(duì)3種抽樣方法在其他土壤要素的空間抽樣上做出對(duì)比分析;另外,在三明治空間抽樣方法的知識(shí)層選擇時(shí),僅以研究區(qū)土地利用現(xiàn)狀作為知識(shí)層分層,未能進(jìn)一步考慮其他可能對(duì)土壤鉻含量空間分布造成影響的因素,如產(chǎn)業(yè)布局、人類(lèi)活動(dòng)、地形坡度和種植作物等。
[1]楊琳,朱阿興,秦承志,等.一種基于樣點(diǎn)代表性等級(jí)的土壤采樣設(shè)計(jì)方法[J].土壤學(xué)報(bào),2011,48(5):938-946.
[2]WANG J,LIU J,ZHUAN D,et al.Spatial sampling design for monitoring the area of cultivated land[J].International Journal of Remote Sensing,2002,23(2):263-284.
[3]王勁峰,姜成晟,李連發(fā).空間抽樣與統(tǒng)計(jì)推斷[M].北京:科學(xué)出版社,2009.
[4]鄧仕虎,楊勤科.DEM采樣間隔對(duì)地形描述精度的影響研究[J].地理與地理信息科學(xué),2010,26(2):23-26.
[5]劉海啟.大尺度耕地變化監(jiān)測(cè)的遙感抽樣方法研究[J].農(nóng)業(yè)工程學(xué)報(bào),2001,17(2):168-171.
[6]高麗玲,李新虎,王翠平,等.空間抽樣的理論方法與應(yīng)用分析——以廈門(mén)島問(wèn)卷調(diào)查為例[J].地球信息科學(xué)學(xué)報(bào),2010(3):358-364.
[7]連健,李小娟,宮輝力,等.GIS支持下的空間分層抽樣方法研究——以北京市人均農(nóng)業(yè)總產(chǎn)值抽樣調(diào)查為例[J].地理與地理信息科學(xué),2008,24(6):30-33.
[8]KNOTTERS M,BRUS D J,OUDE VOSHAAR J H.A comparison of Kriging,co-Kriging and Kriging combined with regression for spatial interpolation of horizon depth with censored observations[J].Geoderma,1995,67(3):227-246.
Study on Regional Soil Spatial Sampling Method
CHEN Fei-xiang1,2,3,DAI Hui2,3,HU Yue-ming2,3,ZHAO Yuan2,3,ZHOU Yong-zhang1
(1.CenterforEarthEnvironment&Resources,SunYat-SenUniversity,Guangzhou510275;2.KeyLaboratoryofGuangdongProvinceLandUseandRemediation,Guangzhou510642;3.SouthChinaAgriculturalUniversity,Guangzhou510642,China)
The comparative study on different spatial sampling method is an important means to find a spatial correlation of the different resources and survey the most appropriate sampling design.In this paper,the soil Cr content in Zengcheng City in Guangdong Province was taken as spatial elements,three kinds of methods for sampling analysis that respectively were the spatial simple random sampling and spatial stratified sampling,spatial Sandwich sampling were discussed.For ease of comparison of three methods of sampling precision,this paper set the same sample size,and then used the Kriging interpolation on the sampling accuracy evaluation,and then did cross-validation after Kriging interpolation.In cross-validation process,|ME|value of the Sandwich space sampling method is the most closet to zero,it is 0.0973,and the value of spatial simple random sampling is the largest.The order of the|RMSE-ASE|value is:spatial simple random sampling>spatial stratified sampling>spatial Sandwich sampling.The results show that,in the case of more rich of prior knowledge,the sample points which gained by Sandwich sampling attain the minimum Kriging estimation error in the case of predicting the distribution of the contents of heavy metals in soil,Sandwich sampling has higher sampling precision and wider range of application.
geo-statistical analysis;spatial sampling;GIS;soil Cr concentration
P 208;X53
A
1672-0504(2012)06-0053-04
2012-04- 28;
2012-06-27
國(guó)家自然科學(xué)基金項(xiàng)目(40971125);廣東省科技計(jì)劃項(xiàng)目(2011B020313020)
陳飛香(1978-),女,壯族,博士研究生,講師,研究方向?yàn)榈乩硇畔⑾到y(tǒng)應(yīng)用。*通訊作者E-mail:ymhu163@163.com