高 鴻 朱 娟 王良杰 趙玉國(guó) 張甘霖
(1 土壤與農(nóng)業(yè)可持續(xù)發(fā)展國(guó)家重點(diǎn)實(shí)驗(yàn)室(中國(guó)科學(xué)院南京土壤研究所),南京 210008)
(2 中國(guó)科學(xué)院大學(xué),北京 100049)
(3 安徽師范大學(xué)國(guó)土資源與旅游學(xué)院,安徽蕪湖 241002)
(4 安徽省測(cè)繪局,合肥 230031)
(5 南京林業(yè)大學(xué)林學(xué)院,南京 210037)
20世紀(jì)我國(guó)進(jìn)行的兩次土壤普查產(chǎn)生的歷史土壤圖已應(yīng)用至農(nóng)業(yè)、生態(tài)環(huán)境等多個(gè)領(lǐng)域,成為土壤資源管理、生態(tài)水文模型等研究的主要數(shù)據(jù)來(lái)源[1-2]。然而,受當(dāng)時(shí)制圖者經(jīng)驗(yàn)水平差異、傳統(tǒng)制圖技術(shù)以及數(shù)據(jù)支撐等的影響與限制,歷史土壤圖中存在邊界錯(cuò)置的現(xiàn)象,空間分布精度受限,加之隨著時(shí)間的推延土壤圖的時(shí)效性降低,因而利用數(shù)據(jù)挖掘模型獲取土壤—環(huán)境關(guān)系知識(shí),進(jìn)行土壤圖的更新的研究越來(lái)越多[2-5]。此外,土壤圖可以為缺少大量野外樣點(diǎn)的地區(qū)提供土壤與環(huán)境關(guān)系知識(shí)[6],從土壤圖中挖掘土壤—環(huán)境關(guān)系知識(shí)需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理和篩選[6-8]。而無(wú)論是土壤圖更新中數(shù)據(jù)挖掘模型訓(xùn)練樣本選取還是土壤圖知識(shí)挖掘中對(duì)土壤圖數(shù)據(jù)的預(yù)處理,關(guān)鍵點(diǎn)和難點(diǎn)均是如何在歷史土壤圖上選取具有代表性的訓(xùn)練樣本。因而,如何從歷史土壤圖中有效選取代表性的訓(xùn)練樣本具有較為重要的意義與價(jià)值。
土壤圖更新和知識(shí)挖掘所需要的訓(xùn)練樣本選取是指從不同土壤類型中篩選出樣本數(shù)量與土壤圖中面積大小相適應(yīng)的、可代表土壤類型成土環(huán)境和圖斑空間分布的訓(xùn)練樣本,包括樣本數(shù)量和樣本空間位置的確定兩個(gè)主要內(nèi)容。對(duì)于樣本數(shù)量的確定,劉雪琦等[9]確定了一種基于土壤類型面積分級(jí)的訓(xùn)練樣本數(shù)量確定的方法,Odgers等[10-11]在每個(gè)圖斑里選擇相同數(shù)目的訓(xùn)練樣本。對(duì)于樣本空間位置的確定,Odgers等[10-11]利用隨機(jī)方法篩選樣本,黃巍等[4]、朱阿興等[6]、Qi和Zhu[7]通過(guò)建立環(huán)境因子直方圖,在峰值區(qū)間進(jìn)行土壤圖樣本選取,Yang等[3]利用模糊聚類法篩選土壤圖樣本并進(jìn)行土壤圖更新。
以上研究在確定樣本數(shù)量時(shí)主要針對(duì)的是土壤類型,并未針對(duì)土壤類型所具有的多個(gè)圖斑設(shè)計(jì)樣點(diǎn),這樣可能會(huì)造成對(duì)較大面積圖斑代表性不夠或不同面積圖斑之間樣點(diǎn)數(shù)量失衡,而每個(gè)圖斑均具有一定的地理空間意義,因而需要針對(duì)每個(gè)圖斑設(shè)計(jì)樣點(diǎn)數(shù)量。在確定樣本位置時(shí),通過(guò)環(huán)境因子直方圖和聚類進(jìn)行樣本位置的選擇只考慮了環(huán)境因子屬性數(shù)值大小,忽略了環(huán)境因子在地理空間分布上的特征,而進(jìn)行土壤類型空間預(yù)測(cè)所使用的樣本應(yīng)具有空間代表性,對(duì)環(huán)境因子進(jìn)行空間分布變化的分析有助于篩選出成土環(huán)境穩(wěn)定、空間代表性高的訓(xùn)練樣本?;诖耍疚奶岢鲆环N基于環(huán)境因子鄰域分析的土壤圖訓(xùn)練樣本篩選方法,包括根據(jù)土壤圖圖斑單元面積分段線性縮放的方法確定樣本數(shù)量和基于環(huán)境因子地理空間分布特征來(lái)確定樣本空間位置。
本文選取安徽省宣城市旌德縣為研究區(qū)域(圖1),11 8°1 5′~11 8°4 4′E,30°07′~30°29′N,位于安徽省南部。四面環(huán)山,地貌類型包括中山、低山、丘陵和山間盆地,海拔100~1 272 m;氣候?qū)儆诒眮啛釒駶?rùn)季風(fēng)氣候;植被以亞熱帶常綠闊葉林為主,包括常綠闊葉林、落葉闊葉林、馬尾松林、灌叢、草叢等。旌德縣第二次土壤普查歷史土壤圖包含紅壤、黃壤、石灰?guī)r土、潮土和水稻土等5種土類,9種土壤亞類,分別為山地黃壤(編號(hào)為S1)、棕色石灰土(編號(hào)為S2)、淹育型水稻土(編號(hào)為S3)、潛育型水稻土(編號(hào)為S4)、潴育型水稻土(編號(hào)為S5)、灰潮土(標(biāo)號(hào)為S6)、紅壤性土(編號(hào)為S7)、黃壤性土(編號(hào)為S8)、黃紅壤(編號(hào)為S9),共1 364個(gè)土壤類型圖斑。本文基于土壤亞類級(jí)別在土壤圖斑單元中篩選訓(xùn)練樣本。
本文所使用數(shù)據(jù)包括第二次土壤普查形成的土壤圖,將其數(shù)字化成矢量數(shù)據(jù)格式。此外,由于地形要素基本上可以代表土壤形成與發(fā)展過(guò)程中的主要影響要素[6],所以本文所使用的另一主要數(shù)據(jù)為數(shù)字高程模型。高程數(shù)據(jù)來(lái)源于地理空間數(shù)據(jù)云平臺(tái)(http://www.gscloud.cn),柵格空間分辨率為30 m×30 m,在SAGA中計(jì)算坡度,采用土壤形成過(guò)程中高程和坡度這兩個(gè)主要地形環(huán)境因子進(jìn)行分析。本文采用ArcGIS 10.0和python2.7 GDAL進(jìn)行空間數(shù)據(jù)處理。
歷史土壤圖存在許多大小不一的圖斑單元,其中面積較小的圖斑單元受制作者主觀影響較大,圖斑邊界及整體的可信度較低,因而本文設(shè)置面積閾值,將低于該閾值的圖斑單元剔除。通過(guò)設(shè)置面積閾值選取歷史土壤圖中面積較大的土壤圖圖斑,再對(duì)所選擇的圖斑根據(jù)面積大小進(jìn)行分段,得到不同面積子區(qū)間,不同的面積區(qū)間對(duì)應(yīng)不同的樣本數(shù)量區(qū)間,面積較小的區(qū)間樣本數(shù)量小,反之樣本數(shù)量大,在不同面積區(qū)間通過(guò)線性縮放法建立面積大小與樣本數(shù)量的線性映射,計(jì)算得出所有圖斑對(duì)應(yīng)的具體樣本數(shù)量。當(dāng)存在過(guò)大面積圖斑時(shí),對(duì)面積進(jìn)行分段可消除根據(jù)圖斑面積比例直接確定樣點(diǎn)數(shù)量造成的樣本數(shù)量差異懸殊;在分段后的區(qū)間內(nèi)通過(guò)線性縮放法建立面積大小與樣本數(shù)量的線性映射,基于面積大小計(jì)算得出樣本數(shù)量,則會(huì)保證樣本數(shù)量與整個(gè)研究區(qū)不同面積圖斑相對(duì)應(yīng)。
圖1 研究區(qū)位置Fig. 1 Location map of the study area
對(duì)于面積較大的山地黃壤、棕色石灰土、潛育型水稻土、潴育型水稻土、紅壤性土、黃壤性土、黃紅壤等土壤類型,圖斑單元面積閾值為50 hm2,面積較小的淹育型水稻土和灰潮土,圖斑單元面積閾值為10 hm2,面積閾值是結(jié)合不同土壤類型圖斑的面積和數(shù)目確定的,主要目的是刪除精度較低的細(xì)小圖斑和減小計(jì)算量,具體閾值可隨不同的研究數(shù)據(jù)而變化。篩選后圖斑總面積占原始總面積的79.7%,圖斑單元數(shù)占原始單元數(shù)的18.6%,通過(guò)面積閾值篩選保留了較少數(shù)量的分析圖斑,但同時(shí)分析圖斑的面積占研究區(qū)總面積的比重較大,減小了分析過(guò)程中的圖斑計(jì)算量。
根據(jù)面積閾值篩選后的所有圖斑面積分布,設(shè)置不同的面積區(qū)間和對(duì)應(yīng)的樣本數(shù)量區(qū)間(表1)。表中圖斑面積分段區(qū)間值和對(duì)應(yīng)的樣本數(shù)量區(qū)間值是作者多次嘗試確定的,具體的參數(shù)值可隨不同的研究區(qū)域和不同的研究者而異。
表1 面積區(qū)間與樣本數(shù)量區(qū)間對(duì)應(yīng)表Table 1 Reference between polygon area range and sample quantity range
對(duì)各面積區(qū)間,其中不同面積圖斑單元所對(duì)應(yīng)樣本數(shù)量的計(jì)算公式為:
式中,Ni表示不同區(qū)間第i個(gè)圖斑樣本數(shù)量;Areai表示不同區(qū)間第i個(gè)圖斑的面積;Nmax表示樣本數(shù)量區(qū)間的上限;Nmin表示樣本數(shù)量區(qū)間的下限;Areamax表示該區(qū)間圖斑面積的最大值;Areamin表示該區(qū)間圖斑面積的最小值。
對(duì)于樣本位置,本文假設(shè)對(duì)于某些主要成土環(huán)境因子,土壤圖圖斑訓(xùn)練樣本的位置位于該因子空間變化穩(wěn)定的位置。因?yàn)橐环矫娈?dāng)成土環(huán)境要素在地理空間某一尺度局部區(qū)域均質(zhì)、穩(wěn)定的分布時(shí),其對(duì)土壤的影響也是持續(xù)、穩(wěn)定的存在,更可能對(duì)應(yīng)著特定的土壤類型;另一方面,從環(huán)境因子變化穩(wěn)定的局部區(qū)域選擇位于其地理中心的位置作為樣本,樣本對(duì)該局部區(qū)域成土環(huán)境具有較高的空間代表性。在土壤圖圖斑內(nèi),采用較小空間尺度,選擇環(huán)境因子空間變化穩(wěn)定的位置作為該圖斑內(nèi)土壤類型訓(xùn)練樣本的位置,篩選出可能是土壤類型所需成土環(huán)境并且空間代表性較高的多個(gè)空間位置。通過(guò)設(shè)置指標(biāo)對(duì)環(huán)境因子進(jìn)行柵格窗口鄰域分析,得出當(dāng)前柵格窗口的尺度下環(huán)境因子空間變化程度的分布情況,進(jìn)而篩選出環(huán)境因子空間變化程度最小也即空間變化最穩(wěn)定的位置。具體思路是,在圖斑單元內(nèi),按照環(huán)境因子鄰域分析結(jié)果值從小到大的順序依次篩選象元作為樣本,第一次選出鄰域分析結(jié)果值最小的樣本,如果下一次選出的樣本與已選出樣本的距離在一個(gè)鄰域內(nèi),則舍棄該樣本繼續(xù)選出下一個(gè)樣本,當(dāng)樣本數(shù)量達(dá)到計(jì)算得出的該圖斑單元目標(biāo)數(shù)量時(shí)為止。
其中,鄰域分析時(shí)采用的反映環(huán)境因子在空間分布上變化大小的指標(biāo)定義如下:
式中,M表示鄰域內(nèi)環(huán)境因子空間變化的程度,N表示鄰域內(nèi)象元總個(gè)數(shù),Di表示第i個(gè)鄰域象元因子值,D0表示自身象元因子值,M表示某一位置象元環(huán)境因子在當(dāng)前空間鄰域內(nèi)的變化程度。鄰域分析結(jié)果M越小表示該位置的環(huán)境因子數(shù)值與周圍的差距越小,空間變化最穩(wěn)定,因而該位置的土壤類型可能是圖斑所對(duì)應(yīng)的土壤類型。
基于本文的上述假設(shè),在一個(gè)圖斑內(nèi),土壤類型訓(xùn)練樣本出現(xiàn)在環(huán)境因子鄰域分析結(jié)果最小的位置。但對(duì)于不同的環(huán)境因子,這些位置可能存在較大差異,例如圖2顯示了黃壤性土類型海拔分布較大的某一圖斑內(nèi),以3×3柵格窗口為鄰域分別對(duì)高程因子和坡度因子進(jìn)行鄰域分析,空間變化最小5%、10%和20%象元的分布情況,其中空間變化最小5%是指圖斑單元內(nèi)鄰域分析結(jié)果值小于5%分位數(shù)的象元,即占總數(shù)目5%的空間變化較小的象元位置,10%和20%同理。
圖2 不同因子空間變化最穩(wěn)定象元位置分布Fig. 2 Distribution of the most stable cells in spatial variation relative to covariate
由圖2可知,高程因子空間變化最小的象元位于山脊、山腳等高程變化小、平緩的位置,空間分布高度集聚,圖斑內(nèi)絕大部分空間位置未被覆蓋。對(duì)坡度因子進(jìn)行鄰域分析得出坡度的空間變化情況,空間變化最小的象元位于山脊與山腳中部的地形變化穩(wěn)定的位置,并且覆蓋到圖斑大部分范圍。所以,需要進(jìn)行不同位置圖斑、不同環(huán)境因子的討論用以說(shuō)明本文所提出方法的不同效果。
由于地形要素基本上可以代表土壤形成與發(fā)展過(guò)程中的主要影響要素[6],本文對(duì)高程和坡度兩個(gè)主要的地形要素環(huán)境因子進(jìn)行討論。本文基于高程和坡度兩個(gè)重要的環(huán)境因子,選取3×3和7×7兩種柵格窗口進(jìn)行鄰域分析篩選樣本,由于研究區(qū)土壤圖各土壤類型圖斑最小面積的中數(shù)為36 250 m2,而環(huán)境因子空間分辨率為30 m,所以不宜采用較7×7更大的柵格窗口作為鄰域。
評(píng)價(jià)樣本篩選結(jié)果的指標(biāo)之一就是樣本的空間分布特征,不同數(shù)量的訓(xùn)練樣本空間分布應(yīng)覆蓋大部分圖斑以增加樣本對(duì)圖斑全局的代表性,即盡可能完備地篩選出包含一系列接近圖斑土壤類型所對(duì)應(yīng)的成土環(huán)境特征。此外,所采集的訓(xùn)練樣本數(shù)值應(yīng)該各不相同、具有較大的信息量,以保證樣本對(duì)全局具有較高的代表性。
本文將各土壤圖圖斑所選出的訓(xùn)練樣本進(jìn)行位置分布制圖以分析訓(xùn)練樣本的空間分布,計(jì)算差異比例和標(biāo)準(zhǔn)差兩個(gè)指標(biāo)來(lái)評(píng)價(jià)樣本的信息量。差異比例是指一組樣本中除去重復(fù)值后的樣本個(gè)數(shù)與該組樣本總個(gè)數(shù)之間的比例,差異比例越大,說(shuō)明樣本重復(fù)程度低,差異程度高。在數(shù)理統(tǒng)計(jì)中,方差可作為評(píng)價(jià)信息量的一個(gè)簡(jiǎn)易指標(biāo),如在主成分分析中就是尋找方差最大的方向以保證較小的信息損失,方差越大表示樣本的信息量越大,因而本文采用與方差相關(guān)的標(biāo)準(zhǔn)差這一統(tǒng)計(jì)指標(biāo)。
本文還采用已有研究中環(huán)境因子直方圖峰值區(qū)間的方法基于高程和坡度確定樣本,通過(guò)對(duì)比來(lái)評(píng)價(jià)說(shuō)明本文提出的鄰域分析方法確定樣本方法。環(huán)境因子直方圖峰值區(qū)間的方法能夠篩選出訓(xùn)練樣本,被廣泛用于從歷史土壤圖篩選訓(xùn)練樣本,并進(jìn)行歷史土壤圖知識(shí)挖掘[6-7]和歷史土壤圖的更新[3-4,9],具有較高的更新精度。
通過(guò)上述面積分段線性縮放的方法,計(jì)算土壤圖各個(gè)圖斑單元的樣本數(shù)量,最后對(duì)圖斑所屬土壤類型進(jìn)行匯總,得出各土壤類型的樣本數(shù)量(表2)。
表2 各土壤類型目標(biāo)樣本數(shù)量Table 2 Quantity of target samples relative to soil type
其中原始面積和原始圖斑數(shù)是在面積閾值篩選之前的土壤類型面積和土壤類型圖斑單元數(shù),采樣面積和采樣圖斑數(shù)是面積閾值篩選之后的土壤類型面積和土壤類型圖斑單元數(shù),目標(biāo)樣本數(shù)量即為所屬土壤類型所有采樣圖斑單元樣本數(shù)量的總和。面積閾值篩選用較少的圖斑單元數(shù)保留了較大的面積,而目標(biāo)樣本數(shù)量的大小大致與土壤類型采樣面積和采樣圖斑數(shù)相匹配。對(duì)不同土壤類型的具體圖斑單元而言,則具有與其面積對(duì)應(yīng)的樣本數(shù)量(表3),表中圖斑為后文樣本空間位置展示時(shí)所選的研究區(qū)典型土壤類型圖斑單元。
表3 典型土壤類型圖斑樣本數(shù)量Table 3 Quantity of samples of a typical soil map polygon
對(duì)于樣本空間位置分布結(jié)果,本文選取研究區(qū)三種典型土壤類型的典型圖斑進(jìn)行展示分析。由于研究區(qū)山體、丘陵分布較廣,所以選取研究區(qū)面積較大或者圖斑較多、出現(xiàn)在山體不同位置的土壤類型作為典型土壤類型,即選取隨海拔升高發(fā)育的土壤類型為序列,分別為潴育型水稻土、紅壤性土和黃壤性土。潴育型水稻土分布在河流兩岸、低平丘陵的底部區(qū)域;紅壤性土主要分布在600~700 m以下的低山地區(qū);黃壤性土分布在600~700 m以上的山坡。三種典型圖斑內(nèi),基于高程和坡度的不同環(huán)境因子,采用不同方法確定樣本的空間位置(圖3)。
圖3 典型土壤圖斑單元訓(xùn)練樣本空間分布Fig. 3 Spatial distribution of training samples in typical soil map polygon
相比于直方圖峰值區(qū)間方法,鄰域分析方法是根據(jù)環(huán)境因子空間變化,篩選出一系列成土環(huán)境穩(wěn)定、對(duì)圖斑具有全局代表性的空間位置。直方圖峰值區(qū)間的方法只在直方圖峰值一個(gè)數(shù)值區(qū)間內(nèi)篩選樣本,樣本相似度高,篩選樣本不全面,并且可能會(huì)出樣本的局部集聚,造成樣本冗余。采用鄰域分析方法確定樣本位置,當(dāng)圖斑位于地勢(shì)平緩的區(qū)域時(shí),如潴育型水稻土,基于高程因子和基于坡度因子確定的樣本位置空間分布差異較小,而當(dāng)圖斑位置位于山區(qū)時(shí),如黃壤性土,基于高程因子采用鄰域分析方法確定的樣本位置會(huì)出現(xiàn)集聚,而基于坡度因子采用鄰域分析方法確定的樣本處于地形變化穩(wěn)定的位置,樣本分布在圖斑范圍內(nèi)覆蓋更大,樣本對(duì)圖斑分布的代表性更高。因而,當(dāng)圖斑位于山區(qū)時(shí),基于坡度因子比基于高程因子鄰域分析篩選的樣本,對(duì)圖斑整體分布范圍具有更高的代表性。
同樣以3種典型土壤為例,每種土壤選取5個(gè)圖斑單元,分別計(jì)算不同方法基于高程和基于坡度確定各圖斑單元樣本高程信息和坡度信息的差異比例以及標(biāo)準(zhǔn)差,其中差異比例圖所示(圖4)。
各圖斑單元樣本標(biāo)準(zhǔn)差如表4所示:
圖4 不同土壤圖圖斑樣本差異比例Fig. 4 Odds ratio of difference in samples relative to soil map polygons
表4 不同土壤圖圖斑樣本標(biāo)準(zhǔn)差Table 4 Standard deviation of samples relative to soil map polygon
續(xù)表
無(wú)論是基于高程因子還是坡度因子,鄰域分析方法確定的樣本其差異比例和樣本標(biāo)準(zhǔn)差均大于環(huán)境因子直方圖確定的樣本,這是因?yàn)橹狈綀D峰值區(qū)間范圍內(nèi)的樣本的環(huán)境因子值比較接近,樣本差異比例較小,標(biāo)準(zhǔn)差也較小。鄰域分析方法是從周圍地理環(huán)境的角度確定樣本位置,未從某一數(shù)值區(qū)間內(nèi)篩選樣本,因而確定的樣本相比于直方圖峰值區(qū)間樣本具有較大的差異比例和標(biāo)準(zhǔn)差,具有較高的信息量,全局代表性更高,其中鄰域大小對(duì)差異比例和標(biāo)準(zhǔn)差的影響隨圖斑而異。
但受歷史土壤圖空間分布精度的影響,從歷史土壤圖上篩選出的樣本精度各異,因而歷史土壤圖精度是影響土壤圖訓(xùn)練樣本的主要因素。
對(duì)于歷史土壤圖圖斑單元采用面積分段線性縮放的方法確定樣本數(shù)量,可保證面積和圖斑數(shù)與訓(xùn)練樣本數(shù)量之間的對(duì)應(yīng),消除了過(guò)大面積土壤類型確定樣本數(shù)量時(shí)造成的樣本數(shù)量差異懸殊,圖斑面積與樣本數(shù)量直接匹配,利于從圖斑直接篩選訓(xùn)練樣本。采用鄰域分析方法,當(dāng)圖斑位于地勢(shì)平緩的區(qū)域時(shí),基于高程因子和坡度因子確定的訓(xùn)練樣本空間分布差異較?。划?dāng)圖斑位于山區(qū)時(shí),基于坡度因子所確定的訓(xùn)練樣本處于地形變化穩(wěn)定的位置,對(duì)圖斑的空間分布也具有更高的代表性,較高程因子更適合訓(xùn)練樣本位置的篩選。此外,鄰域分析方法確定的訓(xùn)練樣本較環(huán)境因子直方圖方法確定的樣本具有更高的差異比例和標(biāo)準(zhǔn)差,樣本信息更豐富,樣本對(duì)全局的代表性更高。在土壤圖不同土壤類型的圖斑內(nèi),基于面積分段線性縮放法確定合適數(shù)量、基于環(huán)境因子鄰域分析法確定特定位置的訓(xùn)練樣本后,可以進(jìn)行后續(xù)土壤圖知識(shí)挖掘和土壤圖更新的研究,其中不同土壤類型篩選樣本時(shí)的環(huán)境因子的選取以及不同位置、大小圖斑所需要的空間鄰域大小的確定,均可進(jìn)一步根據(jù)相關(guān)土壤地理學(xué)知識(shí)進(jìn)行優(yōu)化。
[ 1 ] 席承藩,章士炎. 全國(guó)土壤普查科研項(xiàng)目成果簡(jiǎn)介. 土壤學(xué)報(bào),1994,31(3):330—335 Xi C F,Zhang S Y. Brief introduction on achievements in national soil survey project since 1979 (In Chinese). Acta Pedologica Sinica,1994,31(3):330—335
[ 2 ] 楊琳,F(xiàn)ahmy Sherif,Jiao You,等. 基于土壤—環(huán)境關(guān)系的更新傳統(tǒng)土壤圖研究. 土壤學(xué)報(bào),2010,47(6):1039—1049 Yang L,F(xiàn)ahmy S,Jiao Y,et al. Updating conventional soil maps using knowledge on soil environment relationships extracted from the maps (In Chinese). Acta Pedologica Sinica,2010,47(6):1039—1049
[ 3 ] Yang L,Jiao Y,F(xiàn)ahmy S,et al. Updating conventional soil maps through digital soil mapping.Soil Science Society of America Journal,2011,75(3):1044—1053
[ 4 ] 黃巍,羅云,汪善勤,等. 基于傳統(tǒng)土壤圖的土壤—環(huán)境關(guān)系獲取及推理制圖研究,土壤學(xué)報(bào),2016,53(1):72—80 Huang W,Luo Y,Wang S Q,et al. Knowledge of soil-landscape model obtain from a soil map and mapping(In Chinese). Acta Pedologica Sinica,2016,53(1):72—80
[ 5 ] Rad M R P,Toomanian N,Khormali F,et al.Updating soil survey maps using random forest and conditioned Latin hypercube sampling in the loess derived soils of northern Iran. Geoderma,2014,232/234:97—106
[ 6 ] 朱阿興,李寶林,裴韜,等. 精細(xì)數(shù)字土壤普查模型與方法. 北京:科學(xué)出版社,2008 Zhu A X,Li B L,Pei T,et al. Fine digital soil census model and method(In Chinese). Beijing:Science Press,2008
[ 7 ] Qi F,Zhu A X. Knowledge discovery from soil maps using inductive learning. International Journal of Geographical Information Science,2003,17(8):771—795
[ 8 ] 楊琳,朱阿興,李寶林,等. 應(yīng)用模糊c-均值聚類獲取土壤制圖所需土壤—環(huán)境關(guān)系知識(shí)的方法研究. 土壤學(xué)報(bào),2007,44(5):784—791 Yang L,Zhu A X,Li B L,et al. Extraction of knowledge about soil-environment relationship for soil mapping using fuzzy c-means (FCM) clustering (In Chinese). Acta Pedologica Sinica,2007,44(5):784—791
[ 9 ] 劉雪琦,朱阿興,楊琳,等. 土壤圖更新中基于土壤類型面積分級(jí)的訓(xùn)練樣點(diǎn)選擇方法. 土壤學(xué)報(bào),2017,54(1):36—47 Liu X Q,Zhu A X,Yang L,et al. Training sample selection method based on grading of soil types by area for updating conventional soil maps (In Chinese).Acta Pedologica Sinica,2017,54(1):36—47
[10] Odgers N P,Sun W,Mcbratney A B,et al.Disaggregating and harmonising soil map units through resampled classification trees. Geoderma,2014,214/215:91—100
[11] Odgers N P,McBratney A B,Minasny B. Digital soil property mapping and uncertainty estimation using soil class probability rasters. Geoderma,2015,237/238:190—198
[12] Yang L,Zhu A X,Qi F,et al. An integrative hierarchical stepwise sampling strategy and its application in digital soil mapping. International Journal of Geographical Information Science,2013,27(1):1—23
[13] Silva S H G,Menezes M D D,Owens P R,et al.Retrieving pedologist’s mental model from existing soil map and comparing data mining tools for refining a larger area map under similar environmental conditions in Southeastern Brazil. Geoderma,2016,267:65—77
[14] Malone B P,Minasny B,Odgers N P,et al. Using model averaging to combine soil property rasters from legacy soil maps and from point data. Geoderma,2014,232/234:34—44
[15] Pahlavan-Rad M R,Khormali F,Toomanian N,et al. Legacy soil maps as a covariate in digital soil mapping:A case study from Northern Iran.Geoderma,2016,279:141—148