亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于隨機(jī)森林模型的耕地表層土壤有機(jī)質(zhì)含量空間預(yù)測①——以河南省輝縣市為例

        2019-04-08 09:06:30韓杏杏王海洋巫振富程道全
        土壤 2019年1期
        關(guān)鍵詞:耕地模型研究

        韓杏杏,陳 杰*,王海洋,巫振富,程道全

        ?

        基于隨機(jī)森林模型的耕地表層土壤有機(jī)質(zhì)含量空間預(yù)測①——以河南省輝縣市為例

        韓杏杏1,陳 杰1*,王海洋1,巫振富2,程道全3

        (1 鄭州大學(xué)水利與環(huán)境學(xué)院,鄭州 450001;2 鄭州大學(xué)公共管理學(xué)院,鄭州 450001;3 河南省土壤肥料站,鄭州 450002)

        耕地表層土壤有機(jī)質(zhì)含量與作物生長發(fā)育密切相關(guān),掌握土壤有機(jī)質(zhì)空間分布對土壤肥力定向培養(yǎng)和農(nóng)業(yè)生產(chǎn)指導(dǎo)具有重要意義。本研究以河南省輝縣市5 922個(gè)耕地資源管理單元圖斑中心點(diǎn)為基礎(chǔ)數(shù)據(jù),并分別按8∶2、7∶3、6∶4的比例隨機(jī)劃分訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集,以土壤類型作為輔助定性變量,利用隨機(jī)森林模型模擬預(yù)測土壤有機(jī)質(zhì)含量與自然環(huán)境變量(坡向、曲率、坡度、高程、土壤質(zhì)地、歸一化植被指數(shù)NDVI)、社會(huì)經(jīng)濟(jì)因子(排水能力、灌溉狀況)之間的復(fù)雜非線性關(guān)系。結(jié)果表明:①當(dāng)訓(xùn)練集與檢驗(yàn)集中樣點(diǎn)數(shù)量的比例為8∶2時(shí),對應(yīng)的隨機(jī)森林模型總體上預(yù)測精度較高;②選用80% 基礎(chǔ)數(shù)據(jù)作為訓(xùn)練集時(shí),預(yù)測得到的地圖與已有圖件相比,相關(guān)性達(dá)到0.859;③當(dāng)用303個(gè)實(shí)地?cái)?shù)據(jù)驗(yàn)證時(shí),預(yù)測值與實(shí)測值的皮爾遜相關(guān)系數(shù)為0.595。通過對影響因子的重要性排序,發(fā)現(xiàn)土壤質(zhì)地是研究區(qū)農(nóng)用地表層土壤有機(jī)質(zhì)含量的最重要影響因子。因此,隨機(jī)森林模型作為機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘的有效方法,能較好地模擬輸入變量與有機(jī)質(zhì)含量之間的關(guān)系,預(yù)測圖件與實(shí)際情況相符,但對有機(jī)質(zhì)含量精細(xì)的差異不能很好體現(xiàn)。

        隨機(jī)森林;土壤有機(jī)質(zhì);耕地預(yù)測制圖;輝縣市

        土壤有機(jī)質(zhì)是土壤中最具有活力的成分,是土壤肥力的基礎(chǔ),是土壤質(zhì)量最為重要的指標(biāo)之一。首先,土壤有機(jī)質(zhì)含有作物和微生物所需要的幾乎各種營養(yǎng)元素,土壤有機(jī)質(zhì)含量高低在很大程度上決定著土壤的養(yǎng)分供給能力;其次,土壤有機(jī)質(zhì)能有效促進(jìn)土壤結(jié)構(gòu)發(fā)育,提高土壤吸附能力、緩沖能力、持水及滲透能力,是土壤肥力得以穩(wěn)定發(fā)揮的基礎(chǔ)[1-4];另外,土壤有機(jī)質(zhì)是一種穩(wěn)定而長效的碳源,土壤有機(jī)碳庫是地球陸地碳庫的重要組成部分,在陸地碳循環(huán)中有著重要的作用。據(jù)估計(jì)土壤有機(jī)質(zhì)的分解以及微生物和根系呼吸作用所產(chǎn)生的CO2每年可達(dá)1.35×1011t,土壤有機(jī)碳庫容的微小變化,都會(huì)對大氣溫室氣體濃度及全球氣候產(chǎn)生重大影響[5-7]。多尺度、全方位揭示土壤有機(jī)質(zhì),尤其是農(nóng)田土壤有機(jī)質(zhì)空間分異規(guī)律、動(dòng)態(tài)演變趨勢及其主要影響因素,對土壤質(zhì)量培育、基礎(chǔ)地力提升等農(nóng)業(yè)生產(chǎn)實(shí)踐具有重要的指導(dǎo)作用,可為制訂農(nóng)田土壤固碳減排、全球氣候變化響應(yīng)策略提供科學(xué)依據(jù)。

        土壤有機(jī)質(zhì)含量及其空間分布特征是多種自然與人為因素共同作用的結(jié)果,基于有限樣點(diǎn)土壤數(shù)據(jù),應(yīng)用各種技術(shù)途徑,在區(qū)域尺度上盡可能精確地預(yù)測土壤有機(jī)質(zhì),尤其是表層土壤有機(jī)質(zhì)含量,并揭示其空間變異規(guī)律,一直以來都是土壤學(xué)的一個(gè)熱點(diǎn)研究內(nèi)容,也是數(shù)字化土壤制圖的一個(gè)重要領(lǐng)域。以多元回歸為核心的確定性模型[8-9]、基于地統(tǒng)計(jì)學(xué)手段的隨機(jī)模型[10-12]及以神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)、分類樹與回歸(classification and regression tree,CART)、模糊聚類、最大貝葉斯熵為代表的一系列機(jī)器學(xué)習(xí)(machine learning, ML)方法[7,13-16],是過去幾十年來土壤有機(jī)質(zhì)空間預(yù)測實(shí)踐中應(yīng)用最為廣泛的技術(shù)。隨機(jī)森林(random forest,RF)模型是由Breiman[8]于21世紀(jì)初在分類與回歸樹算法模型基礎(chǔ)上開發(fā)的一種數(shù)據(jù)挖掘方法,是一種新的組合式自學(xué)習(xí)技術(shù)。其不僅同樣具有CART與ANN等處理變量之間復(fù)雜非線性關(guān)系的優(yōu)勢,同時(shí)有效克服了上述模型存在的過度擬合、不穩(wěn)定、計(jì)算復(fù)雜等缺點(diǎn)[9-11]。此外,隨機(jī)森林模型在分類和預(yù)測時(shí)均支持多種數(shù)據(jù)類型如數(shù)值型、因子型、邏輯型等,方法簡單易用。因此,隨機(jī)森林模型一經(jīng)問世,便迅速在包括數(shù)字化土壤制圖在內(nèi)的多個(gè)領(lǐng)域內(nèi)得到推廣應(yīng)用[12-14]。目前在國內(nèi),將隨機(jī)森林模型運(yùn)用于土壤屬性空間預(yù)測及數(shù)字制圖研究還處于探索階段,尤其是對土壤有機(jī)質(zhì)這類時(shí)空可變性、影響因素復(fù)雜、人為活動(dòng)影響深刻的土壤屬性,相關(guān)的空間預(yù)測研究報(bào)道較少[11,15]。

        本研究以河南省輝縣市土壤為研究對象,基于研究區(qū)傳統(tǒng)調(diào)查中的土壤屬性數(shù)據(jù)、環(huán)境協(xié)變量以及與土地利用相關(guān)的基礎(chǔ)信息,應(yīng)用隨機(jī)森林算法構(gòu)建空間預(yù)測模型,模擬變量與有機(jī)質(zhì)含量之間復(fù)雜的非線性關(guān)系,在縣域尺度上對農(nóng)用地表層土壤有機(jī)質(zhì)含量實(shí)施空間預(yù)測并進(jìn)行數(shù)字化制圖,以期探索隨機(jī)森林模型在土壤屬性預(yù)測方面的有效性。

        1 材料與方法

        1.1 研究區(qū)概況及數(shù)據(jù)來源

        輝縣位于河南省西北部的太行山南麓,地理位置35°17′~35°50′ N,113°20′~113°57′ E,屬暖溫帶大陸性季風(fēng)氣候,總面積2 007 km2,地貌自北向南依次為山區(qū)、丘陵、平原3個(gè)類型,面積分別為1 007、216、784 km2。根據(jù)第二次全國土壤普查資料,輝縣土壤包括7個(gè)土類:褐土(簡育干潤淋溶土)、潮土(淡色潮濕雛形土)、風(fēng)砂土(干潤砂質(zhì)新成土)、砂姜黑土(砂姜潮濕雛形土)、棕壤(簡育濕潤淋溶土)、水稻土(潛育水耕人為土)、沼澤土(半腐正常有機(jī)土),13個(gè)亞類,29個(gè)土屬,69個(gè)土種,其中褐土和潮土的分布最廣,是主要的農(nóng)業(yè)土壤。

        本研究采用的主要數(shù)據(jù)源包括:河南省輝縣市的測土配方施肥補(bǔ)貼項(xiàng)目(2009—2011年)及其耕地地力評價(jià)專項(xiàng)項(xiàng)目(2011—2012年)獲取的耕地資源管理單元圖、耕地地力調(diào)查點(diǎn)位圖(圖1)等相關(guān)成果數(shù)據(jù)。其中,耕地資源管理單元圖(共計(jì)5 922個(gè)圖斑)制作過程中綜合考慮了土壤類型、土地利用類型、地形地貌、灌排狀況等自然條件和社會(huì)經(jīng)濟(jì)條件,每一個(gè)單元圖斑均含有相對均質(zhì)的上述相關(guān)信息;耕地地力調(diào)查點(diǎn)位圖包含2 445個(gè)耕地表層(0 ~ 20 cm)土壤樣點(diǎn),樣點(diǎn)布設(shè)和采集、土壤理化屬性(包括土壤有機(jī)質(zhì)、土壤全氮等)測定等嚴(yán)格執(zhí)行《耕地地力調(diào)查與質(zhì)量評價(jià)技術(shù)規(guī)程》[17]、《測土配方施肥技術(shù)規(guī)范》[18]的技術(shù)要求。此外,根據(jù)研究區(qū)土壤類型、地形地貌和土地利用類型的空間分布,野外補(bǔ)充采集303個(gè)耕地表層樣點(diǎn)(圖2)作為驗(yàn)證數(shù)據(jù),樣點(diǎn)布設(shè)和采集以及土壤理化屬性測定同耕地地力調(diào)查樣點(diǎn)。本研究相關(guān)數(shù)據(jù)信息還包括第二次全國土壤普查數(shù)據(jù)以及2008年10月Landsat衛(wèi)星影像等資料。

        圖1 研究區(qū)耕地管理單元及樣點(diǎn)分布圖

        圖2 研究區(qū)不同土類實(shí)地采樣點(diǎn)分布圖

        1.2 變量遴選與研究方法

        本文從每個(gè)耕地管理單元圖斑提取中心點(diǎn)(含圖斑屬性),得到5 922個(gè)包含土壤有機(jī)質(zhì)、高程、土類、灌溉水平等變量信息的樣點(diǎn),作為構(gòu)建隨機(jī)森林預(yù)測模型的基礎(chǔ)數(shù)據(jù)。為了突顯相關(guān)自然、人為因素對研究區(qū)農(nóng)用地表層土壤有機(jī)質(zhì)含量的影響在空間上的差異性,本研究將農(nóng)用地表層土壤有機(jī)質(zhì)含量分為兩個(gè)構(gòu)成部分[19]:

        y=m+r(1)

        式中:y為第個(gè)樣點(diǎn)的表層土壤有機(jī)質(zhì)含量值;m為其所屬土類所有樣點(diǎn)表層土壤有機(jī)質(zhì)含量的平均值;r為樣點(diǎn)y減去m后的殘差。

        以土壤質(zhì)地、高程、坡度、坡向、地表曲率、歸一化植被指數(shù)(NDVI)、灌溉水平以及排澇能力8個(gè)因子作為輸入變量,構(gòu)建隨機(jī)森林模型表達(dá)上述影響因子與研究區(qū)農(nóng)用地樣點(diǎn)表層土壤有機(jī)質(zhì)含量殘差值r之間復(fù)雜的非線性映射特征:

        r=(1,2,3,4,5,6,7,8) (2)

        式中:1、2、3、4、5、6、7、8分別代表坡度、高程、坡向、地表曲率、NDVI、灌溉水平、排澇能力和土壤質(zhì)地。其中,1、2、3、4、5、6、7、8為耕地管理單元圖斑包含屬性,2通過公式¢=(–min)/(max–min)實(shí)施標(biāo)準(zhǔn)化處理并映射在區(qū)間[0,1]中,以避免其較高的數(shù)值夸大對土壤有機(jī)質(zhì)含量的貢獻(xiàn)[20-21];3取坡向的余弦值來表征北半球坡向?qū)邮芴柟獾挠绊慬22];描述性變量6、7的量化借鑒《輝縣市耕地地力評價(jià)》采用的特爾菲法對概念性因子的作用進(jìn)行歸納、反饋、逐步收縮、集中,最后以隸屬度確定相應(yīng)的賦值(表1);8以土壤黏粒含量的百分比賦值;5基于2008年10月Landsat衛(wèi)星影像在Envi5.1環(huán)境中計(jì)算。

        表1 研究區(qū)灌溉水平和排澇能力賦值

        隨機(jī)森林建模通過R語言中的Random Forest包實(shí)現(xiàn)。隨機(jī)森林是用隨機(jī)手段建立的一個(gè)由多棵決策樹構(gòu)成的森林[8]。隨機(jī)森林模型涉及2個(gè)關(guān)鍵參數(shù):ntree(決策樹的數(shù)量)和mtry(分割節(jié)點(diǎn)的隨機(jī)變量的數(shù)量,一般取自變量個(gè)數(shù)的平方根)。每棵樹構(gòu)建中,利用自助法抽樣(bootstrap)生成新的樣本,約1/3的原始訓(xùn)練集數(shù)據(jù)不會(huì)出現(xiàn),對個(gè)樣本建立個(gè)決策樹模型。沒被抽取的記錄構(gòu)成袋外數(shù)據(jù),袋外誤差的計(jì)算與交叉驗(yàn)證算法類似,因此,隨機(jī)森林模型不需要單獨(dú)再做交叉驗(yàn)證[23-27]。在分類樹的每個(gè)節(jié)點(diǎn)上,從所有變量中隨機(jī)選擇個(gè)預(yù)測變量,進(jìn)而選擇一個(gè)最優(yōu)的進(jìn)行節(jié)點(diǎn)分割,再匯總所有分類樹的結(jié)果。隨機(jī)森林算法能在運(yùn)算量沒有顯著增加的前提下提高預(yù)測精度,且對多元共線性不敏感,有缺失數(shù)據(jù)和非平衡的數(shù)據(jù)時(shí)也比較穩(wěn)健[25-28]?;诔醪浇Y(jié)果,本研究在隨機(jī)森林實(shí)際建模操作中,設(shè)定ntree為2 000,它不僅可以產(chǎn)生穩(wěn)定的袋外誤差率,數(shù)值也較小,能最大化提高計(jì)算效率,mtry設(shè)置為3。

        1.3 模型驗(yàn)證

        模型預(yù)測結(jié)果采用3種方式進(jìn)行驗(yàn)證:第一,將本研究獲取的原始數(shù)據(jù)劃分為訓(xùn)練集和檢驗(yàn)集,調(diào)整數(shù)據(jù)劃入訓(xùn)練集和檢驗(yàn)集的比例關(guān)系,然后計(jì)算模型輸出結(jié)果的平均誤差(ME)、平均絕對誤差(MAE)、均方根誤差(RMSE)和相關(guān)系數(shù)(),ME越接近0、MAE和RMSE越小、越接近1,則表明隨機(jī)森林模型的預(yù)測精度越高;第二,為進(jìn)一步驗(yàn)證隨機(jī)森林模型預(yù)測值的精度,將隨機(jī)森林模型預(yù)測的非空間結(jié)果(耕地管理單元圖斑中心點(diǎn)的有機(jī)質(zhì)預(yù)測值)賦值給研究區(qū)耕地資源管理單元圖斑,輸出預(yù)測有機(jī)質(zhì)含量分布的柵格地圖,利用Map Comparison Kit 3軟件與已有耕地管理單元有機(jī)質(zhì)分布圖(經(jīng)輝縣耕地地力評價(jià)專項(xiàng)項(xiàng)目驗(yàn)收的有機(jī)質(zhì)分布圖)進(jìn)行對比[14],計(jì)算兩幅圖的相關(guān)系數(shù);第三,使用樣點(diǎn)實(shí)測數(shù)據(jù)對模型進(jìn)行檢驗(yàn),研究區(qū)不同土壤類型按面積比例共計(jì)選擇303個(gè)農(nóng)用地樣點(diǎn)進(jìn)行實(shí)地采樣,測定表層土壤的有機(jī)質(zhì)含量,與訓(xùn)練集和驗(yàn)證集的比例達(dá)到最好的預(yù)測精度時(shí)構(gòu)建的隨機(jī)森林模型預(yù)測的結(jié)果進(jìn)行對比。

        2 結(jié)果與討論

        2.1 表層土壤有機(jī)質(zhì)含量描述性統(tǒng)計(jì)

        研究區(qū)樣點(diǎn)各類土壤表層有機(jī)質(zhì)含量實(shí)測值描述性統(tǒng)計(jì)結(jié)果見表2。5 922個(gè)耕地管理單元中土壤有機(jī)質(zhì)含量平均值為21.53 g/kg,其中,水稻土平均含量最高,為24.47 g/kg,其次是砂姜黑土,為21.67 g/kg。就空間變異特征而言,各土類表層土壤有機(jī)質(zhì)含量的變異系數(shù)均介于10% ~ 100%,屬中等程度變異,且各土類內(nèi)部的變異系數(shù)比較接近。由于風(fēng)砂土土類樣點(diǎn)數(shù)量極少,相關(guān)數(shù)據(jù)的統(tǒng)計(jì)學(xué)意義較弱。

        2.2 表層土壤有機(jī)質(zhì)ri值預(yù)測結(jié)果及精度

        將研究區(qū)5 922個(gè)農(nóng)用地表層土壤樣點(diǎn)分為訓(xùn)練集和檢驗(yàn)集,二者的比例關(guān)系分別設(shè)定為8∶2、7∶3、6∶4,然后基于劃分的訓(xùn)練集利用R語言Random Forest包建立隨機(jī)森林模型,對研究區(qū)農(nóng)用地表層土壤有機(jī)質(zhì)r值進(jìn)行預(yù)測,使用包含不同數(shù)量的訓(xùn)練集所得預(yù)測結(jié)果的精度如表3所示。

        表2 研究區(qū)不同土壤類型有機(jī)質(zhì)含量描述性統(tǒng)計(jì)特征

        表3 隨機(jī)森林模型使用不同訓(xùn)練集時(shí)表層土壤有機(jī)質(zhì)ri值預(yù)測精度

        注:ME為平均誤差;MAE為平均絕對誤差;RMSE為均方根誤差;為皮爾遜相關(guān)系數(shù)。

        從表3數(shù)據(jù)可以看出,當(dāng)訓(xùn)練集與檢驗(yàn)集樣點(diǎn)數(shù)量的比例為8∶2時(shí),用訓(xùn)練集運(yùn)行隨機(jī)森林模型可獲得總體上精度較高的樣點(diǎn)表層土壤有機(jī)質(zhì)r值的預(yù)測結(jié)果。表3中的統(tǒng)計(jì)信息還顯示,運(yùn)行隨機(jī)森林模型獲得的預(yù)測結(jié)果,與訓(xùn)練集樣點(diǎn)、驗(yàn)證集樣點(diǎn)間的相關(guān)性均不顯著(= 0.372 ~ 0.420),但與全區(qū)樣點(diǎn)的對應(yīng)值之間的相關(guān)性顯著提高(= 0.671 ~ 0.829),隨機(jī)森林模型在處理大數(shù)據(jù)方面的優(yōu)勢以及不過度擬合的特征得到體現(xiàn)。

        2.3 表層土壤有機(jī)質(zhì)含量空間預(yù)測結(jié)果

        將隨機(jī)森林模型輸出的表層土壤有機(jī)質(zhì)r值預(yù)測結(jié)果加上對應(yīng)的有機(jī)質(zhì)土類平均值,得到樣點(diǎn)表層土壤有機(jī)質(zhì)含量預(yù)測值,將其賦給樣點(diǎn)所在的耕地資源管理單元多邊形圖斑,得到耕地管理單元有機(jī)質(zhì)含量預(yù)測柵格圖(圖3A)。在GIS環(huán)境中計(jì)算圖3A與已有的耕地管理單元土壤有機(jī)質(zhì)分布圖(圖3B)之間柵格圖像的相關(guān)性,顯示二者的圖像相關(guān)性達(dá)到0.859。通過圖3A和圖3B的對比可以看出:①預(yù)測圖對于表層土壤有機(jī)質(zhì)含量的空間變異趨勢有較好展示,高值區(qū)在預(yù)測圖上同樣出現(xiàn)在研究區(qū)域的東南部分,整體上預(yù)測圖在一定程度上準(zhǔn)確反映了研究區(qū)域農(nóng)用地土壤有機(jī)質(zhì)的變異特征;②在預(yù)測圖中,有機(jī)質(zhì)含量低值區(qū)區(qū)域邊緣不明顯,中部本應(yīng)出現(xiàn)的低值區(qū)在預(yù)測圖中沒有很好呈現(xiàn),而是與周邊土壤有機(jī)質(zhì)含量無顯著差異。這可能是因?yàn)殡S機(jī)森林模型在低值區(qū)域預(yù)測效果不佳,也可能與圖中有機(jī)質(zhì)含量設(shè)置梯度有一定的關(guān)系,以致圖件可讀性較差;③在預(yù)測圖中,有機(jī)質(zhì)含量的變化比較平緩,特別是在相鄰地區(qū)差異不顯著。從實(shí)際情況來看,在相鄰的耕地區(qū)域中,土壤有機(jī)質(zhì)的含量會(huì)有一定的空間自相關(guān)性,受到周邊耕地的影響。在實(shí)現(xiàn)科學(xué)管田、耕地的集約化經(jīng)營中,隱去較小的差異,對于管理上的指導(dǎo)更有其可行性和實(shí)踐性。

        圖3 耕地管理單元有機(jī)質(zhì)含量空間分布:預(yù)測圖(A)和已有圖(B)

        此外,為更形象地對比兩幅柵格地圖,利用Map Comparison Kit,對兩幅圖像的有機(jī)質(zhì)含量數(shù)值采用公式:=(-)/max(abs(-)) 進(jìn)行計(jì)算,式中,為耕地管理單元有機(jī)質(zhì)含量預(yù)測值,為耕地管理單元有機(jī)質(zhì)含量已有值,得到的結(jié)果如圖4所示,有機(jī)質(zhì)預(yù)測圖和已有有機(jī)質(zhì)含量分布圖之間的標(biāo)準(zhǔn)化差異值在有機(jī)質(zhì)東南側(cè)高值區(qū)比較大(0.5左右),在研究區(qū)的其他地方預(yù)測效果比較理想(0 ~ 0.2)。

        2.4 土壤有機(jī)質(zhì)預(yù)測值與實(shí)地采樣點(diǎn)實(shí)測值的對比

        為了更進(jìn)一步探討在該研究區(qū)域基于所選變量構(gòu)建的隨機(jī)森林模型對耕地表層有機(jī)質(zhì)含量預(yù)測結(jié)果的有效性,在研究區(qū)域?qū)嵉夭杉?03個(gè)表層土壤樣本,在實(shí)驗(yàn)室測定各樣點(diǎn)有機(jī)質(zhì)實(shí)際含量,并將樣點(diǎn)的解釋變量代入前述構(gòu)建的最優(yōu)模型(訓(xùn)練集80%),得到303個(gè)樣點(diǎn)的有機(jī)質(zhì)預(yù)測值。將實(shí)測值與預(yù)測值對比,計(jì)算得出皮爾遜相關(guān)系數(shù)為0.595,ME為0.916,MAE為4.481,RMSE為5.958。

        圖4 預(yù)測土壤有機(jī)質(zhì)含量圖與已有土壤有機(jī)質(zhì)含量圖的對比結(jié)果

        本研究中用訓(xùn)練樣本構(gòu)建的模型對全部樣本預(yù)測時(shí)皮爾遜相關(guān)系數(shù)提高到0.67 ~ 0.82,但用實(shí)測樣點(diǎn)數(shù)據(jù)進(jìn)行驗(yàn)證時(shí),預(yù)測值與實(shí)測值的皮爾遜相關(guān)系數(shù)為0.595,可能由于構(gòu)建模型的樣點(diǎn)為測土配方施肥補(bǔ)貼項(xiàng)目及耕地地力評價(jià)專項(xiàng)所得耕地管理單元圖斑提取的中心點(diǎn),其有機(jī)質(zhì)含量與樣點(diǎn)實(shí)測有機(jī)質(zhì)含量有誤差,影響了對實(shí)地樣點(diǎn)有機(jī)質(zhì)含量預(yù)測時(shí)模型的有效性。模型的預(yù)測精度還有進(jìn)一步提高的空間,為得到更為精確的預(yù)測結(jié)果,可以從以下兩方面入手:①進(jìn)一步優(yōu)化進(jìn)入模型構(gòu)建的訓(xùn)練樣本的比例以及隨機(jī)森林模型參數(shù)ntree和mtry的設(shè)置;②探究其他未在本研究體現(xiàn)的密切影響土壤有機(jī)質(zhì)的變量,使所考慮的變量盡可能解釋農(nóng)用地表層土壤有機(jī)質(zhì)含量的差異。

        2.5 不同變量對有機(jī)質(zhì)含量的影響

        毋庸置疑,對于農(nóng)用地表層土壤有機(jī)質(zhì)含量而言,諸多影響因子的重要性各不相同。厘清農(nóng)用地土壤有機(jī)質(zhì)影響因子的相對重要性,對快速提升表層土壤有機(jī)質(zhì)含量、定向培育農(nóng)用地土壤質(zhì)量等土壤利用與管理實(shí)踐,具有極為關(guān)鍵的指導(dǎo)意義。隨機(jī)森林算法一個(gè)很重要的功能,就是在對目標(biāo)變量進(jìn)行分類和回歸的過程中,對解釋變量的重要性進(jìn)行評估。這種重要性評估并非通過統(tǒng)計(jì)顯著性或赤池信息量準(zhǔn)則(akaike information criterion,AIC)等指標(biāo)進(jìn)行間接估計(jì),而是通過森林中每棵樹生長過程中產(chǎn)生的袋外數(shù)據(jù)(out-of-bag, OOB)某一變量加入隨機(jī)噪聲后袋外誤差的變化來判斷的。這個(gè)誤差的增加程度與預(yù)測變量的重要性具有特定比例關(guān)系。誤差隨加入的隨機(jī)噪聲增加越多,則該預(yù)測變量的重要性越高。圖5為本研究在運(yùn)行隨機(jī)森林模型進(jìn)行研究區(qū)農(nóng)用地表層土壤有機(jī)質(zhì)r值預(yù)測過程中,獲得的相關(guān)解釋變量相對重要性排序圖。

        由圖5可以看出,土壤質(zhì)地是研究區(qū)耕地表層土壤有機(jī)質(zhì)含量最重要的影響因子。本研究中的土壤質(zhì)地狀況由土壤機(jī)械組成中黏粒含量百分比代表,因此土壤中黏粒含量的高低顯著影響著土壤有機(jī)質(zhì)的含量。一般而言,黏粒含量越高,表明土壤顆粒的比表面積越大,吸附能力越強(qiáng),與有機(jī)顆粒組成有機(jī)-無機(jī)復(fù)合顆粒及阻止有機(jī)物分解的能力就越強(qiáng);另一方面,黏粒含量高意味著土壤中小空隙比例增加,通氣性較差且易為土壤水占據(jù),好氣性微生物活動(dòng)受限,土壤有機(jī)質(zhì)分解相對緩慢,有利于有機(jī)質(zhì)在土壤中積累。在本研究區(qū),高程是影響農(nóng)用地表層土壤有機(jī)質(zhì)含量的第二重要因素,這可能主要因?yàn)檗r(nóng)用地海拔普遍較低,地勢相對較高的區(qū)域,易于遭受風(fēng)蝕、水蝕以及耕作侵蝕的影響,富含有機(jī)質(zhì)的表層土壤流失,耕層變薄,有機(jī)質(zhì)含量下降。灌溉水平和排澇能力很大程度代表了農(nóng)田基本建設(shè)和田間管理水平的高低,致力于農(nóng)田土壤質(zhì)量培育、基礎(chǔ)肥力提升的各種基礎(chǔ)設(shè)施建設(shè)與耕作管理實(shí)踐,同樣有助于農(nóng)用地表層土壤有機(jī)質(zhì)含量的增加。坡向、坡度、曲率等地形因子對農(nóng)用地表層土壤有機(jī)質(zhì)含量的影響程度不高,主要是因?yàn)檠芯繀^(qū)農(nóng)用地地勢較為平坦,由上述地形因子空間變化導(dǎo)致的微域環(huán)境差異不足以對研究區(qū)域農(nóng)用地表層土壤有機(jī)質(zhì)含量產(chǎn)生較大影響。

        (圖中x1、x2、x3、x4、x5、x6、x7、x8分別代表坡度、高程、坡向、地表曲率、NDVI、灌溉水平、排澇能力和土壤質(zhì)地;MSE為均方誤差)

        3 結(jié)論

        本研究利用研究區(qū)耕地管理單元圖斑含有的所選變量為基礎(chǔ)數(shù)據(jù),構(gòu)建的隨機(jī)森林模型在土壤有機(jī)質(zhì)預(yù)測中具有有效性和可靠性,預(yù)測值在統(tǒng)計(jì)學(xué)意義上與實(shí)際值保持較高的一致性,可視化表達(dá)結(jié)果也有較好的體現(xiàn),展示了研究區(qū)耕地土壤有機(jī)質(zhì)的高低變化趨勢。同時(shí),本研究給出了所選解釋變量對于輝縣耕地表層有機(jī)質(zhì)含量影響的相對重要性。主要結(jié)論如下:①本研究中用訓(xùn)練樣本構(gòu)建的模型對全部樣本預(yù)測時(shí)皮爾遜相關(guān)系數(shù)提高到0.67 ~ 0.82,證明了隨機(jī)森林模型作為一種有效的機(jī)器學(xué)習(xí)方法在大的數(shù)據(jù)集上表現(xiàn)良好。②用實(shí)測樣點(diǎn)數(shù)據(jù)進(jìn)行驗(yàn)證時(shí),預(yù)測值與實(shí)測值的皮爾遜相關(guān)系數(shù)值有所下降,為0.595。③在選取的8個(gè)自變量中,土壤質(zhì)地是輝縣耕地表層土壤有機(jī)質(zhì)含量最重要的影響因子。結(jié)合統(tǒng)計(jì)意義上的預(yù)測精度以及最終的預(yù)測制圖效果,可以認(rèn)為,采用土類為定性輔助變量以及土壤質(zhì)地、NDVI、高程、排灌能力等8個(gè)變量作為自變量,建立隨機(jī)森林模型,對縣域尺度農(nóng)用地表層土壤有機(jī)質(zhì)的含量進(jìn)行預(yù)測,預(yù)測結(jié)果比較符合實(shí)際特征。

        [1] Brady, Nyle C. The nature and properties of soils[M]. New York: MacMillan, 1984

        [2] Skjemstad, J O, Reicosky D C, Wilts A R, et al. Charcoal carbon in U.S. agricultural soils[J]. Soil Science Society of America Journal, 2002, 66(4): 1249–1255

        [3] 張枝枝, 張福平, 燕玉超, 等. 渭河兩岸緩沖帶的土壤有機(jī)質(zhì)含量分布特征及其影響因子[J]. 土壤, 2017, 49(2): 393–399

        [4] 向紅英, 柳維揚(yáng), 彭杰, 等. 基于連續(xù)統(tǒng)去除法的南疆水稻土有機(jī)質(zhì)含量預(yù)測[J]. 土壤, 2016, 48(2): 389-394

        [5] 潘根興, 李戀卿, 張旭輝, 等. 中國土壤有機(jī)碳庫量與農(nóng)業(yè)土壤碳固定動(dòng)態(tài)的若干問題[J]. 地球科學(xué)進(jìn)展, 2003, 18(4): 609–618

        [6] 潘根興. 中國土壤有機(jī)碳庫及其演變與應(yīng)對氣候變化[J]. 氣候變化研究進(jìn)展, 2008, 4(5): 282–289

        [7] 王巖松, 李夢迪, 朱連奇. 土壤有機(jī)碳庫及其影響因素的研究進(jìn)展[J]. 中國農(nóng)學(xué)通報(bào), 2015, 31(32): 123–131

        [8] Breiman L.Random forests[J].Machine Learning, 2001, 45(1): 5–32

        [9] Li Q, Yue T, Wang C, et al. Spatially distributed modeling of soil organic matter across China: An application of artificial neural network approach[J]. CATENA, 2013, 104(Supplement C): 210–218

        [10] Na X D, Zhang S Q, Zhang H Q, et al. Integrating TM and ancillary geographical data with classification trees for land cover classification of marsh area[J]. Chinese Geographical Science, 2009, 19(2): 177–185

        [11] 郭澎濤,李茂芬,羅微,等. 基于多源環(huán)境變量和隨機(jī)森林的橡膠園土壤全氮含量預(yù)測[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2015, 31(5): 194–200

        [12] Grimm R, Behrens T, M?rker M, et al. Soil organic carbon concentrations and stocks on Barro Colorado Island-Digital soil mapping using Random Forests analysis[J]. Geoderma, 2008, 146: 102–113

        [13] Wiesmeier M, Barthold F, Blank B, et al. Digital mapping of soil organic matter stocks using Random Forest modeling in a semi-arid steppe ecosystem[J]. Plant and Soil, 2011, 340(1/2): 7–24

        [14] Heung B, Bulmer C E, Schmidt M G. Predictive soil parent material mapping at a regional-scale: A Random Forest approach[J]. Geoderma, 2014, 214/215(2): 141–154

        [15] Guo P T, Li M F, Luo W, et al. Digital mapping of soil organic matter for rubber plantation at regional scale: An application of random forest plus residuals kriging approach[J]. Geoderma, 2015, 237/238: 49–59

        [16] 郭治興, 袁宇志, 郭穎, 等. 基于地形因子的土壤有機(jī)碳最優(yōu)估算模型[J]. 土壤學(xué)報(bào), 2017, 54(2): 331–343

        [17] 中華人民共和國農(nóng)業(yè)部. 耕地地力調(diào)查與質(zhì)量評價(jià)技術(shù)規(guī)程: NY/T 1634—2008[S]. 北京: 中國標(biāo)準(zhǔn)出版社, 2008

        [18] 中華人民共和國農(nóng)業(yè)部. 測土配方施肥技術(shù)規(guī)范NY/N 1118—2006[S]. 北京: 中國標(biāo)準(zhǔn)出版社, 2006

        [19] 李啟權(quán), 王昌全, 岳天祥, 等. 基于定性和定量輔助變量的土壤有機(jī)質(zhì)空間分布預(yù)測——以四川三臺(tái)縣為例[J]. 地理科學(xué)進(jìn)展, 2014, 33(2): 259–269

        [20] 張晉昕, 李河. 回歸分析中定性變量的賦值[J]. 循證醫(yī)學(xué), 2005, 5(3): 169–171

        [21] 馬立平. 統(tǒng)計(jì)數(shù)據(jù)標(biāo)準(zhǔn)化──無量綱化方法──現(xiàn)代統(tǒng)計(jì)分析方法的學(xué)與用(三)[J]. 北京統(tǒng)計(jì), 2000(3): 34–35

        [22] 李立東, 陳杰, 宋軒, 等. 空間回歸模型在區(qū)域數(shù)字化土壤制圖中的應(yīng)用——以河南封丘縣為例[J]. 土壤學(xué)報(bào), 2013, 50(1): 21–29

        [23] 王茵茵, 齊雁冰, 陳洋, 等. 基于多分辨率遙感數(shù)據(jù)與隨機(jī)森林算法的土壤有機(jī)質(zhì)預(yù)測研究[J]. 土壤學(xué)報(bào), 2016, 53(2): 342–354

        [24] 張海陽, 齊俊傳, 毛健. 基于R語言的數(shù)據(jù)挖掘算法研究[J]. 電腦知識(shí)與技術(shù), 2016, 12(28): 16–19

        [25] 方匡南, 吳見彬, 朱建平, 等. 隨機(jī)森林方法研究綜述[J]. 統(tǒng)計(jì)與信息論壇, 2011(3): 32–38

        [26] 李欣海. 隨機(jī)森林模型在分類與回歸分析中的應(yīng)用[J].. 應(yīng)用昆蟲學(xué)報(bào), 2013, 50(4): 1190–1197

        [27] 張良均, 謝佳標(biāo), 楊坦, 等. R語言與數(shù)據(jù)挖掘[M]. 北京: 機(jī)械工業(yè)出版社, 2016

        [28] 張雷, 王琳琳, 張旭東, 等. 隨機(jī)森林算法基本思想及其在生態(tài)學(xué)中的應(yīng)用——以云南松分布模擬為例[J]. 生態(tài)學(xué)報(bào), 2014, 34(3): 650–659

        Spatial Prediction of SOM Content in Topsoil Based on Random Forest Algorithm: A Case Study of Huixian City, Henan Province

        HAN Xingxing1, CHEN Jie1*,WANG Haiyang1, WU Zhenfu2, CHENG Daoquan3

        (1 School of Water Conservation and Environment, Zhengzhou University, Zhengzhou 450001, China; 2 School of Public Administration, Zhengzhou University, Zhengzhou 450001, China; 3 Soil and Fertilizer Station of Henan Province, Zhengzhou 450002, China)

        The content of topsoil organic matter strongly influences the growth of crops, so understanding its spatial distribution is of great significance in guiding agricultural production and improving soil fertility. Taking 5 922 center points of polygons in the map of cultivated land management units of the Huixian City in Henan Province as the basic data, this study tried to evaluate the complex non-linear relationship between topsoil organic matter content and influential factors at the county scale by using the model of random forest (RF). Each point included soil types, which were the auxiliary qualitative variables, environmental variables (slope, curvature, slope, elevation, soil texture, NDVI) and socio-economic factors (drainage capacity, irrigation status), and in addition, 5 922 center points was randomly divided into the training data set and verification data set with the ratio of 8︰2, 7︰3 and 6︰4 separately. Then the accuracy of predicted map of SOM was evaluated by three ways according to the model. The results showed that when the ratio of the training data set and verification data was 8︰2, the prediction accuracy of RF model was generally higher, and the correlation was 0.859 between the predicted and the existing maps of SOM. Pearson correlation coefficient was 0.595 between the predicated and measured data of 303 field points. Based on the importance of the influential factors, it was found that soil texture was the most important variable affecting distribution of SOM in the agricultural land of the study area. The results demonstrate that the RF method, as a machine learning and data mining approach, can simulate relationships between the input variables and SOM content, meanwhile, the maps can show reliable predicted results of SOM but couldn’t disclose the fine differences in SOM.

        Random forest; Soil organic matter; Agricultural land predictive mapping; Huixian City

        國家自然科學(xué)基金項(xiàng)目(40971128)資助。

        通訊作者(jchen@zzu.edu.cn)

        韓杏杏(1994—),女,河南許昌人,碩士研究生,主要從事土地資源管理、土地資源評價(jià)、土壤空間預(yù)測與數(shù)字化制圖方面的研究。E-mail: 1085310871@qq.com

        S159-3

        A

        10.13758/j.cnki.tr.2019.01.021

        猜你喜歡
        耕地模型研究
        一半模型
        自然資源部:加強(qiáng)黑土耕地保護(hù)
        我國將加快制定耕地保護(hù)法
        FMS與YBT相關(guān)性的實(shí)證研究
        保護(hù)耕地
        北京測繪(2021年12期)2022-01-22 03:33:36
        新增200億元列入耕地地力保護(hù)補(bǔ)貼支出
        遼代千人邑研究述論
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        視錯(cuò)覺在平面設(shè)計(jì)中的應(yīng)用與研究
        科技傳播(2019年22期)2020-01-14 03:06:54
        亚洲欧美精品suv| 亚洲女同恋中文一区二区| 在线亚洲妇色中文色综合| 伊人久久精品亚洲午夜| 欧美乱人伦人妻中文字幕| 怡春院欧美一区二区三区免费| 无码丰满熟妇浪潮一区二区av| 天堂网av在线免费看| 国产午夜精品无码| 国产一区二区三区影院| 国产一区二区三区韩国| 国产女主播一区二区三区在线观看| 亚洲 欧美 综合 在线 精品 | 欧美尺寸又黑又粗又长| 精品人伦一区二区三区蜜桃麻豆| 免费在线观看草逼视频| 成人欧美一区二区三区在线| 免费无码午夜福利片69| 国产一起色一起爱| 日日麻批免费高清视频| 午夜精品射精入后重之免费观看| 久久久久久av无码免费看大片| 亚欧视频无码在线观看| 国产三级精品三级男人的天堂| 婷婷五月婷婷五月| 欧美日韩国产免费一区二区三区欧美日韩| 久久不见久久见中文字幕免费| 美女裸体自慰在线观看| 天堂av在线免费播放| 一本色道久久亚洲加勒比| 欧美精品videossex少妇| 欧美日韩国产成人综合在线影院| 国产自拍三级黄片视频| 国模精品一区二区三区| 馬与人黃色毛片一部| 国产毛片一区二区三区| 亚洲大尺度无码无码专区| 国产成人无码区免费内射一片色欲| 中文字幕无码免费久久9一区9| 国产91精品一区二区麻豆亚洲| 欧美真人性野外做爰|