謝恩澤 趙永存? 陸訪儀 史學(xué)正 于東升
(1 土壤與農(nóng)業(yè)可持續(xù)發(fā)展國家重點實驗室(中國科學(xué)院南京土壤研究所),南京 210008)
(2 中國科學(xué)院大學(xué),北京 100049)
土壤有機(jī)質(zhì)(Soil organic matter, SOM)是土壤的重要組成部分,盡管只占土壤總質(zhì)量的很小一部分,但其作為土壤肥力形成的基礎(chǔ),不但影響土壤質(zhì)量及關(guān)鍵功能,而且在陸地生態(tài)系統(tǒng)物質(zhì)循環(huán)中扮演重要角色[1-3]。因此,利用不同空間預(yù)測方法對比預(yù)測農(nóng)田SOM,對于準(zhǔn)確把握SOM的空間分布規(guī)律和土壤資源管理的科學(xué)決策,進(jìn)而保障糧食安全、氣候安全及土壤安全具有重要意義。
地統(tǒng)計學(xué)方法廣泛用于土壤屬性空間預(yù)測[4]。而克里格法是其中最準(zhǔn)確,強(qiáng)大的插值方法之一[5]。徐尚平等[6]基于半方差函數(shù)和普通克里格方法分析了內(nèi)蒙古地區(qū)SOM含量的空間結(jié)構(gòu)特征;Mushtaq等[7]采用普通克里格方法描繪了克什米爾農(nóng)業(yè)區(qū)土壤微量元素的空間分布;Heba等[8]則利用普通克里格方法對尼羅河三角洲地區(qū)的土壤碳庫和氮庫的空間分布特征進(jìn)行了深入分析。這些結(jié)果表明,克里格方法在不同區(qū)域、不同土壤性質(zhì)的空間變化中均能得到較好的預(yù)測結(jié)果。遙感和數(shù)字制圖技術(shù)的快速發(fā)展,為空間預(yù)測提供了大量廉價且與土壤形成過程直接或間接相關(guān)的輔助數(shù)據(jù),比如,DEM、植被指數(shù)及生物量、光譜反射率、數(shù)字化的土壤圖、土地利用/覆蓋圖等。這些輔助數(shù)據(jù)提供了關(guān)于土壤性質(zhì)變異性的先驗信息,從而使得整合輔助數(shù)據(jù)先驗信息的回歸克里格等混合建模方法得到了快速發(fā)展。Hengl等[9]以土壤圖和DEM獲取的地形因子為輔助數(shù)據(jù),采用回歸克里格方法預(yù)測了克羅地亞SOM的空間分布;Andrew等[10]則采用回歸克里格方法整合紅外光譜數(shù)據(jù),大大提高了土壤全碳、氮等土壤屬性的預(yù)測精度。回歸克里格方法不但反映了輔助因子對土壤屬性空間分異的潛在影響,同時,趨勢項的分離和殘差的再預(yù)測也使得其空間預(yù)測精度通常要優(yōu)于普通克里格方法。近年來,隨機(jī)森林作為經(jīng)典的機(jī)器學(xué)習(xí)模型之一,由于具有處理高維度數(shù)據(jù)、防止過度擬合、提供輔助因子的重要性度量等優(yōu)勢,在土壤空間預(yù)測,特別是地形分異明顯地區(qū)的土壤空間預(yù)測中也逐漸得到廣泛應(yīng)用。比如,Mareike等[11]在厄瓜多爾南部高程起伏1.7~3.2 km的安第斯山脈典型區(qū)中,利用隨機(jī)森林方法成功地預(yù)測了土壤質(zhì)地的空間分布;Dharumarajan等[12]以印度南部安得拉邦阿嫩達(dá)布爾區(qū)的Bukkarayasamudrum mandal為研究區(qū),在高程(295~595 m)較復(fù)雜多變的情況下利用地形、植被等輔助數(shù)據(jù),采用隨機(jī)森林方法預(yù)測了土壤有機(jī)碳、pH和電導(dǎo)率的空間分布;而Zhi等[13]則通過隨機(jī)森林方法并整合DEM獲取的地形因子、遙感影像獲取的光譜反射率及植被指數(shù)等輔助數(shù)據(jù)預(yù)測了青藏高原地區(qū)高山草氈層的空間分布。隨機(jī)森林方法在地形復(fù)雜且人為活動影響相對較弱的區(qū)域土壤空間預(yù)測中得到了較為成功的應(yīng)用,而在地形平坦、人為影響強(qiáng)烈的地區(qū)應(yīng)用效果則依然不清楚。
上述研究可以看出,不同預(yù)測方法利用輔助因子在平原地區(qū)的應(yīng)用仍需進(jìn)一步探討。所以,選擇地勢平坦的江蘇南部(蘇南)為研究區(qū),以影響土壤生態(tài)系統(tǒng)服務(wù)功能的關(guān)鍵因子SOM為研究對象,以輔助因子與SOM的相關(guān)性強(qiáng)弱及輔助因子的可獲取性為切入點,通過回歸克里格和隨機(jī)森林方法與傳統(tǒng)的普通克里格方法對比分析來研究不同空間預(yù)測方法對該區(qū)SOM空間分布預(yù)測的影響,以便為準(zhǔn)確預(yù)測該區(qū)SOM空間分布規(guī)律,進(jìn)而為通過科學(xué)調(diào)控不同區(qū)域SOM來實現(xiàn)關(guān)鍵土壤生態(tài)系統(tǒng)服務(wù)功能提供科學(xué)依據(jù)。
研究區(qū)為江蘇省南部地區(qū)(30°44′~32°16′N,118°29′~121°19′E)。該區(qū)屬北亞熱帶季風(fēng)氣候,四季分明,雨量充沛,年均溫16℃,年均降雨量1 000 mm。全區(qū)地勢西高東低,太湖平原地區(qū)地勢平坦,河流湖泊較多,主要土壤類型為水稻土,沿江地區(qū)則以灰潮土為主。研究區(qū)西部及西南部多為丘陵、低山崗地,土壤類型主要為黃棕壤。研究區(qū)農(nóng)耕條件優(yōu)越,工業(yè)經(jīng)濟(jì)發(fā)展迅速,城鎮(zhèn)化水平較高,是長三角地區(qū)經(jīng)濟(jì)最為發(fā)達(dá)的地區(qū)之一。
土壤采樣點位置根據(jù)該區(qū)20世紀(jì)80年代第二次土壤普查結(jié)果進(jìn)行布設(shè),共413個(圖1),采樣時間為2000年,采樣深度為0~20 cm。采樣同時記錄了樣點的GPS位置信息以及環(huán)境條件和主要農(nóng)業(yè)管理措施信息。土壤有機(jī)質(zhì)(SOM)含量采用重鉻酸鉀氧化-外加熱法測定,全氮采用半微量開氏法測定,有效磷采用碳酸氫鈉浸提-鉬銻抗比色法測定,速效鉀采用乙酸銨浸提-火焰光度法測定,pH采用電位法(土︰水=1︰2.5)測定,機(jī)械組成采用吸管法測定[14]。其中,土壤全氮、有效磷、速效鉀、pH及黏粒含量主要用于SOM空間預(yù)測的輔助土壤屬性因子。
圖1 蘇南地區(qū)地形及土壤采樣點分布圖Fig. 1 Topographic map of South Jiangsu and distribution of soil sampling sites
SOM空間預(yù)測的其他輔助因子數(shù)據(jù)包括:20世紀(jì)80年代初始SOM含量(Initial SOM,SOM1980),來源于研究區(qū)各縣/區(qū)的土壤普查報告;江蘇省1︰20萬土壤圖;江蘇省30 m分辨率D E M計算的主要地形因子,包括高程(Elevation, Elev)、坡度(Slope)、平面曲率(Plane curvature, Planc)、剖面曲率(Profile curvature, Profc)和復(fù)合地形指數(shù)(Compound terrain index, CTI);1 km×1 km的年均氣溫(Mean annual temperature, Mat)和降雨量(Mean annual precipitation, Map)數(shù)據(jù)(1976—2005年平均,來源于碳專項)。除了上述常用于SOM空間輔助預(yù)測的因子外,本研究也考慮了一些容易獲取且免費(fèi)的數(shù)據(jù)產(chǎn)品,以檢驗其在提高SOM空間預(yù)測精度中的可行性,這些因子包括:土壤溫度(Soil temperature, ST)和土壤濕度(Soil moisture,SM)1 km×1 km柵格數(shù)據(jù)(2000年月平均,分別來源于歐洲中期天氣預(yù)報中心(ECMWF)和Earthdata);遙感反演的5 km×5 km凈初級生產(chǎn)力(Net Primary Production, NPP)數(shù)據(jù)(1980—2000年平均,來源于北京師范大學(xué));5 km×5 km年均氮肥用量(Nitrogen fertilizer, N-fert)柵格數(shù)據(jù)(1994—2001年平均,來源于美國國家航空航天局(National Aeronautics and Space Administration,NASA)社會經(jīng)濟(jì)數(shù)據(jù)應(yīng)用中心)。其中遙感NPP主要用于估算農(nóng)田作物還田碳輸入。農(nóng)作物碳投入主要包括:秸稈還田、作物根茬殘留和作物地下生物量。根據(jù)周睿等[15]區(qū)域農(nóng)田有機(jī)物質(zhì)的估算方法利用NPP數(shù)據(jù)進(jìn)行農(nóng)田碳投入的碳估算:
Btotal=α×NPP式中,Btotal為作物整株生物量(包括地上和地下),單位為g·m-2(生物量按C計算);NPP為凈初級生產(chǎn)力;α為碳-干物質(zhì)系數(shù)。由作物的根冠比、收獲指數(shù),秸稈還田比例計算農(nóng)田碳投入。
對于土壤SOM1980、TN、Ap、Ak、pH和Clay等點位測定數(shù)據(jù),采用普通克里格方法預(yù)測提取300 m×300 m柵格數(shù)據(jù),插值后的柵格數(shù)據(jù)作為SOM空間預(yù)測的輔助因子。對于30 m分辨率DEM計算得到的Elev、Slope、Planc、Profc和CTI等輔助預(yù)測因子,采用鄰域平均法將尺度降至300 m×300 m柵格,以消減土壤樣點可能存在的GPS定位誤差對空間預(yù)測的影響。而對于空間分辨率相對較低的ST、SM、和N-fert等輔助預(yù)測數(shù)據(jù)則采用普通克里格方法插值將尺度升至300 m×300 m柵格作為SOM空間預(yù)測的輔助因子。
首先,采用皮爾森相關(guān)分析對SOM空間預(yù)測的輔助因子進(jìn)行初步篩選。表1相關(guān)分析的結(jié)果表明,Clay、SOM1980、TN、Ak、pH、SD、CT、Elev、Profc、Mat、Map、InputC、SM、ST、N-fert共15個輔助預(yù)測因子與SOM含量顯著相關(guān),可潛在地用于SOM含量空間分布預(yù)測。
表1 土壤有機(jī)質(zhì)含量與輔助預(yù)測因子的相關(guān)系數(shù)Table 1 Pearson correlation coefficients between soil organic matter content and auxiliary factors
其次,對于皮爾森相關(guān)分析初步篩選的15個輔助預(yù)測因子,進(jìn)一步采用逐步回歸分析進(jìn)行篩選,以便避免因子間的共線性效應(yīng)。同時,為探討輔助預(yù)測因子與SOM相關(guān)性強(qiáng)弱對不同空間預(yù)測方法預(yù)測精度的潛在影響,在逐步回歸分析過程中,考慮了保留相關(guān)性最強(qiáng)的輔助預(yù)測因子TN和移除TN兩種情況以便進(jìn)行對比分析。逐步回歸的篩選主要是以最小信息準(zhǔn)則(AIC)為衡量標(biāo)準(zhǔn),通過選擇最小的AIC信息統(tǒng)計量,來達(dá)到刪除變量的目的,直到當(dāng)去掉某一因子時AIC均增加,逐步回歸分析終止,達(dá)到最優(yōu)模型。由此得到,保留相關(guān)性最強(qiáng)的輔助預(yù)測因子TN的條件下,逐步回歸篩選得到的SOM輔助預(yù)測因子分別為:TN、SOM1980、SD、Mat、SM、Clay;移除與SOM相關(guān)性最強(qiáng)的TN預(yù)測因子的條件下,逐步回歸保留的輔助預(yù)測因子包括SD、Elev、Mat、InputC、Map、ST和SOM1980共七個因子(表2)。
表2 土壤有機(jī)質(zhì)(SOM)預(yù)測輔助因子的逐步回歸分析Table 2 Stepwise regression analysis of auxiliary factors for prediction of soil organic matter (SOM)
普通克里格(Ordinary kriging,OK):基于土壤屬性的空間自相關(guān)性,通過鄰近的相關(guān)觀測點的權(quán)重均值來預(yù)測采樣點位置的土壤屬性[16]。本文通過SOM含量半方差函數(shù)及擬合參數(shù),采用OK方法預(yù)測SOM空間分布。
回歸克里格(Regression kriging,RK):首先基于逐步回歸分析保留的輔助預(yù)測因子,采用多元線性回歸(MLR)對SOM進(jìn)行預(yù)測,然后對多元回歸預(yù)測的SOM殘差進(jìn)行OK預(yù)測,最后將回歸預(yù)測值與殘差的OK預(yù)測值相加得到SOM的預(yù)測值[8]。
隨機(jī)森林(Random forest,RF):首先基于逐步回歸篩選的預(yù)測因子和SOM觀測數(shù)據(jù),對隨機(jī)森林模型中的關(guān)鍵參數(shù)每次分裂向量數(shù)(mtry)進(jìn)行參數(shù)優(yōu)化,然后采用經(jīng)參數(shù)優(yōu)化后的RF模型對SOM空間分布進(jìn)行預(yù)測。參數(shù)優(yōu)化過程中,分裂節(jié)點隨機(jī)向量數(shù)量ntree設(shè)定為1 000,以預(yù)測誤差最小化為目標(biāo)函數(shù),通過遍歷比較確定mtry的最優(yōu)值[17](根據(jù)預(yù)測因子的個數(shù)設(shè)置mtry參數(shù)為1~7,并進(jìn)行建模),以運(yùn)行100次的平均RMSE結(jié)果尋找最優(yōu)參數(shù)。結(jié)果表明,當(dāng)保留與SOM相關(guān)性最強(qiáng)的預(yù)測因子TN時,mtry最優(yōu)值為4,而移除相關(guān)性最強(qiáng)的輔助因子TN時,mtry最優(yōu)值為1。
SOM的空間預(yù)測精度采用獨立驗證進(jìn)行評價。為了使模型每次驗證的結(jié)果覆蓋到整個樣點數(shù)據(jù)集,將樣點數(shù)據(jù)集分成預(yù)測集和驗證集進(jìn)行三折獨立驗證(即將樣點數(shù)據(jù)隨機(jī)分成三份,分三次取其中兩份為預(yù)測數(shù)據(jù)集,一份為驗證數(shù)據(jù)集),循環(huán)執(zhí)行三折獨立驗證100次,通過比較100次得到的驗證數(shù)據(jù)點位置上SOM均方根誤差進(jìn)行空間預(yù)測精度分析。其中,均方根誤差(RMSE)的計算公式為:
式中,zi為第i個樣點的預(yù)測值;zi為第i個樣點的實際值;n為樣點個數(shù)。RMSE的結(jié)果越小表明預(yù)測精度越高。
本研究中輔助數(shù)據(jù)的篩選、尺度轉(zhuǎn)換等數(shù)據(jù)處理均采用R軟件進(jìn)行分析,其中OK、RK和RF及空間預(yù)測精度分析采用R語言編程計算,SOM空間分布采用Arcmap10.2軟件進(jìn)行制圖。
研究區(qū)413個樣點的描述統(tǒng)計分析(圖2)結(jié)果表明,農(nóng)田土壤耕層SOM平均含量為29.29 g·kg-1,中值與均值較為接近,為28.79 g·kg-1,高于江蘇北部的黃淮平原和東部濱海平原,略高于江淮平原地區(qū)[18];標(biāo)準(zhǔn)差為7.18 g·kg-1,變異系數(shù)(CV)為25%,變異程度中等;SOM含量介于7.75~58.31 g·kg-1之間,極差為50 g·kg-1。SOM含量的頻率分布直方圖表現(xiàn)為稍向均值右側(cè)偏離,偏度系數(shù)為0.35,峰度值為0.75,表現(xiàn)為近似正態(tài)分布。
圖2 土壤有機(jī)質(zhì)含量的描述統(tǒng)計及頻數(shù)分布直方圖Fig. 2 Descriptive statistics and histogram of soil organic matter(SOM) contents
從不同空間預(yù)測方法100次三折獨立驗證的結(jié)果(圖3)來看。OK方法的預(yù)測誤差最大,空間預(yù)測的均方根誤差(RMSE)均值為6.97 g·kg-1,僅能解釋SOM方差的9.7%;當(dāng)整合與SOM相關(guān)性最強(qiáng)的輔助預(yù)測因子TN后,RK和RF預(yù)測方法的RMSE均值分別降低至5.25 g·kg-1和4.97 g·kg-1,分別降低了25%和29%,同時,RK和RF方法預(yù)測結(jié)果對SOM方差的解釋程度分別提高到了51%和55%,RF方法均方根誤差的四分位距亦較RK方法小,表明整合與SOM相關(guān)性最強(qiáng)的輔助預(yù)測因子TN時,RF方法預(yù)測的穩(wěn)健性更好。然而,當(dāng)不整合與SOM相關(guān)性最強(qiáng)的輔助預(yù)測因子TN時,進(jìn)入空間預(yù)測過程的其余輔助預(yù)測因子與SOM的相關(guān)性減弱(表1、表2),RK和RF方法預(yù)測的RMSE均值也分別增加至6.21 g·kg-1和6.29 g·kg-1,相應(yīng)的SOM方差解釋程度亦分別降低至29%和28%,同時,RK方法均方根誤差的四分位距也較RF方法稍小,表明在不整合與SOM相關(guān)性強(qiáng)的輔助因子TN時,RK方法預(yù)測的精度及穩(wěn)健性較RF方法稍好。此外,盡管不整合與SOM相關(guān)性最強(qiáng)的輔助預(yù)測因子TN時,SOM的預(yù)測精度要較整合輔助預(yù)測因子TN時低,但其預(yù)測精度依然較OK方法高。
圖3 不同空間預(yù)測方法的預(yù)測誤差對比Fig. 3 Comparison between the spatial prediction methods in deviation
從不同方法預(yù)測的SOM含量空間分布圖來看(圖5),SOM含量空間分布的總體趨勢大體一致,主要表現(xiàn)為研究區(qū)西部的丹陽-金壇-溧陽一線含量相對較低,SOM含量變化范圍集中在15~35 g·kg-1,而研究區(qū)東部到東南部的常熟-昆山-吳江一線SOM含量相對較高,大多數(shù)為25~45 g·kg-1。OK方法預(yù)測的SOM含量空間分布模式表現(xiàn)為具有較多的、局部分布的島狀高值區(qū)和低值區(qū),且島狀區(qū)域分布較為零散。與OK方法相比,RK和RF兩種方法預(yù)測的SOM空間分布的低值區(qū)連續(xù)性稍好,同時,昆山南部和吳江南部的SOM高值區(qū)也得到了更好的表達(dá)。然而,考慮到是否整合與SOM相關(guān)性最強(qiáng)的輔助預(yù)測因子時,RK和RF兩種方法預(yù)測的SOM空間分布也存在一定的差異性。當(dāng)在空間預(yù)測過程中整合了與SOM相關(guān)性最強(qiáng)的輔助預(yù)測因子(比如TN)時,除了RF方法能夠進(jìn)一步表達(dá)太倉東部地區(qū)的SOM低值區(qū)外,RK和RF兩種方法預(yù)測的SOM空間分布基本完全一致;當(dāng)移除與SOM相關(guān)性最強(qiáng)的輔助預(yù)測因子TN后,其余輔助預(yù)測因子與SOM的相關(guān)性較弱,此時,與RK方法預(yù)測的SOM空間分布模式相比,RF預(yù)測結(jié)果中,研究區(qū)西部丹陽-金壇-溧陽一線的SOM含量低值區(qū)范圍變大,同時研究區(qū)東部的SOM高值區(qū)的范圍亦明顯增加。
在樣點數(shù)量及樣點空間位置不變的條件下,OK方法的空間預(yù)測精度在很大程度上取決于待預(yù)測目標(biāo)土壤屬性的空間變異結(jié)構(gòu)[19]。從SOM含量半方差函數(shù)的擬合結(jié)果來看(表3),研究區(qū)SOM含量的空間相關(guān)性較弱,其中塊金值與基臺值的比值高達(dá)83%,表明耕作、施肥等隨機(jī)因素的強(qiáng)烈影響削弱了SOM的空間自相關(guān)性[20],可能是導(dǎo)致OK方法預(yù)測精度低的主要原因之一。
整合與SOM具有一定相關(guān)性的輔助預(yù)測因子后,RK和RF方法均能在一定程度上提高SOM的空間預(yù)測精度。Knotters[21]和Ahmed[22]研究結(jié)果表明,在插值方法中使用輔助因子有兩個重要特性需要考慮,首先是輔助因子和目標(biāo)變量之間的相關(guān)性強(qiáng)弱,其次是預(yù)測的殘差是否具有一定的空間結(jié)構(gòu)性。當(dāng)整合與SOM相關(guān)性較強(qiáng)的輔助預(yù)測因子(比如TN)后,RF的預(yù)測精度顯著提高,表明RF方法預(yù)測精度主要受目標(biāo)變量與輔助預(yù)測因子間的相關(guān)性強(qiáng)弱所控制。而對于RK方法而言,整合高相關(guān)性的輔助預(yù)測因子的預(yù)測精度也較不整合時要高,但由于整合高相關(guān)性的輔助預(yù)測因子后分離出的殘差缺乏空間相關(guān)性而導(dǎo)致RK方法的預(yù)測精度低于RF方法。
圖4 不同方法預(yù)測SOM空間分布Fig. 4 SOM spatial distribution maps based on prediction using different prediction methods
表3 土壤有機(jī)質(zhì)含量的半方差函數(shù)模型及擬合參數(shù)Table 3 Semi-variogram model and fitting parameters of soil organic matter content
在不整合高度相關(guān)的輔助預(yù)測因子TN的條件下,RK方法預(yù)測精度仍然較RF方法稍高,表明RK方法的預(yù)測精度除了與目標(biāo)變量(比如本研究中的SOM)和輔助因子間的相關(guān)性強(qiáng)弱有關(guān)外[23],還在很大程度上受目標(biāo)變量多元回歸(MLR)預(yù)測殘差的空間變異結(jié)構(gòu)影響[24]。比如,從整合與不整合輔助預(yù)測因子TN的MLR殘差的半方差函數(shù)對比來看(表3),在輔助數(shù)據(jù)與SOM相關(guān)性較強(qiáng)的條件下(整合TN后),由于SOM的大部分趨勢組分被MLR所分離,導(dǎo)致SOM的殘差半方差函數(shù)基本為純塊金效應(yīng),即趨勢性組分預(yù)測精度高而殘差預(yù)測精度降低;而在輔助數(shù)據(jù)與SOM的相關(guān)性較弱的條件下(不整合TN),盡管輔助數(shù)據(jù)MLR分離的SOM趨勢組分相對較少,但SOM殘差的半方差函數(shù)相比于整合TN條件下依然具有一定的結(jié)構(gòu)性,從而殘差的預(yù)測精度能夠有所提升。從數(shù)據(jù)來源分析,由于土壤全氮含量獲取成本較高,而移除全氮因子后回歸模型中保留的氣象、DEM、土壤圖及初始SOM含量等輔助預(yù)測數(shù)據(jù)(表1)則相對較為容易獲取,因此,從這一點來看,在輔助預(yù)測數(shù)據(jù)與SOM有相關(guān)性,但相關(guān)性相對較弱的條件下,傳統(tǒng)的RK方法在本研究區(qū)SOM空間預(yù)測上仍然具有較高的應(yīng)用價值。
本研究區(qū)地勢平坦,DEM獲取的地形因子在SOM預(yù)測應(yīng)用中還有一定的局限性,同時,本研究區(qū)土壤受人為活動影響強(qiáng)烈,目前容易獲取、相對廉價且可能用于輔助SOM空間預(yù)測的數(shù)據(jù)在提高本研究區(qū)SOM空間預(yù)測精度方面還面臨諸多挑戰(zhàn)。比如,相對于本研究區(qū)的面積(2.7萬km2)而言,盡管土壤濕度、溫度、氮肥施用量等輔助數(shù)據(jù)比較容易獲取,但依然存在空間分辨率相對較低,難以和SOM觀測點數(shù)據(jù)進(jìn)行尺度匹配等問題。Li[25]利用RK方法預(yù)測SOM空間分布的研究結(jié)果表明,目標(biāo)變量和輔助因子的空間尺度匹配性直接影響SOM的空間預(yù)測精度。因此,如何對現(xiàn)有容易獲取且廉價但相對粗糙的輔助數(shù)據(jù)進(jìn)行尺度轉(zhuǎn)換以便更好地識別輔助數(shù)據(jù)與SOM間潛在的相關(guān)性是未來需要進(jìn)一步研究的問題。此外,對本研究區(qū)而言,SOM除了受土壤類型等環(huán)境因子影響外,SOM含量特別是表層SOM含量還受施肥、耕作、秸稈管理等農(nóng)業(yè)管理措施的強(qiáng)烈影響[26]。作物殘茬的C輸入是影響農(nóng)田土壤SOM含量的重要因素之一[27],整合土壤C輸入來預(yù)測SOM的空間分布不但能在一定程度上間接地反映農(nóng)業(yè)管理措施等人為活動對SOM空間分布區(qū)域差異性的潛在影響,也可能在一定程度上提高SOM空間預(yù)測精度。然而,從本研究區(qū)C輸入與SOM間的相關(guān)性分析來看,其直接的相關(guān)性還相對較弱。這不但與NOAA AVHRR遙感數(shù)據(jù)估算的NPP空間分辨率相對較低且存在混合像元等問題有關(guān),也與研究區(qū)的農(nóng)田土壤C輸入來源相對復(fù)雜(比如,除了根茬C輸入外還有有機(jī)肥等C輸入等)有關(guān)。因此,在平原地區(qū)人為活動因子影響強(qiáng)烈的條件下,尋找與SOM相關(guān)性強(qiáng)的、容易獲取且廉價的其他輔助預(yù)測替代因子,或者開發(fā)適宜的輔助數(shù)據(jù)降尺度方以實現(xiàn)輔助數(shù)據(jù)與SOM實測點數(shù)據(jù)的尺度匹配,將是實現(xiàn)平原地區(qū)強(qiáng)烈人為作用影響下SOM空間有效預(yù)測的重要途徑之一。
OK、RK和RF三種方法對蘇南地區(qū)農(nóng)田表層SOM含量空間預(yù)測結(jié)果的對比分析表明:(1)三種方法預(yù)測的SOM空間分布總體趨勢大體一致,總體表現(xiàn)為東高西低,但SOM空間分布的局部細(xì)節(jié)存在一定的差異性。從預(yù)測精度來看,OK方法預(yù)測的平均RMSE為6.97 g·kg-1,RK和RF在保留相關(guān)性最強(qiáng)的輔助因子TN時平均RMSE分別為5.25 g·kg-1和4.97 g·kg-1,而在移除相關(guān)性最強(qiáng)的輔助因子TN后,平均RMSE分別為增加至6.21 g·kg-1和6.29 g·kg-1,因此,RK和RF預(yù)測精度均較OK要高,且RK和RF均隨輔助因子與SOM的相關(guān)性變強(qiáng)而預(yù)測精度增加。(2)RK和RF的預(yù)測精度存在一定的差異,表現(xiàn)為保留相關(guān)性最強(qiáng)的TN時,RF的預(yù)測精度較RK要高,但移除TN后,RK較RF精度稍高。因此,考慮到TN的獲取成本及移除TN后進(jìn)行預(yù)測模型的輔助因子可獲取性問題,RK方法在輔助因子與SOM相關(guān)性較弱的條件下對本研究區(qū)依然有較高的應(yīng)用價值。(3)RK和RF的預(yù)測精度均與輔助因子和SOM間的相關(guān)性強(qiáng)弱有關(guān),但目前能夠通過公開途徑免費(fèi)獲取的相關(guān)輔助數(shù)據(jù)對于本研究區(qū)而言還存在分辨率相對較低等問題,因此,如何尋找與SOM相關(guān)性強(qiáng)的,容易獲取且廉價的其他輔助因子預(yù)測替代因子,或者開發(fā)適宜的輔助因子降尺度方法以實現(xiàn)輔助因子與SOM實測數(shù)據(jù)的尺度匹配,將是實現(xiàn)平原地區(qū)強(qiáng)烈人為作用影響下SOM空間預(yù)測的重要挑戰(zhàn)。