吳家林,彭 杰*,白建鐸,王佳文,紀(jì)文君,王 楠
(1.塔里木大學(xué) 植物科學(xué)學(xué)院,新疆 阿拉爾 843300;2.中國農(nóng)業(yè)大學(xué) 土地科學(xué)與技術(shù)學(xué)院, 北京 100083;3.浙江大學(xué) 環(huán)境與資源學(xué)院,杭州 310058)
【研究意義】土壤鹽漬化是現(xiàn)今世界干旱地區(qū)的主要農(nóng)業(yè)問題[1-3]。新疆地處西北干旱地區(qū),2018年棉花種植面積已經(jīng)占全國棉花種植面積的4/5,同時作為我國最大的鹽土區(qū),其鹽漬土面積達(dá)1 100 萬hm2[4-5]。南疆作為棉花的主產(chǎn)區(qū),棉花產(chǎn)業(yè)長期受高蒸降比和灌溉排水不暢導(dǎo)致的土壤鹽漬化以及次生鹽漬化危害,土壤鹽漬化已成為新疆棉花產(chǎn)量和品質(zhì)提升及持續(xù)發(fā)展的重大限制條件和障礙因素。表層土壤鹽漬化信息由于時空變異性強(qiáng)烈,不利于土壤鹽漬化程度的客觀診斷,從而很難為土壤鹽漬化改良和精準(zhǔn)灌溉提供可靠的支撐依據(jù),而土壤剖面鹽分信息相對于表層土壤鹽分信息來講,其時空變異性相對較弱,信息相對較穩(wěn)定。掌握棉田土壤鹽分空間變異性,前提是大面積、準(zhǔn)確、及時地掌握棉田鹽漬化土壤剖面的鹽分空間分布特征信息。傳統(tǒng)的土壤剖面鹽漬化調(diào)查方法為野外定點(diǎn)采樣結(jié)合室內(nèi)分析測定,多以挖剖面、土鉆鉆孔等侵入式為主,且相關(guān)研究多局限于田間小尺度。在費(fèi)時耗力和代表性差的雙重影響下,難以滿足目前針對區(qū)域尺度的農(nóng)田土壤鹽漬化管理所急需的大面積土壤剖面鹽分信息獲取的需求[6-9]。
【研究進(jìn)展】電磁感應(yīng)技術(shù)可非接觸直接獲取土壤剖面表觀電導(dǎo)率信息,具有快速、代表性強(qiáng)和精度高等優(yōu)點(diǎn),適用于大面積土壤鹽漬化的監(jiān)測,已被廣泛應(yīng)用于土壤鹽漬化的調(diào)查與研究中[10-12]。近年來,大地電導(dǎo)率儀在土壤屬性(土壤鹽分、有機(jī)質(zhì)、土壤含水率、陽離子交換量等)監(jiān)測方面發(fā)揮著重要作用[13-18]。楊勁松等[19]以黃河三角洲海涂區(qū)為研究對象,基于電磁感應(yīng)數(shù)據(jù)并結(jié)合GIS 與地統(tǒng)計學(xué)確定了最佳的空間插值方式,分析了不同植被類型下土壤鹽漬剖面分布特征。吳亞坤等[20]利用線性建模方法構(gòu)建了不同季節(jié)及不同土層土壤含鹽量的解譯模型,從三維角度評估了不同季節(jié)土壤鹽分變異特征。國內(nèi)外學(xué)者同時期也進(jìn)行了相關(guān)研究[21-27]?!厩腥朦c(diǎn)】以往基于電磁感應(yīng)數(shù)據(jù)所建立的土壤鹽分解譯模型研究區(qū)域多以田間尺度為主,建模方法主要以線性模型居多。而不同條田的土壤鹽分、土壤水分、陽離子交換量、土壤有機(jī)質(zhì)以及土壤質(zhì)地等均具有較大差異,造成模型參數(shù)難以統(tǒng)一。因此,基于田間尺度建立的電磁感應(yīng)線性解譯模型能否外延至區(qū)域尺度,有待于進(jìn)一步研究。此外,將非線性建模方法應(yīng)用于區(qū)域尺度構(gòu)建基于表觀電導(dǎo)率的土壤電導(dǎo)率反演模型的報道甚少。在區(qū)域尺度上,探明表觀電導(dǎo)率與土壤電導(dǎo)率之間是否滿足線性關(guān)系,不同線性建模方法能否適用于區(qū)域尺度的土壤電導(dǎo)率反演模型研究,以及非線性建模方法相較于線性建模方法在區(qū)域尺度上是否有更好的應(yīng)用前景,是電磁感應(yīng)技術(shù)應(yīng)用于大面積農(nóng)田土壤剖面鹽分信息獲取所需解決的關(guān)鍵問題。【擬解決的關(guān)鍵問題】利用新疆南疆阿拉爾墾區(qū)內(nèi)30 個不同地點(diǎn)的棉田剖面表觀電導(dǎo)率與土壤電導(dǎo)率數(shù)據(jù),通過區(qū)域尺度模型與田間尺度模型的模型精度對比,不同線性模型和不同非線性模型在區(qū)域尺度下的模型精度對比,提出構(gòu)建棉田土壤電導(dǎo)率反演模型的思路和方法,研究結(jié)果為EM38-MK2 在區(qū)域尺度棉田土壤鹽漬化監(jiān)測中提供理論參考,為發(fā)展精準(zhǔn)農(nóng)業(yè)提供新思路。
研究區(qū)為新疆南部阿拉爾墾區(qū)(圖1),地理位置介于(80°30′—81°58′E,40°22′—40°57′N),全墾區(qū)東西相距281 km,南北相距180 km。平均海拔高度1 011 m,北部為沖積扇平原,南部為塔克拉瑪干沙漠,地勢北高南低,屬典型暖溫帶極端大陸性干旱荒漠氣候。且水土資源豐富,年均氣溫10.7 ℃,年日照2 556.3~2 991.8 h,無霜期220 d,年均蒸發(fā)量為1 988 mm,年均降水量50 mm,蒸降比約為40 倍。土壤質(zhì)地類型主要為壤土、沙壤土以及沙土。土壤鹽分主要由硫酸鹽、亞硫酸鹽和氯化鹽構(gòu)成。地下水礦化度0.6~6 g/L,地下水埋深1~3 m[28],土壤pH 值在7.26~9.23 之間變化。主要種植作物包括棉花、紅棗、蘋果和水稻等,其中棉花種植面積最大,約1.55×105hm2,土壤樣品采集與表觀電導(dǎo)率數(shù)據(jù)采集均在棉田中。受地形、強(qiáng)蒸發(fā)、降雨稀少以及高蒸降比、土地開墾、灌溉排鹽系統(tǒng)不配套的影響,墾區(qū)內(nèi)土壤鹽漬化現(xiàn)象明顯且鹽漬化土壤分布廣泛,致使農(nóng)作物受到不同程度的鹽漬化危害。
EM38-MK2 測量點(diǎn)和土樣采集點(diǎn)如圖2 所示,本研究使用加拿大GEONICS 公司生產(chǎn)的新式大地電導(dǎo)率儀EM38-MK2 采集土壤表觀電導(dǎo)率數(shù)據(jù)(ECa,mS/m),采用美國犀牛鉆機(jī)公司生產(chǎn)的Rhino S1 土壤采集系統(tǒng)采集土壤剖面樣品。EM38-MK2 工作時提供2 種測定模式EMH 和EMV,每種模式可測定2 個不同深度土壤剖面的表觀電導(dǎo)率,EMH 模式下的測定深度為0~0.375、0~0.750 m,表觀電導(dǎo)率數(shù)據(jù)分別記錄為EMH0.375和EMH0.75,EMV 模式下的測定深度為0~0.750 和0~1.500 m,表觀電導(dǎo)率數(shù)據(jù)分別記錄為EMV0.75和EMV1.5。
Rhino S1 土壤采集系統(tǒng)取樣管長度為1 m,內(nèi)置中空PVC 取芯管,取芯管直徑36 mm,可完整保存土壤樣品的原狀性。田間作業(yè)時,單管取樣時間約30~60 s。完成后取出取芯管獲得深度為1 m 的完整土壤剖面樣品,用密封橡皮塞分別將取芯管底部和上部密封(底紅頂黑)以防止水分蒸發(fā)和鹽分流失。
綜合考慮墾區(qū)面積大小、土壤鹽漬化程度、棉花種植集中度、交通道路狀況等因素,在阿拉爾墾區(qū)內(nèi)棉花種植區(qū)域選取30 個棉田布設(shè)樣方,采集土壤表觀電導(dǎo)率數(shù)據(jù)和土壤剖面樣品。采樣時間為2019年3月中下旬,如圖1 所示,在研究區(qū)中選取30 個不同鹽漬化程度棉田(面積均大于10 hm2),棉田內(nèi)布設(shè)大小為100 m×100 m 的樣方。
圖1 研究區(qū)地理位置與調(diào)查樣方分布 Fig.1 The geographical location of the study area and the distribution of survey samples
圖2 EM38-MK2 測量點(diǎn)和土樣采集點(diǎn)分布 Fig.2 Distribution of EM38-MK2 measuring points and soil sample collection points
如圖2 所示,采集表觀電導(dǎo)率數(shù)據(jù)時,為了解樣方內(nèi)表觀電導(dǎo)率數(shù)據(jù)的閾值范圍,便于采樣點(diǎn)位的選取,采集6 條平行棉花種植方向和6 條垂直棉花種植方向的EMH 和EMV 模式下連續(xù)線狀表觀電導(dǎo)率數(shù)據(jù),形狀為網(wǎng)格狀,數(shù)據(jù)間距約3 m。根據(jù)連續(xù)線狀表觀電導(dǎo)率數(shù)據(jù)采集時觀測的閾值范圍,樣方內(nèi)遵循代表性原則在連續(xù)線狀表觀電導(dǎo)率數(shù)據(jù)行走路線上采集18 個特征樣點(diǎn)表觀電導(dǎo)率數(shù)據(jù),每個樣點(diǎn)EMH 和EMV 模式各測定3 次,獲取的表觀電導(dǎo)率數(shù)據(jù)取平均值。并在18 個表觀電導(dǎo)率數(shù)據(jù)測定位上使用Rhino S1 土壤采集系統(tǒng)采集18 管深度為0~1 m 的土壤剖面樣本數(shù)據(jù),30 個樣方共采集540 組特征樣點(diǎn)的表觀電導(dǎo)率數(shù)據(jù),每組包含4 種表觀電導(dǎo)率數(shù)據(jù),共計2 160 個樣點(diǎn)表觀電導(dǎo)率數(shù)據(jù)。采集540管土壤樣品數(shù)據(jù),用手持GPS 記錄每個采樣點(diǎn)的緯度和經(jīng)度(誤差精度小于8 m),每管土壤樣品實驗室處理為3 個深度(0~0.375、0~0.750、0~1.000 m),共計1 620 個土壤樣品。在去除石子、植物根和地膜等殘留物后將土壤樣本置于牛皮紙上自然風(fēng)干,取風(fēng)干土樣研磨過2 mm 篩備用,每個深度樣本數(shù)據(jù)保留300 g 土壤,按土水比為(1∶1)比例制備濾液,測定其土壤電導(dǎo)率,用于構(gòu)建電導(dǎo)率與表觀電導(dǎo)率之間的反演模型。
本研究以Rhino S1 土壤采集系統(tǒng)采集、處理、測定的540 組土壤電導(dǎo)率和對應(yīng)EM38-MK2 測定的540 組土壤表觀電導(dǎo)率數(shù)據(jù)為樣本總體,以3 個不同深度土壤剖面(0~0.375、0~0.750、0~1.000 m)電導(dǎo)率為因變量,4 種測定位下的土壤表觀電導(dǎo)率(EMH0.375、EMH0.75、EMV0.75、EMV1.5)為自變量,建立研究區(qū)棉田不同深度土壤剖面(0~0.375、0~0.750、0~1.000 m))電導(dǎo)率的反演模型。
建模方法為多元線性回歸(MLR)、主成分回歸(PCR)、偏最小二乘回歸(PLSR)、支持向量機(jī)(SVM)、隨機(jī)森林(RF)、神經(jīng)網(wǎng)絡(luò)(NN)6 種。其中,RF 是一種構(gòu)建神經(jīng)網(wǎng)絡(luò),利用多棵決策樹對樣本數(shù)據(jù)進(jìn)行訓(xùn)練、分類和預(yù)測的機(jī)器學(xué)習(xí)方法,各決策樹單元間相互無關(guān)聯(lián)且隨機(jī)排列,有效降低了單一分類器的分析誤差,其計算量大,但提升了分類準(zhǔn)確度和模型預(yù)測精度,適用于大規(guī)模數(shù)據(jù)的高效處理[29]。NN 是基于大量樣本經(jīng)過反復(fù)訓(xùn)練的學(xué)習(xí)過程,能被賦予完成某項任務(wù)的具體功能,在擁有傳統(tǒng)數(shù)學(xué)模型中能處理海量多維數(shù)據(jù)的優(yōu)點(diǎn)的同時,還具有高度自由的非線性、泛化性等優(yōu)良特性[30]。建模思路為區(qū)域尺度模型與田間尺度模型2 種,區(qū)域尺度模型是將30 個樣方的表觀電導(dǎo)率數(shù)據(jù)和土壤電導(dǎo)率數(shù)據(jù)匯總,建立統(tǒng)一的反演模型,田間尺度模型針對單一樣方的表觀電導(dǎo)率數(shù)據(jù)和土壤電導(dǎo)率數(shù)據(jù)建立單獨(dú)的反演模型。
模型預(yù)測精度和穩(wěn)定性的評價指標(biāo)為決定系數(shù)(R2)、均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)、相對分析誤差(RPD)。R2反映觀測值與預(yù)測值間的相關(guān)性強(qiáng)度;RMSE檢驗?zāi)P偷念A(yù)測能力;MAPE檢驗?zāi)P偷木取O鄬τ赗PD而言,預(yù)測精度分為5 個等級,當(dāng)RPD<1.5 時表明模型無法進(jìn)行預(yù)測,當(dāng)1.5<RPD<2 時表明模型可進(jìn)行粗略估計,當(dāng)2≤RPD<2.5 時表明模型有較好的預(yù)測能力,當(dāng)2.5≤RPD<3.0時模型具有很好的預(yù)測能力,當(dāng)RPD≥3.0時模型具有極好的預(yù)測能力[4]。R2和RPD大、RMSE和MAPE 小的模型,其預(yù)測能力好,穩(wěn)定性高。
土壤剖面電導(dǎo)率統(tǒng)計特征見表1。由表1 可知,不同深度土壤剖面的電導(dǎo)率介于0.120~11.015 dS/m之間,變幅較大,最小值分布于0~0.375 m 土壤剖面中,最大值分布于0~0.750 m 土壤剖面中,其中,0~0.375 m 土壤剖面電導(dǎo)率范圍為0.120~8.963 dS/m,0~0.750 m 土壤剖面的為0.185~11.015 dS/m,0~1.000 m 土壤剖面的為0.354~10.650 dS/m。不同深度土壤剖面的電導(dǎo)率平均值在2.080~3.769 dS/m,0~0.375 m 的電導(dǎo)率最低,0~0.750 m 的次之,0~1.000 m 的最高,具有隨土壤剖面深度增加而增加的趨勢,這是棉花冬季灌水將表層土壤鹽分淋溶到深層土壤中的結(jié)果。從變異系數(shù)來看,各層土壤電導(dǎo)率的變異系數(shù)差異明顯,0~0.375、0~0.750、0~1.500 m 土壤剖面變異系數(shù)分別為65.10%、57.00%、53.90%。通常情況下,變異系數(shù)小于10%為弱變異,變異系數(shù)10%~100%為中等變異,變異系數(shù)大于100%為強(qiáng)變異[31],不同土壤深度下土壤電導(dǎo)率均呈中等變異強(qiáng)度。
表1 剖面土壤電導(dǎo)率的統(tǒng)計特征值 Table 1 Statistical characteristic value of profile soil conductivity
為驗證線性建模方法在田間尺度模型中的可靠性,選用MLR、PLSR 和PCR 等線性建模方法建立田間尺度模型。以每個棉田樣方采集的18 個土壤樣本為總體,采用分層抽樣的方法按2∶1 比例分為建模集與預(yù)測集,其中建模集12 組樣本,預(yù)測集6 組樣本,將30 個棉田總體樣本數(shù)累加。
不同線性模型反演精度見表2。由表2 可知,在建模集中,3 種線性建模方法的不同深度土壤剖面模型精度差異較小,0~0.375 m 土壤深度MLR 模型精度低于PLSR 和PCR,R2為0.88,RMSE、MAPE分別為0.50 dS/m 和0.21,0~0.750 m 和0~1.000 m 土壤深度下,PLSR 和PCR 基本保持一致,0~0.750 m 的PLSR 模型精度最高,R2為0.95,RMSE、MAPE分別為0.41 dS/m 和0.12。在驗證集中,3 種不同深度土壤剖面電導(dǎo)率反演模型的各指標(biāo)相較于建模集模型精度均有一定程度下降,但不同建模方法R2在0.83以上,表明模型穩(wěn)定不同模型預(yù)測集中RPD最高值為2.78,最低值為2.35,可見模型具有較好或很好的預(yù)測能力。不同深度土壤剖面電導(dǎo)率模型反演效果優(yōu)劣排序依次為PLSR>PCR>MLR。在田間尺度模型中表觀電導(dǎo)率與土壤電導(dǎo)率滿足線性關(guān)系,所選用的3 種線性建模方法在區(qū)域尺度棉田中適用性較好。
表2 不同線性建模方法的田間尺度模型精度 Table 2 Field scale model accuracy of different linear modeling methods
選取MLR、PLSR 和PCR3 種建模方法對土壤電導(dǎo)率進(jìn)行預(yù)測并進(jìn)行模型精度檢驗,將田間尺度模型的建模集與預(yù)測集分別匯總后得到區(qū)域尺度模型的建模集與預(yù)測集,其中建模集360 組土壤樣本數(shù)據(jù),預(yù)測集180 組土壤樣本數(shù)據(jù)。表觀電導(dǎo)率數(shù)據(jù)為自變量,土壤電導(dǎo)率為因變量,構(gòu)建基于線性建模方法的區(qū)域尺度模型。
表3 不同線性建模方法的區(qū)域尺度模型精度 Table 3 Regional scale model accuracy of different linear modeling methods
不同線性建模方法的區(qū)域尺度模型精度評價結(jié)果如表3 所示,在建模集中,3 種建模方法的模型精度差異不明顯,0~0.375 m 土壤深度PLSR 模型精度略優(yōu)于MLR 和PCR,R2為0.35,RMSE、MAPE分別為1.08 dS/m 和0.57,0~0.750 m 和0~1.000 m 土壤深度下,PLSR 和PCR 模型精度基本保持一致,且均低于MLR,在0~0.750 m 的MLR 模型精度最高,R2為0.53,RMSE、MAPE分別為1.26 dS/m 和0.41。在驗證集中,3 種模型的各指標(biāo)相較于建模集均沒有明顯下降,表明模型比較穩(wěn)定,MLR 模型的各項指標(biāo)略優(yōu)于PLSR 和PCR。MLR、PLSR 和PCR 建模方法的RPD均<1.5,說明3 種線性模型不具備對全區(qū)樣本數(shù)據(jù)進(jìn)行預(yù)測的能力。由于土壤中大多數(shù)溶解鹽類均以離子狀態(tài)存在,EM38-MK2 測定的表觀電導(dǎo)率數(shù)據(jù)反映的是土壤空間范圍內(nèi)游離態(tài)電解質(zhì)量,同一棉田樣方中土壤質(zhì)地和土壤含水率等影響表觀電導(dǎo)率數(shù)據(jù)的因素變化基本穩(wěn)定,田間尺度模型對樣本有較好或很好的預(yù)測能力。區(qū)域尺度模型考慮到不同棉田樣方的地域跨度較大,土壤質(zhì)地、地下水位和土壤含水率等因素變化強(qiáng)烈,降低了區(qū)域尺度模型的精度,導(dǎo)致區(qū)域尺度模型的預(yù)測能力大幅下降。
選用RF、NN 和SVM3 種非線性建模方法構(gòu)建基于表觀電導(dǎo)率數(shù)據(jù)的土壤剖面電導(dǎo)率反演模型。結(jié)果如表4 所示,相較于MLR、PLSR 和PCR 線性建模方法,RF、NN 和PCR 區(qū)域尺度模型精度均有明顯提高。在建模集中,3 種建模方法的精度差異較大,0~0.750 m深度RF 模型精度最高,R2為0.85,RMSE和MAPE分別為0.78 dS/m 和0.27,0~0.375 m 深度剖面的R2、RMSE和MAPE分別為0.80、0.61 dS/m 和0.33,為RF 模型中最低值。0~1.000 m 剖面的模型精度介于二者之間,略低于0~0.750 m 深度下模型精度。NN 和SVM 模型精度有不同程度的降低,但不同深度的模型精度變化趨勢與RF 保持一致,具有隨土壤剖面電導(dǎo)率增加而升高的趨勢。綜上所述,建模集中,RF 模型性能明顯優(yōu)于NN 和SVM 模型,反演效果優(yōu)劣排序依次為RF 模型>NN 模型>SVM 模型。在驗證集中,不同深度的RF 模型精度相較于建模集均沒有明顯差異,且RPD指標(biāo)均>2.0,說明模型比較穩(wěn)定,能在區(qū)域尺度下較好地對樣本數(shù)據(jù)進(jìn)行預(yù)測。NN 模型的R2高于SVM,RMSE和MAPE低于SVM。不同深度下NN 和SVM 的RPD指標(biāo)均介于1.5~2.0 之間,R2指標(biāo)介于0.54~0.72 之間,說明NN 和SVM 兩模型均只能對樣本數(shù)據(jù)進(jìn)行粗略估計。綜合考察各模型建模集與預(yù)測集的評價指標(biāo),3 種模型的預(yù)測性能和穩(wěn)定性從高到低排序依次為RF 模型>NN 模型>SVM 模型,表明非線性建模方法可有效改善基于土壤剖面電導(dǎo)率的區(qū)域尺度模型的預(yù)測精度。
表4 不同非線性建模方法的區(qū)域尺度模型精度對比 Table 4 Comparison of regional scale model accuracy of different nonlinear modeling methods
圖3 RF 模型不同樣本數(shù)據(jù)量下的精度指標(biāo)Fig.3 RF model accuracy index under different sample data sizes
區(qū)域尺度模型中應(yīng)用效果最優(yōu)的為RF 模型,為探究其能否在縮小數(shù)據(jù)量的條件下獲得同樣的模型精度,以期達(dá)到減少樣本數(shù)據(jù)獲取量,減少人力、物力以及時間成本的投入,對模型可靠性進(jìn)行驗證的目的,隨機(jī)抽取總樣本數(shù)量分別設(shè)置540、360、240、160 共4 個樣本數(shù)據(jù)量梯度,總樣本數(shù)據(jù)量為160 時,無法按照2∶1 的比例進(jìn)行建模和預(yù)測,調(diào)整建模集數(shù)據(jù)量為107,預(yù)測集數(shù)據(jù)量為53。結(jié)果如圖3 所示,從0~0.375 m 深度來看,540、360 和240樣本數(shù)據(jù)量梯度下模型精度差異不大,R2均為0.80,RMSE在0.60~0.62 dS/m 波動,MAPE在0.33~0.35 之間,2.0<RPD<2.5,不同樣本數(shù)據(jù)量下模型均有較好的預(yù)測能力。當(dāng)樣本數(shù)據(jù)量為160 時,R2從0.80 降低至0.77,RMSE和MAPE數(shù)值上升,1.50<RPD<2.0,說明模型對樣本數(shù)據(jù)具有粗略估計的能力。
0~0.750 m 深度下,4 種不同數(shù)據(jù)量的RF 模型R2穩(wěn)定,RMSE在0.78~0.85 dS/m 波動,MAPE在0.26~0.28,RPD保持在2.35~2.47 之間,表明樣本數(shù)據(jù)量減少模型仍具有較好的預(yù)測能力。在0~1.000 m深度下,隨樣本數(shù)據(jù)量的減少R2由0.84 降低至0.81,RMSE和MAPE呈上升趨勢,RPD由2.34降低為1.94,模型預(yù)測能力由較好預(yù)測等級降低至粗略估計等級??傮w分析,樣本數(shù)據(jù)量540、360、240 共3 個梯度時,RF 模型保留了原有對樣本數(shù)據(jù)的預(yù)測能力。在樣本數(shù)據(jù)量為160 時,模型精度有所下降,但能對樣本數(shù)據(jù)進(jìn)行粗略估計。4 個不同樣本數(shù)據(jù)梯度中,RMSE、MAPE和RPD等精度評價指標(biāo)出現(xiàn)隨樣本數(shù)據(jù)量的減少反而略微升高的現(xiàn)象,造成該現(xiàn)象的原因可能是在縮減樣本數(shù)據(jù)時剔除了異常樣本數(shù)據(jù)。
本研究表明,采用線性建模方法時,區(qū)域尺度模型反演精度明顯低于田間尺度模型,二者具有明顯差異性,不同線性建模方法無法有效提高區(qū)域尺度模型的反演精度,且各線性模型的預(yù)測能力均較低。采用非線性建模方法時,區(qū)域尺度模型的模型反演精度顯著提高,最佳模型預(yù)測能力提升至對樣本數(shù)據(jù)有較好的預(yù)測能力。根據(jù)田間實地采樣考察,實驗室分析和EM38-MK2 工作原理,其原因可能有以下幾點(diǎn):①土壤含水率不同,表觀電導(dǎo)率受土壤含水率影響[4,32],研究區(qū)棉田冬季和春季灌溉用水主要引于塔里木河和阿克蘇河,灌溉順序大致為由西向東,部分地區(qū)由于灌溉配套系統(tǒng)不完善和灌水量不足,不進(jìn)行冬季和春季灌水或少灌,導(dǎo)致各棉田土壤含水率不同,造成了區(qū)域尺度模型和田間尺度模型的精度差異。②土壤質(zhì)地類型不同,在土壤溫度、土壤含水率相對一致的前提下,質(zhì)地越輕,表觀電導(dǎo)率讀數(shù)越小。而全墾區(qū)內(nèi)各棉田地域跨度較大,棉田土壤質(zhì)地類型主要有壤土、沙壤土和沙土3 種,不同土壤質(zhì)地類型對線性建模方法在區(qū)域尺度下模型的精度造成了影響。③土壤有機(jī)質(zhì)不同,土壤中固體土粒由礦物質(zhì)和有機(jī)質(zhì)組成,而形成有機(jī)質(zhì)腐殖質(zhì)具有帶電性,其在土壤中量的多少可引起大地電導(dǎo)率儀磁場的變化。在土壤質(zhì)地和含水率相對一致的前提下,土壤有機(jī)質(zhì)量的多少會造成表觀電導(dǎo)率測定值的高低,二者正相關(guān)。不同棉田由于本身肥力和施用有機(jī)肥量各不相同,造成了線性模型無法對區(qū)域尺度的土壤電導(dǎo)率進(jìn)行反演[33]。④建模方法不同,非線性建模方法相較于線性建模方法具有各決策樹單元互無關(guān)聯(lián)且隨機(jī)排列,能有效降低區(qū)域尺度模型的分析誤差,提高了模型的精度。綜上,在同一棉田中,土壤含水率、土壤質(zhì)地類型和土壤有機(jī)質(zhì)相對保持一致,模型參數(shù)穩(wěn)定,表觀電導(dǎo)率和土壤電導(dǎo)率二者保持線性關(guān)系,線性建模方法在田間尺度高度適用,而不同棉田中,土壤含水率、土壤質(zhì)地類型和土壤有機(jī)質(zhì)量各不相同,導(dǎo)致土壤電導(dǎo)率反演模型參數(shù)不同,從而造成了在區(qū)域尺度下線性建模方法無法對樣本進(jìn)行預(yù)測,而非線性建模方法由于其本身具備的高度非線性可有效提高區(qū)域尺度土壤電導(dǎo)率反演模型精度。
如何有效篩選出能進(jìn)一步提高區(qū)域尺度模型反演精度的建模方法,對利用EM38-MK2 獲取區(qū)域尺度農(nóng)田土壤鹽漬化信息有重要意義。面對區(qū)域尺度更大,種植作物類型更復(fù)雜的土壤鹽漬化信息獲取的研究,還有待于進(jìn)一步探索。
適用于田間尺度模型的MLR、PLSR 和PCR 線性建模方法無法對區(qū)域尺度模型的樣本數(shù)據(jù)進(jìn)行預(yù)測。在田間尺度模型中不同線性建模方法R2在0.88~0.95 之間,在區(qū)域尺度模型中不同線性建模方法R2降低至0.34~0.53 之間,無法對樣本數(shù)據(jù)進(jìn)行有效預(yù)測。將RF、NN 和SVM 等非線性建模方法應(yīng)用于區(qū)域尺度模型中,相較于線性建模方法,區(qū)域尺度模型的模型精度明顯提高,不同非線性建模方法的R2在0.60~0.85 之間,其中,NN 和SVM 建模方法只能對樣本數(shù)據(jù)進(jìn)行粗略估計,模型精度最高、預(yù)測能力最好的RF 模型在不同深度下均保持了對樣本數(shù)據(jù)較好的預(yù)測能力。通過縮減RF 區(qū)域尺度模型的樣本數(shù)量,驗證了RF 區(qū)域尺度模型可大幅降低采集土壤剖面的樣本數(shù)量,從而提高采樣效率和降低采樣成本。