蔡海輝, 彭 杰, 柳維揚(yáng), 羅德芳, 王玉珍, 白建鐸, 白子金
(塔里木大學(xué) 植物科學(xué)學(xué)院, 新疆 阿拉爾 843300)
由于受農(nóng)業(yè)灌溉、蒸降比、地下水礦化度等因素影響[1],新疆土壤堿化狀況不容樂(lè)觀。2015年中國(guó)地質(zhì)調(diào)查局資料表明,近40 a來(lái),中國(guó)有近2.67×107hm2耕地土壤堿化狀況加劇,約占耕地面積的23%,土壤pH值上升了0.6左右。pH值是土壤酸堿化的重要評(píng)價(jià)指標(biāo),土壤堿性越強(qiáng)所對(duì)應(yīng)的pH值越大,土壤越容易表現(xiàn)出板結(jié)、透氣性差等現(xiàn)象,從而降低植物根系對(duì)養(yǎng)分的吸收效率[2-4],影響植物的生長(zhǎng)發(fā)育。為更好防治農(nóng)田土壤堿化,提高農(nóng)田作物產(chǎn)量、提升作物品質(zhì),需要對(duì)農(nóng)田中土壤pH值的分布狀況進(jìn)行持續(xù)監(jiān)測(cè)。但傳統(tǒng)野外采樣并進(jìn)行室內(nèi)化學(xué)分析的方法不能實(shí)時(shí)、快速獲取土壤pH值在農(nóng)田中的分布信息,隨著高光譜技術(shù)的不斷發(fā)展,可通過(guò)建立土壤pH值與土壤反射率反演模型實(shí)現(xiàn)土壤pH值信息的快速準(zhǔn)確獲取[5],為農(nóng)田土壤改良、精準(zhǔn)農(nóng)業(yè)發(fā)展提供技術(shù)支撐[6]。
目前國(guó)內(nèi)外學(xué)者在使用高光譜數(shù)據(jù)預(yù)測(cè)土壤屬性方面有大量研究成果,如李詩(shī)朦等[7]使用室內(nèi)光譜數(shù)據(jù)預(yù)測(cè)呼倫貝爾草原的電導(dǎo)率和pH值,使用支持向量機(jī)回歸建模R2大于0.90,RPD大于3.00,具有較好的預(yù)測(cè)能力;徐馳等[8]研究發(fā)現(xiàn)使用室內(nèi)高光譜數(shù)據(jù)反演內(nèi)蒙古河套灌區(qū)的地表土(0—5 cm)的pH值與含鹽量是可行的,模型預(yù)測(cè)效果良好,R2在0.95以上;Miles等[9]通過(guò)使用室內(nèi)光譜數(shù)據(jù)反演土壤中的速效磷與pH值后,認(rèn)為未來(lái)光譜分析可能會(huì)取代傳統(tǒng)化學(xué)分析對(duì)土壤屬性信息進(jìn)行獲取。雖然室內(nèi)光譜可以減少土壤水分、土壤質(zhì)地和一些環(huán)境因素對(duì)光譜測(cè)量與土壤屬性預(yù)測(cè)精度的影響[7],但由于其對(duì)野外采集的土壤樣品進(jìn)行預(yù)處理后才能測(cè)定土壤光譜反射率,需要耗費(fèi)一定時(shí)間因而不能對(duì)土壤屬性進(jìn)行快速實(shí)時(shí)監(jiān)測(cè),因此一些學(xué)者對(duì)使用野外實(shí)測(cè)光譜數(shù)據(jù)預(yù)測(cè)土壤屬性也表現(xiàn)出了濃厚的興趣,如翟茂彤[10]、喬娟峰等[11]利用野外光譜數(shù)據(jù)成功反演了鄱陽(yáng)湖和阜康地區(qū)的有機(jī)質(zhì)含量;賈科利等[12]使用偏最小二乘回歸建立土壤pH值預(yù)測(cè)模型的擬合度R2達(dá)0.93,王凱龍等[13]建立的土壤pH值預(yù)測(cè)模型R2為0.90,RPD為2.65,他們使用野外實(shí)測(cè)光譜數(shù)據(jù)都較好預(yù)測(cè)了當(dāng)?shù)赝寥赖膒H值。這些研究都證實(shí)了采用野外實(shí)測(cè)光譜預(yù)測(cè)土壤屬性是可行的。
數(shù)字土壤圖通常利用柵格的方式來(lái)詳盡表達(dá)土壤屬性的空間變化,是一種新興的、有效的表達(dá)土壤屬性空間信息的方法[14-15],如廖琪等[16]、Brian等等[17]使用克里格插值方法分別獲取了其研究區(qū)的土壤有機(jī)質(zhì)、pH值空間分布圖,但利用田間原位高光譜數(shù)據(jù)反演土壤pH值并制圖的研究還較為少見(jiàn)?;谝陨戏治?,本文以南疆阿拉爾市十二團(tuán)棉田土壤為研究目標(biāo),通過(guò)野外原位間隔采集光譜數(shù)據(jù)、土壤樣品與室內(nèi)化學(xué)分析,結(jié)合偏最小二乘回歸、支持向量機(jī)回歸、隨機(jī)森林3種建模方法,篩選最優(yōu)模型反演研究區(qū)土壤pH值并使用普通克里格插值制作土壤pH值分布圖,為南疆土壤堿化研究與治理提供理論依據(jù)。
研究區(qū)位于新疆阿拉爾市十二團(tuán),其中心地理坐標(biāo)為東經(jīng)81°19′05″,北緯40°29′20″,地處南疆中部,緊鄰塔克拉瑪干沙漠邊緣,位于塔里木河上游。年均降水量約為47 mm,年均蒸發(fā)量約為1 988 mm,年平均氣溫為10.8 ℃,年均日照時(shí)長(zhǎng)約為2 700 h,屬典型的大陸性干旱氣候。研究區(qū)內(nèi)土壤以砂土和砂壤土為主,依靠膜下滴灌提供作物生育期內(nèi)所需水分,每年冬春季節(jié)都要進(jìn)行大水漫灌。研究區(qū)地勢(shì)西高東低,灌溉入水口在地勢(shì)較高處。在阿拉爾市十二團(tuán)選取能代表當(dāng)?shù)毓芾硭角揖哂幸欢ǔ潭葔A化的棉田作為研究區(qū)。
土壤樣品采集于2018年11月3—4日,采樣點(diǎn)遠(yuǎn)離路邊、地邊,采用網(wǎng)格布點(diǎn)法均勻分布于研究區(qū)內(nèi),樣點(diǎn)間隔為20 m,去除表面覆蓋的植物殘留物、石塊等影響光譜反射率的雜物后,采集較為平整、沒(méi)有明顯水分聚集的土壤表面光譜反射率信息。每行采集21個(gè)樣點(diǎn)原位高光譜數(shù)據(jù)并間隔采集0—20 cm深度的棉田土壤,在8 hm2面積內(nèi)采集11行共計(jì)231個(gè)樣點(diǎn)原位高光譜數(shù)據(jù)及其經(jīng)緯度信息,并同步采集其中116個(gè)樣點(diǎn)的土壤樣品,建立原位高光譜數(shù)據(jù)和土壤pH值的反演模型,并利用最優(yōu)反演模型預(yù)測(cè)未采集土壤樣品的115個(gè)樣點(diǎn)的pH值,結(jié)合實(shí)際測(cè)定的土壤pH值進(jìn)行插值制作研究區(qū)土壤pH值分布圖。將采集所得土樣帶回實(shí)驗(yàn)室風(fēng)干研磨后過(guò)2 mm篩,使用土水比為1∶2.5土壤浸提液測(cè)定土壤pH值[18]。
使用美國(guó)SR-3500型地物光譜儀采集光譜數(shù)據(jù),其波長(zhǎng)范圍為350~2 500 nm,在波長(zhǎng)區(qū)間分別為350~1 000 nm,1 000~1 900 nm和1 900~2 500 nm時(shí),光譜分辨率分別為3.5,10和7 nm,數(shù)據(jù)重采樣間隔為1 nm。使用具有內(nèi)置光源的光纖手柄采集土壤原位光譜數(shù)據(jù),將土壤表面的植物殘?bào)w、殘膜、石塊等雜物清除干凈后,儀器探頭緊貼地面測(cè)量,每個(gè)樣點(diǎn)重復(fù)測(cè)量10次,取其算術(shù)平均值作為該樣點(diǎn)原位光譜數(shù)據(jù)。每個(gè)樣點(diǎn)在測(cè)量前都要清理手柄的鏡面,每10個(gè)樣點(diǎn)進(jìn)行1次白板校準(zhǔn)。為了便于描述,將此方法采集的光譜數(shù)據(jù)簡(jiǎn)稱為“原位數(shù)據(jù)”。根據(jù)國(guó)內(nèi)學(xué)者的研究成果去除噪聲較大的350~399 nm,2 401~2 500 nm波段[19-20],采用Savitzyk-Golay平滑濾波去除光譜噪聲后[21],使用Excel和The Unscrambler X 10.5.1軟件對(duì)原始反射率(R)進(jìn)行倒數(shù)(1/R)、對(duì)數(shù)(lgR)、倒數(shù)對(duì)數(shù)lg(1/R)、面積歸一化(AN, area normalization)、峰值歸一化(MAN, maximum normalization)、多元散射校正(MSC, multiplicative scatter correction)、一階微分(FDR, first derivative)、二階微分(SDR, second derivative)等9種數(shù)據(jù)預(yù)處理。
將土壤pH值進(jìn)行升序排列,取每3個(gè)相鄰樣本的中間樣本的集合為驗(yàn)證集,其余三分之二為建模集,即78個(gè)樣本用于建模,38個(gè)樣本用于驗(yàn)證。建模方法為偏最小二乘回歸(PLSR,partial least squares regression)、支持向量機(jī)回歸(SVMR, support vector regression)、隨機(jī)森林(RF, random forest)3種,其中PLSR與SVMR建模在The Unscrambler X 10.5.1軟件中實(shí)現(xiàn),RF建模在Rstudio中實(shí)現(xiàn)。
PLSR集中了主成分分析、典型相關(guān)分析、線性回歸分析的優(yōu)點(diǎn),解決了數(shù)據(jù)間多重共線性、樣本數(shù)少于變量數(shù)的問(wèn)題,因而成為了普遍使用的一種線性模型[22]。
SVMR方法是一種通過(guò)一個(gè)非線性映射,把樣本空間映射到一個(gè)高維的特征空間中,使得在樣本空間中的非線性可分問(wèn)題轉(zhuǎn)化為在特征空間中的線性可分問(wèn)題的機(jī)器學(xué)習(xí)算法[22]。SVMR方法的關(guān)鍵在于核函數(shù),結(jié)合相關(guān)文獻(xiàn)[23-24],本研究選取RBF函數(shù)為其核函數(shù),根據(jù)模型交叉驗(yàn)證最優(yōu)效果及模型穩(wěn)定性確定懲罰系數(shù)C和Gamma的值。
RF是使用隨機(jī)方式建立一個(gè)具有許多且沒(méi)有關(guān)聯(lián)的決策樹(shù)的森林,從N個(gè)樣本中隨機(jī)選取n個(gè)樣本用于構(gòu)建回歸樹(shù),當(dāng)有樣本輸入時(shí)都要經(jīng)過(guò)每棵分類決策樹(shù)決策分類,投票最多的一類作為最終分類結(jié)果,在進(jìn)行回歸預(yù)測(cè)時(shí),預(yù)測(cè)值為所有回歸樹(shù)輸出結(jié)果的平均值。根據(jù)模型穩(wěn)定性及較高預(yù)測(cè)效果,并經(jīng)多次建模驗(yàn)證,確定決策樹(shù)個(gè)數(shù)及其余參數(shù)設(shè)置。
模型穩(wěn)定性及精度評(píng)價(jià)指標(biāo)為決定系數(shù)(R2)、均方根誤差(RMSE)、相對(duì)分析誤差(RPD)。針對(duì)RPD而言,當(dāng)RPD<1.5時(shí)模型無(wú)法對(duì)樣品進(jìn)行預(yù)測(cè),當(dāng)1.5≤RPD<2.0時(shí)表明模型只能粗略估測(cè)樣品中高含量和低含量部分,當(dāng)2.0≤RPD<2.5時(shí)表明模型具有較好的預(yù)測(cè)能力,當(dāng)2.5≤RPD時(shí)模型具有很好的預(yù)測(cè)能力[21]。選擇R2和RPD大、RMSE小的模型作為最優(yōu)模型,進(jìn)行進(jìn)一步研究。
表1為建模集與驗(yàn)證集土壤pH值數(shù)據(jù)統(tǒng)計(jì)特征,由表1可知,116個(gè)供試樣本pH值的最大值為8.09,最小值為7.48,平均值為7.77,標(biāo)準(zhǔn)差0.12,變異系數(shù)為1.54%,根據(jù)新疆土壤分析[25]中pH值分級(jí)標(biāo)準(zhǔn),6.50≤pH<7.50為中性;7.50≤pH<8.50為堿性;pH值≥8.50為強(qiáng)堿性,變異系數(shù)是衡量數(shù)據(jù)間變異程度的統(tǒng)計(jì)量,其可以用于表示樣品的離散程度,當(dāng)Cv<10%時(shí)為弱變異性;當(dāng)10%≤Cv≤100%時(shí)為中等變異性;當(dāng)100% 表1 建模集與驗(yàn)證集土壤pH值數(shù)據(jù)統(tǒng)計(jì) 圖1為將116個(gè)土壤樣品的pH值升序排列均分為3類后(分別為7.48≤pH≤7.71,7.72≤pH≤7.82,7.83≤pH≤8.09)計(jì)算各類野外原位高光譜反射率數(shù)據(jù)平均值,所得到的土壤樣品反射率曲線。從圖1可以看出在400~988 nm波段內(nèi)不同pH值的土樣光譜反射率曲線差異較??;在989~2 400 nm波段范圍內(nèi),相同波長(zhǎng)條件下土壤pH值越大所對(duì)應(yīng)的光譜反射率也越大,說(shuō)明在pH值為7.48~8.09范圍內(nèi)土壤的光譜反射率與土壤pH值呈正相關(guān),即在一定pH值范圍內(nèi),在同一波長(zhǎng)下隨著土壤pH值的增大,反射率也隨之增大;在1 450,1 940,2 200 nm附近存在3個(gè)明顯的特征吸收谷,參照相關(guān)學(xué)者研究結(jié)果,1 450和 940 nm是水分吸收谷[27-28],2 200 nm附近是用于判斷黏土礦物存在的特征谷[29],在這些吸收谷附近的土壤反射率明顯降低,研究區(qū)土壤反射率最大值為27.70%。土壤質(zhì)地、土壤含水量、環(huán)境雜散光是導(dǎo)致土壤光譜反射率數(shù)據(jù)降低的主要影響因素[27],這些因素也將影響光譜數(shù)據(jù)的建模和驗(yàn)證精度。 圖1 不同pH值范圍土樣反射率均值曲線 經(jīng)建模結(jié)果驗(yàn)證,選擇建模及驗(yàn)證效果較好的R,lgR,1/R,F(xiàn)DR,SDR 5種數(shù)據(jù)形式進(jìn)行后續(xù)分析。圖2為在波長(zhǎng)400~2 400 nm間,將土壤pH值與原位高光譜數(shù)據(jù)及其4種數(shù)據(jù)變換形式進(jìn)行相關(guān)分析所得的相關(guān)系數(shù)曲線。由圖2可知土壤pH值與R,lgR在400~745 nm呈負(fù)相關(guān)關(guān)系,與1/R成正相關(guān)關(guān)系,而在746~2 400 nm波段則相反,R,lgR與土壤pH值的相關(guān)性系數(shù)曲線幾乎一致。R,lgR,1/R的最大相關(guān)系數(shù)均位于1 965 nm處,分別為0.25,0.24與-0.23,F(xiàn)DR,SDR的最大相關(guān)系數(shù)分別位于1 942 nm,636 nm處,分別為0.45,-0.43。土壤pH值與R,1/R,lgR,F(xiàn)DR,SDR的相關(guān)系數(shù)達(dá)顯著性的波段總數(shù)分別為421,395,420,819,670個(gè), FDR,SDR變換可以大幅度提高土壤pH值與光譜數(shù)據(jù)相關(guān)性,但由于其與土壤pH值的相關(guān)性缺乏規(guī)律,需要對(duì)光譜進(jìn)行較為詳細(xì)的分類,充分挖掘光譜信息才能取得好的建模及預(yù)測(cè)效果。原位高光譜數(shù)據(jù)經(jīng)倒數(shù)、對(duì)數(shù)轉(zhuǎn)換后對(duì)于改善光譜與土壤pH值相關(guān)性作用不大,對(duì)反射率進(jìn)行一階微分、二階微分轉(zhuǎn)換可以明顯提高光譜與土壤pH值的相關(guān)性和相關(guān)系數(shù)達(dá)顯著性的波段總數(shù),其相關(guān)系數(shù)最大值為0.45比原始反射率提高了0.20左右,但相對(duì)于一階微分變換,二階微分的相關(guān)系數(shù)分布更為均勻,使用二階微分建??赡軙?huì)取得更好的建模效果。 圖2 土壤pH值和光譜反射率不同轉(zhuǎn)換形式的相關(guān)系數(shù) 以土壤pH值為因變量,所對(duì)應(yīng)原位高光譜反射率數(shù)據(jù)為自變量,采用3種建模方法結(jié)合5種數(shù)據(jù)形式建立反演模型。建模集與驗(yàn)證集pH值數(shù)據(jù)詳見(jiàn)表1。表2為建立的3種模型的精度對(duì)比統(tǒng)計(jì)。由表2可知,微分?jǐn)?shù)據(jù)在支持向量機(jī)回歸建模,隨機(jī)森林建模中均取得了不錯(cuò)的效果,但在偏最小二乘回歸建模時(shí)的建模和預(yù)測(cè)效果較差。相較于微分?jǐn)?shù)據(jù),3種建模方法在使用反射率倒數(shù)、對(duì)數(shù)建模時(shí)的建模與驗(yàn)證效果都不太理想。偏最小二乘回歸建模中反射率倒數(shù)的建模效果最好,建模集的R2為0.25,RMSE為0.11,驗(yàn)證集R2為0.43,RMSE為0.09,RPD為1.26,支持向量機(jī)回歸建模中一階微分的建模效果最好,建模集R2為0.75,RMSE為0.08,驗(yàn)證集R2為0.36,RMSE為0.09,RPD為1.22,但這兩者驗(yàn)證集的R2和RPD值較小、RPD均小于1.4,無(wú)法對(duì)樣本進(jìn)行預(yù)測(cè)。隨機(jī)森林中最優(yōu)反演模型的建模集R2為0.86,RMSE為0.04,驗(yàn)證集R2為0.87,RMSE為0.04,RPD為2.53 (2.5≤RPD<3.0)模型具有極好的預(yù)測(cè)能力。相較于PLSR模型、SVMR模型,RF模型的精度,預(yù)測(cè)能力均最好,因此選擇RF模型為最優(yōu)模型,對(duì)未采樣的樣點(diǎn)進(jìn)行反演與制圖研究。 表2 不同土壤pH值模型精度對(duì)比 基于對(duì)前文的分析,選取隨機(jī)森林模型作為反演模型,對(duì)只采集原位光譜信息而未采集土壤樣品的115個(gè)樣點(diǎn)進(jìn)行反演并制作研究區(qū)土壤pH值分布圖。為進(jìn)一步驗(yàn)證田間原位光譜的建模精度,將未采集土壤樣品樣點(diǎn)的原位高光譜數(shù)據(jù)進(jìn)行Savitzyk-Golay平滑和SDR數(shù)據(jù)處理后使用隨機(jī)森林模型進(jìn)行反演土壤pH值??死锔癫逯凳堑亟y(tǒng)計(jì)學(xué)的主要內(nèi)容之一,同時(shí)也是估計(jì)未采樣位置屬性值的最優(yōu)無(wú)偏估計(jì)方法,是土壤屬性制圖中廣泛使用的一種插值方法。圖3為使用隨機(jī)森林模型模擬的土壤pH值數(shù)據(jù)和實(shí)測(cè)土壤pH值數(shù)據(jù)分別進(jìn)行普通克里格插值得到的研究區(qū)土壤pH值插值圖。 圖3 研究區(qū)土壤pH值模型模擬插值與實(shí)測(cè)數(shù)據(jù)對(duì)比 由圖3可知,模型模擬的土壤pH值數(shù)據(jù)插值圖與實(shí)測(cè)土壤pH值數(shù)據(jù)插值圖中土壤pH值的分布特征高度吻合,都表現(xiàn)為土壤pH值在東西方向上總體呈現(xiàn)逐步減小趨勢(shì),南北方向上呈現(xiàn)逐步增加趨勢(shì)。研究區(qū)內(nèi)土壤pH值分布狀態(tài)為高值部分呈片狀集中在研究區(qū)東部,低值部分成片集中在研究區(qū)的中西部,低值地帶和高值地帶間有較為明顯的緩沖帶,出現(xiàn)這種規(guī)律可能是因?yàn)檠芯繀^(qū)地勢(shì)西高東低,在進(jìn)行冬灌、春灌洗去土壤鹽分時(shí),使得土壤中交換性Na+隨水流原因被土壤膠體吸附導(dǎo)致東北區(qū)域土壤堿性增強(qiáng),而表現(xiàn)出土壤pH值增加所造成的。研究區(qū)選取的是最接近當(dāng)?shù)厣a(chǎn)管理水平的田塊,屬于輕微堿化,說(shuō)明該地區(qū)土壤可能存在不同程度的堿化現(xiàn)象,因此研究該地區(qū)的土壤pH值的空間分布信息,對(duì)于精準(zhǔn)改良當(dāng)?shù)氐耐寥浪釅A度,提升作物產(chǎn)量有重要意義。對(duì)使用實(shí)測(cè)pH值與模型模擬pH值得到的插值圖進(jìn)行預(yù)測(cè)誤差分析,結(jié)果見(jiàn)表3。預(yù)測(cè)誤差、均方根誤差、平均標(biāo)準(zhǔn)預(yù)測(cè)誤差越小說(shuō)明預(yù)測(cè)效果越好,均方根預(yù)測(cè)誤差越接近于1越好[28]。由表3可知,實(shí)測(cè)pH值預(yù)測(cè)誤差與模擬pH值預(yù)測(cè)誤差相近,都達(dá)到了較好的插值效果,說(shuō)明使用野外原位光譜預(yù)測(cè)土壤pH值是可行的。 表3 普通克里格插值預(yù)測(cè)土壤pH值誤差分析 土壤pH值是衡量土壤酸堿化程度最重要的指標(biāo)之一,使用田間原位高光譜數(shù)據(jù)對(duì)土壤pH值進(jìn)行反演并制作土壤pH值分布圖,可為土壤養(yǎng)分利用、實(shí)現(xiàn)精準(zhǔn)農(nóng)業(yè)的實(shí)時(shí)快速檢測(cè)提供一定的科技支撐[15,30]。文中對(duì)不同數(shù)據(jù)轉(zhuǎn)換形式的光譜數(shù)據(jù)與土壤pH值的相關(guān)系數(shù)進(jìn)行比較,結(jié)果表明反射率數(shù)據(jù)經(jīng)微分變換后與土壤pH值的相關(guān)性明顯提高,能為建立預(yù)測(cè)模型提供更多信息,這也與李陽(yáng)等[19]、李詩(shī)朦等[7]、魏雨露等[31]研究結(jié)果一致。微分?jǐn)?shù)據(jù)在SVMR,RF建模中都取得了不錯(cuò)的結(jié)果也驗(yàn)證了這一點(diǎn),但微分?jǐn)?shù)據(jù)會(huì)放大噪聲的干擾,同時(shí)也易引進(jìn)無(wú)關(guān)因素進(jìn)而影響建模精度[32],如張芳等[5]、彭杰等[33]使用微分?jǐn)?shù)據(jù)建模的效果不如實(shí)測(cè)光譜。本文使用RF模型預(yù)測(cè)土壤pH值取得了較好的效果,同郭鵬等[34]、張振華等[35]研究結(jié)果一致。不少研究證實(shí)RF在噪聲較大、數(shù)據(jù)量少時(shí)仍能建立準(zhǔn)確且可靠的模型,其具有處理定量和定性數(shù)據(jù)的能力,在數(shù)字土壤制圖中能夠發(fā)揮出巨大的潛力[36-37]。正是由于隨機(jī)森林具有較強(qiáng)的抗擬合能力及其對(duì)高維數(shù)據(jù)極強(qiáng)的處理能力[38],本文在使用其與原位高光譜數(shù)據(jù)的微分建立的反演模型時(shí)取得了不錯(cuò)的結(jié)果。PLSR在處理線性回歸時(shí)有著獨(dú)特的優(yōu)勢(shì)同時(shí)還能解決數(shù)據(jù)間的多重共線性問(wèn)題,但對(duì)于非線性數(shù)據(jù)的擬合能力較低,SVMR適用于小樣本的非線性數(shù)據(jù)建模,但當(dāng)數(shù)據(jù)集的噪聲過(guò)大甚至是成為支持向量時(shí)使用SVMR預(yù)測(cè)可能會(huì)取得較差的結(jié)果[39],因原位高光譜數(shù)據(jù)量大且含有土壤水分信息與其他干擾因素,所以本文使用PLSR,SVMR建模效果不如RF模型。與室內(nèi)光譜反演土壤屬性數(shù)據(jù)相比,田間原位光譜可以節(jié)省室內(nèi)測(cè)定時(shí)間,得到更接近實(shí)際的土壤屬性數(shù)據(jù),實(shí)現(xiàn)土壤屬性的快速、實(shí)時(shí)檢測(cè)。原位光譜數(shù)據(jù)易受環(huán)境因素、土壤類型等因素影響,且土壤pH值在近紅外波段屬于間接預(yù)測(cè),本文建立的預(yù)測(cè)模型精度不如李詩(shī)朦等[7]、魏雨露等[31]的高。建立的模型受地域、土壤類型等影響較大,在不同的地區(qū)應(yīng)用需建立相應(yīng)的原位光譜庫(kù),進(jìn)而為精準(zhǔn)農(nóng)田的實(shí)現(xiàn)提供一定的技術(shù)支持。 本文采用隨機(jī)森林算法建立新疆阿拉爾市十二團(tuán)研究區(qū)土壤pH值的原位高光譜反演模型并利用普通克里格插值方法制作研究區(qū)土壤pH值插值圖,著重討論了4不同數(shù)據(jù)預(yù)處理方式結(jié)合3種建模方法對(duì)于提高建模及驗(yàn)證精度的幫助,確定了使用二階微分?jǐn)?shù)據(jù)預(yù)處理后的隨機(jī)森林反演模型為最優(yōu)模型。 (1) 原位高光譜反射率數(shù)據(jù)與土壤pH值在746~2 400 nm波段呈正相關(guān)關(guān)系、400~745 nm波段呈負(fù)相關(guān)關(guān)系,在1 856~2 400 nm相關(guān)關(guān)系達(dá)顯著性水平,相關(guān)系數(shù)在1 965 nm處達(dá)最大值為0.25。 (2) 相較于偏最小二乘(PLSR)、支持向量機(jī)(SVMR)建模,使用5種數(shù)據(jù)形式進(jìn)行隨機(jī)森林建模都能取得好的建模及驗(yàn)證效果(RPD均大于2.00)。對(duì)于不同數(shù)據(jù)變換來(lái)說(shuō)反射率數(shù)據(jù)經(jīng)一階、二階微分變換后使用支持向量機(jī)回歸(SVMR)、隨機(jī)森林(RF)建模都可以取得較好的建模效果,但支持向量機(jī)的模型驗(yàn)證效果較差(R2為0.36,RPD為1.22,RPD小于1.40無(wú)法預(yù)測(cè)土壤pH值),隨機(jī)森林模型驗(yàn)證效果較好R2達(dá)0.87,RPD達(dá)2.53,能極好的反演未采樣點(diǎn)的土壤pH值。 (3) 分別利用模型模擬數(shù)據(jù)和實(shí)測(cè)數(shù)據(jù)進(jìn)行普通克里格插值制作研究區(qū)土壤pH值插值圖,模型模擬數(shù)據(jù)插值圖與實(shí)測(cè)數(shù)據(jù)插值圖中土壤pH值的分布特征相一致,說(shuō)明田間原位高光譜測(cè)量手段可以實(shí)現(xiàn)土壤pH值空間分布信息的實(shí)時(shí)快速獲取,同時(shí)也能為農(nóng)田堿化防治提供一定依據(jù)。2.2 不同pH值的土壤光譜特征分析
2.3 土壤pH與土壤光譜數(shù)據(jù)相關(guān)分析
2.4 土壤pH值反演模型的建立與驗(yàn)證
2.5 土壤pH值空間分布數(shù)字制圖
3 討 論
4 結(jié) 論