劉旭輝, 白云崗, 柴仲平, 張江輝, 丁邦新,3, 江 柱
(1.新疆農(nóng)業(yè)大學資源與環(huán)境學院,新疆 烏魯木齊 830052;2.新疆水利水電科學研究院,新疆 烏魯木齊 830049;3.西北農(nóng)林科技大學水利與建筑工程學院,陜西 楊凌 712100)
目前,土壤鹽漬化已經(jīng)成為全球性生態(tài)環(huán)境問題,嚴重制約著干旱區(qū)灌溉農(nóng)業(yè)的可持續(xù)發(fā)展[1-2]。新疆作為我國重要的農(nóng)墾區(qū),鹽漬土面積約占耕地總面積的1/3,鹽漬化問題尤為嚴重[3]。因此,亟需快速準確獲取土壤含鹽量變化的監(jiān)測方法,以支持灌區(qū)灌溉制度制定、土壤鹽漬化防治、鹽堿地綜合利用、土地管理等工作[4]。傳統(tǒng)的實地采樣調(diào)查方法不僅耗費大量的人力、物力,而且研究尺度較小,獲取的多為點狀信息[5-6]。遙感技術能夠大面積快速獲取同一地區(qū)不同時間點的地物信息,有助于開展長時間序列的土壤鹽漬化研究工作,加之宏觀、綜合、及時、動態(tài)、低成本等特點,被廣泛應用于土壤鹽漬化的實時監(jiān)測和土壤鹽分的定量估算等[7]。
隨著遙感技術的愈加成熟,學者們開始深入探索提高建模精度的各類方法,其中,光譜參量的構建和建模方法的選取有助于提高遙感反演精度[8]。許多學者采用敏感波段組合、特征光譜指數(shù)構建和光譜數(shù)學變換等方法創(chuàng)建模型輸入變量[9-10]。周曉紅等[10]以艾比湖濕地自然保護區(qū)為試驗區(qū),基于Landsat 8 OLI 多光譜遙感影像,構建了多種植被指數(shù)和鹽分指數(shù),在眾多光譜指數(shù)中,增強型植被指數(shù)與土壤鹽分的相關性最高,傳統(tǒng)型植被指數(shù)次之,鹽分指數(shù)最低;張曉光等[11]對光譜數(shù)據(jù)分別進行了對數(shù)、倒數(shù)、一階微分、二階微分等數(shù)學變換,以增強光譜與鹽分之間的相關性,進而達到了提升模型反演精度的效果;Zhang 等[12]基于MODIS 衛(wèi)星影像構建了光譜指數(shù),反演了黃河三角洲地區(qū)的土壤含鹽量;Alexakis 等[13]針對希臘克里特島土壤鹽漬化問題,基于WV2 和Landsat 8 OLI 計算鹽分指數(shù),結(jié)果表明,光譜指數(shù)S5對土壤鹽分最為敏感,可為該地區(qū)地表土壤含鹽量的監(jiān)測提供新方案。以上研究表明,篩選敏感光譜變量可以有效提升模型反演效果[8]。除了自變量的優(yōu)化,建模方法也經(jīng)歷了一段發(fā)展歷程,從傳統(tǒng)的線性回歸發(fā)展到具有非線性擬合能力的機器學習算法。研究發(fā)現(xiàn),當模型輸入變量個數(shù)較多、且與土壤鹽分的相關性較低時,機器學習的優(yōu)勢得到了更加充分的體現(xiàn)[14]。通過對比不同模型的建模和驗證效果,確定了最適合本研究區(qū)土壤鹽分的建模方法和反演模型,進而提升了土壤鹽分遙感反演精度。馮雪力等[15]對比了傳統(tǒng)回歸方法和機器學習算法的建模精度,發(fā)現(xiàn)BP神經(jīng)網(wǎng)絡(Back propagation neural network, BPNN)模型預測效果最優(yōu),其穩(wěn)定性和預測精度均優(yōu)于經(jīng)驗回歸模型;劉恩等[16]基于Landsat 8 OLI 多光譜影像,分別采用多元線性回歸和BP神經(jīng)網(wǎng)絡算法構建了土壤鹽分反演模型,發(fā)現(xiàn)影像光譜反射率和土壤含鹽量之間不是單純的線性關系,因而多元回歸模型的預測效果具有很大的波動性,而BPNN 具有極強的非線性擬合能力,因而機器學習模型反演精度更高;張智韜等[17]以內(nèi)蒙古河套灌區(qū)為研究區(qū)域,采用多種方法進行建模,發(fā)現(xiàn)支持向量機(Support vector machine,SVM)模型精度最高,分位數(shù)回歸次之,偏最小二乘回歸(Partial least squares regression,PLSR)最低。以上研究都說明了機器學習算法在土壤鹽分遙感反演過程中的優(yōu)越性。
土壤鹽漬化相關研究雖然取得了一系列較為理想的成果,但現(xiàn)有的遙感反演研究多是基于某一特定時期的遙感影像展開,僅能反映當?shù)卦摃r期的土壤鹽漬化狀況,模型的推廣性不強。而且,鹽漬化程度受時空變化影響,不同位置的土壤含鹽量存在差異性。因此,探討某一地區(qū)不同年份的土壤鹽漬化狀況極為重要[18-19]。鑒于此,本文以新疆兵團農(nóng)二師31 團為研究區(qū)域,基于2019、2021 年的Landsat 8 OLI衛(wèi)星遙感影像和相應時期地表土壤含鹽量,利用多元逐步回歸(Multiple stepwise regression,MSR)、PLSR、極限學習機(Extreme learning machine,ELM)、SVM 和BPNN 構建土壤鹽分遙感反演模型,實現(xiàn)棉田土壤鹽分的定量反演,以期為當?shù)赝寥辣韺雍}量的實時監(jiān)測提供參考。
新疆生產(chǎn)建設兵團農(nóng)二師31 團位于天山南麓塔里木盆地東北邊緣,塔里木河與孔雀河兩河下游的沖積平原上,地處巴音郭楞蒙古自治州尉犁縣境內(nèi),西南臨塔克拉瑪干沙漠,東北與庫姆塔格沙漠接壤,地理坐標為85°24′~88°30′E,39°30′~42°20′N。灌區(qū)土壤類型主要為鹽土、堿土和風沙土。團場深處歐亞內(nèi)陸腹地,屬北溫帶大陸性荒漠干旱氣候,降水量年際變化大,多年平均降水量53.3~62.7 mm,多年平均蒸發(fā)量2273~2788 mm?,F(xiàn)有灌溉面積7.5×103hm2,灌溉方式以膜下滴灌為主,灌溉用水來自塔里木河與恰拉水庫。生育期灌溉量2700~3450 m3·hm-2,自每年5月開始;冬灌量約為3600 m3·hm-2,自每年11月開始,使用大水漫灌。地下水位保持在1~3 m之間,地下水礦化度2~7 g·L-1;塔里木河與水庫礦化度0.47~1.53 g·L-1;灌溉排水礦化度10.58~18.36 g·L-1。
野外采樣選擇在棉花播種前(2019 年3 月20—28日、2021年4月7—12日)進行,該時段為裸土期,受植被影響較小。實地勘察后,按照從水庫引水處沿干渠走向布設采樣點,同時考慮交通條件、分布位置、土壤類型等因素。2019年和2021年最終采集的樣點個數(shù)分別為53個和33個(圖1)。
圖1 研究區(qū)位置及土壤樣點分布示意圖Fig.1 Sketch maps of the study area location and soil sample distribution
1.2.1 表層土壤含鹽量測定考慮到土壤水鹽的變異性較強,從預設點向外輻射約10 m的范圍內(nèi)再選取2個點,利用3點取樣法采集地表0~20 cm深度的土壤,使用四分法將3處土壤混合,作為該編號位置上的一個樣品,隨即將樣品裝入已編號的自封袋中,手持GPS 儀測定每個樣點的經(jīng)緯度,拍照記錄各樣點處的鹽漬化程度、作物類型、植被覆蓋度等信息。將土樣帶回實驗室后,挑出雜物,風干,研磨,過2 mm孔徑篩,稱取18 g土樣,在錐形瓶中按土水質(zhì)量比為1:5 配置土壤溶液,用玻璃棒攪拌均勻后固定在振蕩器上震蕩10 min,使鹽分充分溶解,靜置后使用電導率儀測定土壤懸濁液的電導率值(EC,μS·cm-1),根據(jù)經(jīng)驗公式:y=0.0051x-0.5241(決定系數(shù)R2=0.9534)計算土壤總鹽(g·kg-1)[20]。
1.2.2 表層土壤光譜曲線采集與處理選擇晴朗、無云、無風的日子,在12:00—16:00之間進行光譜測定。使用美國PP Systems公司生產(chǎn)的UniSpec-SC光譜分析儀(波段范圍310~1130 nm)測定土壤光譜反射率。樣點觀測前需要進行標準白板掃描和暗掃描操作,光譜采集時,探頭設置在垂直距離地面50 cm 處,從而縮小儀器視場角,以減小地面背景及周圍其他地物對土壤光譜的影響。對不同鹽漬化等級的土壤測定多條光譜曲線,每個等級測定10 次,取平均值后作為每個鹽漬化等級土壤的實測高光譜數(shù)據(jù)。土壤光譜采集完畢后,使用Multispec 5.1.5軟件對數(shù)據(jù)進行處理,得到310~1130 nm 波段范圍的土壤光譜反射率,在Origin 2018軟件中繪制土壤實測高光譜反射率曲線。
多光譜數(shù)據(jù)采用Landsat 8 OLI 衛(wèi)星遙感影像,數(shù)據(jù)來源于美國地質(zhì)調(diào)查局(United States Geological Survey, USGS)官 網(wǎng)(https://earthexplorer.usgs.gov/),行列號143/031,空間分辨率30 m,重訪周期16 d。根據(jù)與采樣時間相近且云量較小的原則,本文選取2019 年3 月22 日和2021年3 月20 日的影像作為本次試驗的多光譜數(shù)據(jù)源。使用ENVI 5.3 軟件對影像數(shù)據(jù)進行輻射定標、大氣校正和裁剪等預處理操作,實現(xiàn)遙感數(shù)據(jù)由數(shù)字量化值到輻射亮度值再到地表反射率的逐步轉(zhuǎn)換,再通過ArcGIS 10.2提取各采樣點對應的影像多光譜反射率,在Excel 2016中計算各類型光譜指數(shù)。
本文選取了7 個波段和12 個鹽分指數(shù)作為土壤鹽分反演模型的備選輸入變量,光譜參量及計算公式如表1 所示,包括海岸波段(b1)、藍波段(b2)、綠波段(b3)、紅波段(b4)、近紅外波段(b5)、短波紅外1 波段(b6)、短波紅外2 波段(b7)、鹽分指數(shù)[歸一化鹽分指數(shù)(NDSI)、SI-T、SI1、SI2、SI3、SI4、S1、S2、S3、S4、S5、S6]。
表1 光譜參量及相關計算公式Tab.1 Spectral parameters and related formulas
考慮到土壤鹽分受水分的影響,不同時期的灌溉、氣溫和降水等因素會影響土壤水分和鹽分含量,2 期土壤含鹽量分布的變異性存在差異。剔除異常值后,將2019年和2021年春季樣本數(shù)據(jù)混合,按照土壤含鹽量由小到大的順序排列分組,根據(jù)建模集與驗證集2:1 的比例進行等間隔取樣[14],最終確定了建模集樣本51 個,驗證集樣本26 個。對建模集影像的波段、鹽分指數(shù)與土壤含鹽量進行皮爾遜相關性分析(Pearson correlation coefficient,PCC),通過分析進行特征光譜參量篩選,將篩出的特征光譜參量分為波段組、光譜指數(shù)組和全變量組,并作為輸入變量組參與建模,建模方法選用MSR、PLSR、ELM、SVM 和BPNN,共計15 個土壤鹽分反演模型。建模方法如下:
(1)多元逐步回歸(MSR)
MSR在多元線性回歸的基礎上進行改進,它能進一步優(yōu)化公式,確定各個自變量對于因變量預測值的比重,剔除不重要的變量[15,21],是土壤鹽分遙感反演最常用的回歸方法之一[22]。本研究的MSR 建模與分析基于IBM SPSS Statistics 25完成。
(2)偏最小二乘回歸(PLSR)
PLSR 是一種多因變量對多自變量的回歸建模方法,能夠在一定程度上消除參量之間的多重共線性,通過不斷地迭代,最終模型將包含原有的所有自變量[15,23]。本文采用The Unscrambler X 10.4軟件進行建模與分析。
(3)極限學習機(ELM)
ELM是一種單隱層前饋型神經(jīng)網(wǎng)絡,具有泛化能力強、人工干預小、學習速度快等優(yōu)勢[24],其特點是輸入層與隱含層之間的連接權值和隱含層神經(jīng)元的閾值隨機生成[25]。本研究基于MATLAB 2018平臺進行ELM 模型構建,通過反復試驗,最終確定了波段組的神經(jīng)網(wǎng)絡模型結(jié)構(輸入層神經(jīng)元個數(shù)-隱含層神經(jīng)元個數(shù)-輸出層神經(jīng)元個數(shù))為4-11-1,光譜指數(shù)組的結(jié)構為7-11-1,全變量組為11-7-1。
(4)支持向量機(SVM)
SVM的原理是建立一個最優(yōu)分類超平面,使其分類間隔最大化[26]。在進行非線性問題的求解時具有泛化能力強、全局最優(yōu)、結(jié)構化風險最小等優(yōu)勢[27]。本文采用LIBSVM 工具箱在MATLAB 2018軟件中建立SVM模型,通過測試確定了最適于本實驗數(shù)據(jù)的svmtrain函數(shù)參數(shù),SVM類型設置為e-SVR回歸,核函數(shù)選用高斯徑向基核函數(shù)(RBF)。懲罰參數(shù)(c)和核函數(shù)參數(shù)(g)根據(jù)樣本數(shù)據(jù)進行測試,最終確定了波段組c為900,g為0.25;光譜指數(shù)組c為367,g為0.14;全變量組c為4,g為0.09。
(5)BP神經(jīng)網(wǎng)絡(BPNN)
BP神經(jīng)網(wǎng)絡(多層前饋式誤差反向傳播神經(jīng)網(wǎng)絡)是一種監(jiān)督學習模型,它通過對代表性樣本進行學習訓練,從而掌握研究對象的本質(zhì)特性,具有很強的自組織和自適應能力,能夠模擬任意的非線性輸入輸出關系[28]。本研究基于MATLAB 2018 平臺,進行BPNN的結(jié)構設計。將建模集的波段組、光譜指數(shù)組和全變量組分別作為模型輸入因子,土壤鹽分作為模型輸出因子,建立土壤鹽分BPNN 反演模型。經(jīng)過反復訓練,最終確定了最適于本實驗數(shù)據(jù)的BPNN 模型參數(shù),訓練函數(shù)選用poslin,隱含層傳遞函數(shù)選用purelin,輸出層函數(shù)選用trainlm,模型最大迭代次數(shù)1000次,訓練目標最小誤差0.00001,波段組的神經(jīng)網(wǎng)絡結(jié)構為4-9-1,光譜指數(shù)組的結(jié)構為7-9-1,全變量組為11-9-1。
為量化模型的擬合能力,評價指標采用決定系數(shù)(Coefficient of determination,R2)和均方根誤差(Root mean square error, RMSE)[29]對模型的建模和驗證效果進行綜合評價。R2越接近1,表示模型擬合程度越好;RMSE越小,表示實測值和預測值誤差越小。因此,R2越大,RMSE 越小,說明模型精度越高,反演效果越好。
根據(jù)新疆土壤鹽堿化程度等級分類標準[30],將土壤分為非鹽化土(0~3 g·kg-1)、輕度鹽化土(3~6 g·kg-1)和中度鹽化土(6~10 g·kg-1)3 個等級。土壤含鹽量的分析結(jié)果如表2 所示,總樣本統(tǒng)計結(jié)果顯示,非鹽化土、輕度鹽化土、中度鹽化土所占比例分別為64.94%、27.27%、7.79%,變異系數(shù)為0.67,表明棉田土壤含鹽量呈中等變異性。
表2 土壤鹽分的描述性統(tǒng)計分析Tab.2 Descriptive statistical analysis on soil salinity
如圖2 所示,土壤高光譜波長范圍為310~1130 nm。地表土壤含鹽量不同導致土壤反射率存在差異,但不同鹽漬化等級土壤的光譜曲線相對平行,形態(tài)相似,變化趨勢基本一致,隨著波長的增加,土壤高光譜反射率先減小后增大。波長在310~373 nm 之間,光譜反射率隨波長的增加而迅速減??;波長在373~1130 nm 之間,反射率隨波長的增加而增大,其中在373~1050 nm 之間,曲線增長較緩,當大于1050 nm時,反射率迅速增大。整體來看,土壤鹽漬化越重,光譜反射率越高。
圖2 不同鹽漬化等級土壤光譜反射率曲線Fig.2 Spectral reflectance curves of soil with different salinization grades
根據(jù)皮爾遜相關系數(shù)界值表[14],樣本數(shù)(n)等于50 時,當相關系數(shù)(r)的絕對值大于0.354 時,表示在0.01 水平上顯著,光譜參量與土壤含鹽量的Pearson 相關系數(shù)如表3 所示,篩選出敏感波段(P<0.01)和敏感光譜指數(shù)(P<0.01)。b1、b2、b3、b4波段顯著性檢驗P<0.01,且r均達到0.5 以上,與土壤含鹽量的相關性大小依次為b1>b2>b3>b4。SI1、SI2、SI3、SI4、S3、S4、S5鹽分指數(shù)與土壤含鹽量均呈顯著相關(P<0.01),相關性大小依次為S4>S5>SI1>SI3>S3>SI2>SI4,且r均達到0.4 以上,說明SI1、SI2、SI3、SI4、S3、S4、S5在一定程度上可以表征土壤含鹽量。
表3 光譜參量與土壤鹽分的相關性Tab.3 Correlation between spectral parameters and soil salinity
選擇與土壤鹽分顯著相關(P<0.01)的b1、b2、b3、b4 波段作為波段組,選擇與土壤鹽分顯著相關(P<0.01)的SI1、SI2、SI3、SI4、S3、S4、S5 鹽分指數(shù)作為光譜指數(shù)組。為了避免模型中遺漏重要的光譜參量,且考慮不同類別光譜參量對模型的影響,將上述4個敏感波段和7個敏感光譜指數(shù)共同作為全變量組參與建模。
2.4.1 土壤鹽分回歸模型由表4 可知,同一變量組作為模型輸入變量下,MSR模型建模集R2均高于PLSR,且數(shù)值均大于0.340,RMSE 均低于PLSR,且數(shù)值均小于1.680,說明MSR 建模效果較好。對模型進行精度驗證時,發(fā)現(xiàn)波段組的MSR 模型和PLSR 模 型R2相 近,均 大 于0.472,RMSE 均 小 于1.415,驗證效果較好。在光譜指數(shù)組和全變量組中,PLSR 模型驗證集R2均高于MSR,其數(shù)值均大于0.448,RMSE均低于MSR,其數(shù)值均小于1.448,說明PLSR 驗證效果較好。綜合對比兩種回歸方法的不同變量組建模和驗證效果,發(fā)現(xiàn)基于波段組建立的MSR 模型是表4 所有模型中最優(yōu)的土壤鹽分反演模型。
表4 基于不同變量組的回歸模型Tab.4 Regression models based on different groups of variables
2.4.2 土壤鹽分機器學習算法反演模型如表5所示,波段組和光譜指數(shù)組作為模型輸入變量下,建模集的各類機器學習模型R2均大于0.616,其中SVM模型的建模集R2均達到0.768以上,RMSE均小于0.998,建模精度最高,BPNN 模型次之,ELM 模型精度最低。對模型進行精度驗證時,發(fā)現(xiàn)波段組和光譜指數(shù)組的ELM、SVM 模型RMSE 較大。在全變量組中,BPNN模型的建模集和驗證集R2均為3個模型中的最高值,分別達到了0.705和0.556,RMSE 分別為1.133 和1.409,模型精度最高,ELM 模型次之,SVM模型精度最低。因此,在3種機器學習算法中,BPNN 模型最適于本實驗數(shù)據(jù)。綜合對比3 種算法的不同變量組建模和驗證效果,發(fā)現(xiàn)基于全變量組建立的BPNN 模型是表5所有模型中最優(yōu)的土壤鹽分反演模型。對比表4 和表5 可知,機器學習模型精度均高于線性回歸模型,因此,本文最終使用基于全變量組建立的BPNN 模型來反演31 團春季土壤表層含鹽量。
表5 基于不同變量組的機器學習模型Tab.5 Machine learning models based on different variable groups
對比圖3 和圖4 可知,土壤含鹽量為6 g·kg-1以上的土壤均分布于灌區(qū)中部的鹽堿地帶上,含鹽量為0~3 g·kg-1的土壤均分布于灌區(qū)內(nèi)部遠離荒地的區(qū)域,越靠近荒地,土壤含鹽量越高。由此可知,土壤鹽分反演結(jié)果與Kriging插值結(jié)果基本一致,與調(diào)查情況相符,表明耕地鹽分反演結(jié)果的準確率較高。
圖3 耕作區(qū)土壤含鹽量Kriging插值分布Fig.3 Kriging interpolation distributions of soil salinity in tillage area
圖4 耕作區(qū)土壤含鹽量反演等級分布Fig.4 Inversion grade distributions of soil salinity in tillage area
如表6所示,2019、2021年春季耕作區(qū)土壤主要為非鹽化土,分別占耕作區(qū)總面積的55.55%和64.62%,其中含鹽量為2~3 g·kg-1的土壤分布面積最大,1~2 g·kg-1的土壤分布面積次之,0~1 g·kg-1的土壤分布面積最小。輕度鹽化土面積分別占44.31%和35.17%,其中含鹽量為3~4 g·kg-1的土壤分布面積最大,4~5 g·kg-1的土壤分布面積次之,5~6 g·kg-1的土壤分布面積最小。對比2 a土壤鹽漬化程度,發(fā)現(xiàn)2021 年春季非鹽化土面積相比2019 年增加了9.07%,輕度鹽化土面積縮小了9.14%,中度鹽化土面積變化較小。
表6 不同鹽分層次的像元個數(shù)及比例Tab.6 Number and proportion of pixels at different salinity levels
由圖4可知,含鹽量小于2 g·kg-1的土壤主要分布于恰拉水庫附近、耕作區(qū)中部和東南部。越接近南北兩側(cè)荒地的耕地土壤含鹽量越高,東北部的小塊耕地鹽分偏高,土壤鹽漬化程度主要為輕度鹽化土。中度鹽化土主要分布于灌區(qū)中部的鹽漬化地帶上,與實際影像位置相重合,取得了較為準確的反演效果。此外,東北部的小塊耕地部分區(qū)域和灌區(qū)內(nèi)的零散地塊上也有少量分布。2021 年反演圖中綠色更深,即含鹽量小于2 g·kg-1的土壤分布面積更大,在整個灌區(qū)都有體現(xiàn)。2021 年含鹽量大于4 g·kg-1的土壤分布面積相比于2019 年有所減小,圖上表現(xiàn)為橙紅色區(qū)域縮小。綜上可知,2021年土壤鹽漬化程度較2019年有所減輕。
棉田土壤含鹽量呈中等變異性,說明其易受氣候、地形、水文、地質(zhì)等自然因素和灌溉、翻耕、施肥等人為因素的影響[31-33]。采樣時間為2019年和2021年春季,2 a自然環(huán)境差異較大,不可控因素較多,因而本文將2 a春季數(shù)據(jù)混合,以中和不同年份的樣本數(shù)據(jù)變異性,再進行建模集和驗證集劃分,更具有合理性。本文對建模集OLI 多光譜波段、光譜指數(shù)與實測土壤鹽分進行相關性分析,發(fā)現(xiàn)多光譜敏感波段為藍、綠、紅波段,這與孫亞楠等[2]研究結(jié)果一致,說明波段為430~760 nm的土壤鹽分光譜信息量較多,而通過波段組進行特征光譜指數(shù)的構建可以挖掘光譜與鹽分之間的隱含信息,推動土壤鹽分遙感定量反演研究的發(fā)展。王雪梅等[34]、邊玲玲等[35]發(fā)現(xiàn)光譜指數(shù)與土壤鹽分之間存在一定的相關性,在估算應用方面具有很大貢獻。本研究也顯示,當敏感波段與敏感光譜指數(shù)共同作為模型輸入變量時,土壤鹽分反演模型的建模和驗證效果最優(yōu)。
本文基于3 個變量組,使用5 種方法建立了15個土壤鹽分反演模型,發(fā)現(xiàn)選擇不同的輸入變量和建模方法,模型效果存在差異。研究發(fā)現(xiàn),基于機器學習模型的精度和穩(wěn)定性均優(yōu)于傳統(tǒng)線性回歸,這是由于土壤鹽漬化發(fā)生機理的復雜性,土壤光譜特征與表層土壤含鹽量之間存在復雜的非線性關系,而機器學習算法具有極強的非線性擬合能力和推廣能力,適合模擬變量內(nèi)部機制的復雜關系。許多學者研究發(fā)現(xiàn)機器學習算法的反演效果優(yōu)于傳統(tǒng)回歸模型[14,23],與本文的研究結(jié)果一致。馮雪力等[15]在進行PCR、MSR和PLSR建模時,發(fā)現(xiàn)MSR模型模擬全鹽量效果最優(yōu),本研究也發(fā)現(xiàn)基于波段組建立的MSR模型是6個線性回歸模型中最優(yōu)的土壤鹽分反演模型。傳統(tǒng)線性回歸建模效果雖次于機器學習算法,但其簡便易懂,回歸方程清楚可見,具有一定的運用價值;機器學習模型可以極大的提升模型反演精度,也具有一定的研究價值。
土壤鹽分Kriging 插值圖基于各采樣點處土壤鹽分的實測值生成,數(shù)據(jù)源為點狀數(shù)據(jù),數(shù)據(jù)量較小,成果圖較為粗略,僅能大致反應土壤鹽分的分布狀況。而遙感技術能根據(jù)土壤鹽分反演模型將影像上所有柵格點處的光譜反射率轉(zhuǎn)化為土壤含鹽量,由此達到量化效果,再對柵格點數(shù)值進行范圍劃分,可以得出不同鹽分層次的柵格點個數(shù)及所占比例。對比2 a 土壤鹽漬化程度,發(fā)現(xiàn)2021 年土壤鹽漬化程度較2019 年有所減弱,這可能與氣溫、蒸發(fā)量、灌水量有關。氣溫越高,蒸發(fā)作用越強,土壤中的鹽分向表層運移;灌水量越大,對土體淋洗作用越強,土壤表層含鹽量越低。而且當?shù)胤浅V匾曽}漬土的治理,制定了合理的農(nóng)業(yè)灌溉排水制度和措施,隨著時間的推移,取得了一定成效。
已有研究多是針對某一年份的鹽漬土進行反演[36-37],但由于每年環(huán)境氣候多變,且柵格點內(nèi)地物類型復雜,使得不同年份的遙感影像數(shù)據(jù)存在較大差異。本研究考慮了不同年份自然環(huán)境的差異性,選用2 a春季數(shù)據(jù)參與建模和驗證,通過不斷調(diào)整模型參數(shù),建立最優(yōu)反演模型,對春季土壤鹽分進行反演,取得了良好的效果,但本次研究對象為非植被覆蓋土,未能反演作物生長期的土壤鹽分,所以下一步可以嘗試研究作物光譜與土壤含鹽量之間的關系。另外,試驗區(qū)自然因素復雜多變,限制了土壤鹽分的實時監(jiān)測,因此反演方法在其他地區(qū)和其他季節(jié)的適用性還有待進一步研究。
(1)棉田土壤主要為非鹽化土和輕度鹽化土,總樣本變異系數(shù)為0.67,呈中等變異性。光譜反射率與土壤鹽漬化程度的關系表現(xiàn)為土壤鹽漬化越重,光譜反射率越高。
(2)通過土壤鹽分與OLI 多光譜影像的波段、光譜指數(shù)進行相關性分析,發(fā)現(xiàn)b1、b2、b3、b4 波段和SI1、SI2、SI3、SI4、S3、S4、S5鹽分指數(shù)均通過顯著性檢驗P<0.01,相關系數(shù)均達到0.4以上。
(3)所有模型中,基于全變量組建立的BPNN模型反演精度最高,建模集R2為0.705,RMSE 為1.133;驗證集R2為0.556,RMSE為1.409。綜合分析建模和驗證效果,選用基于全變量組的BPNN 模型來反演春季棉田表層土壤含鹽量。
(4)由反演結(jié)果可知,2019、2021年春季耕作區(qū)土壤主要為非鹽化土,分別占耕作區(qū)總面積的55.55%和64.62%,其次為輕度鹽化土,分別占44.31%和35.17%。越接近南北兩側(cè)荒地的耕作區(qū)土壤含鹽量越高,東北部的小塊耕地鹽分偏高。2021年土壤鹽漬化程度較2019年有所減輕。