彭遠(yuǎn)新,王澤強(qiáng),周忠科,宋曉寧,徐夕博
1.棗莊學(xué)院旅游與資源環(huán)境學(xué)院,山東 棗莊 277160
2.山東師范大學(xué)地理與環(huán)境學(xué)院,山東 濟(jì)南 250358
土壤是地表生物的各項(xiàng)生命活動(dòng)正常運(yùn)行的基礎(chǔ),在生態(tài)系統(tǒng)的物質(zhì)轉(zhuǎn)化和能量傳遞中起到關(guān)鍵的媒介作用[1-2]。 土壤鹽分含量(SSC,本文均指質(zhì)量分?jǐn)?shù))是評(píng)價(jià)土壤質(zhì)量的一項(xiàng)重要指標(biāo),其對(duì)綠色植物生長(zhǎng)異常敏感。 土壤在發(fā)生鹽化后,鈉離子會(huì)發(fā)生富集進(jìn)而限制植物細(xì)胞中的物質(zhì)交換,導(dǎo)致植物生長(zhǎng)受限甚至死亡[3-4]。 在全球變暖和人類活動(dòng)的作用下,全球范圍內(nèi)約有7%的土地受到不同程度的鹽化影響,1/3 的世界耕地存在鹽漬化的風(fēng)險(xiǎn),土壤鹽化對(duì)干旱區(qū)域乃至世界的生態(tài)環(huán)境安全帶來極大的威脅[5-6]。 所以,為實(shí)現(xiàn)土壤鹽化的風(fēng)險(xiǎn)預(yù)警和治理恢復(fù),快速精準(zhǔn)地進(jìn)行區(qū)域SSC 識(shí)別與分異狀態(tài)監(jiān)測(cè)尤為重要。
近年來,遙感作為一種新型對(duì)地觀測(cè)技術(shù),因其具有覆蓋廣、數(shù)據(jù)更新快和獲取成本低等優(yōu)勢(shì),被廣泛用于土壤制圖與環(huán)境監(jiān)測(cè)領(lǐng)域。 彭杰等[7-10]在實(shí)驗(yàn)室控制條件下利用土壤鹽分光譜定量分析技術(shù),分析出SSC 在450 ~680 nm 和短波紅外的波譜范圍內(nèi)存在確定的響應(yīng)波段,并利用其作為模型輸入變量完成SSC 的光譜定量估算,證實(shí)SSC 光譜定量估算方式的可行性。 在此基礎(chǔ)上,LIU 等[11-14]分析了衛(wèi)星影像波段反射率(Landsat-5、Landsat-8、Sentinel-2 和HJ-1 等)與土壤鹽分間的相關(guān)關(guān)系,探尋光譜波段吸收特征與石膏、碳酸鈣、硫酸鈉等鹽分礦物間微妙且穩(wěn)定的聯(lián)系性,最后建立遙感估算模型,分析得出區(qū)域尺度SSC 分布規(guī)律。
鹽分在表層土壤中的積累是地貌、降水和人類活動(dòng)等因素共同作用下的一種綜合表現(xiàn),因而在利用統(tǒng)計(jì)模型擬合SSC 與衛(wèi)星接收的光譜發(fā)射率間的關(guān)系時(shí),僅通過簡(jiǎn)單線性模型是很難取得較高精度的,而基于非線性回歸技術(shù)的機(jī)器學(xué)習(xí)算法在構(gòu)建SSC 遙感估算模型中具有更大的優(yōu)勢(shì)。 例如,王飛等[15-17]在衛(wèi)星遙感數(shù)據(jù)基礎(chǔ)上采用機(jī)器學(xué)習(xí)技術(shù)(例如人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和隨機(jī)森林等)完成了土壤鹽分在區(qū)域尺度上的反演制圖。 通常來說,機(jī)器學(xué)習(xí)過程中通過增多隱藏層數(shù)量、增加結(jié)構(gòu)參數(shù)設(shè)置和決策樹節(jié)點(diǎn)數(shù)目,可以實(shí)現(xiàn)對(duì)土壤屬性到光譜信號(hào)間的信息轉(zhuǎn)換。 但是,輸入樣本數(shù)據(jù)在土壤環(huán)境、人類活動(dòng)和采樣過程等因素影響下表現(xiàn)出的特異性和空間非關(guān)聯(lián)性增加了目標(biāo)地物與光譜特征間映射關(guān)系的復(fù)雜度,使機(jī)器學(xué)習(xí)模型的泛化能力減弱和出現(xiàn)局部極值問題,限制了估算精度的提升和模型的可應(yīng)用性。 針對(duì)此問題,方利民等[18-22]探索在遙感估算模型構(gòu)建之前通過預(yù)先對(duì)樣本數(shù)據(jù)進(jìn)行隨機(jī)選擇、含量分布、光譜特征和土壤類型劃分等方式減弱或消除特異性樣本的影響,選取最佳訓(xùn)練樣本集,在確保驗(yàn)證集精度的同時(shí)有效提升訓(xùn)練效率和準(zhǔn)確度。 上述研究對(duì)特異樣本數(shù)據(jù)的識(shí)別均是基于樣本的含量特征信息,然而,采集到的地理樣本除帶有描述統(tǒng)計(jì)的含量特征數(shù)據(jù),還具有顯著的地理位置特征信息[23-24]。 根據(jù)地理學(xué)第一定律[25],地理事物之間距離越近,表現(xiàn)出的空間相關(guān)性越強(qiáng),而特異性地理數(shù)據(jù)則呈現(xiàn)出弱的地理相關(guān)性并在空間上表現(xiàn)出非關(guān)聯(lián)性。 所以,在立足于決策樹集成學(xué)習(xí)的隨機(jī)森林中加入空間關(guān)聯(lián)函數(shù)將空間位置信息引入,用以探尋樣本數(shù)據(jù)在連續(xù)地理空間上的空間關(guān)聯(lián)度,并完成對(duì)空間特異數(shù)據(jù)的識(shí)別和最優(yōu)訓(xùn)練集的構(gòu)建,減少樣本量和提升計(jì)算效率,在區(qū)域尺度下的SSC狀態(tài)識(shí)別與分布規(guī)律監(jiān)測(cè)中具有一定的潛力。
濰北平原位于萊州灣南岸地區(qū),土壤的母質(zhì)及發(fā)育過程兼具海洋和陸地的特征,因此在此特定景觀環(huán)境下構(gòu)建準(zhǔn)確高效的鹽分估算制圖模型,一直是資源環(huán)境領(lǐng)域的重點(diǎn)和難點(diǎn)工作。 本文選取濰北平原為研究區(qū),野外采集233 個(gè)土壤樣本并獲取同時(shí)相的Sentinel-2 多光譜影像,分別構(gòu)建兩波段差值、比值、歸一值指數(shù)、相鄰三波段正切指數(shù)和單波段共135 個(gè)光譜參量;進(jìn)一步采用隨機(jī)森林變量重要度評(píng)估技術(shù),選擇SSC 敏感光譜參量為輸入自變量,測(cè)試得到的鹽分含量值為因變量,分別建立基于隨機(jī)森林和空間關(guān)聯(lián)隨機(jī)森林算法的遙感估算;最后完成區(qū)域尺度下的SSC 含量估算和數(shù)字制圖,以期為實(shí)現(xiàn)土地資源優(yōu)化管理和土壤環(huán)境政策制定提供理論支持和方法依據(jù)。
研究區(qū)位于萊州灣南岸濰北平原地區(qū)(圖1),地理坐標(biāo)為北緯37°8'24″~37°16'36″和東經(jīng)118°37'40″~118°46'24″,占地總面積約為59.14 km2。 作為典型的溫帶大陸性季風(fēng)氣候區(qū),該地受海洋環(huán)境影響明顯且干濕季分明。 據(jù)歷史氣象資料記錄,多年平均氣溫和降水量分別為12.7 ℃和608.5 mm。 研究區(qū)內(nèi)整體地形平坦,以平原為主,適合農(nóng)業(yè)種植,主要種植作物類型為玉米和小麥。 地質(zhì)構(gòu)造上屬遼冀臺(tái)向斜第四系沉積層,當(dāng)前地質(zhì)狀況較為穩(wěn)定。 因距海較近,地下水受到海咸水入侵,在冬季強(qiáng)烈的蒸發(fā)作用下土壤表現(xiàn)為輕微的鹽堿化(1 g/kg <SSC < 2 g/kg)[26]。
圖1 研究區(qū)及采樣點(diǎn)示意圖Fig.1 The study area and samplings sites
在室內(nèi)首先以ArcGIS 10.2 軟件的數(shù)字底圖為基礎(chǔ),綜合考慮土地利用、水文地質(zhì)和道路交通可達(dá)性等因素,完成233 處土壤樣點(diǎn)的預(yù)設(shè)。 采樣過程中,將預(yù)設(shè)樣點(diǎn)周邊10 m 內(nèi)設(shè)定為采樣范圍,采用多點(diǎn)混合法將土壤綜合至1 kg 左右;其后裝入聚乙烯密封袋中,送往實(shí)驗(yàn)室待測(cè)。 同時(shí),采用手持式GPS 確定并記錄采樣點(diǎn)的真實(shí)地理坐標(biāo),采樣過程在2019 年1 月完成。 在實(shí)驗(yàn)室內(nèi),首先去除土壤中小石塊、木棒和草根等明顯異質(zhì)物;接下來,土壤樣品在室溫條件(25 ℃)下風(fēng)干并過1 mm 篩,完成待測(cè)前處理;最后,運(yùn)用質(zhì)量法測(cè)定土壤樣品的全鹽含量,即吸取一定量基質(zhì)水浸出液,并蒸干除去有機(jī)質(zhì),再烘干稱量測(cè)得全鹽量[27]。
研究所使用的Sentinel-2(哨兵二號(hào))多光譜影像數(shù)據(jù)(2019 年1 月17 日)由美國(guó)地質(zhì)調(diào)查局網(wǎng)站提供,數(shù)據(jù)獲取條件為晴朗無云天氣及地面無明顯積雪。 下載得到的影像數(shù)據(jù)為L(zhǎng)1C 級(jí)的大氣表觀反射率產(chǎn)品,在鹽分估算中,要將L1C級(jí)數(shù)據(jù)轉(zhuǎn)換為L(zhǎng)2A 的地表真實(shí)反射率產(chǎn)品。 需對(duì)數(shù)據(jù)進(jìn)行輻射校正和大氣校正,具體實(shí)現(xiàn)過程由歐空局推薦的SNAP 軟件(已安裝Sen2Cor 大氣校正插件)完成[28]。 哨兵二號(hào)影像數(shù)據(jù)中的波段1、 波段9 和波段10 設(shè)計(jì)用于大氣和水分特征的檢測(cè),不能用于土壤鹽分含量的反演,因此在接下來的計(jì)算過程中將其排除。 為確保各個(gè)光譜波段與地面信息間的匹配性,所有波段均進(jìn)行重采樣操作(空間分辨率為10 m)。 并且影像與地面采樣數(shù)據(jù)進(jìn)行地理校正,確保像元偏差不大于0.5 個(gè)像元。 此外,在土地覆蓋以裸地為主,部分存在植被的區(qū)域,參照裸土的判別標(biāo)準(zhǔn)(NDVI <0.2)[29-30],剔除存在光譜干擾的植被區(qū)域。 地面樣品和影像數(shù)據(jù)獲取時(shí)間正值冬季,降水較為稀少,因此土壤水分對(duì)光譜反射率的影響最小。
在土壤有機(jī)質(zhì)、鐵和黏土的重疊吸收作用下,土壤鹽分在可見光-近紅外范圍內(nèi)的光譜吸收特征通常具有非特異性,表現(xiàn)出覆蓋范圍廣、光譜信號(hào)較弱的特點(diǎn)[31]。 因此,除對(duì)多光譜影像的10個(gè)波段進(jìn)行光譜分析以外,本研究還選擇光譜差值指數(shù)(D)、光譜比值指數(shù)(RI)、光譜歸一化指數(shù)(ND)和相鄰三波段正切指數(shù)(tan)共4 種方式用于挖掘土壤鹽分的特征光譜信號(hào),計(jì)算過程:
式中:Bi和Bj分別表示哨兵數(shù)據(jù)的第i、j 波段的光譜反射率;tanpmq為相鄰的3 個(gè)波段(波段p、波段m 和波段q)之間夾角的正切值,用于表征光譜曲線形狀對(duì)土壤鹽分的響應(yīng)能力;kpm是波段p 和波段m 之間連線的斜率;kmq是波段m 和波段q之間連線的斜率。 波段運(yùn)算在ENVI 5.3.1 軟件中的IDL 二次開發(fā)平臺(tái)中完成。
空間關(guān)聯(lián)隨機(jī)森林模型的構(gòu)建是在隨機(jī)森林算法[32]的基礎(chǔ)之上(流程見圖2),在樣本數(shù)據(jù)輸入側(cè)引入空間權(quán)重函數(shù)[式(5)~式(7)],用以評(píng)估樣本數(shù)據(jù)間的關(guān)聯(lián)度和空間特異性,在完成輸入樣本數(shù)據(jù)的最優(yōu)組合聚類后,進(jìn)行回歸模型的擬合計(jì)算。 模型計(jì)算過程如圖2 所示。
圖2 空間關(guān)聯(lián)隨機(jī)森林模型流程圖Fig.2 Work flowcharts for the spatial random forest model
式中:F 表示因變量yi、自變量xi和位置信息(μi,νi)間的函數(shù)關(guān)系; Fi(φ) 為對(duì)應(yīng)位置i 處的空間權(quán)重高斯函數(shù); δ 和L 分別代表隨機(jī)誤差和土壤鹽分真實(shí)值;t 表示樣本數(shù)據(jù)的空間關(guān)聯(lián)度值,數(shù)值越小,樣本數(shù)據(jù)空間關(guān)聯(lián)性越強(qiáng),依據(jù)此數(shù)據(jù)實(shí)現(xiàn)對(duì)輸入數(shù)據(jù)集的組合聚類。
決策樹數(shù)量(ntree)、總特征集上的特征子集(m try)、變量重要度值(VIS)和地理要素信息協(xié)同變量(Xi)是空間關(guān)聯(lián)隨機(jī)森林模型構(gòu)建過程中的4 項(xiàng)重要參數(shù)。 隨機(jī)森林算法的核心思想是構(gòu)建若干棵決策樹(ntree),從決策樹上的總特征集中,隨機(jī)選擇m 個(gè)特征子集(m try)用作預(yù)測(cè)變量,最后投票匯總結(jié)果;VIS 的大小用于衡量輸入自變量對(duì)因變量的影響強(qiáng)度和解釋能力的高低,在模型構(gòu)建中將根據(jù)VIS 的大小選擇最佳的光譜參數(shù)用于SSC 估算;此外,為增加空間權(quán)重評(píng)估函數(shù)對(duì)樣本數(shù)據(jù)的位置信息解釋能力和穩(wěn)定性,選擇典型且易于計(jì)算的5 個(gè)環(huán)境要素特征作為輔助信息,分別是地面高程、植被歸一化指數(shù)、土壤濕度指數(shù)、地表溫度和離海距離。 地面高程數(shù)據(jù)免費(fèi)下載自地理數(shù)據(jù)共享平臺(tái)(http:/ /www.gscloud.cn/),NDVI、土壤濕度指數(shù)和地表溫度數(shù)據(jù)的求算參照文獻(xiàn)[33-34],獲取時(shí)間與地面采樣時(shí)間相同,樣點(diǎn)離海岸線邊界的距離的計(jì)算在ArcGIS 10.2 軟件中的歐式距離計(jì)算模塊中完成。在本研究中,ntree 和m try 分別設(shè)置為1 000 和3,模型的實(shí)現(xiàn)與計(jì)算在Python 3.8 中進(jìn)行。
采集到的土壤樣本總集隨機(jī)劃分為建模集(n=209)和驗(yàn)證集(n=24),建模樣本集用于估算模型的訓(xùn)練,估算模型精度的驗(yàn)證在驗(yàn)證集進(jìn)行。 決定系數(shù)(R2)和相對(duì)分析誤差(RPD)是評(píng)價(jià)模型精度的重要統(tǒng)計(jì)指標(biāo)。 R2表示自變量對(duì)因變量的信息解釋能力的強(qiáng)弱,RPD 表征反演模型比只使用均值模型性能提升的能力。 RPD 大于2.0 時(shí),說明模型取得滿意的精度;RPD 處在1.4 ~2.0 之間時(shí)表明反演結(jié)果尚可接受,有待進(jìn)一步提升;而RPD 小于1.40 時(shí),意味著模型尚不具備反演能力[17]。 通常,R2和RPD 越大,表明估算模型的精度和穩(wěn)定性越強(qiáng)。
濰北平原表層土壤(0 ~20 cm)SSC 的描述性統(tǒng)計(jì)特征如表1 所示。 從表1 可以看出,土壤樣品總集的SCC 為0.49 ~21.22 g/kg 內(nèi),均值為2.29 g/kg,覆蓋范圍較大且分布不均勻。 SSC 較高的采樣點(diǎn)主要分布在中部和北部鹽田附近,其余大部分采樣點(diǎn)位于耕地,SSC 較低。 在本研究中,變異系數(shù)主要用來評(píng)估數(shù)據(jù)的離散程度[35],3個(gè)樣品數(shù)據(jù)集的變異系數(shù)均大于0.36,已處于高度變異,表明區(qū)域內(nèi)SSC 分異較大。 SSC 數(shù)據(jù)存在空間變異會(huì)增加地表反演模型的訓(xùn)練難度,但一定程度的數(shù)據(jù)變異會(huì)有利于模型收斂并對(duì)模型的計(jì)算效率產(chǎn)生積極影響,所以隨機(jī)抽取到的建模集和驗(yàn)證集用于土壤鹽分的遙感建模反演是可靠的[36]。 峰度和偏度用于描述數(shù)據(jù)分布的集中和雙尾特性[37],3 個(gè)數(shù)據(jù)集的偏度值均大于2,表現(xiàn)出正偏,表明外部活動(dòng)已經(jīng)干擾了成土之初SSC 正態(tài)分布狀態(tài)。 土壤樣本在總集合上的峰度偏高,說明鹽分含量分布呈現(xiàn)出非集中的均勻分布態(tài)勢(shì)。 SSC 的統(tǒng)計(jì)特征變異性,一定程度上也反映了土壤鹽堿化的狀態(tài)趨勢(shì)。 濰北平原地區(qū)工農(nóng)業(yè)生產(chǎn)發(fā)展造成地下水過度開采,引發(fā)海咸水倒灌,加之旱季蒸發(fā)強(qiáng)烈,可溶性鹽運(yùn)移至表層土壤中產(chǎn)生結(jié)晶富集;土壤表現(xiàn)出輕微的鹽堿化,并帶來土地肥力下降等一系列的環(huán)境問題,這也是SSC 的數(shù)據(jù)分布表現(xiàn)顯著變異的潛在驅(qū)動(dòng)因素[38]。
表1 土壤SSC 描述性統(tǒng)計(jì)特征Table 1 Statistical characteristics of soil salt contents in the surface soils
通過式(1)至式(4)共計(jì)算得到125 個(gè)光譜指數(shù),包括39 個(gè)D、39 個(gè)RI、39 個(gè)ND 和8 個(gè)tan。 對(duì)SSC 最敏感的前10 個(gè)單波段和光譜指數(shù)的變量重要度(VIS)如圖3 所示。 B11 是最重要的光譜波段,VIS 達(dá)到35.1%,其次是B3 和B8,其余波段的VIS 均小于10%。
圖3 光譜參數(shù)變量重要度Fig.3 Variable importance scores of the spectral parameters
通過兩兩波段變換得到的光譜指數(shù),對(duì)SSC信息的響應(yīng)能力提升明顯,波段比值指數(shù)的光譜信息提升能力最強(qiáng);例如,B3 和B4 的變量重要度(VIS)分別為11.6%和4.4%,但經(jīng)過波段比值變換后,RI34的VIS 達(dá)到27.5%,有效增強(qiáng)了土壤鹽分的光譜特征。 B11 是重要度最高的單波段,在RF 變量重要度評(píng)估算法輸出中的10 個(gè)最優(yōu)光譜指數(shù)中,B11 參與了6 個(gè)光譜指數(shù)的構(gòu)建,在鹽分遙感反演模型和光譜指數(shù)的構(gòu)建中應(yīng)給予重點(diǎn)關(guān)注。 基于此,選擇3 個(gè)波段(B11、B3 和B8)和4個(gè)光譜指數(shù)(RI34、RI711、ND611和D45)作為SSC 的特征光譜參數(shù),并在SSC 估算模型構(gòu)建中充當(dāng)輸入自變量。
土壤鹽化通常是鹽分離子在蒸發(fā)作用下發(fā)生運(yùn)移,在土壤表層生成白色晶體聚合物和鹽殼的過程。 鹽分分子及其基團(tuán)在晶格結(jié)構(gòu)上振動(dòng)的合頻與倍頻,會(huì)產(chǎn)生特異性的吸收特征峰[39]。WANG 等[3]和SIDIKE 等[40]在對(duì)SSC 的光譜吸收特征的室內(nèi)控制實(shí)驗(yàn)分析時(shí)發(fā)現(xiàn),波長(zhǎng)在560 nm 和1 640 nm 附近波段與SSC 具有顯著的相關(guān)性。 FOURATI 等[41]在利用衛(wèi)星影像構(gòu)建估算模型對(duì)土壤鹽化水平進(jìn)行識(shí)別時(shí),得出了同樣的結(jié)果,即處在短波紅外范圍內(nèi)的2 個(gè)波段(波長(zhǎng)在1 600 nm 和2 200 nm 附近)對(duì)SSC 表現(xiàn)出極顯著的相關(guān)性。 而本研究篩選得到的特征波段B3 和B11 的中心波長(zhǎng)分別處在560 nm 和1 610 nm 附近,證實(shí)了本研究所選波段的典型性和估算模型構(gòu)建的可靠性。 此外,張俊華等[8]在分析寧夏銀北地區(qū)鹽化土壤的原位光譜分析時(shí)指出,600 nm附近是SSC 的一個(gè)明顯吸收峰,并且640 ~870 nm光譜區(qū)間內(nèi)波段的光譜反射率與碳酸根鹽分離子顯著相關(guān),這與哨兵影像的波段8 的中心波長(zhǎng)范圍高度一致。 總之,SSC 估算模型的輸入特征波段有著明確的物理意義,能夠反映地表土壤鹽分的光譜反射率特征。
不同的特征光譜參數(shù)(特征波段和最優(yōu)光譜指數(shù)) 構(gòu)建的估算模型的預(yù)測(cè)結(jié)果如圖4所示。
圖4 不同估算模型的土壤鹽分含量估算值與實(shí)測(cè)值對(duì)比散點(diǎn)圖Fig.4 The scatter plots of estimated SSC values versus measured SSC values based on the different model
圖4(a)和圖4(b)分別是以3 個(gè)特征波段(B11 、B3 和B8)和4 個(gè)光譜指數(shù)(RI34、RI711、ND611和D45)作為輸入自變量,測(cè)得的土壤SSC作為因變量,訓(xùn)練得到的基于RF 算法的反演模型的結(jié)果。 可以看出,2 個(gè)估算模型的驗(yàn)證精度RPD 均小于1.40,實(shí)測(cè)值和估算值偏離1 ∶1 線較大,表明構(gòu)建模型尚不能夠進(jìn)行土壤鹽分的準(zhǔn)確估算。 圖4(d)和圖4(e)表示的估算模型是以空間關(guān)聯(lián)隨機(jī)森林算法為基礎(chǔ)構(gòu)建,對(duì)比RF 算法構(gòu)型的模型[圖4(a)和圖4(b)],以空間關(guān)聯(lián)隨機(jī)森林算法為基礎(chǔ)構(gòu)建的估算模型[圖4(d)和圖4(e)] 的驗(yàn)證精度RPD 分別提升至1.17 和1.60,以4 個(gè)光譜指數(shù)(RI34、RI711、ND611和D45)為輸入變量的空間關(guān)聯(lián)隨機(jī)森林模型,基本能夠較準(zhǔn)確地實(shí)現(xiàn)土壤鹽分的反演[RPD >1.40,圖4(e)]。
圖4(f)是組合3 個(gè)特征波段和4 個(gè)光譜指數(shù)作為輸入自變量,得到的空間關(guān)聯(lián)隨機(jī)森林模型估算效果,土壤鹽分實(shí)測(cè)值與估算值的對(duì)比的散點(diǎn)基本在1 ∶1 線兩側(cè),估算值與實(shí)測(cè)值偏差較小,反演結(jié)果最佳(R2=0.89 和RPD=2.04);而采用相同輸入變量的RF 估算模型[圖4(c)],則尚不能準(zhǔn)確進(jìn)行SSC 的遙感估算。 總之,僅用特征波段或最佳光譜指數(shù)來構(gòu)建SSC 估算模型均不能取得滿意精度,空間關(guān)聯(lián)隨機(jī)森林模型的精度和穩(wěn)定度要高于隨機(jī)森林模型,再將特征波段和最佳光譜指數(shù)組合,輸入到空間關(guān)聯(lián)隨機(jī)森林算法中去,建立得到的反演模型能夠較準(zhǔn)確地完成土壤鹽分的遙感估算。
以特征波段和光譜指數(shù)作為輸入自變量的空間關(guān)聯(lián)隨機(jī)森林模型在不同空間關(guān)聯(lián)度(t)下的精度變化如圖5 所示。 當(dāng)t 為4 時(shí),共有197 個(gè)數(shù)據(jù)樣本(n 表示輸入樣本數(shù))參與估算模型的建立,R2為0.77;t 繼續(xù)減少,選取得到的數(shù)據(jù)樣本間的空間關(guān)聯(lián)度增強(qiáng),t 為2 時(shí),共有185 個(gè)土壤樣本參與模型構(gòu)建,取得了最高的估算精度(R2=0.89);隨著樣本空間關(guān)聯(lián)度要求提升,樣本量減少,模型逐漸不夠完全訓(xùn)練,精度隨之下降。
圖5 不同t 時(shí)空間關(guān)聯(lián)隨機(jī)森林模型精度Fig.5 The perform ance changes of spatial random forest model with the different t value
為進(jìn)一步驗(yàn)證構(gòu)建的土壤鹽分反演模型的穩(wěn)定性和可靠度,將構(gòu)建得到的最優(yōu)反演模型推廣至整個(gè)研究區(qū),計(jì)算得到的鹽分空間分布如圖6所示。
圖6 土壤鹽分含量分布圖Fig.6 The spatial distribution of the soil salt contents
從圖6 可以看出,土壤鹽分含量在中部地區(qū)略高于北部和南部地區(qū),鹽分含量高值區(qū)與鹽田的分布位置密切相關(guān)。 此外,研究區(qū)土地利用主要為農(nóng)用耕地,地質(zhì)地貌類型也較為單一,土壤鹽分含量的變異并沒有在大的空間尺度上表現(xiàn)得很明顯。 但是,SSC 在田塊尺度上表現(xiàn)出顯著變化,這與當(dāng)?shù)氐奈⒌孛埠秃K构嗝芮邢嚓P(guān)。 研究區(qū)是國(guó)內(nèi)知名的蔬菜生產(chǎn)基地,生產(chǎn)蔬菜的耕地需要進(jìn)行大量抽水灌溉,地下水儲(chǔ)備不足時(shí)引發(fā)海水倒灌,可溶性鹽分運(yùn)移至表層土壤產(chǎn)生一定程度富集,所以不同田塊間的SSC 存在明顯差異。
在遙感估算中,地理環(huán)境過程時(shí)刻在變化,土壤鹽分的光譜特征僅強(qiáng)調(diào)瞬時(shí)信號(hào)是遠(yuǎn)遠(yuǎn)不夠的。 下一步要將遙感反演的經(jīng)驗(yàn)統(tǒng)計(jì)模型與土壤鹽分動(dòng)態(tài)和環(huán)境的交互作用結(jié)合起來,從而最大化地減弱水汽、粗糙度和植被殘積物對(duì)反演的影響,最終建立起穩(wěn)健的遙感反演模型,實(shí)現(xiàn)動(dòng)態(tài)大尺度層面上的土壤屬性監(jiān)測(cè)。 其次,計(jì)算得到的光譜參數(shù)的重要度存在一定差異(即光譜參數(shù)對(duì)SSC 的響應(yīng)能力不同),但在模型輸入中并未考慮不同光譜參數(shù)的權(quán)重,若能將其對(duì)土壤鹽分的不同光譜參數(shù)的響應(yīng)強(qiáng)度考慮進(jìn)估算模型,將有助于選取最佳分裂節(jié)點(diǎn)和決策樹數(shù)目,提升模型的運(yùn)算精度和效率。 最后,混合像元問題是遙感估算中難以忽略的問題[12,42]。 混合像元的存在,會(huì)減弱土壤鹽分的目標(biāo)光譜特征,增大信號(hào)噪聲和模型誤差。 因此,在研究中選用空間分辨率(10 m)較高的Sentinel-2 影像作為數(shù)據(jù)輸入源,土壤樣點(diǎn)的采集也均在純像元中進(jìn)行,并且影像處理中掩膜掉道路、植被和建設(shè)用地等非裸土區(qū)域,以此最小化混合像元對(duì)反演結(jié)果的影像;并利用光譜指數(shù)構(gòu)建法凸顯SSC 的光譜信息,同時(shí)減弱環(huán)境弱信號(hào)。 但是,實(shí)現(xiàn)像元解混合采用超高空間分辨率影像可能是解決混合像元問題的最佳方案[43-44],在下一步研究中需要參考改進(jìn)。
1)哨兵影像的B3、B8 和B11 是SSC 的特征光譜波段,B11 對(duì)SSC 的重要度值最高。 兩兩波段間比值變換能夠有效綜合多個(gè)波段的光譜信息,增強(qiáng)衛(wèi)星光譜信號(hào)對(duì)SSC 的響應(yīng),最優(yōu)的光譜指數(shù)分別為RI34、RI711、ND611和D45。
2)空間關(guān)聯(lián)隨機(jī)森林模型的精度和計(jì)算效率優(yōu)于隨機(jī)森林遙感估算模型,以3 個(gè)特征波段和4 個(gè)最優(yōu)光譜指數(shù)作為輸入自變量時(shí),空間關(guān)聯(lián)隨機(jī)森林算法支持下的遙感估算模型的精度指標(biāo)R2和RPD 分別達(dá)到0.89 和2.04,能夠較準(zhǔn)確地完成SSC 的反演制圖。
3)SSC 的空間分布整體上中部略高于南部和北部,高值區(qū)主要受中部地區(qū)的鹽田分布影響;農(nóng)業(yè)活動(dòng)和微地貌使SSC 的分布在田塊尺度上分異趨勢(shì)顯著,建議采用農(nóng)業(yè)措施、水利措施、生物措施相結(jié)合的方式進(jìn)行土壤鹽化治理。