朱傳梅 王宏衛(wèi) 謝霞 馬利剛 仝雁軍 古力孜熱·買買提
摘要:土壤有機(jī)質(zhì)(SOM)是衡量礦區(qū)生態(tài)環(huán)境質(zhì)量的重要指標(biāo)之一。為了提高SOM含量的估算精度,在已有二波段指數(shù)的基礎(chǔ)上加入第3個(gè)波段,構(gòu)建新的三波段指數(shù),利用極限學(xué)習(xí)機(jī)(ELM)和隨機(jī)森林(RF)分別建立SOM含量的預(yù)測模型。在新疆準(zhǔn)東煤田采集168個(gè)土壤樣點(diǎn),在室內(nèi)進(jìn)行SOM含量、光譜的測定。對(duì)光譜數(shù)據(jù)進(jìn)行平滑和預(yù)處理后,構(gòu)建多個(gè)兩波段、三波段光譜指數(shù),隨后分析不同維度光譜數(shù)據(jù)與SOM含量的敏感程度和敏感區(qū)域。ELM和RF被用于對(duì)每個(gè)維度最優(yōu)光譜參數(shù)建立預(yù)測模型。研究結(jié)果顯示,無論采用哪種方式建模,每個(gè)維度的光譜數(shù)據(jù)與SOM含量的敏感程度和建模精度均隨信息維度的增加而增加,即三波段指數(shù)(TBI)>二波段指數(shù)>一維光譜數(shù)據(jù)。在三波段指數(shù)中,ELM的預(yù)測效果要優(yōu)于RF,其中(TBI-4)-ELM的預(yù)測效果最好,決定系數(shù)(r2)=0.87,均方根誤差(RMSEP)=4.07,相對(duì)分析誤差(RPD)=2.63。三波段指數(shù)與ELM的結(jié)合,可以很好地減弱土壤信息噪聲,提高SOM含量的預(yù)測精度。
關(guān)鍵詞:遙感;光譜分析;土壤有機(jī)質(zhì);光譜指數(shù);機(jī)器學(xué)習(xí)
中圖分類號(hào):S153.6+21文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1002-1302(2020)22-0233-09
作者簡介:朱傳梅(1993—),女,新疆昌吉人,碩士研究生,主要從事綠洲聚落景觀與土壤有機(jī)質(zhì)研究。E-mail:aspiration818@163.com。
通信作者:王宏衛(wèi),博士,教授,碩士生導(dǎo)師,主要從事干旱區(qū)綠洲聚落生態(tài)安全格局與土壤重金屬研究。E-mail:wanghw_777@163.com。
礦產(chǎn)資源的開采和加工可以帶來更多的經(jīng)濟(jì)效益,但是開采煤礦會(huì)干擾土層,破壞植被,使土壤失去利用價(jià)值,這對(duì)土地資源的可持續(xù)發(fā)展和生態(tài)環(huán)境構(gòu)成嚴(yán)重威脅[1]。在我國,大型的露天煤礦多集中分布于干旱、半干旱生態(tài)脆弱的地帶,該地區(qū)土壤自身修復(fù)能力極弱,生態(tài)敏感性極強(qiáng),再加上礦產(chǎn)資源長期大量被開采和加工,導(dǎo)致當(dāng)?shù)丨h(huán)境問題和生態(tài)修復(fù)問題日益突出[2]。土壤是陸地生態(tài)系統(tǒng)中許多生態(tài)過程(例如養(yǎng)分循環(huán)、水平衡、凋落物分解等)的基礎(chǔ),土壤有機(jī)質(zhì)狀態(tài)是衡量退化生態(tài)系統(tǒng)中生態(tài)功能恢復(fù)和維持的關(guān)鍵指標(biāo)[3]。因此,無損地監(jiān)測土壤有機(jī)質(zhì)(SOM)含量有助于礦區(qū)環(huán)境管理和生態(tài)恢復(fù)。一般的SOM含量測定多基于大量的野外土壤采樣和繁瑣的室內(nèi)化學(xué)分析方法,較費(fèi)時(shí)、費(fèi)力、耗資,無法滿足現(xiàn)代精細(xì)農(nóng)業(yè)發(fā)展的需要[3]。與傳統(tǒng)的方法相比,遙感技術(shù)是一種很有前景的土壤屬性定量評(píng)估方法,具有快速響應(yīng)、成本低、采集快等特點(diǎn),可以很好地用來描述、評(píng)估不同尺度下表層土壤的各種特征[4]。因此,基于不同的光譜反射和吸收特性,可見光-近紅外光譜(VIS-NIR)分析技術(shù)可以作為一種替代方法,保證SOM含量的準(zhǔn)確估算。
土壤是由多種物質(zhì)組成的混合物,其反射光譜常包括背景噪聲、基線漂移、傾斜等干擾信息,直接用來進(jìn)行SOM含量的估算得到的結(jié)果并不理想[5]。相關(guān)研究表明,光譜預(yù)處理方法能夠較好地移除噪聲、突出光譜曲線特征、去除或減弱其他因素的影響,為建立具有較高精度的估測模型提供可能[5]。光譜微分是增加信噪比的主要技術(shù)手段之一,其中一階微分(FD)可去除不同的背景噪聲和基線漂移,擴(kuò)大樣本間光譜的差異,反映被測物體的本質(zhì)特征。連續(xù)統(tǒng)去除(CR)法可減小散射對(duì)目標(biāo)光譜的影響,同時(shí)可放大微弱光譜的吸收特性[5]。這2種預(yù)處理技術(shù)被廣泛地應(yīng)用于VIS-NIR分析中,對(duì)建立預(yù)測能力強(qiáng)、穩(wěn)健性好的分析模型至關(guān)重要。
以往對(duì)于SOM的研究是在一維層面(全波段反射率或?qū)?yīng)的數(shù)學(xué)變換)上選取單個(gè)敏感波段或多個(gè)敏感波段進(jìn)行建模,該方法僅考慮了SOM與光譜間的關(guān)系,并沒有考慮光譜間的重疊吸收或相互影響[3-4]。光譜指數(shù)是由幾個(gè)窄波段或?qū)挷ǘ谓M合而成,可通過分析特定波段間的相互作用,提高對(duì)待測屬性的敏感程度。Wang等采用最優(yōu)兩波段指數(shù)對(duì)土壤鹽分含量進(jìn)行分析和預(yù)測,取得了較顯著的成果[3]。然而,Tian等在水稻葉片氮濃度的定量估測中,對(duì)比了兩波段指數(shù)和三波段指數(shù)的估算能力[4],這些研究和提出的指標(biāo)表明,通過兩波段指數(shù)評(píng)估某些參數(shù)存在不足。對(duì)于土壤這種組成極為復(fù)雜的物質(zhì),兩波段指數(shù)能否很好地消除或減弱土壤中其他物質(zhì)產(chǎn)生光的散射和分子的非特征吸收的干擾有待于進(jìn)一步研究。
機(jī)器學(xué)習(xí)算法在解析非線性問題時(shí)表現(xiàn)能力較好,常用于土壤屬性的定量化估測,其中,極限學(xué)習(xí)機(jī)(ELM)和隨機(jī)森林(RF)更是研究的焦點(diǎn)。Douglas等在估算土壤中總石油烴(TPH)含量時(shí),發(fā)現(xiàn)與線性偏最小二乘回歸(PLSR)法相比,RF模型能更好地反映土壤光譜的非線性響應(yīng),從而提供更高的預(yù)測精度[6]。然而,ELM和RF能否在較多的土壤信息噪聲中(如嚴(yán)重的人為影響)和較低的SOM水平(如干旱區(qū)嚴(yán)重的荒漠化影響)下,建立SOM含量和光譜參數(shù)的聯(lián)系,并達(dá)到一定的預(yù)測精度,有待進(jìn)一步研究。
本研究的目的:(1)利用波段優(yōu)化算法,構(gòu)建新的三波段光譜指數(shù);(2)量化不同維度的光譜參數(shù)對(duì)SOM的響應(yīng);(3)通過比較SOM的預(yù)測精度,尋找最有效的建模方法。
1材料與方法
1.1研究區(qū)介紹和土壤樣本的制備
研究區(qū)為準(zhǔn)東煤田,位于我國新疆準(zhǔn)噶爾盆地東南緣(43°45′~45°00′N,88°45′~91°10′E)為13000km2的露天煤田,煤炭儲(chǔ)量預(yù)估可達(dá)到3900億t[2]。它是世界上最大的綜合煤田,被譽(yù)為“中國工業(yè)糧倉”。該地為極端干燥的大陸性氣候,年平均降水量、溫度分別為140~183mm、5.3~7.3℃。土壤母質(zhì)為第四紀(jì)沖積沉積物,地表植被稀疏。準(zhǔn)東煤田的主要土地利用和土地覆被類型為荒地、草地、農(nóng)田等。自2006年準(zhǔn)東煤礦啟動(dòng)以來,大量的工礦活動(dòng)已造成了生態(tài)失衡和嚴(yán)重的環(huán)境污染,土壤性質(zhì)可能正在發(fā)生變化。
2014年6月,筆者所在研究團(tuán)隊(duì)收集了168個(gè)土壤樣本,期間未發(fā)生極端天氣(如大雨或強(qiáng)風(fēng))。研究區(qū)主要地形為丘陵,因此該試驗(yàn)的主要設(shè)計(jì)路線是沿著道路進(jìn)行。在確保車輛和人員安全的前提下,選擇距離道路較平坦的區(qū)域(>300m)作為采樣地點(diǎn)。在每個(gè)采樣點(diǎn),用木鏟收集直徑在10m以內(nèi)的5個(gè)子樣本的表土樣本(土壤深度為0~20cm),并混合成復(fù)合樣本(質(zhì)量約1.5kg)。將復(fù)合樣品立即裝入帶標(biāo)簽的防水自封袋中,并使用手持全球定位系統(tǒng)(GPS)和植被覆蓋率儀記錄樣品的坐標(biāo)、高程、植被覆蓋率等信息。將樣品送回實(shí)驗(yàn)室進(jìn)行室內(nèi)空氣干燥2周(室溫26~28℃),小心去除非土壤物質(zhì)(礫石、植物根、其他物質(zhì)),然后用瑪瑙研缽研磨并通過1.5mm篩,以減小粒徑的影響。SOM含量通過重鉻酸鉀外部加熱法[5]進(jìn)行測定。
1.2光譜數(shù)據(jù)的采集和預(yù)處理
利用ASD地物光譜儀進(jìn)行土壤樣本的光譜采集,該儀器在350~1000nm與1000~2500nm區(qū)間的采樣間隔分別為1.4、2.0nm,重采樣間隔為1.0nm,輸出波段數(shù)為2151個(gè)。土壤光譜的測定應(yīng)避免外界光源的干擾,因此試驗(yàn)在暗室中進(jìn)行,選用50W的鹵素?zé)簦筋^的視場角為5°,探頭距離土壤表面30cm,每測定10次進(jìn)行1次白板定標(biāo),每個(gè)土壤樣本重復(fù)測定10次,剔除異常光譜后取其算術(shù)平均值作為該樣品的反射率。
位于兩端(350~399nm和2401~2500nm)處的光譜數(shù)據(jù)通常存在高頻噪聲,因此對(duì)其進(jìn)行剔除。對(duì)168個(gè)土壤樣本的400~2400nm反射率光譜進(jìn)行多項(xiàng)式階數(shù)為2、平滑窗口為9點(diǎn)的Savitzky-Golay平滑。高光譜數(shù)據(jù)的維數(shù)較高,存在的多余重復(fù)信息和相鄰波段間高度相關(guān)。已有文獻(xiàn)表明,重采樣高光譜數(shù)據(jù)能夠降低信息冗余,提高計(jì)算的準(zhǔn)確度、速度、反演精度[4]。因此,對(duì)光譜數(shù)據(jù)重采樣到10nm,每個(gè)光譜由此獲得201個(gè)波段,降采樣后的光譜被定義為原始光譜(R)。
本研究引入了2種光譜預(yù)處理方法:用于去除地物背景噪聲、修復(fù)基線漂移的一階微分和用于消除散射、突出光譜特性的連續(xù)統(tǒng)去除法。預(yù)處理工作均在MATLAB2018b中完成。
1.3二維、三維相關(guān)系數(shù)
相關(guān)性分析有助于揭示SOM含量與光譜間線性相關(guān)關(guān)系的強(qiáng)弱,這種關(guān)系通常以一維線性數(shù)據(jù)的形式展示。近年來,許多研究以可視化的形式展示了常見光譜指數(shù)與待測屬性的相關(guān)關(guān)系,該方法不僅將光譜特性從一維擴(kuò)展到了二維,而且充分考慮了光譜間的相互關(guān)系[3-5],公式如下:
選取特定敏感區(qū)域的第三波段疊加在兩波段光譜指數(shù)上,往往能夠增加指數(shù)的精確性,增強(qiáng)抗干擾性,清除常用兩波段指數(shù)存在的易飽和現(xiàn)象等。本研究在所選3種指數(shù)的形式基礎(chǔ)上增加第3個(gè)波段λ3,使用MATLAB2018b做400~2400nm的全波段循環(huán),并選擇最優(yōu)三波段指數(shù)構(gòu)建估測模型。本研究具體涉及如下:
1.4建模預(yù)測
為了保證建模集和驗(yàn)證集數(shù)據(jù)盡可能地涵蓋SOM含量的全部范圍,本研究使用Kennard-Stone(K-S)算法進(jìn)行樣本集合的劃分。該算法根據(jù)已選擇對(duì)象的重要主成分?jǐn)?shù)量來將歐氏距離(Euclideandistance)最大化。168個(gè)土壤樣本被分成2個(gè)部分,其中112個(gè)樣本用于建模,剩余56個(gè)樣本用于驗(yàn)證建模結(jié)果。
1.4.1極限學(xué)習(xí)機(jī)
極限學(xué)習(xí)機(jī)(ELM)是由Huang等提出的基于單隱含層前饋神經(jīng)網(wǎng)絡(luò)的機(jī)器算法[7]。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型例如反向傳播前饋(BP)神經(jīng)網(wǎng)絡(luò)模型相比,其學(xué)習(xí)方式不同,BP神經(jīng)網(wǎng)絡(luò)模型利用梯度下降算法,通過反向傳播方式進(jìn)行學(xué)習(xí),在學(xué)習(xí)過程中須要不斷地進(jìn)行迭代來更新權(quán)值和閾值。而ELM僅須要添加隱含層節(jié)點(diǎn)的個(gè)數(shù),利用正則化計(jì)算網(wǎng)絡(luò)的輸出權(quán)值來達(dá)到學(xué)習(xí)的目的,網(wǎng)絡(luò)中輸入層和輸出層的權(quán)值和閾值通過隨機(jī)初始化得到,且不影響網(wǎng)絡(luò)的收斂能力。因此,它的學(xué)習(xí)速度比BP等提高了數(shù)千倍,且不會(huì)出現(xiàn)過擬合現(xiàn)象。
ELM中,連接層的激活函數(shù)采用更加接近生物學(xué)激活模型的softplus函數(shù)代替?zhèn)鹘y(tǒng)的sigmoid函數(shù),已有在不同數(shù)據(jù)庫的大量實(shí)驗(yàn)證明了softplus激活函數(shù)具有更好的泛化性能。本研究通過將步長從3增加到150,每次增加3個(gè)步長來確定隱含層的最優(yōu)節(jié)點(diǎn)數(shù),每個(gè)模型重復(fù)50次以減少隨機(jī)誤差。本研究利用MATLAB2018b對(duì)Huang等編寫的ELM源碼[7]進(jìn)行了部分修改和調(diào)試。
1.4.2隨機(jī)森林
隨機(jī)森林(RF)是用于分類和回歸的一種機(jī)器學(xué)習(xí)算法。RF以決策樹學(xué)習(xí)和簡單平均算法為基礎(chǔ),根據(jù)每個(gè)二叉樹上的節(jié)點(diǎn)數(shù)(m)和自助法(Bootstrap)抽換選取n個(gè)樣本構(gòu)建決策樹,利用未被選取的樣本對(duì)每顆樹進(jìn)行預(yù)測,由于RF隨機(jī)選擇特征和變量,使模型不容易陷入過度擬合。
為了建立RF模型,對(duì)模型中二叉樹節(jié)點(diǎn)處的變量個(gè)數(shù)(mtry)和決策樹數(shù)量(decisiontree)進(jìn)行調(diào)整。選擇均方差(MSE)的倒數(shù)作為適應(yīng)度函數(shù)值,即最優(yōu)模型的適應(yīng)度函數(shù)值越小,它與期望值間的誤差就越小。mtry以1~9為間隔,每次移動(dòng)的步長為1,決策樹數(shù)量以100~2000為間隔,每次移動(dòng)的步長為100。
1.5模型的精度檢驗(yàn)
本研究從擬合程度、估算能力、準(zhǔn)確性等3個(gè)方面對(duì)模型進(jìn)行驗(yàn)證。模型的擬合度用決定系數(shù)(r2)評(píng)價(jià),r2越接近1說明模型的擬合程度越好。模型的估算能力用驗(yàn)證集均方根誤差(RMSEP)評(píng)價(jià),RMSEP越小說明模型的估算能力越好。估算模型的準(zhǔn)確性用相對(duì)分析誤差(RPD)來評(píng)價(jià)。
2結(jié)果與分析
2.1不同的SOM含量和反射光譜曲線
表1顯示,168個(gè)樣點(diǎn)的SOM含量為0.255~45.708g/kg,平均值為7.461g/kg,標(biāo)準(zhǔn)差為8.747g/kg,變異系數(shù)為117.23%,為強(qiáng)變異,這表明準(zhǔn)東煤礦SOM含量空間變異較大,這可能由不同土地利用方式和人為影響造成的。建模集和驗(yàn)證集間的F-test得出P=0.72>0.05,表明集合的劃分比較相似,但差異不顯著。
由原始光譜曲線(圖1-a)可知,研究區(qū)不同SOM含量的光譜曲線形態(tài)基本一致,該地區(qū)土壤光譜在可見光波段陡峭上升,反射率與SOM含量呈明顯的負(fù)相關(guān)關(guān)系,即SOM含量越高反射率越低,土壤光譜曲線在1400、1900、2200nm附近都存在水分吸收谷,在1900nm處較為明顯[5]。如圖1-b所示,在580、1350、1900nm附近分別出現(xiàn)了不同的正負(fù)峰值,可見一階微分有利于顯示原始光譜的部分肩峰。如圖1-c所示,反射率經(jīng)過連續(xù)統(tǒng)去除吸收特征得到了明顯的放大,其中500、1900nm處的為弱吸收帶在連續(xù)統(tǒng)去除曲線中可以觀察出來,而在反射率曲線中則不明顯。
2.2一維相關(guān)性分析
由圖2可知,R與SOM含量的相關(guān)性曲線較為平滑,且沒有波段通過0.01水平上的顯著性檢驗(yàn),說明R與SOM含量的敏感性較低。然而R經(jīng)過FD處理后,顯著性明顯提升,尤其是在640~1110nm處,最大相關(guān)系數(shù)在840nm處,為0.52,因?yàn)樵摬ǘ胃浇嬖贑—H吸收帶,與SOM含量直接相關(guān)[5]。R經(jīng)過CR處理后,在1110~1380nm出現(xiàn)了1個(gè)相關(guān)系數(shù)高峰,相關(guān)系數(shù)為0.3~0.4,使原來弱的吸收特征得到了增強(qiáng)。600、840、2250nm分別為R、FD、CR相關(guān)系數(shù)絕對(duì)值最大的波段,本研究提取了不同處理中相關(guān)性最強(qiáng)的波段數(shù)據(jù),用于后續(xù)的對(duì)比分析和估算建模(表2)。
2.3二維相關(guān)性分析
圖3為基于不同光譜處理得到的兩波段光譜指數(shù)(NDI、RI、DI)的二維相關(guān)系數(shù)圖,圖中橫軸代表λ1,[CM(20*2]波長范圍為400~2400nm,豎軸代表λ2,波長范圍為400~2400nm,右邊的顏色軸代表相關(guān)系數(shù)值到顏色圖的映射,顏色軸的上限和下限為最大正相關(guān)系數(shù)和最大負(fù)相關(guān)系數(shù)。與圖2相比,二維相關(guān)系數(shù)值的閾值范圍均大于一維相關(guān)系數(shù)。其中以SOM含量與CR的差值指數(shù)(DI)的相關(guān)性為例(圖3-i),最大相關(guān)系數(shù)與(圖2)中CR的一維最大相關(guān)系數(shù)相比提高了0.12。R和CR構(gòu)建的兩波段指數(shù)其相關(guān)性較好的波段主要集中在可見光和短波近紅外區(qū)域(圖3-a、圖3-b),這與Zhang等的研究結(jié)果[5]一致。在每個(gè)兩波段指數(shù)中,F(xiàn)D對(duì)SOM含量的敏感性最強(qiáng),其中FD-NDI、FD-DI(圖3-b、圖3-h)得到的相關(guān)系數(shù)較大,約為0.55。提取每個(gè)指數(shù)的最優(yōu)波段組合并計(jì)算其與SOM含量的相關(guān)系數(shù),結(jié)果列于表2中。
2.4三維相關(guān)性分析
為了充分挖掘光譜數(shù)據(jù),根據(jù)前人的研究[5]進(jìn)展,本研究在兩波段(λ1、λ2)指數(shù)的基礎(chǔ)上增加第3個(gè)波段λ3,構(gòu)建新的三波段指數(shù)。三波段指數(shù)在兩波段光譜指數(shù)的基礎(chǔ)上放大了與SOM含量相關(guān)系數(shù)的閾值范圍(圖4至圖7)。同時(shí),本研究發(fā)現(xiàn)在R所構(gòu)建的三波段指數(shù)中(圖5至圖7),最優(yōu)指數(shù)的波長基本都在可見光和近紅外短波范圍內(nèi),820~850nm為主要敏感區(qū),已有研究發(fā)現(xiàn)820nm附近存在C—H吸收帶,這與SOM含量直接相關(guān)[5];在FD中(圖4至圖7),最優(yōu)指數(shù)集中在長波近紅外范圍,每個(gè)指數(shù)中均有1個(gè)或多個(gè)波靠近1450、1950nm的水分吸收帶。同時(shí),除TBI-4外,其余3個(gè)三波段指數(shù)中均有1個(gè)波段靠近2300nm,已有研究證明2300nm附近存在1個(gè)與SOM含量相關(guān)的C—H特征峰[8-9],在每個(gè)三波段指數(shù)中,F(xiàn)D的敏感性均最強(qiáng),但從切片圖(圖4至圖7中的d、e、f)中來看,敏感區(qū)域較為分散,不集中;在CR中(圖4至圖7),780~1100nm的短波近紅外為敏感區(qū)域,880、950、1020nm為主要的敏感波段,在TBI-2和TBI-3中均有出現(xiàn)。在所有三波段指數(shù)中,TBI-4(FD2020,F(xiàn)D2360,F(xiàn)D1150)的效果最優(yōu),最大相關(guān)系數(shù)為0.65,相比于FD的兩波段指數(shù)(圖3-b、圖3-e、圖3-h)提升了0.1。因此,優(yōu)化后的三波段指數(shù)是估測SOM含量較為有前景的指標(biāo),同時(shí)也表明兩波段指數(shù)存在一定的不足。提取每個(gè)三波段指數(shù)的最優(yōu)波段組合并計(jì)算其與SOM含量的相關(guān)系數(shù),結(jié)果列于表2中。
2.5建模與預(yù)測
利用ELM和RF2種機(jī)器算法分別建立SOM含量預(yù)測模型,不同維度的最優(yōu)光譜參數(shù)(表2)和建模集中的SOM含量作為機(jī)器算法的訓(xùn)練樣本(表1),驗(yàn)證集中的SOM含量作為機(jī)器算法的預(yù)測樣本(表1)。
結(jié)果表明,無論采用哪一種模型,一維光譜數(shù)據(jù)的預(yù)測效果明顯不如多維指數(shù)的建模預(yù)測結(jié)果,r2(0.55,0.51)、RPD(1.41,1.36)較低,RMSE(7.57,7.84)相對(duì)較高(表3),雖然ELM的估算精度略高于RF,但該模型僅具有區(qū)分樣本數(shù)據(jù)含量高低的能力,量化能力較弱。
兩波段指數(shù)的建模效果相較一維光譜數(shù)據(jù)有所提升,r2為0.59~0.72,RMSE為5.89~7.09,RPD為1.51~1.82。三波段指數(shù)的估算效果均優(yōu)于前兩者,r2為0.78~0.87,RMSE為4.07~5.2,RPD為2.03~2.63。此外,在三波段指數(shù)的建模結(jié)果中,ELM對(duì)SOM含量的估算能力普遍優(yōu)于RF。其中使用三波段指數(shù)4-ELM的預(yù)測效果最好(r2=0.87、RMSE=4.07、RPD=2.63),其擬合程度、估算能力和準(zhǔn)確性均優(yōu)于本研究中的所有模型。
3結(jié)論與討論
光譜指數(shù)根據(jù)地物的光譜特性,對(duì)波段進(jìn)行簡單組合,以達(dá)到對(duì)地表參量簡單有效的度量[10]。前人研究發(fā)現(xiàn)由于研究人員自身客觀條件的局限性,研究所用的試驗(yàn)數(shù)據(jù)往往來自某一特定地區(qū),使光譜指數(shù)往往具有一定的局限性[11-14]。本研究參考植被光譜分析方法,采用波段優(yōu)化算法分析了在400~2400nm范圍內(nèi)任意2個(gè)波段的NDI、RI、DI與SOM含量間的關(guān)系,發(fā)現(xiàn)其對(duì)SOM含量的響應(yīng)大大提升。
本研究發(fā)現(xiàn),光譜指數(shù)法可在一維線性數(shù)據(jù)的基礎(chǔ)上更為深層次挖掘光譜信息,充分考慮波段間的相互關(guān)系和提高建模預(yù)測的精度。通過在已有的兩波段指數(shù)中添加第3個(gè)敏感波段,構(gòu)建新的三波段指數(shù),發(fā)現(xiàn)三波段光譜指數(shù)放大了與SOM含量相關(guān)系數(shù)的閾值范圍,其中FD的三波段指數(shù)4效果最優(yōu),最大相關(guān)系數(shù)為0.65。利用ELM和RF對(duì)不同維度的最優(yōu)光譜參數(shù)分別建立預(yù)測模型,發(fā)現(xiàn)無論采用哪種模型,預(yù)測精度均跟據(jù)光譜參數(shù)維度的增加而增加,并且在三波段指數(shù)中,ELM的建模效果均優(yōu)于RF。其中,三波段光譜指數(shù)4-ELM的預(yù)測能力最優(yōu),r2=0.87,RPD=2.63。該研究結(jié)果對(duì)減少土壤中其他信息噪聲的干擾和土壤屬性的定量估算具有一定的參考價(jià)值,為估測土壤中其他屬性提供了新的思路。
參考文獻(xiàn):
[1]BaoNS,WuLX,YeBY,etal.Assessingsoilorganicmatterofreclaimedsoilfromalargesurfacecoalmineusingafieldspectroradiometerinlaboratory[J].Geoderma,2017,288:47-55.
[2]彭麗萍,戴岳,師慶東.新疆準(zhǔn)東荒漠區(qū)5種典型植物水分來源[J].干旱區(qū)研究,2018,35(5):1146-1152.
[3]WangXP,ZhangF,DingJL,etal.Estimationofsoilsaltcontent(SSC)intheEbinurLakeWetlandNationalNatureReserve(ELWNNR),NorthwestChina,basedonaBootstrap-BPneuralnetworkmodelandoptimalspectralindices[J].ScienceoftheTotalEnvironment,2018,615:918-930.
[4]TianYC,YaoX,YangJ,etal.Assessingnewlydevelopedandpublishedvegetationindicesforestimatingriceleafnitrogenconcentrationwithground-andspace-basedhyperspectralreflectance[J].FieldCropsResearch,2011,120(2):299-310.
[5]ZhangZP,DingJL,WangJZ,etal.PredictionofsoilorganicmatterinnorthwesternChinausingfractional-orderderivativespectroscopyandmodifiednormalizeddifferenceindices[J].CATENA,2020,187:104257.
[6]DouglasRK,NawarS,CipulloS,etal.Evaluationofvis-NIRreflectancespectroscopysensitivitytoweatheringforenhancedassessmentofoilcontaminatedsoils[J].ScienceoftheTotalEnvironment,2018,626:1108-1120.
[7]HuangGB,DianHW,YuanL.Extremelearningmachines:asurvey[J].InternationalJournalofMachineLearning&Cybernetics,2011,2:107-122.
[8]史舟,王乾龍,彭杰,等.中國主要土壤高光譜反射特性分類與有機(jī)質(zhì)光譜預(yù)測模型[J].中國科學(xué):地球科學(xué),2014,44(5):978-988.
[9]鄭曼迪,熊黑鋼,喬娟峰,等.基于綜合光譜指數(shù)的不同程度人類干擾下土壤有機(jī)質(zhì)含量預(yù)測[J].江蘇農(nóng)業(yè)學(xué)報(bào),2018,34(5):1048-1056.
[10]張子鵬,丁建麗,王敬哲.基于諧波分析算法的干旱區(qū)綠洲土壤光譜特性研究[J].光學(xué)學(xué)報(bào),2019,39(2):391-401.
[11]張賢龍,張飛,張海威,等.基于光譜變換的高光譜指數(shù)土壤鹽分反演模型優(yōu)選[J].農(nóng)業(yè)工程學(xué)報(bào),2018,34(1):110-117.
[12]尼加提·卡斯木,茹克亞·薩吾提,師慶東,等.基于優(yōu)化光譜指數(shù)的土壤有機(jī)質(zhì)含量估算[J].農(nóng)業(yè)機(jī)械報(bào),2018,49(11):155-163.
[13]章濤,于雷,易軍,等.高光譜小波能量特征估測土壤有機(jī)質(zhì)含量[J].光譜學(xué)與光譜分析,2019,39(10):3217-3222.
[14]徐麗華,謝德體.土壤有機(jī)質(zhì)含量預(yù)測精度對(duì)光譜預(yù)處理和特征波段的響應(yīng)[J].江蘇農(nóng)業(yè)學(xué)報(bào),2019,35(6):1340-1345.