鄧永鵬,朱洪芬,丁皓希,孫瑞鵬,畢如田
(山西農(nóng)業(yè)大學 資源環(huán)境學院,山西 太谷 030801)
黃河中游地處黃土高原和鄂爾多斯高原干旱-半干旱沙漠區(qū),流域面積約為34.4 萬km2,易蝕松散的黃土物質(zhì)、植被覆蓋率低和不合理的土地利用等原因?qū)е曼S河中游水土流失嚴重,生態(tài)環(huán)境脆弱[1]。為改善黃河中游的生態(tài)環(huán)境問題,自2000 年以來,黃河中游進行了大規(guī)模的退耕還林工程[2]。土地利用方式的轉(zhuǎn)變會導致土壤有機碳含量發(fā)生變化,進而影響土壤碳循環(huán)過程[3]。因此,快速、準確地獲取退耕還林地土壤有機碳含量對評估退耕還林工程的生態(tài)效益具有重要意義。
土壤有機碳(Soil Organic Carbon,SOC)是全球碳循環(huán)和氣候變化研究的一個重要內(nèi)容,也是評價土壤肥力的重要指標[4]。目前,諸多學者開展了退耕還林地土壤有機碳含量的研究[5-7]。黎鵬等[8]采用重鉻酸鉀氧化法測定不同退耕還林措施土壤有機碳含量,結(jié)果表明,退耕還林能夠顯著提高土壤有機碳儲量。張祎等[9]采用TOC 分析儀測定土壤有機碳含量,分析不同生態(tài)建設(shè)方式對土壤有機碳含量的影響。關(guān)于土壤有機碳測定方法,常用的有重鉻酸鉀容量法、重鉻酸鉀氧化-分光光度法、非水滴定法、離子色譜前處理法等[10]。盡管這些方法測定結(jié)果準確,但由于必須對野外采集的土壤樣品進行風干、研磨、過篩等處理,整個過程費時費力,無法滿足快速獲取土壤有機碳含量的目的[11]。高光譜遙感技術(shù)具有波段多、分辨率高、光譜信息連續(xù)等特點,為土壤養(yǎng)分的快速、準確測定提供了一條新途徑。近年來,國內(nèi)外學者在利用高光譜技術(shù)預測土壤養(yǎng)分方面開展了諸多研究[12-16]。例如,趙明松等[17]以蘇中平原典型土壤為研究對象,分別計算弓曲差、差值指數(shù)、比值指數(shù)和歸一化指數(shù)等光譜特征指數(shù),基于光譜特征指數(shù)建立有機質(zhì)預測模型,結(jié)果表明,3 種光譜特征指數(shù)結(jié)合弓曲差建立的模型精度最好。鐘亮等[18]以江西省奉新縣北部248 個紅壤樣本為研究對象,構(gòu)建了5 種不同卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型,結(jié)果表明,采用小卷積核的VGGNet-7具有極好的預測能力,證明可以通過高光譜遙感技術(shù)快速準確地估算土壤有機質(zhì)含量。馬國林等[19]以艾比湖保護區(qū)為研究區(qū),利用高光譜估算土壤有機質(zhì)的同時加入土壤協(xié)變量(土壤電導率、pH 和Fe),結(jié)果表明,將可見光-近紅外光譜信息和土壤協(xié)變量相結(jié)合的方法可以顯著提升土壤有機質(zhì)的預測性能。總之,高光譜技術(shù)的發(fā)展為快速、準確地監(jiān)測土壤養(yǎng)分狀況提供了一種新的方法。
本研究以黃河中游大寧縣退耕還林地土壤為研究對象,進行光譜采集和有機碳測定,分析其光譜特征,利用倒數(shù)的對數(shù)、倒數(shù)對數(shù)一階微分、一階微分、去包絡(luò)線等光譜處理方法,結(jié)合皮爾遜相關(guān)系數(shù)法、主成分回歸法、偏最小二乘回歸法和支持向量回歸法建立土壤有機碳高光譜預測模型,比較不同光譜變換形式建模精度,以期為快速、準確測定退耕還林地土壤有機碳含量提供技術(shù)參考。
大寧縣 地處黃 河中游(東 經(jīng)110°27′55″~111°0′40″,北緯36°16′40″~36°36′25″),隸屬于山西省臨汾市,位于山西省呂梁山南端,地勢南北高、中間低,屬典型的黃土殘垣溝壑區(qū),是黃河泥沙的主要輸入?yún)^(qū)之一[2]。全縣東西長50 km,南北寬38 km,總面積為967 km2,該縣屬暖溫帶亞干旱氣候,四季分明。2000 年大寧縣被定為黃河中上游退耕還林(草)生態(tài)工程試點縣之一,布置有刺槐、檸條等樹種[2]。查詢國家土壤信息服務(wù)平臺(http://www.soilinfo.cn/map/)中國1∶400 萬土壤類型圖可知,研究區(qū)內(nèi)主要土壤類型為黃綿土和褐土。
2020 年11 月,在研究區(qū)退耕還林地內(nèi)布設(shè)128 個樣點(圖1),記錄每一樣點經(jīng)緯度坐標及高程數(shù)據(jù)。采樣點土壤類型均為黃綿土,質(zhì)地類別為粉壤土。土壤樣品采集選用“S”形布點法,采集0~20 cm 表層土壤,每一個采樣點取5 個點的土壤混合后作為該采樣點土樣?;旌暇鶆虻耐翗釉谑覂?nèi)自然風干、研磨并過2 mm 篩,將土樣均分為2 份,用于土壤光譜和有機碳含量測定。土壤有機碳含量采用重鉻酸鉀氧化-外加熱法測定[8]。
圖1 研究區(qū)位置、高程與采樣點分布Fig.1 Location of the study area and the distribution of elevation and sampling points
采用美國FiledSpec 4 便攜式光譜儀(簡稱ASD)測定土壤反射光譜曲線,其波譜范圍為350~2 500 nm。土壤光譜測量在暗室中進行,光源由1 個50 W 的鹵素燈提供,光纖探頭視場角為10°,距離土樣表面15 cm。每次測試前進行白板標定,每個土樣測定10 條光譜曲線,取平均值作為該土樣的實際光譜曲線。
去除噪聲較為強烈的350~399、2 451~2 500 nm波段,并對剩余波段進行Savitzky-Golay 平滑處理。同時,為避免數(shù)據(jù)冗余,對原始光譜反射率(R)進行10 nm 重采樣,并對重采樣后的光譜曲線分別進行倒數(shù)的對數(shù)(RL)、倒數(shù)的對數(shù)一階微分(FRL)、一階微分(FD)、去包絡(luò)線(CR)等4 種光譜變換。相關(guān)數(shù)據(jù)處理在ViewSpec Pro、The Unscrambler X 10.4、ENVI 5.3 以及MATLAB R2019b 中完成。
本研究采用主成分回歸(Principle component regression,PCR)、偏最小二乘回歸(Partial least squares regression,PLSR)和支持 向量回 歸(Principle component regression,SVR)3 種模型進行土壤有機碳含量估測。PCR 方法是一種結(jié)合了主成分分析與多元線性回歸的分析技術(shù),可以有效對自變量數(shù)據(jù)進行降維[20]。PLSR 方法融合主成分、典型相關(guān)分析及多元線性回歸等3 種分析方法的優(yōu)點,可以消除波長變量共線性從而對數(shù)據(jù)降維,有較好的預測能力[12]。SVR 方法是支持向量機函數(shù)在回歸領(lǐng)域的應(yīng)用,在解決非線性和高維數(shù)據(jù)有獨特的優(yōu)勢[21],本研究選用徑向基核函數(shù),懲罰參數(shù)(C)設(shè)為3,Gamma 參數(shù)設(shè)為0.33。
將128 個土壤樣本按有機碳含量從低到高依次排序,以3∶1 的比例分為2 組,其中,建模集包含96 個樣本,驗證集包含32 個樣本,用于模型的精度檢驗。為了評估模型的預測精度,本研究采用決定系數(shù)(R2)、均方根誤差(RMSE)和相對預測偏差(RPD)作為精度評價指標。其中,R2越大,RMSE越小,說明模型穩(wěn)健性更好,預測精度更高。RPD是樣本標準差與均方根誤差RMSE 的比值,反映模型的預測能力,一般分為3 類,當RPD≤1.4 時,模型不可用于樣本的預測;當1.4<RPD<2.0 時,模型具有較好的預測能力;當RPD≥2.0 時,模型具有極好的預測能力[22]。
研究區(qū)土壤有機碳含量總體較低且變化范圍偏大,最小值為2.12 g/kg,最大值為30.11 g/kg,均值為9.22 g/kg,變異系數(shù)為60.52%,屬于中等強度變異。
按照全國第二次土壤普查養(yǎng)分分級標準中土壤有機質(zhì)的5 個等級對研究區(qū)土壤有機碳數(shù)據(jù)進行分級,分 為<3.50、3.50~5.80、5.80~11.80、11.80~16.50、>16.50 g/kg 等5 個級別,計算各級別內(nèi)的土壤光譜反射率平均值,得到5 種不同土壤有機碳含量的平均光譜反射率曲線(圖2)。不同土壤有機碳含量的土壤光譜曲線形狀基本一致,總體上呈現(xiàn)遞增的趨勢;土壤有機碳含量與光譜反射率呈負相關(guān),土壤有機碳含量越高,反射率越低,說明土壤原始光譜反射率可以反映土壤有機碳含量的差異;在可見光波段范圍內(nèi),隨著波長的增加,光譜反射率迅速增大,在近紅外波段范圍內(nèi),隨著波長的增加,光譜反射率增大的速度減緩;由于受到氧化鐵的影響,光譜曲線在900 nm 處出現(xiàn)微小的吸收谷;并且光譜曲線在1 400、1900、2 200、2 300 nm處出現(xiàn)了較為明顯的吸收谷,吸收谷的深度、寬度、面積都存在一定的差異。一般認為,1 400、1 900 nm處的吸收谷是受到土壤表面吸附水、土壤中水分子的O-H 官能基發(fā)生伸縮震動和轉(zhuǎn)角震動所造成的[23],2 200、2 300 nm 附近存在著Al-OH 黏土礦物(高嶺石)和蒙脫石類礦物的吸收帶,從而導致了光譜曲線明顯的吸收谷[24]。
圖2 不同有機碳含量土壤光譜曲線Fig.2 Spectral curves of soil with different organic carbon contents
將土壤有機碳含量數(shù)據(jù)與5 種光譜數(shù)據(jù)進行相關(guān)性分析,繪制相關(guān)關(guān)系曲線,結(jié)果表明(圖3),土壤有機碳含量與R 在全波段范圍均呈極顯著負相關(guān)(P<0.01),與RL 均呈極顯著正相關(guān)(P<0.01),曲線整體較平滑,相關(guān)系數(shù)絕對值均在0.550以上。土壤有機碳含量與R、RL 在550~1 000 nm波段范圍內(nèi),相關(guān)性遠高于其他波段,相關(guān)系數(shù)絕對值均在0.700 以上,在630~670 nm 波段范圍相關(guān)性最高,相關(guān)系數(shù)絕對值分別為0.758、0.762。經(jīng)過一階微分轉(zhuǎn)換后的光譜反射率FD 和FRL 與土壤有機碳含量之間呈正負相關(guān),相關(guān)系數(shù)有了顯著提高,在2 250、2 260 nm 相關(guān)性最高,相關(guān)系數(shù)絕對值分別為0.799、0.815。去包絡(luò)線變換后的光譜反射率CR 與土壤有機碳含量之間呈現(xiàn)不同程度的正或負相關(guān),在2 230 nm 相關(guān)性最高,相關(guān)系數(shù)絕對值為0.810,相關(guān)程度總體上大于R 和RL。以上分析表明,對原始光譜進行數(shù)學轉(zhuǎn)換和去包絡(luò)線變換可以顯著提升一些細微的光譜吸收特征,有利于特征波段的選取。
圖3 土壤有機碳含量與光譜數(shù)據(jù)相關(guān)性分析Fig.3 Correlation analysis between soil organic carbon content and spectral data
本研究選擇相關(guān)系數(shù)|r|>0.700 的波段作為特征波段用于模型構(gòu)建。特征波段分別為:R 的550~980 nm;RL 的530~1 300、1 430~1 560、1 930~2 180、2 250~2 330 nm;FRL 的730~930、1 420、1910~1 920、2 230~2 260 nm;FD 的430~610、800~880、1 420~1 430、1 910~1 920、2 150~2 190、2 230~2 260 nm;CR 的820~950、1 790~1 860、2 160~2 250、2 350~2 370 nm。選用R 進行土壤有機碳含量預測時,特征波段主要位于可見光波段范圍;選用RL、FD、FRL 和CR 時,特征波段選擇范圍較廣,涉及可見光、近紅外和短波紅外波段范圍。
PCR 方法建模結(jié)果表明(表1),除CR-PCR 和RL-PCR 外,其余模型預測精度較為均衡。其中,FRL-PCR 模型預測精度最差,建模集和驗證集R2分別為0.638 和0.601,RPD 為1.554。CR-PCR 模型預測精度最好,建模集R2為0.700,驗證集R2為0.689,RPD 為1.772,可以對土壤有機碳含量進行較好預測。RL-PCR 模型預測能力不穩(wěn)定,建模集R2與驗證集R2相差0.076。為了對比模型預測效果,繪制CR-PCR 和FRL-PCR 模型擬合效果圖。從圖4 可以看出,CR-PCR 模型驗證結(jié)果較好,除少數(shù)幾個樣本偏離1∶1 線較遠外,其余樣本點均位于1∶1 線附近,有較好的預測能力。
表1 PCR 方法土壤有機碳含量建模精度統(tǒng)計Tab.1 Modeling accuracy statistics of soil organic carbon content with PCR
圖4 土壤有機碳實測值與模型(PCR)預測值比較Fig.4 Comparison of measured values of soil organic carbon and predicted values by PCR modeling
以5 種光譜數(shù)據(jù)構(gòu)建PLSR 模型可知(表2),模型精度均高于PCR 模型,說明PLSR 模型比PCR 模型具有更好的預測能力。CR-PLSR 模型預測效果最好,可以對研究區(qū)土壤有機碳含量較為精確的預測,建模集和驗證集R2分別達到0.702 和0.699,RPD 為1.812,說明對于PLSR 模型來說,經(jīng)過CR 處理后的光譜數(shù)據(jù)預測效果更好;RL-PLSR模型預測能力不穩(wěn)定,建模集R2為0.699,而驗證集R2僅為0.611,相差較大;FRL-PLSR 模型的預測效果最差,建模集R2為0.641,相比R-PLSR 模型降低1.687%。
表2 PLSR 方法土壤有機碳含量建模精度統(tǒng)計Tab.2 Modeling accuracy statistics of soil organic carbon content with PLSR
為了進一步分析模型的擬合效果,繪制CRPLSR 和FRL-PLSR 模型擬合效果圖。從圖5 可以看出,CR-PLSR 模型的驗證樣本均勻分布于1∶1 線附近,模型的擬合效果比較好,預測能力最優(yōu)。
圖5 土壤有機碳實測值與模型(PLSR)預測值比較Fig.5 Comparison of measured values of soil organic carbon and predicted values by PLSR modeling
基于5 種光譜數(shù)據(jù)建立土壤有機碳含量SVR預測模型,結(jié)果表明(表3),與相應(yīng)的PLSR 模型相比,F(xiàn)RL-SVR、FD-SVR 和CR-SVR 模型的建模集R2均有所提高,分別提高21.685%、13.609%、5.840%,RMSE分別降低21.471%、15.278%、6.452%;5 種光譜數(shù)據(jù)的SVR 模型預測能力依次為FRL>FD>CR>RL>R,其中,F(xiàn)RL-SVR 模型的建模集R2最高,RMSE 最小,分別為0.780、2.615 g/kg,模型預測效果最好,說明對于SVR 模型來說,F(xiàn)RL 光譜數(shù)據(jù)具有更好的預測效果;FD-SVR 模型的建模集R2為0.768,RMSE 為2.684 g/kg,模型預測效果較好;R-SVR 模型的建模集R2最低,為0.649,RMSE最大,為3.307 g/kg,模型預測效果最差。利用驗證集實測值與預測值繪制R-SVR 和FRL-SVR 模型驗證效果圖,進一步分析模型的驗證效果。由圖6可知,R-SVR 模型的驗證樣本分布較散,偏離1∶1線程度較大,RMSE 為3.403 g/kg,模型驗證效果較差;FRL-SVR 模型的驗證樣本相對集中,均位于1∶1 線附近,R2為0.707,RMSE 為3.017 g/kg,RPD為1.850,模型驗證效果最好。
表3 SVR 方法土壤有機碳含量建模精度統(tǒng)計Tab.3 Modeling accuracy statistics of soil organic carbon content with SVR
圖6 土壤有機碳實測值與模型(SVR)預測值比較Fig.6 Comparison of measured values of soil organic carbon and predicted values by SVR modeling
對比分析不同模型的精度,可以發(fā)現(xiàn)PCR、PLSR 方法的最優(yōu)光譜變換形式相同,均為CR,而SVR 方法的最優(yōu)光譜變換形式為FRL。以FRL 為建模因子時,F(xiàn)RL-SVR 模型建模集R2為0.780,驗證集R2為0.707,RPD 為1.850,是本研究土壤有機碳含量最優(yōu)預測模型;而FRL-PCR 模型建模集R2為0.638,驗證集R2為0.601,RPD 為1.554,是本研究土壤有機碳含量最差預測模型。FRL-SVR 模型建模集和驗證集的R2分別高于FRL-PLSR 模型21.685%、17.833%,建模集與驗證集的RMSE 分別低于FRL-PLSR 模型21.471%、14.119%。相同光譜變換形式所建模型預測效果具有顯著差異,說明對于不同的建模方法,有其相匹配的光譜變換形式。
自黃河中游退耕還林工程實施以來,隨著植被的逐漸恢復,土壤有機碳含量發(fā)生了巨大的變化,從而對區(qū)域碳循環(huán)產(chǎn)生一定影響[25-27]。針對實驗室化學分析方法無法快速獲取土壤有機碳含量的問題,研究發(fā)現(xiàn),利用高光譜技術(shù)可以高效、快速、準確地反演土壤有機碳含量[28-31]。本研究以土壤有機碳含量和光譜曲線數(shù)據(jù)為基礎(chǔ),分析不同光譜數(shù)據(jù)與土壤有機碳含量的相關(guān)性,從而建立PCR、PLSR 和SVR 土壤有機碳高光譜預測模型,為快速、準確獲取土壤有機碳含量數(shù)據(jù)提供技術(shù)參考。
多數(shù)研究表明,土壤理化性質(zhì)與土壤光譜反射率存在一定的關(guān)系,土壤理化性質(zhì)的差異會造成獨特的光譜特征[24]。南鋒等[12]研究發(fā)現(xiàn),隨著土壤有機質(zhì)含量的增加,土壤反射率減小。這與本研究結(jié)果一致。土壤水分是影響土壤光譜反射率的一個重要因素,土壤水分吸收帶主要位于1 400、1 900 nm附近,并且1 900 nm 是土壤水分的特征波段[32],本研究對不同土壤有機碳含量的光譜曲線進行分析,同樣發(fā)現(xiàn)了顯著的吸收特征。土壤母質(zhì)又會以直接或間接的方式影響土壤光譜反射特征,如土壤氧化鐵含量、主要礦物等[33]。土壤中的氧化鐵在土壤光譜900~1 100 nm 波段范圍內(nèi)吸收特征最強,對土壤光譜特性的影響極大[32]。一般來說,土壤中氧化鐵含量增加,會導致反射率下降[32]。由于黃綿土僅含有少量褐鐵礦、水云母及氧化鐵混合物[34],因此,在900 nm 處產(chǎn)生了細微的光譜吸收特征。史舟等[24]研究認為,高嶺石和蒙脫石類礦物會在2 200、2 300 nm 處形成顯著的吸收特征,而黃綿土礦物組成以石英和長石為主,僅有少量的高嶺石[34],從而導致2 200、2 300 nm 處吸收特征微弱。
應(yīng)用土壤光譜數(shù)據(jù)構(gòu)建模型反演土壤養(yǎng)分含量前,對光譜數(shù)據(jù)進行各種形式的變換會顯著提升土壤養(yǎng)分含量與光譜數(shù)據(jù)的相關(guān)性,從而提高模型精度[32]。倒數(shù)對數(shù)變換可以減少光照等隨機因素的影響,增強可見光區(qū)域的差異[35]。本研究土壤有機碳含量與R 呈極顯著負相關(guān),與RL 呈極顯著正相關(guān),符合前人研究結(jié)果[17]。一階微分和去包絡(luò)線變換可以消除光譜曲線噪聲,突出光譜的吸收和反射特征,從而提高光譜數(shù)據(jù)與土壤有機碳含量的相關(guān)性[13]。玉米提·買明等[36]、吳倩等[37]研究發(fā)現(xiàn),對土壤光譜數(shù)據(jù)進行去包絡(luò)線處理,相關(guān)系數(shù)分別增加0.097 和0.160。本研究 將FRL、FD 以 及CR 光譜數(shù)據(jù)與土壤有機碳含量進行相關(guān)分析,相關(guān)系數(shù)絕對值較R 分別增加0.041、0.057、0.052。
本研究使用5 種光譜數(shù)據(jù)形式與3 種建模方法,進行黃河中游退耕還林地土壤有機碳含量高光譜反演??傮w上,SVR 模型的效果要優(yōu)于PCR 和PLSR 模型,能對土壤有機碳進行較好的預測,這與郭云開等[21]、周偉等[35]、紀文君等[38]研究結(jié)果大致相同。SVR 模型可以在高維空間里處理非線性問題,具有強大的泛化能力[21],因此,被廣泛應(yīng)用于土壤理化性質(zhì)反演研究中[13,21,30]。劉恬琳等[39]采用高光譜技術(shù)反演蘋果園土壤有機質(zhì)含量,結(jié)果表明,SVR 模型具有較好的精度。張雅梅等[40]采用高光譜技術(shù)探討土壤質(zhì)地不同粒徑含量的統(tǒng)一估測模型,結(jié)果表明,SVR 模型可以實現(xiàn)土壤中黏粒、粉粒和砂粒的統(tǒng)一估測。對比分析建模集、驗證集R2、RMSE 和RPD 發(fā)現(xiàn),本研究效果最優(yōu)的土壤有機碳預測模型為FRL-SVR 模型。然而,本研究未能采用機器學習算法對SVM 模型參數(shù)進行優(yōu)化,一定程度上會影響模型精度。因此,在后續(xù)研究中,將繼續(xù)圍繞模型參數(shù)優(yōu)化方法開展進一步研究。