摘 要:利用遙感的方式對森林喬木層碳儲量(Aboveground Biomass Carbon Stocks,ABGCS)以及喬木層碳儲量的光飽和值進行精準估測,以期替代傳統(tǒng)大面積調(diào)查的繁瑣工序,為碳儲量的估測提供參考和依據(jù),提高森林可持續(xù)經(jīng)營管理的效率。以2017年黑龍江省伊春市嘉蔭縣森林喬木層碳儲量(ABGCS)作為研究對象,利用Landsat8 OLI遙感影像以及森林資源二類調(diào)查數(shù)據(jù),構建參數(shù)模型多元逐步回歸模型(Stepwise Multiple-Regression,SMR),非參數(shù)模型BP神經(jīng)網(wǎng)絡模型(BP neural network,BP-NN)、隨機森林模型(Random Forest,RF)、支持向量回歸模型(Support Vector Machine,SVR)對嘉蔭縣地區(qū)ABGCS進行估測和反演其空間分布情況。研究結果表明,非參數(shù)模型的估測精度明顯高于參數(shù)模型,其中3種非參數(shù)模型(BP-NN、RF、SVR)相較于參數(shù)模型(SMR),擬合精度分別提高了25.0%、12.2%、7.3%;綜合比較4種模型十折交叉驗證的評價指標,分析得出模型性能優(yōu)劣為BP-NN>RF>SVR>SMR,其中BP-NN模型擬合出最大的決定系數(shù)(R2為0.785)和最小的均方根誤差(RMSE為3.572 t/hm2)、均方誤差(MSE為12.757 t/hm2)、平均絕對誤差(MAE為2.687 t/hm2);從碳儲量殘差分段檢驗結果來看,4種模型均存在碳儲量不同程度上高值低估和低值高估的情況,BP-NN模型在各碳儲量分段的平均殘差(ME)和相對平均殘差(MRE)值均為最小,其泛化能力較強;利用立方項模型確定ABGCS的光飽和值為63.056 t/hm2,與BP-NN所預測的ABGCS光飽和值接近(64.232 t/hm2)。因此,BP-NN模型在估測嘉蔭縣ABGCS具有較為理想的效果,為森林碳儲量動態(tài)監(jiān)測及研究提供重要依據(jù)。
關鍵詞:遙感; 森林喬木層碳儲量; 光飽和值; BP神經(jīng)網(wǎng)絡模型; 立方項模型
中圖分類號:S757.2 文獻標識碼:A DOI:10.7525/j.issn.1006-8023.2024.04.015
Estimation and Spatial Analysis of Carbon Storage in Tree Layers of Northern Forests
LIU Lei, JIA Weiwei*, ZHANG Xiaoyong, HE Jinyou, WU Simin, LU Shixin, LIANG Yuepeng
(College of Forest, Northeast Forestry University, Harbin 150040,China)
Abstract: Using remote sensing methods to accurately estimate aboveground biomass carbon stock (ABGCS) in forest canopy layers and light saturation value of carbon storage, aiming to replace the cumbersome procedures of traditional large-area surveys, providing references and basis for carbon storage estimation, and improving the efficiency of sustainable forest management. In this study, the ABGCS in Jiayin County, Yichun City, Heilongjiang Province in 2017 was selected as the research object. Landsat 8 OLI remote sensing images and forest resource two-class survey data were used to construct parameter models of stepwise multiple regression model (SMR), non-parameter models of BP neural network model (BP-NN), random forest model (RF), support vector regression model (SVR) to estimate and reverse the spatial distribution of ABGCS in Jiayin County. The research results showed that the estimation accuracy of non-parameter models was significantly higher than that of parameter models. Among them, the fitting accuracy of the three non-parameter models (BP-NN, RF, SVR) was increased by 25.0%, 12.2%, and 7.3%, respectively, compared with the parameter model (SMR). By comprehensive comparison of the evaluation indexes of the four models in ten-fold cross-validation, the performance of the models was analyzed: BP-NN>RF>SVR>SMR, among which the BP-NN model fitted the largest R2 (0.785) and the smallest RMSE (3.572 t/hm2), MSE (12.757 t/hm2), MAE (2.687 t/hm2). From the perspective of carbon storage residual segmentation test results, all four models exhibited varying degrees of overestimation and underestimation of carbon storage. The BP-NN model had the smallest ME and MRE values in each carbon storage segment, indicating strong generalization ability. The light saturation value of ABGCS was determined to be 63.056 t/hm2 using a cubic model, which was close to the predicted ABGCS light saturation value by BP-NN (64.232 t/hm2). Therefore, the BP-NN model has a relatively ideal effect in estimating ABGCS in Jiayin County, providing important basis for dynamic monitoring and research of forest carbon storage.
Keywords: Remote sensing; aboveground biomass carbon stock; light saturation value; backpropagation neural network model (BP-NN); cubic mode
0 引言
森林生態(tài)系統(tǒng)在維護區(qū)域生態(tài)環(huán)境和全球碳平衡方面發(fā)揮著非常關鍵且不可替代的作用。森林生態(tài)系統(tǒng)作為動態(tài)碳庫,其碳儲量不僅受整個森林生態(tài)系統(tǒng)植被面積的影響,還受森林植被碳儲量密度的質(zhì)量,即單位面積森林碳儲量的影響[1-2]。因此,對精準估測森林碳儲量以及了解其空間分布的研究具有重要意義。然而,對森林碳儲量估測的不確定性問題,以及如何精確量化森林碳儲量,是一項重大挑戰(zhàn)[3]。
研究森林碳儲量,必須對其進行量化,國內(nèi)外的很多學者已經(jīng)就此問題給出了很多的方法,已有多種研究手段被用于估算局部、區(qū)域和世界范圍的森林碳儲量[4-5]。傳統(tǒng)上,使用樣地測量森林結構參數(shù)可以提供準確的信息,但需要大量的人力和物力。當森林結構復雜時,如熱帶森林,無法進行森林原位監(jiān)測[6]。遙感估測碳儲量相較于樣地實測具有多項優(yōu)勢,包括成本較低、實時性高、高精度、非破壞性和適用于大規(guī)模動態(tài)監(jiān)測等[7]。通過高分辨率遙感影像收集詳細的植被信息,如植被指數(shù)和紋理特征等。這些數(shù)據(jù)通常用于參數(shù)或非參數(shù)估計方法,通過構建數(shù)學模型,結合遙感信息和地面調(diào)查數(shù)據(jù),最終利用分析公式進行森林碳儲量估算,隨后可分析森林碳儲量的空間分布和動態(tài)。與參數(shù)模型相比,非參數(shù)模型具有更強的數(shù)據(jù)擬合能力和更高的估測精度。然而,非參數(shù)模型對樣本量的大小和代表性更為敏感,對于樣本量較小的研究區(qū)來說,改進森林碳儲量的估計效果有限[8-9]。基于遙感的森林碳儲量估測常使用多種遙感估算經(jīng)驗模型。其中,一些主要的模型包括多元逐步回歸模型、地理加權模型、支持向量回歸模型、人工神經(jīng)網(wǎng)絡法和隨機森林回歸等[10]。
本研究具體目標如下。1)通過地面實測數(shù)據(jù)計算嘉蔭縣森林喬木層碳儲量(Aboveground Biomass Carbon Stocks,ABGCS),通過處理Landsat 8 OLI遙感影像并提取相關遙感因子,進而篩選出與ABGCS顯著相關的遙感因子;2)構建多元逐步回歸模型(Stepwise Multiple-Regression,SMR)、BP神經(jīng)網(wǎng)絡模型(BP neural network,BP-NN)、隨機森林模型(Random Forest,RF)和支持向量回歸模型(Support Vector Machine,SVR),并對比分析模型對ABGCS的估測能力;3)利用立方項模型對森林喬木層碳儲量的光飽和值進行估算,并利用最優(yōu)回歸模型的結果對所預測光飽和值進行檢驗;4)對嘉蔭縣地區(qū)ABGCS進行反演和空間分布的分析。
1 研究區(qū)概況
研究區(qū)位于黑龍江省伊春市嘉蔭縣,地處于小興安嶺北麓東段,地理坐標為48°8′30″~49°26′5″N, 129°9′45″~130°50′E。全區(qū)屬于溫帶大陸性季風氣候,年平均氣溫-1.5~-0.7 ℃。降水主要分布在夏季,年均降水量通常在400~600 mm。該地區(qū)地勢較高,地理條件多為丘陵和山區(qū)。森林覆蓋率達78.3%,森林地面積60.71 萬hm2,森林資源主要包括落葉松林、針闊葉混交林和闊葉混交林。
2 數(shù)據(jù)與方法
2.1 數(shù)據(jù)來源及處理
2.1.1 樣地數(shù)據(jù)
基于2017年嘉蔭縣13個經(jīng)營林區(qū)的森林資源二類調(diào)查數(shù)據(jù),包括海拔、植被類型、優(yōu)勢樹種和各小班每公頃蓄積量等,剔除蓄積量為0 m3的小班,并去除非植被的小班。最終在SPSS 26中采用系統(tǒng)抽樣的方法抽取984塊小班。
2.1.2 森林喬木層碳儲量(ABGCS)計算
以主要的優(yōu)勢樹種(樹種組)為對象,根據(jù)篩選出984塊樣地的每公頃蓄積量,進行森林生物量與碳儲量的計算。目前,國際上對森林碳儲量的估算方法通常采用生物量與生物碳含量的乘積。本研究采用了Fang等[11]提出的生物量轉(zhuǎn)換因子連續(xù)函數(shù)法,以估計黑龍江省主要森林類型的生物量。公式為
B=aV+b。 (1)
C=B×C_c。 (2)
式中:B為某一樹種單位面積生物量,mg/hm2;V為某一樹種單位面積蓄積量,m3/hm2;a和b為蓄積量與生物量轉(zhuǎn)換參數(shù);C為碳儲量,t/hm2;C_c為含碳系數(shù)。黑龍江省各類森林的生物量與蓄積量轉(zhuǎn)換參數(shù)見表1[12]。使用國際上普遍采用的含碳系數(shù)0.5來估算森林碳儲量[13]。
2.1.3 遙感影像數(shù)據(jù)獲取及處理
為確保影像信息與地面調(diào)查信息盡可能一致,選用2017年7月獲取的Landsat 8 OLI衛(wèi)星影像數(shù)據(jù)(條帶號116/26、117/26),該影像完整地覆蓋了整個嘉蔭縣。
首先利用ENVI5.3軟件,對原始影像進行輻射定標、大氣校正和影像裁剪等處理。之后使用波段計算工具Bandmath提取所需的各種遙感因子,包括原始波段、植被指數(shù)、紋理特征和主成分分析等,部分重要遙感變量計算公式見表2。在本研究中,地形因子使用ArcGIS 10.8空間和統(tǒng)計分析擴展來提取,包括高程、起伏程度、粗糙程度、坡度和坡向等。最后將提取的地形因子和遙感因子在SPSS 26中進行標準化處理。
2.2 森林喬木層碳儲量遙感模型
2.2.1 多元線性逐步回歸模型(SMR)
利用SPSS 26,采用Pearson相關系數(shù)對特征變量(遙感因子、地形因子)與森林喬木層碳儲量進行相關性分析。在此過程中,剔除相關性不顯著的變量,選擇P≤0.05且方差膨脹因子(Variance Inflation Factor,VIF)小于10的特征變量,排除特征變量間的多重共線性[14]。最后,通過多元逐步回歸確定參與建模的自變量最佳組合,具體方程為
y=β_0+β_1 x_1+β_2 x_2+...+β_m x_m。 (3)
式中:y為單位面積森林喬木層碳儲量,t/hm2;x_1,x_2,…,x_m為影響碳儲量的自變量因子;β_1,β_2,…,β_m為相應的回歸系數(shù);β_0為殘差項。
2.2.2 支持向量回歸模型(SVR)
本研究中,SVR模型采用的是高斯核函數(shù)(Radial Basis Function,RBF)。對于SVR模型,最重要是對RBF核參數(shù)gamma(g)和懲罰系數(shù)cost(c)的選擇,其大小直接影響了模型預測的準確度[15]。運用Python 3.11,根據(jù)研究目標,選用sklearn中的網(wǎng)格搜索和交叉驗證函數(shù)GridSearchCV(CV),設置調(diào)優(yōu)的參數(shù)范圍,核參數(shù)(g)的范圍是[0.001,0.01,0.1,1],懲罰系數(shù)(c)的范圍是[0.01,0.1,1,10],其中交叉驗證(CV)為10,以此來尋求最優(yōu)的參數(shù)組合。
2.2.3 隨機森林模型(RF)
隨機森林是一種基于裝袋(Bagging)的集成學習方法,其他使用決策樹作為基本學習器,通過數(shù)據(jù)重采樣(Bootstrap Aggregating)構建多個基學習 器并將其預測結果組合生成隨機森林模型。預測結果為n棵決策樹預測結果的平均值[16]。本研究使用R語言中的隨機森林模型包進行裝袋法估計。RF模型的構建涉及2個重要的超參數(shù),決策樹的數(shù)目(ntree,式中記為ntree)和隨機抽取的決策樹節(jié)點變量個數(shù)(mtry,式中記為mtry)。一般情況下,隨機森林回歸模型建議將mtry設置為總特征數(shù)量的1/3、ntree需要確保整體隨機森林的誤差趨于穩(wěn)定即可[17]。在模型的構建過程中加入主成分分析,找到數(shù)據(jù)中最重要的特征或主成分,并將數(shù)據(jù)投影到這些主成分上,以實現(xiàn)數(shù)據(jù)降維。這有助于減少數(shù)據(jù)的復雜性,去除冗余信息,同時保留盡可能多的方差。
2.2.4 BP神經(jīng)網(wǎng)絡模型(BP-NN)
BP神經(jīng)網(wǎng)絡是一種多層神經(jīng)網(wǎng)絡,通常包含輸入層、一個或多個隱含層和輸出層,如圖1所示。BP神經(jīng)網(wǎng)絡的核心特點是使用反向播算法來訓練網(wǎng)絡,以減小模型的預測誤差。
要創(chuàng)建最佳BP神經(jīng)網(wǎng)絡模型,需要不斷優(yōu)化關鍵參數(shù),包括網(wǎng)絡結構(層數(shù)和隱含層節(jié)點數(shù))、權值和閾值的初始化、最大訓練迭代次數(shù)、學習率和學習速率等[18]。本研究采用含有2個隱含層的三層BP神經(jīng)網(wǎng)絡模型,輸入層神經(jīng)元的個數(shù)為通過相關性分析,并納入多元逐步回歸模型的特征因子個數(shù),輸出層神經(jīng)元個數(shù)為1。為在確保模型精度的前提下,防止過擬合并提高模型的泛化能力,本研究選擇盡可能減少隱含層神經(jīng)元的數(shù)量[19]?;诮?jīng)驗式(4)確定隱含層神經(jīng)元的范圍[20]。雙隱含層節(jié)點數(shù)配置使用嵌套循環(huán)來迭代所確定隱含層神經(jīng)元范圍之間所有整數(shù)的大小組合,通過比較R2大小,確定雙隱含層節(jié)點的最優(yōu)配置。最后,將最優(yōu)的參數(shù)組合帶入模型中,對ABGCS進行預測。
w=√(n+m)+a。 (4)
式中:w為隱含層神經(jīng)元個數(shù);n為輸入層神經(jīng)元個數(shù);m為輸出層神經(jīng)元個數(shù);a為1~10的常數(shù)。
2.3 模型評價與檢驗
2.3.1 模型評價
基于十折交叉驗證的決定系數(shù)(R2)、均方根誤差(RMSE,式中記為RMSE)、均方誤差(MSE,式中記為MSE)和平均絕對誤差(MAE,式中記為MAE)4種指標對模型的估測能力進行評價與檢驗,如式(5)—式(8)所示。
R^2=1-(∑_(i=1)^n?(y_i-y ?_i )^2 )/(∑_(i=1)^n?(y_i-ˉ(y_i ))^2 )。 (5)
R_MSE=√((∑_(i=1)^n?(y_i-y ?_i )^2 )/n)。 (6)
M_SE=1/n ∑_(i=1)^n?(y_i-y ?_i )^2 。 (7)
M_AE=1/n ∑_(i=1)^n?|y_i-y ?_i | 。 (8)
式中:y_i為實測值;ˉ(y_i )為樣本平均值;y ?_i為估測值;n為樣本容量;i為樣本點。
2.3.2 殘差分段檢驗
本研究采用“刀切法”殘差檢驗,采用相對平均殘差(MRE,式中記為MRE)、平均殘差(ME,式中記為ME)2個度量標準對樣本進行分段殘差分析,如式(9)—式(10)所示。分別設置30~50、50~70、70~90 t/hm2 3個碳儲量分段。通過分段殘差檢驗,分析不同碳儲量分段下不同模型之間的殘差差異。
M_E=1/n ∑_(i=1)^n?(y_i-y ?_i ) 。 (9)
M_RE=1/n ∑_(i=1)^n?〖((y_i-y ?_i)/y_i )〗×100%。 (10)
2.4 碳儲量光飽和點確定
通過選擇與實測的喬木層碳儲量相關性最高的波段,建立散點圖,研究發(fā)現(xiàn)通常情況下,隨著碳儲量的增加,波段反射率呈降低趨勢。然而,一旦碳儲量達到一定水平,光譜反射率就不再發(fā)生顯著變化。該水平值是通過光學遙感估算碳儲量時的光飽和點。本研究采用參數(shù)估計方法探尋喬木層碳儲量的光飽和點[21]。研究表明,二次項模型和立方項模型能夠較好地擬合曲線方程,如式11所示,這有助于更準確地描述數(shù)據(jù)的非線性關系[21-22]。通過計算該函數(shù)的拐點值,以確定光學遙感估測ABGCS的光飽和點。
f(g)=x_n g^n+x_(n-1) g^(n-1)+x_(n-2) g^(n-2)+…+x_(^2 ) g^2+x_(^1 ) g+x_0 (a_n≠0)。 (11)
式中:f(g)為g模型拐點值;x_n為模型參數(shù);非負整數(shù)n為模型的次數(shù)(本研究n取2和3)。
2.5 研究區(qū)森林喬木層碳儲量反演
使用反距離加權空間插值法(Inverse Distance Weighted,IDW),對實測以及4種模型預測的嘉蔭縣森林喬木層碳儲量的空間分布情況進行反演。由于森林的復雜性和內(nèi)在的不確定性因素,運用統(tǒng)計學方法來探究研究區(qū)內(nèi)樣地之間的空間分布結構是一種必然趨勢。通過ArcGIS10.8軟件中的插值工具,對森林喬木層碳儲量進行反演,繪制研究區(qū)域的地貌圖,對不同地貌下的碳儲量進行空間分析。
3 結果與分析
3.1 建模因子篩選結果
利用SPSS 26將特征變量進行標準化,采用逐步回歸方法進行最優(yōu)變量選擇,最終選取植被指數(shù)因子3個(NDVI、TVI、VARI)、主成分分析因子3個(PCA2、PCA6、PCA10)、原始波段因子2個(B7、B9)、紋理特征因子1個(B4-COR)、地形因子2個(slope、focalst)共計11個特征變量,其在P<0.01水平上表現(xiàn)出極顯著的相關性,如圖2所示,其中,B7相關性最高,R=-0.44。
3.2 森林喬木層碳儲量估測模型構建結果
3.2.1 多元線性逐步回歸模型構建結果
借助R語言構建多元線性逐步回歸模型,引入程序包caret進行十折交叉驗證,其擬合結果見表3。由表3可知,SMR模型能夠解釋嘉蔭縣森林喬木層碳儲量的決定系數(shù)58.9%,RMSE、MSE和MAE的值相對較小,說明模型在預測上取得了一定的準確性,但仍有改進的空間。
3.2.2 支持向量回歸模型構建結果
在SVR模型的構建過程中,通過十折交叉驗證選擇了最優(yōu)參數(shù)組合為c=10和g=0.01,這些參數(shù)組合導致了最低的均方誤差MSE=21.711,如圖3所示。將最優(yōu)的參數(shù)組合代入到模型中,十折交叉驗證的結果為R2=0.632、RMSE=4.618 t/hm2、MAE=3.498 t/hm2、MSE=21.416 t/hm2,相較于SMR(R2=0.589)模型擬合精度提高了7.3%。需要注意的是,c=10,表示SVR模型傾向于更嚴格地擬合訓練數(shù)據(jù),可以解釋模型更復雜,適應噪聲更多。但這也意味著該模型對樣本數(shù)據(jù)的泛化性能可能較差。
3.2.3 隨機森林模型構建結果
使用R語言中的隨機森林包進行裝袋法估計,首先確定決策樹的數(shù)目。將參數(shù)中的決策樹節(jié)點數(shù)設置為11(mtry=11),表示在該例中使用全部的特征變量,結果顯示,隨機森林模型函數(shù)默認估計500棵決策樹,在每個節(jié)點均使用全部的11個變量,根據(jù)袋外觀測值計算的袋外數(shù)據(jù)(Out of Band,OOB)為22.71;而準R2=0.659,使用plot畫出袋外誤差曲線圖,如圖4所示。由圖4可知,隨著決策樹數(shù)目的增加,袋外誤差呈現(xiàn)下降趨勢,當決策數(shù)目大于300時,誤差就趨于平穩(wěn),這時繼續(xù)增大決策樹數(shù)目,也不會使之下降。因此,決策樹的數(shù)目大于300即可。
隨機森林的另一個重要參數(shù)為每次用于節(jié)點分裂的變量個數(shù)(mtry),這可以通過最小化袋外誤差(minMSEOOB)來確定,可用R包隨機森林中的tuneRF函數(shù),達到上述的目的,該函數(shù)需要設定參 數(shù)“step—Factor”表示隨機選擇變量個數(shù)的縮放倍 數(shù),并不考慮mtry的所有可能取值。通過計算尋找 到使袋外誤差最小的mtry=6,如圖5所示,此時袋外誤差為22.735。
將最佳參數(shù)(ntree=1 000,mtry=6)帶入到隨機森林模型當中,得到十折交叉驗證的R2=0.661、RMSE=4.435 t/hm2、MAE=3.394 t/hm2、MSE=19.425 t/hm2,表示模型對數(shù)據(jù)的擬合效果較好,模型的預測較準確。在其模型的構建當中加入了對特征變量的主成分分析,如圖6所示,B7在模型的構建當中起主導作用,VARI和TVI的貢獻較低。
3.2.4 BP-NN模型構建結果
使用Matlab 2020軟件創(chuàng)建BP神經(jīng)網(wǎng)絡模型。本研究選擇了11個在P<0.01水平上極顯著相關的特征因子作為輸入層因子,輸出層神經(jīng)元的數(shù)量為1,基于經(jīng)驗式(4),得出隱含層中神經(jīng)元數(shù)量的取值范圍為4~13。通過嵌套循環(huán)來迭代4~13整數(shù)的所有可能隱含層節(jié)點數(shù)大小組合的R2結果,如圖7所示。結果顯示雙隱含層最優(yōu)的節(jié)點數(shù)組合為hidden_size1=5,hidden_size2=13,其決定系數(shù)R2=0.862,將試驗得出最優(yōu)的參數(shù)組合(hidden_size1=5,hidden_size2=13,最大迭代次數(shù)=1 000,目標精度=0.001,學習率=0.01)帶入到BP神經(jīng)網(wǎng)絡模型中,得到十折交叉驗證的R2=0.785,RMSE=3.572 t/hm2,MSE=2.687 t/hm2,MAE=12.757 t/hm2。
3.3 模型評價與檢驗
3.3.1 模型評價
通過比較4種模型的評估精度和預測效果發(fā) 現(xiàn)(表4),SMR模型的擬合效果以及估測能力都 相對較差,SVR、RF和BP-NN模型擬合效果均有提升。BP-NN模型具有最高的R2(0.785)和最小的RMSE(3.572 t/hm2)、MAE(2.687 t/hm2)、MSE(12.757 t/hm2)值,且模型的預測指標均優(yōu)于其他3種回歸模型。因此,BP-NN模型具有最佳的擬合和估測能力,其次是RF、SVR、SMR。
為進一步對模型擬合性能進行可視化分析,分別對4種模型的最佳估測結果繪制散點圖如圖8所示,分析發(fā)現(xiàn)4種模型的預測結果與實測值均表現(xiàn)出較為一致的擬合性,大多數(shù)散點在1∶1線附近集中分布;其中BP-NN模型的估測值與實際值更為接近,估測結果更能準確反映研究區(qū)森林喬木層生長的實際狀況,可作為嘉蔭縣森林喬木層碳儲量的最佳估測模型。
3.3.2 碳儲量分段殘差分析
碳儲量分段殘差結果見表5,由表5可知,與其他3種回歸模型相比,BP-NN模型具有較高的估計精度和相對較小的誤差;從各碳儲量分段看,這4種模型都存在ABGCS高值低估和低值高估的情況 (ME>0,表示高值低估;ME<0,表示低值高估),尤其在70~90 t/hm2分段中,SMR模型表現(xiàn)出最顯著的低值高估(ME=-10.549 6,MRE=-0.465 9),且其他3種模型也表現(xiàn)出相對較大的ME、MRE,說明在高碳儲量段4種模型的估測能力均顯不足,但不能排除此分段樣本量較少導致數(shù)值較大的因素;在30~50 t/hm2分段中,4種模型均表現(xiàn)出高值低估的情況;在各分段SVR、RF、BP-NN模型的ME和MRE遠小于SMR模型,且BP-NN模型的ME和MRE均為最小,因此BP-NN模型具有較好的估測精度。
3.4 森林喬木層碳儲量遙感估測光飽和點分析
通過選擇相關性最高的B7遙感變量,采用二次項和立方項函數(shù)擬合嘉蔭縣森林喬木層碳儲量與B7反射率值的函數(shù)關系。擬合曲線的拐點對應的自變量值即為嘉蔭縣ABGCS估測的光飽和值,見表6。由表6可知,相較于二次項模型,立方項模型擬合出較高的R2(0.322),在極小的范圍內(nèi)較好地反映了B7光譜反射率值與ABGCS的關系。因此,以其對應的拐點作為嘉蔭縣ABGCS光飽和點,其值為63.056 t/hm2。
隨后采用立方項函數(shù)求解4種模型估測的ABGCS與B7反射率值的函數(shù)關系,探尋4種模型估測結果的準確性,其立方項函數(shù)擬合的各類ABGCS光飽和曲線,如圖9所示。結合表7可知,采用B7變量與BP-NN模型估測下的ABGCS進行立方項函數(shù)擬合時具有最高的R2(0.599),且估測的飽和值更接近實際飽和值,其值為64.232 t/hm2。進一步驗證了BP-NN模型在估測嘉蔭縣ABGCS具有較為理想的效果。結合上述殘差分析結果,在超出實測ABGCS光飽和點的范圍內(nèi)(70~90 t/hm2),4種模型均表現(xiàn)出相對較高的殘差,說明光飽和點對遙感估測精度有著較大的限制。
3.5 森林喬木層碳儲量反演
為探究伊春市嘉蔭縣森林喬木層碳儲量的空間分布,利用DEM數(shù)據(jù)以及ArcGIS10.8軟件進行坡向的地貌分布圖的繪制,如圖10所示,將4種模型(SMR、SVR、RF、BP-NN)估計以及實測的嘉蔭縣森林喬木層碳儲量分布圖與地貌分布圖進行協(xié)同分析。結合圖10(a)和表8,可以看出研究區(qū)域內(nèi)陽坡面積所占比例最大為30.9%。由圖10(b)可以得出,研究區(qū)內(nèi)東南部的碳儲量要高于西北部,這一現(xiàn)象的主要原因是由于西北部的年平均氣溫、降水量、日照時間要低于東南部,導致樹木生長緩慢,進而影響碳儲量。
位于不同坡向的平均碳儲量存在一定差異,具體分布情況見表8。由表8可知,坡向?qū)BGCS及其空間分配有一定程度的影響。結果顯示,不同坡向的森林喬木層碳儲量由大到小分布為陽坡、半陽坡、平坡、陰坡、半陰坡。這說明陽坡相較于陰坡、平坡,具有更適合森林生長的光照、水分和溫度等條件,使得陽坡的碳儲存能力較強。由地理分布引起的地形差異對森林碳儲量的空間分布有較大的影響,因此,在生態(tài)性建設與保護過程中,應更多關注對陽坡的經(jīng)營與管護,因地制宜地制定經(jīng)營管理措施。
4 討論
4.1 遙感數(shù)據(jù)選擇
自變量的選擇對于基于遙感的森林喬木層碳儲量估測模型尤為重要,利用逐步回歸的方法從80個光譜變量中最終選取了NDVI、TVI、VARI、B4-COR、PCA2、PCA6、PCA10、B7、B9、slope、focalst作為建模變量。為研究森林碳儲量的空間分布情況,選擇了Landsat系列衛(wèi)星的影像數(shù)據(jù)集,這些數(shù)據(jù)具有較早的記錄并持續(xù)維護至今。然而,由于大氣衰減、低信噪比、有限的年重訪次數(shù)和相對較低的分辨率,與真實環(huán)境存在一定差距[23],尤其在研究區(qū)域從局部擴展到更大范圍時,影像質(zhì)量下降可能導致更大的研究誤差。為改進研究,后續(xù)觀測和研究可以使用分辨率更高的衛(wèi)星高光譜圖像,以研究森林碳儲量的空間分布規(guī)律。此外,融合多源遙感數(shù)據(jù)可以實現(xiàn)更好的效果[24]。同時,地面調(diào)查數(shù)據(jù)可以通過地基激光雷達和無人機激光雷達來采集,這不僅可以避免對森林生態(tài)系統(tǒng)的破壞,還可以提高觀測數(shù)據(jù)的準確性和便捷性。
4.2 模型對比
在機器學習算法中,SVR模型可處理小樣本機器學習問題,并且通過使用核函數(shù)來應對非線性問題,將數(shù)據(jù)映射到高維空間,從而捕捉復雜的關系。然而,需要仔細地超參數(shù)調(diào)優(yōu)和數(shù)據(jù)預處理,以達到最佳性能。而面對較大的數(shù)據(jù)集時,SVR算法學習效率很低[25-26];RF模型雖然訓練可以高度并行化,能夠處理高維度數(shù)據(jù),對噪聲和離群值相對魯棒,但當類別不平衡問題嚴重時,隨機森林可能傾向于預測出現(xiàn)頻率較高的類別[27]。BP-NN模型具有較強的非線性映射能力和高度自學習自適應能力,也能夠并行化處理數(shù)據(jù),但也面臨著訓練時間長、容易過擬合等問題[28]。相較于RF、SVR、SMR構建的模型,BP-NN模型在本次驗證過程中具有更高的預測精度和穩(wěn)定性。機器學習中,樣本數(shù)量不足會降低模型性能。通過十折交叉驗證的結果顯示,4種回歸模型在不同的交叉驗證折疊上表現(xiàn)穩(wěn)定,說明試驗所用的樣本數(shù)量滿足了機器學習算法模型的學習需求。在對SVR模型和BP-NN模型的構建過程中,均采用嵌套循環(huán)來迭代參數(shù)范圍之間所有超參數(shù)的大小組合,考慮所有超參數(shù)搭配的可能性,進而確定最優(yōu)的超參數(shù)組合,使模型獲得最佳性能。其中,3種非參數(shù)模型(BP-NN、RF、SVR)相較于參數(shù)模型(SMR),擬合精度分別提高了33.3%、12.2%、7.3%,說明非參數(shù)模型比參數(shù)模型有更好的解釋能力,泛化能力更強。
4.3 數(shù)據(jù)飽和
光譜影像受到多種因素的限制,包括光譜反射率、輻射分辨率以及空間分辨率等。這些限制使得光譜信息對碳儲量的敏感度隨著碳儲量的增大而減小,從而導致數(shù)據(jù)飽和現(xiàn)象的出現(xiàn)[29]。單位面積碳儲量的光飽和情況在許多森林碳儲量估測研究中是不可避免的。多項研究已經(jīng)發(fā)現(xiàn),數(shù)據(jù)飽和是影響碳儲量估測精度的重要原因之一。研究學者們大多以結合不同數(shù)據(jù)源,利用高光譜影像估測碳儲量,以減少碳儲量的飽和并提高估測精度[30]。因此,本研究采用了與ABGCS相關性最強的波段(B7),通過立方項模型對Landsat8 OLI影像進行了嘉蔭縣ABGCS光飽和值的定量研究。
5 結論
本研究中,利用Landsat8 OLI遙感影像及森林資源二類調(diào)查數(shù)據(jù),選取地學參數(shù)及遙感參數(shù)能夠很好地估測森林喬木層碳儲量,為森林碳儲量動態(tài)監(jiān)測及研究提供重要數(shù)據(jù)。本研究通過構建多元逐步回歸模型(SMR)、BP神經(jīng)網(wǎng)絡模型(BP-NN)、隨機森林模型(RF)、支持向量機回歸模型(SVR)對黑龍江省嘉蔭縣ABGCS估測和空間分布狀況的量化研究,利用立方項函數(shù)模型估測ABGCS光飽和值,并通過模型預測結果分析立方項模型對ABGCS飽和值的估測能力。
1)通過構建4種回歸模型對ABGCS估測以及空間分布分析結果來看BP-NN模型擬合精度最高(R2=0.785,RMSE=3.572 t/hm2,MSE=2.687 t/hm2,MAE=12.757 t/hm2),BP-NN模型能夠提供更加準確、穩(wěn)定的估測結果。
2)采用ABGCS與B7反射率值進行立方項式函數(shù)擬合,可用于估算嘉蔭縣森林喬木層碳儲量光飽和點,其值為63.996 t/hm2。采用B7變量與BP-NN模型估測下的ABGCS進行立方項函數(shù)擬合時具有最高的R2(0.599),且估測的飽和值更接近實際飽和值,其值為64.232 t/hm2。進一步驗證了BP-NN模型在估測嘉蔭縣ABGCS具有較為理想的效果。
3)BP-NN模型在各ABGCS分段上的ME和MRE均低于RF、SVR和SMR模型。在嘉蔭縣森林喬木層碳儲量空間分布反演中,BP-NN模型的估測范圍更為廣泛。這有助于在一定程度上解決高值低估和低值高估的問題,進而提高了嘉蔭縣ABGCS的遙感估測精度和確定閾值的準確性。
【參 考 文 獻】
[1] 鄭甲佳,黃松宇,賈昕,等.中國森林生態(tài)系統(tǒng)土壤呼吸溫度敏感性空間變異特征及影響因素[J].植物生態(tài)學報,2020,44(6):687-698.
ZHENG J J,HUANG S Y,JIA X,et al.Spatial variation and controlling factors of temperature sensitivity of soil respiration in forest ecosystems across China[J].Chinese Journal of Plant Ecology,2020,44(6):687-698.
[2] BALIMA L H,KOUAME F N,BAYEN P,et al.Influence of climate and forest attributes on aboveground carbon storage in Burkina Faso,West Africa[J].Environmental Challenges,2021,4:100-123.
[3] BONAN G B.Forests and climate change:forcings,feedbacks,and the climate benefits of forests[J].Science,2008,320(5882):1444-1449.
[4] 舒洋,郭嬌宇,周梅,等.基于IPCC法大興安嶺興安落葉松人工林碳計量參數(shù)研究[J].溫帶林業(yè)研究,2022,5(1):30-35,47.
SHU Y,GUO J Y,ZHOU M,et al.Carbon measurement parameters of larch plantation in the Greater Xing′an Mountains based on IPCC method[J].Research at Temperate Forestry,2022,5(1):30-35,47.
[5] 毛學剛,王靜文,范文義.基于遙感與地統(tǒng)計的森林生物量時空變異分析[J].北京林業(yè)大學學報,2016,38(2):10-19.
MAO X G,WANG J W,F(xiàn)AN W Y.Spatiotemporal variation analysis of forest biomass based on remote sensing and ground statistics[J].Journal of Beijing Forestry University,2016,38(2):10-19.
[6] 穆喜云.森林地上生物量遙感估測方法研究[D].呼和浩特:內(nèi)蒙古農(nóng)業(yè)大學,2015.
MU X Y.Research on the remote sensing estimation method of forest aboveground biomass[D].Hohhot:Inner Mongolia Agricultural University,2015.
[7] 李德仁,王長委,胡月明,等.遙感技術估算森林生物量的研究進展[J].武漢大學學報·信息科學版,2012,37(6):631-635.
LI D R,WANG C W,HU Y M,et al.General review on remote sensing-based biomass estimation[J].Geomatics and Information Science of Wuhan University,2012,37(6):631-635.
[8] OU G L,LV Y Y,XU H,et al.Improving forest aboveground biomass estimation of pinus densata forest in Yunnan of southwest China by spatial regression using Landsat 8 images[J].Remote Sensing,2019,11(23):2750.
[9] CHEN Q,MCROBERTS R E,WANG C,et al.Forest aboveground biomass mapping and estimation across multiple spatial scales using model-based inference[J].Remote Sensing of Environment,2016,184:350-360.
[10] ZHAO P P,LU D S,WANG G X,et al.Examining spec-tral reflectance saturation in landsat imagery and corresponding solutions to improve forest aboveground biomass estimation[J].Remote Sensing,2016,8(6):469.
[11] FANG J Y,CHEN A P,PENG C H,et al.Changes in forest biomass carbon storage in China between 1949 and 1998[J].Science,2001,292(5525):2320-2322.
[12] ZHANG C H,JU W M,CHEN J M,et al.China′s forest biomass carbon sink based on seven inventories from 1973 to 2008[J].Climatic Change,2013,118(3/4):933-948.
[13] 肖興威.中國森林資源清查[M].北京:中國林業(yè)出版社,2005.
XIAO X W.Forest resources inventory in China[M].Beijing:China Forestry Press,2005.
[14] TUIA D,VERRELST J,ALANSO L,et al.Multioutput support vector regression for remote sensing biophysical parameter estimation[J].IEEE Geoscience and Remote Sensing Letters,2011,8(4):804-808.
[15] ZHAO Y,WANG K.Fast cross validation for regularized extreme learning machine[J].Journal of Systems Engineering and Electronics,2014,25(5):895-900.
[16] DONG L J,LI X B,PENG K.Prediction of rockburst classification using random forest[J].Transaction of Nonferrous Metals Society of China,2013,23(2):472-477.
[17] 林成德,彭國蘭.隨機森林在企業(yè)信用評估指標體系確定中的應用[J].廈門大學學報(自然科學版),2007,46(2):199-203.
LIN C D,PENG G L.Application of random forest on selecting evaluation index system for enterprise credit assessment[J].Journal of Xiamen University:Natural Science Edition,2007,46(2):199-203.
[18] 李萍,曾令可,稅安澤,等.基于MATLAB的BP神經(jīng)網(wǎng)絡預測系統(tǒng)的設計[J].計算機應用與軟件,2008,25(4):149-150.
LI P,ZENG L K,SHUI A Z,et al.Design of the BP neural network prediction system based on MATLAB[J].Computer Applications and Software,2008,25(4):149-150.
[19] 沈花玉,王兆霞,高成耀,等.BP神經(jīng)網(wǎng)絡隱含層單元數(shù)的確定[J].天津理工大學學報,2008,24(5):13-15.
SHEN H Y,WANG Z X,GAO C Y,et al.Determining the number of BP neural network hidden layer units[J].Journal of Tianjin University of Technology,2008,24(5):13-15.
[20] 李振,陳香香,楊文府.BP人工神經(jīng)網(wǎng)絡算法的探究及其應用[J].數(shù)字技術與應用,2016(2):132-132.
LI Z,CHEN X X,YANG W F.BP artificial neural network algorithm exploration and its application[J].Digital Technology and Application,2016(2):132-132.
[21] 趙盼盼.基于Landsat TM和ALOS PALSAR數(shù)據(jù)的森林地上生物量估測研究[D].杭州:浙江農(nóng)林大學,2016.
ZHAO P P.Forest aboveground biomass estimation study based on Landsat TM and ALOS PALSAR data[D].Hangzhou:Zhejiang A & F University,2016.
[22] 孫雪蓮.基于Landsat 8-OLI的香格里拉高山松林生物量遙感估測模型研究[D].昆明:西南林業(yè)大學,2016.
SUN X L.A remote sensing estimation model of Alpine pine forest based on Landsat8-OLI[D].Kunming:Southwest Forestry University,2016.
[23] ZHANG X,JIA W,SUN Y,et al.Simulation of spatial and temporal distribution of forest carbon stocks in long time series-based on remote sensing and deep learning[J].Forests,2023,14(3):483.
[24] 王飛平,張加龍.基于碳衛(wèi)星的森林碳儲量估測研究綜述[J].世界林業(yè)研究,2022,35(6):30-35.
WANG F P,ZHANG J L.Review of forest carbon reserve estimation study based on carbon satellite[J].World Forestry Research,2022,35(6):30-35.
[25] DONG L H,ZHANG L J,LI F R.Developing two additive biomass equations for three coniferous plantation species in northeast China[J].Forests,2016,7(7):136.
[26] 李紫荊,劉彥楓,冉嬌,等.基于Landsat 8 OLI的云南元江流域森林生物量光學遙感估測及其飽和點分析[J].西南林業(yè)大學學報(自然科學),2023,43(1):126-136.
LI Z J,LIU Y F,RAN J,et al.Optical remote sensing estimation and saturation point analysis of forest biomass in Yuanjiang Basin,Yunnan Province Based on Landsat 8 OLI[J].Journal of Southwest Forestry University:Natural Science,2023,43(1):126-136.
[27] 田惠玲,朱建華,何瀟,等.基于隨機森林模型的東北三省喬木林生物質(zhì)碳儲量預測[J].林業(yè)科學,2022,58(4):40-50.
TIAN H L,ZHU J H,HE X,et al.Prediction biomass carbon stock of arbor forest of three provinces in northeastern China based on random forest model[J].Scientia Silvae Sinicae,2022,58(4):40-50.
[28] 范文義,張海玉,于穎,等.三種森林生物量估測模型的比較分析[J].植物生態(tài)學報,2011,35(4):402-410.
FAN W Y,ZHANG H Y,YU Y,et al.Comparison of three models of forest biomass estimation[J].Journal of Plant Ecology,2011,35(4):402-410.
[29] WANG G X,ZHANG M Z,GERTNER G Z,et al.Uncertainties of mapping aboveground forest carbon due to plot locations using national forest inventory plot and remotely sensed data[J].Scandinavian Journal of Forest Research,2011,26(4):360-373.
[30] FLEMING A L,WANG G X,MCROBERTS R E.Comparison of methods toward multi-scale forest carbon mapping and spatial uncertainty analysis:combining national forest inventory plot data and landsat TM images[J].European Journal of Forest Research,2015,134(1):125-137.