盧婧 馮仲科
(精準(zhǔn)林業(yè)北京市重點實驗室(北京林業(yè)大學(xué)),北京,100083)
蓄積量是森林資源監(jiān)測的一個重要指標(biāo),林分蓄積量的消長變化是指導(dǎo)林業(yè)生產(chǎn)的重要指標(biāo),也是林業(yè)經(jīng)營決策的重要依據(jù)[1-2]。森林經(jīng)營依賴于當(dāng)前和預(yù)測的森林狀況,通過林分生長模型進(jìn)行蓄積量預(yù)測,掌握樹木的生長動態(tài),研究森林的生長規(guī)律,合理開展各種營林措施,能夠為提出優(yōu)化的經(jīng)營方法奠定理論基礎(chǔ)。近年來,國內(nèi)外學(xué)者對生長模型的研究不斷增多,然而目前我國對林分生長模型的研究存在以下問題:對小區(qū)域單一樹種和單木生長模型研究較多,對大尺度林分蓄積生長模型研究較少;與胸徑、樹高相關(guān)模型研究較多,對環(huán)境因子的研究主要集中于樹種而非整個林分[3-4];用于分析的樣地數(shù)據(jù)量不足,且缺少固定樣地數(shù)據(jù)[5]。林分生長量能反映一段時間內(nèi)森林能夠產(chǎn)出多少木材,是反映碳儲量、森林生產(chǎn)力和環(huán)境質(zhì)量的重要指標(biāo),而我國現(xiàn)行的森林資源調(diào)查體系不能生成精確可靠的森林蓄積年度生長量,因此,通過林分生長模型來預(yù)估蓄積量是十分有必要的。
以往的林分生長模型采用多元線性回歸方法,但需假設(shè)限制樣本必須服從正態(tài)分布和無共線性[6]。為此,非參數(shù)的機器學(xué)習(xí)估測方法(如BP神經(jīng)網(wǎng)絡(luò)、隨機森林法)被引入到回歸統(tǒng)計中來估測森林參數(shù)[7]。但是BP神經(jīng)網(wǎng)絡(luò)存在訓(xùn)練時間長、預(yù)測能力與泛化能力的矛盾,易出現(xiàn)過擬合弊端。而隨機森林模型不僅能夠處理交互作用、非線性等問題,能夠避免過度擬合,而且還擁有變量重要性評估功能,具有操作簡便、結(jié)構(gòu)清晰、運行效率高等優(yōu)勢[8],因此,在地質(zhì)、生態(tài)等領(lǐng)域應(yīng)用廣泛[9-14]。但目前國內(nèi)外將隨機森林模型多用于遙感估測生物量,而預(yù)測林分蓄積生長量的研究不多。
本研究利用北京市森林資源連續(xù)清查的固定樣地數(shù)據(jù)和氣候數(shù)據(jù),通過隨機森林方法分別建立針葉林、闊葉林、針闊混交林的林分蓄積生長量預(yù)測模型,并根據(jù)該模型預(yù)測下期北京市森林資源連續(xù)清查的蓄積量。該方法能夠為后續(xù)生物量、碳儲量的估測提供數(shù)據(jù)基礎(chǔ),還能夠為北京市森林資源評價和營林決策提供借鑒,對森林精準(zhǔn)經(jīng)營和規(guī)劃具有重要的現(xiàn)實意義。
樣地數(shù)據(jù):用于建模的樣地數(shù)據(jù)來源于2006年、2011年、2016年北京市森林資源連續(xù)清查數(shù)據(jù)。北京市森林資源連續(xù)清查(一類清查)是根據(jù)北京市地形地勢特點及森林分布情況,在全市范圍內(nèi)采用系統(tǒng)抽樣方法布設(shè)正方形固定樣地,樣地面積為0.067 hm2[15]。研究所用樣地數(shù)據(jù)包括緯度、經(jīng)度、海拔、坡向、坡位、坡度、土層厚度等因子,以及各樣地的樹種結(jié)構(gòu)(針葉林、闊葉林、混交林)。利用MYSQL軟件,以樣地號、樣木號為標(biāo)準(zhǔn),將森林資源連續(xù)清查數(shù)據(jù)的樣木庫和樣地庫匹配得到蓄積量數(shù)據(jù)。由于測量時可能出現(xiàn)漏測、漏記、錯記等現(xiàn)象,導(dǎo)致樣地蓄積量減小,而本研究假定林分生長量均為正,因此,在建模過程中將生長量為負(fù)的數(shù)據(jù)剔除。用于建模的樣地點分布如圖1所示,樣地覆蓋度高且分布均勻,能夠反映北京市林分生長狀況。
氣候數(shù)據(jù):本研究所用氣候數(shù)據(jù)包括平均氣溫、平均降水量、平均溫差,由加拿大學(xué)者開發(fā)的CLimateAP免費開放軟件包獲取,該軟件提供的氣候數(shù)據(jù)覆蓋整個亞太地區(qū),涵蓋了由東安格利亞大學(xué)氣候研究中心生成的歷史氣候數(shù)據(jù)和基于IPCC第5次評估報告(AR5)預(yù)測的未來氣候數(shù)據(jù)[16-17]。針對一類連清數(shù)據(jù),根據(jù)3期連續(xù)清查觀測樣地的點位坐標(biāo)逐年提取了2007—2021年的氣候數(shù)據(jù),分為3個時間段(2007—2011、2012—2016、2017—2021年)對氣溫、溫差、降水量取平均值,作為氣候因子參與建模,分別對各期數(shù)據(jù)進(jìn)行預(yù)測分析。
隨機森林模型主要思想來源于Boosting、AdaBoost和Bagging等算法,隨機森林模型建立的是多個決策樹,即通過多個弱學(xué)習(xí)器的結(jié)合,達(dá)到強學(xué)習(xí)器的效果[18-19]。隨機森林是由很多的決策樹{f(x,θk),k=1、2、…、k}組成,其中x是輸入的向量,θk是獨立同分布的隨機向量,決策樹與決策樹之間是相互獨立的[20]。在森林訓(xùn)練完成后,當(dāng)有新的數(shù)據(jù)輸入時,隨機森林中的所有決策樹獨立進(jìn)行計算。當(dāng)預(yù)測變量為數(shù)值型變量時,生成的隨機森林模型為多元非線性回歸模型,模型預(yù)測結(jié)果為多棵決策樹預(yù)測結(jié)果的平均值。
在隨機森林模型中,需要設(shè)置樹的棵數(shù)(n)和樹節(jié)點抽選的變量個數(shù)(m)。樹的棵數(shù)為重抽樣次數(shù),一般當(dāng)樹的棵數(shù)大于500以后整體誤差率趨于穩(wěn)定[21],但為保障預(yù)估結(jié)果的可靠性且不會影響計算效率,樹的棵數(shù)需要依據(jù)具體數(shù)據(jù)而定。變量個數(shù)指每次尋找最佳分割效果時從全部自變量中隨機選取的變量數(shù),一般對于回歸問題,變量個數(shù)默認(rèn)值設(shè)置為全部自變量數(shù)目的三分之一[22]。
本文利用全部數(shù)據(jù)的80%進(jìn)行建模,20%進(jìn)行驗證。在綜合考慮多種因素的考慮下,選擇以下5項指標(biāo)作為長期動態(tài)預(yù)測模型的基本評價指標(biāo)[23-26]:決定系數(shù)(R2),偏差(B),均方根誤差(RMSE),相對偏差(rB),相對均方根誤差(rR)。具體計算公式如下:
在模型建立后需進(jìn)行變量重要性評估,可以看出各個因子分別對針葉林、闊葉林、針闊混交林生長的影響大小。其基本思想是[27-28]:對于隨機森林中的每一顆決策樹,使用相應(yīng)的袋外數(shù)據(jù)來計算它的袋外數(shù)據(jù)誤差,記為B1;然后隨機地對袋外數(shù)據(jù)所有樣本的特征X加入噪聲干擾,再次計算它的袋外數(shù)據(jù)誤差,記為B2;假設(shè)隨機森林中有n棵樹,那么,特征X的重要性得分為V(X)=∑(B2-B1)/n。
為實現(xiàn)森林資源的經(jīng)營管理和可持續(xù)發(fā)展,需要及時準(zhǔn)確地掌握森林資源狀況,尤其是森林資源的動態(tài)變化情況。從匹配好的樣地中,根據(jù)樹種組成將樣地分為針葉林、闊葉林、針闊混交林,樣地數(shù)量分別為736、268、729個。
在建模過程中,因變量為蓄積生長量,自變量為經(jīng)度、緯度、海拔、平均氣溫、平均降水量、平均溫差、土壤厚度、坡度、坡向、坡位等因子,在R.3.4.3環(huán)境下調(diào)用隨機森林?jǐn)?shù)據(jù)包,分別建立針葉林、闊葉林、針闊混交林的林分蓄積生長量動態(tài)預(yù)測模型,其中n取值為1 000,m取值為3。
由表1可,模型的各項評價指標(biāo)較好,能夠滿足森林樣地蓄積量預(yù)測的精度要求。針對針葉林、闊葉林、混交林,其決定系數(shù)(R2)分別為0.93、0.94、0.89,說明模型的擬合優(yōu)度較好;其偏差(B)分別為0.006 6、-0.015 3、0.077 9 m3/hm2,均方根誤差(RMSE)分別15.499 1、9.555 7、14.293 7 m3/hm2,相對均方根誤差(rR)分別為26.12%、18.99%、35.25%,相對偏差(rB)分別為0.01%、-0.03%、0.19%,表明預(yù)測的蓄積量準(zhǔn)確度較高,模型可靠性良好。
表1 林分蓄積生長量預(yù)測模型效果評價
為了更加直觀的表達(dá)模型預(yù)測結(jié)果的偏差,繪制調(diào)查值與預(yù)測值關(guān)系散點圖。從圖2中可以看出,模型預(yù)測出的蓄積量與蓄積量標(biāo)準(zhǔn)值的一致性較好,進(jìn)而說明模型的擬合效果良好。
由表2可知,影響針葉林生長因子重要性從大到小的順序為:坡度、平均氣溫、經(jīng)度、海拔、平均溫差、緯度、坡向、坡位、平均降水量、土層厚度;影響闊葉林生長因子重要性從大到小的順序為:平均降水量、平均溫差、經(jīng)度、緯度、平均氣溫、海拔、坡向、土層厚度、坡度、坡位;影響針闊混交林生長因子重要性從大到小的順序為:緯度、經(jīng)度、平均溫差、平均降水量、平均氣溫、坡度、海拔、坡位、土層厚度、坡向。綜合來看,環(huán)境因子對3種林分生長的影響程度各不相同,其中經(jīng)度、緯度、平均溫差對林分蓄積量的生長影響較大。
表2 林分生長影響因子相對重要性 %
樣地數(shù)據(jù)選擇2016年全部4 074個森林資源連清樣地數(shù)據(jù),其中,針葉林921個、闊葉林539個、針闊混交林2 614個,氣候數(shù)據(jù)利用ClimateAP軟件提取得到2017—2021年的平均氣溫、平均降水量、平均溫差,根據(jù)隨機森林模型預(yù)測出蓄積生長量,并得到2021年的北京市林分蓄積量。由表2可知,北京市林分蓄積量預(yù)測的平均值為58.107 3 m3/hm2,變化范圍為7.284 6~388.775 6 m3/hm2,蓄積量平均值由大到小分別是針葉林、針闊混交林、闊葉林。
表3 北京市三種森林類型2021年蓄積量統(tǒng)計指標(biāo)
2.4.1 北京市林分蓄積量時間變化
由表3可知,北京市林分年平均蓄積量2006為36.358 5 m3/hm2,2011年為51.939 2 m3/hm2,2016年為53.210 9 m3/hm2,預(yù)測的2021年為58.107 3 m3/hm2,總體呈增加趨勢,在15年內(nèi),林分蓄積量共增加21.748 8 m3/hm2,其中2006—2011年增加幅度最大,年平均蓄積量增加了15.580 7 m3/hm2。由于政府制定政策保護首都園林綠化建設(shè)成果并引導(dǎo)全市嚴(yán)格保護林地,北京市林地面積不斷增加,而2006—2011年林地面積增加幅度較大,因此,北京市林分蓄積量呈增長趨勢[29]。
表4 北京市2006—2021年林分蓄積量變化
從3種森林類型的蓄積量變化情況,針葉林蓄積量在2006—2016年不斷增加,預(yù)測2021年小幅下降;闊葉林的蓄積量在2006—2016年先增加后減小,預(yù)測2021年大幅上升;針闊混交林在2006—2016年不斷增加,預(yù)測2021年繼續(xù)保持上升趨勢。因此,需進(jìn)一步落實政府制定的發(fā)展戰(zhàn)略,做好生態(tài)退耕造林工作,促進(jìn)首都經(jīng)濟社會可持續(xù)發(fā)展[30]。
2.4.2 北京市林分蓄積量空間變化
由圖4可知,北京市年平均蓄積量分布在15年間較為一致且逐漸均勻,并未因為平均蓄積量的增加出現(xiàn)某區(qū)域蓄積量激增現(xiàn)象。按北京市的14個城區(qū)來看,位于北京市邊緣區(qū)的門頭溝區(qū)、順義區(qū)、通州區(qū)等蓄積量較大,位于城市中心的西城區(qū)、東城區(qū)、朝陽區(qū)、石景山區(qū)等蓄積量較小。這是由于北京市城市森林資源分布不均勻,山區(qū)森林面積占北京市森林總面積的75%,而人口相對集中的城區(qū)、平原區(qū)的森林資源明顯不足[31]。北京市蓄積量的空間分布及變化為城鄉(xiāng)統(tǒng)籌發(fā)展提供基礎(chǔ),為林業(yè)各方面的分析提供科學(xué)依據(jù),從而為各級部門的管理、決策工作提供服務(wù)。
森林蓄積量是政府掌握國家森林資源狀況和制定計劃采伐、森林經(jīng)營管理措施的重要依據(jù),其生長量能夠反映環(huán)境因子對森林生長的綜合影響,因此,測定林分蓄積生長量具有重要意義[32]。本文結(jié)合已知固定樣地數(shù)據(jù)和對應(yīng)環(huán)境因子數(shù)據(jù),利用隨機森林方法建立與經(jīng)緯度、海拔、平均氣溫、平均降水量、平均溫差、坡度、坡向、坡位、土壤厚度相關(guān)的林分蓄積生長量預(yù)測模型。利用北京市第六~八期的一類連清數(shù)據(jù)進(jìn)行建模,預(yù)測出第九期蓄積量。
(1)林分蓄積生長模型預(yù)測精度R2為0.92,其中針葉林、闊葉林、混交林的預(yù)測精度分別為0.93、0.94、0.89,說明模型擬合優(yōu)度較好;其偏差、均方根誤差、相對均方根誤差、相對偏差均滿足要求,表模型準(zhǔn)確度較高,可靠性好。
(2)通過隨機森林方法得到的模型中每個變量的重要性評分表明,環(huán)境因子對3種林分生長的影響大小各不相同。對于針葉林生長影響較大的因子為坡度、平均氣溫、經(jīng)度、海拔;對于闊葉林生長影響較大的因子為平均降水量、平均溫差、經(jīng)度、緯度;對于針闊混交生長影響較大的因子為緯度、經(jīng)度、平均溫差、平均降水量。
(3)預(yù)測的2021年北京市林分蓄積量平均值為58.107 3 m3/hm2,變化范圍為7.284 6~388.775 6 m3/hm2;蓄積量平均值由大到小分別是針葉林、針闊混交林、闊葉林。將預(yù)測的林分蓄積量與前幾期蓄積量進(jìn)行對比,在時間尺度上蓄積量呈增加趨勢,在空間分布上蓄積量與前些年較為一致,中心城區(qū)的蓄積量逐漸增加。