王媛, 王秀蘭*, 馮仲科, 孫素芬, 張浪, 劉培斌
(1.北京林業(yè)大學(xué),精準(zhǔn)林業(yè)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100083;2.北京市農(nóng)林科學(xué)院農(nóng)業(yè)信息與經(jīng)濟(jì)研究所,北京 100097;3.上海市園林科學(xué)規(guī)劃研究院, 上海 200232;4.上海城市困難立地綠化工程技術(shù)研究中心,上海 200232;5.北京市水利規(guī)劃設(shè)計(jì)研究院, 北京 100048)
森林資源調(diào)查是對森林中各種資源的特征、數(shù)量進(jìn)行測量或調(diào)查的過程,是森林經(jīng)營與管理的基礎(chǔ)。其中最重要的任務(wù)之一是立木測量,它在評價(jià)森林資源質(zhì)量和林木生長狀況方面具有重要的價(jià)值[1]。森林資源調(diào)查的因子包括胸徑(diameter at breast height,DBH)、樹高、冠幅、林地面積、蓄積量、年齡、優(yōu)勢樹種等[2]。樹高和胸徑是反映立木質(zhì)量和生長量的最基本因子[3],也是計(jì)算森林蓄積量、生物量、碳儲(chǔ)量的基礎(chǔ)。樹冠是樹木進(jìn)行光合作用和蒸騰作用的重要場所,冠幅是樹冠結(jié)構(gòu)的重要特征因子之一,是預(yù)測樹木生物量、樹冠表面積、林分郁閉等的重要變量[4],因其相較于其他樹冠結(jié)構(gòu)因子直觀且較易觀測,也是在樹冠中被研究最多的形態(tài)變量,在單木生長模型中常作為協(xié)變量預(yù)測樹高和胸徑生長量以及樹木枯損等[5-6]。對樹木冠幅的定量研究對林分密度調(diào)控、森林生態(tài)效益和生產(chǎn)能力的最優(yōu)化管理具有重要意義。
在傳統(tǒng)樹木測量中,林業(yè)工作一般使用胸徑尺測量胸徑,以測高器測樹高,并記錄數(shù)據(jù)。而冠幅相對難以用傳統(tǒng)工具測量且誤差較大,因此,林業(yè)工作者基于樹高、胸徑與冠幅之間的關(guān)系建立回歸模型,以容易測得的胸徑推算樹高和冠幅[7]。國內(nèi)外學(xué)者就胸徑、樹高和冠幅之間存在的密切聯(lián)系進(jìn)行了大量的研究。例如,S?nmez[8]通過研究遼東冷杉的胸徑和樹高,建立了7個(gè)胸徑樹高模型,其研究結(jié)果表明精度最高的是三次方程。Calama等[9]對西班牙石松建立了樹高-胸徑模型,對5個(gè)雙參數(shù)非線性方程進(jìn)行了擬合和評價(jià),建立了同一樹種不同地區(qū)的模型。雷相東等[10]建立了長白落葉松等9個(gè)樹種的樹冠冠幅預(yù)測模型,結(jié)果證明樹木的胸徑對大多數(shù)樹種的冠幅都有顯著影響。符亞健等[11]對山西省龐泉溝自然保護(hù)區(qū)華北落葉松天然次生林單木冠幅預(yù)測模型展開研究,得出三參數(shù)的邏輯斯蒂形式的冠幅-胸徑模型擬合精度較高,并且模型參數(shù)可解釋。上述研究證明大多數(shù)樹種胸徑與樹高、胸徑與冠幅之間都存在較強(qiáng)的相關(guān)關(guān)系。近年來隨著遙感技術(shù)的發(fā)展,運(yùn)用高分辨率影像與LiDAR數(shù)據(jù)結(jié)合,傳統(tǒng)手段難以獲取的冠幅數(shù)據(jù)可以在遙感影像中獲取,而利用胸徑、樹高與冠幅的相關(guān)關(guān)系,在大面積森林資源調(diào)查中可以利用冠幅數(shù)據(jù)推算胸徑和樹高數(shù)據(jù),提高工作效率。
北京市延慶松山國家自然保護(hù)區(qū)地處北京市延慶縣西北端,距離北京市區(qū)90 km。東部與延慶縣后河村相鄰,南部與佛峪口村和水峪村相鄰,西邊和河北省懷來縣接壤,北邊與河北省赤城縣相鄰,位于北京延慶縣海坨山南麓,坐標(biāo)為N40°29′9″~40°33′35″, E115°43′44″~115°50′22″,面積4 660 hm2。松山自然保護(hù)區(qū)地勢北高南低,地形復(fù)雜,地勢陡峭、地面起伏較大。本文基于松山自然保護(hù)區(qū)的實(shí)測數(shù)據(jù),對松山主要的14個(gè)樹種利用回歸方程分別建立胸徑-冠幅與樹高-冠幅模型,通過比較分析選取最優(yōu)模型,并進(jìn)行精度檢驗(yàn)??蔀橐院蟠竺娣e開展森林資源調(diào)查以及冠幅、胸徑、樹高的高效預(yù)測提供參考。
在松山國家自然保護(hù)區(qū)內(nèi)的唐子溝、石湖溝和大柳樹溝內(nèi)建立了40 hm2(1 000 m×400 m)的森林大樣地,劃分為1 000個(gè)20×20 m2的小樣地,使用全站儀[12](NTS 340,南方測繪儀器有限公司)對樹木進(jìn)行測量,可得到樹木的三維坐標(biāo)、樹高、胸徑、冠幅等基本數(shù)據(jù)。將全站儀架設(shè)于地形平坦處,激光點(diǎn)分別瞄準(zhǔn)待測位置,通過三角函數(shù)和距離公式自動(dòng)解算測量數(shù)據(jù),得到相應(yīng)樹高、胸徑、冠幅數(shù)據(jù)。為了建模更具代表性,本研究對每個(gè)小樣地內(nèi)胸徑大于1 cm的所有喬木的樹高、胸徑、冠幅(東西和南北兩個(gè)方向)進(jìn)行測量和記錄。
1.2.1建模方法 本文將實(shí)測獲取的各樣地?cái)?shù)據(jù)進(jìn)行匯總后,選取松山地區(qū)數(shù)量較多的油松(PinustabulaeformisCarr.)、胡桃楸(JuglansmandshuricaMaxim.)、椴樹(TiliatuanSzyszyl.)、榆樹(UlmuspumilaLinn.)、五角楓(AceroliverianumPax)、蒙古櫟(QuercusmongolicaFischerexLedebour)、白樺(BetulaplatyphyllaSuk.)、山槐(AlbiziakalkoraRoxb.Prain)、核桃(JuglansregiaLinn.)、柳樹(Salix)、小葉樸(CeltisbungeanaBl.)、棗樹(ZiziphusjujubaMill.)、椿樹(AilanthusaltissimaMill.Swingle)、黑樺(BetuladahuricaPall.)14個(gè)樹種的部分測量數(shù)據(jù),利用SPSS 22.0建模。
建立模型時(shí),樹高、胸徑數(shù)據(jù)直接使用測量值,因冠幅數(shù)據(jù)分別測量了東西、南北兩個(gè)方向,在計(jì)算中,使用兩個(gè)方向的測量值的平均值參與建模。將所有樣地的數(shù)據(jù)按照樹種匯總,去除異常數(shù)據(jù)后進(jìn)行后續(xù)分析。
以往的研究表明,經(jīng)驗(yàn)?zāi)P驮趩文旧L預(yù)估中是一種常用方法,構(gòu)建的模型直觀明了[13]。由于各種函數(shù)回歸模型的精度存在一定差異,本文選取了6個(gè)回歸模型(表1)對松山地區(qū)樹種進(jìn)行擬合分析。
表1 候選模型Table 1 Candidate model
以冠幅數(shù)據(jù)D作為自變量,樹高H和胸徑d作為因變量,a、b、c、f分別為擬合模型的參數(shù)估計(jì)值。模型驗(yàn)證是建模的關(guān)鍵步驟,常用方法是數(shù)據(jù)分割(data splitting),即按照比例將數(shù)據(jù)分為建模數(shù)據(jù)和驗(yàn)證數(shù)據(jù)[14]。本文隨機(jī)選取各樹種80%左右的數(shù)據(jù)建立模型,剩余20%數(shù)據(jù)作為檢驗(yàn)數(shù)據(jù),在模型建立后對模型進(jìn)行精度驗(yàn)證[15]。
1.2.2精度評價(jià) 本文選用決定系數(shù)R2、均方誤差RMSE和F統(tǒng)計(jì)量三個(gè)指標(biāo)對對模型精度進(jìn)行評價(jià)。R2取值范圍為[0,1],R2越接近1,表明模型對數(shù)據(jù)的擬合越好。均方誤差RMSE是用擬合值與原始值之間的偏差來評價(jià)模型的回歸效果,值越小越好。對回歸方程進(jìn)行F檢驗(yàn),回歸方程的擬合度越高,F(xiàn)統(tǒng)計(jì)量值就越大。各指標(biāo)估計(jì)值檢驗(yàn)計(jì)算方法如下。
(1)
(2)
(3)
在計(jì)算上述指標(biāo)后,對比每個(gè)模型的決定系數(shù)R2,均方誤差RMSE和F統(tǒng)計(jì)量,按照R2、F最大以及RMSE最小的原則,選取出最優(yōu)模型。
2.1.1異常數(shù)據(jù)分析 將每種樹木的所有數(shù)據(jù)繪制散點(diǎn)圖,如圖1(以山槐為例)所示,因樹木本身或測量中較大問題存在個(gè)別異常數(shù)據(jù),如記錄過程中出現(xiàn)小數(shù)點(diǎn)標(biāo)錯(cuò)位置以致明顯過大或過小的數(shù)據(jù),以及繪制散點(diǎn)圖之后與趨勢線和大多數(shù)數(shù)據(jù)距離過大的數(shù)據(jù)等,因此,需要去除后對剩余數(shù)據(jù)才能進(jìn)行后續(xù)分析。
圖1 山槐胸徑、樹高、冠幅數(shù)據(jù)散點(diǎn)圖Fig.1 Scatter plot of DBH, tree height and crown width of Albizia kalkora Roxb. Prain
2.1.2建模數(shù)據(jù)統(tǒng)計(jì)分析 匯總所有數(shù)據(jù),將枯死的樹木數(shù)據(jù),因測量、記錄等過程出現(xiàn)錯(cuò)誤的數(shù)據(jù)以及散點(diǎn)圖中異常值剔除,最終選定樣本量大于30的14個(gè)喬木樹種進(jìn)行研究,統(tǒng)計(jì)結(jié)果如表2所示。
從表2可以看出,選取的樹種中,油松和蒙古櫟的樣本量較大,達(dá)到18 201和6 724株;椿樹、核桃和柳樹的樣本量比較小,均為30余株。各樹種的樹高、胸徑、冠幅數(shù)據(jù)的最大值與最小值差距較大,標(biāo)準(zhǔn)差值較大,說明使用的數(shù)據(jù)取值范圍較廣,具有代表性。
表2 建模數(shù)據(jù)統(tǒng)計(jì)Table 2 Statistics of model data
分別把各個(gè)樹種的胸徑、樹高、冠幅的建模數(shù)據(jù)代入公式中,每個(gè)樹種分別得到12個(gè)模型,包括6個(gè)胸徑-冠幅模型和6個(gè)樹高-冠幅模型,并求出其R2以及F值;使用檢驗(yàn)數(shù)據(jù)計(jì)算RMSE的值。以山槐為例,按照候選模型分別計(jì)算出各模型的參數(shù)(表3和4),并繪制出各模型的曲線圖(圖2)。
表3 山槐胸徑-冠幅模型Table 3 Albizia kalkora Roxb. Prain d-D model
圖2 山槐建模曲線Fig.2 Albizia kalkora Roxb. Prain modeling curve
從結(jié)果中可以看出所有模型的顯著性水平Sig.<0.001,說明通過統(tǒng)計(jì)學(xué)檢驗(yàn)。從決定系數(shù)R2、F統(tǒng)計(jì)值來看,各模型的擬合效果存在差異,其中線性模型、二次多項(xiàng)式和三次多項(xiàng)式模型的擬合效果較好,對數(shù)模型擬合效果最差。根據(jù)決定系數(shù)R2和F統(tǒng)計(jì)值最大的標(biāo)準(zhǔn),選擇山槐的最優(yōu)胸徑-冠幅模型為二次多項(xiàng)式模型,樹高-冠幅模型為線性模型;計(jì)算得到對應(yīng)的RMSE的值也是所有模型中最小的,說明選擇的模型優(yōu)于其他模型。
表4 山槐樹高-冠幅模型Table 4 Albizia kalkora Roxb. Prain H-D model
將所有樹種的胸徑、樹高、冠幅數(shù)據(jù)分別代入回歸方程,得到每個(gè)樹種的12個(gè)模型。建模過程中,一些樹種按指標(biāo)最優(yōu)的原則選取出的最優(yōu)模型為二次多項(xiàng)式模型或者三次多項(xiàng)式模型,但是結(jié)合模型圖像來看,二次多項(xiàng)式模型和三次多項(xiàng)式模型走勢存在下降現(xiàn)象,可能出現(xiàn)過擬合的情況(圖3),故應(yīng)在排除這些模型之后選擇最優(yōu)模型。為了評估選取的最優(yōu)模型的適用性和準(zhǔn)確性,使用預(yù)留的驗(yàn)證數(shù)據(jù)參照RMSE值做評估。
圖3 榆樹樹高-冠幅模型曲線Fig.3 H-D model curve of Ulmus pumila Linn.
從建模結(jié)果可以看出,所有模型Sig.<0.01,說明極為顯著。同樣對每個(gè)樹種的模型依據(jù)R2最大、F最大、RMSE最小的的原則,選取出最優(yōu)模型,如表5、表6所示。在選取最優(yōu)模型時(shí),當(dāng) 3 個(gè)指標(biāo)相差不大時(shí),選擇系數(shù)較少、形式較簡單的模型。在選取出的最優(yōu)模型中,沒有出現(xiàn)指數(shù)模型和三次多項(xiàng)式模型;三次多項(xiàng)式存在決定系數(shù)R2最大的情況,但同時(shí)存在過擬合,因此最優(yōu)模型也均未選擇三次多項(xiàng)式模型。線性模型和冪函數(shù)模型被較多樹種選為最優(yōu)模型。
表5 各樹種最優(yōu)胸徑-冠幅模型Table 5 Optimal d-D model
表6 各樹種最優(yōu)樹高-冠幅模型Table 6 Optimal H-D model
選取出模型中,樹高-冠幅模型的R2范圍為0.511~0.887,最小的是白樺,最大的是核桃;RMSE的值最小的是柳樹,值為1.069,最大的是油松的4.128。胸徑-冠幅模型中,決定系數(shù)最大的是核桃,R2為0.951,榆樹的最小,R2為0.515;RMSE的值來看,最小的是柳樹,為1.166,最大的白樺為7.353,榆樹為5.506,其余介于1.857~4.917之間。
從上述建模和驗(yàn)證結(jié)果可以看出,各樹種的具體模型和參數(shù)都有不同,選取出的最優(yōu)模型中冪函數(shù)模型和線性模型最多。并未出現(xiàn)指數(shù)模型,說明指數(shù)模型比起其他模型來說,較為不適合本研究所選樹種。二次多項(xiàng)式模型和三次多項(xiàng)式模型在一些樹種中出現(xiàn)了過擬合的情況,因此并未選擇R2最高的二次多項(xiàng)式和三次多項(xiàng)式模型,說明經(jīng)驗(yàn)?zāi)P筒皇窃綇?fù)雜越好。各樹種的冠幅預(yù)測模型的決定系數(shù)R2都在0.5以上,其中決定系數(shù)最高的是核桃,胸徑-冠幅模型R2高達(dá)0.951,樹高-冠幅模型R2為0.887;決定系數(shù)最小的是蒙古櫟,樹高-冠幅模型R2為0.506,胸徑-冠幅模型的R2為0.52,有一定的統(tǒng)計(jì)學(xué)意義。張樹森等[16]利用啞變量構(gòu)建了大興安嶺地區(qū)天然落葉松冠幅預(yù)測模型,模型的決定系數(shù)R2為0.717 4;韓艷剛等[17]用章古臺(tái)地區(qū)的樟子松人工林?jǐn)?shù)據(jù)構(gòu)建了冠幅-胸徑的基礎(chǔ)模型、廣義模型和基于混合效應(yīng)的基礎(chǔ)和廣義模型,決定系數(shù)R2在0.5~0.7之間,在關(guān)于胸徑和冠幅的研究中,決定系數(shù)很多在0.7左右,可以看出本研究精度較高。在大規(guī)模森林資源調(diào)查中,冠幅可通過遙感技術(shù)獲得,但是林冠下的條件因子立地條件可能難以獲取。這時(shí)直接使用冠幅數(shù)據(jù)估算樹高和胸徑值就有了實(shí)用價(jià)值。由此可以看出,對松山地區(qū)的數(shù)據(jù)進(jìn)行模型擬合是有意義的,且模型簡單易懂,在獲取大量冠幅數(shù)據(jù)時(shí)可以作為以上樹種用冠幅預(yù)測樹高和胸徑的參考,模型有一定的實(shí)用性,便于后續(xù)的應(yīng)用。從精度驗(yàn)證來看,所有的模型顯著性水平(Sig.)都小于0.01,都通過了顯著性檢驗(yàn),且F較大,說明回歸方程顯著。但是從各模型的RMSE指標(biāo)來看,還是存在不同程度的誤差,存在這些誤差可能有以下幾點(diǎn)原因:一方面由于樣本數(shù)量的限制,某些樹種樣本偏少,結(jié)論可能有誤差;另一方面冠幅生長同樣受到海拔、林分密度等的影響,下一步應(yīng)在加大樣本量的基礎(chǔ)上加入一些容易獲取的環(huán)境、林分和單木因子,研究這些因子與冠幅之間的關(guān)系。
近年來,隨著遙感技術(shù)的迅速發(fā)展和無人機(jī)在林業(yè)中的應(yīng)用,通過無人機(jī)攝影獲取影像提取冠幅的方法,可高效地進(jìn)行森林資源調(diào)查因子提取,提高了森林資源調(diào)查的效率,使森林資源管理實(shí)現(xiàn)信息化、精準(zhǔn)化。利用樹高、胸徑、冠幅間的相關(guān)關(guān)系,可以通過冠幅預(yù)測胸徑和樹高。目前通過影像提取冠幅的方法主要有面向?qū)ο蠓?、分水嶺分割法、專家分類法等。王枚梅等[18]基于面向?qū)ο蠓椒?,提取四川貢嘎山某區(qū)域亞高山針葉林的樹冠,精度較高,自動(dòng)提取的東西冠幅和南北冠幅與真實(shí)冠幅的R2分別達(dá)0.765 1和 0.855 6,單元面積樹木數(shù)和郁閉度的提取精度分別達(dá)0.99和0.92。孫華[19]采用標(biāo)記分水嶺和均值漂移分割算法對樣地杉木冠幅信息進(jìn)行提取。其中標(biāo)記分水嶺分割方法提取冠幅的最佳效果正確率為77.1%;多尺度分割漂移算法的正確率為86.6%。基于無人機(jī)和遙感影像的冠幅提取技術(shù)已經(jīng)相對成熟,為建立胸徑-冠幅和樹高-冠幅模型提供了前提條件。本文建立的模型可對松山地區(qū)大面積森林調(diào)查中胸徑、樹高的預(yù)測提供參考。