蘇迪,高心丹
(東北林業(yè)大學(xué)信息與計(jì)算機(jī)工程學(xué)院,哈爾濱 150040)
森林是地球生態(tài)系統(tǒng)中重要的組成部分,其碳匯功能在維持全球碳平衡方面發(fā)揮著重要作用。森林蓄積量是生物量和碳儲(chǔ)量研究的重要參考因素,是評(píng)價(jià)森林固碳能力的重要指標(biāo),也是森林資源調(diào)查的重要因素。傳統(tǒng)的一、二類(lèi)森林資源調(diào)查是測(cè)算森林蓄積量的重要方法,這兩種方法雖然準(zhǔn)確度較高,但在時(shí)間與空間上存在較大的局限性,調(diào)查過(guò)程會(huì)耗費(fèi)大量的時(shí)間和人力[1-2]。如何在準(zhǔn)確獲取森林蓄積量信息的同時(shí),快速、高效地為區(qū)域生態(tài)狀況評(píng)估提供參考[3-5]已成為研究熱點(diǎn)。
近年來(lái),隨著遙感技術(shù)的發(fā)展,基于遙感因子的森林蓄積量估測(cè)方法因其可以快速、高效獲得蓄積量模型而引起了國(guó)內(nèi)外學(xué)者的廣泛關(guān)注[6-8]?;貧w建模估測(cè)法因其工作量相對(duì)較少、估測(cè)頻率高、估測(cè)覆蓋面積大等優(yōu)點(diǎn)逐步成為基于遙感因子蓄積量估測(cè)研究的主要方向[9-11]。按照自變量數(shù)量可以將蓄積量回歸模型分為一元和多元回歸,按照方程表現(xiàn)形式可以分為線性和非線性回歸[12-13]。研究森林蓄積量的線性回歸方法主要有最小二乘法、逐步回歸法、主成分回歸法、偏最小二乘法[14-16]。其中,偏最小二乘法結(jié)合了多種回歸方法的功能和優(yōu)點(diǎn),有效地改善了模型自變量間的多重共線性問(wèn)題,目前已廣泛地應(yīng)用于各領(lǐng)域的估測(cè)研究中[17-20]。帶有點(diǎn)云數(shù)據(jù)的航測(cè)數(shù)據(jù)與其他遙感數(shù)據(jù)相比,具有分辨率高、細(xì)節(jié)更完善、時(shí)效性強(qiáng)、成本低等優(yōu)點(diǎn),可以更準(zhǔn)確地提取蓄積量的相關(guān)特征因子[21-23],從而提高蓄積量估測(cè)精度。
本研究利用無(wú)人機(jī)航攝影像點(diǎn)云數(shù)據(jù)估測(cè)樹(shù)高和胸徑因子,使用正射影像通過(guò)分水嶺算法提取樹(shù)冠個(gè)數(shù),結(jié)合提取的坡向等因子,用主成分回歸方法估測(cè)郁閉度,結(jié)合全部因子通過(guò)偏最小二乘回歸方法估測(cè)森林蓄積量。
以帽兒山林場(chǎng)老山施業(yè)區(qū)森林為研究區(qū)域(127°18′0″~127°41′6″E,45°2′20″~45°18′16″N),該林場(chǎng)是東北林業(yè)大學(xué)實(shí)驗(yàn)林場(chǎng),位于尚志市西北部,場(chǎng)址距市區(qū)40 km,隸屬于尚志國(guó)有林場(chǎng)管理局。林業(yè)用地面積26 067 hm2,其中有林地面積23 204 m3,森林總蓄積1 879 380 hm2,森林覆蓋率83.29%。老山施業(yè)區(qū)屬于帽兒山林場(chǎng)的一部分,原始地帶植被為闊葉紅松混交林,現(xiàn)存植被以紅松、樟子松、落葉松人工林為主,該區(qū)域具有豐富的森林資源適合進(jìn)行蓄積量研究。
研究數(shù)據(jù)1 來(lái)源于航測(cè)數(shù)據(jù),原始圖像數(shù)據(jù)來(lái)源于型號(hào)為DJI X3 的無(wú)人機(jī)拍攝而成的影像,機(jī)上搭載Canon?EOS?60D 數(shù)碼相機(jī)拍攝,有效像素1 240 萬(wàn),最大分辨率可達(dá)到4 000×3 000 ppi,成像時(shí)間為2015 年9 月14 日,利用航空影像中獲得DOM(digital orthophoto map,數(shù)字正射影像圖),DOM 影像面積達(dá)到4 723.169 7 hm2,其地理坐標(biāo)為xian80,研究區(qū)域內(nèi)的DOM 與小班矢量圖疊加圖像見(jiàn)圖1。用lasmerge 軟件將多個(gè)點(diǎn)云數(shù)據(jù)合成為一個(gè)點(diǎn)云數(shù)據(jù),按照研究數(shù)據(jù)2 實(shí)測(cè)范圍對(duì)點(diǎn)云數(shù)據(jù)進(jìn)行裁剪,其地理坐標(biāo)為xian80,其面積為3 129.276 hm2,平均點(diǎn)云密度為49 point/m2,按高程顯示的點(diǎn)云數(shù)據(jù)圖像見(jiàn)圖2。
圖1 DOM 與小班矢量圖疊加圖像Fig.1 DOM and sub?compartment vector overlay image
圖2 點(diǎn)云數(shù)據(jù)圖像Fig.2 Point cloud data image
研究數(shù)據(jù)2 是實(shí)測(cè)數(shù)據(jù),為帽兒山林場(chǎng)老山實(shí)驗(yàn)區(qū)森林資源二類(lèi)調(diào)查數(shù)據(jù)。其中包括2015 年調(diào)查的1∶10 000 地形圖,618 個(gè)以矢量地理信息數(shù)據(jù)形式儲(chǔ)存的小班二類(lèi)調(diào)查數(shù)據(jù)。
研究數(shù)據(jù)3 為實(shí)測(cè)數(shù)據(jù),為東北林業(yè)大學(xué)帽兒山實(shí)驗(yàn)林場(chǎng)森林固定樣地?cái)?shù)據(jù),2004 年調(diào)查更新的比例尺1∶25 000 的固定樣地分布圖,調(diào)查總面積為26 496 hm2,包含263 個(gè)樣地的二類(lèi)調(diào)查信息。
不同類(lèi)型的GIS 因子數(shù)據(jù)對(duì)蓄積量模型精度有嚴(yán)重的影響,為了減少該影響,對(duì)研究數(shù)據(jù)2、3中的針闊混交林小班采用標(biāo)準(zhǔn)差分析法剔除樣本中離群較大的數(shù)據(jù),即剔除樣本中的數(shù)據(jù)。重復(fù)上述步驟,最終選擇到120 個(gè)針闊混交林樣本數(shù)據(jù)。將所有數(shù)據(jù)進(jìn)行中心標(biāo)準(zhǔn)化處理,去除因各個(gè)因子間量綱不同帶來(lái)的影響,統(tǒng)一所有因子的量綱,如式(1)所示:
利用GIS 技術(shù)提取與森林蓄積量相關(guān)的樹(shù)冠個(gè)數(shù)、平均樹(shù)高、平均胸徑、坡度、坡向、海拔、小班面積、郁閉度這8 個(gè)GIS 因子建立蓄積量模型,通過(guò)該方法提高蓄積量的估測(cè)精度。本研究先使用ArcGIS10.2 軟件將DOM 圖像和點(diǎn)云數(shù)據(jù)圖像按照小班邊界進(jìn)行裁剪,為進(jìn)行特征因子提取做準(zhǔn)備。本研究結(jié)合點(diǎn)云數(shù)據(jù)、DOM 圖像和研究區(qū)小班矢量數(shù)據(jù),以二類(lèi)調(diào)查小班為單位對(duì)樹(shù)冠個(gè)數(shù)、平均樹(shù)高等因子進(jìn)行估測(cè),對(duì)海拔、坡向等因子進(jìn)行提取,獲得建立蓄積量模型所需的特征因子,特征因子提取流程圖見(jiàn)圖3。
圖3 特征因子提取流程圖Fig.3 Feature factor extraction flow chart
2.1.1 分水嶺樹(shù)冠個(gè)數(shù)提取
分水嶺算法適合提取邊緣微弱較敏感、分辨率高、細(xì)節(jié)多的影像輪廓,但傳統(tǒng)分水嶺算法存在過(guò)分割問(wèn)題,為了解決該問(wèn)題,本研究將120 個(gè)小班正射影像作為分水嶺分割的原始圖像,首先使用支持向量機(jī)的分類(lèi)方法將其分為針葉林和闊葉林;其次采用最大熵法分別獲得針葉林和闊葉林的最優(yōu)閾值,比較針、闊葉林的最大熵最優(yōu)閾值,發(fā)現(xiàn)針葉林最優(yōu)閾值大于闊葉林最優(yōu)閾值;最后對(duì)形態(tài)學(xué)開(kāi)閉重建處理后的針闊混交林圖像進(jìn)行基于閾值標(biāo)記的分水嶺分割,第1 次將小于闊葉林閾值區(qū)域進(jìn)行標(biāo)記和分水嶺分割,第2 次將大于闊葉林最優(yōu)閾值,小于針葉林最優(yōu)閾值進(jìn)行分割得到樹(shù)冠輪廓圖像。
2.1.2 樹(shù)高和胸徑的估測(cè)
使用LIDAR360 工具對(duì)點(diǎn)云數(shù)據(jù)進(jìn)行去噪處理,生成0.5 m 分辨率的DEM(digital elevation model,數(shù)字高程模型)和DSM(digital surface model,數(shù)字地表模型)。由于DEM 模型中只有地形的高程信息,不包括DSM 模型中的森林樹(shù)木高度等地表信息的高程,因此從DSM 中減去DEM 即可獲得CHM(canopy height model,冠層高度模型)。
CHM 中每個(gè)點(diǎn)的像素值即為該點(diǎn)的高程值,通過(guò)MATLAB 2013b 軟件編程,讀取各個(gè)小班樣本的CHM 模型平均高程,只保留高程值不為0 的點(diǎn)進(jìn)行平均高程的計(jì)算。由于CHM 為冠層模型不能等同于樹(shù)高,因此需要結(jié)合讀取的CHM 平均高程利用一元線性回歸方法建立平均樹(shù)高模型和平均胸徑模型。
2.1.3 海拔、坡向、坡度、小班面積因子的提取
使用LIDAR360 軟件在DEM 基礎(chǔ)上生成等高線圖(圖4a)。其中比例尺為1∶1 000、三角形最大邊為30 m、間曲線等高距為2.5 m、首曲線等高距為5 m、計(jì)曲線等高線為25 m。利用DEM 數(shù)據(jù)生成坡向圖像和以10°為間隔進(jìn)行處理生成坡度圖像,如圖4b、c 所示。
使用Python2.0 編程,用雙線性插值法提取等高線、坡向和坡度平均值。使用ArcGIS10.2 軟件結(jié)合小班矢量圖計(jì)算小班面積,提取各項(xiàng)因子為接下來(lái)建立郁閉度和蓄積量模型提供特征因子。
2.1.4 郁閉度估測(cè)
圖4 等高線、坡向、坡度圖像Fig.4 Contour line,aspect,slope image
主成分回歸是主成分分析和回歸估計(jì)結(jié)合的方法,主成分分析是一種變量降維技術(shù),是將多個(gè)相關(guān)變量重新組合成幾個(gè)主成分變量,減少變量個(gè)數(shù)的變量分析方法。該方法能夠簡(jiǎn)化分析過(guò)程,提高分析效率。同理主成分回歸是用合成后的主成分變量進(jìn)行回歸分析,不僅保留了原自變量對(duì)因變量的影響,還消除了各個(gè)變量相互間的共線性問(wèn)題。本研究通過(guò)主成分回歸將樹(shù)冠個(gè)數(shù)、平均樹(shù)高、平均胸徑、坡度、坡向、海拔、小班面積這7 個(gè)特征因子組成若干相互獨(dú)立的主成分,根據(jù)各個(gè)主成分的貢獻(xiàn)率大小選取模型最終的主成分變量,建立郁閉度回歸模型。使用MATLAB 2013b 編程,分析1~70 號(hào)小班數(shù)據(jù),得出了各主成分的特征根、主成分得分、主成分累積貢獻(xiàn)率。按照貢獻(xiàn)率累積80%以上的選取標(biāo)準(zhǔn),根據(jù)貢獻(xiàn)率的大小順序選取主成分,主成分與特征因子間的關(guān)系方程,再根據(jù)主成分的構(gòu)成,還原郁閉度方程,得到郁閉度與7個(gè)特征因子的關(guān)系模型。
2.2.1 樹(shù)冠個(gè)數(shù)提取結(jié)果
實(shí)驗(yàn)使用2.1.1 部分改進(jìn)后分水嶺分割算法提取樹(shù)冠輪廓信息,將樹(shù)冠分割結(jié)果圖像進(jìn)行二值化處理計(jì)算連通區(qū)域得到樹(shù)冠個(gè)數(shù),通過(guò)公式(2)計(jì)算分割準(zhǔn)確率和平均分割準(zhǔn)確率來(lái)顯示分割效果。
式中:Ad為準(zhǔn)確率;為平均準(zhǔn)確率;Nc為分割的樹(shù)冠個(gè)數(shù);Nd為小班樹(shù)木株數(shù)總數(shù)(實(shí)測(cè)小班株數(shù));n為圖像個(gè)數(shù)。
通過(guò)計(jì)算得到120 個(gè)樣地DOM 圖像的傳統(tǒng)分水嶺平均分割精度為52.89%,改進(jìn)后分水嶺平均分割精度為80.03%,能夠達(dá)到基本分割要求,改善了傳統(tǒng)分水嶺存在的過(guò)分割現(xiàn)象,分割后得到的樹(shù)冠個(gè)數(shù)可以用于建立蓄積量模型。經(jīng)計(jì)算,23 號(hào)樣地樹(shù)冠分割精度與平均分割精度最相近,所以選擇該樣地圖像進(jìn)行顯示(圖5)。
圖5 樣地23 圖像Fig.5 Sample plot 23 image
2.2.2 平均樹(shù)高、平均胸徑估測(cè)結(jié)果
根據(jù)2.1.2 部分得到平均樹(shù)高和平均胸徑模型結(jié)果如下:
由圖6 和平均樹(shù)高、平均胸徑模型的平均精度可知,估測(cè)值與實(shí)測(cè)值的擬合程度較好,且都是由CHM 直接進(jìn)行估測(cè)而成,充分利用點(diǎn)云數(shù)據(jù)所生成的CHM 數(shù)據(jù)。
圖6 平均數(shù)高和平均胸徑擬合曲線Fig.6 Average height and average DBH curve
2.2.3 郁閉度估測(cè)結(jié)果
由2.1.4 部分將7 個(gè)變量進(jìn)行主成分分析,其中第1 主成分貢獻(xiàn)率32.087%,第2 主成分貢獻(xiàn)率24.375%,第3 主成分貢獻(xiàn)率18.005%,第4 主成分貢獻(xiàn)率13.769%。前4 個(gè)主成分貢獻(xiàn)率已達(dá)到88.235%,符合主成分選取要求,選取前4 個(gè)主成分因子為新變量。則公式(5)~(8)為4 個(gè)主成分與特征因子間的關(guān)系方程。
第1 主成分為:
第2 主成分為:
第3 主成分為:
第4 主成分為:
公式(5)~(8)中:X1 為小班平均樹(shù)高;X2 為平均胸徑;X3 為坡度;X4 為坡向;X5 為海拔;X6 為小班面積;X7 為分水嶺提取的樹(shù)冠個(gè)數(shù)。
主成分回歸在減輕原始變量的多重共線性問(wèn)題后,得到以4 個(gè)主成分為新自變量的郁閉度模型,回歸方程為:
根據(jù)4 個(gè)主成分的構(gòu)成,將回歸方程還原,得到關(guān)于自變量X1—X7 的回歸方程為:
方程(9)和(10)中X8 為郁閉度,通過(guò)71~120號(hào)50 個(gè)檢驗(yàn)數(shù)據(jù)進(jìn)行精度檢驗(yàn),郁閉度模型(公式10)精度為83.18%,可以達(dá)到精度要求,再結(jié)合前文所有提取和估測(cè)的特征因子建立蓄積量模型,進(jìn)一步研究各個(gè)特征因子與蓄積量之間的關(guān)系。
偏最小二乘回歸方法是一種集典型相關(guān)分析和主成分分析優(yōu)點(diǎn)以及功能于一身的多元線性分析方法。該方法由于精度高,穩(wěn)健性實(shí)用性好而被廣泛地應(yīng)用于各種估測(cè)研究中。
設(shè)已知單個(gè)因變量Y和自變量X=[x1,x2,…,xp],樣本個(gè)數(shù)n,偏最小二乘法從X和Y的相關(guān)矩陣中提取主成分t,使用Y和X對(duì)t進(jìn)行回歸,對(duì)于回歸分析的需要,偏最小二乘回歸在提取成分時(shí)添加以下兩個(gè)目標(biāo):1)盡可能多地在t中攜帶X矩陣數(shù)據(jù)表中的變異信息;2)t和Y的相關(guān)程度能夠達(dá)到最大。在對(duì)X和Y進(jìn)行一次成分提取后,分別進(jìn)行X對(duì)t的回歸和Y對(duì)t的回歸。如果回歸方程達(dá)到了滿(mǎn)意的精度,就停止計(jì)算,否則將X關(guān)于t回歸后的殘差矩陣與Y關(guān)于t回歸后的殘差矩陣進(jìn)行新一輪的成分提取。反復(fù)重復(fù)這個(gè)過(guò)程,直至滿(mǎn)足交叉有效性原則規(guī)定的條件,最終確定提取主變量成分的個(gè)數(shù),建立偏最小二乘回歸方程[19]。
借助SPSS 軟件,通過(guò)相關(guān)性分析得到與蓄積量存在顯著關(guān)系的8 個(gè)自變量如表1 所示,表中X1—X8 同前文。
表1 表明各因子間存在多重相關(guān)性,一般回歸模型已不適用,偏最小二乘法對(duì)自變量的選擇門(mén)檻不高,不需要選擇最優(yōu)因子,且較多變量有益于對(duì)提取的主成分進(jìn)行累計(jì)解釋分析,因此本研究采用偏最小二乘法建立森林蓄積量估測(cè)模型。
在MATLAB 2013b 軟件中按照偏最小二乘原理編寫(xiě)PLS 回歸代碼,對(duì)1~120 號(hào)樣本用偏最小二乘法建立蓄積量模型,對(duì)模型進(jìn)行交叉有效檢驗(yàn),得到原始變量的回歸方程系數(shù),據(jù)此可以擬合出基于偏最小二乘回歸方法蓄積量方程。
表1 特征因子相關(guān)系數(shù)Table 1 Characteristic factor correlation relationship table
式中:V為蓄積量,方程包含的X1—X8 與上文一致,將30 個(gè)固定樣地檢驗(yàn)樣本數(shù)據(jù)代入方程(公式11),得到蓄積量估測(cè)值,為模型評(píng)價(jià)和精度檢驗(yàn)做準(zhǔn)備。
結(jié)合預(yù)留的121~150 號(hào)30 個(gè)驗(yàn)證樣本實(shí)測(cè)數(shù)據(jù)和蓄積量方程(公式11)估算的森林蓄積量得到圖7 實(shí)測(cè)值與估測(cè)值折線圖。
圖7 實(shí)測(cè)值與估測(cè)值折線圖Fig.7 Line chart of stock volume measured value and estimated value
從圖7 中可以看出估測(cè)的蓄積量值整體偏大,通過(guò)對(duì)蓄積量實(shí)測(cè)值和估測(cè)值進(jìn)行配對(duì)T檢驗(yàn),得到T=-0.374,P=0.657>0.05,說(shuō)明實(shí)測(cè)值和估測(cè)值相比雖然整體偏小,但不存在顯著性差異。
使用實(shí)測(cè)值與估測(cè)值對(duì)模型進(jìn)行評(píng)價(jià),根據(jù)模型的決定系數(shù)R2,均方根誤差RMSE,總體相對(duì)誤差RS,平均相對(duì)誤差MRE,預(yù)估精度Pr為評(píng)價(jià)指標(biāo)。根據(jù)公式(12)~(16)計(jì)算:
式中:yi為蓄積量實(shí)測(cè)值;為蓄積量模型預(yù)測(cè)值;為蓄積量實(shí)測(cè)樣本平均值;n為檢驗(yàn)樣本數(shù);i表示第i個(gè)樣本。本研究蓄積量模型(公式11)的R2=0.738 6,RMSE=5.135 3 m3/hm2,說(shuō)明模型擬合效果較好。利用模型偏差統(tǒng)計(jì)量進(jìn)行比較并評(píng)價(jià)模型的預(yù)測(cè)能力,RS=-1.285 8、MRE=-0.263 0,說(shuō)明估測(cè)蓄積量與實(shí)測(cè)蓄積量偏離不大,可以很好地進(jìn)行蓄積量估測(cè);精度達(dá)到88.43%,估測(cè)能力較好,并且有一定的可推廣性。
以蓄積量實(shí)測(cè)值為橫坐標(biāo),估測(cè)值為縱坐標(biāo),建立實(shí)測(cè)值和估測(cè)值散點(diǎn)圖,建立的散點(diǎn)圖趨勢(shì)線擬合效果較好,實(shí)測(cè)值和估測(cè)值比較吻合(圖8)。
圖8 蓄積量實(shí)測(cè)值與估測(cè)值的散點(diǎn)圖Fig.8 Scatter plot of measured and estimated values of stock volume
利用無(wú)人機(jī)影像生成的點(diǎn)云數(shù)據(jù)和正射影像估測(cè)蓄積量的方法,能夠在充分利用無(wú)人機(jī)影像的同時(shí)最大限度地保留無(wú)人機(jī)影像的細(xì)節(jié)和各種因子的特征,提高特征參數(shù)的提取精度。該方法不僅提高了實(shí)施效率、降低了估測(cè)成本,還為代替人工野外實(shí)測(cè)森林調(diào)查信息提供了可能。無(wú)人機(jī)數(shù)據(jù)生成的正射影像與高分辨率衛(wèi)星影像相比具有重疊度大、分辨率高等優(yōu)點(diǎn);其生成的點(diǎn)云數(shù)據(jù)不僅可以代替機(jī)載雷達(dá)獲得高程信息,還具有航線靈活、操作方便、時(shí)效性好等優(yōu)點(diǎn)。無(wú)人機(jī)航測(cè)數(shù)據(jù)彌補(bǔ)了高分辨率衛(wèi)星影像無(wú)法同時(shí)獲得影像和高程信息的缺點(diǎn),在估測(cè)森林生物量和蓄積量方面應(yīng)用前景廣闊。
本研究利用無(wú)人機(jī)航攝方法采集了黑龍江帽兒山林場(chǎng)老山實(shí)驗(yàn)區(qū)航攝影像,利用三維點(diǎn)云數(shù)據(jù)提取CHM 模型高程,估測(cè)了平均樹(shù)高和平均胸徑;用改進(jìn)的分水嶺算法獲得了樹(shù)冠個(gè)數(shù);用DEM數(shù)據(jù)獲得坡度等特征信息,估測(cè)了森林蓄積量。使用帽兒山林場(chǎng)固定樣地?cái)?shù)據(jù)作為檢驗(yàn)樣本,結(jié)果表明,平均樹(shù)高提取精度達(dá)到97.34%,平均胸徑提取精度達(dá)到91.27%,樹(shù)冠個(gè)數(shù)提取精度達(dá)到80.03%,郁閉度模型精度為83.18%,森林蓄積量估測(cè)精度達(dá)到88.43%,滿(mǎn)足森林調(diào)查精度要求。研究得到如下結(jié)論:1)在提取CHM 平均高程值時(shí)不計(jì)算高程值為0 的點(diǎn),減少了點(diǎn)云數(shù)據(jù)空白點(diǎn)對(duì)平均樹(shù)高、胸徑模型的影響;2)通過(guò)遙感技術(shù)提取特征因子,用主成分回歸的方法可有效地估測(cè)郁閉度;3)模型中所有因子都是通過(guò)遙感與回歸方法提取或估測(cè)生成,使用偏最小二乘回歸方法建立蓄積量模型,為信息化、自動(dòng)化提取特征因子估測(cè)蓄積量提出可能。由于時(shí)間和試驗(yàn)條件限制,仍存在很多不足和改進(jìn)的地方,如波段信息對(duì)蓄積量估測(cè)的影響等方面有待進(jìn)一步研究。