王俊杰, 張思媛, 滕鵬程
(1.黑龍江科技大學(xué) 礦業(yè)工程學(xué)院, 哈爾濱 150022; 2.兗州中材建設(shè)有限公司, 江西 撫州 344706)
精確識(shí)別森林樹種對生態(tài)環(huán)境和樹木的可持續(xù)發(fā)展具有重要意義,有助于研究森林中生態(tài)系統(tǒng)的多樣性,合理有計(jì)劃地規(guī)劃、監(jiān)測和保護(hù)森林資源,實(shí)現(xiàn)森林資源的可持續(xù)發(fā)展。無人機(jī)多光譜影像空間分辨率高且較傳統(tǒng)調(diào)查方法效率更高,因此為中小尺度上的精細(xì)樹種識(shí)別提供了新的方法。楊爍[1]基于Landsat影像并結(jié)合DEM數(shù)據(jù)對大興安嶺地區(qū)進(jìn)行了遙感影像分類研究,分類總體精度為75.46%。Pro?ek等[2]以位于捷克的一個(gè)森林為研究區(qū),基于無人機(jī)多光譜和紋理信息進(jìn)行了樹種精細(xì)分類,分類精度達(dá)到88.2%。隨著激光雷達(dá)掃描技術(shù)的發(fā)展,其在林業(yè)中的應(yīng)用也越來越廣泛[3]。Puttonen等[4]利用機(jī)載雷達(dá)點(diǎn)云數(shù)據(jù)和高光譜數(shù)據(jù)結(jié)合,對樹種進(jìn)行分類,結(jié)果顯示結(jié)合了點(diǎn)云數(shù)據(jù)的精度提高為95.8%,證明了在樹種分類中結(jié)合多源遙感數(shù)據(jù)能夠提高識(shí)別精度。Clark等[5]通過對熱帶雨林的樹種識(shí)別研究,得出基于單木冠幅的樹種識(shí)別精度比基于像素尺度的樹種識(shí)別精度要高。隨著激光雷達(dá)技術(shù)的發(fā)展,將點(diǎn)云數(shù)據(jù)運(yùn)用到單木分割也成了研究熱點(diǎn)。Drǎgut等[6]結(jié)合光譜特征和形狀特征通過多尺度分割算法實(shí)現(xiàn)了單木分割。Zhen等[7]提出了區(qū)域生長算法,通過樹木之間的高度差分析競爭區(qū)域?qū)崿F(xiàn)單木分割。手持激光掃描儀發(fā)射的激光束可透過林間隙抵達(dá)樹干、樹冠和地面,快速完整獲取森林的樹干等垂直結(jié)構(gòu)信息,但其在樹種識(shí)別領(lǐng)域運(yùn)用較少。
因此,結(jié)合多源遙感數(shù)據(jù)進(jìn)行樹種識(shí)別研究是目前的研究熱點(diǎn),但大部分研究數(shù)據(jù)源采用較為單一,故筆者將HMLS數(shù)據(jù)和無人機(jī)多光譜數(shù)據(jù)結(jié)合,利用隨機(jī)森林模型進(jìn)行樹種識(shí)別,探索不同數(shù)據(jù)組合方式對樹種識(shí)別精度的影響,以期為后續(xù)樹種識(shí)別領(lǐng)域提供一定參考意義。
文中研究區(qū)域選擇了位于哈爾濱市阿城區(qū)的料甸林場,料甸林場位于哈爾濱市阿城區(qū)東北區(qū)域(東經(jīng)127°3′39″~127°13′39″,北緯45°34′22″~45°42′4″[8])。林場地處張廣才嶺北段,整個(gè)地勢南高北低,地勢起伏較緩。主要喬木樹種有紅松、水曲柳、椴樹、柞樹、榆樹、色樹、白樺、楊樹等,灌木和藤本植物有白丁香、五味子等,草本植物有苔草、地榆、鈴蘭等。研究區(qū)地理位置示意,如圖1所示。
圖1 研究區(qū)地理位置示意
2.1.1 野外實(shí)測數(shù)據(jù)
野外實(shí)測數(shù)據(jù)獲取于2022年10月15日,選取了落葉松、樺樹、榆樹、楊樹和柞樹為研究對象。在研究區(qū)中主要選取了三塊便于測量的樣地,在樣地中隨機(jī)選取單木利用RTK測量單木的位置信息,并記錄單木的樹種信息,共記錄落葉松32株,樺樹10株,榆樹7株,楊樹26株,柞樹21株。
2.1.2 無人機(jī)數(shù)據(jù)
無人機(jī)多光譜數(shù)據(jù)搭載飛行平臺(tái)為固定翼無人機(jī),利用MS600 V2通用型多光譜相機(jī)獲取多光譜數(shù)據(jù),坐標(biāo)系為CGCS2000坐標(biāo)系。采集時(shí)間于2022年10月15日的中午,飛行區(qū)域要包括整個(gè)研究區(qū)。具體無人機(jī)參數(shù)設(shè)置為飛行高度300 m,飛行速度18 m/s,航向重疊率80%,旁向重疊率70%,相片分辨率1 280×960,地面分辨率0.2 m,圖像類型16-bit TIFF。
2.1.3 手持激光掃描儀數(shù)據(jù)
手持激光雷達(dá)數(shù)據(jù)獲取于2020年10月15日,對研究區(qū)內(nèi)包含實(shí)測樣本單木的三塊樣地進(jìn)行掃描,該數(shù)據(jù)獲取基于LiGrip手持旋轉(zhuǎn)激光掃描儀,手持移動(dòng)激光掃描儀數(shù)據(jù)參數(shù)為:LIDAR精度±3 cm,測量范圍100m,掃描視場角為280°×360°,相對精度≤3 cm,掃描頻率300 000 pts/s。
雷達(dá)點(diǎn)云數(shù)據(jù)預(yù)處理的流程包括:點(diǎn)云去噪;基于CSF濾波算法對數(shù)據(jù)進(jìn)行地面點(diǎn)分類;基于IDW插值法生成DEM、DSM,并對兩者作差生成研究區(qū)CHM(冠層高度模型)和點(diǎn)云歸一化。
單木分割算法可以將點(diǎn)云數(shù)據(jù)分割成多個(gè)部分,每個(gè)部分可以看作一棵單木。采用基于分水嶺分割(Watershed)算法、點(diǎn)云距離閾值分割(PCS)算法和基于層堆疊算法(Layer stacking)的單木分割方法對研究區(qū)點(diǎn)云數(shù)據(jù)進(jìn)行單木分割。分水嶺分割基于分辨率為0.3 m的CHM(冠層高度模型),經(jīng)過嘗試選取Sigma(高斯平滑因子)為0.5來進(jìn)行研究區(qū)的單木分割;PCS分割時(shí)嘗試不同的距離閾值進(jìn)行分割,最終選擇距離閾值為2 m對本研究區(qū)進(jìn)行單木分割;層堆疊種子點(diǎn)的單木分割流程為:(1)首先對點(diǎn)云數(shù)據(jù)進(jìn)行歸一化操作,以消除地勢地形對單木分割的影響;(2)將點(diǎn)云數(shù)據(jù)進(jìn)行水平分層,文中設(shè)置從1 m開始每隔1 m進(jìn)行一次分層直至最高點(diǎn);(3)基于K-Means聚類算法對每一層點(diǎn)云進(jìn)行聚類操作,去除一些矮小的植被;(4)在每一個(gè)聚類生成多邊形緩沖區(qū),將每層多邊形重疊,多個(gè)多邊形重疊說明此處有單木存在,識(shí)別局部最大值將其作為種子點(diǎn);(5)對種子點(diǎn)基于PCS算法進(jìn)行單木分割。
將分割結(jié)果與實(shí)地調(diào)查數(shù)據(jù)進(jìn)行匹配,單木分割的整體精度驗(yàn)證,文中采用F來進(jìn)行評價(jià)[9],F-Score由計(jì)算精度P(Precision)和召回率R(Recall)兩個(gè)因素計(jì)算而來,P代表單木檢測的準(zhǔn)確率,包括正確分割、欠分割和過分割[10]。分割精度的計(jì)算公式為
(1)
(2)
(3)
式中:TP——正確分割;
FN——欠分割;
FP——過分割。
通過對比結(jié)果精度,選取精度最高的分割算法參與樹種識(shí)別。
3.2.1 特征提取與特征篩選
結(jié)合國內(nèi)外研究,對多光譜波段之間進(jìn)行不同的線性組合計(jì)算了11個(gè)光譜特征:大氣阻抗植被指數(shù)(ARVI)、亮度(BI)、差值植被指數(shù)(DVI)、增強(qiáng)型植被指數(shù)(EVI)、綠光歸一化植被指數(shù)(GNDVI)、紅外百分比植被指數(shù)(IPVI)、修正型簡單比值植被指數(shù)(MSR)、歸一化植被指數(shù)(NDVI)、歸一化綠光(NORMG)、最優(yōu)土壤調(diào)節(jié)指數(shù)(OSAVI)、紅綠比值植被指數(shù)(RGRI);基于灰度共生矩陣提取了8個(gè)紋理特征:角二階矩、相關(guān)性、對比度、相異性、熵、均勻度、均值、方差;基于HMLS數(shù)據(jù),提取了高度變量:點(diǎn)云累計(jì)高度百分位數(shù)、冠層起伏率、點(diǎn)云高度最大值、點(diǎn)云高度平均值、大于10%、30%、50%、70%、90%高度的點(diǎn)云密度和點(diǎn)云高度變異系數(shù);強(qiáng)度變量:點(diǎn)云強(qiáng)度平均值、點(diǎn)云強(qiáng)度百分位數(shù)、點(diǎn)云強(qiáng)度最大值、點(diǎn)云強(qiáng)度變異系數(shù)、點(diǎn)云強(qiáng)度的峰度值來參與樹種識(shí)別。
為了避免特征冗余,隨機(jī)森林在進(jìn)行模型運(yùn)算時(shí)會(huì)對數(shù)據(jù)的屬性進(jìn)行重要性的排序,本文利用這一功能,基于OOBPredictorImportance包對參與分類的特征進(jìn)行重要性排序,從中不斷優(yōu)選,選取排名靠前的變量參與樹種分類。
3.2.2 識(shí)別方法
隨機(jī)森林(Random Forest,RF)算法是一種機(jī)器學(xué)習(xí)算法,隨機(jī)森林分類就是利用多個(gè)樣本進(jìn)行訓(xùn)練之后獲得預(yù)測分類結(jié)果的分類過程。將實(shí)測樣本數(shù)據(jù)以7∶3的比例分為訓(xùn)練集和驗(yàn)證集,通過兩種不同數(shù)據(jù)組合形式(多光譜數(shù)據(jù)、多光譜數(shù)據(jù)結(jié)合手持點(diǎn)云數(shù)據(jù))對研究區(qū)內(nèi)樹種進(jìn)行分類研究,并對比其識(shí)別精度。
分類結(jié)果精度的評定通過混淆矩陣來實(shí)現(xiàn),混淆矩陣又叫誤差矩陣,通過對比實(shí)測點(diǎn)和分類點(diǎn)來計(jì)算精度,其衡量指標(biāo)通過Kappa系數(shù)K、分類的總體精度ηOA、觀測一致率Pe來評價(jià)。具體計(jì)算公式為
(4)
(5)
(6)
式中:Xii——第i類樹被正確分類的數(shù)量;
N——分類樣本樹木總數(shù);
Xi——第i類驗(yàn)證樣本的數(shù)量;
Xi′——被分為i的樣本數(shù)量。
基于三種單木分割算法對手持移動(dòng)激光雷達(dá)數(shù)據(jù)(HMLS)實(shí)現(xiàn)了單木分割,并結(jié)合實(shí)測樣本點(diǎn)數(shù)據(jù)進(jìn)行單木匹配,計(jì)算不同分割算法的單木分割精度,表1為基于Watershed、PCS和Layer stacking分割算法的單木分割結(jié)果精度對比情況。
表1 基于不同分割算法的單木分割精度
從表1可以發(fā)現(xiàn),基于Layer stacking層堆疊生成種子點(diǎn)的單木分割R值為0.763,P值為0.972,F值為0.855;該算法單木分割精度最高,96棵樣本樹中有70棵分割正確,24棵欠分割,2棵過分割,故選取Layer stacking算法分割結(jié)果進(jìn)行樹種識(shí)別研究。
4.2.1 特征篩選結(jié)果
經(jīng)OOBPredictorImportance包對特征進(jìn)行篩選并排序后,對于不同數(shù)據(jù)組合優(yōu)選出各自重要性排名前20的特征。圖2為特征優(yōu)選情況和重要性排序,其中,圖2a為光譜特征與紋理特征參與隨機(jī)森林樹種分類的特征重要性排序情況,圖2b為在圖2a的基礎(chǔ)上加入手持激光點(diǎn)云數(shù)據(jù)的隨機(jī)森林分類模型特征重要性排序情況。
圖2 特征重要性排序
從圖2a中可以看出,NORMG重要程度最高,紋理指數(shù)和原始波段排名靠后,說明紋理特征在天然林樹種識(shí)別中的影響較小。而觀察圖2b,發(fā)現(xiàn)排名靠前的特征除了NORMG以外,都為點(diǎn)云特征,這也證明了基于激光雷達(dá)數(shù)據(jù)提取的樹木結(jié)構(gòu)特征特別是點(diǎn)云高度特征在樹種識(shí)別中的應(yīng)用潛力。
4.2.2 識(shí)別結(jié)果
基于光譜特征和紋理特征的樹種識(shí)別結(jié)果見表2,結(jié)合光譜特征、紋理特征和手持點(diǎn)云結(jié)構(gòu)特征的樹種識(shí)別結(jié)果見表3。僅使用無人機(jī)多光譜數(shù)據(jù)的樹種識(shí)別總體精度為70.83%,Kappa系數(shù)為0.69;結(jié)合無人機(jī)多光譜數(shù)據(jù)和手持移動(dòng)激光雷達(dá)數(shù)據(jù)的樹種識(shí)別總體精度為81.25%,Kappa系數(shù)為0.80,樺樹識(shí)別精度有所提高,總體來看分類表現(xiàn)良好。
表2 光譜特征的樹種識(shí)別
表3 光譜+手持點(diǎn)云數(shù)據(jù)的樹種識(shí)別
與僅使用無人機(jī)多光譜影像的分類模型相比,可以發(fā)現(xiàn)加入樹木結(jié)構(gòu)特征能很好地提高樹種識(shí)別精度。在五類樹種中,樺樹分類精度最低,其他樹種也都有一定程度的錯(cuò)分,落葉松識(shí)別精度最高,考慮原因可能是落葉松為針葉樹種,而其他為闊葉樹,落葉松作為唯一的針葉林,故落葉松有更好的區(qū)分性,說明在對森林類型的分類上點(diǎn)云數(shù)據(jù)也有很好的表現(xiàn)。
以哈爾濱市阿城區(qū)料甸林場為研究區(qū),結(jié)合多光譜數(shù)據(jù)和手持激光雷達(dá)數(shù)據(jù)實(shí)現(xiàn)了研究區(qū)的單木樹種識(shí)別。具體研究結(jié)果如下。
(1)在對點(diǎn)云數(shù)據(jù)進(jìn)行預(yù)處理、歸一化等操作后,對比了分水嶺分割、PCS分割和層堆疊種子點(diǎn)的單木分割結(jié)果精度,結(jié)果表明基于層堆疊生成種子點(diǎn)的單木分割算法精度最高,F值為0.843。
(2)在特征重要性排序中,點(diǎn)云高度變量比光譜特征、紋理特征和強(qiáng)度變量重要性更高,說明其在樹種識(shí)別中有很大的應(yīng)用前景。
(3)基于不同的數(shù)據(jù)組合方式的樹種識(shí)別,加入雷達(dá)數(shù)據(jù)后的樹種識(shí)別精度較僅使用多光譜數(shù)據(jù)的樹種識(shí)別精度提高了10.42%,而基于不同森林類型之間的區(qū)分比樹種分類效果更好。