謝天義 潘潔 孫玉琳 鄭光
(南京林業(yè)大學,南京,210037) (南京大學)
In order to explore the main remote sensing information affecting forest tree species classification, the difference of tree species classification based on different dimension information were analyzed. The research object is the forest tree species in the natural forest area of Panther Creek in the southeast of Portland, Oregon, United States. The principal component analysis and ant colony optimization method were used to select the feature bands, texture features and vegetation indexes of airborne hyperspectral images. The LiDAR data were used to extract the vertical structure parameters of forests, and the random forest method was used to classify tree species. The results showed that the average classification accuracy using one-dimensional information was 69.86%, of which the classification accuracy using texture features was the highest (77.40%), and the classification accuracy using vertical structure parameters was the lowest (62.44%). The average classification accuracy of two-dimensional information combination was 79.68%, and the classification accuracy of hyperspectral feature band and texture feature combination was the highest. The average classification accuracy of three-dimensional information combination was 85.00%, and the classification accuracy of hyperspectral feature band, texture feature and vegetation index was the highest. The classification accuracy of all four-dimensional information was higher than that of one-dimensional, two-dimensional and three-dimensional information, and the classification accuracy was 89.20%. It can be seen that collaborative multi-dimensional remote sensing information can effectively improve the classification accuracy of forest tree species, among which texture information and feature spectrum information extracted from hyperspectral data play an important role in forest tree species classification, while the collaborative vertical structure information further improves the accuracy of forest tree species classification.
森林是陸地生態(tài)系統(tǒng)的重要組成部分,對維持生態(tài)過程和維護生態(tài)平衡起著至關(guān)重要的作用[1-2]。森林樹種結(jié)構(gòu)與分布則是森林資源可持續(xù)經(jīng)營管理、森林生態(tài)系統(tǒng)服務(wù)評估以及生物多樣性維護的基礎(chǔ)[3-5]。
遙感作為目前森林資源調(diào)查的主要技術(shù)手段,在森林樹種分類研究中取得了諸多進展。其中,高光譜遙感在地物精細識別中的優(yōu)勢為森林樹種分類精度的提高提供了可能[6]。Richter et al.[7]利用機載高光譜影像采用隨機森林和支持向量機的分類方法,對萊比錫河岸天然林進行樹種分類的精度為78.40%;申鑫等[8]利用LiCHy集成傳感器同期獲取的高空間分辨率和光譜分辨率數(shù)據(jù),通過信息熵原理提取特征變量對4個典型樹種分類的總體精度達到62.90%。
高光譜遙感雖然提供了豐富的光譜信息,但僅限于冠層表面且存在“同譜異物和同物異譜”現(xiàn)象,在一定程度上影響了森林樹種識別的精度。激光雷達(LiDAR)作為一種新型的對地觀測技術(shù),具有主動性、穿透性及可快速大面積地獲取三維信息等特點[9],為獲取森林垂直結(jié)構(gòu)特征提供了可能。吳艷雙等[10]采用機載高光譜和LiDAR數(shù)據(jù)構(gòu)建多特征集合,對廣西高峰林場界牌分場樹種進行分類的精度最高達到83.70%;Zhao et al.[11]結(jié)合機載高光譜和LiDAR數(shù)據(jù)對東北某天然混交林樹種進行分類,平均分類精度達到85.33%。由此可見,結(jié)合LiDAR數(shù)據(jù)提取的垂直信息和高光譜影像數(shù)據(jù)的光譜信息能夠?qū)崿F(xiàn)優(yōu)勢互補,在提高森林樹種識別精度方面具有巨大潛力[12]。
隨機森林是一種非參數(shù)分類算法,近年來被廣泛應(yīng)用于樹種分類。Pu et al.[13]應(yīng)用美國佛羅里達坦帕市5個季節(jié)性高分辨率衛(wèi)星影像對該地區(qū)樹種分類,隨機森林(RF)分類精度優(yōu)于支持向量機(SVM)[13];董彥芳等[14]應(yīng)用機載LiDAR數(shù)據(jù)建立歸一化數(shù)字地表模型(nDSM)結(jié)合機載高光譜影像提取的歸一化植被指數(shù)(NDVI),采用最大似然分類法進行森林樹種分類的精達到84.0%;Shi et al.[15]應(yīng)用高光譜和LiDAR數(shù)據(jù)衍生的光譜和結(jié)構(gòu)特征參數(shù),利用隨機森林分類器對德國某天然林樹種進行分類,分類精度達到83.70%,分類精度遠高于單純使用激光雷達(65.10%)或高光譜(69.30%)數(shù)據(jù)。最大似然分類法雖然擁有簡單、實施方便的優(yōu)點,但這種方法更適合波段數(shù)少的數(shù)據(jù)。支持向量機分類法使用核函數(shù)避免了維數(shù)災(zāi)難的問題;在分類過程中少數(shù)支持向量決定最終結(jié)果,對異常值不敏感,分類更具魯棒性。然而支持向量機分類法難以對大規(guī)模數(shù)據(jù)進行訓練,結(jié)果受設(shè)定的參數(shù)和核函數(shù)影響較大。與前兩者相比,隨機森林分類算法能較好處理高維度數(shù)據(jù)集,更適合多維數(shù)據(jù)的處理,其訓練時不同決策樹之間相互獨立互不干擾,泛化能力強。
本研究以美國俄勒岡州波特蘭市東南部黑豹溪(Panther Creek)流域天然林區(qū)的主要森林樹種為研究對象,充分利用機載高光譜影像與LiDAR數(shù)據(jù),探索光譜信息、空間信息與垂直結(jié)構(gòu)特征協(xié)同作用在森林樹種分類中的應(yīng)用,以期為森林樹種分類提供方法借鑒。
研究區(qū)位于美國俄勒岡州波特蘭市東南部黑豹溪(Panther Creek)流域的天然林區(qū)(123°14′54″~123°19′24″W、45°17′27″~45°17′57″N,見圖1)。波特蘭市兼具地中海氣候和溫帶海洋型氣候的特征,氣候溫和,四季分明,冬季溫暖多雨,夏季炎熱干燥,年平均降水量1 119 mm。該林區(qū)主要森林樹種有花旗松(Pseudotsugamenziesii)、異葉鐵杉(Tsugaheterophylla)、北美喬柏(Thujaplicata)和大葉楓樹(Acermacrophyllum)。
圖1 研究區(qū)分布圖
高光譜數(shù)據(jù)獲取采用CASI-1500緊湊型機載成像光譜儀(加拿大ITRES公司),空間分辨率0.5 m,光譜范圍400~1 000 nm,波段96個;由Cessna Caravan航空飛機搭載,并同時集成實時動態(tài)(RTK)以記錄飛行過程中的位置信息;飛行試驗于2014年9月3—5日,飛行航高為1 310 m。
LiDAR數(shù)據(jù)獲取的飛行時間為2014年9月23日,Cessna Caravan航空飛機搭載了Leica ALS60傳感器,飛行高度為700 m,視場角為30°,Leica ALS60的發(fā)射頻率為112 kHz,激光脈沖波長1 064 nm,平均首次回波密度為13.9點/m2,到達地面激光脈沖直徑17 cm,激光強度為8 bit,最小分辨率平均8脈沖/m2。
光譜數(shù)據(jù)垂直結(jié)構(gòu)信息:利用LiDAR360軟件對LiDAR點云數(shù)據(jù)進行濾波處理后分離地面點和非地面點。對分離的地面點采用不規(guī)則三角網(wǎng)插值法(TIN)[16]生成數(shù)字高程模型(DEM)和數(shù)字表面模型(DSM),并將DSM與DEM進行差值運算得到冠層高度模型(CHM)。由于不同百分位高度(Hp50、Hp75、Hp90和Hp95)信息對樹種分類有重要影響[3],因此,利用CHM進行樹高信息提取,采用DEM提取不同百分位的高度特征,作為垂直結(jié)構(gòu)(VS)信息進行后續(xù)的樹種分類。
特征波段:對高光譜數(shù)據(jù)進行特征波段選擇,可以有效降低數(shù)據(jù)維度,解決數(shù)據(jù)冗余問題。主成分分析(PCA)依據(jù)特征值和貢獻率提取光譜數(shù)據(jù)特征變量,不僅能夠不限融合的波段數(shù)量,同時較完好的保存光譜特征和空間特征[17],當指標間相關(guān)性不顯著時,就要選取較多的主成分,導(dǎo)致主成分分析的降維效果不明顯。人工蟻群(ACO)是一種模擬進化算法,其原理是尋找一種機率型最優(yōu)路徑[18],但人工蟻群易造成局部最優(yōu)解,無法更好地顧及全局。因此,本研究綜合主成分分析和人工蟻群算法,確定最優(yōu)特征波段(COD)。
紋理特征:紋理特征(TF)描述了物體表面周期性變化的表面結(jié)構(gòu)排列屬性和物體之間的空間關(guān)聯(lián)信息,對樹種分類起著重要的作用,利用灰度共生矩陣(GLCM)提取影像不同尺度的紋理特征,能夠提高地物的分類精度[26-27]。TF影像的標準差反應(yīng)了影像各像元灰度值和均值總的離散度,標準差值越大,所包含的信息量越多[28]。本研究應(yīng)用高光譜影像特征波段,采用GLCM,紋理測度值為0°、45°、90°和135°等4個方向的均值,采用3×3、5×5、7×7、…、17×17的窗口梯度,設(shè)置步長為1,提取8個特征值(方差、均值、相關(guān)性、差異性、協(xié)同性、對比度、熵和二階矩)作為紋理特征。
植被指數(shù)(VIS)是利用植被在不同波段的光譜反射特性,通過數(shù)學運算更能突出植被間的細微差異[19]。本研究選取了10個與植被種類區(qū)分密切相關(guān)的植被指數(shù)用于樹種分類[20-25](見表1)。
表1 植被指數(shù)及計算公式
隨機森林(RF)是一種由多個決策樹分類模型集成的分類器,被廣泛應(yīng)用于森林樹種分類研究[29]。隨機森林算法利用靴帶法(boot-strap)重抽樣方法從原始樣本中抽取多個樣本,對每個樣本進行決策樹建模,然后組合多棵決策樹的預(yù)測,采用投票的方式,決策樹投票的眾數(shù)為最終預(yù)測結(jié)果[30]。本研究利用機載LiDAR和高光譜影像數(shù)據(jù),結(jié)合目視解譯進行樣本選擇。從高光譜真彩色影像中提取單木冠幅50個光譜像元,并求其均值作為一個樣本。4種不同樹種各提取500個樣本(花旗松393棵、異葉鐵杉233棵、北美喬柏437棵、大葉楓樹97棵),共計2 000個樣本。隨機篩選各樹種75%的樣本點作為訓練樣本,剩余的25%樣本作為驗證集,對分類結(jié)果進行精度評價。
由圖2、表2可知,通過數(shù)字表面模型(DSM)和數(shù)字高程模型(DEM)的差值運算得到冠層高度模型(CHM),在此基礎(chǔ)上提取Hp95、Hp90、Hp75、Hp50、Hp25、Hp10和Hp5等7個百分位高度(每個像素點內(nèi)95%、90%、70%、50%、25%、10%、5%的高度)。此外,計算平均值差值(不同樹種樹高平均值的差值)并進行顯著性檢驗以分析不同森林樹種在不同垂直高度上的樹高分布差異。
表2 不同樹種間樹高差異
圖2 不同樹種DEM、RGB和CHM顯示圖
3.2.1 特征波段選擇
根據(jù)高光譜影像和LiDAR影像,選取了花旗松、異葉鐵杉、北美喬柏、大葉楓樹等4樹種各200個像元,并提取各樹種的反射光譜曲線。由圖3(A)可知,各樹種間反射率變化趨勢具有很強的相似性,但在特定波段處(500~680、720~790、850~970 nm)存在較為明顯的差異。
利用PCA和ACO分別提取最能區(qū)分樹種間反射特征差異的波段作為特征波段。由圖3(B)可知,主成分權(quán)重系數(shù)局部極值對應(yīng)的波段為差異最顯著波段,PCA方法選擇出7個特征波段,而利用ACO進行局部最優(yōu)路徑解分析,則篩選出26個特征波段。綜合兩種方法的波段選擇結(jié)果,最終在507~977 nm區(qū)域確定12個波段,作為森林樹種分類貢獻顯著的特征波段。
3.2.2 植被指數(shù)提取
由圖3可知,4個樹種的冠層反射率與主成分分析權(quán)重系數(shù)分布清晰,綠峰和紅邊位置反映樹種間的光譜差異明顯。根據(jù)PCA和AOC篩選的特征波段分布(見表3),最終選擇特征波段557 nm和757 nm組成新的植被指數(shù)(SV=B757/B557),新的植被指數(shù)與其他10個植被指數(shù)共同參與后續(xù)的樹種分類。
表3 高光譜影像特征波段選擇
圖3 樹種反射光譜曲線和主成分權(quán)重系數(shù)
由表4可知,隨著移動窗口的增大,影像均值標準差不斷增大。方差、對比度隨移動窗口的增大,呈先增大后減小的趨勢,在5×5窗口處達到最大值;相關(guān)性、差異性、協(xié)同性、熵、二階矩等紋理測度值隨窗口的不斷增大而減??;分類精度窗口5×5最高。因此,本研究選取5×5窗口作為最佳窗口尺寸提取紋理特征。
表4 不同窗口大小下各紋理測度標準差和分類精度表
由表5可知,一維信息進行分類時,分別利用5×5窗口提取的紋理特征、高光譜特征波段、植被指數(shù)和垂直結(jié)構(gòu)參數(shù)進行樹種分類。利用一維信息進行樹種分類的平均精度為69.86%,其中,利用紋理特征進行分類的精度最高為77.40%,特征波段進行分類的精度為71.47%,植被指數(shù)的分類精度為68.55%,垂直結(jié)構(gòu)參數(shù)分類的精度為62.44%。
表5 隨機森林分類結(jié)果
協(xié)同二維信息進行分類,相比于一維信息分類,二維信息分類精度明顯提高,平均精度達到了79.68%。其中,高光譜提取的特征波段和紋理特征組合的分類精度最高為86.40%,紋理特征和植被指數(shù)組合分類精度為85.80%,特征波段和垂直結(jié)構(gòu)組合的分類精度為81.60%,植被指數(shù)和垂直結(jié)構(gòu)組合的分類精度為79.80%,特征波段和垂直結(jié)構(gòu)組合的分類精度為75.80%,而特征波段和植被指數(shù)組合的分類精度僅為68.70%。
協(xié)同三維信息分別進行分類,三維信息組合的分類精度有了更明顯的提升,平均精度達到了85%。其中,僅采用基于高光譜數(shù)據(jù)提取的特征波段、植被指數(shù)、紋理特征組合總體分類精度達到87.20%,垂直結(jié)構(gòu)、植被指數(shù)和紋理結(jié)構(gòu)組合分類精度為87.00%,特征波段、垂直結(jié)構(gòu)和紋理特征組合分類精度為85.40%,特征波段、垂直結(jié)構(gòu)、植被指數(shù)組合總體分類精度僅為79.8%。
協(xié)同四維信息進行分類時的精度遠高于一維、二維與三維信息協(xié)同時的分類精度,分類精度達到了89.20%,與使用高光譜數(shù)據(jù)提取的特征波段、紋理特征和植被指數(shù)相比,加入垂直結(jié)構(gòu)信息后,分類精度提高了2%。
本研究利用機載LiDAR數(shù)據(jù)和高光譜影像數(shù)據(jù),分別提取了垂直結(jié)構(gòu)信息、高光譜特征波段、植被指數(shù)和紋理信息,將信息進行不同維度的組合,采用隨機森林分類器進行了森林樹種分類。結(jié)果表明:(1)機載高光譜數(shù)據(jù)由于同時具備了高的空間分辨率與光譜分辨率,能夠很好地提高森林樹種的分類精度,紋理特征在樹種分類中起到了關(guān)鍵作用;(2)協(xié)同LiDAR數(shù)據(jù)提取的垂直結(jié)構(gòu)信息時,樹種分類的精度提高了2%。由此可見,多維信息協(xié)同作用能夠有效提高森林樹種分類的精度。
樹種識別精度是森林資源調(diào)查關(guān)鍵的指標[11],研究表明高光譜數(shù)據(jù)的光譜特征及其衍生特征在樹種識別上發(fā)揮著積極的作用[33,35-36],而將高光譜數(shù)據(jù)衍生的紋理特征應(yīng)用于樹種分類,達到很好的分類效果[26-27]。同時,機載高光譜數(shù)據(jù)和LiDAR數(shù)據(jù)的結(jié)合能夠大幅度提高樹種分類的精度[37]。本研究中,使用LiDAR數(shù)據(jù)提取的垂直結(jié)構(gòu)信息與高光譜原始波段進行樹種分類的精度并不高(不超過65%),而高光譜數(shù)據(jù)進行適宜的波段選擇后發(fā)展的光譜信息和紋理特征在樹種分類中起到了更重要的作用,垂直結(jié)構(gòu)信息則在充分挖掘高光譜信息的基礎(chǔ)上推動森林樹種分類精度的進一步提高。