張曉羽 李鳳日 甄貞 趙穎慧
(東北林業(yè)大學(xué),哈爾濱,150040)
?
基于隨機森林模型的陸地衛(wèi)星-8遙感影像森林植被分類1)
張曉羽李鳳日甄貞趙穎慧
(東北林業(yè)大學(xué),哈爾濱,150040)
摘要以黑龍江省漠河縣為研究區(qū)域,采用陸地衛(wèi)星-8遙感影像為數(shù)據(jù)源,結(jié)合影像的光譜信息和數(shù)字高程模型輔助數(shù)據(jù),分別采用最大似然分類法(MLC)和隨機森林模型法(RFM)對研究區(qū)森林植被進(jìn)行分類,并分析和評價光譜特征變量對模型的重要性、2種分類方法對森林植被類型分類的適用性。結(jié)果表明:隨機森林分類方法的總體分類精度為81.65%、卡帕(Kappa)系數(shù)為0.812。與傳統(tǒng)的MLC方法相比,RFM法均提高了3種森林類型的生產(chǎn)者精度和使用者精度,其中針闊混交林精度提高最多。通過分析特征變量的重要性,發(fā)現(xiàn)高程、歸一化植被指數(shù)、紅光波段、近紅外波段、短波紅外波段對模型分類精度有較重要的影響。說明隨機森林模型方法結(jié)合多源信息是森林植被類型遙感分類的一種有效手段。
關(guān)鍵詞隨機森林模型法;陸地衛(wèi)星-8遙感影像;森林植被分類
森林植被分類研究,在保護(hù)并合理的利用森林植被資源、對促進(jìn)生態(tài)系統(tǒng)的可持續(xù)發(fā)展、維持國家和區(qū)域性的生態(tài)安全都具有重要的作用。通過結(jié)合遙感數(shù)據(jù)和一些機器分類算法,如最大似然、神經(jīng)網(wǎng)絡(luò)、決策樹等進(jìn)行森林植被的分類,是諸多學(xué)者致力于研究的問題。然而,傳統(tǒng)的分類方法存在著分類精度低、分類速度慢和難處理大數(shù)據(jù)等問題,為解決上述問題,隨機森林分類法得到了廣泛的應(yīng)用。
隨機森林法是近年來一種比較流行的分類技術(shù),是一種新型高效的組合分類器,優(yōu)越性遠(yuǎn)勝于傳統(tǒng)的分類方法[1]。在國外,應(yīng)用隨機森林做遙感圖像分類的研究起步較早,M. Pal[2]等以陸地探測衛(wèi)星系統(tǒng)(Landsat ETM+)多光譜圖像為數(shù)據(jù)源,利用隨機森林分類法對土地覆蓋進(jìn)行分類,并與迭代算法、集成學(xué)習(xí)算法、支持向量機分類算法在分類精度和分類速度等方面比較優(yōu)劣性,實驗表明隨機森林法更具有優(yōu)勢,是一種很好的遙感圖像分類算法。P. O. Gislason et al[3]將隨機森林用于多光譜數(shù)據(jù)和數(shù)字高程模型(DEM)、坡度、坡向等對多元數(shù)據(jù)進(jìn)行土地覆蓋分類,并與分類和回歸樹決策樹法相比較,得出隨機森林在精度上優(yōu)于決策樹。隨機森林用于陸地衛(wèi)星和高光譜數(shù)據(jù)與地理和紋理輔助數(shù)據(jù)組成多元數(shù)據(jù)對土地覆蓋進(jìn)行分類;還有,對樹種的分析等[4-12]實驗表明,隨機森林表現(xiàn)出了對噪聲的不敏感性、分類更快更穩(wěn)定的特點[13-14]。近幾年,國內(nèi)也有一些學(xué)者應(yīng)用隨機森林對遙感圖像分類[15-18],但目前將隨機森林方法與高程、坡度數(shù)據(jù)組成多元數(shù)據(jù)進(jìn)行林業(yè)調(diào)查,包括樹種識別的研究較少。本文以陸地衛(wèi)星-8遙感影像為數(shù)據(jù)源,結(jié)合光譜特征以及DEM輔助特征構(gòu)建隨機森林模型,對黑龍江省漠河縣森林植被進(jìn)行分類,并與傳統(tǒng)的最大似然分類法(MLC)進(jìn)行精度的對比分析,同時對分類模型的參數(shù)和變量重要性進(jìn)行評價與分析,探討基于多源信息的隨機森林模型在森林植被分類上應(yīng)用的可行性。
1研究區(qū)概況
漠河縣位于黑龍江省西北部(見圖1),是中國最北且全年氣溫最低的縣。地理坐標(biāo)為北緯52°10′~53°33′,東經(jīng)121°07′~124°20′,全縣總面積18 367 km2,屬于寒溫帶大陸性季風(fēng)氣候。由于大陸及海洋季風(fēng)交替影響,冬季氣候寒冷、干燥而漫長;夏季雨量充沛且降水集中,日照時間長,氣候濕熱;春季降雨量偏少,干旱,多為大風(fēng)天氣,易發(fā)生森林火災(zāi);秋季常因為氣溫驟降而有大面積的凍害發(fā)生。該區(qū)域受地理和氣候條件的影響,土層薄,植物生長周期短;野生植物種類相對較少,主要喬木樹種有興安落葉松(Larixgmelini(Rupr.))、樟子松(PinussylvestrisL. var.mongolicaLitv)、白樺(BetulaplatyphyllaSuk)、楊樹(Populusspp.)、柳樹(Salixspp.)等;土壤主要為森林土、草甸土和沼澤土。
圖1 研究區(qū)示意圖
2研究方法
本研究基于光譜特征和地形特征等變量構(gòu)建隨機森林模型,對漠河縣森林植被類型進(jìn)行分類,并將分類結(jié)果與傳統(tǒng)的最大似然法進(jìn)行分類精度比較。針對隨機森林樹數(shù)量和特征變量數(shù)量的選擇問題、各變量對分類精度的重要性等進(jìn)行系列分析,具體流程見圖2。
圖2 研究方法流程圖
2.1特征提取
首先考慮到陸地衛(wèi)星-8遙感影像的特點,充分利用1~7波段的光譜信息;并考慮到植被指數(shù)可以反映不同的植被類型,且比單波段信息監(jiān)測植被更為穩(wěn)定,以及研究區(qū)處于山區(qū)地形的多樣化,選用3種具有代表性的植被指數(shù):歸一化植被指數(shù)(NDVI)、比值植被指數(shù)(RVI)、差值植被指數(shù)(DVI)和地形因子的高程、坡度、坡向共13個分類特征。
光譜特征提取:本研究分類的地物類型,除非林地外都屬于植被類型。為能準(zhǔn)確區(qū)分非林地、林地以及各種不同的植被類型,選取3種植被指數(shù)作為遙感圖像分類的特征量進(jìn)行分類實驗。植被指數(shù)是從多光譜遙感圖像中獲取的,是一種對植被的生長狀況、覆蓋程度以及生物量等具有一定指示意義的數(shù)值。選定RVI、DVI、NDVI為特征量,原因:NDVI是目前在使用遙感圖像進(jìn)行植被分類研究中最廣泛應(yīng)用的植被指數(shù),是植被生長狀態(tài)和植被覆蓋度最佳指示因子;RVI在植被生長茂盛、植被覆蓋率較高時對植被更為敏感,對于綠色植被類型,RVI值較高,對非林地如裸地和水體等RVI值較低;DVI對土壤背景變化極為敏感,適用于植被發(fā)育早中期或植被覆蓋率較低的植被監(jiān)測[19]。
DEM及輔助因子的提?。篋EM是進(jìn)行二維地形空間模擬的基礎(chǔ),DEM可以派生出多種地形因子,其中坡度、坡向、高程作為其中最重要的地形因子可以被合理的應(yīng)用到植被分布研究中。坡度一般是指過地表面任一點的切平面與水平地面的夾角,表示地表面在該點的傾斜程度;坡向為地表面上任一點的切平面的法線矢量在水平面投影,與過該點的正北方向的夾角;高程為地面上任意一點的海拔高度。本此研究以ArcGIS軟件為平臺,以漠河縣的DEM數(shù)據(jù)為基礎(chǔ),利用其空間分析模塊,執(zhí)行命令面分析;再由坡度和坡向函數(shù)實現(xiàn)地形因子的提取。
2.2分類系統(tǒng)的建立
主要根據(jù)黑龍江省大區(qū)域土地利用類型和主要林分類型,考慮到陸地衛(wèi)星-8遙感影像的可分程度及漠河縣二類調(diào)查森林植被類型的具體情況,將研究區(qū)的土地利用類型主要分為林地和非林地。由于本研究主要針對林地進(jìn)行研究,最終將非林地剔除,所以將林地分為闊葉林、針葉林和針闊混交林;將非林地暫且劃分為居民地、水體、道路、農(nóng)田等。
2.3分類方法
隨機森林基本原理:隨機森林由Leo Breiman于2011年提出。它通過逐步引導(dǎo)重采樣技術(shù),從原始訓(xùn)練樣本集中有放回的重復(fù)隨機抽取N個樣本,生成新的訓(xùn)練樣本集合;然后,根據(jù)自助樣本集生成k個分類樹,組成隨機森林;新數(shù)據(jù)的分類結(jié)果,按分類樹投票多少形成的分?jǐn)?shù)而定。由于隨機森林是由多棵分類和回歸樹決策樹組合構(gòu)成的新型機器學(xué)習(xí)算法[20],所以其實質(zhì)是對決策樹算法的一種改進(jìn);單棵樹的分類能力可能很小,將多個決策樹合并在一起,每棵樹的建立依賴于一個獨立抽取的樣品,森林中的每棵樹具有相同的分布,分類誤差取決于每一棵樹的分類能力和它們之間的相關(guān)性。特征選擇,采用隨機的方法去分裂每個節(jié)點,然后比較不同情況下產(chǎn)生的誤差。能夠檢測到的內(nèi)在估計誤差、分類能力和相關(guān)性,決定選擇特征的數(shù)目。
隨機森林具體實現(xiàn)過程:①首先采用逐步引導(dǎo)抽樣技術(shù)從原始數(shù)據(jù)集中抽取N個訓(xùn)練集,每個訓(xùn)練集的大小約為原始數(shù)據(jù)集的2/3。②為每個訓(xùn)練集分別建立回歸樹,產(chǎn)生由N棵決策樹組成的森林;在每棵樹生長過程中,從全部M個特征變量中隨機選取m個(m≤M),在這m個屬性中根據(jù)基尼(Gini)指數(shù)最小原則選出最優(yōu)屬性進(jìn)行內(nèi)部節(jié)點分支,使每棵樹充分生長,通常不進(jìn)行剪枝操作。③最后集合N棵決策樹的預(yù)測結(jié)果,采用投票的方式?jīng)Q定新樣本的類別。④每次抽樣,約有1/3的數(shù)據(jù)未被抽中,這部分?jǐn)?shù)據(jù)通常稱為袋外數(shù)據(jù)(OOB);利用袋外數(shù)據(jù)進(jìn)行內(nèi)部誤差估計,產(chǎn)生OOB誤差,OOB被用來預(yù)測分類的正確率。
本文隨機森林算法通過Weka軟件中的隨機森林模塊和R軟件平臺實現(xiàn)。首先選取訓(xùn)練樣本感興趣區(qū)域,對于遙感圖像存為TIFF格式。通過調(diào)用Weka庫中的訓(xùn)練分類器,分別設(shè)置生長樹的數(shù)量(N)和特征變量的數(shù)量(m),建立隨機森林模型。然后,利用Gdal軟件讀取TIFF格式待分類遙感圖像每個像元的所有波段的信息,將其轉(zhuǎn)換為隨機森林模型所需要的ARFF格式的文件類型,使用分類方法對遙感影像進(jìn)行分類,并存儲分類結(jié)果在遙感圖像處理平臺中顯示。在該算法分類過程中,通常只需要設(shè)定2個參數(shù),生長樹的數(shù)量(N)和節(jié)點分裂時輸入特征變量的數(shù)量(m);通過本次研究發(fā)現(xiàn),當(dāng)N≥400時,各分類情況OOB誤差趨于穩(wěn)定,且由于前面的采樣過程為隨機采樣,保證了隨機性;所以,即使不對其進(jìn)行剪枝,也不會出現(xiàn)過擬合現(xiàn)象。
最大似然分類法:又稱貝葉斯分類,是經(jīng)常使用的監(jiān)督分類方法之一,而且被認(rèn)為是一種穩(wěn)定性最好的分類器[21]。它是通過求出每個像素對于各類別歸屬概率,把該像素分到歸屬概率最大的類別中的方法。最大似然分類使用高斯概率密度函數(shù)。簡單說,最大似然分類法是通過計算樣本的統(tǒng)計值得到概率密度函數(shù)值,在實際應(yīng)用中,最大似然分類是分類精度最高的分類器之一。
2.4數(shù)據(jù)處理
遙感數(shù)據(jù)源:采用的光譜數(shù)據(jù)是美國陸地衛(wèi)星-8于2013年6月獲取的3景漠河縣遙感影像,LC81220232013173LGN00、LC81220242013144LGN00、LC81230232013244LGN00,空間分辨率為30 m,3幅影像數(shù)據(jù)成像質(zhì)量均良好且清晰無云覆蓋。
輔助數(shù)據(jù):另外選取漠河縣界矢量數(shù)據(jù),美國太空總署(NASA)和國防部國家測繪局(NIMA)聯(lián)合測量的SRTM3地形數(shù)據(jù),分辨率為90 m、投影為坐標(biāo)UTM WGS84以及2010年森林資源二類調(diào)查數(shù)據(jù)。調(diào)查內(nèi)容主要包括各類林地的面積、權(quán)屬、森林覆蓋率、林木蓄積、株數(shù)和與森林資源有關(guān)的自然地理環(huán)境、生態(tài)環(huán)境因素,以及2010年8月布設(shè)的用于檢驗分類精度的255塊固定樣地數(shù)據(jù),樣地每塊面積為0.06 hm2,按8 km×8 km間距布設(shè);調(diào)查信息主要包括樹種組成、優(yōu)勢樹種名稱、胸徑、樹高、郁閉度和土壤信息等。各林分類型固定樣地數(shù)量:針葉林108塊、闊葉林93塊、針闊混交林54塊(見圖3)。
數(shù)據(jù)預(yù)處理:遙感影像預(yù)處理主要是對圖像中無關(guān)信息進(jìn)行消除,恢復(fù)可用的真實信息,最大限度地簡化數(shù)據(jù),增強可用信息的可檢測性,從而改進(jìn)特征識別,提高提取的可靠性[22]。本文使用的陸地衛(wèi)星-8數(shù)據(jù)已經(jīng)具有UTM-WGS84投影,所以需要在遙感圖像處理平臺中對其進(jìn)行輻射定標(biāo)、利用大氣校正模塊進(jìn)行大氣校正,圖像裁剪和鑲嵌,最后利用革蘭氏施密特頻譜銳化(Gram-Schmidt Spectral Sharpening)融合方法對多光譜和全色影像進(jìn)行圖像融合處理。
3結(jié)果與分析
3.1分類精度檢驗
依照本文的分類系統(tǒng),分別通過最大似然和隨機森林模型對研究區(qū)各種地物類型進(jìn)行分類,得到研究區(qū)的初步分類圖。然后通過分類后處理的方法包括將聚類和剔除非林地等,得到研究區(qū)的分類結(jié)果(見圖4),利用漠河縣的255個固定樣地點對其進(jìn)行精度檢驗。
圖3 固定樣地分布圖
(a)最大似然分類法(b)隨機森林分類法
圖42種分類方法的分類結(jié)果比較
為了對2種分類方法的分類精度進(jìn)行定量評價,分別計算總體精度、卡帕(Kappa)系數(shù)、3種植被類型的使用者精度和生產(chǎn)者精度(見表1)。與傳統(tǒng)的最大似然法相比,隨機森林分類法的總體精度為81.15%,提高了6.09%;Kappa系數(shù)為0.812,提高了1.8%;另外,2種分類方法對針葉林的識別度均較高,其次為闊葉林,但是對針闊混交林的識別程度最低,這與針闊混交林的構(gòu)成復(fù)雜性有關(guān),造成光譜特征易被混淆。針葉林、闊葉林、針闊混交林的生產(chǎn)者精度,分別提高了2.87%、1.24%、4.1%;使用者精度分別提高了4.15%、6.67%、5.55%。由此可見,基于植被指數(shù)和地形因子的隨機森林分類法,比最大似然法分類精度都有明顯的提高,隨機森林相對于最大似然分類法有更好的分類效果。
表1 2種分類方法分類精度的對比
3.2生長樹和特征變量數(shù)量對分類精度的影響
在隨機森林模型分類中,生長樹的數(shù)量和特征變量的數(shù)量對分類結(jié)果有影響。本試驗中,首先固定生長樹的數(shù)量為100,將特征變量的數(shù)量由1~10進(jìn)行分類,得到在生長樹數(shù)量固定條件下,隨著特征變量數(shù)量的改變,總體的分類精度也隨之變化(見表2)。當(dāng)特征變量數(shù)量為3和4時,與特征變量數(shù)量為5(最優(yōu)參數(shù))的總體分類精度較相近,說明分類精度對特征變量數(shù)量的設(shè)置并不特別敏感,無特別大影響。當(dāng)設(shè)置特征變量數(shù)量為5時,將生長樹的數(shù)量分別設(shè)定為1、5、10、50、100、200、400、800、1000進(jìn)行試驗,得到分類精度結(jié)果(見表3)。由表3可見,隨著生長樹數(shù)量的增加,分類精度呈上升的趨勢,當(dāng)生長樹數(shù)量為800或1000時,總體分類精度較高且浮動不大,趨于穩(wěn)定。
3.3特征變量重要性
對于多源數(shù)據(jù)的分類,在各種不同類型特征變量數(shù)量較多時,需要了解這些特征變量對分類結(jié)果的貢獻(xiàn),以便挑選出較重要的特征變量。隨機森林通??商峁?種特征變量重要性度量,其中OOB平均下降精度、Gini指數(shù)平均下降精度為最常用的2個測度。根據(jù)Gini指數(shù)和OOB估計計算特征變量重要性(見表4)。
表2 生長樹為100棵時分類精度隨特征變量數(shù)量的變化
表3 特征變量為5時分類精度隨生長樹數(shù)量的變化
表4 Gini指數(shù)、OOB估計計算特征變量的重要性
從Gini指數(shù)看,對分類結(jié)果有較重要影響的是高程、5波段、6波段、7波段、歸一化植被指數(shù)、3波段、坡度等;從OOB誤差估計看,貢獻(xiàn)性較大的特征變量,依次是歸一化植被指數(shù)、高程、4波段、6波段、7波段、比值植被指數(shù)、5波段,各種變量的重要性幾乎與上一種結(jié)果相同,只是重要性順序有差別;說明這2種計算特征變量重要性的方法是比較可靠的。另外,結(jié)合研究區(qū)地物類型分布的實際情況分析,研究區(qū)處于山區(qū)位置,地形起伏較大,所以高程特征變量的重要程度較高;又由于研究區(qū)內(nèi)森林植被類型豐富,其中又包括水體、裸地,所以紅光波段、近紅外波段、短波紅外波段、NDVI的重要性較高,這都與實際情況相符合。綜合以上分析,在隨機森林分類的過程中,盡量選擇能夠識別樣本間差異的特征,選擇與研究區(qū)所在地理位置相關(guān)的地形信息,根據(jù)最優(yōu)的特征變量進(jìn)行分類,不僅可以提高分類速度,還可以提高分類精度。
4結(jié)論與討論
本研究結(jié)合黑龍江省漠河縣陸地衛(wèi)星-8遙感影像光譜特征和地形特征,通過建立隨機森林模型分類法和最大似然分類法對森林植被類型進(jìn)行分類,對比2種方法的分類結(jié)果,結(jié)果表明:隨機森林分類法在中高分辨率的遙感影像植被分類中,比最大似然法更具優(yōu)勢,分類速度快、精度高,是一種有效的分類方法。
研究了隨機森林參數(shù)設(shè)置對分類精度的影響程度,結(jié)果表明:分類精度對參數(shù)設(shè)置不敏感,通常情況下,使用默認(rèn)參數(shù),即可達(dá)到理想的分類效果,如果選擇適當(dāng)?shù)哪P蛥?shù)可獲得更好的分類結(jié)果。
另外,也對隨機森林不同特征變量的重要性和隨機森林計算特征變量重要性的可靠性與實用價值進(jìn)行了研究,結(jié)果表明:隨機森林不同的特征變量對模型的貢獻(xiàn)程度不同,對分類精度有不同的影響,計算的特征變量重要性可靠,且篩選重要特征變量后的分類精度較之前有所提高,模型訓(xùn)練時間縮短,具有很好的實用價值。
本研究尚存在缺陷:首先考慮到本次研究使用的陸地衛(wèi)星-8遙感影像的分辨率和波段數(shù)量的限制;其次,在訓(xùn)練樣本的選擇上,由于缺少足夠的實地調(diào)查信息以及判讀者的局限性,進(jìn)而影響分類樣本的準(zhǔn)確選取;另外,研究區(qū)處于山區(qū),地形復(fù)雜,只是簡單的結(jié)合3種典型的植被指數(shù)(如RVI、DVI、NDVI)和由DEM提取的高程、坡度、坡向輔助數(shù)據(jù)作為特征變量構(gòu)建隨機森林模型,也具有一定的局限性。此外,想要取得更高的分類精度,在今后的研究中需要使用高分辨率的高光譜影像,并結(jié)合影像的紋理特征和幾何特征構(gòu)建更精確的隨機森林分類模型,對森林植被類型作進(jìn)一步的細(xì)化,這是值得進(jìn)一步研究的方向。
參考文獻(xiàn)
[1]BERIMAN L. Random forests[J]. Machine Learning,2001,45(1):5-32.
[2]PAL M. Random forest classifier for remote sensing classification[J]. International Journal of Remote Sensing,2005,26(1):217-222.
[3]GISLASONPO,BENEDIKTSSONJA,SVEINSSONJR.Randomforestsforlandcoverclassification[J].PatternRecognitionLetters,2003,27(4):294-300.
[4]CAO L, COOPS N C, INNES J L, et al. Tree species classification in subtropical forests using small-footprint full-waveform LIDAR data[J]. International Journal of Applied Earth Observation and Geoinformation,2016,49:39-51.doi:10.1016/j.jag.2016.01.007.
[5]JUEL A, GROOM G B, SVENNING J C, et al. Spatial application of Random Forest models for fine-scale coastal vegetation classification using object based analysis of aerial orthophoto and DEM data[J]. International Journal of Applied Earth Observation and Geoinformation,2015,42:106-114.
[6]OTHMANI A, VOON L F C L Y, STOLZ C, et al. Single tree species classification from Terrestrial Laser Scanning data for forest inventory[J]. Pattern Recognition Letters,2013,34(16):2144-2150.
[7]DALPONTE M, BRUZZONE L, GIANELLE D. Tree species classification in the Southern Alps based on the fusion of very high geometrical resolution multispectral/hyperspectral images and LiDAR data[J]. Remote Sensing of Environment,2012,123(3):258-270.
[8]IMMITZER M, ATZBERGER C, KOUKAL T. Tree Species Classification with Random Forest Using Very High Spatial Resolution 8-Band WorldView-2 Satellite Data[J]. Remote Sensing,2012,4(9):2661-2693.
[9]RODRIGUEZ-GALIANO V F, CHICA-OLMO M, ABARCA-HERNANDEZ F, et al. Random Forest classification of Mediterranean land cover using multi-seasonal imagery and multi-seasonal texture[J]. Remote Sensing of Enviroment,2012,121:93-107.
[10]RODRIGUEZ-GALIANO V F, GHIMIRE B, ROGAN J, et al. An assessment of the effectiveness of a random forest classifier for land-cover classification[J]. ISPRS Journal of Photogrammetry and Remote Sensing,2012,67(1):93-104.
[11]HAM J, CHEN Y, CRAWFORD M M, et al. Investigation of the random forest framework for classification of hyperspectral data[J]. IEEE Transactions on Geoscience & Remote Sensing,2005,43(3):492-501.
[12]NAIDOO L, CHO M A, MATHIEU R, et al. Classification of savanna tree species, in the Greater Kruger National Park region, by integrating hyperspectral and LiDAR data in a Random Forest data mining environment[J]. ISPRS Journal of Photogrammetry & Remote Sensing,2007,307(1/2/3):62-70.
[13]MIAO X, HEATON J S, ZHENG S, et al. Applying tree-based ensemble algorithms to the classification of ecological zones using multi-temporal multi-source remote-sensing data[J]. International Journal of Remote Sensing,2012,33(6):1823-1849.
[14]CLARK M L, ROBERTS D A. Species-level differences in hyperspectral metrics among tropical rainforest trees as determined by a d tree-base classifier[J]. Remote Sensing,2012,4(12):1820-1855.
[15]馬玥,姜琦剛,孟治國,等.基于隨機森林算法的農(nóng)耕區(qū)土地利用分類研究[J].農(nóng)業(yè)機械學(xué)報,2016,47(1):297-303.
[16]黃婷,趙自明.基于隨機森林和MR8濾波器的圖像分類研究[J].嘉應(yīng)學(xué)院學(xué)報(自然科學(xué)版),2015,33(2):26-32.
[17]劉海娟,張婷,侍昊,等.基于RF模型的高分辨率遙感影像分類評價[J].南京林業(yè)大學(xué)學(xué)報(自然科學(xué)版),2015,39(1):99-103.
[18]王棟,岳彩榮,田傳召,等.基于隨機森林的大姚縣TM遙感影像分類研究[J].林業(yè)調(diào)查規(guī)劃,2014,39(2):1-5.
[19]潘琛,杜培軍,羅艷,等.一種基于植被指數(shù)的遙感影像決策樹分類方法[J].計算機應(yīng)用,2009,29(3):777-780,797.
[20]方匡南,吳見彬,朱建平,等.隨機森林方法研究綜述[J].統(tǒng)計與信息論壇,2011,26(3):32-38.
[21]ZHENG Mingguo, CAI Qianguo, QIN Mingzhou. The Effect of Prior Probabilities in the Maximum Likelihood Classification on Individual Classes[J]. Photogrammetric Engineering & Remote Sensing,2009,75(9):1109-1117.
[22]王玉麗,馬震.應(yīng)用ENVI軟件目視解譯TM影像土地利用分類[J].現(xiàn)代測繪,2011,34(1):11-13.
Forest Vegetation Classification of Landsat8 Remote Sensing Image Based on Random Forests Model
Zhang Xiaoyu, Li Fengri, Zhen Zhen, Zhao Yinghui
(Northeast Forestry University, Harbin 150040, P. R. China)//Journal of Northeast Forestry University,2016,44(6):53-57,74.
Taking Mohe County of Heilongjiang Province as study area, with the Landsat8 remote sensing images as data source, and the spectral signatures of the image and DEM as additional data, we classified the types of forest vegetation based on classification method of the Maximum Likelihood Classifier (MLC) and random forest model (RFM). We analyzed the importance of the characteristics variables of the spectral for the model, and evaluated the suitability of two methods in forest vegetation classification. The overall classification accuracy and the Kappa coefficient of RFM were 81.65% and 0.812, respectively. Compared with the MLC method, the RFM method improved the user accuracy and production accuracy for three forest types. By analyzing the importance of the variables, elevator, NDVI, red band, NIR band, and short wave IR band played an important role in classification accuracy. Therefore, the RFM based on multiply types of data is a fast and effective method in the classifications of forest vegetation types.
KeywordsRandom forest model (RFM); Landsat8 remote sensing image; Forest vegetation classification
第一作者簡介:張曉羽,女,1989年2月生,東北林業(yè)大學(xué)林學(xué)院,碩士研究生。E-mail:949205203@qq.com。 通信作者:趙穎慧,東北林業(yè)大學(xué)林學(xué)院,副教授,E-mail:zyinghui0925@126.com。
收稿日期:2015年11月23日。
分類號S757.2;S771.8;TP751
1)科技部科技基礎(chǔ)性工作專項項目(2013FY111600-7)。
責(zé)任編輯:張玉。