王婷 北方民族大學(xué)
基于隨機(jī)森林的高光譜遙感圖像分類
王婷 北方民族大學(xué)
針對(duì)高光譜遙感圖像分類精度較低的問題,本文提出了基于隨機(jī)森林的分類算法,首先采用主成分分析法對(duì)高光譜遙感數(shù)據(jù)進(jìn)行降維,并在降維后形成的主成分空間中利用隨機(jī)森林分類器進(jìn)行分類。為了反映該分類算法在高光譜遙感數(shù)據(jù)方面的優(yōu)越性,分別與支持向量機(jī)(SVM)、隨機(jī)森林(RF)進(jìn)行對(duì)比分析。實(shí)驗(yàn)結(jié)果表明,基于主成分空間的隨機(jī)森林分類模型對(duì)分類具有較高的準(zhǔn)確率和較優(yōu)的效率。
高光譜遙感圖像 主成分分析 隨機(jī)森林 機(jī)器學(xué)習(xí)
由于高光譜圖像的波段數(shù)量較多且波段間相關(guān)性較高,圖像光譜信息所包含的高維特征集,反而可能會(huì)導(dǎo)致分類精度隨著特征維度的過分增長而呈現(xiàn)下降趨勢(shì),因此一般會(huì)通過降維或特征波段選擇的方式選取有限的波段來參與分類識(shí)別。主成分分析(PCA)是通過數(shù)學(xué)變換將多波段的圖像信息壓縮到比原波段更有效的少數(shù)幾個(gè)轉(zhuǎn)換波段,降低特征的維數(shù),減少波段之間的冗余,以廣泛應(yīng)用于高光譜圖像處理中。隨機(jī)森林(RF)是一個(gè)以決策樹為基礎(chǔ)分類器的集成分類器。其分類表現(xiàn)優(yōu)異,能提供在當(dāng)前流行的同類算法中頂級(jí)的準(zhǔn)確性,能在類大小分布不平衡的情況下保持分類誤差平衡,而且有非??斓倪\(yùn)算速度。
2.1 主成分分析
2.2 隨機(jī)森林
圖1 肯尼迪航天中心數(shù)據(jù)集
RF是基于CART決策樹的組合分類器。首先,從給定的訓(xùn)練集通過多次隨機(jī)的可重復(fù)的采樣得到多個(gè)bootstrap數(shù)據(jù)集并對(duì)每個(gè)數(shù)據(jù)集構(gòu)造一棵決策樹。在每個(gè)葉節(jié)點(diǎn)處通過統(tǒng)計(jì)訓(xùn)練集中達(dá)到此葉節(jié)點(diǎn)的分類標(biāo)簽的直方圖經(jīng)驗(yàn)的估計(jì)此葉節(jié)點(diǎn)上的類分布。一直迭代到用戶設(shè)定的最大樹深度或者直到不能通過繼續(xù)分割獲取更大的信息增益為止。在分類預(yù)測(cè)階段,對(duì)一個(gè)輸入樣本迭代地根據(jù)訓(xùn)練得到的RF中的各個(gè)決策樹進(jìn)行或左或右的分支,直到各決策樹的葉節(jié)點(diǎn),各個(gè)葉節(jié)點(diǎn)的類分布就是這棵樹的分類結(jié)果。通過(3)式平均各棵樹的葉節(jié)點(diǎn)上的分類分布就得到了整個(gè)隨機(jī)森林的對(duì)此輸入樣本的分類結(jié)果。
其中T是森林中樹的數(shù)目,c是某一個(gè)特定的類,P是概率函數(shù)。
本文采用AVIRIS獲取的美國佛羅里達(dá)州肯尼亞中心實(shí)驗(yàn)區(qū)高光譜遙感圖像。圖像大小為614*512像素,空間分辨率18m,如圖1所示。
本文步驟:對(duì)原始高光譜遙感圖像數(shù)據(jù)進(jìn)行主成分分析,將原始數(shù)據(jù)投影到主成分方向上;在主成分空間中隨機(jī)選取70%訓(xùn)練樣本訓(xùn)練隨機(jī)森林分類器。其余30%作為測(cè)試樣本。通過實(shí)驗(yàn),對(duì)SVM、RF、PCA-RF三種算法進(jìn)行對(duì)比分析,分類結(jié)果如表1所示:
表1 分類結(jié)果
從表1的結(jié)果中可得:RF分類精度明顯優(yōu)于SVM,但兩種算法運(yùn)行時(shí)間相當(dāng)。本文提出的算法分類精度優(yōu)于RF算法,提高了0.62個(gè)百分點(diǎn);與此同時(shí)算法時(shí)間也比RF快3.25s。實(shí)驗(yàn)結(jié)果表明本文算法能夠有效的提升高光譜遙感圖像分類的精度。
[1]張良培,張立福.高光譜遙感[M].北京:測(cè)繪出版社,2011
[2]Prasad S, Bruce L M. Limitations of principal components analysis for hyperspectral target recognition[J]. IEEE Geoscience and Remote Sensing Letters, 2008, 5( 4) : 625—629
[3]雷震,隨機(jī)森林及其在遙感影像處理中應(yīng)用[D].上海交通大學(xué),2012
[4]陳佩.主成分分析法研究及其在特征提取中的應(yīng)用[D].陜西師范大學(xué),2014
[5]王書民,張愛武,胡少興.基于隨機(jī)森林算法的航空高光譜數(shù)據(jù)分類方法研究[J].科學(xué)技術(shù)與工程,2016,21(6):83-87
[6]Pal, M. Random forests for land cover classification[J]. IEEE, 2003
王婷(1992—),女,漢族,甘肅慶陽人,工學(xué)碩士,單位:北方民族大學(xué)計(jì)算機(jī)學(xué)院軟件工程專業(yè),研究方向:遙感圖像處理。