秦夢(mèng)宇 趙赫
摘? 要:與傳統(tǒng)的信息提取方法相比,將機(jī)器學(xué)習(xí)算法應(yīng)用到遙感影像信息提取中,可以提高結(jié)果的精度,文章以WorldView-2遙感影像為例,首先利用多尺度分割選取最優(yōu)分割尺度,獲得影像對(duì)象。在基于對(duì)象的基礎(chǔ)上利用特征空間優(yōu)選工具獲得最優(yōu)特征子集,最后利用J48算法、隨機(jī)森林算法對(duì)建筑物提取的效果進(jìn)行分析。實(shí)驗(yàn)結(jié)果表明:J48算法在高分辨率影像建筑物提取中有更好地效果。
關(guān)鍵詞:WorldView-2;面向?qū)ο?J48;隨機(jī)森林;建筑物
中圖分類號(hào):TP751? ? ? ? ?文獻(xiàn)標(biāo)志碼:A? ? ? ? ?文章編號(hào):2095-2945(2020)10-0129-02
Abstract: Compared with the traditional information extraction methods, the application of machine learning algorithm to remote sensing image information extraction can improve the accuracy of the results. Taking WorldView-2 remote sensing image as an example, firstly, the optimal segmentation scale is selected by multi-scale segmentation, and the image object is obtained. On the basis of object-based, the optimal feature subset is obtained by using feature space optimization tool. finally, J48 algorithm and random forest algorithm are used to analyze the effect of building extraction. The experimental results show that J48 algorithm is more effective in building extraction from high-resolution images.
Keywords: WorldView-2; object-oriented; J48; random forest; building
隨著技術(shù)的發(fā)展,遙感影像空間分辨率不斷提高,高分辨率影像的細(xì)節(jié)信息越來越顯著。傳統(tǒng)的基于像元的信息提取方法,偏重于地物的光譜特征,而忽略了例如幾何、紋理、上下文等特征,已經(jīng)不能滿足信息提取的精度要求。近年來,不少學(xué)者對(duì)基于對(duì)象[1-2]的方法進(jìn)行了廣泛研究,證明了該方法從高分辨率影像中提取地物信息的有效性。
與此同時(shí),機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘廣泛地應(yīng)用到了影像信息提取中,其中J48算法[3]與隨機(jī)森林算法[4]最為普遍,本文以瑞典斯德哥爾摩為例,對(duì)比這兩種算法在WorldView-2影像建筑物提取中的效果。
1 數(shù)據(jù)準(zhǔn)備
研究區(qū)地處瑞典的東海岸斯德哥爾摩,斯德哥爾摩所在緯度:59°18'00.00"N,所在經(jīng)度:18°10'00.00"E。本實(shí)驗(yàn)數(shù)據(jù)采用Wordview-2影像,數(shù)據(jù)獲取日期為2016年8月27日,多光譜波段空間分辨率為2米,研究區(qū)大小為1024×1024個(gè)像元。實(shí)驗(yàn)首先在ENVI5.3中對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理,獲得了地表反射率。
2 研究方法
2.1 決策樹J48算法
J.Ross Quinlan對(duì)ID3算法進(jìn)行了改進(jìn),提出了C4.5算法。除了繼承了ID3算法的所有功能以外,決策樹C4.5算法還可以利用信息增益率來選擇屬性,合并具有連續(xù)屬性值、處理含有未知屬性值的訓(xùn)練樣本等。
C4.5算法是對(duì)ID3算法的最大改進(jìn)之處是對(duì)信息增益率的引入。屬性選擇時(shí)利用信息增益率,對(duì)連續(xù)屬性實(shí)現(xiàn)離散化處理,將知識(shí)表示為決策樹的形式,并最終生成規(guī)則。信息增益率[5]的計(jì)算公式如下:
GainRatio=I(C,V)/H(V)
計(jì)算出信息增益率后,將最高信息增益率所對(duì)應(yīng)的屬性作為根節(jié)點(diǎn),然后向下遞歸建樹最終形成產(chǎn)生式規(guī)則。Weka平臺(tái)中的J48算法就是C4.5算法。
2.2 隨機(jī)森林
隨機(jī)森林屬于集成分類器,它由一組決策樹分類器組成,是基于無參數(shù)回歸算法的集成學(xué)習(xí)策略,如果將單個(gè)決策樹看為是某一方面的專家,所有專家聚集就構(gòu)成了隨機(jī)森林,最終的分類結(jié)果根據(jù)專家投票的結(jié)果得出[6]。
3 操作過程
3.1 分類體系的確立
根據(jù)研究區(qū)的地理特征、自然狀況,通過試錯(cuò)法確立研究區(qū)的最優(yōu)分割參數(shù)。本實(shí)驗(yàn)采用多尺度分割,分割尺度設(shè)置為80,形狀因子設(shè)置為0.8,緊致度因子設(shè)置為0.5,共生成了3826個(gè)地物。結(jié)合Google earth高分辨率影像,共選取了565 個(gè)對(duì)象作為訓(xùn)練樣本,將研究區(qū)分為5種土地覆被類型(表1)。
3.2 分類特征優(yōu)選
為了避免分類過程中出現(xiàn)盲目使用多種特征容易導(dǎo)致計(jì)算量急劇增大、分類精度降低、分類特征冗余等問題[7],本實(shí)驗(yàn)采用易康中自帶的Feature Space Optimization工具對(duì)分類特征進(jìn)行優(yōu)選。
對(duì)每個(gè)類別選取不少于50個(gè)樣本(由于水體較少,不包括水體),對(duì)選取的21個(gè)特征進(jìn)行計(jì)算,得到所有的特征組合與類別之間樣本可分性的詳細(xì)信息,從中能夠直觀看出:樣本之間的區(qū)分距離隨特征數(shù)量即維數(shù)的變化而變化。當(dāng)特征數(shù)量較少時(shí),不能很好地區(qū)分地物,當(dāng)特征數(shù)量過多時(shí),可能影響分類效率。如圖1可以看出區(qū)分距離的變化趨勢(shì)為先上升后下降,并在特征數(shù)量等于19時(shí)達(dá)到最大,因此確定最優(yōu)特征數(shù)量為19。
4 分類結(jié)果及精度評(píng)價(jià)
基于J48算法以及隨機(jī)森林算法得到的分類結(jié)果見圖2。
選取566個(gè)獨(dú)立于前述模型構(gòu)建的訓(xùn)練樣本數(shù)據(jù)集對(duì)以上2種方法的分類結(jié)果進(jìn)行精度評(píng)價(jià)分析(表2)。從中可以看出,隨機(jī)森林算法對(duì)影像整體的分類結(jié)果好于J48算法。但對(duì)于建筑物的提取,J48算法在生產(chǎn)者精度和用戶精度上均高于隨機(jī)森林算法。
5 結(jié)論
本文對(duì)比了J48算法以及隨機(jī)森林算法在高分辨影像建筑物提取上的效果,得出J48算法優(yōu)于隨機(jī)森林算法的結(jié)論,但是J48算法在建筑物提取上仍有一些錯(cuò)誤,例如將建筑物錯(cuò)分為道路、將道路錯(cuò)分為建筑物等。如何改進(jìn)J48算法,得到更好的建筑物提取效果有待進(jìn)一步的研究。
參考文獻(xiàn):
[1]許燕,段福洲,段光耀.面向?qū)ο蟮臒o人機(jī)影像分類研究[J].地理空間信息,2014(5):8+41-43.
[2]陳云浩,等.基于面向?qū)ο蠛鸵?guī)則的遙感影像分類研究[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2006(04):316-320.
[3]史澤鵬,等.基于J48決策樹算法的遙感土地利用變化分析[J].遙感信息,2014,29(1):78-84.
[4]Breiman L . Random Forests[J]. Machine Learning, 2001, 45(1):5-32.
[5]高海賓.基于Weka平臺(tái)的決策樹J48算法實(shí)驗(yàn)研究[J].湖南理工學(xué)院學(xué)報(bào)(自然科學(xué)版),2017,30(01):21-25.
[6]李欣海.隨機(jī)森林模型在分類與回歸分析中的應(yīng)用[J].應(yīng)用昆蟲學(xué)報(bào),2013,50(04):1190-1197.
[7]叢佃敏,等.基于最優(yōu)特征空間構(gòu)建的隨機(jī)森林算法在WorldView-2影像分類中的適用性研究[J].科學(xué)技術(shù)與工程,2016,16(31):218-224.