亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于AdaBoost改進隨機森林和SVM的極化SAR地物分類*

        2022-11-15 06:01:30張政李世強
        關(guān)鍵詞:決策樹極化分類器

        張政,李世強

        (1 中國科學(xué)院空天信息創(chuàng)新研究院, 北京 100190; 2 中國科學(xué)院大學(xué)電子電氣與通信工程學(xué)院, 北京 100049)

        合成孔徑雷達(synthetic aperture radar, SAR)是一種高分辨率成像雷達,具備全天時、全天候、遠距離觀測目標的能力[1]。極化SAR(polarimetric SAR)是一種多通道多參數(shù)的SAR系統(tǒng),與傳統(tǒng)SAR系統(tǒng)相比可以獲得更為豐富的目標散射特性[2],在圖像分類方面具備一定優(yōu)勢[3]。

        地物分類是遙感圖像解譯的關(guān)鍵問題之一,在環(huán)境監(jiān)測、災(zāi)害評估、城市規(guī)劃等方面有著廣泛應(yīng)用。隨著大數(shù)據(jù)處理技術(shù)的發(fā)展,學(xué)者們開始嘗試將機器學(xué)習等算法應(yīng)用在SAR數(shù)據(jù)處理中。文獻[4]用深度卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)對極化SAR進行分類,可以得到較高的分類精度,但其依賴大量的有標記訓(xùn)練樣本,在數(shù)據(jù)量較少時分類效果不佳,而在此情況下機器學(xué)習等傳統(tǒng)算法表現(xiàn)通常優(yōu)于深度卷積神經(jīng)網(wǎng)絡(luò)[5]。

        一般來說,特征參數(shù)種類越豐富,所描述的地物目標信息便越全面,然而由于特征之間冗余度和相關(guān)性的存在,不加區(qū)分的特征疊加往往會導(dǎo)致過高的計算復(fù)雜度,而分類效果卻提升有限,同時SAR圖像的相干斑噪聲也一直影響著分類精度。針對這些問題,文獻[6]提出一種基于特征篩選的二級分類結(jié)構(gòu)對建筑物進行提取,作者利用隨機森林(random forest, RF)[7]對特征進行篩選,并得到初級分類結(jié)果,將篩選后的特征輸入到支持向量機(support vector machine, SVM)[8]得到二級分類結(jié)果,兩種結(jié)果融合后獲得最終結(jié)果。該方法在建筑物提取上效果較好,但由于RF沒有區(qū)分決策樹的分類能力,所有決策樹在分類時默認權(quán)重相同,而實際上決策樹分類能力有所差異,對權(quán)重適當調(diào)整可以提升分類器的總體精度。因此陳偉民等[9]針對該問題提出一種基于自適應(yīng)提升(adaptive boosting, AdaBoost)改進RF算法,并在高光譜圖像分類上驗證了該算法的有效性。

        為提升極化SAR圖像地物分類精度,減少相干斑噪聲對分類的影響,本文設(shè)計了一種基于AdaBoost改進RF(adaBoost random forest, ADA_RF)和SVM的二級分類算法。該方法采用AdaBoost提升RF性能的方法[9],同時還引入了二級分類結(jié)構(gòu)[6]。

        該方法首先從極化SAR數(shù)據(jù)中提取特征數(shù)據(jù)集,利用分層采樣法選取訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集,先得到ADA_RF分類器和特征重要性排名,再根據(jù)排名選擇部分特征求出SVM的二級分類結(jié)果,通過鄰域投票法融合兩級結(jié)果,得出最終結(jié)果。

        1 特征描述

        在極化SAR圖像的分析過程中常用極化散射矩陣S來描述地物的極化散射特性,S矩陣經(jīng)過變換之后又可以得到極化協(xié)方差矩陣C和極化相干矩陣T。

        (1)

        (2)

        (3)

        式(2)和式(3)中:〈·〉表示集合平均,*表示共軛。在單站后向散射體制下,假定S滿足互易性,即有SHV=SVH,因此通常定義極化SAR系統(tǒng)測量的散射總功率為

        式中:Tr(·)表示求矩陣的跡,T作為上角標時表示轉(zhuǎn)置。

        不同的極化目標分解方法描述地物散射特性的角度不同。極化目標分解方法主要分為3種,分別是基于散射模型的分解方法、基于特征矢量或特征值分析的分解方法和相干分解方法[2]?;谏⑸淠P偷哪繕藰O化分解方法有Freeman-Durden分解、Yamaguchi分解等?;谔卣魇噶磕繕藰O化分解方法有Cloude-Pottier分解、 Holm分解和Van Zyl分解等。相干分解是將S矩陣分解為目標散射機制的組合,有Pauli分解和Krogager分解等方法??紤]到地物目標一般較為復(fù)雜,單一的分解方法難以適用于不同場景,故本文從3種分解方法中各選取了幾個典型特征組成極化特征集合。

        紋理是應(yīng)用于遙感圖像分類的典型特征。它通過灰度空間重復(fù)變化反映圖像的灰度統(tǒng)計信息、空間分布信息和結(jié)構(gòu)信息。紋理特征中的灰度共生矩陣和半方差矩陣是具有代表性的兩個特征,前者是應(yīng)用最為廣泛的紋理描述方法之一,后者則能有效表示建筑區(qū)域的特征。因此本文選擇灰度共生矩陣和半方差矩陣作為紋理特征集合。

        綜上所述,本文選取如表1所示的特征集合,分別是直接測量得到的極化數(shù)據(jù)、Yamaguchi分解特征[10]、Cloude-Pottier極化分解特征[11],還有灰度共生矩陣[12]和半方差函數(shù)[13]等紋理特征。

        表1 特征集合

        其中,直接測量得到的極化數(shù)據(jù)主要有極化散射總功率Span和極化相干矩陣的對角線元素T11,T22,T33。Span表示極化SAR系統(tǒng)的回波強度,T11代表目標對稱因子,T22代表目標非對稱因子,T33代表目標非規(guī)則因子。

        Yamaguchi分解將地物目標散射分解成表面散射PS、二次散射PD、體散射PV和螺旋散射PH。螺旋散射信息PH的存在是Yamaguchi分解優(yōu)于Freeman-Durden分解之處,該成分在具有復(fù)雜結(jié)構(gòu)的目標或城區(qū)建筑中較為常見。

        Cloude-Pottier分解參數(shù)包括極化熵H、散射角α與各向異性度A,它們都來自于相干矩陣T的分解,均有旋轉(zhuǎn)不變性。極化熵H用來衡量散射過程的隨機性,散射角α與平均物理散射機制密切相關(guān),各向異性度A用來描述特征分解得到的第2、3個特征值的相對大小。

        紋理特征選取灰度共生矩陣和半方差函數(shù)。灰度共生矩陣包含熵、對比度、同質(zhì)性、均值4種特征,分別用符號ENT、CON、HOM、MEA表示。ENT描述圖像信息量的隨機性,CON反映圖像灰度的局部差異,HOM體現(xiàn)圖像局部均勻程度,MEA體現(xiàn)紋理的規(guī)則化程度。半方差函數(shù)V[14]描述像素與其鄰域像素的空間相關(guān)性。將圖像中的灰度值作為區(qū)域化變量,在以像素點為中心的鄰域窗口內(nèi)對0°、45°、90°、135°等4個方向的半方差函數(shù)取平均,最終得到中心像素的半方差紋理特征值。

        2 分類方法

        2.1 分類器

        本文構(gòu)建了由ADA_RF和SVM組成的二級分類結(jié)構(gòu)。

        AdaBoost是一種集成學(xué)習算法,它能根據(jù)分類器的性能賦予權(quán)重,得到分類器的加權(quán)組合,提升整體分類性能。具體來說便是根據(jù)各個分類器的分類正確率高低來分配權(quán)重,正確率高的獲得高權(quán)重,低的則獲得低權(quán)重。RF[7]是一種集成學(xué)習模型,決策樹是它的基本分類器。它利用自助采樣法隨機采集樣本組成子集,每個樣本子集訓(xùn)練出一個決策樹,多顆決策樹組成隨機森林。各個決策樹通過簡單投票法決定最終結(jié)果。

        本文用AdaBoost算法調(diào)整隨機森林中決策樹的投票權(quán)重,分類能力越強權(quán)重越高,最后通過最大投票準則獲得分類結(jié)果。AdaBoost算法是面向二分類的分類算法,因此本文采用“一對多”拆解法,將多類別分類問題轉(zhuǎn)化為多個二分類問題。對像素分類時,每顆決策樹單獨給出分類結(jié)果,隨機森林對投票結(jié)果加權(quán)統(tǒng)計,將得票最多的預(yù)測結(jié)果作為最終分類結(jié)果。

        SVM是一種典型的有監(jiān)督分類器[15]。它的基本思想是找到能夠正確劃分訓(xùn)練數(shù)據(jù)集并且間隔最大的超平面,該超平面要有足夠間隔將離其最近的兩類樣本點分開,所以可將超平面的求解表示為一個凸二次優(yōu)化問題

        s.t.yi(wTxi+b)≥1,i=1,2,…,m.

        其中:w為權(quán)重系數(shù),b為位移項,(xi,yi)為樣本集中的訓(xùn)練樣本。SVM具有比較完備的數(shù)學(xué)理論支撐,但在大樣本和高維度場景下計算效率不高。因此可以考慮利用隨機森林的特征篩選功能,提前去除冗余特征,提高運行效率。

        由ADA_RF和SVM得到的兩級分類結(jié)果通過鄰域投票法進行融合,其原理是當兩級分類結(jié)果在像素點(i,j)處不同時,以該點為中心取一個寬度為d的正方形窗口,窗口中每個像素點都可以對分類結(jié)果進行投票,將中心像素的類別標記為得票最多的類別C

        C=maxc(SUM(En(k,l)==c)),

        c=1,2,3,…;n=1,2.

        2.2 算法步驟

        本文算法流程如圖1所示。

        圖1 本文算法流程

        步驟1輸入極化SAR數(shù)據(jù),進行預(yù)處理。

        步驟2提取數(shù)據(jù)的極化和紋理特征,構(gòu)成維度為M的原始特征參數(shù)集X。

        步驟3分析極化SAR圖像,查找或繪制地面真值圖。利用分層采樣法選取訓(xùn)練集和測試集。

        步驟4通過輸入訓(xùn)練數(shù)據(jù)集和標簽到ADA_RF,使得隨機森林的每個決策樹都有各自的權(quán)重。用訓(xùn)練好的分類器對整幅圖像進行預(yù)測,得到初級預(yù)測結(jié)果E1,同時得到各個特征的平均重要性排名V1。

        步驟6利用篩選后的特征集合X訓(xùn)練SVM分類器,并對整幅圖像進行預(yù)測,得到二級分類結(jié)果E2。

        步驟7利用鄰域投票法,將E1和E2進行融合,得到最終地物分類結(jié)果。

        3 實驗與分析

        本文通過對AIRSAR采集自美國舊金山和荷蘭弗萊福蘭省的L波段極化數(shù)據(jù)進行分類實驗,得到RF、SVM、ADA_RF和本文算法4種分類器的分類結(jié)果,通過對比來驗證本文算法的有效性。

        3.1 特征篩選

        ADA_RF可以根據(jù)各個特征的貢獻率得出重要性排名,作為特征篩選的依據(jù)。按照步驟5得到重要性排名,依次加入特征并記錄精度的提升程度,得到圖2所示的折線圖。

        圖2 特征向量個數(shù)對分類精度的影響

        根據(jù)圖2確定兩個實驗的特征篩選個數(shù)N=10,即選擇重要性排名前10的特征集,分別是Span,PS,PD,PV,PH,H,α,A,ENT,V。

        3.2 分類對比實驗

        第1個對比試驗利用的是美國舊金山海灣地區(qū)的數(shù)據(jù)。數(shù)據(jù)大小為900×1 024,PauliRGB圖和地面真值圖像如圖3(a)、3(b)所示,其中地面真值圖像的繪制參考了文獻[16]和谷歌地圖。將地物類別分為5類,分別是山地、海洋、城市、植被、有角度城市,城市對應(yīng)的是普通建筑區(qū)域,有角度城市對應(yīng)的是高層建筑區(qū)域。

        在實驗中,RF和ADA_RF的決策樹各設(shè)置為200棵,SVM采用的是徑向基函數(shù)核。訓(xùn)練和測試數(shù)據(jù)集通過分層采樣法獲得,二者比例為3∶7,最終分類效果如圖3(c)~3(f)所示,分類精度與耗時數(shù)據(jù)如表2所示。

        表2 舊金山地區(qū)數(shù)據(jù)的分類精度與耗時指標

        圖3 舊金山地區(qū)數(shù)據(jù)分類效果圖

        從分類效果和分類精度數(shù)據(jù)來看,本文算法的分類精度最高,達到92.72%。尤其是山地和城區(qū)的精度相比RF和SVM有較大提升。從分類效果看,本文算法得到的結(jié)果相比ADA_RF和SVM結(jié)果更加光滑連續(xù),說明鄰域投票法可有效抑制相干斑噪聲。由圖3(c)、3(d)可知,RF和SVM在區(qū)分城市建筑物高度問題上效果欠佳,而圖3(e)、3(f)表明經(jīng)過AdaBoost改進的隨機森林可以更好地區(qū)分普通城區(qū)和高建筑物城區(qū)。在算法的耗時上,RF耗時最短,因為ADA_RF引入了決策樹權(quán)重的計算,故相比于RF耗時有所增加,但本文算法的耗時小于ADA_RF和SVM耗時的直接加和,表明特征篩選在減少計算量上發(fā)揮了作用。

        為進一步驗證本文算法的有效性,選取Flevoland數(shù)據(jù)進行二次驗證。數(shù)據(jù)大小為750×1 024,包含15類地物,圖4(b)地面真值圖像的繪制參考了文獻[17]和谷歌地圖。分類器中RF和ADA_RF的決策數(shù)仍然設(shè)為200棵,訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集通過分層采樣獲取,比例設(shè)置為3∶7。分類結(jié)果如圖4所示,各項分類指標如表3所示。

        表3 弗萊福蘭地區(qū)數(shù)據(jù)的分類精度與耗時指標

        圖4 荷蘭弗萊福蘭地區(qū)數(shù)據(jù)分類圖

        從分類效果和分類精度上看,ADA_RF在分類精度上相比于RF和SVM有所提升,分別提升6.71和8.31個百分點。本文算法又在ADA_RF的基礎(chǔ)上進一步提升了分類精度,達到94.68%。由此可以證明ADA_RF算法在提升分類精度上具有一定效果,經(jīng)過鄰域投票法之后可以有效抑制相干斑噪聲,使得分類精度進一步提升。

        4 結(jié)論

        本文設(shè)計了一種基于ADA_RF和SVM的二級分類結(jié)構(gòu)。通過對舊金山和弗萊福蘭兩個地區(qū)極化SAR數(shù)據(jù)的實驗,結(jié)果表示本文所提算法的分類精度高于RF、SVM和ADA_RF。證明了本文算法的有效性,且ADA_RF算法能夠根據(jù)RF中決策樹的分類能力給決策樹賦予權(quán)重,提升整體分類精度,證明特征篩選之后再訓(xùn)練SVM分類器能夠減少計算量與時間消耗。證明通過鄰域投票法將兩級分類結(jié)果融合,能夠在保持空間一致性的前提下抑制相干斑噪聲的影響。

        猜你喜歡
        決策樹極化分類器
        認知能力、技術(shù)進步與就業(yè)極化
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        決策樹和隨機森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        BP-GA光照分類器在車道線識別中的應(yīng)用
        電子測試(2018年1期)2018-04-18 11:52:35
        雙頻帶隔板極化器
        電子測試(2017年15期)2017-12-18 07:18:51
        加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
        結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
        基于決策樹的出租車乘客出行目的識別
        基于PWM控制的新型極化電源設(shè)計與實現(xiàn)
        基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
        一本色道久久亚洲加勒比| 9久久精品视香蕉蕉| 久久国产精品老人性| 色婷婷精久久品蜜臀av蜜桃| 国产精品成人自拍在线观看| 亚洲精品一区久久久久一品av| 亚洲精品一区国产欧美| 久久婷婷五月综合色欧美| 少妇性饥渴bbbbb搡bbbb| 亚洲熟妇网| 美女视频很黄很a免费国产| 色av色婷婷18人妻久久久| 亚洲一区二区三区高清在线观看| 激情亚洲一区国产精品久久| 亚洲熟女www一区二区三区| 久久精品国产亚洲一区二区 | 免费无码又爽又高潮视频| 狠狠色成人综合网| 久久久久久久一线毛片| 中文字幕 在线一区二区| 白白色发布会在线观看免费| av色欲无码人妻中文字幕| 亚洲精品久久久无码av片软件| 久久99精品这里精品动漫6| 国产亚洲av一线观看| 91久久国产香蕉熟女线看| 天天做天天爱夜夜爽| 精品一区二区三区无码免费视频| 日本香蕉久久一区二区视频| 日韩激情av不卡在线| 97人妻人人揉人人躁九色| 欧洲多毛裸体xxxxx| 内谢少妇xxxxx8老少交| 精品久久亚洲一级α| 久久亚洲综合亚洲综合| 国产精品高清网站| 妺妺窝人体色www聚色窝仙踪| 藏春阁福利视频| 亚洲中文字幕精品一区二区| 日本加勒比一区二区在线观看| 国产在线观看自拍av|