陳彥橋,張澤勇*,陳金勇,高 峰,柴興華
(1.中國電子科技集團公司第五十四研究所,河北 石家莊050081;2.中國電子科技集團公司航天信息應用技術重點實驗室,河北 石家莊050081)
極化合成孔徑雷達(Synthetic Aperture Rader, SAR)數(shù)據能夠獲取觀測目標的幅度信息以及相位信息[1],在各個領域都得到了廣泛的應用,而極化SAR圖像分類又是極化SAR數(shù)據處理的關鍵技術。近些年來,許多極化SAR圖像分類算法被提出,上述可以被劃分成3類:第1類方法是基于極化分解的分類方法,如Freeman分解[2]、Krogager分解[3]、Cloude分解[4]、Huynen分解[5]和Cameron分解[6]等目標分解方法;第2類方法是基于統(tǒng)計特性的分類方法,極化SAR相關研究學者已證明極化相干矩陣與極化協(xié)方差矩陣都服從復Wishart分布[7],J.S.Lee等人[8]提出了Wishart距離并將其應用于極化SAR圖像分類;第3類方法是基于機器學習相關算法的分類方法,例如支持向量機(Support Vector Machine, SVM)[9]、神經網絡(Neural Network,NN)[10]、K近鄰(K-Nearest Neighbor, KNN)[11]以及隨機森林分類器(Random Forest Classifier, RFC)[12]等算法。
近些年來,卷積神經網絡(Convolution Neural Network, CNN)[13]在極化SAR圖像分類中也得到了廣泛應用。在CNN分類框架中,需要將像素點的鄰域設置為模型輸入從而得到該像素點的分類結果。然而,在圖像的類別邊界區(qū)域,單像素點的鄰域區(qū)域的像素點的類別并不一定與該像素點的類別一致,因此CNN在圖像的類別邊界區(qū)域分類效果并不好。RFC算法在極化SAR圖像任務中表現(xiàn)性能良好,但是在類別非邊界區(qū)域的分類結果沒有CNN好。在本文中,在類別邊界區(qū)域使用RFC的分類結果,在類別非邊界區(qū)域使用CNN的分類結果,通過此種集成方式,得到更好的分類結果。
通過線性水平和垂直方向發(fā)射和接收極化電磁波的方式,極化散射矩陣[14]可以表示為:
(1)
在滿足互易定理SHV=SVH的情況下,極化散射矩陣可以表示為:
(2)
(3)
根據特征分解模型,T矩陣可以分解為[14]:
(4)
(5)
本文使用T矩陣(T11,T22,T33, Re(T12), Re(T13), Re(T23), Im(T12), Im(T13), Im(T23)和Cloude分解特征(H,A,α,λ1,λ2,λ3)作為輸入特征,其中Re(Tij)和Im(Tij)代表Tij的實部和虛部。
CNN主要由卷積層、池化層和全連接層組成[13]。卷積層是用卷積核處理數(shù)據,而且通過卷積提取的特征具有平移不變性。池化層的主要作用是降低特征維度,從而降低計算量。激活函數(shù)主要作用于卷積層,使模型可以提取數(shù)據之間的非線性關系,提取的特征更加抽象。常見的激活函數(shù)有sigmoid函數(shù)、ReLU函數(shù)和tanh函數(shù)。
隨機森林[15]使用Bagging方法為每棵決策樹生成用于訓練的樣本集,而且這些樣本集是獨立同分布的,每棵決策樹在訓練過程中確定的參數(shù)會組成隨機向量,而且隨機森林中所有決策樹的隨機向量也是獨立同分布的。隨機森林分類器是由所有決策樹集合而成的分類器,該分類器可以表示為:
h(x,θk),k=1,2,…,n,
(6)
式中,x代表輸入數(shù)據;k代表第k棵決策樹;θk代表第k棵決策樹的參數(shù)向量,可以在bootstrap樣本集上學習得到;h(x,θk)則代表第k棵決策樹對輸入數(shù)據x進行分類。對于輸入數(shù)據x的最終類別由所有決策樹的分類結果綜合得到。
本文使用信息熵表示CNN分類結果的不確定性,其可以表示為:
(7)
式中,N表示類別總數(shù);i表示類別i;p(i)表示將樣本x分類為第i類的概率。H(x)的值越大,意味著x的分類不確定性越強,x位于類別邊界區(qū)域的概率也就越大。通過此種方式,可以得到圖像的類別邊界區(qū)域。
本文算法(RFC-CNN)流程如下:
① 用RFC得到分類結果;
② 用CNN得到分類結果;
③ 根據式(8)從CNN的分類結果得到類別邊界區(qū)域;
④ 類別邊界區(qū)域使用RFC的分類結果,類別非邊界區(qū)域使用CNN的分類結果。
如第1節(jié)所述,本文使用T矩陣(T11,T22,T33,Re(T12), Re(T13),Re(T23), Im(T12), Im(T13), Im(T23))和Cloude分解特征(H,A,α,λ1,λ2,λ3)。使用精致Lee濾波[1]方法作為濾波方法,使用總體正確率(Overall Accuracy, OA)以及Kappa系數(shù)作為評價指標。RFC的決策樹的數(shù)目為100。CNN架構圖如圖1所示,其中Image代表輸入圖像,Conv代表卷積層,Pool代表池化層,F(xiàn)lat代表拉成一列,fc代表全連接層,Result代表分類結果。
圖1 CNN框架圖Fig.1 CNN framework
Xi’an圖像[14]是全極化C波段的極化SAR圖像,由RADARSAT-2衛(wèi)星獲取,覆蓋中國陜西省西安市渭河部分場景,含有3類地物:Water(水域)、Grass(草地)和Building(建筑區(qū))。Xi’an圖像大小為512 pixel×512 pixel,其分辨率為8 m×8 m,Xi’an圖像的Pauli偽彩色圖、類標圖以及配色方案如圖2所示。
(a)Pauli偽彩色圖
(b)類標圖
(c)配色方案圖2 Xi’an極化SAR圖像Fig.2 PolSAR image of Xi’an
圖2中有標記的樣本數(shù)目為237 416。本文從有標記樣本中隨機選取的比例為0.5%,剩下的有標記樣本被設置為測試樣本。圖3給出了該圖像的分類結果,表1給出了該圖像的分類正確率以及Kappa系數(shù)。
(a) RFC
(b) CNN
(c)邊界
(d) RFC-CNN圖3 Xi’an圖像分類結果Fig.3 Classification result of Xi’an image
表1 Xi’an圖像分類正確率Tab.1 Classification accuracy of Xi’an image
由圖3可以看出,RFC-CNN確實得到了圖像的邊界區(qū)域,而且該方法確實得到了比RFC和CNN更好的分類結果,在圖像邊界區(qū)域比CNN分類結果好,在圖像非邊界區(qū)域比RFC的分類結果更好。由表1可以看出,本文方法的整體正確率和Kappa系數(shù)都是所有方法中最高的。上述結果表明,本文方法的集成策略在Xi’an圖像分類中是有效的。
Oberpfaffenhofen圖像[14]是全極化L波段的極化SAR圖像,由E-SAR衛(wèi)星獲取,覆蓋了位于德國Oberpfaffenhofen的部分地區(qū),包含3類地物:Open Areas(開放區(qū)域)、Wood Land(森林)和Built-up Areas(建筑區(qū)),該圖像大小為1 300 pixel×1 200 pixel,其分辨率為3 m×2.2 m,Oberpfaffenhofen圖像的Pauli偽彩色圖、類標圖以及配色方案如圖4所示,該圖像的有標價樣本數(shù)目為1 374 298,本文采用0.2%的標記樣本作為訓練樣本,剩余標記樣本作為測試樣本。圖5給出了該圖像的分類結果,表2給出了該圖像的分類正確率以及Kappa系數(shù)。
(a) Pauli偽彩色圖
(b) 類標圖
(c) 配色方案圖4 Oberpfaffenhofen極化SAR圖像Fig.4 PolSAR image of Oberpfaffenhofen
(a) RFC
(b) CNN
(c)邊界
(d) RFC-CNN圖5 Oberpfaffenhofen圖像分類結果Fig.5 Classification result of Oberpfaffenhofen image
表2 Oberpfaffenhofen圖像分類正確率Tab.2 Classification accuracy of Oberpfaffenhofen image
由圖5可以看出,RFC-CNN成功找到了圖像邊界區(qū)域,相比于RFC和CNN,本文方法也得到了更好的分類結果。由表2可以看出,RFC-CNN的總體正確率和Kappa系數(shù)確實比RFC和CNN更高。綜上,本文方法的集成策略在Oberpfaffenhofen圖像分類的有效性得到了證明。
本文提出了一種基于CNN和RFC的集成學習方法用于極化SAR圖像分類。CNN在類別非邊界區(qū)域分類性能優(yōu)異,但是在類別邊界區(qū)域分類結果較差,RFC在類別非邊界區(qū)域分類結果不如CNN,但是在類別邊界區(qū)域分類性能比CNN優(yōu)異,本文方法的集成策略是使用CNN對類別非邊界區(qū)域進行分類,使用RFC對類別邊界區(qū)域進行分類,以此取得更好的分類結果。本文將T矩陣以及Cloude分解特征設置為輸入特征,使用Xi’an和Oberpfaffenhofen兩幅極化SAR圖像作為測試圖像,與對比方法RFC以及CNN相比較,本文方法在類別非邊界區(qū)域比RFC分類結果好,在類別邊界區(qū)域比CNN分類結果好,因此本文方法的集成策略是有效的。