耿杰 范劍超, 初佳蘭 王洪玉
基于深度協(xié)同稀疏編碼網(wǎng)絡(luò)的海洋浮筏SAR圖像目標(biāo)識(shí)別
耿杰1范劍超1,2初佳蘭2王洪玉1
浮筏養(yǎng)殖廣泛存在于我國(guó)近海海域,可見(jiàn)光遙感圖像無(wú)法完全準(zhǔn)確地獲取養(yǎng)殖目標(biāo),而基于主動(dòng)成像的合成孔徑雷達(dá)(Synthetic aperture radar,SAR)遙感圖像能夠得到養(yǎng)殖目標(biāo),因此采用SAR圖像進(jìn)行海洋浮筏養(yǎng)殖目標(biāo)識(shí)別.然而,海洋遙感SAR圖像包含大量相干斑噪聲,并且SAR圖像特征單一,使得目標(biāo)識(shí)別難度較大.為解決這些問(wèn)題,提出一種深度協(xié)同稀疏編碼網(wǎng)絡(luò)(Deep collaborative sparse coding network,DCSCN)進(jìn)行海洋浮筏識(shí)別.本文方法對(duì)預(yù)處理后的圖像先提取紋理特征和輪廓特征,再進(jìn)行超像素分割并將同一個(gè)超像素塊特征組輸入該網(wǎng)絡(luò)進(jìn)行協(xié)同表示,最后得到有效特征并分類識(shí)別.通過(guò)人工SAR圖像和北戴河海域浮筏養(yǎng)殖SAR圖像的實(shí)驗(yàn)驗(yàn)證所提模型的有效性.該網(wǎng)絡(luò)不僅具有優(yōu)異的特征表示能力,能夠獲得更適合分類器的特征,而且通過(guò)近鄰協(xié)同約束,有效抑制相干斑噪聲影響,所以提高了SAR圖像目標(biāo)識(shí)別精度.
合成孔徑雷達(dá),深度學(xué)習(xí),稀疏自動(dòng)編碼器,浮筏養(yǎng)殖,目標(biāo)識(shí)別
引用格式耿杰,范劍超,初佳蘭,王洪玉.基于深度協(xié)同稀疏編碼網(wǎng)絡(luò)的海洋浮筏SAR圖像目標(biāo)識(shí)別.自動(dòng)化學(xué)報(bào),2016,42(4):593?604
合成孔徑雷達(dá)(Synthetic aperture radar,SAR)是一種主動(dòng)成像傳感器,具有全天候、全天時(shí)、高分辨率的數(shù)據(jù)獲取能力[1?2].SAR圖像目標(biāo)識(shí)別是SAR圖像解譯的重要內(nèi)容,在軍事偵察、資源探測(cè)、地理測(cè)繪、海域監(jiān)測(cè)等領(lǐng)域有著廣泛的應(yīng)用.隨著SAR成像技術(shù)的發(fā)展,分辨率的不斷提高,SAR圖像目標(biāo)識(shí)別成為海量SAR數(shù)據(jù)處理的主要手段.典型的SAR圖像目標(biāo)識(shí)別模型分為檢測(cè)(Detection)、鑒別(Discrimination)和分類(Classification)三個(gè)階段[2].海洋浮筏養(yǎng)殖是海域監(jiān)測(cè)的重要組成部分,自動(dòng)識(shí)別浮筏信息對(duì)實(shí)現(xiàn)大面積海域動(dòng)態(tài)使用監(jiān)測(cè)有著重要意義[3?4].由于海洋散射信號(hào)較弱,光譜成像衛(wèi)星數(shù)據(jù)難以獲取浮筏信息,而SAR是主動(dòng)式微波成像,利于獲取浮筏信息,在海域監(jiān)測(cè)中具有明顯優(yōu)勢(shì)[5].因此,利用SAR圖像進(jìn)行海洋浮筏養(yǎng)殖自動(dòng)識(shí)別,不僅可以大范圍、宏觀調(diào)查海域使用情況,而且為海洋遙感業(yè)務(wù)化動(dòng)態(tài)監(jiān)測(cè)提供了有力手段.但是,由于海洋周期性波浪的影響,后向散射系數(shù)相干疊加使得成像存在嚴(yán)重的相干斑噪聲;同時(shí)由于海洋每個(gè)區(qū)域的流、浪、涌、內(nèi)波都不一樣,導(dǎo)致后向散射特性非常不規(guī)律,同一目標(biāo)在不同海域特征存在明顯差異[6].這些問(wèn)題增加了海洋SAR圖像目標(biāo)識(shí)別難度,有效的特征表示是解決問(wèn)題的關(guān)鍵.
在SAR圖像目標(biāo)識(shí)別問(wèn)題中,紋理特征被廣泛用于SAR圖像的特征提取.紋理特征是圖像灰度或色彩在空間上的重復(fù)或者變化的特征,提取紋理特征的方法可以分為三類:基于統(tǒng)計(jì)的方法、基于模型的方法和基于變換域的方法[7].在基于統(tǒng)計(jì)的方法中,灰度共生矩陣(Gray-level co-occurrence matrix,GLCM)統(tǒng)計(jì)圖像上保持某距離的兩個(gè)像素的灰度狀況,主要包括均值、方差、對(duì)比度、熵、自相關(guān)等元素.在基于模型的方法中,馬爾科夫隨機(jī)場(chǎng)模型是最常用的分析模型.在基于變換域的方法中,小波變換得到變換域各個(gè)方向的系數(shù)能反映目標(biāo)的后向散射特性.
為了更加有效地分析理解圖像,多尺度幾何分析(Multi-scale geometric analysis,MGA)方法陸續(xù)被提出,它是一種多方向、多尺度和局部性的圖像稀疏表示方法,被稱為后小波分析.由于小波分析的方向受限、頻率分辨率低,而MGA可以利用圖像的幾何正則性,能夠保持豐富的細(xì)節(jié)信息.目前常用的MGA方法有Gabor變換、曲波變換、輪廓波變換、剪切波變換等.Gabor變換是具有高斯函數(shù)的傅里葉變換,二維Gabor函數(shù)相當(dāng)于一個(gè)高斯函數(shù)調(diào)制的復(fù)正弦函數(shù),可以提取圖像不同空間位置、空間頻率的局部結(jié)構(gòu)信息[8].由于二維Gabor變換在表征圖像紋理變化方面的優(yōu)勢(shì),已經(jīng)被普遍用于人臉識(shí)別等模式識(shí)別問(wèn)題中.為了更好地逼近圖像的輪廓信息,Do等提出了輪廓波變換[9],通過(guò)多尺度分解和方向分解,可以有效地表示圖像輪廓.然而,對(duì)圖像輪廓波變換時(shí),要進(jìn)行降采樣和上采樣,這樣就不具備平移不變性,而平移不變性在邊緣保持、目標(biāo)檢測(cè)等方面起著重要作用.為了解決這一問(wèn)題,Da Cunha等提出一種非下采樣輪廓波變換(Nonsubsampled contourlet transform,NSCT)[10],具有平移不變性,可以很好地保持圖像的細(xì)節(jié)和邊緣信息.當(dāng)前,NSCT已經(jīng)被廣泛用于圖像融合問(wèn)題中[11].考慮到二維Gabor變換和NSCT在圖像特征表示方面的優(yōu)勢(shì),本研究利用這兩種方法分別提取SAR圖像的紋理特征和輪廓特征.
在目標(biāo)識(shí)別問(wèn)題中,有效的特征表示對(duì)于識(shí)別準(zhǔn)確度起著關(guān)鍵作用.但是在許多研究中,特征提取和表示都需要大量的經(jīng)驗(yàn)知識(shí)和人為地參數(shù)設(shè)置,這個(gè)過(guò)程比較復(fù)雜而且效率較低,尤其是當(dāng)圖像分辨率較高、尺寸較大時(shí),更增加了特征表示的難度.近年來(lái),深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)被用于特征自主學(xué)習(xí)和表示,在智能識(shí)別任務(wù)中表現(xiàn)出極其優(yōu)異的性能[12?15].深度學(xué)習(xí)網(wǎng)絡(luò)具有類似于人腦感知視覺(jué)的層次化結(jié)構(gòu),不過(guò)分依賴研究人員的經(jīng)驗(yàn)知識(shí),能逐層抽象學(xué)習(xí)數(shù)據(jù)的特征,從而發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在結(jié)構(gòu)信息并改善分類識(shí)別的效果.研究表明,深度網(wǎng)絡(luò)可以很好的挖掘圖像的低層特征(如邊界)和中層特征(如形狀),在圖像去噪、圖像分類識(shí)別等問(wèn)題中取得較好的效果.在分類識(shí)別問(wèn)題中,利用深度網(wǎng)絡(luò)得到的特征表示,不同類別的區(qū)分度更大,更適合于監(jiān)督分類.常用的深度網(wǎng)絡(luò)結(jié)構(gòu)有深度置信網(wǎng)絡(luò)(Deep belief networks,DBN)[12]、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural networks,CNN)[16]和堆疊自動(dòng)編碼器(Stacked auto-encoders,SAE)[17].
本文提出一種深度協(xié)同稀疏編碼網(wǎng)絡(luò)(Deep collaborative sparse coding network,DCSCN)來(lái)進(jìn)行SAR圖像目標(biāo)識(shí)別,并用在海洋浮筏養(yǎng)殖監(jiān)測(cè)任務(wù)中.為了從SAR圖像獲得更優(yōu)異的特征,提高目標(biāo)與背景特征差異性,DCSCN利用了自動(dòng)編碼器在特征表示中的優(yōu)勢(shì),獲得更適合于分類器的特征.為了克服海洋SAR圖像嚴(yán)重的相干斑噪聲,對(duì)超像素分割的近鄰像素特征利用DCSCN進(jìn)行協(xié)同表示,使得同個(gè)超像素塊特征更相近并平滑掉相干斑噪聲,減小噪聲對(duì)目標(biāo)識(shí)別的影響.
傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)都是隨機(jī)初始化模型的參數(shù),然后通過(guò)反向傳播來(lái)優(yōu)化參數(shù).然而深度網(wǎng)絡(luò)如果利用這種方式,很容易陷入局部極值或者造成梯度彌散,使得網(wǎng)絡(luò)參數(shù)無(wú)法最優(yōu).為了解決這一問(wèn)題,提出了逐層學(xué)習(xí)參數(shù)的預(yù)訓(xùn)練,再對(duì)預(yù)訓(xùn)練后的模型進(jìn)行反向傳播來(lái)優(yōu)化參數(shù)的方法[18].常用的預(yù)訓(xùn)練單元有限制玻爾茲曼機(jī)(Restricted Boltzmann machine,RBM)和自動(dòng)編碼器(Auto-encoders),多層預(yù)訓(xùn)練單元堆疊起來(lái)構(gòu)成深度網(wǎng)絡(luò).
1.1自動(dòng)編碼器
一個(gè)自動(dòng)編碼器由輸入層、隱含層和輸出層構(gòu)成,訓(xùn)練學(xué)習(xí)的目標(biāo)是使得網(wǎng)絡(luò)的輸出盡量逼近輸入[19].自動(dòng)編碼器訓(xùn)練過(guò)程由編碼過(guò)程和解碼過(guò)程組成,編碼過(guò)程將輸入樣本進(jìn)行線性映射和非線性映射變換得到隱含層表示.設(shè)樣本集為輸入樣本對(duì)應(yīng)的隱含層表示為
訓(xùn)練好一層自動(dòng)編碼器后,將其隱含層的激活值作為下一層自動(dòng)編碼器的輸入.這樣將多層自動(dòng)編碼器堆疊起來(lái)構(gòu)成了堆疊自動(dòng)編碼器.
1.2堆疊自動(dòng)編碼器
堆疊自動(dòng)編碼器是一種典型的深度神經(jīng)網(wǎng)絡(luò),被廣泛用于特征學(xué)習(xí)與表示.該網(wǎng)絡(luò)先逐層貪婪學(xué)習(xí)來(lái)確定參數(shù),再?gòu)淖铐攲臃聪騻鞑?lái)微調(diào)(Finetune)整個(gè)網(wǎng)絡(luò)的參數(shù).如果最頂層不加入標(biāo)簽信息,則這個(gè)學(xué)習(xí)過(guò)程為無(wú)監(jiān)督的特征學(xué)習(xí)過(guò)程;如果最頂層加入樣本的標(biāo)簽信息來(lái)反向微調(diào)整個(gè)網(wǎng)絡(luò)的參數(shù),則這個(gè)學(xué)習(xí)過(guò)程是監(jiān)督學(xué)習(xí)過(guò)程.圖1給出了堆疊自動(dòng)編碼器結(jié)構(gòu)圖.
圖1 堆疊自動(dòng)編碼器結(jié)構(gòu)圖Fig.1 The structure of SAE
由圖1所示,該堆疊自動(dòng)編碼器共M層,最高層自動(dòng)編碼器的隱含層就是網(wǎng)絡(luò)的輸出.通常在堆疊自動(dòng)編碼器后連接Softmax分類器進(jìn)行分類識(shí)別.在有監(jiān)督學(xué)習(xí)網(wǎng)絡(luò)中,樣本的標(biāo)簽也是在Softmax分類器加入的,整個(gè)網(wǎng)絡(luò)的參數(shù)通過(guò)后向傳播來(lái)整體調(diào)整.網(wǎng)絡(luò)整體參數(shù)微調(diào)的目標(biāo)函數(shù)為
2.1預(yù)處理
衛(wèi)星拍攝的SAR圖像需要先進(jìn)行幾何校正,來(lái)解決由于傳感器以及地球自轉(zhuǎn)等因素造成的圖像相對(duì)于地面目標(biāo)發(fā)生的幾何畸變.由于原始的SAR圖像對(duì)比度較差,需采用灰度拉伸來(lái)提高圖像灰度級(jí)的動(dòng)態(tài)范圍.為了增大目標(biāo)與背景間的對(duì)比度,利用非線性函數(shù)對(duì)圖像進(jìn)行灰度拉伸處理.為了抑制相干斑噪聲對(duì)目標(biāo)識(shí)別的影響,采用增強(qiáng)Lee濾波算法進(jìn)行去噪.
2.2紋理特征提取
二維Gabor濾波器可以提取圖像多尺度、多方向的紋理特征.二維Gabor變換是具有高斯函數(shù)形式的傅氏變換,由一個(gè)高斯函數(shù)乘以正弦函數(shù),正弦函數(shù)的頻率決定特征的尺度,相位決定特征的方向,具體公式如下[20]
其中,x0=xcosθ+y sinθ,y0=?xsinθ+y cosθ,x和y代表像素點(diǎn)的位置,ω0表示濾波器的中心頻率,θ表示濾波器的方向,σ表示高斯函數(shù)的標(biāo)準(zhǔn)差. exp(jω0x0)代表交流分量,代表直流分量.當(dāng)直流分量趨于0時(shí),Gabor濾波器對(duì)光照強(qiáng)度不敏感.θ和σ不同取值得到一組濾波器,將濾波器組與圖像進(jìn)行卷積得到與圖像相同大小的分解圖像,這些圖像代表紋理特征.
2.3輪廓特征提取
非下采樣輪廓波變換(NSCT)[10]可以將圖像分解為不同頻率和不同方向的子帶圖像,各個(gè)子帶圖像表示了圖像在各個(gè)頻率和各個(gè)方向上的系數(shù),可以看作原圖的一張?zhí)卣鲌D,即輪廓特征圖.NSCT交替利用非下采樣的塔型濾波器組和非下采樣的方向?yàn)V波器組,來(lái)得到多方向、多尺度的二維分解圖像.圖2給出了具體分解的過(guò)程.
圖2 非下采樣輪廓波變換Fig.2 Nonsubsampled contourlet transform
如圖2所示,NSCT先利用非下采樣的塔型濾波器組將圖像分解為低通、帶通和高通子帶圖像,然后利用非下采樣方向?yàn)V波器組對(duì)子帶圖像進(jìn)行方向?yàn)V波,得到各個(gè)頻域方向的子帶圖像.具體過(guò)程如下:NSCT的非下采樣塔型濾波器由多個(gè)雙通道非下采樣濾波器級(jí)聯(lián)構(gòu)成.設(shè)定分解的尺度為j,則在尺度j上的理想低通濾波器包含的區(qū)域?yàn)槔硐敫咄V波器H1(z)包含的區(qū)域?yàn)橛捎诿看畏纸庵卸贾粚?duì)上次分解結(jié)果進(jìn)行上采樣,而不使用下采樣,所以保證算法的平移不變性.經(jīng)過(guò)k級(jí)非下采樣塔型濾波,可以得到k+1個(gè)與原圖像相同尺寸大小的子帶圖像.NSCT所采用的方向?yàn)V波器組也是一組二通道非下采樣濾波器,其理想頻域區(qū)域是扇形形狀,對(duì)扇形濾波器采用不同的采樣矩陣進(jìn)行上采樣,再對(duì)上一級(jí)方向分解的子帶進(jìn)行濾波,得到頻域的方向分解.當(dāng)方向?yàn)V波器組數(shù)目較多時(shí),得到的子帶圖像代表各個(gè)方向的分解圖像,具有優(yōu)異的輪廓和邊界保持效果.如果對(duì)某尺度下子帶圖像做t級(jí)方向分解,可以獲得2t個(gè)與原圖像相同尺寸大小的方向子帶圖像.因此,圖像經(jīng)過(guò)K級(jí)NSCT后可得到個(gè)與原圖像尺寸大小相同的子帶圖像,其中tk是尺度k下的方向分解級(jí)數(shù)[21?22].綜上描述,NSCT分解得到的子帶圖像具有平移不變性、良好的輪廓和邊界保持效果,這些子帶圖像可以用來(lái)作為目標(biāo)識(shí)別的特征圖.
海洋SAR圖像存在嚴(yán)重的相干斑噪聲,使得圖像像素的灰度值不完全反映地物的后向散射特性,基于單個(gè)像素特征進(jìn)行分類識(shí)別往往達(dá)不到很好的效果.考慮到圖像的統(tǒng)計(jì)特性,近鄰像素點(diǎn)的特性比較接近,可以聯(lián)合起來(lái)進(jìn)行協(xié)同表示.為了增加不同類別特征的差異性,并且抑制相干斑噪聲的影響,本研究提出一個(gè)深度協(xié)同稀疏編碼網(wǎng)絡(luò)(DCSCN),采用超像素分割的方法將圖像進(jìn)行分割,然后對(duì)每個(gè)超像素塊內(nèi)像素點(diǎn)對(duì)應(yīng)的特征聯(lián)合優(yōu)化,使得同個(gè)超像素塊的像素特征更趨于相似并平滑掉相干斑噪聲.為了獲得更豐富的特征,在DCSCN網(wǎng)絡(luò)前先進(jìn)行預(yù)處理,再通過(guò)二維Gabor變換和NSCT來(lái)提取紋理特征和輪廓特征.圖3給出了整個(gè)算法的流程圖.
圖3 基于深層協(xié)同稀疏編碼網(wǎng)絡(luò)算法流程圖Fig.3 The flow chart of the proposed algorithm
如圖3所示,本文算法先對(duì)輸入SAR圖像進(jìn)行幾何校正、灰度拉伸和增強(qiáng)Lee濾波去噪的預(yù)處理過(guò)程,再利用二維Gabor濾波器和NSCT濾波器提取圖像的特征,并進(jìn)行超像素分割,然后將各個(gè)超像素塊特征組輸入DCSCN網(wǎng)絡(luò)進(jìn)行特征優(yōu)化和分類識(shí)別,最后輸出識(shí)別結(jié)果.
本研究中使用了一種基于幾何流的水平集方法(TurborPixels)[23],將SAR圖像分割成M 個(gè)超像素塊{S1,S2,···,SM}.把每個(gè)超像素塊特征組輸入到DCSCN網(wǎng)絡(luò)進(jìn)行協(xié)同表示和分類識(shí)別.下面詳細(xì)描述了DCSCN網(wǎng)絡(luò)結(jié)構(gòu)和網(wǎng)絡(luò)訓(xùn)練過(guò)程.
3.1DCSCN網(wǎng)絡(luò)結(jié)構(gòu)
根據(jù)第1節(jié)描述,堆疊自動(dòng)編碼器可以學(xué)習(xí)到圖像更高層次的特征,使得不同類別樣本特征區(qū)分度增大.為了讓隱含層單元激勵(lì)的平均輸出較小,對(duì)每個(gè)自動(dòng)編碼器進(jìn)行稀疏約束,可以避免參數(shù)取值過(guò)大,防止過(guò)學(xué)習(xí).稀疏自動(dòng)編碼器的目標(biāo)是使得解碼輸出盡量接近輸入,本文為了有效抑制相干斑噪聲,希望各個(gè)像素特征通過(guò)編碼器的解碼輸出與其相應(yīng)的超像素塊特征組的平均特征接近,提出了協(xié)同稀疏編碼器來(lái)對(duì)每個(gè)超像素塊的特征組聯(lián)合訓(xùn)練學(xué)習(xí).將多個(gè)協(xié)同稀疏編碼器堆疊起來(lái)構(gòu)成了深度協(xié)同稀疏編碼網(wǎng)絡(luò)(DCSCN),圖4給出了網(wǎng)絡(luò)結(jié)構(gòu)圖.圖中網(wǎng)絡(luò)共包含L層,第1層到第L?1層網(wǎng)絡(luò)為協(xié)同稀疏編碼器,第L層網(wǎng)絡(luò)為Softmax分類器.為了進(jìn)行協(xié)同表示,各層協(xié)同稀疏編碼器的輸入對(duì)輸出進(jìn)行約束,即每個(gè)特征的輸出都要與輸入的這組特征的平均值盡量接近.因此,在前向逐層訓(xùn)練過(guò)程中,每層參數(shù)都是將特征組的特征依次輸入網(wǎng)絡(luò)后確定的.完成逐層貪心訓(xùn)練后,整個(gè)網(wǎng)絡(luò)的參數(shù)通過(guò)后向反饋整體微調(diào).
圖4 深度協(xié)同稀疏編碼網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.4 The structure of deep collaborative sparse coding network
3.2DCSCN網(wǎng)絡(luò)訓(xùn)練
DCSCN網(wǎng)絡(luò)需要先確定各層參數(shù),然后再進(jìn)行分類識(shí)別.網(wǎng)絡(luò)各層參數(shù)的優(yōu)化分為預(yù)訓(xùn)練(Pretraining)和整體微調(diào)(Fine-tune)兩個(gè)過(guò)程.預(yù)訓(xùn)練是逐層優(yōu)化各層網(wǎng)絡(luò)的參數(shù).整體微調(diào)是從頂層引入標(biāo)簽信息來(lái)優(yōu)化整個(gè)網(wǎng)絡(luò)參數(shù),可以使得網(wǎng)絡(luò)輸出的特征更適合于分類器.
3.2.1DCSCN網(wǎng)絡(luò)預(yù)訓(xùn)練
預(yù)訓(xùn)練過(guò)程是將訓(xùn)練樣本的特征輸入到網(wǎng)絡(luò),逐層訓(xùn)練得到各層網(wǎng)絡(luò)的參數(shù).對(duì)于第k層網(wǎng)絡(luò),參數(shù)優(yōu)化的目標(biāo)函數(shù)為
其中,ρ是稀疏性參數(shù).ρ?j表示第j個(gè)隱含單元在所有超像素塊特征組編碼后的平均激勵(lì)值,其中可知,j的大小由網(wǎng)絡(luò)權(quán)重和偏置決定[24].ρ是人為設(shè)定的接近0的數(shù)值,目的是讓j的值接近0,這樣隱含層的輸出值接近0,使得隱含層具有稀疏性.目標(biāo)方程(6)利用此約束項(xiàng)求解網(wǎng)絡(luò)權(quán)重和偏置,目的是使得網(wǎng)絡(luò)的隱含層輸出具有稀疏性.
根據(jù)網(wǎng)絡(luò)的目標(biāo)函數(shù),通過(guò)梯度下降法來(lái)確定網(wǎng)絡(luò)的參數(shù).對(duì)于第k層協(xié)同稀疏編碼器,設(shè)定
根據(jù)以上分析,下面給出了利用梯度下降法求第k層網(wǎng)絡(luò)參數(shù)的具體過(guò)程:
3.2.2DCSCN網(wǎng)絡(luò)整體微調(diào)
通過(guò)預(yù)訓(xùn)練逐層學(xué)習(xí)各層參數(shù),再?gòu)捻攲蛹尤胗?xùn)練樣本標(biāo)簽信息來(lái)優(yōu)化整個(gè)網(wǎng)絡(luò)參數(shù),可以使得網(wǎng)絡(luò)輸出的特征更適合于分類器,即不同類別的樣本特征差異更大.整體微調(diào)網(wǎng)絡(luò)參數(shù)采用了誤差反向傳播梯度下降算法,設(shè)網(wǎng)絡(luò)層數(shù)為L(zhǎng),則目標(biāo)函數(shù)表示如下
步驟1.設(shè)權(quán)重系數(shù)的修改量為?WWW,考慮到學(xué)習(xí)速率η,有
同理,可得偏置系數(shù)的修改量
3.2.3分類識(shí)別
訓(xùn)練好整個(gè)網(wǎng)絡(luò)的參數(shù)后,最后一層Softmax分類器可以用來(lái)對(duì)樣本進(jìn)行識(shí)別.如果樣本是目標(biāo),則對(duì)應(yīng)的標(biāo)簽為+1;如果樣本不是目標(biāo),則對(duì)應(yīng)的標(biāo)簽為?1.樣本是否為目標(biāo)的概率計(jì)算如下
本文采用人工合成SAR圖像和真實(shí)SAR圖像-北戴河海域Radarsat-2數(shù)據(jù)進(jìn)行實(shí)驗(yàn).本文與其他幾種常用的識(shí)別方法進(jìn)行比較,分別是支持向量機(jī)(Support vector machine,SVM)[25]、聯(lián)合稀疏表示分類算法(Simultaneous orthogonal matching pursuit,SOMP)[26]、未做改進(jìn)的堆疊自動(dòng)編碼器(SAE)[24]和稀疏編碼-池化分類算法(Lasso-Pooling)[27].Lasso-Pooling算法,先采用Lasso算法對(duì)每個(gè)像素點(diǎn)稀疏編碼得到稀疏向量,然后對(duì)超像素分割后同一像素塊的各個(gè)像素點(diǎn)稀疏向量采用最大值池化(Max pooling)得到一個(gè)稀疏向量,最后利用聯(lián)合稀疏表示分類器進(jìn)行分類.為了比較各個(gè)算法的識(shí)別效果,采用總分類精度(Overall accuracy,OA)和Kappa系數(shù)(Kappa coefficient,κ)作為識(shí)別精度的評(píng)價(jià)指標(biāo).總分類精度反映了整體圖像識(shí)別的誤差性,計(jì)算公式如下
Kappa系數(shù)反映了樣本的識(shí)別結(jié)果與真實(shí)標(biāo)記類型相一致的概率,計(jì)算公式如下
其中,M表示誤差混淆矩陣(Confusion matrix),是一個(gè)C×C的矩陣,C是類別數(shù)量,Mji表示類別j被誤分類為類別i的樣本數(shù)量.N表示總的樣本數(shù)量.
本文實(shí)驗(yàn)還比較了各個(gè)算法的計(jì)算效率,實(shí)驗(yàn)所用的計(jì)算平臺(tái)為PC(Intel Core i7 4.0GHz CPU,32GB RAM),操作系統(tǒng)為Windows 7,所有算法采用Matlab編寫(xiě).
4.1仿真實(shí)驗(yàn)
4.1.1人工SAR圖像
為了驗(yàn)證DCSCN網(wǎng)絡(luò)在目標(biāo)識(shí)別上的可行性和有效性,設(shè)計(jì)人工SAR圖像進(jìn)行實(shí)驗(yàn).該圖像中包含了多個(gè)不同形狀的目標(biāo),圖像大小為200×200.通過(guò)對(duì)該圖像的目標(biāo)識(shí)別來(lái)說(shuō)明DCSCN網(wǎng)絡(luò)的普適性.圖5(a)和圖5(b)分別給出了人工SAR圖像及其相應(yīng)的目標(biāo)真值圖.
圖5 人工SAR圖像數(shù)據(jù)Fig.5 The artificial SAR data
4.1.2網(wǎng)絡(luò)參數(shù)設(shè)置
根據(jù)第3節(jié)介紹,本文分別利用二維Gabor變換和NSCT來(lái)提取圖像紋理特征和輪廓特征,初始特征會(huì)對(duì)最后的識(shí)別精度有一定影響.根據(jù)經(jīng)驗(yàn),采用5個(gè)尺度、8個(gè)方向的二維Gabor濾波器組來(lái)提取圖像紋理特征,利用3級(jí)NSCT分解得到15個(gè)子帶圖像作為輪廓特征,將這些特征堆疊起來(lái)構(gòu)成55維的特征.然后,采用TurborPixels將圖像分割為1000個(gè)超像素塊,將各個(gè)小塊特征組輸入到DCSCN網(wǎng)絡(luò)中進(jìn)行特征學(xué)習(xí)和分類識(shí)別.
DCSCN網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù)對(duì)識(shí)別精度有很大的影響.考慮到算法的復(fù)雜度,設(shè)計(jì)三層結(jié)構(gòu)的DCSCN,前兩層進(jìn)行特征稀疏編碼,最高層進(jìn)行分類識(shí)別.根據(jù)實(shí)驗(yàn)經(jīng)驗(yàn),網(wǎng)絡(luò)的權(quán)重衰減系數(shù)λ設(shè)置為0.005,稀疏性懲罰因子β設(shè)置為0.1,稀疏性參數(shù)ρ設(shè)置為0.2.各層隱含單元數(shù)目對(duì)分類識(shí)別的精度有明顯影響,因此這里詳細(xì)描述了隱含單元數(shù)目的確定過(guò)程.由于最高層用于識(shí)別,最高層隱含單元數(shù)等于類別數(shù),所以只需要分析前兩層隱含單元數(shù)目對(duì)識(shí)別結(jié)果的影響.實(shí)驗(yàn)中,隨機(jī)選取20%的超像素塊作為訓(xùn)練集,其他超像素塊用來(lái)驗(yàn)證算法的識(shí)別精度.通過(guò)改變其中一個(gè)參數(shù)的同時(shí)固定另一個(gè)參數(shù),來(lái)討論隱含單元數(shù)目對(duì)結(jié)果的影響.
圖6(a)和圖6(b)分別給出了總分類精度和Kappa系數(shù)隨著兩層隱含單元數(shù)目變化的變化情況.實(shí)驗(yàn)中,第一層隱含單元數(shù)目在20到150之間變化,第二層隱含單元數(shù)目在20到100之間變化.實(shí)驗(yàn)結(jié)果表明,當(dāng)前兩層的隱含單元數(shù)目分別為100和40時(shí),網(wǎng)絡(luò)的識(shí)別精度最高.當(dāng)?shù)诙与[含單元數(shù)目一定,第一層隱含單元數(shù)目取值在90到110之間時(shí),識(shí)別的精度優(yōu)于其他情況的結(jié)果.即第一層隱含單元數(shù)目比輸入樣本特征維度要高,其原因是輸入的樣本初始特征是非線性的,當(dāng)隱含單元數(shù)目比輸入單元數(shù)目大時(shí),網(wǎng)絡(luò)第一層相當(dāng)于對(duì)特征進(jìn)行高維空間映射,使得特征更加線性化、更利于分類識(shí)別.當(dāng)?shù)谝粚与[含單元數(shù)目一定,第二層隱含單元數(shù)目取值在30到40之間時(shí),識(shí)別的精度優(yōu)于其他情況的結(jié)果.網(wǎng)絡(luò)第二層的作用相當(dāng)于對(duì)特征進(jìn)行降維,降維處理不能降得太低或者太高.這是因?yàn)榻稻S維度過(guò)低會(huì)壓縮掉有用信息,而降維維度較高時(shí)訓(xùn)練分類器容易發(fā)生過(guò)擬合現(xiàn)象.
圖6 DCSCN網(wǎng)絡(luò)參數(shù)設(shè)置Fig.6 Parameter setting of the DCSCN
4.1.3對(duì)比實(shí)驗(yàn)結(jié)果與分析
為了證明DCSCN在SAR圖像目標(biāo)識(shí)別中的效果,本文與SVM算法、SOMP算法、Lasso-Pooling算法及未做改進(jìn)的SAE網(wǎng)絡(luò)進(jìn)行對(duì)比.對(duì)比算法采用的樣本特征與輸入到DCSCN網(wǎng)絡(luò)的特征一致,都是由二維Gabor濾波器和NSCT濾波器得到的55維特征.根據(jù)前述實(shí)驗(yàn)分析,DCSCN網(wǎng)絡(luò)為三層,前兩層的隱含單元數(shù)目分別為100和40.SVM采用了高斯徑向基作為核函數(shù),參數(shù)通過(guò)十次交叉驗(yàn)證得到.SOMP算法、Lasso-Pooling算法中的主要參數(shù)為稀疏度和重建誤差極值,分別設(shè)定為10和10?3.SAE網(wǎng)絡(luò)采用了與本文提出的DCSCN網(wǎng)絡(luò)相同的結(jié)構(gòu),都設(shè)計(jì)了三層結(jié)構(gòu)的網(wǎng)絡(luò),前兩層的隱含單元數(shù)目分別為100和40,最高層進(jìn)行分類識(shí)別.通過(guò)五次實(shí)驗(yàn)來(lái)分析各個(gè)算法的識(shí)別效果,每次實(shí)驗(yàn)隨機(jī)選取20%的樣本作為訓(xùn)練集,其他樣本作為測(cè)試集,計(jì)算五次實(shí)驗(yàn)結(jié)果的均值和標(biāo)準(zhǔn)差.表1給出了各種算法識(shí)別精度和算法效率的結(jié)果對(duì)比.
根據(jù)表1結(jié)果,DCSCN識(shí)別精度要明顯高于其他四種算法.對(duì)比SAE和DCSCN實(shí)驗(yàn)結(jié)果,基于SAE提出的DCSCN網(wǎng)絡(luò)可以提高目標(biāo)識(shí)別精度,說(shuō)明本文對(duì)DCSCN網(wǎng)絡(luò)的設(shè)計(jì)是有效的.DCSCN網(wǎng)絡(luò)考慮了近鄰像素的協(xié)同性,通過(guò)聯(lián)合優(yōu)化得到近鄰像素特征表示,能平滑掉相干斑噪聲,從而有效降低相干斑噪聲對(duì)識(shí)別結(jié)果的影響.由于SVM算法、SOMP算法、Lasso-Pooling算法和DCSCN網(wǎng)絡(luò)輸入的初始特征都是由二維Gabor濾波器和NSCT濾波器分別提取的紋理特征和輪廓特征,而DCSCN網(wǎng)絡(luò)識(shí)別精度得到明顯提高,這說(shuō)明經(jīng)過(guò)DCSCN網(wǎng)絡(luò)優(yōu)化后的不同類別特征的區(qū)分度更大,更適合于分類器進(jìn)行識(shí)別.對(duì)比各個(gè)算法的計(jì)算耗時(shí)發(fā)現(xiàn),DCSCN網(wǎng)絡(luò)計(jì)算效率比SVM算法略差,但要優(yōu)于其他方法.這是由于SOMP算法和Lasso-Pooling算法的計(jì)算復(fù)雜度隨著樣本數(shù)成高次方增長(zhǎng),而DCSCN網(wǎng)絡(luò)計(jì)算復(fù)雜度隨迭代次數(shù)、樣本數(shù)和網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)線性變化.因此,基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的DCSCN網(wǎng)絡(luò)計(jì)算復(fù)雜度低于基于稀疏編碼的SOMP算法及Lasso-Pooling算法.
表1 各個(gè)算法在人工SAR圖像上識(shí)別結(jié)果對(duì)比Table 1 Recognition performance comparison of different algorithms on the artificial SAR image
圖7顯示了五種算法的目標(biāo)識(shí)別結(jié)果圖.對(duì)比五幅圖可知,DCSCN網(wǎng)絡(luò)表現(xiàn)出更好的識(shí)別結(jié)果,誤分類點(diǎn)比其他方法更少.同時(shí)發(fā)現(xiàn),SOMP算法和Lasso-Pooling算法結(jié)果圖的孤立誤分類點(diǎn)也很少,這是因?yàn)镾OMP算法、Lasso-Pooling算法和本文DCSCN網(wǎng)絡(luò)都考慮了近鄰像素的協(xié)同性,而通過(guò)空間近鄰協(xié)同可以平滑掉相干斑噪聲,所以這三種算法對(duì)相干斑噪聲抑制作用明顯.由于DCSCN算法有優(yōu)異的特征表示能力,所以其識(shí)別精度明顯高于SOMP算法和Lasso-Pooling算法.此外,SVM算法和SAE算法結(jié)果的孤立誤分類點(diǎn)很多,原因是這兩種算法是基于像素的分類識(shí)別,未考慮空間協(xié)同相關(guān)性,相關(guān)斑噪聲對(duì)識(shí)別產(chǎn)生很大的影響.
圖7 人工SAR圖像目標(biāo)識(shí)別結(jié)果Fig.7 Target recognition results of the artificial SAR image
4.2浮筏識(shí)別實(shí)驗(yàn)
為了驗(yàn)證DCSCN網(wǎng)絡(luò)在海洋浮筏養(yǎng)殖目標(biāo)識(shí)別的有效性,選取北戴河海域作為研究區(qū)域.圖8(a)和圖8(b)是北戴河海域的兩個(gè)不同傳感器的多光譜圖像,分別是Landsat-8衛(wèi)星圖像和資源三號(hào)衛(wèi)星圖像.圖8(c)為Radarsat-2衛(wèi)星的SAR圖像,極化方式為HH,分辨率為5m.比較這三幅圖可以發(fā)現(xiàn),多光譜圖像不能有效地獲取北戴河海域的浮筏目標(biāo),而在SAR圖像中有清晰的浮筏目標(biāo).這是由于海洋散射信號(hào)較弱,光譜成像衛(wèi)星數(shù)據(jù)難以獲取浮筏信息,而SAR是主動(dòng)式微波成像,利于獲取海洋信息.圖8(d)為現(xiàn)場(chǎng)測(cè)繪時(shí)拍攝的實(shí)景圖片.從圖8(c)選取兩塊海域的圖像來(lái)驗(yàn)證本文提出算法的效果,選取的圖像1和圖像2分別如圖8(e)和圖8(g),圖像大小分別為1275×1140和600×600.根據(jù)現(xiàn)場(chǎng)測(cè)繪的數(shù)據(jù)繪制出相應(yīng)的真值圖如圖8(f)和8(h).
圖8 北戴河區(qū)域SAR數(shù)據(jù)Fig.8 The original SAR data of Beidaihe area
在SAR圖像1上進(jìn)行實(shí)驗(yàn),先做幾何校正、灰度拉伸和增強(qiáng)Lee濾波去噪,再采用二維Gabor變換和NSCT提取圖像紋理特征和輪廓特征.與仿真實(shí)驗(yàn)相同,采用3級(jí)NSCT分解和5個(gè)尺度、8個(gè)方向的二維Gabor濾波器得到55維的特征.采用TurborPixels將圖像分割為40000個(gè)超像素塊,將各個(gè)小塊輸入到DCSCN網(wǎng)絡(luò)中進(jìn)行特征學(xué)習(xí)并分類識(shí)別.DCSCN網(wǎng)絡(luò)共三層,前兩層的隱含層單元數(shù)目分別設(shè)置為100和40.網(wǎng)絡(luò)其他參數(shù)的設(shè)置與仿真實(shí)驗(yàn)相同.同樣,為說(shuō)明本文算法在海洋浮筏養(yǎng)殖目標(biāo)識(shí)別的優(yōu)越性能,本文與SVM、SOMP、Lasso-Pooling和SAE進(jìn)行了比較.表2給出了各個(gè)算法識(shí)別精度和算法效率的對(duì)比,這里每個(gè)算法效率的統(tǒng)計(jì)都是指整個(gè)識(shí)別過(guò)程,即從輸入圖像到最后得出分類識(shí)別結(jié)果.圖9給出了各個(gè)算法目標(biāo)識(shí)別結(jié)果圖.
根據(jù)表2結(jié)果,DCSCN網(wǎng)絡(luò)的總分類精度和Kappa系數(shù)都明顯好于其他四種算法.結(jié)果表明,本文DCSCN網(wǎng)絡(luò)具有優(yōu)異的特征表示能力,可以得到區(qū)分性更大、更適合分類器的特征.同時(shí),DCSCN通過(guò)空間近鄰協(xié)同約束,有效地抑制SAR圖像相干斑噪聲的影響,所以在分類精度上明顯優(yōu)于現(xiàn)有的三種方法.此外,DCSCN的算法效率更優(yōu),比其他四種算法耗時(shí)都少.這是由于DCSCN網(wǎng)絡(luò)計(jì)算復(fù)雜度隨迭代次數(shù)、樣本數(shù)和網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)線性變化,而SVM算法、SOMP算法和Lasso-Pooling算法的計(jì)算復(fù)雜度隨著樣本數(shù)成高次方增長(zhǎng),所以DCSCN網(wǎng)絡(luò)計(jì)算復(fù)雜度較低.在圖像尺寸較大、樣本較多的時(shí)候,DCSCN能夠有效地降低計(jì)算量,使得計(jì)算效率優(yōu)于其他算法.
表2 各個(gè)算法在SAR圖像1浮筏識(shí)別結(jié)果對(duì)比Table 2 Recognition performance comparison of different algorithms on the first SAR image
對(duì)比圖9各個(gè)算法的結(jié)果圖,DCSCN識(shí)別效果要明顯優(yōu)于其他四種算法的結(jié)果.分析發(fā)現(xiàn),SVM和SAE識(shí)別結(jié)果圖存在較多誤分類噪點(diǎn),而本文算法、SOMP算法和Lasso-Pooling算法誤分類噪點(diǎn)較少.這是由于這三種算法都采用了近鄰協(xié)同約束,可以有效抑制SAR圖像相干斑噪聲.同時(shí),本文算法的誤分類噪點(diǎn)更少,說(shuō)明本文算法在抑制相干斑噪聲方面的效果更好.本文算法要優(yōu)于SAE算法結(jié)果,說(shuō)明稀疏約束和協(xié)同約束能使得深度網(wǎng)絡(luò)學(xué)到區(qū)分性更大的特征.此外,在實(shí)際SAR圖像上的實(shí)驗(yàn)結(jié)果與人工SAR圖像的實(shí)驗(yàn)結(jié)果得到了一致的結(jié)論,充分證明了算法的有效性和適應(yīng)性.
由于海洋不同區(qū)域的后向散射特性存在差異,為了說(shuō)明本文DCSCN網(wǎng)絡(luò)對(duì)不同海域浮筏的識(shí)別能力,對(duì)SAR圖像2進(jìn)行相同的實(shí)驗(yàn).與SAR圖像1上實(shí)驗(yàn)一樣,先進(jìn)行幾何校正、灰度拉伸和增強(qiáng)Lee濾波去噪,再采用5個(gè)尺度、8個(gè)方向的二維Gabor濾波器和3級(jí)NSCT濾波器提取出55維的特征,然后采用TurborPixels將圖像分割為10000個(gè)超像素塊,最后將各個(gè)小塊輸入到三層結(jié)構(gòu)的DCSCN網(wǎng)絡(luò)中進(jìn)行特征學(xué)習(xí)和分類識(shí)別.表3給出了各個(gè)算法識(shí)別精度和算法效率的對(duì)比,圖10給出了各個(gè)算法目標(biāo)識(shí)別結(jié)果圖.
分析圖10和表3結(jié)果,DCSCN網(wǎng)絡(luò)的識(shí)別精度和算法效率都優(yōu)于其他四種算法,這一結(jié)論和前面分析一致.這充分說(shuō)明,不同海域即使海洋后向散射特性有差別的情況下,DCSCN網(wǎng)絡(luò)都能達(dá)到較好的浮筏養(yǎng)殖識(shí)別結(jié)果.
表3 各個(gè)算法在SAR圖像2浮筏識(shí)別結(jié)果對(duì)比Table 3 Recognition performance comparison of different algorithms on the second SAR image
圖9 SAR圖像1浮筏識(shí)別結(jié)果Fig.9 Target recognition results of the first SAR image
圖10 SAR圖像2浮筏識(shí)別結(jié)果Fig.10 Target recognition results of the second SAR image
本文針對(duì)海洋遙感SAR圖像嚴(yán)重的相干斑噪聲污染和SAR圖像特征單一的問(wèn)題,提出一種深度協(xié)同稀疏編碼網(wǎng)絡(luò),進(jìn)行SAR圖像特征表示和目標(biāo)識(shí)別.通過(guò)人工SAR圖像和北戴河兩個(gè)海域浮筏養(yǎng)殖SAR圖像的實(shí)驗(yàn),證明本文所提網(wǎng)絡(luò)的有效性和適用性.結(jié)果表明,深度協(xié)同稀疏編碼網(wǎng)絡(luò)不僅可以有效優(yōu)化近鄰像素特征組來(lái)提高識(shí)別精度,而且能有效抑制SAR圖像相干斑噪聲的影響.此外,深度協(xié)同稀疏編碼網(wǎng)絡(luò)計(jì)算效率較高,在圖像尺寸較大時(shí)表現(xiàn)出更好的效率.
References
1 Yu Hang,Jiao Li-Cheng,Liu Fang.Context based unsupervised hierarchical iterative algorithm for SAR segmentation. Acta Automatica Sinica,2014,40(1):100?116(余航,焦李成,劉芳.基于上下文分析的無(wú)監(jiān)督分層迭代算法用于SAR圖像分割.自動(dòng)化學(xué)報(bào),2014,40(1):100?116)
2 Zhao Ming-Bo,He Jun,F(xiàn)u Qiang.Survey on fast CFAR detection algorithms for SAR image targets.Acta Automatica Sinica,2012,38(12):1885?1895(趙明波,何峻,付強(qiáng).SAR圖像CFAR檢測(cè)的快速算法綜述.自動(dòng)化學(xué)報(bào),2012,38(12):1885?1895)
3 Chu Jia-Lan,Zhao Dong-Zhi,Zhang Feng-Shou.Wakame raft interpretation method of remote sensing based on association rules.Remote Sensing Technology and Application,2012,27(6):941?946(初佳蘭,趙冬至,張豐收.基于關(guān)聯(lián)規(guī)則的裙帶菜筏式養(yǎng)殖遙感識(shí)別方法.遙感技術(shù)與應(yīng)用,2012,27(6):941?946)
4 Fan Jian-Chao,Zhang Feng-Shou,Zhao Dong-Zhi,Wen Shi-Yong,Wei Bao-Quan.Floating raft aquaculture extraction based on high resolution satellite remote sensing SAR images.In:Proceedings of the 2nd Symposium on Disaster Risk Analysis and Management in Chinese Littoral Regions. 2014.59?63(范劍超,張豐收,趙冬至,文世勇,衛(wèi)寶泉.基于高分辨率衛(wèi)星遙感SAR圖像的海洋浮筏養(yǎng)殖信息提取.見(jiàn):第二屆中國(guó)沿海地區(qū)災(zāi)害風(fēng)險(xiǎn)分析與管理學(xué)術(shù)研討會(huì).2014.59?63)
5 Qazi W A,Emery W J,F(xiàn)ox-Kemper B.Computing ocean surface currents over the coastal california current system using 30-min-lag sequential SAR images.IEEE Transactions on Geoscience and Remote Sensing,2014,52(12): 7559?7580
6 Pan De-Lu,Lin Ming-Shen,Mao Zhi-Hua.Microwave Remote Sensing and Application of Ocean.Beijing:Ocean Press,2013.(潘德?tīng)t,林明森,毛志華.海洋微波遙感與應(yīng)用.北京:海洋出版社,2013.)
7 Collins M J,Allan J M.Modeling and simulation of SAR image texture.IEEE Transactions on Geoscience and Remote Sensing,2009,47(10):3530?3546
8 Liu C J,Wechsler H.Gabor feature based classification using the enhanced fisher linear discriminant model for face recognition.IEEE Transactions on Image Processing,2002,11(4):467?476
9 Do M N,Vetterli M.The contourlet transform:an efficient directional multiresolution image representation. IEEE Transactions on Image Processing,2005,14(12): 2091?2106
10 Da Cunha A L,Zhou J P,Do M N.The nonsubsampled contourlet transform:theory,design,and applications. IEEE Transactions on Image Processing,2006,15(10): 3089?3101
11 Yang X H,Jiao L C.Fusion algorithm for remote sensing images based on nonsubsampled contourlet transform.Acta Automatica Sinica,2008,34(3):274?281
12 Hinton G E,Osindero S,Teh Y W.A fast learning algorithm for deep belief nets.Neural Computation,2006,18(7): 1527?1554
13 Salakhutdinov R,Tenenbaum J B,Torralba A.Learning with hierarchical-deep models.IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(8): 1958?1971
14 Goh H,Thome N,Cord M,Lim J H.Learning deep hierarchical visual feature coding.IEEE Transactions on Neural Networks and Learning Systems,2014,25(12):2212?2225
15 Zheng Yin,Chen Quan-Qi,Zhang Yu-Jin.Deep learning and its new progress in object and behavior recognition.Journal of Image and Graphics,2014,19(2):175?184(鄭胤,陳權(quán)崎,章毓晉.深度學(xué)習(xí)及其在目標(biāo)和行為識(shí)別中的新進(jìn)展.中國(guó)圖象圖形學(xué)報(bào),2014,19(2):175?184)
16 Chen X Y,Xiang S M,Liu C L,Pan C H.Vehicle detection in satellite images by hybrid deep convolutional neural networks.IEEE Geoscience and Remote Sensing Letters,2014,11(10):1797?1801
17 Chen Y S,Lin Z H,Zhao X,Wang G,Gu Y F.Deep learningbased classification of hyperspectral data.IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2014,7(6):2094?2107
18 Feng Bo,Chen Bo,Wang Peng-Hui,Liu Hong-Wei.Feature extraction method for radar high resolution range profile targets based on robust deep networks.Journal of Electronics&Information Technology,2014,36(12):2949?2955(馮博,陳渤,王鵬輝,劉宏偉.基于穩(wěn)健深層網(wǎng)絡(luò)的雷達(dá)高分辨距離像目標(biāo)特征提取算法.電子與信息學(xué)報(bào),2014,36(12): 2949?2955)
19 Li Shuai,Xu Yue-Lei,Ma Shi-Ping,Ni Jia-Cheng,Wang Kun.SAR target recognition using wavelet transform and deep sparse autoencoders.Video Engineering,2014,38(13): 31?35(李帥,許悅雷,馬時(shí)平,倪嘉成,王坤.基于小波變換和深層稀疏編碼的SAR目標(biāo)識(shí)別.電視技術(shù),2014,38(13):31?35)
20 Rai P,Khanna P.A gender classification system robust to occlusion using gabor features based 2D2PCA.Journal of Visual Communication and Image Representation,2014,25(5):1118?1129
21 Zhang Qiang,Guo Bao-Long.Fusion of multi-sensor images based on the nonsubsampled contourlet transform.Acta Automatica Sinica,2008,34(2):135?141(張強(qiáng),郭寶龍.基于非采樣Contourlet變換多傳感器圖像融合算法.自動(dòng)化學(xué)報(bào),2008,34(2):135?141)
22 Yan C M,Guo B L,Yi M.Fast algorithm for nonsubsampled contourlet transform.Acta Automatica Sinica,2014,40(4): 757?762
23 Levinshtein A,Stere A,Kutulakos K N,F(xiàn)leet D J,Dickinson S J,Siddiqi K.TurboPixels:fast superpixels using geometric flows.IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31(12):2290?2297
24 Ng A.Sparse autoencoder[Online],available:http://web. stanford.edu/class/cs294a/sae/,November 8,2015.
25 Chang C C,Lin C J.LIBSVM:a library for support vector machines.ACM Transactions on Intelligent Systems and Technology,2011,2(3):Article No.27
26 Chen Y,Nasrabadi N M,Tran T D.Simultaneous joint sparsity model for target detection in hyperspectral imagery. IEEE Geoscience and Remote Sensing Letters,2011,8(4): 676?680
27 Mairal J,Bach F,Ponce J.Sparse modeling for image and vision processing.Foundations Trend in Computer Graphics Vision,2014,8(2?3):85?283
耿 杰大連理工大學(xué)電子信息與電氣工程學(xué)部博士研究生.主要研究方向?yàn)镾AR圖像處理,模式識(shí)別.E-mail:gengjie@mail.dlut.edu.cn
(GENG JiePh.D.candidate at the Faculty of Electronic Information and Electrical Engineering,Dalian University of Technology.His research interest covers SAR image processing and pattern recognition.)
范劍超國(guó)家海洋環(huán)境監(jiān)測(cè)中心,大連理工大學(xué)電子信息與電氣工程學(xué)部副研究員.主要研究方向?yàn)樯窠?jīng)網(wǎng)絡(luò),模式識(shí)別和遙感圖像處理.本文通信作者.E-mail:fjchaonmemc@163.com
(FAN Jian-ChaoAssociate professor at National Marine Environment Monitoring Center and Dalian University of Technology.His research interest covers neural network,pattern recognition,and remote sensing image processing.Corresponding author of this paper.)
初佳蘭國(guó)家海洋環(huán)境監(jiān)測(cè)中心工程師.主要研究方向?yàn)楹S騽?dòng)態(tài)衛(wèi)星遙感應(yīng)用.E-mail:jlchu@nmemc.org.cn
(CHUJia-LanEngineer at National Marine Environment Monitoring Center.Her research interest covers sea dynamic surveillance remote sensing application.)
王洪玉大連理工大學(xué)電子信息與電氣工程學(xué)部教授.主要研究方向?yàn)閳D像處理,模式識(shí)別和無(wú)線傳感器網(wǎng)絡(luò).E-mail:whyu@dlut.edu.cn
(WANG Hong-YuProfessor at the Faculty of Electronic Information and Electrical Engineering,Dalian University of Technology.His research interest covers image processing,pattern recognition,and wireless sensor networks.)
Research on Marine Floating Raft Aquaculture SAR Image Target Recognition Based on Deep Collaborative Sparse Coding Network
GENG Jie1FAN Jian-Chao1,2CHU Jia-Lan2WANG Hong-Yu1
Floating raft aquaculture is widely distributed in the offshore ocean of China.Since raft information cannot be obtained accurately in the visible remote sensing image,active imaging images acquired from synthetic aperture radar(SAR)are applied.However,oceanic SAR images are seriously contaminated by speckle noise,and effective features of SAR images are deficient,which make recognition difficult.In order to overcome these problems,a deep collaborative sparse coding network(DCSCN)is proposed to extract features and conduct recognition automatically.The proposed method extracts texture features and contour features from the pre-processed image firstly.Then,it segments the image into patches and learns features of each patch collaboratively through the DCSCN network.The optimized features are used for recognition finally.Experiments on the artificial SAR image and the images of Beidaihe demonstrate that the proposed DCSCN network can accurately obtain the area of floating raft aquaculture.Since the network can learn discriminative features and integrate the correlated neighbor pixels,the DCSCN network improves the recognition accuracy and has better performance in overcoming the contamination of speckle noise.
Synthetic aperture radar(SAR),deep learning,sparse auto-encoders,floating raft aquaculture,target recognition
Manuscript July 6,2015;accepted January 15,2016
10.16383/j.aas.2016.c150425
Geng Jie,F(xiàn)an Jian-Chao,Chu Jia-Lan,Wang Hong-Yu.Research on marine floating raft aquaculture SAR image target recognition based on deep collaborative sparse coding network.Acta Automatica Sinica,2016,42(4): 593?604
2015-07-06錄用日期2016-01-15
國(guó)家自然科學(xué)基金(61273307,61301130),中國(guó)博士后面上基金(2014M551082),北戴河鄰近海域典型生態(tài)災(zāi)害與污染監(jiān)控海洋公益專項(xiàng)(201305003),海域使用動(dòng)態(tài)監(jiān)測(cè)和污染監(jiān)測(cè)研究專項(xiàng)資助
Supported by National Natural Science Foundation of China(61273307,61301130),the China Postdoctoral Science Foundation(2014M551082),the Public Welfare Project of Beidaihe Marine Ecological Disasters and Pollution Monitoring(201305003)and the Research of Dynamic Monitoring and Pollution Monitoring of Sea Area
本文責(zé)任編委劉躍虎
Recommended by Associate Editor LIU Yue-Hu
1.大連理工大學(xué)電子信息與電氣工程學(xué)部大連1160242.國(guó)家海洋環(huán)境監(jiān)測(cè)中心大連116023
1.Faculty of Electronic Information and Electrical Engineering,Dalian University of Technology,Dalian 1160242.Na-tional Marine Environment Monitoring Center,Dalian 116023