雷嘉興 王 偉
(西安電子工程研究所 西安 710100)
地形檢測(cè)在濱海作戰(zhàn)、搶險(xiǎn)救援等任務(wù)中具有十分重要的意義,國內(nèi)外關(guān)于這方面也有所研究。由于合成孔徑雷達(dá)(SAR, Synthetic Aperture Radar)成像具有穿透云、雨、霧,不受天氣因素干擾的全天候工作能力,我軍在實(shí)際作戰(zhàn)中也常用合成孔徑雷達(dá)作為獲取地形地理信息的手段。
但在實(shí)際使用中,通過合成孔徑雷達(dá)獲取到的地形圖像需要人手工進(jìn)行地形標(biāo)注,增大了部隊(duì)人員的工作量,同時(shí)容易延誤作戰(zhàn)、搶險(xiǎn)救援時(shí)機(jī),因此需要一種地形檢測(cè)算法來快速對(duì)地形進(jìn)行分類、檢測(cè)。針對(duì)這一困難,國內(nèi)許多研究人員也進(jìn)行了一些研究,目前應(yīng)用比較廣泛的SAR圖像地形檢測(cè)算法是WangKe等人于2012年提出的一種基于不變矩區(qū)域檢測(cè)法的SAR圖像地形檢測(cè)算法,該算法的基本原理是求取淺海地形圖片的不變矩,通過在SAR圖像上檢測(cè)相同不變矩區(qū)域的方式進(jìn)行地形檢測(cè)。由于不變矩只能反映圖像整體特征,不能反映局部特征,因此檢測(cè)準(zhǔn)確率較低,仍需要一定的手工矯正。然而隨著科技的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)在圖像識(shí)別、圖像檢測(cè)等項(xiàng)目上體現(xiàn)出得天獨(dú)厚的優(yōu)勢(shì)。自1998 年Yann LeCun提出了名為LeNet的經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)以來,經(jīng)過不斷的改進(jìn)和發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)對(duì)物體進(jìn)行識(shí)別和檢測(cè)的準(zhǔn)確率已可達(dá)到95%以上。目前卷積神經(jīng)網(wǎng)絡(luò)主要的應(yīng)用場(chǎng)景仍然是對(duì)物體的識(shí)別,如識(shí)別貓狗、識(shí)別人類身份、識(shí)別載具類型等,將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于SAR雷達(dá)成像地形檢測(cè)的研究還未見報(bào)。
因此本文提出了一種將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于SAR圖像地形檢測(cè)的算法,探究利用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)進(jìn)行地形檢測(cè)的可行性。對(duì)比實(shí)驗(yàn)證明,本文提出的基于卷積神經(jīng)網(wǎng)絡(luò)的SAR圖像地形檢測(cè)算法的分類準(zhǔn)確率相較于不變矩檢測(cè)法有顯著提高,解決了人工地形標(biāo)注工作量大、不變矩檢測(cè)法準(zhǔn)確率低的難題。
經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)(LeNet)一般由輸入層、卷積層、池化層和全連接層組成,如圖1所示。
圖1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
該神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)是結(jié)構(gòu)簡單,實(shí)現(xiàn)起來較為容易,同時(shí)具有一定的分類準(zhǔn)確性。缺點(diǎn)是參數(shù)量過大,訓(xùn)練時(shí)間較長,而且網(wǎng)絡(luò)深度不夠,對(duì)模型的擬合能力不足。與此同時(shí)在小樣本的情況下又容易產(chǎn)生過擬合現(xiàn)象。需注意的是過擬合現(xiàn)象和欠擬合現(xiàn)象兩者不能抵消,在工程中兩者都應(yīng)該避免。
用SAR圖像數(shù)據(jù)集對(duì)經(jīng)典神經(jīng)網(wǎng)絡(luò)進(jìn)行10個(gè)批次的訓(xùn)練,得到訓(xùn)練輪數(shù)與判定準(zhǔn)確率的關(guān)系如圖2所示。
圖2 經(jīng)典簡單神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確率和訓(xùn)練次數(shù)的關(guān)系
容易發(fā)現(xiàn),隨著訓(xùn)練輪數(shù)的增加,經(jīng)典神經(jīng)網(wǎng)絡(luò)識(shí)別準(zhǔn)確率較低,而且并不穩(wěn)定。這主要是由于經(jīng)典神經(jīng)網(wǎng)絡(luò)層數(shù)過少,因此參數(shù)過少,進(jìn)而導(dǎo)致的欠擬合現(xiàn)象導(dǎo)致的。
因此為了彌補(bǔ)經(jīng)典神經(jīng)網(wǎng)絡(luò)容易欠擬合的問題,應(yīng)當(dāng)適量增加網(wǎng)絡(luò)層數(shù),但網(wǎng)絡(luò)層數(shù)過多,又會(huì)加大計(jì)算復(fù)雜度。綜合網(wǎng)絡(luò)的擬合能力和計(jì)算復(fù)雜度全盤考慮,本項(xiàng)目設(shè)計(jì)了三重復(fù)合的卷積神經(jīng)網(wǎng)絡(luò)。具體來說,為了防止欠擬合現(xiàn)象,該網(wǎng)絡(luò)設(shè)計(jì)了三層重復(fù)結(jié)構(gòu),首先將輸入圖片通過兩個(gè)卷積層(Conv)對(duì)其進(jìn)行特征提取,然后利用池化層(Max-pooling)層將其最大的特征篩選出來,同時(shí)為了防止過擬合現(xiàn)象,又在一些卷積層之后加入dropout層防止過擬合,隨機(jī)遺忘了13%的神經(jīng)元特征;如此結(jié)構(gòu)共疊加三次,之后通過一個(gè)展開層(Flatten),將二維的圖片數(shù)據(jù)展開成一維的數(shù)據(jù),然后輸入全連接層(Dense)進(jìn)行邏輯分類。
該網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
圖3 三重復(fù)合卷積神經(jīng)網(wǎng)絡(luò)
矩是數(shù)理統(tǒng)計(jì)中的一個(gè)概念,表示隨機(jī)變量的某種特征。若設(shè)為離散型隨機(jī)變量,c為常數(shù),則稱(|-c|)為關(guān)于點(diǎn)c的階矩。常見的如一階原點(diǎn)矩表示的數(shù)學(xué)期望,二階中心矩表示的方差。
若將圖片每個(gè)點(diǎn)的像素灰度值歸一化后以概率表示,并將每個(gè)點(diǎn)的坐標(biāo)記為(,)則每個(gè)點(diǎn)的歸一化灰度(,)為二維離散型隨機(jī)變量(,)的概率質(zhì)量函數(shù)。
Hu在1962年利用二階和三階歸一化中心矩構(gòu)造了7個(gè)不變矩,常用于圖像檢測(cè),分別為
=+
(1)
=(-)+4
(2)
=(-3)+(3-)
(3)
=(+)+(+)
(4)
=(-3)(+)((+)-
3(+))+(3-)(+)(
3(+)-(+))
(5)
=(-)((+)-(=))+
4(+)(+)
(6)
=(3-3)(+)((+)-
3(+))-(-3)(+)
(3(+)-(+))
(7)
其中:
(8)
(9)
文章[2]提出的不變矩地形檢測(cè)法就是基于此原理。
實(shí)驗(yàn)采用的數(shù)據(jù)集來源為東南沿海某地實(shí)地拍攝的高分辨率SAR圖像。這些圖像經(jīng)過預(yù)處理后,通過人手工標(biāo)注的方式,截取了2000張有代表性的河流圖像,2000張有代表性的城鎮(zhèn)圖像,并對(duì)這些圖像一一標(biāo)注好其地形類型。從中隨機(jī)選取了100張河流圖像和100張城鎮(zhèn)圖像作為驗(yàn)證集以驗(yàn)證檢測(cè)準(zhǔn)確率,并對(duì)剩余1900張城鎮(zhèn)圖像和1900張河流圖像做數(shù)據(jù)擴(kuò)充,共計(jì)得到5700張城鎮(zhèn)圖像和5700張河流圖像,使用這5700張城鎮(zhèn)圖像和5700張河流圖像作為訓(xùn)練集來訓(xùn)練三重復(fù)合卷積神經(jīng)網(wǎng)絡(luò)。
本實(shí)驗(yàn)的實(shí)驗(yàn)步驟為:首先搭建好三重復(fù)合卷積的神經(jīng)網(wǎng)絡(luò)模型,然后使用3.1所提到的訓(xùn)練集對(duì)該神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。訓(xùn)練完成后,將驗(yàn)證集中的共計(jì)200張城鎮(zhèn)、河流圖像遮住標(biāo)簽,并使用該網(wǎng)絡(luò)進(jìn)行檢測(cè)其是何種類型的地形。檢測(cè)完成后,將該神經(jīng)網(wǎng)絡(luò)在驗(yàn)證集上的判定結(jié)果和驗(yàn)證集標(biāo)簽進(jìn)行對(duì)比,統(tǒng)計(jì)檢測(cè)的準(zhǔn)確率。
對(duì)照實(shí)驗(yàn)的實(shí)驗(yàn)步驟為:使用文章[2]提出的方法求取不變矩,在驗(yàn)證集上進(jìn)行驗(yàn)證,統(tǒng)計(jì)檢測(cè)的準(zhǔn)確率。
由于神經(jīng)網(wǎng)絡(luò)的檢測(cè)準(zhǔn)確率隨訓(xùn)練次數(shù)上升,因此上述步驟共進(jìn)行10輪。
通過10次對(duì)比實(shí)驗(yàn),得到兩種算法在驗(yàn)證集上的檢測(cè)準(zhǔn)確率分別如表1所示。
表1 兩種算法訓(xùn)練輪數(shù)與準(zhǔn)確率的關(guān)系
利用python繪制出訓(xùn)練次數(shù)與分類準(zhǔn)確率的關(guān)系如圖4所示。
圖4 分類準(zhǔn)確率與訓(xùn)練次數(shù)
通過對(duì)比實(shí)驗(yàn)的結(jié)果可以發(fā)現(xiàn):卷積神經(jīng)網(wǎng)絡(luò)僅在第一輪測(cè)試時(shí)準(zhǔn)確率低于不變矩檢測(cè)法。在第二輪訓(xùn)練之后,卷積神經(jīng)網(wǎng)絡(luò)的檢測(cè)準(zhǔn)確率迅速超過不變矩檢測(cè)法的檢測(cè)準(zhǔn)確率,并且最終達(dá)到97.5%的檢測(cè)準(zhǔn)確率。這是由于卷積神經(jīng)網(wǎng)絡(luò)可以在一輪輪的重復(fù)訓(xùn)練中不斷學(xué)習(xí)地形特征,優(yōu)化網(wǎng)絡(luò)參數(shù)。反觀不變矩檢測(cè)法,由于算法固定,在10輪重復(fù)實(shí)驗(yàn)中,它的檢測(cè)準(zhǔn)確率始終只能達(dá)到71.5%。
綜上,本文提出的基于三重復(fù)合卷積神經(jīng)網(wǎng)絡(luò)的SAR圖像地形檢測(cè)算法,相比不變矩檢測(cè)法確實(shí)可以大大提高檢測(cè)準(zhǔn)確率。
識(shí)別效果如圖5、圖6所示。
圖5 河流識(shí)別效果圖
圖6 城鎮(zhèn)識(shí)別效果圖
對(duì)SAR圖像的分類與地形檢測(cè),以往主要依靠不變矩檢測(cè)法等方式,存在的主要問題是準(zhǔn)確率較低;少量的機(jī)器學(xué)習(xí)在SAR成像中的應(yīng)用,也主要局限在SAR圖像的目標(biāo)識(shí)別上,至于利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行地形檢測(cè)的研究還尚未見報(bào)。本文創(chuàng)新地將機(jī)器學(xué)習(xí)應(yīng)用于SAR圖像的地形檢測(cè)上,并針對(duì)經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)準(zhǔn)確率低、容易過擬合的現(xiàn)象提出了一種新的三重復(fù)合卷積神經(jīng)網(wǎng)絡(luò),經(jīng)模擬驗(yàn)證和在東南沿海某地上機(jī)驗(yàn)證,取得了良好的效果,完成設(shè)計(jì)指標(biāo)。