謝澤奇 張會(huì)敏 張善文
(鄭州大學(xué)西亞斯國(guó)際學(xué)院 河南 鄭州 451150)
軍事目標(biāo)分類(lèi)作為圖像理解的一個(gè)基礎(chǔ)而且重要的研究課題深受?chē)?guó)內(nèi)外學(xué)者的重視,在世界各國(guó)國(guó)防防御系統(tǒng)中占據(jù)十分重要的地位[1-3]。在軍事領(lǐng)域,隨著軍事目標(biāo)數(shù)據(jù)的不斷增大及軍事目標(biāo)在偽裝、遮掩程度的提高,能快速地從大量復(fù)雜背景的軍事圖像集中實(shí)現(xiàn)對(duì)各類(lèi)目標(biāo)進(jìn)行高精度的圖像分類(lèi)與目標(biāo)識(shí)別,正逐漸成為圖像處理、計(jì)算機(jī)視覺(jué)等很多領(lǐng)域的研究熱點(diǎn)[4-6]。易崎等[7]提出了一種基于目標(biāo)特征和支持向量機(jī)(SVM)相結(jié)合的飛機(jī)目標(biāo)識(shí)別算法。該方法首先提取輪廓圖像,通過(guò)計(jì)算目標(biāo)圖像的形狀參數(shù)的特征矢量構(gòu)建訓(xùn)練樣本,最后訓(xùn)練SVM構(gòu)建飛機(jī)的目標(biāo)識(shí)別模型。該算法在提高識(shí)別率的同時(shí),不但減少樣本訓(xùn)練時(shí)間,而且還降低算法的復(fù)雜度。高惠琳[8]采用基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)結(jié)構(gòu)對(duì)目標(biāo)進(jìn)行特征學(xué)習(xí),在大量的軍事圖像分類(lèi)中取得較高的分類(lèi)精度。但深度學(xué)習(xí)中需要較多的經(jīng)驗(yàn)、人工嘗試及技巧,如設(shè)置網(wǎng)絡(luò)層數(shù)、每層節(jié)點(diǎn)數(shù)、節(jié)點(diǎn)的激發(fā)函數(shù)等。李萍等[9]提出通過(guò)計(jì)算稀疏表示系數(shù)實(shí)現(xiàn)多姿態(tài)的飛機(jī)目標(biāo)識(shí)別算法,該算法在出現(xiàn)遮擋和姿態(tài)變化時(shí)具有較高的識(shí)別率。
盡管軍事圖像分類(lèi)和識(shí)別方法的技術(shù)很多,并取得了不錯(cuò)的識(shí)別效果,但由于應(yīng)用背景的復(fù)雜性和多變性,使得傳統(tǒng)軍事圖像分類(lèi)方法難以克服拍攝環(huán)境、遮擋、角度等因素的影響,所以傳統(tǒng)方法并不能滿(mǎn)足實(shí)際需要。中心-輪廓距離CCD(Centre-Contour Distance)特征是將輪廓線(xiàn)上的點(diǎn)到形狀的幾何中心的距離描述成中心角度函數(shù),該方法基本能夠重構(gòu)被描述的目標(biāo)圖像形狀[10]。為了能將其轉(zhuǎn)化成一維函數(shù),則需要對(duì)這些多值進(jìn)行選擇或者運(yùn)算處理,但會(huì)造成關(guān)鍵信息的丟失而不能實(shí)現(xiàn)重構(gòu),因此,該算法在描述形狀時(shí)無(wú)法實(shí)現(xiàn)唯一性。隨著軍事圖像像素的不斷增加,CCD描述形狀輪廓的精度及所占帶寬也會(huì)不斷遞增,因此其抗噪性弱,且難以克服遮掩、不同姿態(tài)、弱特征、視角變化等因素的影響[11-12]。稀疏表示分類(lèi)SRC(Sparse Representation based Classification)是采用全體訓(xùn)練樣本之間的稀疏線(xiàn)性組合來(lái)表示一個(gè)特定的測(cè)試樣本[13-14]。本文提出一種改進(jìn)的傅里葉描述子,在此基礎(chǔ)上,與加權(quán)SRC相結(jié)合[15],提出一種新的軍事圖像分類(lèi)方法。該方法利用了飛機(jī)圖像的本質(zhì)特征,能夠有效地描述軍事圖像的形狀,在真實(shí)的軍事圖像數(shù)據(jù)庫(kù)上驗(yàn)證了該方法的有效性。
設(shè)有n個(gè)來(lái)自k類(lèi)的訓(xùn)練樣本,第i類(lèi)有ni個(gè)樣本x1,x2,…,xn,y為測(cè)試樣本,第i類(lèi)中ni個(gè)樣本構(gòu)成的矩陣表示為Ai=[vi1,vi2,…,vini]∈Rm×ni。則所有樣本組成的矩陣A=[A1,A2,…,Ak]∈Rm×n稱(chēng)為過(guò)完備字典。加權(quán)稀疏表示分類(lèi)(SRC)算法是通過(guò)計(jì)算各類(lèi)訓(xùn)練樣本與測(cè)試樣本的殘差大小來(lái)實(shí)現(xiàn)測(cè)試樣本的分類(lèi),即求解下面的l1范數(shù)最小化問(wèn)題[15]:
(1)
式中:a=[a1,a2,…,an]T為稀疏表示系數(shù),ai(i=1,2,…,n)為第i個(gè)樣本xi對(duì)應(yīng)的稀疏表示系數(shù),μ>0為調(diào)節(jié)參數(shù),W為加權(quán)矩陣,W由訓(xùn)練樣本與測(cè)試樣本之間的高斯核距離得到。
計(jì)算測(cè)試樣本y在第i類(lèi)訓(xùn)練樣本上的殘差:
(2)
式中:Bi為對(duì)應(yīng)第i類(lèi)訓(xùn)練樣本的稀疏表示系數(shù)構(gòu)成的向量。
則測(cè)試圖像y的類(lèi)別為y在所有k類(lèi)訓(xùn)練樣本上殘差的最小值對(duì)應(yīng)的類(lèi)別:
(3)
軍事圖像的輪廓包含了軍事圖像識(shí)別的大部分分類(lèi)信息,是軍事圖像分割、定位和分類(lèi)的重要特征。Canny輪廓提取算法是一種簡(jiǎn)單、實(shí)用的輪廓檢測(cè)方法[11],具有較好的輪廓檢測(cè)性能,在復(fù)雜圖像檢測(cè)和識(shí)別中得到廣泛應(yīng)用。本文在Canny輪廓提取算法的基礎(chǔ)上,提出一種基于改進(jìn)傅里葉描述子與加權(quán)SRC算法相結(jié)合的軍事圖像分類(lèi)方法,該識(shí)別方法流程圖如圖1所示。
圖1 軍事圖像識(shí)別流程圖
軍事圖像識(shí)別方法的基本步驟描述如下:
1) 軍事圖像預(yù)處理。同一類(lèi)軍事圖像的大小、方位、形狀和角度之間存在差異,因此在進(jìn)行軍事圖像分類(lèi)前必須對(duì)軍事圖像進(jìn)行預(yù)處理[4-5,7]。首先將拍攝的彩色圖像轉(zhuǎn)換成灰度圖像來(lái)消除對(duì)圖像分類(lèi)的干擾。轉(zhuǎn)換公式為:
Y=0.298 9R+0.587 0G+0.114 1B
(4)
式中:R、G和B分別表示彩色圖像的紅、綠、藍(lán)三個(gè)分量,Y表示對(duì)應(yīng)圖像的灰度值。
其次,為了降低圖像噪聲的影響,利用高斯濾波方法對(duì)灰度圖像進(jìn)行平滑處理,以便更準(zhǔn)確地計(jì)算圖像的梯度及輪廓幅值,得到的圖像為:
f1(x,y)=g(x,y)?f(x,y)
(5)
2) 通過(guò)偏導(dǎo)數(shù)計(jì)算幅值和梯度方向。通過(guò)在2×2鄰域的有限差分計(jì)算在x和y兩個(gè)方向的平滑圖像的偏導(dǎo)數(shù):
(6)
3) 確定輪廓點(diǎn)。在水平、豎直、45度和135度的四個(gè)輪廓梯度方向搜索各個(gè)像素梯度方向的鄰接像素。若某個(gè)像素點(diǎn)的灰度值與其梯度方向上前后兩個(gè)像素的灰度值差值較小,則這個(gè)像素置為0,即不是輪廓,最后得到輪廓點(diǎn)的坐標(biāo)集合。
設(shè)由步驟1)~3)得到的輪廓點(diǎn)坐標(biāo)集為{(xi,yi)|i=1,2,…,m},其中(x1,y1)為輪廓點(diǎn)的始點(diǎn)。
4) 計(jì)算輪廓點(diǎn)的中心坐標(biāo)。計(jì)算輪廓點(diǎn)的中心坐標(biāo)(xc,yc):
(7)
5) 將直角坐標(biāo)點(diǎn)轉(zhuǎn)換為極坐標(biāo)點(diǎn)。以(xc,yc)為極坐標(biāo)系的極點(diǎn),將輪廓點(diǎn)的直角坐標(biāo)點(diǎn)(xi,yi)(i=1,2,…,m)轉(zhuǎn)換為對(duì)應(yīng)的極坐標(biāo)(ri,θi)(i=1,2,…,m):
(8)
式中:ri(i=1,2,…,m)為中心輪廓點(diǎn)距離。
6) 按照θi(i=1,2,…,m)的升序?qū)i進(jìn)行排序,得到一個(gè)中心輪廓點(diǎn)距離序列,記為V=[r1,r2,…,rm],容易得知V與圖像的旋轉(zhuǎn)和平移無(wú)關(guān)[12]。
7) 對(duì)中心輪廓點(diǎn)距離序列進(jìn)行快速傅里葉變換。由于V與圖像的大小和輪廓點(diǎn)序列的起始點(diǎn)有關(guān),為了得到魯棒的軍事圖像的分類(lèi)特征,對(duì)V進(jìn)行快速傅里葉變換。V的K點(diǎn)傅里葉變換為:
(9)
頻域變換后的邊界序列中F(0)表示直流分量,不能反映不同圖像之間形狀差異,而較低頻率系數(shù)能夠反映圖像形狀的主要特征信息,較高頻率系數(shù)能夠反映圖像形狀的細(xì)節(jié)信息[15]。
8) 構(gòu)建傅里葉描述子。根據(jù)式(9)構(gòu)建傅里葉描述子:
(10)
式中:|·|表示傅里葉頻譜。
9) 計(jì)算高斯核距離。根據(jù)式(10)計(jì)算每幅測(cè)試圖像與每幅訓(xùn)練圖像的傅里葉描述子之間的高斯核距離。
10) 加權(quán)SRC。利用訓(xùn)練集圖像的傅里葉描述子構(gòu)建如式(1)的加權(quán)SRC的l1范數(shù)最小化問(wèn)題,求解稀疏表示系數(shù)。
11) 分類(lèi)。計(jì)算每一類(lèi)軍事圖像的殘差,則最小殘差對(duì)應(yīng)的類(lèi)別即為測(cè)試圖像的類(lèi)別。
容易證明,F(xiàn)V與圖像的縮放和輪廓點(diǎn)集中的起始點(diǎn)無(wú)關(guān),而且與圖像的大小、旋轉(zhuǎn)、平移和輪廓的起始點(diǎn)無(wú)關(guān),所以利用傅里葉描述子對(duì)軍事圖像進(jìn)行分類(lèi)方法具有魯棒性。
在MATLAB 2010環(huán)境下進(jìn)行軍事圖像分類(lèi)實(shí)驗(yàn),實(shí)驗(yàn)硬件平臺(tái)為英特爾雙核T6600處理器、主頻2.2 GHz和2 GB DDR3內(nèi)存。為了驗(yàn)證本文算法的有效性,將本文提出的方法與文獻(xiàn)[7]、文獻(xiàn)[8]和文獻(xiàn)[9]提出的軍事圖像分類(lèi)算法進(jìn)行對(duì)比。本文SR算法的求解最小化l1范數(shù)采用MATLAB的K-SVD字典學(xué)習(xí)的工具包和求解優(yōu)化問(wèn)題的SPGL1工具包。選擇10類(lèi)軍事圖像組成一個(gè)數(shù)據(jù)庫(kù),包括軍用汽車(chē)、坦克、裝甲車(chē)、導(dǎo)彈裝置、火炮、戰(zhàn)斗機(jī)、建筑物、隊(duì)伍、叢林和田野。每類(lèi)包含圖像100幅,共1 000幅圖像。圖2給出該數(shù)據(jù)庫(kù)中的部分軍事圖像示例圖像。采用五-折交叉驗(yàn)證法進(jìn)行實(shí)驗(yàn),即將圖像集中每類(lèi)圖像隨機(jī)劃分為5等分,每等分有20幅圖像。在每次實(shí)驗(yàn)中,由每類(lèi)中的1等分共200幅圖像作為測(cè)試圖像,其余的800幅作為訓(xùn)練集,進(jìn)行圖像分類(lèi)實(shí)驗(yàn)。由此可以得到5個(gè)實(shí)驗(yàn)結(jié)果,將其平均值作為這次劃分的實(shí)驗(yàn)結(jié)果。進(jìn)行50次五-折交叉驗(yàn)證法實(shí)驗(yàn),計(jì)算50次實(shí)驗(yàn)結(jié)果的平均值,為最后的軍事圖像的分類(lèi)結(jié)果。
(a) 六類(lèi)軍事圖像
(b) 不同姿態(tài)下的18幅軍事飛機(jī)圖像圖2 軍事圖像實(shí)例
首先將每幅圖像縮放大小為256×256像素的圖像,然后轉(zhuǎn)換為灰度圖像,采用Canny算法提取各圖像的輪廓,計(jì)算中心-輪廓距離序列,再提取該序列的傅里葉描述子,如圖3所示。
(a) 灰度圖像 (b) 輪廓圖像
(c) 中心-輪廓距離 (d) 傅里葉描述子圖3 兩幅軍事灰度圖像及其輪廓圖像、中心-輪廓 距離序列和傅里葉描述子
為了表明本文提取的軍事圖像的傅里葉描述子的魯棒性,對(duì)一幅軍事圖像進(jìn)行平移、旋轉(zhuǎn)、縮放后得到的5幅擴(kuò)展圖像,如圖4所示。然后分別提取5幅擴(kuò)展圖像的傅里葉描述子與第一幅圖像的傅里葉描述子之間的相似度,如表1所示。表1中給出了5幅擴(kuò)展圖像與第一幅圖像之間及其中心-輪廓距離序列的相似度。相似度選擇為兩個(gè)矩陣或向量之間的余弦距離。
(a) (b) (c) (d) (e)圖4 軍事圖像及其擴(kuò)展圖像
相似度(a)與(b)(a)與(c)(a)與(d)(a)與(e)圖像0.862 60.848 30.792 70.694 3中心-輪廓距離0.934 10.889 50.876 80.867 4
由表1可以看出,同類(lèi)軍事圖像的傅里葉描述子的相似度比同類(lèi)圖像之間的相似度大。由表1表明,傅里葉描述子對(duì)圖像的平移、旋轉(zhuǎn)、縮放以及輪廓點(diǎn)系列的起始點(diǎn)具有不變性和較高的魯棒性。由于基于軍事圖像形狀的傅里葉描述子的能量基本上集中在低頻部分,傅里葉變換的高頻分量幅度一般較小且易受到噪聲干擾,可以使用歸一化傅里葉描述子的低頻分量來(lái)表示軍事圖像特征的相似差異。在本文實(shí)驗(yàn)中取128點(diǎn)快速傅里葉變換進(jìn)行軍事圖像識(shí)別實(shí)驗(yàn)。
計(jì)算每幅測(cè)試圖像與每幅訓(xùn)練圖像的傅里葉描述子之間的高斯核距離,構(gòu)建加權(quán)SRC的l1范數(shù)最小化問(wèn)題,求解稀疏表示系數(shù)。計(jì)算每一類(lèi)軍事圖像的殘差,則最小殘差對(duì)應(yīng)的類(lèi)別即為測(cè)試圖像的類(lèi)別。將本文提出的算法與其他三種方法軍事圖像分類(lèi)方法進(jìn)行比較,表2為四種方法的實(shí)驗(yàn)結(jié)果。
表2 SVM、CNN、MSRC和本文方法對(duì)10類(lèi) 軍事圖像的分類(lèi)結(jié)果
從表2可以看出,本文提出的方法的識(shí)別結(jié)果最好。其原因是本文方法提取的傅里葉描述子能夠比較準(zhǔn)確地描述軍事圖像的形狀特征,而且具有旋轉(zhuǎn)、平移和縮放不變性,且與輪廓點(diǎn)序列中的起始點(diǎn)無(wú)關(guān),加權(quán)SRC具有較好的分類(lèi)性能。CNN方法的識(shí)別率不高的原因在于訓(xùn)練樣本比較少,不能有效地訓(xùn)練CNN模型。
本文針對(duì)軍事圖像分類(lèi)問(wèn)題,在傳統(tǒng)傅里葉描述子的基礎(chǔ)之上,提出了一種基于改進(jìn)軍事圖像傅里葉描述子的軍事圖像識(shí)別方法,并利用加權(quán)SRC進(jìn)行圖像分類(lèi),取得了較高的分類(lèi)結(jié)果。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的傅里葉描述子對(duì)圖像的平移、旋轉(zhuǎn)和縮放能夠保持不變,具有較高的形狀區(qū)分能力。下一步將傅里葉描述子與深度學(xué)習(xí)相結(jié)合來(lái)研究大規(guī)模復(fù)雜背景下的軍事圖像進(jìn)行分類(lèi)方法,以提高軍事圖像分類(lèi)率。同時(shí),對(duì)分類(lèi)方法進(jìn)一步改進(jìn),以實(shí)現(xiàn)軍事圖像自動(dòng)分類(lèi)識(shí)別系統(tǒng)。