劉相云,龔志輝,金 飛,楊 光,范煒康
(信息工程大學(xué),河南 鄭州 450001)
衛(wèi)星影像拍攝質(zhì)量的大幅提高使得利用遙感影像進(jìn)行目標(biāo)識(shí)別成為可能。飛機(jī)是現(xiàn)代社會(huì)中必不可少的工具,利用遙感影像進(jìn)行飛機(jī)目標(biāo)識(shí)別無論是在民航上的飛機(jī)飛行情況監(jiān)督,還是軍事上的掌握敵機(jī)部署情況都有廣泛的應(yīng)用前景。因此,飛機(jī)目標(biāo)的檢測(cè)識(shí)別一直是備受關(guān)注的研究課題,也有不少有效的檢測(cè)識(shí)別算法被提出。
目前,飛機(jī)目標(biāo)識(shí)別算法主要可分為4類:①模板匹配[1]算法,該算法是傳統(tǒng)飛機(jī)目標(biāo)識(shí)別中常用的算法;②基于不變矩[2-6]的算法,可以提取多種不變矩,完成對(duì)飛機(jī)目標(biāo)的識(shí)別;③基于顯著圖的算法[7-9],即使用顯著圖去除復(fù)雜背景[10]進(jìn)行識(shí)別;④基于機(jī)器學(xué)習(xí)[5]和神經(jīng)網(wǎng)絡(luò)[11]的算法,已經(jīng)將深度學(xué)習(xí)[12]運(yùn)用到飛機(jī)目標(biāo)識(shí)別中。上述4類方法從不同角度對(duì)飛機(jī)目標(biāo)識(shí)別進(jìn)行了研究,取得了一定的效果,但是也存在一些問題。如模板匹配算法過程過于簡(jiǎn)單,精度不高;基于不變矩的算法在一定程度上提高了識(shí)別精度,但是提高程度有限;基于顯著圖的算法容易造成誤檢及漏檢;機(jī)器學(xué)習(xí)算法中淺層的算法如SVM(support vector machine)等還需要改進(jìn),深度學(xué)習(xí)算法則存在訓(xùn)練時(shí)間過長的問題。針對(duì)這些問題,本文提出了一種視覺顯著圖和多種特征融合的基于深度置信網(wǎng)絡(luò)的飛機(jī)目標(biāo)識(shí)別算法。算法在粗定位階段提取影像的視覺顯著圖,定位顯著目標(biāo)的位置;在精確識(shí)別階段提取顯著目標(biāo)的顏色、紋理、形狀等多種特征,然后使用深度置信網(wǎng)絡(luò)進(jìn)行飛機(jī)目標(biāo)的識(shí)別,不僅克服了單一特征的局限性,同時(shí)也避免了深度網(wǎng)絡(luò)從像素級(jí)直接進(jìn)行訓(xùn)練速度緩慢的現(xiàn)象。
本文算法主要由兩部分組成:一是目標(biāo)的粗定位,二是目標(biāo)的精確識(shí)別,其流程如圖1所示。
具體步驟為:①使用HC算法處理影像,提取影像的顯著目標(biāo);②使用Ostu算法對(duì)顯著圖進(jìn)行二值化,通過標(biāo)記連通區(qū)域來定位候選目標(biāo);③提取候選目標(biāo)及樣本庫影像的顏色、紋理、形狀特征,形成多維特征向量,并對(duì)特征向量進(jìn)行歸一化;④使用訓(xùn)練集對(duì)DBN進(jìn)行訓(xùn)練,并使用訓(xùn)練過程中得到的權(quán)重及偏置對(duì)測(cè)試集進(jìn)行測(cè)試,最后用訓(xùn)練好的DBN網(wǎng)絡(luò)識(shí)別粗定位階段標(biāo)記的候選目標(biāo),判斷是否為飛機(jī)目標(biāo)。
粗定位主要運(yùn)用直方圖對(duì)比度(HC)算法,該算法由文獻(xiàn)[13]于2011年提出,效率較高且效果良好,主要目的是將影像中的顯著目標(biāo)檢測(cè)出來。HC算法根據(jù)圖像的色彩統(tǒng)計(jì)特征來確定圖像的顯著性,即圖像中某像素與其他像素的顏色對(duì)比度即為這個(gè)像素的顯著值。如圖像中的某像素Ik,其顯著值可表示為
(1)
式中,I為圖像,把圖像中像素排成一列;Ik和Ii為第k和第i個(gè)像素;D(IK,Ii)為像素Ik和像素Ii在CIELab彩色空間上的顏色歐氏距離。將相同顏色的像素分為一組,即可以獲取顏色不同的像素的顯著值為
(2)
式(2)表示第k個(gè)像素的顏色為圖像中第i個(gè)顏色ci。圖像里總的顏色數(shù)目為n;fj為顏色ci在圖像I中出現(xiàn)的次數(shù)。
由于一幅圖像所包含的顏色數(shù)量很龐大,HC算法通過量化RGB空間中各個(gè)通道的顏色來減少顏色數(shù)量,從而減少計(jì)算量。在量化過程中,相近的顏色可能被量化為不同的值,HC算法通過平滑每種顏色的顯著值來降低這種情況引起的誤差,即使用與每種顏色最相近的m種顏色顯著值的加權(quán)平均來代替其顯著值,平滑公式為
(3)
經(jīng)過HC算法提取顯著目標(biāo)后,能夠?yàn)V除背景圖像,突出圖中飛機(jī)等候選目標(biāo),只需再把顯著圖轉(zhuǎn)化為二值圖像,就能夠通過二值化圖像定位顯著目標(biāo)。本文使用Ostu算法對(duì)顯著圖進(jìn)行二值化,隨后,用外接矩形將連通區(qū)域標(biāo)記出來,完成目標(biāo)的粗定位。
在粗定位完成之后,還會(huì)存在一些干擾目標(biāo),如房屋建筑等,需要進(jìn)行精確識(shí)別剔除干擾目標(biāo)。本文采用了提取目標(biāo)顏色、形狀、紋理[14]等多種特征,最后與深度置信網(wǎng)絡(luò)結(jié)合進(jìn)行分類識(shí)別的方法。
進(jìn)行飛機(jī)目標(biāo)識(shí)別時(shí),先提取飛機(jī)目標(biāo)的特征,單一特征很難具有足夠辨識(shí)度,本文采用提取多種特征的方式,主要提取了目標(biāo)的顏色、紋理、形狀這3種類型的特征,包括9個(gè)顏色矩、6個(gè)Tamura特征、8個(gè)灰度共生矩陣、7個(gè)Hu不變矩、36個(gè)邊緣方向直方圖,組成多維的特征向量并進(jìn)行歸一化,提高識(shí)別準(zhǔn)確性。
深度學(xué)習(xí)通過組合底層特征形成更抽象的高層表示或特征,從而發(fā)現(xiàn)數(shù)據(jù)分布的特征表示[15]。深度置信網(wǎng)絡(luò)(deep belief networks,DBN)是由限制波爾茲曼機(jī)擴(kuò)展而來的一種深度架構(gòu)的推廣,由Geoffrey Hinton在2006年提出,是包含多個(gè)隱層(隱層數(shù)大于2)的概率生成模型,可以對(duì)非線性數(shù)據(jù)進(jìn)行有效訓(xùn)練。
深度置信網(wǎng)絡(luò)由多層限制波爾茲曼機(jī)(restricted boltzmann machine,RBM)組成,RBM是一個(gè)由可視層(記為v)和隱含層(記為h)組成的深度學(xué)習(xí)算法,RBM中的可視層與隱含層兩層的層內(nèi)節(jié)點(diǎn)之間是條件相互獨(dú)立,沒有關(guān)聯(lián)的。因此,可視層和隱含層的全概率分布滿足下式
p(h|v)=p(h1v)=…=p(hnv)
(4)
式中,v為可視層狀態(tài)向量;h為隱含層狀態(tài)向量。求解最小化損失函數(shù)之后,就能得到可視層和隱含層之間的權(quán)值W。RBM的訓(xùn)練過程實(shí)際上是求出一個(gè)最能產(chǎn)生訓(xùn)練樣本的概率分布。也即要求在一個(gè)分布里,訓(xùn)練樣本的概率最大,由于這個(gè)分布的決定性因素在于權(quán)值W,因此訓(xùn)練RBM的目標(biāo)就是尋找最佳的權(quán)值。圖2即為RBM模型。深度置信網(wǎng)絡(luò)的結(jié)構(gòu)與RBM相同,都是通過權(quán)重層W把層與層之間聯(lián)系起來,層內(nèi)節(jié)點(diǎn)相互獨(dú)立。深度置信網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
DBN的訓(xùn)練過程主要分為兩步:一是分別單獨(dú)無監(jiān)督地訓(xùn)練每一層RBM網(wǎng)絡(luò),確保特征向量映射到不同的特征空間時(shí),都盡可能多地保留特征信息;二是在DBN的最后一層設(shè)置BP網(wǎng)絡(luò),接收RBM的輸出特征向量作為它的輸入特征向量,有監(jiān)督地訓(xùn)練實(shí)體關(guān)系分類器。本文算法的DBN采用4個(gè)RBM組成的結(jié)構(gòu),其結(jié)構(gòu)為:66-100-100-100-2。在第4層中加入sigmoid函數(shù),作為最終結(jié)果的輸出層。
本文試驗(yàn)環(huán)境為Windows 10系統(tǒng)下的Matlab 2014a,電腦硬件配置為Inter(R)Core(TM)i5-6300HQ CPU @2.30 GHz,8 GB內(nèi)存,465 GB硬盤,試驗(yàn)數(shù)據(jù)來源于Google Earth,共1400幅飛機(jī)影像和700幅背景影像作為樣本集,其中1200幅飛機(jī)影像及600幅背景影像作為訓(xùn)練樣本,200幅飛機(jī)影像和100幅背景影像作為測(cè)試樣本,訓(xùn)練樣本不參與測(cè)試,樣本集影像統(tǒng)一縮放為64×64像素,另外選取75幅機(jī)場(chǎng)影像用來識(shí)別。樣本影像如圖4所示。
試驗(yàn)各步驟結(jié)果如圖5所示,從圖5(b)可以看出,提取顯著圖后,原始影像中無意義的背景被去除,突出了顯著目標(biāo);經(jīng)過Ostu閾值分割得到圖5(c)二值化影像,顯著目標(biāo)視覺效果明顯,但是還存在不少噪音,需要進(jìn)行去噪,去除連通區(qū)域面積較小的目標(biāo);為了避免飛機(jī)目標(biāo)的部分機(jī)身被當(dāng)作噪音去除,在去噪之前先進(jìn)行形態(tài)學(xué)膨脹,結(jié)果如圖5(d)所示;隨后去除面積較大的干擾目標(biāo),得到圖5(e)的結(jié)果,此時(shí)圖中僅剩飛機(jī)目標(biāo)及少量干擾目標(biāo),標(biāo)記連通區(qū)域,得到圖5(f)的結(jié)果;再在原圖中進(jìn)行標(biāo)記,即可得到圖5(g)的粗定位結(jié)果;粗定位完成后經(jīng)過DBN分類,得到圖5(h)最終識(shí)別結(jié)果。
DBN網(wǎng)絡(luò)的層數(shù)很大程度上影響著網(wǎng)絡(luò)對(duì)數(shù)據(jù)的擬合精度,為了驗(yàn)證最佳隱含層層數(shù),對(duì)層數(shù)為1、2、3、4這4種情況分別進(jìn)行試驗(yàn),網(wǎng)絡(luò)分類精度見表1。
表1 不同深度DBN網(wǎng)絡(luò)分類正確率比較
從表1可以看出,本文選用的3層隱含層的結(jié)構(gòu)分類正確率最高,達(dá)到94.33%,當(dāng)層數(shù)增加到4時(shí),分類正確率反而下滑,這是由于網(wǎng)絡(luò)深度增加更容易陷入局部最優(yōu)點(diǎn),使分類正確率不高。
為了驗(yàn)證組合特征與單一特征對(duì)網(wǎng)絡(luò)分類效果的影響,用測(cè)試樣本分別測(cè)試了單一特征和組合特征下DBN網(wǎng)絡(luò)的分類正確率,結(jié)果見表2。從表2可以看出,單一特征中使用邊緣方向直方圖分類正確率最高,為84.67%,而使用本文算法的組合特征對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,正確率達(dá)到94.33%,顯然高于單一特征算法。
表2 單一特征與本文算法DBN網(wǎng)絡(luò)分類正確率比較 (%)
為了評(píng)價(jià)飛機(jī)目標(biāo)識(shí)別效果,本文選用檢測(cè)率(DR)和虛警率(FA)[16]作為評(píng)價(jià)指標(biāo)。飛機(jī)的檢測(cè)率是指算法所檢測(cè)出的飛機(jī)目標(biāo)數(shù)量占所有飛機(jī)目標(biāo)的比重,可以定義為
(5)
式中,DR為飛機(jī)檢測(cè)率;mi為檢測(cè)出的第i幅影像中的飛機(jī)目標(biāo)數(shù)量;Ni為第i幅影像中飛機(jī)目標(biāo)的總數(shù);n為試驗(yàn)影像的總數(shù)。虛警率反映被判定為飛機(jī)的樣本中背景所占的比率。定義為
(6)
式中,F(xiàn)A為虛警率;FP為把非目標(biāo)判斷為目標(biāo)的數(shù)量;TP為正確識(shí)別的目標(biāo)數(shù)量。用來識(shí)別的75幅影像中,含有飛機(jī)259架,檢測(cè)出255架,誤檢4架,檢測(cè)率為98.46%,虛警率為5.20%。本文算法與其他算法的對(duì)比結(jié)果見表3。
表3 不同識(shí)別算法性能對(duì)比 (%)
從表3可以看出,本文的HC算法與深度置信網(wǎng)絡(luò)結(jié)合進(jìn)行飛機(jī)識(shí)別的檢測(cè)率明顯高于BP神經(jīng)網(wǎng)絡(luò)算法及SVM算法,虛警率也較低。圖6所示為在不同機(jī)場(chǎng)不同分辨率的飛機(jī)目標(biāo)的識(shí)別結(jié)果。
本文提出了一種由粗到精的顯著圖和多特征結(jié)合的基于DBN的飛機(jī)目標(biāo)識(shí)別算法。首先利用HC算法和Ostu算法對(duì)目標(biāo)進(jìn)行粗定位并標(biāo)記候選目標(biāo),然后提取候選目標(biāo)的多種特征進(jìn)行融合,最后使用深度置信網(wǎng)絡(luò)進(jìn)行分類識(shí)別。試驗(yàn)結(jié)果表明,本文算法的檢測(cè)率為98.46%,虛警率為5.20%,能克服復(fù)雜背景的干擾。飛機(jī)識(shí)別的精度很大程度上取決于樣本庫的完善程度,下一步將繼續(xù)完善樣本數(shù)據(jù)庫以提高分類識(shí)別精度。