楊春偉,王仕成,廖守億,劉華平
?
基于核稀疏編碼的紅外目標識別方法
楊春偉1,2,王仕成1,廖守億1,劉華平2
(1.第二炮兵工程大學精確制導仿真技術實驗室,陜西 西安 710025;2.清華大學計算機科學與技術系,北京 100084)
針對紅外目標識別問題,提出了一種基于協(xié)方差描述子和核稀疏編碼的紅外目標識別方法。該方法結合了紅外圖像的灰度、一階以及二階梯度等特征的協(xié)方差描述子作為紅外目標的特征,并采用Log-Euclidean度量進行特征相似性計算,通過高斯核函數(shù)將協(xié)方差描述子映射到高維空間,最后在新的特征空間上進行稀疏編碼。實測數(shù)據(jù)實驗結果表明,與傳統(tǒng)的KNN(k-nearest neighbor,k最近鄰)以及SVM(support vector machine,支持向量機)等分類算法相比,基于核稀疏編碼的紅外識別方法在識別準確率上有很大的提高。
協(xié)方差描述子;核稀疏編碼;紅外目標識別
作為圖像處理領域的一個熱門研究課題,目標識別在軍事運動目標的識別與跟蹤、交通檢測以及人臉識別等方面有著廣泛的應用。而隨著紅外成像技術的發(fā)展,紅外目標識別技術在軍事領域受到了越來越多的關注。紅外目標識別算法主要包括4個階段:紅外目標檢測、背景雜波抑制、紅外目標的特征提取以及目標的分類識別。由于前2個階段的研究已經比較成熟[1-2],本文對紅外目標的特征提取及分類識別進行研究。特征提取主要是提取目標的邊緣、形狀以及紋理等顯著性特征,而分類識別則指選取合適的分類器對目標的特征進行分類。
文獻[3]提出了一種基于目標紅外特征與SIFT(scale-invariant feature transform)特征相結合的紅外圖像識別算法,首先通過紅外目標初步信息實現(xiàn)初步識別,然后采用SIFT算法進行精確識別。文獻[4]采用SURF(speeded up robust features)算法對地面背景下的紅外目標進行識別,通過自適應中值濾波器和小波分頻與直方圖均衡的圖像增強算法對圖像進行預處理,然后采用SURF特征提取匹配的方法進行紅外目標識別。文獻[5]針對電廠冷凝塔等具有建筑規(guī)范的特殊建筑物,對自動目標捕獲方案中模板匹配的相似性測度計算方法進行了研究,提出了基于梯度矢量相關系數(shù)的計算方法。文獻[6]針對實戰(zhàn)中紅外成像制導導彈面臨的自動目標識別問題,將支持向量機作為分類器,提出了一種利用二維圖像識別三維目標的自動目標識別方法。
最近幾年,稀疏表示在模式識別以及計算機視覺領域受到了越來越多的關注。文獻[7]將稀疏表示應用于分類問題,提出了一種基于稀疏表示的人臉識別算法,通過訓練樣本的線性組合來表示測試樣本,通過求解稀疏表示問題得到測試樣本的稀疏表示系數(shù),而測試樣本的分類識別結果則由測試樣本本身與重建結果之間的殘差決定。文獻[8]將稀疏表示和壓縮感知理論應用于紅外目標識別領域,提出了一種新的紅外目標自動識別框架,將紅外目標識別問題轉化為稀疏編碼問題進行求解,取得了良好的識別結果。而我們知道,通過一個合適的非線性映射核函數(shù)將特征映射到高維空間,訓練樣本可以更加準確地通過測試樣本的線性組合表示。也就是說,核稀疏編碼可以更加準確地表示測試樣本,具有更好的區(qū)分性。另一方面,特征選擇在目標檢測以及分類識別中起著十分關鍵的作用,而協(xié)方差描述子[9](covariance descriptor, CovD)以其優(yōu)良的特性被廣泛應用于紋理鑒別、目標檢測、目標跟蹤以及視覺顯著性提取等方面[10-12]。
采用協(xié)方差描述子,提出基于核稀疏編碼的紅外目標識別方法。協(xié)方差描述子結合了紅外圖像的灰度以及一階二階梯度信息,通過Log-Euclidean度量計算協(xié)方差描述子之間的相似性,由高斯核函數(shù)將協(xié)方差描述子映射到高維空間,通過核稀疏編碼將目標識別問題轉化為稀疏系數(shù)求解問題,通過殘差最小化對目標進行分類識別。
圖1為基于核稀疏編碼的紅外目標識別總體流程。首先提取紅外目標的協(xié)方差描述子,而由于協(xié)方差描述子不屬于歐式空間,無法采用歐氏距離計算不同目標之間協(xié)方差描述子的相似性,本文采用Log-Euclidean度量進行計算;之后通過高斯核函數(shù)將其映射到高維空間,采用核稀疏編碼將目標識別問題轉化為稀疏系數(shù)求解問題;最后,基于核稀疏編碼得到的稀疏系數(shù),根據(jù)重建誤差對紅外目標進行分類識別,殘差最小值對應的類別即為目標所屬類別。
圖1 紅外目標識別流程
2006年,Tuzel等人提出了協(xié)方差描述子,具體來說,令{f}=1,…為表征圖像的灰度值、梯度、邊緣、空間屬性等的維特征向量,其中為圖像像元數(shù)量。那么,×維的協(xié)方差描述子定義為:
式中:為特征向量的平均值。
協(xié)方差描述子與其他特征相比具有以下優(yōu)點:首先,圖像的協(xié)方差描述子能夠表征圖像不同視角的特征;第二,協(xié)方差描述子能夠融合不同特征,其對角線元素表征了特征之間的變化,非對角元素表征了特征之間的相關性;第三,與其他特征相比,協(xié)方差描述子維數(shù)較低,由于對稱性,僅有(2+)/2個值;另外,協(xié)方差描述子可以通過積分圖像表示進行快速運算。
然而,協(xié)方差描述子為對稱正定矩陣,并不屬于歐式空間,而是位于圖2所示的黎曼流形中。因此,我們不能用歐式距離來衡量協(xié)方差描述子之間的差異。為了克服這個問題,采用Log-Euclidean度量[13]來近似協(xié)方差描述子之間的差異:
式中:logm表示對矩陣求對數(shù)。
由于測試樣本標簽未知,因此通過所有訓練樣本的線性組合表示,即:
=(4)
稀疏編碼解決如下的優(yōu)化問題:
公式的第1部分表示重建誤差,第2部分用來調節(jié)系數(shù)的稀疏度。
然而,現(xiàn)有的線性假設在許多應用中并不總是有效的。文獻[14]指出可以通過核映射函數(shù)將原始特征映射到高維特征空間后再進行稀疏編碼,這樣在原始空間中不能線性可分的樣本在高維空間變得線性可分,而在原始空間中線性可分的樣本在高維空間中能夠更加準確的線性可分。令訓練樣本?,其中為特征所屬的原始空間,如果通過一個合適的核映射函數(shù)將映射到高維空間,那么將具有更好的線性表示特性。因此,令?為原始空間到高維空間(可能是無限維)的映射關系,如圖3。
圖3 原始特征空間到高維空間的映射
令()=[(1),…,(d)],對于待識別紅外目標,可以通過所屬類別的訓練樣本的線性組合來表示。因此,式(3)的優(yōu)化問題可轉化為:
重建誤差可表示為:
Trace{[()-()]T-[()-()]}=
Trace{(,)-2T(,)-T(,)} (7)
式中:(,)=[(,1),(,2),…(,d)]T,(,)=()T×(),而(,)為第(,)個元素為(d,j)的×方陣。
接下來給出基于核稀疏編碼的紅外目標識別的計算過程:
Step 1:協(xié)方差描述子計算。對于每個紅外目標,根據(jù)式(6)計算紅外目標的灰度以及一階二階梯度信息:
式中:(,)為圖像像素,為灰度值。根據(jù)式(1)計算紅外目標對應的5×5協(xié)方差描述子。
Step 2:通過Log-Euclidean度量計算協(xié)方差描述子1和2的距離。
Step 3:采用高斯核計算核。由于高斯核體現(xiàn)出的優(yōu)良特性,我們采用式(7)進行核計算:
(1,2)=exp[-×(1,2)2] (9)
式中:為衰減因子。
圖4所示為核計算過程。第1行為從原始紅外圖像提取的目標,其中第2和第3個為同類目標;第2行為Step 1中紅外目標對應的協(xié)方差描述子;第3行為Step 2計算得到的距離;第4行為Step 3中的高斯核值。不難看出,核值越大,二者為同一類目標的可能性越大。
圖4 核計算過程
Step 4:通過SLEP或SPAMS工具箱進行優(yōu)化計算。式(5)可轉化為:
式中:
式中:ST為對稱正定矩陣(,)的奇異值分解。這樣上述優(yōu)化問題就可以采用SLEP或者SPAMS等稀疏矩陣求解工具箱求解。
Step 5:通過重建殘差進行紅外目標分類識別。求得稀疏系數(shù)后,待識別紅外目標的殘差為:
r=-2(,D)+T(D,D)(12)
式中:是第類目標的訓練樣本。殘差最小值對應的類別即為待測試紅外目標所屬分類,即:
我們采用紅外熱像儀拍攝的真實紅外車輛目標對文中所提算法進行測試。通過感興趣區(qū)域提取,將紅外車輛從原始紅外圖像中提取出來,共計7類紅外車輛目標,每類包含100個樣本。圖5所示為示例目標圖像,所有目標均轉化為160×128。將每類100個樣本任意分為5組,其中4組用來訓練,1組用來測試,并循環(huán)進行5次實驗。
固定訓練樣本數(shù)量,對核參數(shù)和稀疏參數(shù)進行調試。當=0.08,=0.001時,識別準確率最高。
圖6為采用Matlab編寫的紅外目標識別軟件。左側為樣本示例。右上方所示對第一組140個測試樣本進行分類識別,準確率為96.4286%。右下方所示為針對任一測試樣本,計算對應的協(xié)方差描述子,稀疏系數(shù)以及殘差。根據(jù)殘差可得,第5類所對應的殘差最小,因此,測試樣本的識別結果為廂式貨車(左側標紅)。
我們采用KNN[15]以及SVM[16]作為基準算法,針對5組測試樣本,比較3種算法的準確率。表1所示為3種算法的識別準確率,本文方法與KNN以及SVM算法相比,識別率平均分別高出約15%和4%。
圖7(a)~(c)所示分別為為KNN、SVM和本文方法針對實驗數(shù)據(jù)的平均混淆矩陣,本文方法針對各類目標的分類識別準確率均高于KNN以及SVM算法。
本文針對紅外目標識別問題,提出了一種基于核稀疏編碼的識別方法,該方法將紅外目標識別問題轉化為稀疏表示問題,采用5×5的協(xié)方差描述子作為紅外目標特征,通過Log-Euclidean度量進行相似性計算,通過核稀疏編碼在高維空間對目標特征進行分類識別。通過對實測數(shù)據(jù)的試驗表明該方法體現(xiàn)出了良好的識別性能。
圖5 紅外車輛目標示例
圖6 紅外目標識別軟件
表1 3種分類算法識別準確率比較
圖7 3種分類算法的混淆矩陣
[1] Yang Chunwei, Liu Huaping, Liao Shouyi, et al. Small target detection in infrared video sequence using robust dictionary learning[J]., 2015, 68: 1-9.
[2] Gong Jinnan, Zhang Yin, Hou Qingyu, et al. Background suppression for cloud clutter using temporal difference projection[J]., 2014, 64: 66-72.
[3] 王世亮, 楊帆, 張志偉, 等. 基于目標紅外特性與SIFT特征相結合的目標識別算法[J]. 紅外技術, 2012, 34(9): 503-507.
WANG Shi-liang, YANG Fan, ZHANG Zhi-wei, et al. A target recognition method based on infrared features and SIFT[J]., 2012, 34(9): 503-507.
[4] 朱長軍, 王民鋼, 王超, 等. 地面背景下基于SURF的紅外目標識別方法[J]. 紅外技術, 2013, 35(9): 551-554.
ZHU Chang-jun, WANG Min-gang, WANG Chao, et al. Infrared target recognition method based on SURF in ground background[J]., 2013, 35(9): 551-554.
[5] 明德烈, 田金文. 紅外前視對一類特殊建筑物目標識別技術研究[J]. 宇航學報, 2010, 31(4): 1190-1194.
MING Delie, TIAN Jinwen. Automatic infrared condensing tower target recognition using gradient vector features[J]., 2010, 31(4): 1190-1194.
[6] 范彬, 馮云松. 支持向量機在紅外成像自動目標識別中的應用[J]. 紅外技術, 2007, 29(1): 38-41.
FAN Bin, FENG Yun-Song. The application of the support vector machine in infrared imaging automatic target recognition[J]., 2007, 29(1): 38-41.
[7] Wright John, Yang Allen Y, Ganesh Arvind, et al. Robust face recognition via sparse representation[J]., 2009, 31(2): 210-227.
[8] Patel Vishal M, Nasrabadi Nasser M, Chellappa Rama. Sparsity-motivated automatic target recognition[J]., 2011, 50(10): 1425-1433.
[9] Tuzel Oncel, Porikli Fatih, Meer Peter. Region covariance: a fast descript- or for detection and classification[C]//, 2006.
[10] Tuzel Oncel, Porikli Fatih, Meer Peter. Pedestrian detection via classific- ation on riemannian manifolds[J]., 2008, 30(10): 1713-1727.
[11] Porikli Fatih, Tuzel Oncel, Meer Peter. Covariance tracking using model update based on lie algebra[C]//, 2006: 728-735.
[12] Erdem Erkut, Erdem Aykut. Visual saliency estimation by nonlinearly integrating features using region covariances[J]., 2013, 13(4): 1-20.
[13] Li Peihua, Wang Qilong, Zuo Wangmeng, et al. Log-Euclidean kernels for sparse representation and dictionary learning[C]//, 2013: 1601-1608.
[14] Gao Shenghua, Tsang Ivor Wai-Hung, Chia Liang-Tien. Sparse representation with kernels[J]., 2013, 22(2): 423-434.
[15] Hastie Trevor, Tibshirani Robert. Discriminant adaptive nearest neighbor classification[J]., 1996, 18(6): 607-616.
[16] Cortes Corinna, Vapnik Vladimir. Support-vector networks[J]., 1995, 20(13): 273-297.
An Infrared Target Recognition Method Based on Kernel Sparse Coding
YANG Chunwei1,2,WANG Shicheng1,LIAO Shouyi1,LIU Huaping2
(1.,’710025,; 2.,,100084,)
An infrared target recognition method based on covariance descriptor and kernel sparse coding is proposed in this paper. Covariance descriptor combining infrared image gray intensity values and the norm of first and second order derivatives of the intensities as infrared image features. With respect toandis extracted as feature representation, similarity of covariance descriptors is computed through Log-Euclidean metric. Then covariance descriptors are mapped into a high dimensional feature space through Gaussian kernel function. Finally, infrared target recognition is accomplished using sparse coding in the new feature space. Experiments on the real infrared images show that our method obtains better results compared with traditional algorithms such as KNN and SVM.
covariance descriptor,kernel sparse coding,infrared target recognition
TP391
A
1001-8891(2016)03-0230-06
2015-09-07;
2015-10-08.
楊春偉(1986-),男,山東高密人,博士研究生,研究方向為紅外目標的檢測與識別。E-mail:yangchunwei081129@163.com。