舒亞海,賈倩茜,張 超,周 元
(1.海軍裝備部駐上海地區(qū)第一軍事代表室,上海 201000;2.中國船舶集團有限公司第八研究院,南京 211153)
空中目標的識別在近代軍事戰(zhàn)場具有重大意義和廣泛應用前景,是戰(zhàn)場態(tài)勢評估和威脅估計的基礎,也是指揮自動化系統(tǒng)的重要組成部分。對于紅外圖像的目標識別,主要難點在于:一是如何使提取的特征具有很好的目標表征能力;二是特征向量的提取和模式識別的方法。
近年來,隨著小波理論的逐漸成熟,小波變換也越來越多地被應用在目標識別領域。但是,小波變換反映的是信號的點奇異性,無法精確描述圖像邊緣的方向,也無法實現(xiàn)對圖像的稀疏表示,從而影響識別精度。而多尺度幾何分析方法正是為了克服小波這一局限性而產(chǎn)生的。該方法對圖像中的幾何特征的表達更加優(yōu)于小波,并且能隨尺度變化,對圖像進行連續(xù)逼近。因此,本文采用了該分析方法中的Contourlet變換提取圖像的特征向量。它能夠在任意尺度上實現(xiàn)任意方向的分解,擅長描述圖像中的輪廓信息,故其分解后的低頻系數(shù)能很好地表征目標的基本特征,而高頻系數(shù)可以表征目標的細節(jié)信息,彌補了小波變換不足。
目前,目標識別的方法很多,有的應用角點特征和核聚類算法,有的基于閉合輪廓特征,有的采用模板匹配等等。神經(jīng)網(wǎng)絡具有自組織、自適應學習功能,由具有非線性映射能量的神經(jīng)元組成。神經(jīng)元之間同通過權值系數(shù)相連,能夠并行計算,因而具有速度快的優(yōu)點。同時,由于信息分布存儲于連接權系數(shù)中,使得神經(jīng)網(wǎng)絡對圖像光照變換、像素部分損失、飛行目標姿態(tài)變化等問題不敏感,能高辨識率地完成圖像識別。
Contourlet變換是一種基于非分離型濾波器組實現(xiàn)的圖像多尺度幾何分析工具,其思想是通過類似于輪廓段(Contoursegment)的基結構來逼近圖像,其算法繼承了小波的多分辨和時頻局部化特性,同時又兼具良好的方向性和各向異性。而二維小波是由一維小波張量積構建得到,它的基缺乏方向性,不具有各向異性,只能限于用正方形支撐區(qū)間描述輪廓,不同大小的正方形對應小波的多分辨率結構。[1]
對于一個二次連續(xù)可微的目標函數(shù)f,如果是其重構函數(shù),而m是其系數(shù)重量,則Contourlet變換時誤差逼近滿足
而采用小波變換時誤差逼近滿足
由此可看出,Contourlet變換比小波變換具有更好的逼近能量,對圖像中的曲線、直線具有更“稀疏”的表達,更有利于對紅外圖像進行預處理提取特征信息。
如圖1所示,Contourlet分解是由拉普拉斯金字塔式分解和方向濾波器組實現(xiàn)。對目標圖像進行Contourlet變換可以利用其優(yōu)良特性更好地提取原始圖像中的幾何特征,從而得到一個低頻子帶系數(shù)和各尺度各方向的高頻子帶系數(shù)。
在工程研究中通常會遇到一些復雜的非線性系統(tǒng)。這些系統(tǒng)狀態(tài)方程復雜,難以用數(shù)學方程準確建模,而適用于神經(jīng)網(wǎng)絡表達這些非線性系統(tǒng)。該方法把系統(tǒng)看成是一個黑箱,用系統(tǒng)輸入輸出數(shù)據(jù)訓練神
圖1 Contourlet分解示意圖
經(jīng)網(wǎng)絡,使神經(jīng)網(wǎng)絡能夠擬合輸入?yún)?shù)和輸出參數(shù)的關系,其實質是一個隱含的數(shù)學表達式,即f(y)=f(x1,x2, …)。輸入?yún)?shù)和輸出參數(shù)直接聯(lián)系,改變輸入?yún)?shù)的數(shù)值,就能得到相應的輸出,而模型的結構不會發(fā)生改變。[2]
由于BP神經(jīng)網(wǎng)絡具有處理非線性輸入輸出關系的能力,并能不斷學習,利用BP網(wǎng)絡可以實現(xiàn)離線數(shù)據(jù)的在線修正。輸入數(shù)據(jù)通過BP神經(jīng)網(wǎng)絡的各層到達輸出層后比較輸入輸出的差值是否達到,如果沒有達到則返回各層不間斷調(diào)整各層權值,以達到期望的輸出。
BP神經(jīng)網(wǎng)絡具有一層或多層的前饋網(wǎng)絡[3],對實例訓練是通過利用輸出層誤差沿著與輸入信號相反的方向逐級反向傳遞來自動獲取知識。一般有輸入層、中間層、輸出層,各層順次連接,結構示意圖如圖2所示。
圖2 BP神經(jīng)網(wǎng)絡結構示意圖
前饋型神經(jīng)網(wǎng)絡的中間層一般可包含有一至多個隱藏層。隱藏層的非線性傳遞函數(shù)神經(jīng)元可以學習輸入輸出之間的線性和非線性關系,采用多個隱藏層數(shù)或增加隱藏層的節(jié)點數(shù)均可提高網(wǎng)絡精度。但是,隱藏層增多或隱藏層節(jié)點數(shù)增多都會增加網(wǎng)絡自學習的時間,影響效率,不利于識別方法的推廣。[4]若隱藏層節(jié)點數(shù)太少,訓練時間雖然變短,但可能訓練不出來或容錯性大。調(diào)整隱藏層節(jié)點的個數(shù)可用來達到目的。
本理論模型目的在于提供一種機動目標識別方法。該方法對紅外圖片庫中機動目標圖像進行幾何重構,再使用Contourlet變換的多尺度分析方法提取圖像低頻特征向量和高頻特征向量,以低頻特征為原始輸入?yún)?shù),通過BP神經(jīng)網(wǎng)絡訓練以高頻特征向量修正模型,快速有效地實現(xiàn)對不同機型、多種飛行姿態(tài)、不同光照明暗變化下的飛行目標進行識別。
圖像的幾何重構主要包括圖像預處理和對飛行目標姿態(tài)的重構。圖像預處理是提高識別精度的重要一步,目的是將圖片進行歸一化處理,并去除圖像中不相關背景環(huán)境的影響,凸顯待識別的目標區(qū)域。分為兩步,第1步進行圖片幾何標準化處理。由于目標在整個紅外圖像中的位置、大小不同,因此會影響識別效果,需要通過校準、定位等方法對目標圖像進行矯正。本文將待識別目標的區(qū)域放大并將圖像校準為像素為64×64,使得目標特征更為明顯;第2步進行灰度歸一化處理,由于不同圖像受環(huán)境影響較大,需要對不同光照條件、光線方向下得到的圖像進行補償,以減弱不同環(huán)境條件下拍攝的圖像信號變化,方便后續(xù)特征向量的提取。
其中,f(x′,y′)為圖像函數(shù),當(x′,y′)屬于目標區(qū)時f(x′,y′) = 1,當(x′,y′)不屬于目標區(qū)時f(x′,y′)= 0;a、b、c、d為跟蹤窗口邊界坐標。
獲得圓點后,以0°~360°向周圍做直線,在該直線上尋找飛機圖像的邊緣點。邊緣點到中心的距離最長線段對應的角度α即為飛機圖像軸線方向。該邊緣點所在位置即機頭位置。同樣,由機頭經(jīng)中心向機尾搜索目標邊緣點,可找到機尾坐標。將軸線方向沿角度α旋轉可將飛行目標圖像轉為機頭向上的標準圖像。
本文示例了直升飛機、民航客機、戰(zhàn)斗機3種機型圖片幾何重構前后對比圖,如圖3所示。
圖3 紅外圖像預處理對比圖
目標圖像的特征提取是識別過程中關鍵的環(huán)節(jié),通過提取特征量來刻畫目標圖像的輪廓特征,為BP神經(jīng)網(wǎng)絡訓練提供輸入?yún)?shù)。采用Contourlet變換分別提取出低頻特征和高頻能量特征。
低頻特征向量包含了大部分能量信息,能平滑逼近圖像的輪廓信息。該部分分量可以作為BP識別中的基礎特征向量。但是,在實際采集的圖片中不同光線下拍攝的目標圖像包含高頻噪聲,Contourlet變換的低頻分量對光線變換并不敏感。
高頻系數(shù)能反映目標各個方向的邊緣、細節(jié)等信息,是具有較高識別效率的特征,故本方法選取高頻特征向量作為BP神經(jīng)網(wǎng)絡訓練的修正向量,利用BP神經(jīng)網(wǎng)絡的修正思想可以對低頻特征訓練進行修正。圖4為某幅直升飛機紅外圖像進行Contourlet變換提取出的16個方向高頻特征,為分解出來的目標邊緣和輪廓信息在各個方向、各個位置的分布情況。
圖4 某幅目標圖像的高頻特征16個方向分布圖
本文采用紅外飛行數(shù)據(jù)庫作為樣本集。庫中包含直升機、戰(zhàn)斗機、民航客機不同姿態(tài)、不同環(huán)境下的紅外圖片,訓練圖片和測試圖片互不重疊。對訓練集目標圖像預處理后進行2層Contourlet分解,提取得到16維特征向量,作為輸入目標集[x1,x2,x3,…,x16],輸出目標集設定為[y1,y2,y3]=[1,0,0]、[0,1,0]、[0,0,1]。[5]
將測試集目標圖像預處理后進行2層Contourlet分解,同樣提取16維高頻特征向量,將其作為測試數(shù)據(jù)送入訓練好的BP網(wǎng)絡模型進行辨識,并計算仿真結果的誤差值。為了便于觀察和調(diào)整,本文采用3層網(wǎng)絡,即1層隱藏層,再通過調(diào)節(jié)隱藏層結點個數(shù)來達到網(wǎng)絡精度和訓練時間的平衡最優(yōu)化化。[6]識別模型流程圖如圖5所示。
圖5 識別模型流程圖
本文對機動目標庫中不同機型飛行圖像進行圖像預處理、特征提取和BP網(wǎng)絡訓練,并對戰(zhàn)斗機、直升機、民航客機的每種機型隨機選取圖像用于測試。神經(jīng)網(wǎng)絡采用的中間層的傳遞函數(shù)為tan-sigmoid,輸出層傳遞函數(shù)為log-sigmoid,訓練采用Levenberg-Marquardt算法,收斂準則為訓練的誤差≤0.001。構建過程包括訓練原始數(shù)據(jù)歸一化、網(wǎng)絡結構優(yōu)化和數(shù)據(jù)反歸一化等幾個過程。考慮到訓練時間,設定迭代次數(shù)小于10 000,超過則退出程序。
訓練過程中,訓練函數(shù)會根據(jù)設定的顯示訓練結果的間隔步數(shù)值自動顯示當前訓練結果信息,并給出網(wǎng)絡誤差實時變化曲線。當訓練步數(shù)大于訓練設定步數(shù)、訓練誤差小于訓練目標誤差、訓練時間超過訓練允許時間或誤差梯度值小于訓練中最小允許梯度值時,訓練都將被終止,并返回訓練后的神經(jīng)網(wǎng)絡對象。
本文提出了一種基于多尺度分析和神經(jīng)網(wǎng)絡相結合的圖像目標識別方法,通過2層Contourlet變換得到多維高頻特征向量,充分利用了BP神經(jīng)網(wǎng)絡并行處理能力強、識別預測準確、穩(wěn)健性好的優(yōu)勢,對特征向量進行網(wǎng)絡訓練。網(wǎng)絡測試結果表明,本方法目標識別率高,精確性好,能滿足不同類型空中目標的準確識別要求。同時,該方法對于紅外圖像明暗光照變化、目標姿態(tài)變換均具有良好的魯棒性。