(91404部隊 秦皇島 066000)
艦船目標的檢測和識別是計算機視覺和模式識別中研究的一個熱點問題,其在軍事活動或民用領域具有十分重要的意義。近年來,隨著衛(wèi)星遙感技術的發(fā)展,可利用的衛(wèi)星遙感圖像數(shù)據(jù)也將呈指數(shù)級爆炸式增長。如何快速準確地從遙感數(shù)據(jù)中自動提取和識別出艦船目標已成為當前迫切需要解決的難題。
針對目前海戰(zhàn)場信息呈現(xiàn)的“小樣本”、“貧信息”等不完備特征,在特征提取方面,Lan等[1]運用改進的Zernike矩以實現(xiàn)遙感圖像中的軍用艦船識別問題,Antelo等[2]通過設計基于Bayessian準則的似然函數(shù)用以識別衛(wèi)星影像的艦船目標,另外,Yang等將像素和區(qū)域特性相結合設計了出一種線性函數(shù)用來檢測艦船目標[3]。另一方面,如何從目標的眾多特征中提取最為有效的特征組合也成為專家和學者們研究的重點,杜等[4]利用粗糙集理論的屬性約簡思想進行識別特征選擇,Siedlecki和Sklansky[5~6]把遺傳算法應用到特征選擇中,取得了不錯的效果。
特征樣本的分類效果同樣影響到圖像識別的準確性,楊等[7]提出了一種大間隔近鄰算法,Anag?nostopoulos[8]將支持向量機(SVM)技術應用到SAR圖像的目標識別中,在Frey等[9]設計的近鄰傳播(Affinity Propagation,AP)聚類算法的基礎上,張等[10]提出了基于分層組合的半監(jiān)督近層傳播算法,分類效果較好。此外,判別回歸(HDR)是一種新的分類和回歸方法,它把分類和回歸問題統(tǒng)一到回歸問題上了[11],效率很高,該算法尤其適合處理高維的圖像數(shù)據(jù)。
區(qū)別性較好的特征直接關系到后續(xù)艦船目標識別的效果。本文擬提取的特征如下。
1)大小特征。長度F1、寬度F2、長寬比F3、周長F4。
2)紋理特征。圖像熵F5、平滑度F6。熵采用8×8的窗體領域,計算公式如下:
3)形狀特征。艦首形狀F7、艦尾形狀F8、偏心率F9、主軸長度F10、緊致度F11。
4)不變矩特征。7個Hu不變矩F12~F18、階數(shù)小于8的前Zernike矩F19~F38、8個小波不變矩F39~F46。
5)面積比特征。參照Chen等[12]提出的面積比編碼,這里,把矩形面積劃分為N等份,記第i份目標區(qū)域面積為Si,根據(jù)式(2)對各面積進行編碼,且按照式(4)定義ARC,基于此,本文只提取艦船頭部面積比F47、尾部面積比F48,如圖1所示。
圖1 面積比編碼示意圖
針對圖1,按照定義可得N=5,面積比編碼記為C=[4 ,8,9,10,7] ,這里,只取C1和C5。
通過分析發(fā)現(xiàn),灰色關聯(lián)分析方法可以較好地反映艦船目標多因素決策方案和屬性之間的關系[13]?;诖耍芯坷没疑P聯(lián)度分析方法,以解決艦船目標的屬于約簡問題。
效益型目標值或成本型目標值進行標準化處理(灰色極差變換方法):
1)根據(jù)式(6)進行標準化處理,計算得到方案的效果評價向量(7);
2)按照式(8)、(9),計算理想方案的效果評價向量;
3)利用式(10),計算方案的灰色關聯(lián)系數(shù);
研究所提模型以未知類別的節(jié)點所屬的類別為隱含變量,以無向圖所在的邊為可見變量,根據(jù)模型的求解結果,獲取樣本的未知類別節(jié)點所屬的類別。
參考guo等[14]提出的動態(tài)概率生成模型,本研究根據(jù)定義的鄰居節(jié)點的差異性對節(jié)點Vi的鄰居節(jié)點按照差異度從小到大的順序快速排序,在此列表中選擇前Mi個節(jié)點作為Vi的鄰居節(jié)點參與后續(xù)分類處理。
以節(jié)點Vi為例,設定有K個類別、Ni個鄰居節(jié)點(其中有Nic個節(jié)點的類別屬于Lc),則對節(jié)點Vi和Ni個鄰居節(jié)點而言,屬于類別Lc的比率定義為
為方便計算記為
通過理論分析及后續(xù)實驗結果,我們將式(13)進行簡化,即:
假設在無向圖G=(V,E)中,有N個節(jié)點,他們隸屬于K個類別,以y表示節(jié)點未知類別索引集合,則由可見變量和隱含變量表示的聯(lián)合概率描述如下:
考慮王等[15]所提出的Gibbs sampling方法的效率低問題,研究采用基于變分近似法來表征模型參數(shù)θ:
上式的推導過程可參考王等[15]論文的附錄A,其中,Cic表示節(jié)點Vi與類別是Lc的節(jié)點之間邊的個數(shù)。
本文以隨機選取的谷歌地圖的航拍影像數(shù)據(jù)為實驗對象,進行艦種實驗仿真,該影像圖像首先采用基于視覺顯著性機制模型得到檢測目標,然后采用GPAC算法得到目標切片,如圖2所示。實驗數(shù)據(jù)分為6個艦種,每種50幅。實驗工具采用Mat?lab R2008b。
圖2 目標識別切片圖
根據(jù)上文描述方法,假設提取獲得一個由48維組成的特征向量。這里,我們將訓練樣本集記做論域U、特征向量集記做條件屬性集C、類別集記做決策屬性集D,根據(jù)式(11)可構造決策表:
其中,表示第i個訓練樣本的第j個特征值。
根據(jù)灰色區(qū)間關聯(lián)的屬性約簡方法步驟進行特征約簡,求得約簡結果其中表示由所有訓練樣本第i個特征組成的特征向量。并進行歸一化處理:
基于此,最終得到的特征組合為Z={F3,F(xiàn)4,F(xiàn)5,F(xiàn)11,F(xiàn)18,F(xiàn)29,F(xiàn)41,F(xiàn)44,F(xiàn)46,F(xiàn)47,F(xiàn)48} 。
圖3給出了識別特征的權值圖。
圖3 目標識別特征權值圖
將上文得到的有效特征組合作為樣本集,驗證本算法的識別性能,并與K近鄰(KNN)方法[16]、支持向量機(SVM)方法[8]、近鄰傳播(AP)方法[9]以及概率生成模型(PGM)[14]的識別結果進行比較。
本實驗數(shù)據(jù)分為8組,分別從每組中隨機選取90、120、150、180、210、240、270、300個樣本標記為訓練樣本,重復10次實驗,以平均值作為最終的識別率和耗時結果。試驗結果分別如表1、2所示。
表1 實驗結果(一)
表2 實驗結果(二)
通過分析表1和表2,不難發(fā)現(xiàn),在相同的實驗條件下,本算法的綜合性能較KNN、SVM、AP相比,有明顯的提高,究其原因,一方面本算法提取了有效的目標識別特征組合進行預處理,另一方面本算法采用了基于樣本鄰居節(jié)點差異度的快速排序方法進行分類計算。
本文針對艦船目標識別問題,首先引入了基于粗糙集理論的目標特征選擇算法,通過計算各候選特征的重要性權值,自動選擇出最有效的特征組合;然后采用動態(tài)概率生產(chǎn)模型進行目標分類,該模型首先通過計算某個節(jié)點的鄰居節(jié)點的差異度進行快速排序,然后在此列表中選取前若干個鄰居節(jié)點參與后分類計算。仿真實驗驗證,該方法識別效率較高,在解決實時性需求較為重要的海戰(zhàn)場目標識別問題時,不失為一種有效的借鑒方法。