馬忠麗,文 杰,梁秀梅,陳虹麗,趙新華
(哈爾濱工程大學(xué)自動化學(xué)院,150001,黑龍江哈爾濱)
水面無人艇(unmanned surface vehicle,USV)是 一種新型的海上智能體,可用來執(zhí)行掃雷、反潛、反恐攻擊等軍事任務(wù)以及海上港口監(jiān)視和搜救等民用任務(wù)。自主識別周圍環(huán)境、目標(biāo)以及障礙物是保證全自主式USV自主航行的先決條件。由于雷達存在近距離目標(biāo)探測盲區(qū),因此視覺系統(tǒng)就成為USV進行周圍場景圖像信息采集的主要設(shè)備之一。研究適合多類水面目標(biāo)的特征提取和識別方法,對發(fā)揮視覺系統(tǒng)在USV目標(biāo)探測和跟蹤中的作用具有重要意義。
在離岸較遠(yuǎn)的情況下,水面目標(biāo)一般包括礁石、島嶼、船只和大型魚類等。針對水面船只的目標(biāo)識別,汪成亮等通過定義輪船的4個幾何特征,實現(xiàn)輪船的簡單識別[1];劉新科等提取三維艦船在不同姿態(tài)下3個仿射不變矩特征,驗證了仿射不變矩特征在艦船目標(biāo)識別中的有效性[2];Zabidi等通過提取艦船Hu不變矩特征完成船舶目標(biāo)識別[3],但識別率不穩(wěn)定;Zhu等通過提取遙感圖像中船舶的形狀特征和紋理特征實現(xiàn)船舶檢測[4]。然而,上述的目標(biāo)識別方法,識別目標(biāo)單一,沒有考慮艦船艇實際運行中周圍目標(biāo)和障礙物的多樣性。
針對上述問題,本文提出一種多類水面目標(biāo)組合特征提取和識別方法??紤]到USV運行會引起圖像視角上的畸變,如平移、縮放、仿射等[5],獲得保持不變或者影響不大的的特征庫是實現(xiàn)目標(biāo)識別的關(guān)鍵。本文在進行圖像預(yù)處理基礎(chǔ)上,根據(jù)礁石、島嶼和船只這3類目標(biāo)的外形輪廓、幾何形狀和紋理分布具有較明顯差異的特點,提取它們的幾何特征、不變矩特征以及紋理特征,形成組合特征,利用PCA降維處理,采用分級BP神經(jīng)網(wǎng)絡(luò)分別實現(xiàn)島嶼、礁石和船只多類目標(biāo)的初級識別和多類船只的次級識別。仿真實驗結(jié)果表明,本文提出的多類水面目標(biāo)組合特征提取和識別方法能夠很好地提高USV對水面感興趣多類目標(biāo)識別的正確性。
海上環(huán)境復(fù)雜,考慮到海霧、海浪等因素的影響,為增強目標(biāo)識別系統(tǒng)的適應(yīng)能力,建立了如圖1所示的USV水面多類目標(biāo)識別系統(tǒng)模型。
受海霧的影響,USV拍攝的圖像會降質(zhì)模糊;同時,水面波動和USV高速運行,會導(dǎo)致目標(biāo)視頻圖像抖動模糊,影響后續(xù)處理。此外,圖像中目標(biāo)、背景的分割是目標(biāo)特征準(zhǔn)確提取的前提。因此,需要進行圖像預(yù)處理,包括:圖像增強、電子穩(wěn)像和目標(biāo)背景分割。
(1)圖像增強去霧。圖像去霧采用基于邊緣檢測的單尺度Retinex算法[6],在傳統(tǒng)單尺度Retinex模型基礎(chǔ)上,采用基于邊緣信息的高斯濾波估計亮度分量,實現(xiàn)較好的圖像去霧效果。
(2)電子穩(wěn)像。采用尺度不變特征變換(scale invariant feature transform,SIFT)算法提取特征點,結(jié)合仿射模型和Kalman濾波求取補償參數(shù),采用相鄰幀補償法對每幀圖像進行補償[7]。
(3)圖像目標(biāo)背景分割。采用改進的自適應(yīng)均值漂移算法進行目標(biāo)圖像分割[8]。結(jié)合貝葉斯準(zhǔn)則自適應(yīng)求取帶寬參數(shù),取得了較好的目標(biāo)分割效果,便于后續(xù)目標(biāo)特征提取。
圖1 無人艇水面多類目標(biāo)識別系統(tǒng)模型
目標(biāo)特征提取是正確識別目標(biāo)的前提,這里需要提取的多類水面目標(biāo)的特征包括:幾何特征、不變矩特征以及紋理特征。
目標(biāo)輪廓提取是幾何特征提取的前提,目標(biāo)輪廓的提取方法為:先對目標(biāo)背景分割后的圖像進行二值化處理,得到目標(biāo)區(qū)域,再提取目標(biāo)區(qū)域的外圍邊界實現(xiàn)目標(biāo)輪廓提取。對3類目標(biāo)輪廓特征提取的結(jié)果如圖2所示。
圖2 3類目標(biāo)輪廓提取的結(jié)果
幾何特征根據(jù)目標(biāo)區(qū)域外圍輪廓和其包含的像素點數(shù)量來定義。根據(jù)目標(biāo)最小外接矩得到目標(biāo)的5個幾何特征[9]。
(1)面積特征(Fa):具有旋轉(zhuǎn)、平移不變性。設(shè)分割后目標(biāo)區(qū)域面積為A1,將目標(biāo)區(qū)域中不連續(xù)部分填充后面積為A2,則歸一化后的面積特征Fa=A1/A2。
(2)細(xì)長度特征(Ff,l):沿主軸方向的長度和與其垂直的寬度的比值,即最小外接矩形長、寬比。
(3)緊密度特征(Ft):目標(biāo)周長與面積的比,可以表征目標(biāo)形狀的復(fù)雜度。
(4)凸包性特征(Fc,h):目標(biāo)面積與最小外接矩形的面積之比。
(5)凸起度量(Mc):針對船只提出的特征參數(shù),是船只上部建筑面積與下部船艙面積之比。確定最小外接矩形時的短軸為分割線,將目標(biāo)區(qū)域分為上、下兩部分,統(tǒng)計兩部分的像素點分別為a1、a2,則Mc=a1/a2。
考慮到僅使用Hu不變矩或仿射不變矩時不能獲得目標(biāo)準(zhǔn)確特征,這里同時提取目標(biāo)Hu不變矩與仿射不變矩特征用于目標(biāo)識別。
2.3.1 Hu不變矩特征的提取 一幅尺寸為m×n的二維離散圖像f(x,y),其p+q階原點矩mpq、中心矩μpq分別表示為
對中心矩做歸一化處理,即
當(dāng)圖像f(x,y)以比例因子ρ發(fā)生失真后,會對中心矩產(chǎn)生影響。為消除比例因子的影響,采用尺度歸一化對原Hu不變矩進行處理,可得
2.3.2 仿射不變矩特征提取 仿射變換是指在歐式空間中,共直線的3個點通過一個映射仍然共直線,仿射變換方程為
式中:A為變換矩陣且行列式不為零;B為平移參數(shù)矩陣。
Jan Flusser等[11]推導(dǎo)出十個仿射不變矩,本文提取前3個仿射不變矩
式中:μpq為式(2)中所表示的中心距,仿射不變矩特征數(shù)值分布范圍較廣,需取其對數(shù)值。
由于船舶相對海上礁石、島嶼而言紋理平滑,因此可以提取紋理特征來進行識別。
2.4.1 目標(biāo)圖像子區(qū)域提取 本文紋理特征的提取是針對目標(biāo)圖像子區(qū)域,子區(qū)域提取步驟如下。
(1)對二值化后的目標(biāo)區(qū)域進行孔洞填充,得到完整目標(biāo)區(qū)域,計算目標(biāo)區(qū)域的最小外接矩。
(2)將目標(biāo)最小外接矩等分割為N個子區(qū)域,每個子區(qū)域的尺寸最大為16×16像素。
(3)搜索每個子區(qū)域,若全為亮點,則設(shè)置為單子區(qū)域;若有黑點,則設(shè)置為背景或邊緣區(qū)域。
(4)繪制所有單子區(qū)域外圍輪廓,形成目標(biāo)多子區(qū)域,并在灰度圖相應(yīng)位置標(biāo)注該區(qū)域。
2.4.2 紋理特征提取 灰度共生矩陣是紋理特征提取常用方法[12],對目標(biāo)子區(qū)域圖像f(x,y)中任一灰度值為(g1,g2)的點A(x,y),計算其出現(xiàn)的概率p(g1,g2),得到灰度共生矩陣[13],其中,紋理統(tǒng)計特征描述因子有4個。
(1)紋理能量Q1:灰度共生矩陣中元素平方和,反映圖像紋理的均勻性,其計算公式為
(3)紋理梯度Q3:反映圖像的層次內(nèi)容以及清晰程度,其計算公式為
式中:k=|g1-g2|。
(4)紋理相關(guān)性Q4:衡量灰度共生矩陣行列之間元素的相似程度,其計算公式為
本文圖像數(shù)據(jù)有4個來源:
(1)水面艇實拍圖像數(shù)據(jù),攝像系統(tǒng)為800萬像素CMOS攝像頭,圖像分辨力為1 280×1 024像素,幀率為30幀/s;
(2)網(wǎng)絡(luò)圖片數(shù)據(jù),包括各種水面船只、礁石、島嶼圖片;
(3)自制水面遙控艇的實測數(shù)據(jù),攝像系統(tǒng)主要性能參數(shù):600萬像素CMOS攝像頭,圖像分辨力為480×320像素,幀率為60幀/s;
(4)3DMAX軟件制作的各種船只3D模型。
根據(jù)以上圖像數(shù)據(jù)建立水面目標(biāo)特征樣本庫。
選取礁石、島嶼、水面遙控艇實際拍攝目標(biāo)視頻序列抽取的圖像各100張,提取6個Hu不變矩、3個仿射不變矩和4個紋理特征。其中3類目標(biāo)5個樣本的部分紋理特征和不變矩特征對比曲線如圖3所示。
由圖3可以看到,船只的紋理特征和不變矩特征與礁石和島嶼的相比相差明顯,利用它們作為船只與其他目標(biāo)相區(qū)別的特征庫具有較好的可分性。
圖3 3類目標(biāo)部分紋理特征和不變矩特征對比曲線
采用3D軟件制作三維船舶模型,包括軍艦、游艇、郵輪、集裝箱船、航空母艦、汽油船、油輪7種船型,如圖4所示。
每種3D船模以一定角度旋轉(zhuǎn)、平移、放大或縮小形成樣本。不同類型3D船模選取100個樣本,每個樣本提取5個幾何特征,6個Hu不變矩,3個仿射不變矩特征。7類船旋轉(zhuǎn)0°和90°得到的14個特征值的對比曲線如圖5所示。
圖4 不同類型船只的3D船型
圖5 不同類型船舶特征對比
對比圖5a和圖5b可知:同一類船模從0°旋轉(zhuǎn)到90°時,其特征參數(shù)的數(shù)值發(fā)生了較大變化;不同類型船模處于相同位置時,幾何特征(除了凸包性)之間有明顯的差別,除Hu高階矩與仿射一階矩稍顯不足外,仿射不變矩與Hu不變矩特征在不同類型的船舶之間差別比較明顯。
主分量分析(PCA)是一種基于統(tǒng)計分析的降維處理技術(shù),應(yīng)用PCA對訓(xùn)練樣本的特征進行分析,能夠得到影響目標(biāo)識別結(jié)果的主要特征,然后利用這些主要特征進行BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練和識別,能有效降低處理時間[14]。
從目標(biāo)圖像樣本庫取300個樣本,選擇180個為訓(xùn)練樣本,每類目標(biāo)含有60個樣本數(shù)據(jù),含有13個特征,組成13×60維矩陣;測試樣本120個,每類目標(biāo)有40個樣本數(shù)據(jù)。搭建礁石、島嶼與船只的多神經(jīng)網(wǎng)絡(luò)并聯(lián)識別模型。模型中,BP神經(jīng)網(wǎng)絡(luò)為單輸出型神經(jīng)網(wǎng)絡(luò),共3層:輸入層、隱藏層和輸出層。
應(yīng)用PCA對輸入的訓(xùn)練樣本庫進行降維,選取貢獻率大于80%的特征。分析可知,礁石目標(biāo)特征量貢獻率較大的是I1、H2、Q2、I2、H4,島嶼目標(biāo)貢獻率較大的是I1、H2、I2、Q1、H6,船只目標(biāo)貢獻率較大的是Q3、H1、I1、I3、H6,則輸入樣本維數(shù)由13×60降為5×60。
采用Matlab 7.9平臺進行仿真研究,并行的3個神經(jīng)網(wǎng)絡(luò)輸入層節(jié)點數(shù)均為5,隱層神經(jīng)元數(shù)都為9,輸出層節(jié)點數(shù)為2。測試過程重復(fù)循環(huán)10次,硬件環(huán)境為:酷睿2雙核E7400處理器,主頻為2.80GHz,內(nèi)存為2GB。PCA降維前后,不同特征下網(wǎng)絡(luò)訓(xùn)練時間和平均識別率對比如表1所示。
表1 PCA降維前后訓(xùn)練時間和平均識別率對比
由表1數(shù)據(jù)比較可以看出:采用紋理特征與不變矩特征組合進行識別得到的平均別率相對較高,且用PCA降維后,大大縮短了訓(xùn)練時間,但降維后識別率有所降低。每類目標(biāo)基于組合特征的正確識別數(shù)統(tǒng)計結(jié)果如表2所示。
表2 基于組合特征目標(biāo)識別
選取3D模型船只樣本每類各120個,其中每類60個樣本作為訓(xùn)練樣本,其余60個為測試樣本;在實際網(wǎng)絡(luò)圖像和水面艇實測圖像形成的各類船只圖像庫中,每類目標(biāo)船型選取120幅不同視角圖像,其中每類60個作為訓(xùn)練樣本,其余60個作為測試樣本。每類測試樣本和訓(xùn)練樣本均含有14個特征,組成14×60維矩陣。
應(yīng)用PCA對輸入樣本庫進行優(yōu)化,選取貢獻率大于80%的特征,結(jié)果發(fā)現(xiàn):9個不變矩特征中,H1、I1、I3、H6貢獻率在不同船型中都較大。5個幾何特征中,軍艦?zāi)繕?biāo)特征量貢獻率較大的是Fa、Ff,l、Ft;游艇目標(biāo)貢獻率較大的是 Fa、Ff,l、Mc;郵輪目標(biāo)貢獻率較大的是Fa、Fc,h、Mc;油船目標(biāo)貢獻率較大的是Fa、Ft、Fc,h;集裝箱船目標(biāo)貢獻率較大的是Fa、Fc,h、Mc;汽油船目標(biāo)貢獻率較大的的是 Fa、Ff,l、Ft。上述6類船只PCA降維后的訓(xùn)練樣本維數(shù)由14×60降為7×60。航空母艦?zāi)繕?biāo)貢獻率較大的是Fa、Ff,l、Ft、Fc,h,維數(shù)由14×60降為8×60。
在同樣硬件條件、不同特征組合下,表3給出了3種情況下平均識別率對比。情況1是訓(xùn)練樣本和測試樣本均為3D模型船只;情況2是訓(xùn)練樣本和測試樣本均為實際船只;情況3是訓(xùn)練樣本為3D模型船只,測試樣本為實際船只。
表3 各類船只目標(biāo)3種情況下平均識別率
由表3得出,采用幾何特征和組合矩形成的組合特征的識別率較高,而實際船只識別率相對較低,3D模型船只和實際船只相結(jié)合的識別率最低。分析原因如下:采用自動分割提取目標(biāo)存在分割誤差[8];3D模型船只背景清晰、無干擾,分割誤差小,而實際圖像背景復(fù)雜,分割誤差較大,因此3D模型船只的識別率要高于實際船只的識別率。此外,實際圖像中目標(biāo)視角多變,且無規(guī)律,導(dǎo)致3D模型船只的訓(xùn)練樣本與實際船只的測試樣本差異較大,造成情況3的識別率最低。
本文在深入研究無人艇視覺系統(tǒng)采集到的水面目標(biāo)圖像特點的基礎(chǔ)上,對水面礁石、島嶼與船只3類目標(biāo)提取幾何特征、不變矩特征和紋理特征,并建立水面目標(biāo)特征庫,然后采用基于主分量分析的分級BP神經(jīng)網(wǎng)絡(luò)進行多類水面目標(biāo)識別,仿真實驗結(jié)果證實了方法的有效性。但是,本文研究也存在局限性,主要有:目標(biāo)沒有考慮水面鳥類、魚群等;已經(jīng)建立的礁石、島嶼、船只數(shù)據(jù)庫樣本數(shù)量有限;神經(jīng)網(wǎng)絡(luò)識別的泛化能力沒有深入討論;如何解決同一場景中多個目標(biāo)的特征提取和識別等。這些問題將是后續(xù)研究著重解決的問題。
[1] 汪成亮,汪連偉.基于特征的江面輪船識別算法 [J].計算機應(yīng)用研究,2011,28(6):2352-2354.
WANG Chengliang,WANG Lianwei.Ship targets recognition algorithm based on features[J].Application Research of Computers,2011,28(6):2352-2354.
[2] 劉新科,于吉紅,呂俊偉,等.基于仿射不變矩特征的艦船圖像識別方法 [J].海軍航空工程學(xué)院學(xué)報,2011,26(6):687-690.
LIU Xinke,YU Jihong,LV Junwei,et al.Ship image recognition method based on the affine invariant moments [J].Journal of Naval Aeronautical Engineering Institute,2011,26(6):687-690.
[3] ZABIDI M M A,MUSTAPA J,MOKJI M M,et al.Embedded vision systems for ship recognition [C]∥Proceedings of TENCON 2009,IEEE Region 10 International Conference.Los Alamitos,CA,USA:IEEE Computer Society,2009:1-5.
[4] ZHU Changren,ZHOU Hui,WANG Runsheng,et al.A novel hierarchical method of ship detection from spaceborne optical image based on shape and texture features[J].IEEE Transactions on Geoscience and Remote Sensing,2010,48(9):3446-3456.
[5] VELLA F.Digital image stabilization by adaptive block motion vectors filtering [J].IEEE Transactions on Consumer Electronics,2002,48(3):796-801.
[6] MA Z,WEN J,LIANG X.Video image clarity algorithm research of USV visual system under the sea fog [M]∥ Advances in Swarm Intelligence.Heidelberg,Germany:Springer,2013:436-444.
[7] 馬忠麗,李慧鳳,文杰,等.高速水面艇視覺系統(tǒng)電子穩(wěn)像算法 [J].計算機應(yīng)用研究,2014,31(2):633-636.
MA Zhongli,LI Huifeng,WEN Jie,et al.Electronic image stabilization algorithm for high speed surface vehicle vision system [J].Application Research of Computers,2014,31(2):633-636.
[8] 馬忠麗,梁秀梅,文杰.無人水面艇目標(biāo)圖像自適應(yīng)分割算法 [J].哈爾濱工業(yè)大學(xué)學(xué)報,2014,46(5):612-636.
MA Zhongli,LIANG Xiumei, WEN Jie.Image adaptive segmentation algorithm for unmanned surface vehicle targets [J].Journal of Harbin Institute of Technology,2014,46(5):612-636.
[9] 宋衛(wèi)東.解析幾何 [M].北京:高等教育出版社,2003:96-101.
[10]CHENG Y Z.Mean shift,mode seeking,and clustering[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1995,17(8):790-799.
[11]FLUSSER J,SUK T.Pattern recognition by affine moment invariants[J].Pattern Recognition,1993,1(26):167-174.
[12]鐘建華,齊樂華,李妙玲,等.利用人工神經(jīng)網(wǎng)絡(luò)的偏光下熱解炭織構(gòu)類型識別 [J].西安交通大學(xué)學(xué)報,2010,44(7):46-49.
ZHONG Jianhua,QI Lehua,LI Miaoling,et al.Automatic classification of pyrocarbon texture under polarized light microscope based on artificial neural network[J].Journal of Xi’an Jiaotong University,2010,44(7):46-49.
[13]苑麗紅,付麗,楊勇,等.灰度共生矩陣提取紋理特征的實驗結(jié)果分析 [J].計算機應(yīng)用,2009,29(4):1018-1021.
YUAN Lihong,F(xiàn)U Li,YANG Yong,et al.Analysis of texture feature extracted by gray level co-occurrence matrix[J].Journal of Computer Applications,2009,29(4):1018-1021.
[14]張國英,王娜娜,張潤生,等.基于主成分分析的BP神經(jīng)網(wǎng)絡(luò)在巖性識別中的應(yīng)用 [J].北京石油化工學(xué)院學(xué)報,2008,16(3):43-46.
ZHANG Guoying,WANG Nana,ZHANG Runsheng,et al.Application of principal component analysis and BP neural network in identifying lithology[J].Journal of Beijing Institute of Petro-chemical Technology,2008,16(3):43-46.