楊海東,孫正凱
利用空間填充曲線和灰度分布估計(jì)的聲圖分割
楊海東,孫正凱
(南昌理工學(xué)院,江西南昌 330044)
針對(duì)聲圖中的目標(biāo)分割問題,提出了一種利用空間填充曲線和灰度分布估計(jì)的聲圖目標(biāo)分割方法。該方法首先利用空間填充曲線將聲圖由二維矩陣變換為一維向量;其次在一維空間下進(jìn)行濾波、灰度分布估計(jì)、閾值計(jì)算、分割處理;最后將分割后的一維向量逆變換為二維矩陣,得到目標(biāo)分割結(jié)果。實(shí)際的聲圖處理驗(yàn)證了方法的有效性。
聲圖目標(biāo)分割;空間填充曲線;灰度分布估計(jì)
成像聲吶是探索海底最主要的手段之一,對(duì)聲圖中各類目標(biāo)的分割及識(shí)別是聲吶圖像處理的主要內(nèi)容[1-3]。多數(shù)聲圖為二維圖像,其后處理也在二維框架下進(jìn)行[4]。與一維處理相比,二維處理的運(yùn)算量較大,較難滿足實(shí)時(shí)處理以及需要快速后處理時(shí)的需求。因此,如果對(duì)二維聲圖進(jìn)行降維,并研究在一維情形下的信號(hào)處理方法,可極大提高聲圖后處理的效率,使實(shí)時(shí)處理和快速后處理易于實(shí)現(xiàn)。
空間填充曲線能夠?qū)⒍嗑S空間數(shù)據(jù)映射為一條曲線,從分形角度看這條曲線的維數(shù)仍然為原空間數(shù)據(jù)的維數(shù),但在數(shù)據(jù)角度上看其為一維向量[5-6]。對(duì)空間填充曲線貢獻(xiàn)最大的是數(shù)學(xué)家康托、皮亞諾和希爾伯特,前者提出了一維到二維的映射理論,后兩人則提出了這種映射曲線的做法,他們所發(fā)現(xiàn)的曲線分別被稱為皮亞諾曲線或希爾伯特曲線[7]。
常見的聲吶圖像灰度分布模型有威布爾分布、瑞利分布、高斯分布,以及升級(jí)的混合分布等模型[8]。其中威布爾分布比瑞利分布能夠更好地逼近聲吶圖像的灰度分布曲線,瑞利分布具有運(yùn)算效率高的特點(diǎn)。
本文在綜合分析典型的空間填充曲線和灰度分布估計(jì)的基礎(chǔ)上,首先,利用空間填充曲線將聲吶圖像由二維矩陣變換為一維向量。其次,利用灰度分布估計(jì),計(jì)算分布參數(shù),并由此計(jì)算聲吶圖像的目標(biāo)分割閾值。再次,在聲圖一維向量基礎(chǔ)上進(jìn)行濾波降噪處理,利用閾值分割目標(biāo)及陰影。最后,利用空間填充曲線的逆變換將目標(biāo)所在區(qū)域分割出來(lái)。
空間填充曲線,顧名思義即指能夠?qū)⒖臻g填滿的一條曲線,其嚴(yán)格的數(shù)學(xué)定義是:一個(gè)維空間填充曲線是一個(gè)連續(xù)的滿射,將單位區(qū)間[0, 1]映射到維超立方空間[0, 1]??臻g填充曲線有很多種,目前主要有Peano曲線、希爾伯特曲線、Moore曲線、Morton曲線(Z曲線)等。
空間填充曲線將二維圖像降為一維向量后,勢(shì)必會(huì)改變?cè)S圖像上像素間的空間位置關(guān)系,重點(diǎn)是各像素與其二維鄰域空間其他各像素的關(guān)系。不同的填充曲線對(duì)原有像素間空間關(guān)系的保留能力不同,這種能力稱為填充曲線的“聚集特性”(clustering properties)。眾多空間填充曲線中,數(shù)據(jù)聚集特性優(yōu)異且應(yīng)用廣泛的是由希爾伯特在1891年發(fā)現(xiàn)的希爾伯特曲線。文獻(xiàn)[9]嚴(yán)格證明了希爾伯特曲線在二維空間中比Z曲線擁有更好的聚集特性,并通過(guò)仿真表明在二維和三維空間中,希爾伯特曲線的聚集特性優(yōu)于Z曲線和Gray編碼曲線。
圖1 1~3階希爾伯特曲線
圖2 希爾伯特掃描曲線的四種方向
設(shè)正方形邊長(zhǎng)為,則可以表示為
構(gòu)造掃描矩陣的步驟如下:
設(shè)希爾伯特掃描矩陣的起點(diǎn)在左上角,掃描矩陣分層示意圖如圖3所示。
圖3 任意邊長(zhǎng)正方形的希爾伯特掃描矩陣分層示意圖
圖4 希爾伯特掃描矩陣層的掃描方向
對(duì)于任意矩形,其空間填充曲線可由若干個(gè)基于正方形的空間填充曲線首尾連接組成。其基本思路是將在矩形中分割出最大的正方形,對(duì)其提取任意邊長(zhǎng)正方形的空間填充曲線,在剩余的矩形中繼續(xù)執(zhí)行該操作,直至剩余部分為空。
設(shè)矩形的行數(shù)和列數(shù)(即矩陣的長(zhǎng)和寬)分別為和,計(jì)算任意矩形的空間填充曲線掃描矩陣的基本步驟如下:
(3) 循環(huán)執(zhí)行上述操作,直至剩余部分為空,將上述矩陣順次連接后形成掃描矩陣。
聲吶圖像是水中或水底目標(biāo)的后向散射強(qiáng)度的體現(xiàn)。一般在內(nèi)陸河流湖泊、近海港口或漁區(qū)的背景較為復(fù)雜,在近海其他水域和遠(yuǎn)海海底背景較為單一、目標(biāo)較為簡(jiǎn)單。此外與光學(xué)圖像相比,聲吶圖像的分辨率低、噪聲較高。因此聲吶圖像的濾波是目標(biāo)識(shí)別中非常重要的步驟。
首先利用任意矩形空間填充曲線掃描矩陣,將二維聲吶圖像做降維處理,生成一維向量,如式(3)所示:
由于聲吶圖像非直接成像,需要對(duì)原始采集數(shù)據(jù)進(jìn)行信號(hào)處理后才能獲得,同時(shí)由于聲吶分辨率低,水聲環(huán)境復(fù)雜,聲吶圖像的背景噪聲較強(qiáng)。因此在目標(biāo)分割前對(duì)聲圖進(jìn)行必要的濾波處理,可提高聲吶目標(biāo)分割的效率和正確率。
對(duì)于聲圖降維后的一維向量,與二維矩陣相比,一些濾波方法的處理效率會(huì)得到較大提升。
圖像灰度分布估計(jì)有很多種模型,典型的如高斯模型、瑞利分布模型、威布爾分布模型,以及升級(jí)的混合分布模型等。
根據(jù)MIDDLETON提出的海底混響模型[11],成像結(jié)果是大量隨機(jī)相位散射體的疊加(積分),幅度和相位相互獨(dú)立,并且根據(jù)中心極限定理,海底散射混響的幅值服從瑞利分布。瑞利分布是威布爾分布的一種特殊形式,即威布爾分布包含了瑞利分布。大量實(shí)驗(yàn)處理結(jié)果表明,威布爾分布比瑞利分布更接近聲吶圖像的灰度分布。當(dāng)成像區(qū)域中有強(qiáng)點(diǎn)目標(biāo)或散射體較少時(shí),聲圖灰度分布服從K分布或Gamma分布[12-13]。
實(shí)際中大多數(shù)成像聲吶基于海底混響成像,包括前下視聲吶、下視多波束聲吶、側(cè)視聲吶、側(cè)視合成孔徑聲吶等。并且海底聲圖中強(qiáng)點(diǎn)面積一般遠(yuǎn)小于背景區(qū)域,因此威布爾分布適用于大部分聲圖。威布爾分布的分布函數(shù)為
式中,為幅度,為尺度參數(shù),為形狀參數(shù)。對(duì)于圖像灰度分布,用來(lái)控制概率最大的灰度值所在的位置,用來(lái)控制灰度值的集中程度。
利用威布爾分布參數(shù)的閾值分割策略生成目標(biāo)閾值和陰影閾值,其優(yōu)點(diǎn)在于可自適應(yīng)地應(yīng)用于不同情形下亮度差異較大的圖像。
目前主流的圖像灰度是位于[0, 225]之間的整數(shù),分析威布爾分布函數(shù),可以看出灰度值與尺度參數(shù)近似為正比例關(guān)系,與形狀參數(shù)為指數(shù)關(guān)系,利用這種關(guān)系以及參數(shù)和閾值間的定性關(guān)系提出目標(biāo)閾值和陰影閾值的策略函數(shù)為
(1) 聲吶原圖
圖5為2幅典型的側(cè)掃聲吶圖像,圖5(a)是由Klein公司的S3900側(cè)掃聲吶對(duì)遇難者的成像結(jié)果[14],圖5(b)是S4900型側(cè)掃聲吶的成像結(jié)果,圖中包含了一個(gè)水泥臺(tái)及其上固定的繩纜。
圖5 兩幅實(shí)際的目標(biāo)聲圖
(2) 圖像進(jìn)行掃描后的一維向量
對(duì)聲圖利用空間填充曲線矩陣進(jìn)行掃描,產(chǎn)生一維向量。其中遇難者聲圖的一維向量如圖6(a)所示。作為對(duì)照,圖6(b)給出了原圖按照每行進(jìn)行掃描后的一維向量曲線。對(duì)比可以看出,采用填充曲線矩陣掃描后的一維向量,圖中幅度較高處(即聲圖中的目標(biāo)部分)較為集中,而采用按行掃描的圖像其幅度較高的部分較為分散。
圖7是對(duì)“繩纜”聲圖進(jìn)行空間填充曲線掃描7(a)和逐行掃描7(b)的結(jié)果。在本實(shí)例中,由于原圖總體亮度水平較高,因此在圖中灰度值較大處較多,但仍可以從兩個(gè)結(jié)果的對(duì)比看出,空間填充曲線掃描結(jié)果的集中度更高。
通過(guò)對(duì)兩幅聲圖分別采用空間填充曲線掃描向量和逐行掃描向量產(chǎn)生的一維向量進(jìn)行定性分析,可以看出經(jīng)空間填充曲線掃描向量處理的結(jié)果,其目標(biāo)集中度更好,更有利于后續(xù)濾波處理。
(3) 一維向量濾波處理
獲得聲圖一維向量后,即可進(jìn)行一維濾波處理,在一維向量上進(jìn)行處理比二維圖像域處理速度更快。
圖8是遇難者聲圖對(duì)應(yīng)一維向量的平滑濾波、中值濾波等處理結(jié)果的局部。從圖8中可以看出,幅度較大部分的中值濾波效果更好。
圖6 “遇難者”聲圖掃描向量
圖7 “繩纜”聲圖掃描向量
(4) 威布爾分布估計(jì)及閾值計(jì)算
對(duì)一維向量進(jìn)行威布爾分布估計(jì),原圖灰度直方圖分布及威布爾分布曲線如圖9所示。
圖8 聲圖掃描向量的濾波
圖9 兩個(gè)目標(biāo)聲圖的灰度分布直方圖及威布爾分布曲線
利用分布參數(shù)計(jì)算目標(biāo)閾值和陰影閾值如表1所示。
(5) 利用閾值的目標(biāo)分割和陰影分割
針對(duì)本文中所使用的圖像和計(jì)算的目標(biāo)閾值和陰影閾值,對(duì)兩幅圖像進(jìn)行分割處理,作為對(duì)照,給出在二維圖像域上進(jìn)行分割的其他兩種方法,即直接閾值分割、二維中值濾波后分割。
表1 威布爾分布估計(jì)參數(shù)及閾值
本文空間填充曲線及灰度分布估計(jì)(Space Filling Curve and Grayscale Distribution Estimation, SFP-GDE)方法針對(duì)直接閾值分割的優(yōu)點(diǎn)在于其較高的準(zhǔn)確率,而針對(duì)二維中值濾波后閾值分割方法的優(yōu)點(diǎn),在于其運(yùn)算效率的提高。為此統(tǒng)計(jì)上述不同方法針對(duì)兩幅聲圖處理時(shí)的準(zhǔn)確率、運(yùn)算時(shí)間,進(jìn)行定量比較分析。
利用人工識(shí)別在遇難者聲圖和繩纜聲圖中使用一個(gè)矩形將目標(biāo)和陰影所在區(qū)域選中,區(qū)域外的像素點(diǎn)識(shí)別為目標(biāo)或陰影的判定為錯(cuò)誤識(shí)別,區(qū)域內(nèi)則不計(jì)入統(tǒng)計(jì)。兩幅聲圖目標(biāo)區(qū)人工選擇示意如圖10所示。
圖10 人工劃分目標(biāo)區(qū)
3種方法的分割結(jié)果如圖11所示。圖11中白色部分為分割出的目標(biāo)部分,灰色部分為分割出的背景部分,黑色部分為分割出的陰影部分。
3種方法的誤分率統(tǒng)計(jì)和處理時(shí)間如表2和表3所示。
通過(guò)對(duì)分割結(jié)果的對(duì)比可以看出,采用本文提出的SFP-GDE方法,其誤分率與聲圖在二維域上進(jìn)行濾波后再進(jìn)行閾值分割相當(dāng),但處理時(shí)間則遠(yuǎn)小于后者,這是因?yàn)橹兄禐V波在二維域處理和一維域處理的差異導(dǎo)致。
圖11 不同方法的目標(biāo)聲圖分割結(jié)果:左,本文SFP-GDE 方法;中,二維中值濾波后閾值分割;右,直接閾值分割
與直接閾值分割相比,本文雖然在運(yùn)算時(shí)間上不占優(yōu)勢(shì),但誤分率則明顯小于直接閾值分割法。
表2 誤分率統(tǒng)計(jì)結(jié)果(10-4)
表3 處理時(shí)間統(tǒng)計(jì)結(jié)果(s)
聲圖目標(biāo)分割是聲圖處理的一個(gè)重要方向,本文提出了利用空間填充曲線掃描矩陣來(lái)將聲吶圖像由二維矩陣變換為一維向量。并在一維空間下進(jìn)行濾波處理,之后利用灰度分布估計(jì)參數(shù)獲得目標(biāo)分割和陰影分割的閾值,并將一維向量的元素劃分為目標(biāo)、背景、目標(biāo)陰影3類。最后將分類后的向量逆變換為二維矩陣,即獲得了聲圖目標(biāo)的分割結(jié)果。本方法的優(yōu)點(diǎn)主要在于聲吶圖像的濾波階段,經(jīng)降維后可極大降低運(yùn)算量。利用對(duì)實(shí)際聲圖的處理結(jié)果,驗(yàn)證了提出方法的有效性。
此外,仍有一些方法在一維域上進(jìn)行閾值檢測(cè)比二維域上的檢測(cè)要更為便利,例如局部峰值檢測(cè)等。在局部峰值檢測(cè)后再變換至二維域進(jìn)行形態(tài)學(xué)腐蝕也可得到有益的成果。
致 謝 本文中所使用的聲吶圖像來(lái)自于Klein公司網(wǎng)站,該圖像是Klein S3900側(cè)掃聲吶對(duì)假人獲得的高清成像結(jié)果,在此對(duì)Klein公司表示感謝。
[1] MIGNOTTE M, COLLET C, PEREZ P, et al. Sonar image segmentation using an unsupervised hierarchical MRF model[J]. IEEE Trans. Image Process, 2000, 9(7): 1216-1231
[2] 盧逢春, 張殿倫, 郭海濤. 基于屬性直方圖的圖像分割方法及其在聲吶圖像分割中的應(yīng)用[J]. 哈爾濱工程大學(xué)學(xué)報(bào), 2002 , 23(3): 1-3.
LU Fengchun, ZHANG Dianlun, GUO Haitao. Image segmentation based upon bounded histogram and its application to sonar image segmentation[J]. Journal of Harbin Engineering University, 2002, 23(3): 1-3.
[3] 霍冠英, 劉靜, 李慶武, 等. 空間約束FCM與MRF結(jié)合的側(cè)掃聲吶圖像分割算法[J]. 儀器儀表學(xué)報(bào), 2017, 38(1): 226-235.
HUO Guanying, LIU Jing, LI Qingwu, et al. Side-scan sonar image segmentation algorithm based on space-constrained FCM and MRF [J]. Chinese Journal of Scientific Instrument, 2017, 38(1): 226-235
[4] 姜楓, 顧慶, 郝慧珍, 等. 基于內(nèi)容的圖像分割方法綜述[J]. 軟件學(xué)報(bào), 2017, 28(1): 160-183.
JIANG Feng, GU Qing, HAO Huizhen, et al. Survey on content-based image segmentation methods[J]. Journal of Software, 2017, 28(1): 160-183.
[5] 劉樹群, 耿德磊. 二維空間填充曲線的生成方法[J]. 甘肅科學(xué)學(xué)報(bào), 2010, 22(3): 105-107.
LIU Shuqun, GENG Delei. The generation method of 2D space-filling curves[J]. Journal of Gansu Sciences, 2010, 22(3): 105-107.
[6] 曹奎, 馮玉才. 基于GM模型和Hilbert空間填充曲線的圖象壓縮方法[J]. 小型微型計(jì)算機(jī)系統(tǒng), 2002, 23(11) :1359-1362.
CAO Kui, FENG Yucai. An image compression method based on GM and Hilbert space filling curve[J]. Journal of Chinese Computer System, 2002, 23(11): 1359-1362.
[7] 王筍, 徐小雙. Hilbert曲線掃描矩陣的生成算法及其MATLAB程序代碼[J]. 中國(guó)圖象圖形學(xué)報(bào), 2006, 11(1): 119-122.
WANG Sun, XU Xiaoshuang. A new algorithm of Hilbert scanning matrix and its MATLAB program[J]. Journal of Image and Graphics, 2006, 11(1): 119-122.
[8] 翟厚曦, 江澤林, 張鵬飛, 等. 一種合成孔徑聲吶圖像目標(biāo)分割方法[J]. 儀器儀表學(xué)報(bào), 2016, 37(4): 887-894.
ZHAI Houxi, JIANG Zelin, ZHANG Pengfei, et al. Object segmentation method for synthetic aperture sonar images[J]. Chinese Journal of Scientific Instrument, 2016, 37(4): 887-894.
[9] BONGKI M, JAGADISH H V, FALOUTSOS C. Analysis of the clustering properties of the Hilbert space filling curve[J]. IEEE Trans. Knowl. Data Eng., 2001, 13(1): 124-141.
[10] CHUNG K L, HUANG Y L, LIU Y W. Efficient algorithms for coding Hilbert curve of arbitrary sized image and application to window query[J]. Information Sciences, 2007, 177(10): 2130-2151.
[11] MIDDLETON D. A statistical theory of reverberation and similar first-order scattered fields[J]. IEEE Transactions On Information Theory, 1967, 13(3): 372-392.
[12] GENSANE M. A statistical study of acoustic signals backscattered from the sea bottom[J]. IEEE J. Oceanic Eng., 1989, 14(1): 84-93.
[13] 霍冠英, 劉靜, 李慶武. 側(cè)掃聲吶圖像統(tǒng)計(jì)特性研究[J]. 傳感器與微系統(tǒng), 2017, 36(3): 25-28 HUO Guanying, LIU Jing, LI Qingwu. Study of statistical characteristics of side scan sonar image[J]. Transducer and Microsystem Technologies, 2017, 36(3): 25-28.
[14] System 3900 Digital Side Scan Sonar [EB/OL]. http://kleinmarinesystems.com/products/side-scan-sonar/system-3900/.
Research on sonar image segmentation by spatial filling curve and grayscale distribution estimation
YANG Hai-dong, SUN Zheng-kai
(Nanchang Institute of Technology, Nanchang 330044, Jiangxi, China)
Aiming at the problem of target segmentation in sonar images, a method based on space filling curve and grayscale distribution estimation is proposed and named as SFC-GDE Method. In this method, the space filling curve is firstly used to transform sonar image from two-dimension matrix to one-dimension vector, and then, the entire sonar image processing process, including filtering, grayscale distribution estimation, threshold calculation and image segmentation, are carried out in one dimensional space. Finally, the segmented one-dimensional vector is transformed into a two-dimensional matrix by inverse transformation to achieve target segmentation. Actual sonar image has been processed to verify the effectiveness of the proposed method.
sonar image object segmentation; space filling curve; grayscale distribution estimation
TP751
A
1000-3630(2019)-06-0691-07
10.16300/j.cnki.1000-3630.2019.06.016
2018-08-12;
2019-03-02
江西省教育廳2017年度科學(xué)技術(shù)基金重點(diǎn)項(xiàng)目(GJJ171041)
楊海東(1983-), 男, 山西長(zhǎng)治人, 碩士, 講師, 研究方向?yàn)殡娮有畔⒖茖W(xué)與技術(shù),軟件工程。
楊海東, E-mail: yanghaidong_nit@sina.com