王曙光,曾向陽,王征,王強
(1.西北工業(yè)大學(xué)航海學(xué)院,陜西西安710072;2.中國船舶工業(yè)集團公司,北京100048)
水下目標的Gammatone子帶降噪和希爾伯特-黃變換特征提取
王曙光1,曾向陽1,王征2,王強1
(1.西北工業(yè)大學(xué)航海學(xué)院,陜西西安710072;2.中國船舶工業(yè)集團公司,北京100048)
水下目標識別是水聲探測中的關(guān)鍵技術(shù),具有重要的應(yīng)用價值。海洋環(huán)境的復(fù)雜性導(dǎo)致水下目標識別中存在不可回避的噪聲干擾。以人耳聽覺機理為基礎(chǔ),提出了一種結(jié)合Gammatone濾波器、小波閾值降噪和希爾伯特-黃變換(HHT)的水下目標識別方法。采用Gammatone濾波器實現(xiàn)人耳聽覺機理的模擬,并在此基礎(chǔ)上進行小波閾值降噪,提高系統(tǒng)的噪聲魯棒性,然后利用HHT進行時頻分析和特征提取。利用實際水下目標數(shù)據(jù)進行識別實驗,對提出的方法進行了驗證。實驗結(jié)果表明,提出的方法在低信噪比條件下具有良好的魯棒性,并具有較好的識別效果。
聲學(xué);水下目標識別;人耳聽覺;Gammatone濾波器;希爾伯特-黃變換
水下目標識別是水聲探測領(lǐng)域的關(guān)鍵技術(shù)之一,是探測系統(tǒng)智能化的重要標志。在現(xiàn)代海戰(zhàn)中,能否對水下目標實現(xiàn)快速、準確的探測和分類,對海軍艦艇的作戰(zhàn)能力和生存能力至關(guān)重要。海洋環(huán)境復(fù)雜、多變的特性對水下目標識別系統(tǒng)的精確度和穩(wěn)定性都提出了巨大的挑戰(zhàn)。海洋環(huán)境噪聲和海洋混響是水下目標識別系統(tǒng)的主要干擾,如果能夠有效地消除這些噪聲的影響,便有望建立具有高精度的魯棒性水下目標識別系統(tǒng)。
人耳聽覺系統(tǒng)在嘈雜的環(huán)境下仍可以有效地跟蹤并識別感興趣的聲音,而不受其他噪聲的干擾,即所謂的“雞尾酒會效應(yīng)”。這種優(yōu)秀的識別能力是許多機器識別方法不能比擬的。人耳聽覺的一個顯著特點是非線性,其對聲音的感知可以劃分為一系列不同帶寬的頻帶,通過對各頻帶的感知實現(xiàn)對聲信號的整體把握。研究證明[1-2],對人耳聽覺能力進行模擬,應(yīng)用于水下目標識別系統(tǒng),這是提高識別系統(tǒng)魯棒性的有效手段??紤]到水下目標探測中的噪聲問題,將人耳聽覺的非線性特點與降噪處理結(jié)合,在各個子帶信號上進行降噪處理,有助于增強系統(tǒng)對噪聲的魯棒性。
另一方面,特征提取是目標識別的關(guān)鍵環(huán)節(jié),提取的特征是否有效,對最終的識別結(jié)果具有直接影響。水下目標輻射噪聲主要包含連續(xù)譜的寬帶噪聲和離散頻率上的線譜。其中,線譜部分主要由目標自身機械結(jié)構(gòu)工作時產(chǎn)生,連續(xù)譜部分主要由螺旋槳空化噪聲和水動力噪聲引起。由于傳播過程中的多途效應(yīng),往往體現(xiàn)為時變信號。作為時頻分析的重要工具,希爾伯特-黃變換(HHT)可以有效地提取信號的瞬時特征,這使其非常適合于水下目標輻射噪聲的分析與處理[3-4]。
本文在已有研究的基礎(chǔ)上,提出了一種結(jié)合Gammatone濾波器組、小波閾值降噪和HHT的水下目標識別方法。其中,Gammatone濾波器組用來模擬人耳聽覺感知的非線性特點,并在此基礎(chǔ)上進行小波閾值降噪處理,以提高識別系統(tǒng)對噪聲的魯棒性;HHT則用來進行時頻分析,構(gòu)建對應(yīng)的特征向量。最后,采用支持向量機(SVM)對目標種類進行判定。實驗結(jié)果表明,該方法在低信噪比條件下仍具有較高的識別精度。
如圖1所示,含噪信號首先通過Gammatone濾波器組進行分解,將其分解成為與人耳聽覺的非線性頻率相對應(yīng)的一系列子帶信號。對各子帶信號進行小波閾值降噪。HHT用來進行特征提取,構(gòu)建特征向量。最后,采用SVM實現(xiàn)目標信號的識別。
圖1 方法流程圖Fig.1 Workflow of proposed algorithm
1.1 Gammatone濾波器組
人耳聽覺感知系統(tǒng)中,基底膜的不同位置會對不同頻率的信號產(chǎn)生最大響應(yīng)。從信號處理的角度,可以將基底膜的這種頻響特性看成是一組濾波器。并采用等效矩形帶寬(ERB)濾波器來表示。濾波器的ERB與中心頻率fc的關(guān)系為
Gammatone濾波器只需要很少的參數(shù)就能很好地模擬人耳聽覺機理的實驗數(shù)據(jù),能夠體現(xiàn)基底膜的頻譜特性。Gammatone函數(shù)的時域表達式為
式中:a為歸一化因子;ut為階躍函數(shù),
b為帶寬相關(guān)的參數(shù),b=1.019ERB(fc);n為Gammatone濾波器的階數(shù),研究表明,n=4的Gammatone濾波器就能很好地模擬基底膜的濾波特性[5];φ為濾波器的初始相位,本文中,取φ=0.
將0~4 kHz的頻率范圍劃分為24個子帶,由(1)式可計算得到各子帶的中心頻率,進而可根據(jù)(2)式得到各Gammatone子濾波器的時域響應(yīng)。對于第16個子帶,其時域的脈沖響應(yīng)如圖2所示。依據(jù)這種方法,可以得到各濾波器的時域脈沖響應(yīng)及對應(yīng)的頻譜。圖3顯示了所有24個濾波器的頻率響應(yīng)曲線。
1.2 子帶小波閾值降噪
經(jīng)過Gammatone濾波器組的處理,信號分解為一系列與人耳聽覺相對應(yīng)的子帶信號。接下來,采用小波閾值降噪的方法,對各子帶信號進行降噪。在各子帶上進行降噪處理有助于得到更純凈的結(jié)果,提高降噪效果。另外,子帶劃分與人耳聽覺感知特性相對應(yīng),這也使得降噪處理后的結(jié)果具有更好的音質(zhì)效果。
圖2 第16個Gammatone濾波器的時域響應(yīng)Fig.2 Time domain response of 16th Gammatone filter
圖3 Gammatone濾波器組的頻域響應(yīng)Fig.3 Frequency response of Gammatone filter bank
小波分析能夠同時在時頻域?qū)π盘栠M行分析,所以它能有效地區(qū)分信號中的突變部分和噪聲,從而實現(xiàn)對信號的降噪。小波閾值降噪就是在小波分解后的各層系數(shù)中,對模大于和小于特定閾值th的系數(shù)分別處理,然后對處理完的小波系數(shù)再反變換重構(gòu)得到降噪后的信號。
小波分解系數(shù)的閾值處理方法分為軟閾值法和硬閾值法。相比之下,軟閾值法的結(jié)果具有較好的整體連續(xù)性[6]。因此,本文選取軟閾值法作為小波閾值降噪的處理方法。
圖4 小波軟閾值降噪Fig.4 Soft threshold of wavelet denoising
1.3 利用HHT提取特征
HHT的核心思想是將時間序列信號通過經(jīng)驗?zāi)B(tài)分解(EMD),分解成若干固有模態(tài)函數(shù)(IMF),然后利用希爾伯特變換構(gòu)造解析信號,得到信號的瞬時頻率和瞬時振幅。
1.3.1 經(jīng)驗?zāi)B(tài)分解
EMD可以看作是一個篩選過程,依據(jù)信號特點自適應(yīng)地將任意一個復(fù)雜信號分解為一列IMF. IMF滿足如下兩個條件:
1)信號極值點的數(shù)量與零點數(shù)相等或相差1;
2)信號由極大值定義的上包絡(luò)和由極小值定義的下包絡(luò)的局部均值為0.
EMD篩選過程如下:
1)對輸入信號x(t),求取極大值和極小值點;
2)對極大值點和極小值點采用3次樣條函數(shù)插值構(gòu)造信號上下包絡(luò)xu(t)和xl(t),計算上、下包絡(luò)的均值函數(shù)m1(t)=[xu(t)+xl(t)]/2;
3)考察h1=x(t)-m1是否滿足IMF條件,如滿足則轉(zhuǎn)到下一步,否則對h1循環(huán)進行前兩步操作,直到第k步結(jié)果h1k滿足IMF條件,則求得第一個IMF c1=h1k;
4)得到第一個殘留r1=x(t)-c1,對r1作如同上述3步操作,得到c2以及r2=x(t)-c2,以此類推;
5)直到rn為單調(diào)信號或者只存在一個極點為止。
經(jīng)過經(jīng)驗?zāi)B(tài)分解后,原始信號可以表達為
1.3.2 EMD數(shù)據(jù)的希爾伯特變換和譜特征提取
對IMF作希爾伯特變換,對于IMF信號ci(t)有
構(gòu)造解析信號
于是得到幅值函數(shù)
和相位函數(shù)
進一步可以求出瞬時頻率
獲得瞬時頻率ωi(t)和瞬時幅值ai(t)后,即可以此為基礎(chǔ)構(gòu)建特征向量。文獻[7]已有的研究結(jié)果表明瞬時頻率的加權(quán)平均值ωMIF具有較好的分類效果,其計算方法如下:
ωMIF描述了信號固有模態(tài)間的頻率分布。在信號分析中,除了頻率分布外,其能量分布也具有重要的分類價值,其瞬時能量的計算通過下式獲得
各類信號EMD分解后得到的IMF個數(shù)為14~17個,取各信號的前12階IMF,即在(11)式、(12)式中取i=1,…,12構(gòu)建特征向量F:
1.4 基于SVM的分類算法
設(shè)樣本為多維向量,n個樣本及其所屬類別表示為(xi,yi),yi∈{+1,-1},i=1,…,n.超平面方程為ωx+b=0,使得對該線性可分的樣本集滿足:
對判別函數(shù)進行歸一化,兩類中所有的樣本都滿足:
此時分類間隔等于2/‖ω‖,使間隔最大等價于使‖ω‖最小或‖ω‖2最小。滿足條件(15)式且使‖ω‖2/2最小的分類面就叫作最優(yōu)分類面。
這樣求最優(yōu)分類面的問題就可表示為:在(15)式的約束下,求φ(ω)‖ω‖2/2的極小值(最小化泛函).為此定義Lagrange函數(shù)為
這里的目標是將(16)式對ω和b求Lagrange函數(shù)的極小值。將問題轉(zhuǎn)化為其對偶問題,即在約束條件
下對αi求解下列目標函數(shù)的最大值:設(shè)滿足上述函數(shù)最大值的解為,解中將只有一部分αi不為0,其對應(yīng)的樣本就是支持向量。求解出上述系數(shù)后,就可以得到最優(yōu)分類函數(shù):
2.1 降噪效果的實驗驗證
海洋環(huán)境噪聲是多種聲源的綜合效應(yīng),其中包含潮汐、波浪的海水靜壓力效應(yīng),隨機水流形成的湍流,航運等持續(xù)的噪聲源,以及海洋生物叫聲、降雨等間歇性噪聲源。其功率譜密度隨頻率變化的關(guān)系非常復(fù)雜。但水聲系統(tǒng)都工作在一個十分有限的低頻段內(nèi),在該頻段,環(huán)境噪聲譜級近似為常數(shù)[8]。因此,相關(guān)研究中通常將其近似為白噪聲。
對于水聲信號s(t),假設(shè)加入的白噪聲為n(t),則其信噪比(SNR)計算方法如下:
圖5所示為一實測的目標信號的原始信號以及人工加噪后的信號。原始信號為船槳劃水時的聲音,采樣頻率為8 kHz.加噪信號由原始信號和白噪聲疊加而成,信噪比為5 dB.
圖5 原始信號、加噪信號與降噪信號Fig.5 Original signal,noised signal and denoised signal
混合信號首先通過Gammatone濾波器組分解為24個子帶信號,在各子帶信號上進行小波閾值降噪。采用db8小波作為小波基函數(shù),小波分解的層數(shù)為3層。閾值的選取采用無偏風險估計閾值[9],降噪的結(jié)果如圖5所示。
從圖5可以看出,降噪處理有效地濾除了信號中的噪聲,其處理后的結(jié)果與原始信號具有較高的一致性。分別利用信號失真比(SDR)、相關(guān)系數(shù)和語音信號處理中常用的聽覺感知評價參數(shù)(PESQ)作為評價指標[10-11],對降噪效果進行定量分析。其中,SDR的計算方法如下:
以直接采用小波閾值降噪的方法作為對比,對圖5中的信號進行處理。小波降噪的設(shè)置與文中所用設(shè)置一致。兩種降噪方法的結(jié)果見表1.
表1 不同降噪方法的結(jié)果對比Tab.1 Denoised results of different methods
由表1可以看出,與傳統(tǒng)的小波降噪方法相比,結(jié)合Gammatone濾波器后新方法的SDR有明顯的提升;處理后的結(jié)果與原信號具有更高的相關(guān)性;PESQ結(jié)果也有所改善。這些結(jié)果充分說明,本文的降噪方法具有良好的性能。
2.2 水下目標識別實驗
實驗數(shù)據(jù)為實測的水下目標輻射噪聲信號,采樣頻率為8 kHz,分為A,B,C,D四類。每類信號中含有60個持續(xù)時間為1 s的樣本。各類數(shù)據(jù)的時域波形如圖6所示。
圖6 4類信號的時域波形圖Fig.6 Waveforms of four types of signals
通過加入高斯白噪聲的方式來模擬不同的SNR條件,首先進行降噪,提取HHT后的特征,利用SVM作為分類器,對4類目標進行分類實驗。采用留一法(LOOCV)對多次分類結(jié)果進行交叉驗證。最終的識別結(jié)果見表2.
表2 在不同條件下提出方法的識別結(jié)果Tab.2 Recognition results of proposed method under different conditions
由表2可以看出,隨著測試信噪比從20 dB下降到5 dB,A類和D類信號均得到了正確的識別。B類信號的識別率從100%下降到了80.00%,C類信號的識別率從90.00%下降到了75.00%.系統(tǒng)的平均識別率從97.50%下降到了96.25%.在不同的信噪比條件下,系統(tǒng)的平均識別率保持在95.00%的較高水平,且隨信噪比的降低,系統(tǒng)的平均識別率下降不顯著。這說明本文提出的方法對噪聲具有較強的魯棒性。
為了進一步了檢驗本文特征提取方法的性能,選用小波包能量譜特征[12],替代本文中的特征,進行識別實驗。小波包能量譜特征的提取流程如下:首先,采用db5小波對信號進行3層小波包分解。然后計算分解后各子帶信號的能量,并用總能量對其進行歸一化處理。處理后的結(jié)果即為小波包能量譜特征。對應(yīng)的識別結(jié)果見表3.
表3 小波包能量譜在不同條件下的識別結(jié)果Tab.3 Recognition results of wavelet packet energy spectrum under different conditions
從表3可以看出,隨著信噪比的降低,系統(tǒng)的平均識別率從89.58%下降到了87.50%.得益于文中降噪方法的引入,系統(tǒng)的平均識別率對信噪比的變化并不敏感。這再次確認了本文降噪方法的效果。另外,小波包能量譜特征的平均識別率整體低于本文特征的識別率,使用本文的特征提取方法,各種信噪比條件下的識別率平均提高了8.02%.這說明本文提出的特征具有更好的識別性能。
結(jié)合Gammatone濾波器和HHT,本文提出了一種新的水下目標識別算法。其中,Gammatone濾波器用來將信號劃分為一系列與人耳聽覺相對應(yīng)的子帶信號。在此基礎(chǔ)上,引入了小波閾值降噪,對信號進行降噪處理,以消除噪聲的干擾。采用SDR、相關(guān)系數(shù)和PESQ為依據(jù),對降噪處理的效果進行了對比分析,結(jié)果表明,本文提出的降噪方法具有更好的效果。
該算法在HHT的基礎(chǔ)上進行時頻特征提取,并以SVM為分類器,利用4類實測水下目標噪聲信號,在不同的信噪比條件下進行了識別實驗,并與其他特征提取方法進行了對比。結(jié)果表明,本文提出的方法具有較好的噪聲魯棒性,且識別性能更好。
(
)
[1] 陸振波,章新華,胡洪波.水中目標輻射噪聲的聽覺特征提?。跩].系統(tǒng)工程與電子技術(shù),2005,26(12):1801-1803. LU Zhen-bo,ZHANG Xin-hua,HU Hong-bo.Auditory feature extraction of noise radiated from an underwater target[J].Systems Engineering and Electronics,2005,26(12):1801-1803.(in Chinese)
[2] 王娜,陳克安.分段譜質(zhì)心特征在水下目標識別中的應(yīng)用[J].兵工學(xué)報,2009,30(2):144-149. WANG Na,CHEN Ke-an.Application of sub-band spectral centroid features to recognizing underwater targets[J].Acta Armamentarii,2009,30(2):144-149.(in Chinese)
[3] Huang N E,Shen S S.Hilbert-Huang transform and its applications[M].Singapore:World Scientific Publishing Company,2005.
[4] 謝磊,李秀坤.HHT在水雷目標特征提取中的應(yīng)用[J].聲學(xué)技術(shù),2009,28(4):480-484. XIE Lei,LI Xiu-kun.The application of HHT to feature extraction of mine[J].Technical Acoustics,2009,28(4):480-484.(in Chinese)
[5] Lopez-Poveda E A,Meddis R.A human nonlinear cochlear filterbank[J].The Journal of the Acoustical Society of America,2001,110(6):3107-3118.
[6] Jansen M.Noise reduction by wavelet thresholding[M].New York:Springer,2001.
[7] Wang S G,Zeng X Y.Robust underwater noise targets classification using auditory inspired time-frequency analysis[J].Applied Acoustics,2014,78(4):68-76.
[8] 馮西安.水下目標高分辨方位估計技術(shù)研究[D].西安:西北工業(yè)大學(xué),2004. FENG Xi-an.Study on the high resolution DOA estimation techniques of underwater targetrs[D].Xi'an:Northwestern Polytechnical University,2004.(in Chinese)
[9] Zhang L,Bao P,Pan Q.Threshold analysis in wavelet-based denoising[J].Electronics Letters,2001,37(24):1485-1486.
[10] Rix A W,Hollier M P,Hekstra A P,et al.Perceptual evaluation of speech quality(PESQ)—the new ITU standard for end-toend speech quality assessment:partⅠ—time-delay compensation[J].Journal of the Audio Engineering Society,2002,50(10):755-764.
[11] Beerends J G,Hekstra A P,Rix A W,et al.Perceptual evaluation of speech quality(PESQ),the new ITU standard for end-toend speech quality assessment.PartⅡ—psychoacoustic model[J].Journal of the Audio Engineering Society,2002,50(10): 765-778.
[12] 劉健,劉忠,熊鷹.基于小波包能量譜和SVM的水下目標識別[J].武漢理工大學(xué)學(xué)報:交通科學(xué)與工程版,2012,36(2):361-365. LIU Jian,LIU Zhong,XIONG Ying.Underwater target recognition based on wavelet packet energy and SVM[J].Journal of Wuhan University of Technology:Transportation Science&Engineering,2012,36(2):361-365.(in Chinese)
Gammatone Subband Denoising and HHT-based Feature Extraction for Underwater Targets
WANG Shu-guang1,ZENG Xiang-yang1,WANG Zheng2,WANG Qiang1
(1.School of Marine Science and Technology,Northwestern Polytechnical University,Xi'an 710072,Shaanxi,China;2.China State Shipbuilding Corporation,Beijing 100048,China)
Underwater target recognition,as a key technique,places a great role in underwater acoustic detection.The inevitable noises decrease the performance of the system in the complex underwater acoustic environments.An underwater target recognition algorithm which includes Gammatone filter bank,wavelet threshold denoising and Hilbert-Huang transform(HHT)is proposed based on auditory perception mechanism.Gammatone filter bank is used for the simulation of auditory perception,and the wavelet threshold denoising is applied to enhance the noise robustness of the system.Hilbert-Huang transform is employed as the time frequency analysis tool and used for feature extraction.At last,the efficiency of the proposed algorithm is testified by using the measured underwater target data in the recognition experiment.The results show that the proposed method has a robust performance and good accuracy under the condition of low SNR.
acoustics;underwater target recognition;auditory perception;Gammatone filter bank;Hilbert-Huang transform
TN912.34
A
1000-1093(2015)09-1704-06
10.3969/j.issn.1000-1093.2015.09.015
2015-01-23
陜西省自然科學(xué)基金項目(2012JM1010)
王曙光(1986—),男,博士研究生。E-mail:wangshuguang@mail.nwpu.edu.cn;曾向陽(1974—),男,教授,博士生導(dǎo)師。E-mail:zenggxy@nwpu.edu.cn