夏 雪 羅夏云
(1.91388部隊(duì)41分隊(duì) 湛江 524000)(2.海軍工程大學(xué) 武漢 430000)
目標(biāo)識別是現(xiàn)代海戰(zhàn)中的重要環(huán)節(jié),主要通過聲納員聽聲辨識或者機(jī)器識別實(shí)現(xiàn)。由于水下環(huán)境的復(fù)雜性以及目標(biāo)聲學(xué)特征的多變性,實(shí)際上在現(xiàn)階段,水下目標(biāo)的識別主要依靠聲吶員聽音并結(jié)合譜圖進(jìn)行分析判斷[1]。
聲納員對目標(biāo)的聽音判斷主要是從心理聲學(xué)角度進(jìn)行的,主觀上,人可以感覺聲音的響度、音調(diào)和音色[2]。對于能夠定量描述的響度和音調(diào),已經(jīng)在水下目標(biāo)識別的研究中取得了一定的進(jìn)展,但這兩類特征不能完全反映人耳主觀感知不同聲音信號的差別程度,并且非常依賴于樣本的選取[3]。
音色目前主要用于評價(jià)語音和樂音的聲品質(zhì),它囊括了除音調(diào)和響度外的所有的聲音主觀屬性,無法用一維尺度定量表述[4]。目前已參數(shù)化的聽覺感知特征主要分為頻域特征和時域特征兩類[5],前者包括譜質(zhì)心、譜通量、譜下降值等;后者包括時域質(zhì)心,零交點(diǎn)比率、上升時間、下降時間等[6]。上述這些具有明確聽覺感知含義的信號特征已被應(yīng)用于樂器和語音識別中。1999年,Mcadams等發(fā)現(xiàn)利用譜結(jié)構(gòu)中的包絡(luò)特征可以區(qū)分樂器聲[7];2000年,Eronen等利用共44維的譜特征和時域特征實(shí)現(xiàn)對樂器的音色識別[8];隨后,Brown等在2001年利用多維倒譜特征識別木管樂器達(dá)到75%,利用一維譜質(zhì)心識別木管樂器達(dá)到50%[9];2003年,Giulio等利用譜質(zhì)心、譜質(zhì)心帶寬、不和諧性和諧波能量的偏斜度實(shí)現(xiàn)了對樂器的音色識別[10]。
對于音色屬性的建模,是模仿聽覺特征提取水面目標(biāo)輻射噪聲特征量的主要途徑。水面目標(biāo)輻射噪聲主要包括螺旋槳噪聲、機(jī)械噪聲和水動力噪聲,其中螺旋槳噪聲是主要噪聲[11]。本文從音色特征的物理含義出發(fā),提取水面目標(biāo)輻射噪聲音色特征[12],將提取的音色特征用于目標(biāo)識別上,結(jié)果表明,音色特征在水面目標(biāo)輻射噪聲的識別上有良好的效果。
音色特征量在這里指聽覺感知特征中的頻譜特征,主要包括譜質(zhì)心、譜質(zhì)心帶寬、譜不規(guī)律性和譜下降值,下面分別闡述其物理意義和計(jì)算方法。
1)譜質(zhì)心(spectrum centroid,SC)是描述音色屬性的重要信號特征之一,它是描述聲音信號的頻率分布和能量分布的信息,當(dāng)聲音集中在高頻時,聲音明亮清晰、有光澤,相反在低頻,聲音暗、悶、不美。譜質(zhì)心的物理含義是聲音能量集中的區(qū)域,在頻率分析范圍內(nèi),將譜能量函數(shù)看成是頻率的概率密度函數(shù),譜質(zhì)心便是頻率的一階矩。
計(jì)算公式為
E(n)為信號x(n)經(jīng)過DTFT變化后所對應(yīng)頻率的譜能量,f(n)為x(n)經(jīng)過DTFT變化后對應(yīng)的頻率,N為DFT長度,P(E(n))為每個頻率對應(yīng)的能量相對于總能量的概率值,SC為信號的譜質(zhì)心。
2)譜質(zhì)心帶寬(spectrum centroid bandwidth,SCB)指聲音能量集中的頻帶寬度,即在[S C,fmax]內(nèi)的譜質(zhì)心與在[0,SC]內(nèi)譜質(zhì)心之間的差值,主要反映了聲音能量集中的區(qū)域。
計(jì)算公式為
SChigh為[S C,fmax]內(nèi)的譜質(zhì)心,SClow為內(nèi)的譜質(zhì)心。
3)譜下降值(spectrum roll-off,SRO)反映頻譜的傾斜程度,在語音學(xué)領(lǐng)域,一般用來區(qū)分嗓音和非嗓音,也可以用來區(qū)分高頻的和敲擊的瞬時聲音。反映了聲音能量開始下降時所對應(yīng)的頻率點(diǎn)。SRO定義為功率譜累計(jì)的幅度在C以下的頻率值。C按經(jīng)驗(yàn)值取0.85或者0.6。
計(jì)算公式為
4)譜不規(guī)律性(spectrum irregularity,SI)反映了包絡(luò)譜的形狀,是一個復(fù)音在頻譜上相鄰分音的幅度差程度的函數(shù)。因此,大幅度差值產(chǎn)生凹口包絡(luò),而較小差值則產(chǎn)生較平滑包絡(luò)。
計(jì)算公式為
采用A,B,C三類實(shí)測水面目標(biāo)輻射噪聲數(shù)據(jù)進(jìn)行特征提取,均采用標(biāo)準(zhǔn)水聽器錄制,采樣率為44100Hz,三類水面目標(biāo)輻射噪聲信號各選用120個樣本,所選用的噪聲樣本都是在不同的工況以及海洋環(huán)境下錄制的,每個信號長度為5s,特征提取前對信號進(jìn)行降采樣處理,降采樣后的采樣率為8820Hz。
從聽音的角度來看,A類水面目標(biāo)輻射噪聲平穩(wěn),螺旋槳擊水“嘩嘩”聲清晰,并伴有“啪啪”聲,聽起來比較輕快、明亮,譜質(zhì)心的值較高;C類水面目標(biāo)輻射噪聲有較強(qiáng)的“咕嚕咕嚕”聲,輕微的螺旋槳劃水聲,聽起來比較沉悶,所以譜質(zhì)心的值較低;B類水面目標(biāo)輻射噪聲聽起來音色介于A,B之間,譜質(zhì)心的值也應(yīng)該介于兩者之間。從圖1(a)可以看出,A目標(biāo)信號的譜質(zhì)心值最高,C目標(biāo)的譜質(zhì)心值最低,B目標(biāo)的譜質(zhì)心值介于兩者之間,實(shí)驗(yàn)得到的結(jié)果與聽音判斷的結(jié)果吻合,理論結(jié)合實(shí)測數(shù)據(jù)說明譜質(zhì)心可作為分辨三類目標(biāo)的音色特征。譜質(zhì)心帶寬是高于譜質(zhì)心的頻帶內(nèi)的SC與低于譜質(zhì)心的頻帶內(nèi)SC的差值。圖1(b)中,三類目標(biāo)的譜質(zhì)心帶寬有少部分重疊在一起,C類目標(biāo)的譜質(zhì)心帶寬最高,B類目標(biāo)的譜質(zhì)心帶寬最低。
譜不規(guī)律性主要是用來描述包絡(luò)譜的形狀,通過研究發(fā)現(xiàn),信號能量越大諧波次數(shù)越多,則譜不規(guī)律性的值越小,表示信號中的噪聲特性越明顯,越不具有規(guī)律性。圖1(c)中看出,三類目標(biāo)的輻射噪聲計(jì)算得到的譜不規(guī)律性的值相互交疊在一起,B類目標(biāo)的SI比A和C類目標(biāo)的SI稍大,而A和C類目標(biāo)的SI基本上一樣,利用譜不規(guī)律性不能很好地區(qū)分三類目標(biāo)。
圖1 音色特征
譜下降值在語音學(xué)中主要被用于區(qū)分嗓音和非嗓音,用來描述頻譜的傾斜程度。運(yùn)用到水面目標(biāo)輻射噪聲中來主要是描述功率譜的幅度累積在C以下的頻率值,C一般取0.85或者0.6,在本文中取C=0.85。圖1(d)中A目標(biāo)的譜下降值與B、C目標(biāo)能夠區(qū)分開,而B、C目標(biāo)的譜下降值有部分疊加在一起,無法區(qū)分開。所以采用譜下降值在一定程度上能夠?qū)θ惸繕?biāo)進(jìn)行區(qū)分。
本文將音色特征應(yīng)用于水面目標(biāo)輻射噪聲的特征提取,描述了音色特征參量的物理含義和計(jì)算方法,對試驗(yàn)數(shù)據(jù)進(jìn)行分析得到如下結(jié)論:譜質(zhì)心、譜質(zhì)心帶寬、譜下降值能夠?qū)δ繕?biāo)進(jìn)行一定程度地區(qū)分,譜不規(guī)律性則不能很好地區(qū)分目標(biāo)。
本文通過實(shí)測數(shù)據(jù)證明了對水面目標(biāo)輻射噪聲進(jìn)行音色分析能夠?qū)ζ溥M(jìn)行有效區(qū)分,在此基礎(chǔ)上,音色特征與水面目標(biāo)輻射噪聲音質(zhì)屬性的關(guān)聯(lián)程度,所反映的人耳的主觀聽覺感受,有待于進(jìn)一步的深入研究,為目標(biāo)機(jī)器識別和人耳識別相結(jié)合奠定基礎(chǔ)。