張戌寶
近年來,心理聽力學(xué)研究指出[1],無論是聽力正常者還是聽力受損者,在噪聲環(huán)境中理解語音時(shí)都會(huì)引起瞳孔擴(kuò)大,嚴(yán)重時(shí)會(huì)造成他們放棄聽音的愿望。近二十多年來,數(shù)字助聽器的單麥克風(fēng)降噪技術(shù)和雙麥克風(fēng)波束形成技術(shù)使其輸出噪聲控制在可接受的范圍,給聽力損失患者帶來了預(yù)期的益處[2,3]。由于助聽器輸入信號(hào)的特殊性,即無論在頻域還是空域,目標(biāo)信號(hào)和干擾噪聲常常是混迭在一起的,加之體積很小,使得在軍事通訊中行之有效的降噪技術(shù)難于直接用于助聽器中,給研發(fā)人員提出了挑戰(zhàn)。在空域信號(hào)處理中,峰力(Phonak)助聽器廠家提出的窄帶波束形成技術(shù)對(duì)助聽器雙側(cè)方向麥克風(fēng)(directional microphone, DM)的輸出信號(hào)進(jìn)行加權(quán)求和處理[4],使每側(cè)DM的波束形成主瓣窄至約90°,能更多地降低與目標(biāo)語音相鄰的空間干擾,提高輸出信噪比。Majia等[5]提出了用于助聽器的超級(jí)波束形成方案,測(cè)試表明,它形成的適當(dāng)寬度的主瓣能保留目標(biāo)信號(hào)的有用空間信息,同時(shí)最大限度地衰減了相鄰的干擾噪聲。在多種環(huán)境條件下,該波束器的降噪性能都優(yōu)于常規(guī)DM和全向麥克風(fēng)(microphone, Mic),不過該波束器在助聽器上實(shí)現(xiàn)的可行性還有待研究。
在助聽器產(chǎn)品的研發(fā)方面,降噪技術(shù)也有新的進(jìn)展。其一是低聲級(jí)波束形成器(soft-level beamformer),也稱之為前延時(shí)方向麥克風(fēng)(front-delay DM)。西門子(Seimens)助聽器廠家研發(fā)了這種低聲級(jí)波束器[6],在輕、低噪聲環(huán)境中它的語音識(shí)別性能優(yōu)于常規(guī)DM;當(dāng)環(huán)境噪聲低于某聲級(jí)時(shí),如50 dB SPL,這類助聽器就轉(zhuǎn)換到該低聲級(jí)DM模式上以獲得更佳的聽音效果。不過,沒有公開的文獻(xiàn)描述過這種低聲級(jí)DM的設(shè)計(jì)原理。其實(shí)它是常規(guī)DM的延時(shí)器和減法器改變構(gòu)成后的一種變型,語音增強(qiáng)和降噪性能都優(yōu)于全向麥克風(fēng)。其二是開闊聲音領(lǐng)航器(open sound navigator, OSN),由奧迪康(Oticon)助聽器廠家研發(fā)推出[7]。該技術(shù)使用全向Mic作主波束器,讓多目標(biāo)信號(hào)和干擾噪聲都經(jīng)它輸出,再用該輸出減噪聲估計(jì)器的輸出而相消掉大部分噪聲;接著再用時(shí)段譜相減法在各頻道清除剩余噪聲。該OSN助聽器能有效地抑制競(jìng)爭(zhēng)聲級(jí)的干擾噪聲,同時(shí)保護(hù)0°、90°等多方位的目標(biāo)語音,讓聆聽者感覺是處于開闊的環(huán)境中。該技術(shù)起源于近年來出現(xiàn)的最小方差無失真響應(yīng)波束器[8,9],即MVDR(minimum variance distortionless response)波束器。它將常規(guī)波束形成器與頻域處理相結(jié)合,能實(shí)現(xiàn)干擾噪聲輸出最小又無目標(biāo)信號(hào)失真的期望,適用于具有寬譜特性的陣列接收信號(hào)。本文將介紹這些前延時(shí)DM和MVDR波束器在助聽器中應(yīng)用的設(shè)計(jì)理念,給出模擬試驗(yàn)得到的一些數(shù)據(jù)、圖表和產(chǎn)品試用的評(píng)估;通過與全向Mic和常規(guī)DM的對(duì)比,闡述這兩種新的波束形成器在噪聲抑制、語音增強(qiáng)和頻譜保真等方面的優(yōu)越性和某些局限性。
1.1前延時(shí)方向麥克風(fēng)的設(shè)計(jì)理念 常規(guī)DM是由兩個(gè)全向Mic、一個(gè)延時(shí)器和一個(gè)減法器構(gòu)成,該DM極性圖的180°上有零凹口(指某個(gè)方向上的增益下降至零)且與輸入信號(hào)的頻率無關(guān),因而能有效抑制后方來的干擾噪聲;不過該DM的頻響曲線有6 dB/倍頻程的向上斜率,從而造成頻譜失真和語音增強(qiáng)性能不足[10]。頻響均衡的 (balanced) DM具有較為平坦的頻響而使頻譜失真得以明顯減少[11]。當(dāng)今,實(shí)際的方向性助聽器中都采用了頻響均衡的DM。許多文獻(xiàn)仍然將該均衡DM歸類于常規(guī)DM,本文亦然。測(cè)試表明[11],在低、輕噪聲(聲級(jí)<50 dB SPL)環(huán)境中,常規(guī)DM的性能并不優(yōu)于全向Mic,因?yàn)檫@兩種Mic模式的輸出信噪比 (SNR) 差不多,且常規(guī)DM多少有些頻譜失真。因此,大多數(shù)實(shí)用方向性助聽器都使用常規(guī)DM和全向Mic兩種模式進(jìn)行互補(bǔ)。
在常規(guī)DM的結(jié)構(gòu)上,將后Mic電路上的延時(shí)器移至前Mic的輸出電路中,再將其減法器改成加法器,就得到前Mic延時(shí)的波束形成器,簡(jiǎn)稱前延時(shí)DM,如圖1所示。圖中,實(shí)線箭頭代表0°(前方)聲音入射,虛線箭頭代表非0°的入射。這里兩個(gè)全向Mic的靈敏度都指定為1,且忽略A/D變換器。在純音的輸入下,假設(shè)前Mic的輸出是yF(t)=sin(2πft),f是頻率,t是時(shí)間,則后Mic的輸出是yR(t)=sin{2πf[t-δ(θ)]},δ(θ)是后Mic輸出的延遲時(shí)間,取決于兩麥克風(fēng)的間距dp和入射角θ,即δ(θ)=Δcos(θ),Δ是間距延遲時(shí)間。圖1中,延時(shí)器參數(shù)τ稱為內(nèi)部延時(shí),加法器的輸出即前延時(shí)DM的輸出:
yFDM(t)=sin[2πf(t-τ)]+sin {2πf[t-δ(θ)]}
(1)
對(duì)于助聽器的DM,需要關(guān)心的是它的波束極性圖和頻響曲線,可以通過推導(dǎo)它的靈敏度(S)-增益計(jì)算公式繪出[10]。通常,選τ=Δ,將得到心臟型波束,且前延時(shí)DM的S-增益計(jì)算公式:
GFDM(θ,f)=2cos{πfΔ[cos(θ)-1]}
(2)
它是與純音頻率和入射角有關(guān)的函數(shù)。圖2顯示了前延時(shí)DM的極性圖,三條波束曲線分別來源于5.36、2和0.5 kHz的純音。該極性圖的條件是采樣頻率44.1 kHz,雙麥克風(fēng)間距是16 mm??梢钥闯?,這三條曲線在0°入射角上有相同的增益6 dB,且與頻率無關(guān);在180°上增益減少,與頻率有關(guān):5.36 kHz的曲線形成深的零點(diǎn),即沒有增益,而500 Hz的曲線幾乎沒有凹口(當(dāng)增益減小時(shí)曲線形成的下陷),即增益幾乎沒下降。因此前延時(shí)DM不具有強(qiáng)的后方噪聲抑制能力,但它沒有目標(biāo)語音的頻譜失真。
此外,還需要檢查常規(guī)DM和全向Mic的語音增強(qiáng)性能以便與前延時(shí)DM作對(duì)比。圖3顯示三種麥克風(fēng)的頻率響應(yīng)曲線,分別是全向Mic、常規(guī)DM和前延時(shí)DM,可觀察到:①全向Mic的頻響是0 dB的水平直線(虛線);②常規(guī)DM的頻響是帶齒狀的水平線(細(xì)線),在6 dB上下起伏;③前延時(shí)DM的頻響是6 dB的水平直線(粗線)。注意:常規(guī)DM的齒狀曲線是理論計(jì)算的結(jié)果,它起伏的大小與多頻道數(shù)目有關(guān),與硬件實(shí)現(xiàn)的字長(zhǎng)有關(guān)。實(shí)測(cè)的助聽器DM頻響遠(yuǎn)比圖中的平滑。因此,全向Mic的語音增強(qiáng)是0 dB,前延時(shí)DM的是6 dB,常規(guī)DM的語音增強(qiáng)均值有數(shù)dB。對(duì)圖2和圖3的曲線分析可知,前延時(shí)DM的語音增強(qiáng)比常規(guī)DM和全向Mic都高,這是采用兩個(gè)麥克風(fēng)的結(jié)果;在噪聲抑制方面,前延時(shí)DM比全向Mic稍好,但比常規(guī)DM的差。
圖2 前延時(shí)DM在三個(gè)頻率下的極性圖
圖3 兩種DM和全向Mic在入射角0°時(shí)的頻響
1.2三種麥克風(fēng)在實(shí)際環(huán)境下的性能模擬 圖2、3的計(jì)算結(jié)果不能確定這三種Mic在真實(shí)聲音條件下的性能,但是借助實(shí)際環(huán)境的模擬試驗(yàn)可以幫助弄清這個(gè)問題。目前,大樣本的真實(shí)語音和噪聲錄音容易從網(wǎng)上文獻(xiàn)的波文件中獲取,其時(shí)間序列有數(shù)秒或更長(zhǎng)的持續(xù)時(shí)間。為了提高置信度,本文截取了一段英語讀音作為測(cè)試語音,由11個(gè)字音組成:“Hi, one of the available high quality texts to speech voices”,是一女性的發(fā)音[12]。該段語音持續(xù)3.8 s,含167 579個(gè)樣本,采樣頻率44.1 kHz,字長(zhǎng)16 bits。本試驗(yàn)中,用此60 dB SPL語音作為標(biāo)準(zhǔn)以校準(zhǔn)其它需用聲音的聲級(jí)。該語音定位在0°(前方)。常見的噪聲環(huán)境有聚會(huì)、交通、餐館、電扇等;本文獲取了交通噪聲的波文件[13]和來源于電扇的設(shè)備噪聲[11],有白噪聲特性。通過統(tǒng)計(jì)序列的均方根(root of mean sguare,RMS)來調(diào)整幅度,確保了這些序列具有50 dB SPL。選擇45°、90°、135°和180°入射角以代表實(shí)際環(huán)境的周邊噪聲。由于頭部的陰影作用,忽略了被阻擋的入射噪聲。波文件讀出、時(shí)間序列存儲(chǔ)、噪聲聲級(jí)校準(zhǔn)的詳情和DM性能的SimuLink試驗(yàn)方法見文獻(xiàn)[11]。表1列出了常規(guī)DM、前延時(shí)DM和全向Mic在低噪聲場(chǎng)中的輸出和SNR值,可得:①在交通噪聲中,常規(guī)DM輸出的RMS是0.012 3,前時(shí)延DM的是0.025 5,全向Mic的是0.013;當(dāng)加入語音后,常規(guī)DM的SNR是13.3 dB,前延時(shí)DM的是11.4 dB,全向Mic的是11.2 dB。②在設(shè)備噪聲中,常規(guī)DM輸出的RMS值是0.011 6,前延時(shí)DM的是0.014 2,全向Mic的是0.008 6;當(dāng)加入語音后,常規(guī)DM的SNR是13.8 dB,前延時(shí)DM的是16.5 dB,全向Mic的是14.8 dB。這些模擬試驗(yàn)的數(shù)據(jù)說明,在周邊低噪聲的環(huán)境中,這三種麥克風(fēng)都能獲得足夠高的SNR來理解測(cè)試語音。在所有測(cè)試條件下,前延時(shí)DM的SNR都優(yōu)于全向Mic,但是常規(guī)DM的SNR不一定都優(yōu)于全向Mic。綜合圖3和表1的數(shù)據(jù),前延時(shí)DM的語音保真性與全向Mic相同,而前延時(shí)DM的SNR總是優(yōu)于全向Mic,因此它完全可以取代全向Mic。
表1 低噪聲場(chǎng)(50 dB SPL)中常規(guī)DM、前延時(shí)DM和全向Mic的輸出和SNR
西門子助聽器廠家研發(fā)了一種低聲級(jí)DM產(chǎn)品,應(yīng)用了前延時(shí)DM技術(shù)。Chalupper等[6]給出了有低聲級(jí)DM的助聽器的試用效果,測(cè)試在美國(guó)Iowa大學(xué)進(jìn)行,15例雙側(cè)感音神經(jīng)性聽力損失試聽者,下降型聽力曲線;所選助聽器品牌為Pure 700和Pure 701,前者有常規(guī)DM加全向Mic模式,后者有常規(guī)DM加低聲級(jí)DM模式,兩種模式按輸入聲級(jí)自動(dòng)轉(zhuǎn)換;助聽器處方增益設(shè)置用語音型粉噪聲(pink-noise)作輸入,聲強(qiáng)55、65和75 dB SPL,由測(cè)試設(shè)備Audioscan Verifit產(chǎn)生;背景噪聲來自180°方位,強(qiáng)度50 dB SPL;語音來自0°方位,問卷選用HINT(hearing in noise test)中的句子;使用言語接收閾值規(guī)則RTS (reception threshold for speech)來記錄SNR,以測(cè)試全向Mic得到的SNR為基線(0 dB),計(jì)算常規(guī)DM和低聲級(jí)DM的SNR獲益,結(jié)果常規(guī)DM的獲益為0.8 dB,而低聲級(jí)DM的獲益為6.2 dB。
3.1MVDR波束形成器用于助聽器的理念 當(dāng)陣列天線的輸出信號(hào)具有寬譜特性時(shí),適宜于窄譜信號(hào)的常規(guī)波束形成器的性能就不能滿足要求。近年來,MVDR波束形成器的出現(xiàn)[8,9],對(duì)空域干擾中多點(diǎn)源目標(biāo)信號(hào)的檢測(cè)較為有效。在助聽器的聽音環(huán)境中,目標(biāo)聲源有一個(gè)或多個(gè),通常位于助聽器的前方和側(cè)面;干擾噪聲可以是點(diǎn)源或周邊源,通常位于助聽器的后方和側(cè)面。它們往往都有寬頻譜,不同的聲源可以有不同的的強(qiáng)度。這種條件下,在助聽器中利用MVDR波束器降噪是恰當(dāng)?shù)摹榱艘腴_闊空間的聲音,主波束器就設(shè)計(jì)成簡(jiǎn)單的全向Mic,利用前Mic來實(shí)現(xiàn),可以包含360°內(nèi)的目標(biāo)語音和干擾噪聲;堵塞矩陣(block matrix)設(shè)計(jì)為噪聲估計(jì)器,用一個(gè)倒心臟型(reverse cardioid)波束器來實(shí)現(xiàn),也稱為倒方向麥克風(fēng)(reverse DM,RDM),其輸出僅包含環(huán)境噪聲的信號(hào)而堵塞目標(biāo)信號(hào)。主波束器輸出與噪聲估計(jì)器輸出相減就實(shí)現(xiàn)了MVDR相消,即完成了MVDR波束器的前端處理,提取語音信號(hào),如圖4所示。前端處理在多頻道中的各頻道獨(dú)立進(jìn)行,該圖僅是中心頻率為2.5 kHz的頻道處理框圖。圖中的主波束器輸入信號(hào)來自其下的前Mic輸出,噪聲估計(jì)器由中部和下面兩通道構(gòu)成;外部延時(shí)即前、后Mic的間距時(shí)差,內(nèi)部延時(shí)與圖1中的延時(shí)器相同;相位調(diào)節(jié)Zt和堵塞系數(shù)α是可控的,取決于語音檢測(cè)器的當(dāng)前判定,默認(rèn)值是t=2,α=0.5。該語音檢測(cè)器判定“不存在”時(shí),圖4中的堵塞系數(shù)α=0.5或更大。如噪聲估計(jì)器中仍然有語音信號(hào),適當(dāng)減少α也不會(huì)相消掉全向波束器中側(cè)面語音的輸出。該語音檢測(cè)器每數(shù) ms更新一次聲音估計(jì),通常利用調(diào)制檢測(cè)器實(shí)現(xiàn),效率高,詳情見文獻(xiàn)[2]。設(shè)計(jì)或驗(yàn)配助聽器時(shí),在各頻道獨(dú)立地設(shè)置Zt和α的范圍以滿足用戶個(gè)人喜好。語音檢測(cè)器估計(jì)前Mic輸出和噪聲估計(jì)器輸出的語音成分。MVDR波束器前端的輸出就是右側(cè)OSN減法器的輸出。
圖4的噪聲估計(jì)器原理結(jié)構(gòu)和圖1是一樣的,除用減法器替換圖中的加法器外,當(dāng)該噪聲估計(jì)器選擇的參數(shù)與圖1中的相同時(shí),可得到該估計(jì)器(RDM)的輸出:
yRDM(t)=sin[2πf(t-τ)]-sin {2πf[t-δ(θ)]}
(3)
圖4 一頻道中語音MVDR波束器前端的結(jié)構(gòu)
內(nèi)部延時(shí)參數(shù)Z2等價(jià)于τ=Δ,可以推導(dǎo)出倒心臟型波束器的S-增益:
GRDM(θ,f)=2sin{πfΔ[cos(θ)-1]}
(4)
當(dāng)選擇與圖2相同的繪圖條件時(shí),借助公式(4)可以得到該倒心臟型波束器的三條極性曲線,如圖5所示,它們分別來源于三個(gè)頻率的純音:5.36、2和0.5 kHz。顯然,圖5是常規(guī)心臟型極性圖的180°翻轉(zhuǎn)。分析曲線可知,該噪聲估計(jì)器能將后方180°來的干擾最靈敏地估出,還要靠調(diào)節(jié)各頻道中的Zt值來完成,而將側(cè)面其它角度(如90°)來的噪聲欠靈敏地估出;同時(shí)該估計(jì)器對(duì)前方0°來的語音有“堵塞”作用。因此它作為MVDR波束器的噪聲估計(jì)器是最恰當(dāng)?shù)摹VDR波束器的前端處理完成后,接著需要在多頻道的各頻道中清除剩余噪聲并將全部頻道的輸出求和以得到完整的語音輸出。這樣的設(shè)計(jì)具有以下特點(diǎn):①倒心臟型噪聲估計(jì)器不僅能將后方和側(cè)面的噪聲估出,而且能阻擋前方目標(biāo)語音的通過;②在主波束器通道中,它的輸出與噪聲估計(jì)器的輸出相減,各頻道的延時(shí)參數(shù)t是可控的,以完成最佳降噪;③在噪聲估計(jì)器的輸出端有堵塞系數(shù)α是可調(diào)的,以確保輸出的語音原本特性被保護(hù)和噪聲相消凹口盡可能地深;④當(dāng)僅語音存在時(shí),無論它在前方或側(cè)面,讓?duì)林迪陆抵?,不影響主波束器輸出多方位的干凈語音。
圖5 倒心臟型DM在三個(gè)頻率上的極性波束圖
圖6為純音0°入射時(shí)常規(guī)DM(細(xì)線)、MVDR波束器(粗線)和全向Mic(虛線)的頻響曲線。事實(shí)上,粗線與虛線是重疊的,圖中將二線拉開一點(diǎn),避免虛線消失??梢?,MVDR波束器和全向Mic的頻響曲線是相同的0 dB水平線,說明該設(shè)計(jì)確保了語音無失真的特性;常規(guī)DM的曲線均值高出全向Mic數(shù)dB,有較高的語音增強(qiáng),這是兩個(gè)麥克風(fēng)作用的結(jié)果,并不保證它的SNR也高。必須指出,當(dāng)入射語音來自90°或>90°時(shí),常規(guī)DM的語音增強(qiáng)性能會(huì)明顯下降,這是它的心臟型極性圖特性決定的;但MVDR 波束器可以保證語音增強(qiáng)基本不下降,這是全向Mic和倒心臟型DM相減的結(jié)果。
圖6 常規(guī)DM、MVDR波束器和全向Mic的頻響(入射角:0°)
表2為在交通噪聲中對(duì)全向Mic、常規(guī)DM和MVDR波束器測(cè)試的輸出和SNR。測(cè)試條件:11字語音,同1.2節(jié),一次測(cè)試沿0°入射,另一次沿90°入射;周邊交通噪聲強(qiáng)度60 dB SPL,兩次都沿45°、90°、135°和180°入射,并忽略被頭部阻擋的入射。試驗(yàn)中,Zt的調(diào)節(jié)范圍在2~8個(gè)采樣周期,α在0~1的范圍??傻茫孩賰H語音存在時(shí),全向Mic的語音增強(qiáng)為0.71 dB,大于0 dB是麥克風(fēng)輸出端低通濾波器的作用;常規(guī)DM的語音增強(qiáng)為2.33 dB(語音在0°)或-2.86 dB(90°),MVDR波束器的為0.71 dB(語音在0°,90°)。②在交通噪聲存在時(shí),全向Mic的輸出SNR為1.22 dB;常規(guī)DM的SNR為6.47 dB(語音在0°)或1.28 dB(90°);MVDR波束器的SNR為3.23 dB(語音在0°)或3.15 dB(90°)。表2數(shù)據(jù)說明,MVDR波束器的語音增強(qiáng)與語音的方位基本沒有關(guān)系,語音的保真度性能優(yōu)良。此時(shí),它的SNR仍然不高,因?yàn)閷?duì)非180°入射的噪聲相消不完全,輸出中還有不少剩余噪聲。
3.2剩余噪聲的清除 當(dāng)環(huán)境噪聲是周邊的且與目標(biāo)語音處于競(jìng)爭(zhēng)強(qiáng)度時(shí),MVDR波束器前端輸出信號(hào)的SNR不能令人滿意,如表2中的數(shù)據(jù),該波束器的降噪還須從頻域進(jìn)一步清除剩余噪聲[7]。通常,噪聲的幅度特性是雜亂無章的,波形樣本有相當(dāng)?shù)莫?dú)立性。語音的幅度特性看起來也無規(guī)則可循,事實(shí)上,它是由多種基波和諧波組成,因而波形樣本有一定的相關(guān)性。當(dāng)噪聲和語音混在一起時(shí),仔細(xì)對(duì)比,噪聲波形無時(shí)不在,而語音波形總是有一些時(shí)段不存在或有聽不見的極低波形。這一差別在經(jīng)多頻道分裂后,在單個(gè)頻道中的波形中更為明顯,特別是高頻道,因此在各頻道中設(shè)法作獨(dú)立的清噪處理總是有效。顯然,傳統(tǒng)的譜相減(spectrum subtract)調(diào)節(jié)單個(gè)頻道的增益無濟(jì)于事。利用語音波形和噪聲波形在時(shí)段上的差別,新近提出的譜相減僅對(duì)某些時(shí)段的增益進(jìn)行衰減,達(dá)到清除剩余噪聲的目的,稱為時(shí)段譜相減。為了使某一頻道的噪聲合理地衰減到足夠小,需要按照SNR的大小來控制該頻道各時(shí)段的增益。為了保護(hù)重要的語音成分和讓聽覺感到自然,不能將增益衰減至0,通常最多衰減10 dB,且增益衰減需分層進(jìn)行。經(jīng)前端波束器處理后,輸出聲音信號(hào)的SNR較高,故SNR估計(jì)結(jié)果是精準(zhǔn)的。SNR估值器通常利用諧波同步檢測(cè)的原理[2]。在心理聽力學(xué)中,當(dāng)聲音信號(hào)的SNR達(dá)10 dB以上時(shí),聽者就能輕松地理解語音;盡可能小的增益調(diào)節(jié)可保護(hù)目標(biāo)語音和干擾噪聲的自然性。
表2 競(jìng)爭(zhēng)噪聲場(chǎng)(60 dB)中常規(guī)DM、MVDR波束器和全向Mic的輸出和SNR
圖7的上圖顯示某一頻道的MVDR波束器前端輸出的波形,語音為藍(lán)色,噪聲為綠色,兩者的混迭區(qū)為灰藍(lán)色,下圖顯示經(jīng)時(shí)段譜相減處理后的輸出波形。圖中的語音波形是1.2節(jié)中使用的英語后面5個(gè)字音,約1.8 s,0°入射;輸入噪聲是交通噪聲,60 dB SPL,180°入射;圖中頻道中心為2.5 kHz,頻寬1 kHz。在不同的聽音環(huán)境,可驗(yàn)配用戶個(gè)人喜好的、不同的增益衰減規(guī)則助聽器。例如,降噪增益分三層完成:無語音存在時(shí),增益降9 dB;SNR低于-12 dB時(shí),降6 dB;SNR低于-7 dB時(shí),降3 dB。顯然,這樣的時(shí)段譜相減規(guī)則對(duì)語音波形沒有什么損壞。對(duì)不同的頻道,噪聲聲強(qiáng)差別可能較大,因此各頻道的增益衰減規(guī)則也會(huì)不同。從上下兩圖的對(duì)比可以看出,經(jīng)該降噪規(guī)則處理后,剩余噪聲清除了許多,特別是在無語音的時(shí)段,效果明顯。不過,在噪聲與較強(qiáng)語音共存的時(shí)段,噪聲仍然在一定程度上保留,這是為了保護(hù)語音而不得不付出的代價(jià)。經(jīng)監(jiān)聽測(cè)試,其輸出的噪聲明顯降低,能聽清每個(gè)字音,完全可以識(shí)別語音。試驗(yàn)和監(jiān)聽借助SimuLink和SoundBooth測(cè)試軟件完成[11]。
圖7 頻道2.5 kHz中時(shí)段譜相減法抑制剩余噪聲
丹麥奧迪康(Oticon)廠家率先將MVDR波束器應(yīng)用于它的助聽器品牌Opn中,取得了良好的效果[7]。該Opn使用的算法是OSN,意指開闊聲音領(lǐng)航而不是傳統(tǒng)的與單人孤立談話的理念。在OSN的多頻道中,每個(gè)頻道的分析塊(analyze)都利用主波束器和干擾噪聲估計(jì)器,估值每2 ms更新一次。由于助聽器沒有安置兩個(gè)以上麥克風(fēng)的空間,它的主波束器就利用全向Mic,噪聲估計(jì)器則利用雙Mic的倒心臟型波束器。它的平衡塊(balance)利用語音檢測(cè)器,也稱語音活動(dòng)檢測(cè)器(voice activity detector),傳送的信息去操作RDM減法器,以滿足相消多方位的干擾噪聲和平衡多方位的語音,無需用自適應(yīng)的波束器聚焦不同方位的語音。它的噪聲清除塊(noise removal)在各頻道用時(shí)段譜相減進(jìn)一步清除剩余噪聲,SNR估計(jì)用10 ms滑窗式的測(cè)試,增益衰減2 ms更新一次。它還有一個(gè)信息管理鏈,稱為YouMatic LX,存儲(chǔ)和傳遞來自分析器、平衡器和噪聲清除器給出的信息以及用戶個(gè)人喜好的助聽器驗(yàn)配參數(shù)。各頻道獨(dú)立處理后的輸出求和,可實(shí)現(xiàn)多目標(biāo)語音聆聽和輸出盡可能小的噪聲,使得聽音費(fèi)力(listening effort)最小。
Le Goff等[1]給出了OSN算法在助聽器中應(yīng)用的效果,包括感音費(fèi)力(cognitive effort)、記憶復(fù)述(memory recall)和語音識(shí)別 (speech recognition)項(xiàng)目。后者的測(cè)試是評(píng)估助聽器性能最普遍的方法。Le Goff[1]挑選了26例有助聽經(jīng)驗(yàn)的試聽者,平均年齡63.5歲,聽力損失在37~66 dB HL之間,樣品品牌是Opn和Alta2 Pro(無OSN算法),正確語音識(shí)別率采用50%和80%兩種,使用了Hangerman問卷的語句,每組10句共兩組問表。聽音場(chǎng)地選用無回音測(cè)試室,背景噪聲是語音型噪聲,6個(gè)揚(yáng)聲器放在圓周上,半徑為1米,方位分別是45°,90°,…315°,激勵(lì)語音放置在0°方位,輸出為65 dB SPL,試聽者位于圓心,測(cè)試數(shù)據(jù)的分析借助方差分析法(ANOVA)。測(cè)試結(jié)果見圖8,淺色塊是正確識(shí)別率50%的閾值,深色塊是正確識(shí)別率80%的閾值??梢?,無論是50%還是80%的識(shí)別率,Opn需要的SNR比Alta2 Pro需要的總是低約2 dB,即語音理解能力提高20%。
圖8 Opn與Alta2 Pro助聽器的語言識(shí)別性能
助聽器降噪技術(shù)的研發(fā)遇到不少挑戰(zhàn),即無論是頻域還是空域,目標(biāo)語音和干擾噪聲常常是混迭在一起的,非點(diǎn)源且頻譜寬?;谇把訒r(shí)波束器和寬帶MVDR波束器,新近出現(xiàn)的兩種方向麥克風(fēng)降噪技術(shù)達(dá)到了一個(gè)新的高度。①前延時(shí)DM具有較大的語音增強(qiáng),其高保真能力與全向Mic相當(dāng);降噪能力比全向Mic要強(qiáng)些,比常規(guī)DM要差,因此它適宜于低噪聲環(huán)境下使用。前延時(shí)DM的結(jié)構(gòu)簡(jiǎn)單,用雙Mic加上加法器和延時(shí)器即可實(shí)現(xiàn);它與常規(guī)DM結(jié)合只需更改信號(hào)處理算法和微程序,實(shí)現(xiàn)降噪性能更優(yōu)越、保真性良好的助聽器,可取代助聽器中的全向Mic。②語音 MVDR波束器技術(shù)是當(dāng)今空域和時(shí)域降噪技術(shù)的結(jié)合。它用全向Mic作主波束器,將多方位的目標(biāo)語音和干擾噪聲引入。倒心臟型波束器估計(jì)干擾噪聲,將其輸出與主波束器的輸出相減而抑制主波束引入的干擾噪聲。對(duì)于相減后輸出的剩余噪聲,在各頻道根據(jù)波形的短期SNR大小用時(shí)段譜相減法作進(jìn)一步清除:SNR越小,輸出字音間隙上的增益衰減越多,反之亦反。對(duì)競(jìng)爭(zhēng)強(qiáng)度的干擾所產(chǎn)生的剩余噪聲都有足夠的抑制,同時(shí)保護(hù)聲音的自然性。MVDR波束器還具有聆聽多方位目標(biāo)語音的能力,而不需要轉(zhuǎn)動(dòng)頭部去對(duì)準(zhǔn)某處發(fā)聲的目標(biāo)語音。③與常規(guī)DM相比,MVDR波束器對(duì)強(qiáng)干擾噪聲(大于語音10 dB)的抑制能力可能還顯弱勢(shì);其算法十分復(fù)雜,需要超高速的、甚寬動(dòng)態(tài)范圍字長(zhǎng)的芯片,如500 MIPS(million instructions per second)和24 bits。目前,奧迪康的Velox平臺(tái)芯片能滿足這樣的要求[14]。