沐 城,張玲華
(南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003)
數(shù)字助聽器中多通道響度補(bǔ)償算法的研究
沐 城,張玲華
(南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003)
目前數(shù)字助聽器中用的較多的響度補(bǔ)償方法,通常是對(duì)語(yǔ)音的高頻部分進(jìn)行高增益,但由于聽損患者在高頻段的聽覺范圍比較小,直接對(duì)高頻部分進(jìn)行高增益容易超出聽損患者的聽覺范圍。文中引進(jìn)了寬動(dòng)態(tài)壓縮技術(shù),首先將整個(gè)語(yǔ)音的動(dòng)態(tài)范圍按一定比例均勻壓縮到患者的殘余聽力中,然后將頻帶非等寬劃分,再在不同頻段進(jìn)行響度補(bǔ)償和增益控制,最后對(duì)信號(hào)進(jìn)行重構(gòu),并利用小波閾值去噪技術(shù)去除部分噪聲。實(shí)驗(yàn)結(jié)果表明,該方法能夠使補(bǔ)償后語(yǔ)音的響度完全映射到聽損患者的聽覺范圍內(nèi),從而有效提高患者的聽力水平,特別對(duì)高頻部分語(yǔ)音的辨識(shí),具有較好的效果。
響度補(bǔ)償;寬動(dòng)態(tài)壓縮;正交鏡像濾波器組;增益控制
在聽力損失的情況下,聽閾普遍下移,從而造成聽覺動(dòng)態(tài)范圍減小、分辨語(yǔ)言的能力下降等問題。響度補(bǔ)償是數(shù)字助聽器的關(guān)鍵算法之一,也是其核心任務(wù)之一。為了對(duì)聲音進(jìn)行壓縮放大,將正常聽力范圍內(nèi)的聲音映射到聽損患者的聽力范圍內(nèi)[1],就需要用到響度補(bǔ)償。目前,大多數(shù)數(shù)字助聽器都已實(shí)現(xiàn)多通道響度補(bǔ)償功能[2],但多數(shù)響度補(bǔ)償方法主要用于處理等寬頻率間隔。其實(shí)人耳對(duì)聲音頻率的感受與實(shí)際的頻率高低不是線性關(guān)系,而是接近對(duì)數(shù)關(guān)系,所以等寬頻率間隔的補(bǔ)償方法不能滿足人耳的聽覺特性。雖然不同患者的聽力損失是不一樣的,但基本上具有低頻聽力損失較小、高頻聽力損失較大的特點(diǎn)。有研究表明,大腦通過(guò)相對(duì)比率[3-4]來(lái)感受頻率,而不是絕對(duì)頻率。由于語(yǔ)素的頻譜間存在一定位置關(guān)系[5],通過(guò)按比例壓縮可以保持這種關(guān)系。
考慮到上述情況,文中將寬動(dòng)態(tài)壓縮技術(shù)[6]應(yīng)用于響度補(bǔ)償。首先將整個(gè)語(yǔ)音信號(hào)的動(dòng)態(tài)范圍按一定比例均勻壓縮到患者的殘余聽力中,再讓信號(hào)順次通過(guò)寬動(dòng)態(tài)壓縮模塊、響度補(bǔ)償模塊以及增益控制模塊,經(jīng)過(guò)這一系列處理后,語(yǔ)音信號(hào)處于聽損患者聽閾范圍內(nèi),再利用小波閾值去噪技術(shù)去除部分噪聲。實(shí)驗(yàn)結(jié)果表明,該方法具有較好的效果。
1.1 多頻段語(yǔ)音信號(hào)響度補(bǔ)償原理
一般來(lái)說(shuō),人耳能感覺到頻率在16~20 000 Hz間的聲音。在這個(gè)范圍內(nèi),可引起人的聽覺的最小聲音強(qiáng)度被稱為聽閾。如果振動(dòng)強(qiáng)度繼續(xù)增加,當(dāng)達(dá)到一定限度時(shí),將會(huì)引起鼓膜疼痛,這個(gè)限度稱為痛閾。對(duì)于不同頻率,人耳的感覺是不同的,對(duì)正常聽力者和聽損患者進(jìn)行聲強(qiáng)測(cè)試,可以分別得到正常人和聽損患者的聽力檢查曲線圖。聽損患者的聽力測(cè)試曲線與正常人相比是不同的,他們對(duì)聲強(qiáng)的敏感度更低,所以他們的聽閾要比一般人高,而痛閾卻比一般人低,因此聽力范圍比普通人小。一般通過(guò)多次測(cè)試特殊頻點(diǎn)的閾值,求各頻點(diǎn)閾值的平均值作為聽損程度,連接各閾值所得曲線圖作為聽損患者的聽力檢查圖。圖1是一個(gè)聽損患者的聽力檢查曲線圖。
圖1 聽損患者的聽力檢查曲線
從圖1中可以看到,聽損患者在不同頻率損傷情況是不一樣的,一般來(lái)說(shuō),在低頻區(qū)域損傷較小,聽閾值也較小,在高頻區(qū)域的聽力損失更為嚴(yán)重,使得在高頻區(qū)域閾值較大,導(dǎo)致高頻區(qū)域聽力范圍較小。就算是同一患者,在不同頻段上也會(huì)有不同程度的聽力損傷,因此使用單通道響度補(bǔ)償方式是不合適的。
對(duì)聽損患者進(jìn)行響度補(bǔ)償,不僅要考慮不同頻率信號(hào)的聽力敏感,還要考慮患者可以承受的信號(hào)強(qiáng)度。因此,在對(duì)聲音進(jìn)行響度補(bǔ)償?shù)耐瑫r(shí),還要根據(jù)聲音的強(qiáng)度進(jìn)行控制,以確保小信號(hào)能被病人聽清楚,同時(shí)保護(hù)病人的耳朵在強(qiáng)信號(hào)下不受傷害[7]。
圖2是增益控制曲線。其中,UCLn和UCLu分別為正常人和患者的痛閾值,THRn和THRu分別為正常人與患者的聽閾值,MCLn和MCLu分別為正常人和患者的最適閾值。這些參數(shù)的值并不是固定的,不同患者在不同頻率上的值都是不同的,因此需要根據(jù)各患者的具體情況來(lái)測(cè)定聽力測(cè)試曲線(見圖1)。根據(jù)圖2的增益控制曲線對(duì)響度補(bǔ)償后的語(yǔ)音進(jìn)行增益調(diào)節(jié),正常聽力范圍內(nèi)的聲音被映射到聽障者的聽力范圍上。
圖2 增益控制曲線
1.2 寬動(dòng)態(tài)壓縮方法
所謂寬動(dòng)態(tài)壓縮,意思是將整個(gè)聲音按照一定的比例進(jìn)行均勻壓縮,最終壓縮到患者的殘余聽力中。由于聲音具有特殊性質(zhì),語(yǔ)素之間存在一定關(guān)系,語(yǔ)素之間的聯(lián)系可以通過(guò)按比例壓縮來(lái)保持。將語(yǔ)音按比例壓縮到患者較好的聽力范圍內(nèi),可以使患者更好地聽到聲音的高頻部分,有助于改善患者的語(yǔ)音識(shí)別率[8]。
首先根據(jù)患者的聽力情況,選擇要進(jìn)行壓縮的頻段和目標(biāo)頻段,然后計(jì)算出高頻部分的壓縮比[9]。設(shè)壓縮比為γ,則:
(1)
其中:ftmax和ftmin分別為目標(biāo)頻段的最高頻率和最低頻率;fomax和fomin分別為原頻段的最高頻率和最低頻率。
壓縮后信號(hào)頻譜表達(dá)式為:
(2)
圖3為從實(shí)驗(yàn)語(yǔ)音中截取的一幀語(yǔ)音,采用了寬動(dòng)態(tài)壓縮方法,選擇壓縮比γ=2,獲得壓縮前后的頻譜比較圖。其中,壓縮前原始語(yǔ)音的頻段為0~8 000Hz,壓縮后的目標(biāo)頻段取0~4 000Hz。實(shí)線表示原始語(yǔ)音的頻譜,虛線表示壓縮后語(yǔ)音的頻譜。
1.3 基于QMFB的多通道子帶濾波器組設(shè)計(jì)
從圖1可以看出,不同頻段上的聽損程度是不同的,因此需要將語(yǔ)音劃分為多個(gè)頻段,不同頻段使用不同的補(bǔ)償因子。還可以看出,聽損患者在4 000~8 000 Hz頻段上的聽力范圍較小,而在0~4 000 Hz頻段上的聽力范圍較大。因此先將信號(hào)整體壓縮到0~4 000 Hz頻段上,這樣使得4 000~8 000 Hz頻段上的信號(hào)對(duì)應(yīng)到2 000~4 000 Hz頻段上,這時(shí)的信號(hào)處于患者的殘余聽力中,最后再使用正交鏡像濾波器組(QMFB)對(duì)信號(hào)進(jìn)行非等帶寬劃分[10-12]。
圖3 原頻譜及壓縮后頻譜
信號(hào)經(jīng)過(guò)QMFB的分析,濾波器組被分成若干子帶信號(hào),各子帶信號(hào)經(jīng)過(guò)處理后,再經(jīng)過(guò)合成濾波器組輸出合成信號(hào)。假設(shè)分析濾波器組的低通濾波器為H0(ω),高通濾波器為H1(ω);合成濾波器組的低通濾波器為G0(ω),高通濾波器為G1(ω)[13]。若H0(ω)=H(ω),由于H0(ω)和H1(ω)關(guān)于ω=π/2對(duì)稱,兩者頻響關(guān)系滿足:
H1(ω)=H(ω-π)
(3)
(4)
合成濾波器組跟分析濾波器組的差別只是因子不同,兩者結(jié)構(gòu)基本相同。因此合成濾波器組的低通濾波器G0(ω)=2H(ω),高通濾波器G1(ω)=-2H(ω-π)。
對(duì)于濾波器而言,一般來(lái)說(shuō),階數(shù)提高了,可以使過(guò)渡帶變窄,阻帶波動(dòng)變小,當(dāng)然濾波效果更接近理想情況,缺點(diǎn)是成本較高。經(jīng)過(guò)綜合考慮,文中選取階數(shù)N=99,歸一化截止頻率fp=0.45π的濾波器。由于QMFB是線性相位的,可以消除混疊失真,能夠完美重構(gòu)信號(hào)[14]。
1.4 系統(tǒng)結(jié)構(gòu)框圖
首先對(duì)原始語(yǔ)音進(jìn)行響度衰減,模擬患者聽到的語(yǔ)音,然后對(duì)該語(yǔ)音進(jìn)行寬動(dòng)態(tài)壓縮,將語(yǔ)音按一定比例均勻地壓縮到目標(biāo)頻段,再使用分析濾波器組對(duì)語(yǔ)音進(jìn)行非等帶寬劃分,并對(duì)各子帶信號(hào)進(jìn)行響度補(bǔ)償和增益調(diào)節(jié),最后使用合成濾波器組將子帶信號(hào)合成為最終補(bǔ)償后的語(yǔ)音。
系統(tǒng)框圖如圖4所示。
圖4 系統(tǒng)框圖
具體步驟如下:
第1步:根據(jù)圖1聽力檢查曲線圖模擬患者聽到的聲音。聽力曲線圖是分段曲線,先計(jì)算各分段點(diǎn)的聲壓級(jí),相鄰分段頻率點(diǎn)之間是線性關(guān)系,可以計(jì)算各頻段聲壓級(jí)的衰減曲線,然后在各頻段內(nèi)依據(jù)得到的衰減曲線進(jìn)行幅度衰減,從而得到患者聽到的聲音。聲壓級(jí)計(jì)算公式為:
(5)
其中:x是采樣信號(hào);N是信號(hào)長(zhǎng)度;P0是基準(zhǔn)聲壓級(jí),一般取20μPa。
第2步:對(duì)語(yǔ)音進(jìn)行分幀。幀長(zhǎng)取20ms,幀移為10ms,加窗為漢明窗。
第3步:對(duì)分幀后的語(yǔ)音進(jìn)行壓縮。從圖1聽力檢查圖可以看到,患者在4 000~8 000Hz上的聽覺范圍較小,而在0~4 000Hz上的聽覺范圍較大,可以取壓縮比γ=2。根據(jù)式(1)將語(yǔ)音進(jìn)行壓縮,壓縮到目標(biāo)頻段0~4 000Hz,這樣原始語(yǔ)音在4 000~8 000Hz的頻段就映射到了2 000~4 000Hz頻段上。要根據(jù)不同患者的具體情況來(lái)選取原頻段與目標(biāo)頻段。
第4步:對(duì)語(yǔ)音進(jìn)行分頻處理。使用四通道QMFB分析濾波器組將壓縮后的語(yǔ)音幀分頻,語(yǔ)音被分成0~500Hz,500~1 000Hz,1 000~2 000Hz以及2 000~4 000Hz這四個(gè)頻段。
第5步:對(duì)子帶信號(hào)進(jìn)行響度補(bǔ)償和增益控制。子帶補(bǔ)償?shù)姆椒ǜ谝徊降倪^(guò)程相反。語(yǔ)音經(jīng)過(guò)補(bǔ)償后,再對(duì)其強(qiáng)度進(jìn)行增益調(diào)節(jié)。先根據(jù)式(5)計(jì)算輸入信號(hào)的聲壓級(jí),再確定各子帶的增益調(diào)節(jié)因子,也就是a與b兩段直線的斜率,如圖2所示。假設(shè)a,b兩段直線的斜率分別為CRa=和CRb,則:
(6)
(7)
由圖2可知,當(dāng)THRn≤SPLin (8) 當(dāng)MCLn≤SPLin (9) 第6步:將子帶信號(hào)進(jìn)行合成。先用QMFB的合成濾波器組將子帶信號(hào)合成為一幀完整的信號(hào),再將各幀信號(hào)疊加得到響度補(bǔ)償后的語(yǔ)音,并利用小波閾值去噪技術(shù)去除部分噪聲。 錄制一段語(yǔ)音作為實(shí)驗(yàn)使用語(yǔ)音。先對(duì)語(yǔ)音進(jìn)行分幀,幀長(zhǎng)取20ms,幀移取10ms。再根據(jù)圖1的聽力曲線對(duì)語(yǔ)音進(jìn)行衰減,獲得患者聽到的聲音。然后根據(jù)圖4的系統(tǒng)框圖,將衰減語(yǔ)音依次通過(guò)寬動(dòng)態(tài)壓縮模塊、QMFB分析濾波器組、補(bǔ)償控制模塊以及QMFB合成濾波器組,最終獲得符合聽損患者聽覺特性的語(yǔ)音,并利用小波閾值去噪方法去除部分噪聲。 圖5為其中一幀語(yǔ)音經(jīng)過(guò)衰減以及響度補(bǔ)償后的波形圖。 從圖5可以看出,衰減后的語(yǔ)音在大多數(shù)頻段內(nèi)的響度值都遠(yuǎn)低于聽損患者的聽閾值。信號(hào)處于低頻段時(shí)衰減相對(duì)較小,處于中高頻段時(shí)的衰減較大。經(jīng)過(guò)響度補(bǔ)償后,原先衰減的語(yǔ)音大部分都處于患者的聽覺范圍,雖然有少部分處于聽閾以下,但是經(jīng)過(guò)增益控制后,所有頻段的語(yǔ)音都被調(diào)節(jié)到患者的聽覺范圍內(nèi),有效實(shí)現(xiàn)響度補(bǔ)償。 如圖6所示,這是原始語(yǔ)音、經(jīng)過(guò)衰減后語(yǔ)音、經(jīng)過(guò)增益控制后語(yǔ)音的時(shí)域波形圖。 從圖6可以看出,衰減后的語(yǔ)音幅度非常小,并且波形發(fā)生變化,甚至無(wú)法分辨出原始語(yǔ)音。而由增益控制后語(yǔ)音波形圖可以看出,經(jīng)過(guò)響度補(bǔ)償和增益控制后的語(yǔ)音與原始語(yǔ)音的波形基本相同,不僅如此,語(yǔ)音的幅度也有了明顯的增強(qiáng),從而實(shí)現(xiàn)了對(duì)語(yǔ)音進(jìn)行響度補(bǔ)償?shù)哪康摹?/p> 圖6 原語(yǔ)音、衰減語(yǔ)音、增益后語(yǔ)音時(shí)域波形圖 上述實(shí)驗(yàn)表明,使用寬動(dòng)態(tài)壓縮,可將患者聽覺范圍較小的高頻區(qū)域信號(hào)移動(dòng)到患者聽覺范圍較大的低頻區(qū)域,同時(shí)對(duì)該低頻區(qū)域的語(yǔ)音進(jìn)行響度補(bǔ)償,這樣可使患者獲得較好的聽覺效果。補(bǔ)償后,語(yǔ)音信號(hào)基本上與原來(lái)的信號(hào)相同,而且聲音的強(qiáng)度明顯增強(qiáng)。再經(jīng)過(guò)增益調(diào)整,將處于患者聽閾以下的信號(hào)調(diào)整到患者聽閾以上,同時(shí)將幅度過(guò)大的信號(hào)進(jìn)行適當(dāng)削弱,這樣既可以使聲音映射到聽損患者的聽力范圍內(nèi),又能防止聲音過(guò)大對(duì)患者造成二次傷害。實(shí)驗(yàn)結(jié)果表明,該方法能有效實(shí)現(xiàn)響度補(bǔ)償,改善聽覺效果,有效提高患者的聽力水平。 [1] 趙 力,張昕然,梁瑞宇,等.數(shù)字助聽器若干關(guān)鍵算法研究現(xiàn)狀綜述[J].數(shù)據(jù)采集與處理,2015,30(2):252-265. [2]ChongKS,GweeBH,ChangJS.A16-channellow-powernonuniformspacedfilterbankcorefordigitalhearingaids[J].IEEETransactionsonCircuitsandSystemsII:ExpressBriefs,2006,53(9):853-857. [3]Miller-HansenDR,NelsonPB,WidenJE,etal.Evaluatingthebenefitofspeechrecodinghearingaidsinchildren[J].AmericanJournalofAudiology,2003,12(2):106-113. [4]StelmachowiczPG,PittmanAL,HooverBM,etal.Theimportanceofhigh-frequencyaudibilityinthespeechandlanguagedevelopmentofchildrenwithhearingloss[J].ArchOtolaryngolHeadNeckSurg,2004,130:556-562. [5]GoldbaumSM,HalpinC.Exploringthedamagedear:theNIDCDnationaltemporalboneregistry[J].ASHA,1999,41(1):29-33. [6] 陳廣飛,應(yīng) 俊.數(shù)字助聽器寬動(dòng)態(tài)壓縮算法研究[J].北京生物醫(yī)學(xué)工程,2006,25(5):454-456. [7] 雍雅琴.數(shù)字助聽器中主要語(yǔ)音信號(hào)處理方法研究[D].北京:北京協(xié)和醫(yī)學(xué)院,2013. [8] 王青云,趙 力,趙立業(yè),等.一種數(shù)字助聽器多通道響度補(bǔ)償方法[J].電子與信息學(xué)報(bào),2009,31(4):832-835. [9] 張寶琳,張玲華.數(shù)字助聽器中多通道響度補(bǔ)償方法的研究[J].信號(hào)處理,2013,29(5):656-661. [10]RothweilerJH.Polyphasequadraturefilters-anewsubbandcodingtechnique[C]//ProcofIEEEICASSP.[s.l.]:IEEE,1983. [11] 張 晨,李雙田.設(shè)計(jì)QMF組的一種新算法及基于GA的優(yōu)化[J].信號(hào)處理,2005,21(2):120-125. [12] 孟 君.基于DSP的數(shù)字助聽器多通道響度補(bǔ)償方案[J].南京信息工程大學(xué)學(xué)報(bào):自然科學(xué)版,2010,2(5):420-425. [13] 李 麗.非均勻?yàn)V波器組的研究[D].西安:西安電子科技大學(xué),2009. [14]HuangJ,GuGX.AdirectapproachtothedesignofQMFbanksviafrequencydomainoptimization[J].IEEETransactiononSignalProcessing,1998,46(8):2131-2138. Research on Multi-channel Loudness Compensation in Digital Hearing Aids MU Cheng,ZHANG Ling-hua (College of Telecommunications & Information Engineering,Nanjing University of Posts and Telecommunications,Nanjing 210003,China) Loudness compensation algorithm is a key technique in digital hearing aid.At present,digital hearing aid in multi-channel loudness compensation method,is usually high gain for the high frequency part of speech.However,because of the relatively small range of hearing loss in the high frequency range,the high gain of the high frequency part is easy to exceed the range of hearing loss.Wide dynamic compression technique is introduced in this paper.First the dynamic range of the speech according to a certain proportion is uniformly compressed to patients with residual hearing,then the band is partitioned with non equal width,and loudness compensation and gain control is carried out in different frequency band.Finally,the signal is reconstructed,removing partial noise by wavelet threshold denoising technology.Experiment shows that the method makes the loudness of speech after compensation completely mapped to range of hearing loss in patients,effectively improving the patient’s hearing level,especially on speech identification of high frequency part with good effect. loudness compensation;wide dynamic compression;quadrature mirror filter bank;gain control 2015-08-26 2015-11-27 時(shí)間:2016-05-05 江蘇省高校自然科學(xué)研究重大項(xiàng)目(13KJA510003);江蘇高校優(yōu)勢(shì)學(xué)科建設(shè)工程資助項(xiàng)目(PAPD) 沐 城(1990-),男,碩士研究生,研究方向?yàn)楝F(xiàn)代語(yǔ)音處理與通信技術(shù);張玲華,教授,博士,博士生導(dǎo)師,研究方向?yàn)閭鞲衅骱驼Z(yǔ)音。 http://www.cnki.net/kcms/detail/61.1450.TP.20160505.0831.102.html TP301.6 A 1673-629X(2016)06-0123-04 10.3969/j.issn.1673-629X.2016.06.0272 實(shí)驗(yàn)與仿真
3 結(jié)束語(yǔ)