鄭 洋 唐加能 柳培忠 劉曉芳
?
數(shù)字助聽器研究現(xiàn)狀及其算法綜述*
鄭 洋 唐加能 柳培忠 劉曉芳
華僑大學(xué)工學(xué)院
隨著中國老齡化社會的到來,效果良好的聽力設(shè)備得到重視,一些相關(guān)算法和技術(shù)先后被提出和改進(jìn),有效解決了現(xiàn)代數(shù)字助聽器中的響度補償、去噪和回聲消除等問題。該文闡述了助聽器的發(fā)展歷程、數(shù)字助聽器的工作原理,以及響度補償、語音降噪技術(shù)、回聲消除技術(shù)和聲源定位技術(shù)等核心技術(shù)的研究現(xiàn)狀,并對未來相關(guān)技術(shù)的發(fā)展進(jìn)行了展望。
數(shù)字助聽器 響度補償 語音降噪 回聲消除 聲源定位
隨著中國老齡化社會的到來,助聽器的使用和發(fā)展受到越來越多人的關(guān)注。助聽器實質(zhì)上是一種幫助聽力障礙患者補償聽力缺失的小型擴(kuò)音裝置,在解決聽力損失人群的耳聽力補償方面發(fā)揮著不可替代的優(yōu)勢作用。在我國,聽力損失與常見性耳病已經(jīng)成為大多老年人安度晚年生活的障礙,而這些聽力障礙的人群里只有很少一部分人佩戴了助聽器。
半導(dǎo)體等微電子技術(shù)不斷發(fā)展,現(xiàn)代數(shù)字助聽器相比模擬助聽器有著明顯的優(yōu)勢,實現(xiàn)了數(shù)字化、小型化。在去噪和回聲消除等方面,隨著相關(guān)算法的不斷改進(jìn),在可調(diào)性方面也有很大的進(jìn)步。數(shù)字助聽器通過對信號的數(shù)字化處理,逐漸智能化,和模擬助聽器單純進(jìn)行聲音信號放大有很大區(qū)別。數(shù)字助聽器可以通過頻率的改變處理過濾噪聲,再通過相關(guān)算法處理,智能化選擇需要的語音信號,并加強(qiáng)和辨別減少其他噪聲的污染,達(dá)到滿足低度或中度聽力損失人群的需要。為此,佩戴合適的助聽器是解決聽力障礙的重要途徑,相關(guān)的助聽器工作也需要進(jìn)行進(jìn)一步研究,以更好地滿足社會需要。
傳統(tǒng)的模擬助聽器中,聲頻信號被麥克風(fēng)收集并轉(zhuǎn)化為電信號。麥克風(fēng)輸出的振幅和頻響,通過一系列的模擬濾波器后,信號被送至接收器。模擬助聽器的信號持續(xù)不斷通過信號處理的路徑,加大了噪聲的污染。在數(shù)字可編程助聽器中,麥克風(fēng)的輸出經(jīng)過采樣和量化,通過A/D轉(zhuǎn)換器將其轉(zhuǎn)換為離散信號。所有的信號處理過程都通過數(shù)字濾波器和相應(yīng)的算法處理。完成數(shù)字信號處理后,數(shù)字信號通過D/A轉(zhuǎn)換器或者解調(diào)器轉(zhuǎn)換回模擬信號。
數(shù)字助聽器最核心的部分由一塊集成的 DSP 處理芯片組成,具有功能強(qiáng)、運算快、功耗低、體積小等優(yōu)點。DSP芯片利用數(shù)字信號處理算法對數(shù)字信號進(jìn)行變換、增強(qiáng)、壓縮、濾波等處理,得到需要的信號。數(shù)字助聽器具有強(qiáng)大的數(shù)據(jù)處理能力和高運行速度,可以進(jìn)行復(fù)雜的非線性信號處理,并且可以存儲多個算法程序,當(dāng)用戶需要響度補償時,根據(jù)其環(huán)境特征設(shè)計不同響度補償方案。當(dāng)助聽器使用者在一個安靜的環(huán)境中,去噪算法就可以關(guān)閉,這樣既能夠降低能耗,又可以避免去噪算法給語音信號帶來的失真。一般來說,數(shù)字助聽器數(shù)字信號處理模塊主要包括有響度補償、降噪技術(shù)、回聲消除和聲源定位等,下文將根據(jù)這些內(nèi)容逐步介紹算法研究現(xiàn)狀。
圖1 數(shù)字助聽器主要工作原理
為了提高語音理解度和聆聽舒適度,目前數(shù)字助聽器使用最多且比較核心的技術(shù)分別為響度補償技術(shù)、語音降噪技術(shù)、回聲反饋消除技術(shù)和聲源定位算法[1]。
3.1 響度補償算法
在助聽器的算法中,響度補償是一種主要的算法,其作用是補償聽力損失患者的語音信息,提高聽力損失人群對語音的識別率。響度補償算法需要根據(jù)患者不同的聽閾、痛閾情況,調(diào)整它的動態(tài)范圍,使之匹配。另外,有些算法會針對不同患者的頻率缺失情況,對不同頻率信號進(jìn)行相關(guān)補償。
在現(xiàn)代數(shù)字助聽器中,大多數(shù)已經(jīng)實現(xiàn)了多通道的響度補償?shù)墓δ躘2],這些響度補償方案很多集中在等寬頻率間隔濾波器組。由于人耳對語音信號頻率的高低感覺與實際聽到的語音信號頻率的高低可以近似為對數(shù)關(guān)系,所以在進(jìn)行響度補償方案時,利用等寬頻率間隔濾波器組的設(shè)計要求并不能滿足聽力損失人群對聽力的補償要求。因此文獻(xiàn)[3]提出了一種非等寬多通道響度補償方法,該算法在對語音信號分析時,采用了一種過采樣完美重構(gòu)濾波器組,并使語音信號達(dá)到了響度補償和重建的效果,彌補了相關(guān)算法對人耳特性的考慮不周。也有學(xué)者提出一種基于共振峰提取的多通道響度補償算法[4],他們通過對濾波器組重新設(shè)計,并加入一個共振峰模塊,對共振峰起到保護(hù)作用,使響度補償取得更佳的效果。
為了減輕響度補償時產(chǎn)生的負(fù)面影響,提高高頻嚴(yán)重?fù)p失的聽損患者的聽辨率,文獻(xiàn)[5]將壓縮移頻技術(shù)用于多通道響度補償,有效提高了聽損患者的聽力水平,同時有效提高了患者的話語辨識率。針對傳統(tǒng)多通道補償算法忽略保護(hù)語音特征,容易造成語音結(jié)構(gòu)變形和識別率低等問題,文獻(xiàn)[6]提出了一種基于多分辨率小波的單通道語音增強(qiáng)算法。該算法利用多分辨率小波對信號進(jìn)行分解和重構(gòu),然后在語音信號中提取出頻譜結(jié)構(gòu),通過提取出的特征點初期信息計算補償增益,此時的響度補償是利用插值算法計算整個頻譜的增益,與多通道響度補償技術(shù)相比,可以有效保證語音特征,并提高語音辨別率。
3.2 數(shù)字助聽器語音降噪技術(shù)
在噪聲環(huán)境下,聽力損失的人的語音理解度非常有限,如何提高語音理解度并提高語音的純凈性,需要相關(guān)的降噪技術(shù)。現(xiàn)代數(shù)字助聽器產(chǎn)品都帶有相對獨立的去噪功能,提高了聆聽的舒適度和語音的可理解度。傳統(tǒng)上,為了提高助聽器抗噪聲的性能,大多利用單通道的降噪處理技術(shù),近年來,基于多通道的維納濾波降噪技術(shù)逐漸被提出,并能更好地提高語音可理解度。
為了滿足高阻帶衰減和高頻分辨率的限制,文獻(xiàn)[7]提出了一個級聯(lián)雙級濾波器組的寬帶系統(tǒng),以提高頻率分辨率和降噪性能。Schasse 等人[8]提出一種改進(jìn)的單通道助聽器雙級濾波器組噪聲抑制技術(shù),解決了助聽器中低延遲和高阻帶衰減,以及因低頻率分辨率問題導(dǎo)致殘留的噪聲等問題,并分析了一個兩個階段的降噪系統(tǒng),減少了計算復(fù)雜度,進(jìn)一步提高助聽器的降噪性能。為了提高單通道語音增強(qiáng)降噪算法的整體質(zhì)量,有學(xué)者[9]提出了基于參數(shù)估計和感知提升的語音增強(qiáng)降噪算法,相比傳統(tǒng)算法,該算法通過引入?yún)?shù)估計改進(jìn)模塊和感知質(zhì)量提升模塊,在消噪效果和語音質(zhì)量兩方面均得到了較大的提高,適用于多類噪聲環(huán)境和信噪比條件。
近年來,學(xué)者們提出多種基于多通道維納濾波(Multi- channel Wiener Filtering,MWF)的降噪技術(shù),這些降噪技術(shù)均適用于雙耳助聽器設(shè)備,其中MWF有很好的噪聲抑制性能,對于語音特征的保留也有很好的效果。文獻(xiàn)[10]指出,SDW-MWF在單一噪聲源時有少量語音失真,但在多個噪聲源的情況下有較好的性能,文獻(xiàn)[11]、[12]針對真實的噪聲環(huán)境,分別提出了MWF-COR和MWF-IC,比以前的降噪技術(shù)都有良好的效果,提高了語音可懂性。
文獻(xiàn)[13]結(jié)合人耳聽覺特性和助聽器響度補償?shù)奶攸c,提出一種改進(jìn)的多通道維納濾波算法的助聽器語音降噪算法,該方法能更有效地抑制殘留噪聲,提高語音可懂度,具有較高的實用價值。文獻(xiàn)[14]針對助聽器降噪算法的特殊性,提出了一種實時多通道數(shù)字助聽器降噪算法??紤]到算法實時性和降噪性能的特點,該算法以子帶聲壓級計算代替?zhèn)鹘y(tǒng)的信號功率譜估計算法,有效降低了算法復(fù)雜度,也有效降低了噪聲。
3.3 數(shù)字助聽器回聲消除算法
在使用現(xiàn)代數(shù)字助聽器時,聲學(xué)回聲是使用者抱怨頻率最高的問題,這里的回聲即接收器的輸出通過耳道、氣孔以及助聽器耳模與耳道的間隙泄露出的聲音被麥克風(fēng)捕獲放大產(chǎn)生的聲音。助聽器中常見的回聲消除系統(tǒng)如圖2所示,圖2中,H*(Z)表示真實的回聲信道,這往往由助聽器和用戶的特性決定。H(Z)是自適應(yīng)估計的回聲信道,由助聽器采用的回聲估計算法確定。e(n)為麥克風(fēng)輸入信號d(n)減去后的殘差信號,并用e(n)來調(diào)整H(z)的參數(shù)。
圖2 助聽器回聲消除系統(tǒng)
回聲消除最常用的是LMS類算法,包括LMS、NLMS[15、16],其中LMS的更新方程為:
(2)
文獻(xiàn)[20]改進(jìn)了一種仿射投影算法,該算法通過能量誤差和步長因子之間存在的非線性函數(shù)關(guān)系使步長因子可以根據(jù)能量誤差的變化自動調(diào)整,也可以達(dá)到加快濾波器收斂速度、降低穩(wěn)態(tài)失調(diào)的目的。而文獻(xiàn)[21]則采用一種仿射組合的方案通過兩個帶有不同步長的濾波器操作,比單個濾波器和固定步長的仿射方案,在助聽器回聲消除方面獲得穩(wěn)定的性能。
在數(shù)字助聽器回聲抵消算法中,當(dāng)助聽器的增益與相位達(dá)到一定的條件時便會引發(fā)高強(qiáng)度的振蕩,即嘯叫,這會給助聽器佩戴者帶來明顯的不舒適感。文獻(xiàn)[22]針對當(dāng)自適應(yīng)濾波器算法中回聲路徑發(fā)生快速變化時,收斂速度仍然難以實現(xiàn)快速嘯叫抑制,提出一種變步長標(biāo)準(zhǔn)最小均方差-陷波器(Variable Step Normalized Least Mean Square- Notch Filter,VSN-NF)算法,既改善了回聲抵消性能,又有效減少嘯叫的產(chǎn)生。
3.4 數(shù)字助聽器聲源定位算法
在一個復(fù)雜的噪聲環(huán)境下,若存在多個噪聲源聲音信號交疊的情況,將導(dǎo)致助聽器語音信號信噪比下降,大大降低了佩戴助聽器的語音理解效果。目前,研究者們基于復(fù)雜的噪聲場景提出了多種聲源定位算法[23-25],并將其運用到助聽器定位系統(tǒng)中,可以有效定位聲源的3D位置。文獻(xiàn)[26]研究了一種基于壓縮感知的麥克風(fēng)陣列聲源定位算法,將聲源定位問題變?yōu)橄∈栊盘柕闹貥?gòu)問題,將不同位置的房間沖激響應(yīng)作為特征以構(gòu)建字典,提高了麥克風(fēng)陣列在高混響、低信噪比環(huán)境中的定位性能,但存在字典模型誤差,有待進(jìn)一步研究。為了改善混響和多干擾聲場景下的聲源定位能力,文獻(xiàn)[27]介紹了一種多通道聯(lián)合策略,改善了傳統(tǒng)算法魯棒性差的缺點,并結(jié)合人耳的哈斯效應(yīng),提出一種雙耳時間差提取策略以提高定位精度,該策略能根據(jù)環(huán)境信噪比自適應(yīng)調(diào)整。
小型化發(fā)展一直是數(shù)字助聽器的趨勢[28-30],而未來讓數(shù)字助聽器越來越小,甚至微型化,讓別人看不見是大多數(shù)聽力損失者的要求,隱形助聽器將是未來研究的方向。這就需要算法復(fù)雜度更低以獲得低功耗,由于是在體積更小的空間,對于算法的要求也要更高,研究者們希望得到?jīng)]有噪聲、回聲消除更明顯的算法,這樣可以大大提高助聽器的聆聽度和舒適度。
數(shù)字助聽器的防水技術(shù)也一直獲得人們的關(guān)注,讓聽力損失患者在一些特殊場景(如游泳),防止設(shè)備因進(jìn)水而停止工作,現(xiàn)在也已經(jīng)有多家公司在考慮防水技術(shù)。另外,以前助聽器只是單純地將信號放大,達(dá)到語音增強(qiáng)的效果,最后完成去噪和回聲消除。隨著聲源定位技術(shù)的發(fā)展,讓兩側(cè)耳的數(shù)據(jù)共享,達(dá)到同步效果,獲得聲源定位將是一個研究和發(fā)展的方向。
目前,大多數(shù)研究集中在一些算法的改進(jìn)方面,對于實際的應(yīng)用效果還需要根據(jù)不同場合進(jìn)行環(huán)境測試,發(fā)展智能化的助聽器將會大大提高數(shù)字助聽器設(shè)備的語音處理能力。智能化的助聽器將可以根據(jù)聽力損失患者在不同環(huán)境(餐廳、會議室、街道等)下自適應(yīng)調(diào)整參數(shù)。算法為不同環(huán)境參數(shù)設(shè)置數(shù)據(jù)庫,根據(jù)外部不同場合的環(huán)境噪聲,聽力損失患者可以自動調(diào)整,隨時改變聆聽效果。
近幾年,隨著數(shù)字信號處理技術(shù)的發(fā)展,數(shù)字助聽器的發(fā)展也得到了明顯的提升和改善?,F(xiàn)在評價一個數(shù)字助聽器的好壞,主要取決于其核心算法技術(shù)的改進(jìn),所以研究數(shù)字信號處理技術(shù)對于數(shù)字助聽器具有重要的理論意義和實用價值。本文從響度補償技術(shù)、降噪技術(shù)、聲學(xué)回聲消除技術(shù)和聲源定位技術(shù)等方面介紹了目前比較流行的一些技術(shù),隨著微電子技術(shù)的發(fā)展,對于語音的識別和去噪等要求,需要從患者的聽力損失情況和現(xiàn)實一些復(fù)雜的噪聲環(huán)境考慮,相信在技術(shù)的不斷發(fā)展下,數(shù)字助聽器在未來的應(yīng)用一定會更加廣泛,也能達(dá)到幫助更多聽力障礙患者改善聽力的目的。
[1] 趙力,張昕然,梁瑞宇, 等.數(shù)字助聽器若干關(guān)鍵算法研究現(xiàn)狀綜述[J].數(shù)據(jù)采集與處理,2015(2):252-265.
[2] Chong K S, Gwee B H,Chang J S. A 16-Channel Low-Power Nonuniform Spaced Filter Bank Core for Digital Hearing Aids[J]. Circuits & Systems II Express Briefs IEEE Transactions on, 2006, 53(9):853-857.
[3] 王青云,趙力,趙立業(yè), 等.一種數(shù)字助聽器多通道響度補償方法[J].電子與信息學(xué)報,2009,31(4):832-835.
[4] 趙毅,尹雪飛,陳克安.一種基于共振峰提取的多通道響度補償算法[J].信號處理,2012, 28(3):352-360.
[5] 張寶琳,張玲華.數(shù)字助聽器中多通道響度補償方法的研究[J].信號處理,2013,29(5):656-661.
[6] 曹旭來,張玲華,林志敏,等.數(shù)字助聽器中單通道語音增強(qiáng)算法的研究[J].信號處理,2014,30(4):405-412.
[7] Schasse A, Martin R, Soergel W, et al. Efficient Implementation of Single-Channel Noise Reduction for Hearing Aids Using a Cascaded Filter-Bank[C]// Speech Communication; 10.ITG Symposium; Proceedings of. 2012:1-4.
[8] Schasse A, Gerkmann T, Martin R, et al. Two-Stage Filter-Bank System for Improved Single-Channel Noise Reduction in Hearing Aids[J]. IEEE/ACM Transactions on Audio Speech & Language Processing, 2015, 23(2): 383-393.
[9] 王晶,尹棟,蔣涉權(quán),等.基于參數(shù)估計和感知提升的語音增強(qiáng)降噪算法[J].電子與信息學(xué)報,2016,38(1):174-179.
[10] Cornelis B, Moonen M, Wouters J. Performance Analysis of Multi-channel Wiener Filter-Based Noise Reduction in Hearing Aids Under Second Order Statistics Estimation Errors[J].IEEE Transactions on Audio Speech & Language Processing, 2011, 19(5):1368-1381.
[11] Marquardt D, Hohmann V, Doclo S. Coherence preservation in multi-channel Wiener filtering based noise reduction forbinaural hearing aids[J]. IEEE/ACM Transactions on Audio Speech & Language Processing, 2013, 23(12):8648-8652.
[12] Marquardt D,Hohmann V,Doclo S. Interaural Coherence Preservation in Multi-Channel Wiener Filtering-Based Noise Reduction for Binaural Hearing Aids[J]. IEEE Transactions on Audio Speech & Language Processing, 2015, 23(12):2162-2176.
[13] 奚吉,梁瑞宇,王國偉, 等.多通道助聽器語音降噪算法研究[J]. 計算機(jī)工程與應(yīng)用,2014,50(11):237-240.
[14] 梁瑞宇,趙力,王青云, 等. 實時多通道數(shù)字助聽器降噪算法[J].東南大學(xué)學(xué)報(自然科學(xué)版),2016,46(1):13-17.
[15] 高鷹,謝勝利.一種變步長LMS自適應(yīng)濾波算法及分析[J].電子學(xué)報,2001,29(8):1094-1097.
[16] 谷源濤,唐昆,崔慧娟, 等.新的變步長歸一化最小均方算法[J].清華大學(xué)學(xué)報(自然科學(xué)版),2002,42(1).
[17] 張云翼,崔杰,肖靈.一種新的應(yīng)用于助聽器指向性傳聲器的自適應(yīng)算法[J].聲學(xué)技術(shù),2011,30(3):270-274.
[18] 吳兆勝,黑勇,袁甲, 等.應(yīng)用于助聽器的帶限NLMS反饋抑制算法及硬件實現(xiàn)[J].微電子學(xué)與計算機(jī),2011,28(3):157-160.
[19] 王俠,梁瑞宇,王青云, 等.應(yīng)用于助聽器反饋抑制系統(tǒng)的變步長歸一化子帶自適應(yīng)濾波算法[J].東南大學(xué)學(xué)報(自然科學(xué)版),2015(3):417-422.
[20] 秦海娟,張玲華.基于改進(jìn)仿射投影算法的數(shù)字助聽器自適應(yīng)回聲消除[J].數(shù)據(jù)采集與處理,2015(2):382-389.
[21] Schepker H, Tran L T T, Nordholm S, et al. Improving adaptive feedback cancellation in hearing aids using an affine combination of filters[C]// IEEE International Conference on Acoustics, Speech and Signal Processing, 2016.
[22] 梁瑞宇,王俠,王青云,等.嘯叫快速抑制的助聽器回聲抵消算法[J].聲學(xué)學(xué)報,2016,41(2):249-259.
[23] 王青云,趙力,鄒采榮.基于次梯度投影的數(shù)字助聽器自適應(yīng)聲源定位方法[J]. 東南大學(xué)學(xué)報(自然科學(xué)版),2009,39(4):667-672.
[24] 趙立業(yè),李宏生.噪聲與共振環(huán)境下的數(shù)字助聽器魯棒聲源定位法[J].Transactions of Nanjing University of Aeronautics & Astronautics, 2010, 27(2):176-182.
[25] 梁瑞宇,趙力,奚吉,等.基于聽覺仿生和壓縮感知的助聽器聲源定位方法[J].儀器儀表學(xué)報,2011,32(6):1390-1395.
[26] 趙小燕,周琳,吳鎮(zhèn)揚.基于壓縮感知的麥克風(fēng)陣列聲源定位算法[J].東南大學(xué)學(xué)報(自然科學(xué)版),2015,45(2):203-207.
[27] 梁瑞宇,周健,王青云,等.仿人耳聽覺的助聽器雙耳聲源定位算法[J].聲學(xué)學(xué)報, 2015,40(3):446-454.
[28] 崔杰.數(shù)字助聽器關(guān)鍵技術(shù)的研究與實現(xiàn)[D].北京:中國科學(xué)院聲學(xué)研究所,2009.
[29] 馬小玲,劉訓(xùn),張思幸,等.國內(nèi)助聽器的現(xiàn)狀調(diào)研與發(fā)展分析[J].中央民族大學(xué)學(xué)報(自然科學(xué)版),2014,23(1):39-43.
[30] 蔣濤.助聽器技術(shù)發(fā)展的3.0及未來[J].中國聽力語言康復(fù)科學(xué)雜志, 2015(6):401-404.
泉州市科技項目(2014Z103),福建省教育廳項目(JA15035),華僑大學(xué)研究生科研創(chuàng)新能力培育計劃資助項目。