黃翔東 高 月
(天津大學電氣自動化與信息工程學院 天津 300072)
陷波器能從有用信號的頻譜中去除某一干擾頻率成分,因而廣泛應用于各種數(shù)字信號處理系統(tǒng)中,如擴頻通信系統(tǒng)、肌電信號處理系統(tǒng)[1]、控制工程[2,3]、雷達、電子對抗、工業(yè)測量[4],其中還有一個重要應用領域就是回聲消除系統(tǒng),例如在助聽器中去除嘯叫[5,6]等。因為助聽器集成度高、體積較小,麥克風與揚聲器距離很接近,從揚聲器輸出的信號很容易從耳塞與耳道之間的縫隙或助聽器的氣孔泄露出去,然后再次被麥克風重新拾取,從揚聲器再次輸出以形成正反饋,產(chǎn)生回波,嚴重時候產(chǎn)生刺耳的嘯叫[7],不僅會損傷人耳聽力,而且極易損壞助聽器,因此去除嘯叫是數(shù)字助聽器中必不可少的部分。但是現(xiàn)在多為耳內(nèi)式助聽器,這就要求元件設計簡單,功耗低,效率高,且性能優(yōu)良,對陷波器的設計提出了嚴峻的要求。
本文認為,一個理想陷波器應滿足以下5個條件:(1)為保證輸出波形不會出現(xiàn)較大的幅值畸變,陷波器傳遞值的通帶要足夠平坦;(2)為保證最終語音不存在相位畸變,陷波器應具有線性相位特性;(3)為了保證助聽器在嘯叫發(fā)生時能有效工作,陷波濾波器的設計也應具有較低的復雜性;(4)為保證嘯叫得到妥善處理,陷波頻率應在任意頻率位置實現(xiàn);(5)為保證嘯叫的頻率成分被顯著去除,陷波濾波器在陷波頻率處應具有較大的衰減。
然而,現(xiàn)有的陷波器設計并不令人滿意。如Parks-McClellan技術(shù)、Zahradnik等人[8]提出的最大平坦(the Maximally Flat,MF)方法和等紋波(the EquiRipple,ER)方法,其不能任意設定陷波頻率,內(nèi)存需求大,收斂速度慢,計算時間長;對經(jīng)典Remez算法增加約束條件來設計FIR陷波器[9],但其進一步增加了算法復雜度;自適應濾波器[10]可以跟蹤回波路徑進行抵消以實現(xiàn)抑制,但實際環(huán)境中的語音信號變化隨機性大,其迭代收斂受到限制;IIR陷波器[11]具有階數(shù)低、運算量少的特點,但是IIR陷波器的相位特性往往是非線性相位,不可避免地產(chǎn)生相位失真,對濾波后的波形產(chǎn)生很大的失真,要想使相位線性化,必須對相位特性進行物理補償校正,加大設計的復雜度,并有可能增加濾波器的體積;將自適應濾波與陷波相結(jié)合的自適應陷波器(Adaptive Notch Filter,ANF),克服了傳統(tǒng)基于離散頻譜校正的頻率估計方法具有的頻譜泄漏嚴重、計算復雜、抗噪性能差等缺點[12],完全從時域角度進行頻率估計,不僅可估計頻率恒定的時不變信號,避免了傳統(tǒng)方法的局限性,特別是基于梯度下降算法的2階ANF,具有結(jié)構(gòu)簡單、計算量小的特點,可以進行在線實時估計,但缺點是ANF頻率估計精度對參數(shù)的選擇較為敏感、算法收斂速度偏慢等[13,14]。
本文在文獻[15]引入的全相位濾波基礎上,提出閉式FIR陷波器的設計方案,無需復雜迭代即可實現(xiàn)衰減值可達–330 dB的陷波頻率點的任意位置控制,且最終可用簡化公式來設計,克服了上述方法的不足,具有較高應用價值。
正如文獻[14]中設計的,給定一個N長度頻率向量H,使其滿足
然后,按照下述3步法可以很容易地得到一個(2N–1)長的線性相位FIR濾波器g=[g(-N-1),g(-N),...,g(-1),g(0),g(1),...,g(N-1)]。
步驟 1 對一特定頻率向量H進行IDFT以獲得h=[h(0),h(1),...,h(N-1)],然后復制h(1),h(2),...,h(N-1)并插入到h的左邊來獲得擴展向量h′=[h(-N+1),h(-N+2),...,h(0),...,h(N-1)];
步驟 2 對常用的N長窗f(n)和N長矩形窗進行歸一化卷積以獲得(2N–1)長窗wc;
步驟 3 將h′和wc對應的元素進行相乘,生成最終的濾波器g(n),-N+1≤n ≤N-1。
理論上,濾波器系數(shù)g(n)為
應該強調(diào)的是,正如文獻[15]中證實的,F(xiàn)IR濾波器的傳輸曲線g(n)通 過頻率設置點H(0),H(1),...,H(N-1),即g(n)的采樣傅里葉變換滿足
第2節(jié)的3步法是基于卷積窗的FIR濾波器的一般設計。然而,作為一種特殊的濾波器,這種方法不能直接設計出具有可控陷波頻率的濾波器。因此本文提出一種名為“反相移組合”的措施來改進這一方法,從而使所需要的陷波器能夠以一種閉式的方式有效地設計出來。
因為全相位濾波器的傳輸曲線通過H的頻率點(令Δω=2π/N為頻率單位),所以本文旨在設計一個陷波頻率在mΔω的陷波器(相對應的頻率是f0=mfs/N),設置H為
要強調(diào)的是,H實際上擁有點通傳輸特性,而不是陷波傳輸特性。這種轉(zhuǎn)換可以通過下面的“反相移組合”措施以及與全通濾波器相減來實現(xiàn)。
該措施要求H分離為兩個向量H1,H2,兩者滿足H1(k)=H2(N-k)[15],即
將式(7)代入式(4),并聯(lián)合式(2)可進一步獲得兩個子濾波器
一般來說,因為m是[0,N–1]范圍內(nèi)的一個整數(shù),只能實現(xiàn)上述3步法中的N個陷波頻率,這不符合陷波頻率點隨機的要求。所以為了實現(xiàn)陷波頻率f0能靈活移動到任一點,對子濾波器進行反相移操作
其中,(·)*表示共軛。
因此,為了得到實值系數(shù),將兩個子濾波器相加,即
圖1 子濾波器g1′ 和g2′的傳輸曲線(N=16,m=3)
結(jié)合式(11)、式(12)和式(13)能得到一個最終的陷波器系數(shù)g(n)的閉式表達式
將N=16,m=3,λ=0.3和wc(n)代入式(14),并對g(n)進行傅里葉變換,其傳輸曲線如圖3所示。從圖3中可看出,陷波頻點準確地落在期望點3.3Δω和1 2.7Δω上。
圖3 陷波器傳輸曲線(N=16,m=3,λ=0.3)
因為助聽器中的語音信號是實時存在的,所以為了提高陷波器的工作效率,對語音信號進行分段處理,但是這帶來了非線性相位效應。因此,本文提出了使用數(shù)據(jù)延拓來避免這一副作用。
圖2 點通濾波器傳輸曲線(N=16,m=3,λ=0.3)
將長度為2N–1的陷波器抽頭系數(shù)g(n)與拓展分段進行卷積得到P+4N–4個樣本,然后去掉前2N–2和后2N–2個暫態(tài)過程,取中間P個樣本作為當前穩(wěn)態(tài)輸出。因此,連接所有P長穩(wěn)定狀態(tài)輸出序列的整個拼接波形不會表現(xiàn)出明顯的截斷效應。從而保證了該陷波器的線性相位特性。
從陷波器的設計原理上分析,本文提出的陷波器具有以下性能:
(1)由于陷波器所有的抽頭系數(shù)都是根據(jù)閉式公式計算的,因此該設計的復雜度非常低,能對語音信號中突發(fā)的嘯叫做出快速響應,實現(xiàn)實時抑制嘯叫。
(2)由于提出了“反相移組合”技術(shù),這確保了陷波頻率可以指定為任意位置,只需設置整數(shù)m和小數(shù)偏移λ,滿足陷波頻率的隨機性。
(3)因為全相位濾波器的傳輸曲線通過了頻率設置點,這就保證了與“反相移組合”技術(shù)相結(jié)合,陷波器的衰減值可以達到–330 dB,能完全地移除嘯叫成分。
(4)本文提出的陷波器的系數(shù)對稱以及數(shù)據(jù)延拓操作保證了生成的語音不包含非線性相位失真,佩戴者能接收到一個舒適的語音信號。
這些性能正好滿足了引言中提出的對助聽器中陷波器的要求。
含陷波器去嘯叫的助聽器模型圖如圖4所示。
圖4 含陷波器的助聽器模型圖
其中,s(n),x(n),y(n)分別表示為原始語音、嘯叫混合語音和經(jīng)本文陷波器濾波的輸出語音。指定采樣率為fs=16 kHz,子段長度P=2000。本文使用的是一段時長7.625 s(含L=fsT=122000個樣本)、包含幾句中文的男性語音。對于本文所提方案,濾波器階數(shù)設為N=32,將卷積窗式(9)中涉及的N長窗f設為漢明窗。為了簡單起見,將前向反饋增益設為G(z)=1。
在上述參數(shù)化的基礎上,在時刻t=1.5 s,即第(Lt=fst=24000)個樣本處添加了頻率f0=1590 Hz,振幅A=1的嘯叫分量,利用信噪比(SNR)來評價該方案的性能。
參考2階IIR模型設計IIR陷波濾波器[16–18],公式為
這里將rz=1,rp=0.8,ωc=2πf0/fs=0.1988π代入式(17)生成IIR陷波器,其衰減曲線和相位響應曲線如圖5所示。
相同地,根據(jù)3.2節(jié)的步驟,將m=3,λ=0.18(由f0=1590 Hz計算出),N,wc(n)代入式(14)生成本文所提陷波器g(n),其衰減曲線和相位響應曲線如圖6所示。
此外,將經(jīng)過IIR陷波器濾波的波形和經(jīng)過本文提出的陷波器濾波的波形進行了對比,如圖7和圖8所示,綠線為原始語音信號,藍線為嘯叫信號經(jīng)過濾波后的信號。
由圖5、圖6可以得出以下結(jié)論:
(1)如圖5(a),圖6(a)所示,IIR陷波濾波器的通帶衰減曲線完全偏離0,因此存在一個明顯的直流電(Direct Circuit,DC)恢復波形偏差,如圖7(b)所示;而該閉式FIR陷波器的通帶衰減曲線完全落在0,因此沒有直流偏差出現(xiàn)在其濾波后的波形中,如圖8(b)所示。
圖5 傳統(tǒng)陷波器頻率響應圖
圖6 本文提出的閉式FIR陷波器頻率響應圖
(2)IIR陷波濾波器的過渡帶比本文提出的濾波器寬,這不可避免地會損傷陷波附近更多有用的頻率成分。
(3)針對陷波位置,IIR濾波器的衰減值只有約–40 dB,而本文提出的陷波器的衰減值低于–330 dB。因此,在前一個濾波后的波形(見圖7(b))上仍有嘯叫分量,而在后一個恢復波形(見圖8(b))上無嘯叫分量。
圖7 經(jīng)IIR陷波器濾波的信號波形圖
圖8 經(jīng)閉式FIR陷波器濾波的信號波形圖
為研究所提陷波器對不同嘯叫頻率的濾波質(zhì)量,本文使嘯叫頻率從1290 Hz至3390 Hz變化,并將其對應的SNR列在了表1中。
由表1可以發(fā)現(xiàn),不同嘯叫頻率所對應的SNR僅在22 dB左右的小范圍內(nèi)波動,說明本文所提陷波濾波器對嘯叫頻率不敏感。這種魯棒性反映了陷波器性能穩(wěn)定,對任何嘯叫頻率工作良好。
表1 嘯叫頻率f0與SNR(N=32)
為了研究所提方案的濾波質(zhì)量與陷波器階數(shù)N之間的關系,使陷波器階數(shù)N從32到1024變化,并將其對應的SNR列在表2中。
由表2可以發(fā)現(xiàn),這些SNR也在22 dB左右的小范圍內(nèi)波動,說明本文提出的陷波濾波器對濾波器的階數(shù)不敏感。這種魯棒性一方面在于,隨著陷波器階數(shù)N的增加,過渡帶一定會變窄,有利于提高SNR;另一方面,這些陷波器階數(shù)的增加也增大了FIR陷波濾波器的暫態(tài)過程,使恢復質(zhì)量下降。由于這種補償效應,SNR幾乎保持不變。因此,實際上,為降低系統(tǒng)成本和處理時間,我們選擇較低階的陷波器。
表2 陷波器階數(shù)N與SNR(f0=1590 Hz)
為了證明本文所提陷波器的線性相位特性,隨機選取第21子段和22子段連接處的放大圖,來觀察濾波后的信號在相鄰子段的邊緣是否出現(xiàn)明顯的躍變,如圖9所示。
圖9 經(jīng)閉式FIR陷波器濾波的信號波形圖及子段放大圖
從圖9可以明顯看出,連接第21子段和第22子段的邊緣幾乎沒有跳變。實際上,我們也研究了所有子段邊緣,均沒有發(fā)生階躍,這證實了所提方案的線性相位特性。
本文提出了一種閉式FIR陷波器設計,該設計引入整數(shù)部分m和小數(shù)部分λ實現(xiàn)陷波頻率的精確控制,并對語音信號進行分段、延拓和拼接來保證線性相位。將其應用于助聽器中,對含嘯叫的語音信號進行濾波來判斷其性能的優(yōu)劣。該設計從根本上解決了嘯叫抑制不足、直流偏置、相位失真等問題,而且由于陷波器可以用簡單的解析公式設計,復雜度較低。此外還進行了一系列的數(shù)值實驗來驗證這些優(yōu)點。在健康產(chǎn)業(yè)蓬勃發(fā)展的今天,助聽器的相關技術(shù)對于大量的老年人和聾人來說至關重要,因此本文的設計擁有較大的應用潛力。