冀常鵬,姬紅紅,郭偉平
1.遼寧工程技術(shù)大學(xué)研究生院,遼寧葫蘆島 125105
2.遼寧工程技術(shù)大學(xué)電子與信息工程學(xué)院,遼寧葫蘆島 125105
一種信號適度失真的寬線性SAEC模型
冀常鵬1,2,姬紅紅1,郭偉平1
1.遼寧工程技術(shù)大學(xué)研究生院,遼寧葫蘆島 125105
2.遼寧工程技術(shù)大學(xué)電子與信息工程學(xué)院,遼寧葫蘆島 125105
由于人類的雙聲道聽覺系統(tǒng),在電話會議系統(tǒng)中,立體聲傳播能夠提供語音的遠(yuǎn)程呈現(xiàn)和單聲道系統(tǒng)所不能提供的音頻真實再現(xiàn)[1-2]。立體聲聲學(xué)回聲是由兩個麥克風(fēng)和兩個揚聲器之間的耦合產(chǎn)生的[3]。它為數(shù)字網(wǎng)絡(luò)通信系統(tǒng)引入更多的時延,使回聲現(xiàn)象猶為突出。系統(tǒng)中回聲抵消器的好壞,直接影響通話質(zhì)量的優(yōu)劣?,F(xiàn)有的立體聲回聲抵消器(SAEC)均采用高質(zhì)量的全雙工通信,而且是一個實變量雙輸入雙輸出的裝置。對于每個SAEC接收端的麥克風(fēng)來說它是由一個未知的雙輸入識別系統(tǒng)組成,即形成了兩個聲學(xué)回聲路徑的并聯(lián)組合[4]。因此,為了確定從兩個揚聲器到兩個麥克風(fēng)的回聲路徑,一個SAEC系統(tǒng)會由四個自適應(yīng)濾波器組成,其結(jié)構(gòu)復(fù)雜且不易實現(xiàn)。
近年來,寬線性模型的思想逐漸受到重視并被廣泛應(yīng)用[5]。可將寬線性模型引入到SAEC中,則一種復(fù)變量單輸入單輸出新系統(tǒng)將代替經(jīng)典的實變量雙輸入雙輸出設(shè)計方案。此時,四個實數(shù)聲學(xué)脈沖響應(yīng)轉(zhuǎn)化成一個復(fù)數(shù)脈沖響應(yīng),其優(yōu)點是只需處理一個復(fù)變量的輸出信號。
摒除其內(nèi)在的相似性,SAEC從根本上有別于單信道回聲抵消而且處理難度更大[6]。SAEC所面臨的主要問題是兩個信道傳輸?shù)木€性相關(guān)信號會使自適應(yīng)算法要求解的方程出現(xiàn)異常[7]。這就意味著,在單信道情況下方程沒有唯一解,而是有無限的解[8]。對于這種解不確定問題的唯一解決途徑是使輸入信號間的相關(guān)性降低,在保證沒有影響到立體感和音質(zhì)的前提下,使輸入信號適度失真。
2.1 經(jīng)典立體聲回聲抵消
經(jīng)典的立體聲聲學(xué)回聲抵消器通常是一個實變量雙輸入雙輸出系統(tǒng),即有兩個輸入或揚聲器信號xL(n)和xR(n),兩個輸出或麥克風(fēng)信號dL(n)和dR(n),n表示時間變量。接收端的麥克風(fēng)信號可以表示為:
其中,yL(n)和yR(n)是聲學(xué)回聲信號,νL(n)和νR(n)是近端信號?;芈曅盘枮椋?/p>
其中,wt,LL、wt,LR、wt,RL、wt,RR是揚聲器到麥克風(fēng)的L維聲學(xué)脈沖響應(yīng)的矢量形式,上標(biāo)(·)T是矢量或矩陣的轉(zhuǎn)置。XL(n)和XR(n)是揚聲器信號的L個抽樣值。這種方法的主要目的是估計這四個濾波器的聲學(xué)脈沖響應(yīng),而且揚聲器信號和麥克風(fēng)信號都是實變量。因此,現(xiàn)有的聲學(xué)回聲抵消器物理結(jié)構(gòu)比較復(fù)雜。
2.2 寬線性立體聲回聲抵消新模型
文獻[9]和[10]介紹了寬線性模型的基本理論及其復(fù)變量的表達形式,文獻[11]證明了寬線性模型理論與對偶原理的一致性。在此,通過復(fù)變量的形式把寬線性模型應(yīng)用到立體聲回聲抵消技術(shù)中,并推導(dǎo)寬線性立體聲回聲抵消模型。
為了引入本文所要介紹的模型,先介紹公式的復(fù)數(shù)表達式,首先輸出信號的復(fù)數(shù)形式為:
從式(4)~(6)可以看出通過復(fù)變量引入的寬線性模型。在這種情況下,要做的是從復(fù)數(shù)麥克風(fēng)信號d(n)和復(fù)數(shù)揚聲器信號x(n)估計出長度為2L復(fù)數(shù)聲學(xué)脈沖響應(yīng)Wt。而此時,經(jīng)典實變量雙輸入雙輸出系統(tǒng)已轉(zhuǎn)換成一個復(fù)變量單輸入單輸出系統(tǒng)。因此,回聲抵消的物理模型是復(fù)數(shù)域的單輸入單輸出寬線性的。
在SAEC中兩個輸入信號是通過對同一信源進行濾波得到的,即兩輸入信號線性相關(guān),因此預(yù)期的非唯一性問題就出現(xiàn)了。而對遠(yuǎn)端揚聲器信號的預(yù)處理是獲得解決方案的有效方式。也就是說,為了減小兩個輸入信號xL(n)和xR(n)之間的相關(guān)性需要使輸入信號適度失真,這樣就可以得到非常逼近的聲學(xué)脈沖響應(yīng)估計值。然而這種失真的實現(xiàn)要以不降低信號的質(zhì)量和立體聲效果為前提。
由文獻[12]可知,分別對每個信道用正負(fù)半波整流器進行整流是能夠降低信號的相關(guān)性。具體對輸入信號的處理公式如下:
其中,αr是用來控制非線性數(shù)量的參數(shù),即使αr增大到0.5也不會影響到聲音的立體感。
在寬線性模型背景下,復(fù)數(shù)形式的輸入信號表示為:
式中的相位是由半波整流房發(fā)展改進而來的,而幅值與原信號的幅值保持一致。
因此,讓輸入信號適度失真的預(yù)處理降低了輸入信號間的相關(guān)性,避免了因相關(guān)性而出現(xiàn)的解不唯一問題,可以根據(jù)其幅值相位的表達形式按需要調(diào)控音質(zhì)和立體感。
仿射投影算法(APA)是回聲抵消效果較好的算法之一,其收斂和跟蹤速度比歸一化最小均方誤差(NLMS)快。此外,從算術(shù)運算的復(fù)雜度方面看,APA要比遞歸最小二乘(RLS)系列衍生的算法更小。設(shè)W(n)=[w0(n),w1(n),…,w2L-1(n)]T是長度為2L的自適應(yīng)濾波器系數(shù),且是Wt的估計值,y′(n)=WH(n-1)X′(n)是自適應(yīng)濾波器在n時刻的輸出信號,誤差信號為e(n)=d(n)-y′(n)。
為了導(dǎo)出在本文背景下的APA算法的表達式,先設(shè)2L×P維的輸入矩陣A(n)=[X′(n),X′(n-1),…,X′(n-P+1)],P是投影階數(shù)。定義P×1維的先驗誤差的矢量形式為e(n)=d(n)-AT(n)W*(n-1)。根據(jù)這種表達方式,APA的更新公式如下:
式中,IP是P×P維的單位矩陣,α是歸一化步長參數(shù),δ是正則化因子。由此可知,當(dāng)P=1時,式(11)轉(zhuǎn)化成NLMS。因為APA算法簡單易實現(xiàn),所以它在實踐中非常實用。但是由于濾波器長度較長,輸入信號相關(guān)性較高,使得它的收斂速度不是很理想。
利用回聲路徑的稀疏特性,即算法的“成比例”思想[13],來改善算法的收斂速率,調(diào)節(jié)與待估計濾波器系數(shù)的幅值成比例的自適應(yīng)步長更新濾波器的每個系數(shù)。因此,在所有的濾波器系數(shù)中自適應(yīng)增益是按比例重新分配的,在系數(shù)較大時能加快收斂速度,算法的整體收斂速率也將得到提高。在眾多改進的成比例算法中[14],改進的成比例APA(IPAPA)算法是最具吸引力的選擇之一,其優(yōu)勢表現(xiàn)在它的簡單性和它對回聲路徑稀疏程度的魯棒性。在本文所提出SAEC的寬線性模型背景下,IPAPA算法的更新公式可以寫成:
其中,k(-1≤k≤1)是用來控制比例數(shù)量的參數(shù)。
在收斂速度和跟蹤速度有所提高的前提下,希望算法的失調(diào)誤差盡量減小。在濾波系數(shù)的估計過程中,為了減少噪聲的影響,提出正則化APA(R-APA)優(yōu)化表達式為:
在本文提出的SAEC模型背景下,可以根據(jù)已有的算法推導(dǎo)出更多新算法。其中,APA、IPAPA和R-APA三種基本算法在APA衍生的算法中具有重要的地位,在此先以這三種算法為例分析改進方法的可行性。
本文所有的仿真結(jié)果是在提出的SAEC模型背景下進行的。設(shè)遠(yuǎn)端聲學(xué)脈沖響應(yīng)有1 024個參數(shù),近端脈沖響應(yīng)(即wt,LL、wt,LR、wt,RL、wt,RR)的長度L為512。自適應(yīng)濾波器的長度1 024,抽樣率為8 000 Hz。遠(yuǎn)端原信號是IEEE-AP語音庫的語音序列。
選擇三種算法進行對比,即APA、IPAPA和R-APA算法。所有算法的步長α=0.5,正則化因子是x(n)的方差。在成比例類型的算法(IPAPA)中取k=0。對于算法性能采用如下的三項指標(biāo)進行估計與分析:(1)收斂快慢的比較,從仿真結(jié)果中可直觀的看出。(2)均方誤差(MSE),為得到平滑的仿真曲線選擇的平均點數(shù)均超過256點。(3)歸一化失調(diào)函數(shù)(即MIS,單位是dB),其表達式為為二階范數(shù))。
仿真是在單向通話的情景下進行的,由于此時近端語音信號不存在,近端信號v(n)中只包含背景噪聲。因此,可以定義聲學(xué)回聲與噪聲之比(SENR),分別為y(n)和v(n)的方差。仿真中,近端的背景噪聲是獨立的高斯白噪聲信號,且SENR=30 dB。
首先,在無失真的輸入信號的情況,輸入信號經(jīng)過正負(fù)半波整流器后的情況以及本文中提出的輸入信號適度失真方法的三種情況下,比較APA算法的性能優(yōu)劣。其中也將無失真的情況作為一個參照展示,失真參數(shù)αr=0.4。其次,分別比較IPAPA和R-APA算法在無失真輸入信號和適度失真的輸入信號情況下的收斂性能。最后,比較APA、IPAPA和R-APA算法在使輸入信號適度失真的方法條件下的性能表現(xiàn)。
由圖1可知,在P=8情況下算法的收斂速度和復(fù)雜度能達到一個折中狀態(tài)。由圖1(a)可以看出,在失真狀態(tài)下的APA收斂速度要比整流后的輸入信號和無處理的參照輸入信號更快且更易達到平穩(wěn)狀態(tài),這就意味著,新SAEC模型的物理結(jié)構(gòu)更簡單,處理速度較快。圖1(b)和1(c)分別是均方誤差和均方誤差的局部細(xì)節(jié)曲線。特別地,從1(c)圖的局部細(xì)節(jié)可知,與正負(fù)半波整流器相比較失真方法具有更小的MES,對于歸一化失調(diào)函數(shù)而言,經(jīng)過半波整流的輸入信號的情況失調(diào)量略小,但并無很大差別,即對回聲信號的抵消效果更好,能夠有效地抑制回聲的產(chǎn)生,而且抵消情況比較穩(wěn)定,能夠有效且真實地還原語音信號。
圖2分別比較IPAPA和R-APA算法在無失真輸入信號和適度失真的輸入信號情況下的收斂性能。由圖可知,對不同算法但相同處理方式時,即R-APA和IPAPA算法分別用這兩種方法處理時,前者的收斂速度比后者略快,誤差較小;對相同算法但不同處理方式時,即適度失真信號情況下的IPAPA和R-APA算法要比無失真純粹是輸入信號情況下算法的收斂速度快,對輸入信號無處理時R-APA算法的誤差最大,而對信號進行失真處理時R-APA算法的誤差最小,即為不同的結(jié)構(gòu)與處理方法對回聲抵消的效果以及效果的穩(wěn)定性。
圖1 在輸入信號無失真,半波整流和輸入信號失真狀態(tài)下的函數(shù)曲線圖
圖2 IPAPA和R-APA算法分別在輸入信號無失真和適度失真條件下的函數(shù)曲線圖
圖3 在失真方法下的APA、IPAPA和R-APA算法的曲線圖
圖3顯示這三種算法在輸入信號失真情況下的性能曲線。圖3(a)驗證了IPAPA和R-APA算法的整體收斂速度要優(yōu)于APA算法,R-APA要比IPAPA算法略快且基本同時趨于穩(wěn)定。因此,在寬線性SAEC模型的條件下,R-APA算法的回聲抵消效果更好,得到的語音更接近真實的語音而且立體感增強。圖3(b)和圖3(c)分別顯示了誤差曲線和其局部曲線圖,相比較可知R-APA算法的誤差最小,而且在失真方法下的誤差的幅度也減小了。同時,從圖3(c)可以看出,在本文的方法下,R-APA算法的失調(diào)量最小,即聲學(xué)系統(tǒng)對聲音的處理效果很穩(wěn)定。
基于現(xiàn)有的實變量雙輸入雙輸出的SAEC模型,提出了一種復(fù)變量單輸入單輸出的新模型。介紹了適用于SAEC模型的使輸入信號失真的新方法。在文中,利用仿射投影算法驗證寬線性SAEC的性能。仿真結(jié)果表明輸入信號適度失真的寬線性模型與算法結(jié)合后,提高了算法的收斂速度,降低了失調(diào)量和均方誤差,從而使SAEC新模型物理結(jié)構(gòu)的復(fù)雜度有所減少。而且在外界環(huán)境變化很大,即揚聲器和麥克風(fēng)的聲耦合更嚴(yán)重時,本文方法的回聲抵消效果比較理想,而且可以抑制回聲產(chǎn)生,聲音的處理效果較穩(wěn)定,更能滿足人們的要求。
[1]成利香,張桂新.基于DSP生回聲抵消系統(tǒng)的研究[D].長沙:中南大學(xué),2010.
[2]袁佳能,于鳳芹.一種無雙端會話檢測的回聲抵消算法[J].計算機工程與應(yīng)用,2008,44(15):33-35.
[3]Chen Qiuying,Wang Xiaomin,Li Mingxuan,et al.Sound field of an electromagnetic acoustic transducer[J].Chinese Journal of Acoustics,2011,30(1):44-54.
[4]Benesty J,Gaensler T,Morgan D R,et al.Advances in network and acoustic echo cancellation[M].Berlin:Springer-Verlag,2001. [5]Benesty J,Paleologu C,G?nsler T,et al.A perspective on stereophonic acoustic echo cancellation[M].Berlin:Springer-Verlag,2011.
[6]Sondhi M M,Morgan D R,Hall J L.Stereophonic acoustic echo cancellation-an overview of the fundamental problem[J].IEEE Signal Processing Letters,1995,2(8):148-151.
[7]Benesty J,Morgan D R,Sondhi M M.A better understanding and an improved solution to the specific problems of stereophonicacousticechocancellation[J].IEEETransactionson Speech and Audio Processing,1998,6(2):156-165.
[8]李躍明,侯楚林.變步長比例放射投影算法及在回聲消除中的應(yīng)用[J].計算機工程與應(yīng)用,2012,48(35):126-129.
[9]Picinbono B,Chevalier P.Widely linear estimation with complex data[J].IEEE Transaction on Signal Processing,1995,43(8):2030-2033.
[10]趙愉,李峰.仿射投影算法中的步長控制[J].計算機工程與應(yīng)用,2011,47(11):112-113.
[11]Mandic D P,Still S,Douglas S C.Duality between widely linear and dual channel adaptive filtering[C]//Proceedings of the IEEE International Conference on Acoustics,Speech,and Signal Processing,2009:1729-1732.
[12]Paleologu C,Benesty J,Ciochinǎ S.Sparse adaptive filters for echo cancellation[C]//Proceedings of the Synthesis Lectures on Speech and Audio Processing,2010.
[13]Duttweiler D L.Proportionate normalized least-mean-squares adaptation in echo cancellers[J].IEEE Transactions on Speech and Audio Processing,2000,8(5):508-518.
[14]Benesty J,Gay S L.An improved PNLMS algorithm[C]// Proceedings of the IEEE International Conference on Acoustics,Speech,and Signal Processing,2002,2:1881-1884.
JI Changpeng1,2,JI Honghong1,GUO Weiping1
1.Institute of Graduate,Liaoning Technical University,Huludao,Liaoning 125105,China
2.School of Electronic and Information Engineering,Liaoning Technical University,Huludao,Liaoning 125105,China
The existing approach of stereophonic acoustic echo cancellation is designed by a two-input/two-output system with real random variables.Its structure appears to be complex and it is difficult to realize.This scheme will be recast as a singleinput/single-output system with complex random variables by approved the widely linear model.The advantage of this method is that instead of handling two real output signals separately,it only handles one complex output signal.Moreover,the perception and quality of the stereo will be modified by the phase and module of the complex input signal,respectively.The coherence can be declined by making the input signal reasonably distorted in order to solve the nonuniqueness problem.The widely linear model and distorted signal are applied in affine projection algorithm to verify the misalignment and convergence.Experimental results indicate that the proposed method has good numerical features of less misalignment and fast convergence,so the SAEC with widely linear model has more advantage.
Stereophonic Acoustic Echo Cancellation(SAEC);widely linear model;nonlinear distortion;Affine Projection Algorithm(APA)
現(xiàn)有的立體聲回聲抵消器是一個實變量雙輸入雙輸出的裝置,其結(jié)構(gòu)復(fù)雜不易實現(xiàn)。寬線性模型的引入,提供了一種復(fù)變量單輸入單輸出的裝置來替代實變量雙輸入雙輸出裝置,其優(yōu)點是只需處理一個復(fù)變量的輸出信號而不是兩個實變量輸出信號,而且能通過復(fù)變量輸入信號的相位和幅值分別調(diào)控聲音的立體感和音質(zhì)。利用輸入信號適度失真的方法降低兩個信號之間的相關(guān)性以解決因濾波而產(chǎn)生的非唯一性問題。把寬線性模型和失真信號應(yīng)用到仿射投影算法中,通過仿真驗證改進方法的誤差性能和收斂速度。結(jié)果表明改進的方法具有誤差小和收斂快的特點,因此寬線性SAEC模型更有優(yōu)勢。
立體聲聲學(xué)回聲抵消;寬線性模型;非線性失真;仿射投影算法
A
TN912
10.3778/j.issn.1002-8331.1303-0022
JI Changpeng,JI Honghong,GUO Weiping.Reasonably distorted signal for stereophonic acoustic echo cancellation with widely linear model.Computer Engineering and Applications,2013,49(19):200-203.
國家自然科學(xué)基金(No.50490275)。
冀常鵬(1970—),男,教授,研究方向為通信與網(wǎng)絡(luò),信號檢測與處理;姬紅紅(1988—),女,研究生,研究方向為信號檢測與處理;郭偉平(1987—),女,研究生,研究方向為信號檢測與處理。E-mail:hongji19880610@163.com
2013-03-04
2013-05-17
1002-8331(2013)19-0200-04
CNKI出版日期:2013-06-08http://www.cnki.net/kcms/detail/11.2127.TP.20130608.1001.027.html