亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        能量比檢測與連續(xù)學習速率結合的改進雙話處理算法

        2012-03-18 08:10:20崔慧娟
        電訊技術 2012年8期

        黃 瑛,唐 昆,崔慧娟

        (清華大學 電子工程系 清華信息科學與技術國家實驗室, 北京100084)

        1 引 言

        聲回聲抵消中一個重要的問題是回聲路徑較長,且易受近端語音的干擾。回聲抵消多以自適應濾波器來模擬真實回聲路徑,通過殘差信號來自適應調整濾波器的系數(shù)[1]。當近端存在語音時,將引起濾波器的發(fā)散。雙話處理一直是回聲抵消中的一個重要問題。Geigel 算法基于能量進行檢測,該算法簡單,但是隨著路徑的改變或者未知情況下,性能變差;H.Ye[2]提出了正交方法,該方法利用自適應濾波器在收斂狀況下殘差信號與遠端輸入信號正交的特點來檢測濾波器收斂狀況而不是檢測雙話,此算法運算量大,且固定門限的判決容易造成雙話與路徑變化之間的誤判;Jacob Benesty[3-4]等利用參考信號與遠端信號或殘差信號的互相關系數(shù)。算法缺點是同樣需要固定的門限,且需要進行矩陣運算,在回聲路徑較長的情況下更不利于實時實現(xiàn)。針對大多數(shù)回聲抵消雙話檢測算法需要顯式檢測門限,誤判或者漏判會導致收斂速度下降或者雙話過程中濾波器發(fā)散的問題,本文基于多延時塊頻域自適應回聲抵消器研究了一種可變學習速率算法,該算法不顯示檢測回聲,而是采用一種可變的連續(xù)學習速率的調整方法。將速率建模成殘留回聲與輸出信號能量的比重。由于輸出信號殘留回聲能量的估計值比較困難,將殘留回聲建模成為一種難以估計的變化緩慢的泄露因子和一種容易估計快速的回聲副本的能量。原有算法采用線性回歸系數(shù)估計泄露因子,然而,隨著近端語音能量增加,估計偏差增大,導致雙話性能下降。本文引入了一種基于近端語音和遠端語音能量比修正泄露因子的方法,即能量比顯式檢測與連續(xù)學習速率相結合。實驗證明,本文算法改進了原算法的缺陷,雙話跟蹤效果更好,發(fā)散減小。

        2 回聲抵消的原理與多延時塊頻域(MDF)算法

        回聲主要分為兩種:一是在電話網(wǎng)絡中,由于用戶端與交換局之間二、四線轉換時阻抗不匹配產生的線路回聲,也稱電回聲;二是伴隨著免提電話,由于麥克風與揚聲器之間的耦合產生的聲回聲。圖1為聲回聲產生的原理框圖。

        圖1 聲回聲產生原理圖Fig.1 Diagram of acoustic echo production

        為了避免回聲的存在引起語音質量的下降,如何處理回聲十分重要。通常通過自適應濾波器來模擬實際的回聲路徑,然后從回聲信號中減去模擬的回聲從而達到消除回聲的目的。自適應濾波算法分為時域算法和頻域算法兩種[1]。在處理延時較長的聲回聲信號時,對濾波器階數(shù)要求較高,為節(jié)省運算保證實時實現(xiàn),通常采用頻域自適應濾波算法。Soo J.-S.[5]提出了一種多延時塊的頻域自適應濾波算法,通過將濾波器分成多個延時塊,該算法比整塊頻域濾波的FLMS 算法收斂速度更快,延時更小。計算線性卷積和相關通常采用重疊保留法和重疊相加法。以重疊保留50%為例,設N 是權值總數(shù), M 是延遲塊數(shù),每塊大小N/M ,每次輸入一個延時塊即N/M 個數(shù)據(jù)樣點,并保留前一塊的輸入值,做FFT運算轉換到頻域,N′=2N/M 是FFT 算法的大小:

        式中,j 是塊標號。每幀只需要進行一次FFT 運算,通過塊標號的移位保留前面M-1 個延時塊的FFT[5]:

        W(m ,j)為第m 個延時塊的權值向量,即用來模擬回聲路徑濾波器的系數(shù)向量,頻域乘積進行濾波得到估計的回聲副本[5]為

        將真實語音中去除回聲副本所得殘留回聲的誤差向量變換到頻域,用來更新頻域濾波器的系數(shù)[5]:

        d(j)是遠端信號經過實際回聲路徑后產生的回聲,即期望向量,頻域濾波器系數(shù)更新是基于最小均方誤差準則,使得E(E(j)2)最小[5]:

        3 MDF 的最優(yōu)可變學習速率的形式

        為避免近端語音或者噪聲引起的濾波器發(fā)散,Jean-Marc Valin[6]提出了一種動態(tài)調整學習速率的算法,通過最小化系數(shù)的誤調程度,求解得到最優(yōu)學習速率表示為殘留回聲能量占輸出信號能量的比重:

        將該速率用于MDF 算法,得到第l 延時塊的頻點k處學習速率[6]為

        殘留回聲的能量估計表示成了一個緩慢變化但是難以估計的量 η(l)和一個快速變化但是容易估計的

        其中, η(l)是泄露因子, 近似回聲返回增強損失ELRE 的倒數(shù)。為了使得學習速率對于雙話情形能夠給出快速的響應,通常采用瞬時估計

        由于殘留回聲與回聲副本相關度較高,而近端語音與回聲副本不相關,因此以回聲副本和輸出信號的功率譜的線性回歸來估計泄露因子[6]:

        泄露因子可以表示成PY(k , l)、PE(k , l)的線性回歸系數(shù)[6]:

        相關值可以通過下列遞歸運算得到[6]:

        其中:

        β0是泄露系數(shù)的學習速率, σ2y(l)、 σ2e(l)分別是回聲副本與輸出信號的方差。β(l)可以防止估計值在沒有回聲的時候被調整。

        4 改進的泄露因子估計算法

        上文將殘留回聲建模成一個緩慢變化但是難以估計的量 η(l)和一個快速變化但是容易估計 σ2y(k , l)。假設的前提是近端語音與回聲副本之間是獨立的,而殘留回聲與回聲副本能量之間卻是高度相關的。因此在雙話情況下,泄露因子 η(l)較小,學習速率較低,從而有效避免雙話下的濾波器發(fā)散。然而在實際語音測試中我們發(fā)現(xiàn),隨著近端語音的增加,上述方法并不能精準地估計泄露因子。本文將一段語音經過回聲路徑以后,在回聲中1 900~2 900幀(160 樣點/幀)的范圍,加入近端語音。近端語音與遠端能量比分別為6 dB、0 dB、-3 dB、-6 dB。從圖2 中可以看出,隨著近端語音能量的增加,泄露因子越來越大,導致學習速率也隨之提高,失調增大。如圖3 所示,在近端語音比較高的時候,意味著殘留回聲隨之增大,回聲抵消性能下降。

        圖2 在不同近遠端能量比下原算法的泄露因子Fig.2 Leakage of original algorithm with different near to far end energy ratio

        圖3 近遠端能量比6 dB 情況下,回聲抵消后殘留回聲輸出圖Fig.3 Residual echo with near to far end energy ratio at 6 dB

        因此,在本文中,我們采用近端與遠端信號短時能量比修正泄露因子,從而調整連續(xù)學習速率。首先估計近端語音和遠端語音的本幀能量:

        通過一階平滑估計短時平均能量如下式,其中平滑因子λ∈(0,1):

        利用兩個短時平均能量修正泄露因子如下,當近端語音能量小于遠端語音能量,采用原來的線性回歸,當近端語音能量大于遠端語音能量,利用兩者的能量比以及修正因子α相結合,進行修正:

        式中, α為修正因子, α∈(0,1)。該改進實際上是一種原可變學習速率與短時能量比顯式檢測的結合。當近端語音短時能量高于遠端信號時,判決為近端語音存在,利用能量比與自適應因子衰減原學習速率,從而減小濾波器的發(fā)散。

        5 測試結果

        測試條件:本文基于800 階160 延時塊的MDF算法,采用本文修正的泄露因子估計法。回聲路徑采取G.168 中的mode1,沖激響應和頻響特性如圖4和圖5 所示。通過引入延時使得延時約為70 ms。采用8 kHz采樣、16 bit量化的標準語音庫語音材料。在回聲中加入近端語音,近端語音/遠端語音能量比分別為6 dB、0 dB、-3 dB、-6 dB。

        圖4 回聲路徑的沖激響應Fig.4 Impu lse response of echo path

        圖5 回聲路徑的頻響特性Fig.5 Frequency response of echo path

        雙話性能可以通過多種指標的測試結果來反映[7-8],本文主要從以下三方面對算法性能進行測試。

        (1)泄露因子與殘留回聲波形

        圖6 是在不同近遠端能量比下改進算法的泄露因子,圖7 是6 dB 近遠端能量比下改進前后殘留回聲比較。

        圖6 在不同近遠端能量比下改進算法的泄露因子Fig.6 Leakage of proposed algorithm with different near to far end energy ratio

        圖7 6 dB 近遠端能量比下, 改進前后殘留回聲比較Fig.7 Comparison of residual echo with near to far end energy ratio at 6dB

        由圖6 和圖7 可知,采用改進的算法,泄露因子并不隨著近端語音能量的增加而增加,只有少許偏差。在近端語音能量較高(如近/遠端能量比6 dB)的雙話情況下,殘留回聲的幅度相比原算法大大衰減。

        (2)回聲返回損失增加度(ERLE)

        ERLE 表征經過回聲抵消處理以后殘留回聲相對于原來回聲衰減的分貝值。該數(shù)值越大,表明回聲衰減程度越大。該參數(shù)的表達式如下:

        實際測試中,將上式中語音能量的期望值采用短時絕對能量代替,以計算每0.01 ms時間長度的語音段的能量為例,對于8 kHz采樣的語音來說,即連續(xù)80 個樣點的能量比,具體計算公式如下:

        表1 是不同近遠端能量比下ERLE 的比較。

        表1 不同近遠端能量比下ERLE 比較Table 1 Comparison of ERLE with different near to far end energy ratio

        從表1 可以看出,采用本文算法殘留回聲返回損失增強度有較大提高,其中近端語音與遠端語音能量比6 dB和3 dB情況下,提高11 dB和5.8 dB。隨著近端語音能量越高,改進效果越明顯。

        (3)平均意見得分

        對雙話情況下近端語音的主觀聽覺質量進行了測試,用以區(qū)分不同雙話檢測算法下近端語音的失真度量。采用ITU 標準P.862 軟件測試平均意見得分(Mean Opinion Score,MOS),該軟件通常用于語音編解碼系統(tǒng)或者降噪系統(tǒng)的語音質量性能評估,在本文的實驗中能夠反映殘留回聲的能量大小。

        表2 是不同近遠端能量比下MOS 分比較。

        表2 不同近遠端能量比下MOS 分比較Table 2 Comparison of MOS with different near to far end energy ratio

        從表2 可以看出,采用本文算法雙話情況下近端語音MOS 分有較大提高,其中近端語音與遠端語音能量比6 dB和3 dB情況下,提高0.449 和0.235。隨著近端語音能量越高,改進效果越明顯。

        6 結束語

        本文基于多延時塊頻域自適應回聲抵消算法,采用改進的短時能量比顯示檢測與連續(xù)可變學習速率結合的方法來處理雙話,解決了原可變速率中由于殘留回聲估計的泄露因子隨著近端語音能量的增加偏差增大,引起殘留回聲增加的問題。實驗證明,該算法能較大程度上修正原算法的問題,提高雙話情況下的ERLE 和近端語音的MOS 分。在近遠端能量比-6 ~6 dB范圍內,兩者分別提高0 ~11 dB和0.02 ~0.45 分。因此,在聲回聲抵消過程中,固定門限雙話與連續(xù)可調學習速率兩者結合起來,可以使得雙話性能更好。

        [1] Haykin S.自適應濾波器原理[M] .4 版.鄭寶玉, 譯.北京:電子工業(yè)出版社, 2006.

        Haykin S.Adaptive Filter Theory[M] .4th ed.Translated by ZHENG Bao-yu.Beijing:Publishing House of Electronics Industry, 2006.(in Chinese)

        [2] Ye H, Wu B X.A new doub le-talk detection algorithm based on the orthogonality theorem [ J] .IEEE Transactions on Communications, 1991, 39(11):1542-1545.

        [3] Benesty J, Morgan D R, Cho J H.A new class of doubletalk detectors based on cross-correlation[ J] .IEEE Transactions on Speech and Audio Processing, 2000, 8(2):168-172.

        [4] lqbal M A, Stokes J W, Grant S L.Normalized Double-Talk Detection Based on Microphone and AEC Error Cross-Correlation[C]//Proceedings of 2007 IEEE International Conference on Multimedia and Expo.Beijing:IEEE,2007:360-363.

        [5] Soo J S, Pang K.Multidelay block frequency domain adap tive filter[ J] .IEEE Transactions on Acoustics, Speech and Signal Processing, 1990, 38(2):373-376.

        [6] Valin Jean-Marc.On Ad justing the Learning Rate in Frequency Domain Echo Cancellation With Double-Talk [ J] .IEEE Transactions on Audio, Speech, and Language Processing, 2007, 15(3):1030-1034.

        [ 7] Cho J H, Morgan D R, Benesty J.An objective technique for evaluating doubletalk detectors in acoustic echo cancellers[ J] .IEEE Transactions on Speech and Audio Processing,1999, 7(2):718-724.

        [8] Ahgren P, Jakobsson A.A study of doub le-talk detection performance in the presence of acoustic echo path changes[ C]//Proceedings of 2005 Internatinal Conference on Acoustics, Speech and Signal Processing.Vienna, Austria:IEEE,2005:141-144.

        免费观看一区二区| 免费人成年激情视频在线观看| 亚洲亚洲人成综合网络| 国产黄色免费网站| 国产不卡一区二区av| 亚洲第一区二区精品三区在线 | 久久精品亚洲成在人线av| 又黄又刺激的网站久久| 日本公与熄乱理在线播放 | 亚洲中文字幕女同一区二区三区| av在线一区二区三区不卡| 琪琪色原网站在线观看 | 亚洲色AV天天天天天天| 亚洲白嫩少妇在线喷水| 无码中文字幕日韩专区| 亚洲av中文无码字幕色三| 午夜亚洲国产精品福利| av新型国产在线资源| 国产综合精品一区二区三区 | 色av色婷婷18人妻久久久| 成人影院在线视频免费观看| 俄罗斯老熟妇色xxxx| 综合激情网站| 亚洲熟女天堂av一区二区三区 | 天堂资源中文最新版在线一区| 久久青草免费视频| 亚洲国产线茬精品成av| 日韩精品人成在线播放| 中文字幕亚洲情99在线| 免费va国产高清不卡大片| 九九精品国产亚洲av日韩| 无码字幕av一区二区三区| 中国一级免费毛片| 琪琪av一区二区三区| 日韩av无码中文字幕| 欧美巨大性爽| 国产一区二区三区视频免费在线| 中文字幕影片免费人妻少妇 | 欧美日韩一区二区综合| 国产精品美女黄色av| 亚洲一区二区在线观看av|