亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        車載環(huán)境下語音增強的研究

        2016-03-17 03:58:54景新幸
        計算機應(yīng)用與軟件 2016年2期
        關(guān)鍵詞:信號環(huán)境檢測

        李 俊 周 萍 景新幸

        1(桂林電子科技大學(xué)電子工程與自動化學(xué)院 廣西 桂林 541004)

        2(桂林電子科技大學(xué)信息與通信學(xué)院 廣西 桂林 541004)

        ?

        車載環(huán)境下語音增強的研究

        李俊1周萍1景新幸2

        1(桂林電子科技大學(xué)電子工程與自動化學(xué)院廣西 桂林 541004)

        2(桂林電子科技大學(xué)信息與通信學(xué)院廣西 桂林 541004)

        摘要針對車載環(huán)境下語音系統(tǒng)受到外界強噪聲的干擾而導(dǎo)致識別精度降低以及通信質(zhì)量受損的問題,提出一種自適應(yīng)MMSE-LSA估計與TEO(Teager Energy Operator)能量端點檢測相結(jié)合的語音增強算法。TEO端點檢測可以將語音分為語音段和非語音段,從而在噪聲估計時可以更好地跟蹤噪聲的變化,得到更加準確的先后驗信噪比,使增強后的語音最大限度地接近純凈語音,而且對車載噪聲的增強效果比其他噪聲更好。在車載環(huán)境中進行實驗,結(jié)果顯示該方法與MMSE-LSA以及傳統(tǒng)的譜減法相比,提高了輸出信噪比,減弱了音樂噪聲,在可懂度和清晰度方面均具有優(yōu)勢。

        關(guān)鍵詞車載噪聲信噪比TEO端點檢測語音增強

        RESEARCH ON SPEECH ENHANCEMENT ALGORITHM UNDER ON-BOARD ENVIRONMENT

        Li Jun1Zhou Ping1Jing Xinxing2

        1(School of Electronic Engineering and Automation,Guilin University of Technology,Guilin 541004,Guangxi,China)2(School of Information and Communication,Guilin University of Technology,Guilin 541004,Guangxi,China)

        AbstractVoice system could be disturbed by external strong noise under on-board environment, which will lead to decline in accuracy of recognition and damage of communication quality. In order to solve this problem, we proposed a speech enhancement algorithm combining adaptive MMSE-LSA estimation and TEO (Teager energy operator) endpoint detection. According to TEO endpoint detection method, speech can be divided into voice segment and non-voice segment so that in noise estimation the changes of noise can be better tracked and more accurate priori SNR and posterior SNR can be gained as well, this makes the enhanced speech sufficiently approach the original speech. In addition, TEO endpoint detection has a much better effect in enhancing vehicle noise than any other noises. Experiment was carried out under on-board environment, results showed that this method, compared with MMSE-LSA estimation and traditional spectral subtraction, improved the output SNR, reduced the music noise, and had the advantages in both intelligibility and clarity.

        KeywordsOn-board noiseSignal-to-noise ratioTEOEndpoint detectionSpeech enhancement

        0引言

        在汽車內(nèi)部由于動力系統(tǒng)的運行產(chǎn)生的齒輪嚙合,高速行駛時車輪與地面和空氣的摩擦以及其他振動源共同形成了車載噪聲[3]。車載語音通信難免會受到噪聲的干擾,帶有很強的背景噪聲的語音信號很難被車載語音系統(tǒng)識別,必須對車載語音進行增強處理,消除背景噪聲,提高汽車中語音通信的質(zhì)量和車載系統(tǒng)的識別率。

        傳統(tǒng)的譜減法、維納濾波法、最小均方差估計法在去除背景噪聲方面有很好的效果,但是有的時候會造成語音的失真或者產(chǎn)生強烈的音樂噪聲[2,4]。通過研究發(fā)現(xiàn)自適應(yīng)MMSE-LSA估計算法對背景噪聲抑制度高,使語音失真度低。

        自適應(yīng)MMSE-LSA算法是利用先驗信噪比計算增益函數(shù),從而得出純凈語音的估計值。因此對噪聲的準確估計顯得尤為重要,文中提出一種基于TEO能量端點檢測的方法與其結(jié)合,實驗證明這種算法可以更好地抑制音樂噪聲,適用于車載環(huán)境中,對volvo噪聲的去除效果明顯。

        1自適應(yīng)MMSE-LSA算法描述

        人耳對語音的感知主要依賴語音信號的幅度,而對其相位不敏感[10]。大量的研究發(fā)現(xiàn)語音具有短時平穩(wěn)性,即在30 ms以內(nèi)通??梢哉J為語音是穩(wěn)態(tài)分布的,所以短時分幀處理為研究語音信號提供了很大的方便。把每一幀信號都近似認為是平穩(wěn)信號來處理,MMSE-LSA正是估計出純凈語音的短時對數(shù)譜幅度[1]。然后利用人耳對語音相位不敏感的特性,用FFT變換時得到的原始語音信號的短時譜相位和估計的短時對數(shù)譜譜幅度重構(gòu)語音信號,把重構(gòu)的信號作為純凈語音信號[7,8]。MMSE-LSA估計算法在對語音增強的過程中會涉及到先驗信噪比和后驗信噪比的估算。隨著對噪聲估計結(jié)果的變化,需要對信噪比進行及時更新,由于在先驗信噪比的估算中引入了調(diào)節(jié)系數(shù)α,通常對其值設(shè)定一個范圍,根據(jù)多次試驗的結(jié)果確定一個經(jīng)驗值。但這種方法難免使其適應(yīng)性減弱,可能不同的環(huán)境中,不同的信噪比時若繼續(xù)使用相同的值就會造成語音失真或者產(chǎn)生過多的音樂噪聲,需要對α 值及時更新。自適應(yīng)MMSE-LSA則是采用先驗信噪比的最小均方差,根據(jù)噪聲的變化,得到α在不同噪聲情況下的最優(yōu)值即自適應(yīng)效果。

        用x(n),d(n)和y(n)分別表示純凈語音,噪聲和帶噪語音,文中研究的噪聲是指語音中的加性噪聲。則:

        y(n)=x(n)+d(n)

        (1)

        式(1)經(jīng)過FFT變換之后可得:

        |Y(n,k)|2=|X(n,k)|2+|D(n,k)|2

        (2)

        其中,|Y(n,k)|2,|X(n,k)|2和|D(n,k)|2分別表示帶噪語音,純凈語音和噪聲的短時譜幅度則:

        Y(n,k)=|Y(n,k)|∠θy

        (3)

        X(n,k)=|X(n,k)|∠θx

        (4)

        (5)

        又由文獻[1]知:

        |X(n,k)|=G(n,k)|Y(n,k)|

        (6)

        其中:

        (7)

        其中,ξ(n,k)是語音信號的第n幀第k個頻率點的先驗信噪比,定義為:

        (8)

        (9)

        從式(7)得知要計算出增益函數(shù)就必須知道先驗信噪比,從而才能估計出純凈語音,能否準確地估計出先驗信噪比將關(guān)系感到語音增強的效果。傳統(tǒng)MMSE-LSA估計對先驗信噪比的估計采用直接判決法。

        (10)

        式中,α根據(jù)經(jīng)驗其取值范圍為[0.8,1],ε是一個無限接近0的正實數(shù),γ[n,k]是后驗信噪比(SNRpost(n,k)),定義如下:

        (11)

        由文獻[5]可知先驗信噪比估計公式的另一種表示方式為:

        (12)

        (13)

        式(13)是一個半波整流函數(shù)。

        (14)

        由式(12)和式(14)可以得到下式:

        (1-α(n,k))2·(ξ(n,k)+1)2

        (15)

        對M求導(dǎo),并假設(shè)?M/?α[n,k]=0,則可以求出α的最優(yōu)解:

        (16)

        2基于TEO的語音端點檢測

        語音信號由語音段和噪聲段共同構(gòu)成,用端點檢測的方法將其區(qū)分出來再增強處理效果更明顯[12]。譜減法以及基于譜減法的改進方法,在語音的增強過程中對噪聲的估計都是選取帶噪語音的開始幾幀能量譜的平均值或者加權(quán)平均值,即一般情況下認為語音的開始部分只存在噪聲不存在語音,但是這種假設(shè)對平穩(wěn)噪聲環(huán)境中具有一定的適用性。對車載環(huán)境中的語音增強需要考慮到汽車在行駛的過程中,產(chǎn)生的車載噪聲隨著汽車所處的外界環(huán)境不同,并不是固定不變,實際上是非平穩(wěn)的。用端點檢測的方法檢測出噪聲段和語音段對噪聲進行實時更新,才能使增強后的語音更真實。因此探尋一種適合車載環(huán)境的端點檢測方法也是很關(guān)鍵的。經(jīng)過試驗的驗證比較發(fā)現(xiàn)基于TEO的語音端點檢測更適用于車載環(huán)境。

        很多研究中都默認聲音的模型就是平面波沿著管軸傳播。然而TEO理論則認為語音的產(chǎn)生是非線性的,語音是由聲道中的渦流和平面共同作用產(chǎn)生的,而且這一結(jié)論被流體力學(xué)所支持[9]。在連續(xù)信號x(t)中,TEO定義為:

        ψ[x(t)]=(x′(t))2-x(t)x″(t)

        (17)

        當x(t)為離散時間信號時,其TEO能量可以近似表示為:

        ψ[x(t)]=x(n)2-x(n-1)x(n+1)

        (18)

        由式(18)可知,離散x(t)的TEO能量不僅與自身有關(guān)而且還和其前一時刻后一時刻的值密切聯(lián)系。自適應(yīng)MMSE-LSA算法的性能好壞依賴于噪聲估計,噪聲估計的準確性又依賴于端點檢測?;赥EO的端點檢測相比短時能量和短時過零率方法準確率有很大的提高,相比譜熵法復(fù)雜度以及計算量都有很可觀的降低[2]。

        基于TEO是端點檢測首先根據(jù)信號是離散的還是連續(xù)的通過式(17)或者式(18)求出帶噪語音的TEO能量。對原是語音信號進行分幀加窗處理,對每一幀信號進行計算,求其TEO能量Ei,和傳統(tǒng)的短時雙門限一樣,在端點檢測時我們設(shè)定一個TEO能量值,作為門限。經(jīng)過對帶噪語音的TEO能量曲線的研究,設(shè)置門限L=Emin+Emean×0.1,當Ei大于L時則認為是語音段,反之為噪聲段,其中Emin表示整段語音TEO能量的最小值,Emean表示整段語音的TEO能量均值。

        把純凈的語音分別加入white、babble、factory、volvo各種噪聲,形成-5、0、5、15 dB不同的信噪比的帶噪語音,比較TEO能量端點檢測方法在不同的噪聲中的檢測率,結(jié)果如圖1所示。

        圖1 TEO能量端點檢測在四種不同噪聲中的檢測率

        從圖1可以看出基于TEO的端點檢測在不同的噪聲環(huán)境中效果不同,對車輛噪聲的增強效果與信噪比近似成正比例關(guān)系,隨著信噪比的逐漸增大識別率直線上升。不僅在高信噪比時有較高的檢測率而且在0 dB以下相對于其用于其他噪聲環(huán)境中的檢測率最高,說明該方法適應(yīng)范圍比較廣穩(wěn)定性高,綜合考慮得出一個結(jié)論:基于TEO的端點檢測方法很適合在車載環(huán)境中應(yīng)用。

        3實驗結(jié)果

        為了驗證文中方法的性能,分別在MATLAB仿真環(huán)境下進行試驗和在實際車載環(huán)境中通過車載識別系統(tǒng)測試識別率。將文中的算法與傳統(tǒng)譜減法,MMSE-LSA估計作比較。試驗采用的純凈語音信號采樣頻率為8 KHz,采樣精度為16 bit,對信號進行分幀幀長為256,幀移為128。并使用噪聲語音庫NOISEX-92中的volvo.wav車輛噪聲加到純凈語音中構(gòu)成不同的信噪比的帶噪語音,比較算法的性能,如表1所示。

        表1 三種算法輸出信噪比對比

        從表1中的數(shù)據(jù)可以得知用傳統(tǒng)譜減法增強后的輸出信噪比與輸入信噪比相比較提升了很多。然而相比于文中的方法和MMSE-LSA估計傳統(tǒng)譜減法效果還是有一定的差距。關(guān)鍵是傳統(tǒng)譜減法會帶來比較嚴重的音樂噪聲。譜減法采用噪聲的統(tǒng)計均值代替當前幀的噪聲,要是噪聲估計值的更新不及時,當估計噪聲小于某幀中所含有的噪聲分量,相減之后就會殘留噪聲。在頻譜上形成離散的譜峰,在時域中就表現(xiàn)為類似正弦信號疊加產(chǎn)生的音樂一樣的噪聲,比較刺耳,影響聽覺的可懂度和清晰度,還會使人聽覺產(chǎn)生疲勞,被稱為“音樂噪聲”。文中方法相對于MMSE-LSA在信噪比提升方面大概提高0.5 dB。但是由于傳統(tǒng)的譜減法和MMSE-LSA算法都會在增強后的語音中引入較強的音樂噪聲,通過文中的算法增強之后的語音在聽覺感受上有明顯的改善,清晰度和可懂度也提高了。圖2以信噪比為0 dB為例,更加直觀地顯示出增強效果的差異,MMSE-LSA增強后明顯殘留較多噪聲。

        圖2 文中方法與MMSE-LSA增強效果對比

        研究增強算法的最終目的是為了提高車載語音識別系統(tǒng)的識別率,因此必須把文中的方法應(yīng)用到實際的車載環(huán)境中檢測其效果。測試的詞語有錄音、播放、停止、天窗、暫停、開門、關(guān)門、關(guān)窗、打開、關(guān)閉10個詞。先讓1名同學(xué)在實驗室環(huán)境下進行訓(xùn)練作為參考模版,然后尋找10名同學(xué)作為測試對象,有男生也有女生,在真實的汽車環(huán)境中進行識別實驗。每個同學(xué)以任意順序說出上述10個詞語并記錄識別結(jié)果,重復(fù)上述操作10次,即每個詞測試了100次。統(tǒng)計每個詞的識別率,實驗結(jié)果如表2所示。

        表2 各詞語的識別率統(tǒng)計和比較

        從表2中可以看出文中算法識別率達到92%已經(jīng)很可觀,通過上述實驗文中方法不管是在仿真環(huán)境中,還是在實際車載環(huán)境中都取得不錯的效果。

        4結(jié)語

        為了提高車載環(huán)境中語音通信的質(zhì)量,本文提出自適應(yīng)MMSE-LSA與TEO能量端點檢測相結(jié)合的算法。通過在車載系統(tǒng)中的驗證和與其他增強方法的比較表明本文方法對車載噪聲有很好的增強效果。不僅提高了輸出信號的信噪比和車載系統(tǒng)的成功識別率,而且增強后的語音在主觀聽覺感受上很好地抑制了音樂噪聲。

        參考文獻

        [1] 張鵬,張艷寧,付中華,等.基于MMSE-LSA語音增強算法在非平穩(wěn)環(huán)境下的研究與實現(xiàn)[J].計算機工程與設(shè)計,2007,28(19):4695-4697.

        [2] 趙歡,王綱金,胡煉,等.車載環(huán)境下基于樣本熵的語音端點檢測方法[J].計算機研究與發(fā)展,2011,48(3):144-147.

        [3] 姚黎.車載語音識別系統(tǒng)的語音增強方法研究[D].武漢:武漢理工大學(xué),2012.

        [4] 姜占才,孫燕,王得芳.基于譜減和LMS的自適應(yīng)語音增強[J].計算機工程與應(yīng)用,2012,48(7):142-145.

        [5] Ephraim Y,Malah D.Speech enhancement using a minimum-mean square error short-time spectral amplitude estimator[J].Acoustics,Speech and Signal Processing,IEEE Transactions on,1984,32(6):1109-1121.

        [6] Jia Hairong,Zhang Xueying,Jin Chengsheng.A speech enhancement method based on wavelet packet and hearing masking effect[C]//2010 2nd International Conference on Signal Processing Systems,2010:272-275.

        [7] 徐耀華,郭英,范海寧.語音增強:使用burg譜先驗信噪比估計消除“音樂噪聲”[J].信號處理,2009,25(1):141-146.

        [8] 李世紹,高勇.低信噪比下基于FastIca和MMSE-LSA的語音識別[J].電聲技術(shù),2014,38(1):62-65.

        [9] Teager H M,Teager S M.Evidence for nonlinear sound production mechanisms in the vocal tract[M].Speech Production and Speech Modeling.Springer Netherlands,1990:241-261.

        [10] 張雪英.數(shù)字語音處理及matlab仿真[M].電子工業(yè)出版社,2011.

        [11] 朱興宇,萬洪杰.基于麥克風陣列的語音增強系統(tǒng)設(shè)計[J].計算機應(yīng)用與軟件,2013,30(3):240-243.

        [12] 王勁松,李柏巖,宋輝.基于小波分解和信號相關(guān)函數(shù)的語音端點檢測[J].計算機應(yīng)用與軟件,2011,28(7):103-104,124.

        中圖分類號TP391.42

        文獻標識碼A

        DOI:10.3969/j.issn.1000-386x.2016.02.031

        收稿日期:2014-08-18。廣西區(qū)自然科學(xué)基金項目(2012GXNS FAA053221)。李俊,碩士,主研領(lǐng)域:語音信號處理。周萍,教授。景新幸,教授。

        猜你喜歡
        信號環(huán)境檢測
        “不等式”檢測題
        “一元一次不等式”檢測題
        “一元一次不等式組”檢測題
        長期鍛煉創(chuàng)造體內(nèi)抑癌環(huán)境
        一種用于自主學(xué)習(xí)的虛擬仿真環(huán)境
        信號
        鴨綠江(2021年35期)2021-04-19 12:24:18
        完形填空二則
        孕期遠離容易致畸的環(huán)境
        環(huán)境
        基于FPGA的多功能信號發(fā)生器的設(shè)計
        電子制作(2018年11期)2018-08-04 03:25:42
        一区二区无码中出| 噜噜综合亚洲av中文无码| 麻豆╳╳╳乱女另类| 一二三四在线视频社区3| 日本韩国三级aⅴ在线观看 | 久久国产36精品色熟妇| 日韩少妇无码一区二区免费视频| 日本韩国一区二区高清| 精品国产天堂综合一区在线| 美女又色又爽视频免费| 挺进朋友人妻雪白的身体韩国电影 | 在线麻豆精东9制片厂av影现网| 任你躁国产自任一区二区三区| 人妻丰满多毛熟妇免费区| 国产在线视频网站不卡| 国产人妻熟女呻吟在线观看| 亚洲日韩av无码| 日本欧美在线播放| 国产网红一区二区三区| 亚洲av无码国产精品色午夜软件| 亚洲国产精品福利片在线观看| 国产一级在线现免费观看| 日本午夜伦理享色视频| 亚洲熟妇无码久久精品| 国产精品久久久久电影网| 亚洲中文字幕精品久久久久久直播 | 久久精品视频日本免费| 色多多性虎精品无码av| 又黄又爽又高潮免费毛片| 国产乱人伦AⅤ在线麻豆A| 放荡成熟人妻中文字幕| 国产综合无码一区二区辣椒 | 成人爽a毛片在线播放| 宅男666在线永久免费观看| 好屌草这里只有精品| 国产亚洲高清不卡在线观看| 亚洲成在人线天堂网站| 久久国产精品偷任你爽任你| 少妇的丰满3中文字幕| 亚洲成人激情在线影院| 亚洲最全av一区二区|