亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于壓縮感知和MFCC的語音端點(diǎn)檢測算法

        2019-09-20 00:54:46
        測控技術(shù) 2019年5期
        關(guān)鍵詞:端點(diǎn)門限信噪比

        吳 雷 周 萍

        (1.桂林電子科技大學(xué) 認(rèn)知無線電與信息處理教育部重點(diǎn)實(shí)驗(yàn)室,廣西 桂林 541004; 2.桂林電子科技大學(xué) 信息與通信學(xué)院,廣西 桂林 541004;3.桂林電子科技大學(xué) 電子工程與自動(dòng)化學(xué)院,廣西 桂林 541004)

        在語音識(shí)別系統(tǒng)中,輸入信號(hào)通常由原始語音信號(hào)和各類噪聲信號(hào)混合而成。將各個(gè)語音信號(hào)時(shí)段與非語音信號(hào)時(shí)段區(qū)分開并對(duì)語音信號(hào)開始位置進(jìn)行精確定位被稱作端點(diǎn)檢測(Voice Activity Detection,VAD)。端點(diǎn)檢測是語音信號(hào)處理的一個(gè)基本問題,語音端點(diǎn)檢測的目的是在一段含噪語音中提取出語音段的起點(diǎn)和終點(diǎn)[1]。

        在對(duì)連續(xù)語音檢測和去噪時(shí),可以利用濁音的周期性將語音和噪聲分離,但是將清音和寬帶平穩(wěn)噪聲進(jìn)行區(qū)分時(shí)卻存在一定的困難,語音信號(hào)容易被噪聲淹沒。文獻(xiàn)[2]中采用基于短時(shí)幅度和短時(shí)過零特征的端點(diǎn)檢測方法在同一個(gè)門限下對(duì)一些清音信號(hào)進(jìn)行檢測時(shí),可能會(huì)出現(xiàn)虛檢、漏檢現(xiàn)象,從而導(dǎo)致系統(tǒng)發(fā)生錯(cuò)誤識(shí)別?;谀慰固囟ɡ淼钠渌它c(diǎn)檢測算法(譜熵法、自相關(guān)參數(shù)法、獨(dú)立分量分析法、高階統(tǒng)計(jì)量)在解決這一問題時(shí)能取得一定的效果,但通常其數(shù)據(jù)處理量大,大多數(shù)情況下不利于語音信號(hào)的實(shí)時(shí)分析與處理[3]。

        2006年,Donoho[4]等人提出了壓縮感知CS(Compressed Sensing)理論。該方法能以低于奈奎斯特速率對(duì)信號(hào)進(jìn)行快速采樣,這也使CS理論逐漸成為信號(hào)處理領(lǐng)域的研究熱點(diǎn)[5]。文獻(xiàn)[3]中提出了基于壓縮感知觀測序列的倒譜距離檢測方法,利用語音信號(hào)的稀疏性通過構(gòu)建稀疏基從而得到信號(hào)的稀疏表示。在觀測序列上采用倒譜距離算法進(jìn)行端點(diǎn)檢測,這種方法大大減少了數(shù)據(jù)運(yùn)算量。但是,由于其未對(duì)原始語音信號(hào)恢復(fù)重構(gòu),此端點(diǎn)檢測方法不適用于語音識(shí)別系統(tǒng)。文獻(xiàn)[6]開始將Mel 頻率倒譜系數(shù)(Mel Frequency Coefficient,MFCC)作為分類特征用于語音/非語音的檢測。Wang[7]等人采用MFCC倒譜相識(shí)度作為語音/非語音的分類特征。在此基礎(chǔ)上本文提出了基于壓縮感知和MFCC的語音端點(diǎn)檢測算法,利用噪聲不能在DCT域近似稀疏,在觀測壓縮過程中會(huì)部分丟失的原理,對(duì)語音信號(hào)進(jìn)行壓縮感知與重構(gòu),恢復(fù)后的語音信號(hào)信噪比得以提高。在重構(gòu)信號(hào)基礎(chǔ)上,提取MFCC倒譜特征,采用倒譜距離進(jìn)行語音端點(diǎn)檢測。實(shí)驗(yàn)結(jié)果證明,在連續(xù)語音檢測中該方法能取得很好的效果。另外,由于MFCC特征參數(shù)能用于后續(xù)的識(shí)別,節(jié)約了系統(tǒng)的運(yùn)行資源,有利于語音識(shí)別系統(tǒng)的集成化。

        1 理論介紹

        1.1 壓縮感知

        壓縮感知(CS)理論通過極少數(shù)的稀疏表示便能重建該信號(hào)。由此看來,CS不僅是一種信號(hào)采樣方式,也是一種信息提取方法。壓縮感知理論主要分為稀疏表示、壓縮觀測和恢復(fù)重構(gòu)三部分。其數(shù)學(xué)模型闡述如下。

        (1) 稀疏表示。

        (1)

        式中,y=[y1,y2,…,yM]T,y=〈x,Ψi〉,y中非零元素個(gè)數(shù)記作‖y‖0。若‖y‖0=K,且K≤N,則稱信號(hào)x是K稀疏的。

        (2) 壓縮觀測。

        s=Φx

        (2)

        (3) 恢復(fù)重構(gòu)。

        (3)

        (4)

        (5)

        圖1 重構(gòu)算法流程圖

        1.2 Mel倒譜特征

        于迎霞和史家蒯等將倒譜特征應(yīng)用于帶噪端點(diǎn)檢測方法并取得了很好的效果。由于Mel倒譜特征參數(shù)其本身能保持一定的特性,因此在語音識(shí)別中得到廣泛的應(yīng)用[11]。通過大量實(shí)驗(yàn)驗(yàn)證,該種檢測算法更加適用于高倍噪聲環(huán)境[12]。Mel倒譜特征參數(shù)是基于聽覺模型的特征參數(shù)提取方法,將耳蝸當(dāng)作是一個(gè)濾波器組,當(dāng)頻率小于1 kHz時(shí),耳蝸以線性形式進(jìn)行濾波;而當(dāng)頻率大于1 kHz時(shí),耳蝸以對(duì)數(shù)形式進(jìn)行濾波。根據(jù)人耳耳蝸的這一特性,研究人員設(shè)計(jì)了Mel頻率濾波器組,經(jīng)過倒譜運(yùn)算后就能得到Mel頻率倒譜系數(shù)。MFCC參數(shù)的計(jì)算以Mel頻率為基準(zhǔn),其與實(shí)際頻率的轉(zhuǎn)換關(guān)系可用式(6)表示:

        (6)

        而 MFCC的求取過程是首先把求得的頻率特性通過式(6)計(jì)算出Mel頻率特性,隨后將其變換到倒譜空間中[13]。MFCC計(jì)算框圖如圖2所示。

        圖2 MFCC計(jì)算框圖

        MFCC計(jì)算過程如下:

        ① 對(duì)輸入語音信號(hào)進(jìn)行預(yù)處理,包括分幀、加窗等步驟,然后將語音幀進(jìn)行DFT變換,依據(jù)式(7)計(jì)算得語音的頻率特性。

        (7)

        式中,x(n)為輸入語音信號(hào);N為傅里葉變換的長度。

        ② 對(duì)Xa(k)求平方,將其作為輸入通過一組含有M個(gè)三角形濾波器的濾波器組,該濾波器組的中心頻率為f(m),m=0,1,2,…。

        ③ 設(shè)Hm(k)為三角濾波器的頻率響應(yīng)特性,將濾波器組的輸出進(jìn)行對(duì)數(shù)變換,其計(jì)算公式如下:

        (8)

        ④ 將S(m)進(jìn)行DCT變換,所得C(n)即為 MFCC系數(shù)。

        (9)

        在對(duì)語音信號(hào)提取MFCC參數(shù)時(shí),一般選取12階倒譜系數(shù),由于第0階的倒譜系數(shù)表現(xiàn)出的是一種能量的特性,通常C(0)被當(dāng)作能量系數(shù),而不作為倒譜系數(shù)。

        2 改進(jìn)算法

        在實(shí)際環(huán)境下,絕大部分信號(hào)的信噪比比較低,單純的語音端點(diǎn)檢測技術(shù)準(zhǔn)確率較低且難以達(dá)到預(yù)期的檢測效果。大量實(shí)驗(yàn)表明,在對(duì)信號(hào)進(jìn)行檢測時(shí),必須先對(duì)其進(jìn)行去噪處理。本文采用壓縮感知重構(gòu)對(duì)語音信號(hào)去噪,利用倒譜距離對(duì)重構(gòu)信號(hào)進(jìn)行端點(diǎn)檢測,如圖3所示。

        圖3 端點(diǎn)檢測算法框圖

        基于壓縮感知和MFCC的語音端點(diǎn)檢測,其算法具體步驟如下:

        ① 利用語音在離散余弦變換(Discrete Cosine Transform,DCT)域下的稀疏性,采用性能表現(xiàn)最優(yōu)的Hadamard矩陣壓縮測量帶噪語音,然后通過改進(jìn)的正交匹配跟蹤算法(Orthogonal Matching Pursuit,OMP)進(jìn)行語音信號(hào)恢復(fù)。

        ② 利用漢寧窗對(duì)重構(gòu)后的信號(hào)進(jìn)行分幀,假定重構(gòu)的語音信號(hào)的前10幀為噪聲信號(hào),對(duì)前10幀MFCC參數(shù)求平均,得到噪音的Mel倒譜初始值。

        (10)

        ③ 最后利用滑動(dòng)平均求取每幀語音的Ci離Cmn的倒譜距離。設(shè)MFCC系數(shù)的序列為Ci,i=1,2,…,n,則滑動(dòng)平均式[14]為

        (11)

        式中,C(i)為語音信號(hào)第i幀的MFCC倒譜距離。根據(jù)MFCC系數(shù)距離曲線,取T1=0.22,T2=0.12。當(dāng)C(i)≥T1且C(i+1)≥T1時(shí),就可以認(rèn)為第i幀是一個(gè)語音信號(hào),當(dāng)隨后C(i)≤T2時(shí)即認(rèn)為語音結(jié)束。

        ④ 為了保證檢測的實(shí)時(shí)性,噪聲Mel倒譜初始值按式(12)更新:

        Cmn=λCmn+(1-λ)Ci

        (12)

        式中,Cmn為前面10幀噪聲的MFCC均值矢量;Ci為當(dāng)前幀的MFCC矢量;λ為更新速度。

        3 仿真實(shí)驗(yàn)與結(jié)果

        為了檢驗(yàn)該算法在帶噪連續(xù)語音的檢測效果,使用錄音筆在實(shí)驗(yàn)室安靜的環(huán)境下錄制純凈的語音信號(hào),其中信號(hào)的采樣率為16 kHz,每幀256個(gè)采樣點(diǎn),幀移為80個(gè)采樣點(diǎn)。圖4給出了純凈語音信號(hào)“我到北京去”的時(shí)域波形圖,使用標(biāo)準(zhǔn)噪音庫noisex-92里的白噪聲信號(hào)對(duì)其干擾,圖5為疊加高斯白噪聲后的帶噪信號(hào)波形。

        圖4 純凈語音信號(hào)

        圖5 帶噪語音信號(hào)(信噪比10dB)

        首先,采用傳統(tǒng)的雙門限法進(jìn)行仿真,使用語音信號(hào)的短時(shí)能量和短時(shí)平均過零率來進(jìn)行端點(diǎn)檢測,圖6為語音信號(hào)短時(shí)能量檢測結(jié)果,圖7為語音信號(hào)短時(shí)平均過零率檢測結(jié)果。從圖6、圖7可以看出,使用雙門限法檢測時(shí),其采用歸一化處理,在同一門限下進(jìn)行檢測。由于濁音的短時(shí)能量遠(yuǎn)大于清音的短時(shí)能量,在清音“北”字語音段上信號(hào)幅度突然變小,該方法將一段語音檢測成為了兩段語音,很顯然發(fā)生了誤檢現(xiàn)象。

        然后,采用壓縮感知與MFCC端點(diǎn)檢測方法對(duì)同一帶噪語音“我到北京去”進(jìn)行檢測。依據(jù)上述步驟對(duì)原始信號(hào)進(jìn)行壓縮感知與重構(gòu)后,信號(hào)波形如圖8所示,從圖中可以看出,采用壓縮感知和改進(jìn)的OMP算法對(duì)帶噪語音信號(hào)進(jìn)行壓縮觀測和重構(gòu),重構(gòu)信號(hào)不僅能較好地恢復(fù)原始語音信號(hào)波形,而且取得了良好的降噪效果。

        圖6 短時(shí)能量檢測結(jié)果

        圖7 短時(shí)平均過零率檢測結(jié)果

        圖8 重構(gòu)的語音信號(hào)

        圖9為傳統(tǒng)雙門限端點(diǎn)檢測算法和CS-MFCC端點(diǎn)檢測算法在不同信噪比情況下的檢測結(jié)果。從圖中可以看出,在信噪比大于5 dB時(shí),兩種檢測算法都可以進(jìn)行有效的端點(diǎn)檢測,但當(dāng)信噪比低于5 dB時(shí),傳統(tǒng)雙門限檢測算法性能明顯下降,已無法有效進(jìn)行端點(diǎn)檢測,特別是測試樣本中的后3個(gè)字符,幾乎完全被淹沒在噪聲信號(hào)中,嚴(yán)重影響檢測準(zhǔn)確率。

        在連續(xù)語音檢測過程中出現(xiàn)幅值急劇變化時(shí),基于本文改進(jìn)的CS-MFCC端點(diǎn)檢測算法不但可以在大于5 dB的高信噪比環(huán)境下有效檢測出語音幀的起始與結(jié)束,而且在信噪比為0 dB的惡劣環(huán)境下仍然可以保持有效的工作,能適用于連續(xù)語音識(shí)別系統(tǒng)進(jìn)行帶噪語音端點(diǎn)檢測,具有良好的魯棒性。

        實(shí)驗(yàn)中采用傳統(tǒng)的雙門限端點(diǎn)檢測算法和本文改進(jìn)的CS-MFCC端點(diǎn)檢測算法分別對(duì)語音信號(hào)進(jìn)行端點(diǎn)檢測,并改變信噪比的值,統(tǒng)計(jì)在不同信噪比條件下兩種算法的端點(diǎn)檢測結(jié)果如表1所示。準(zhǔn)確率定義為:

        錯(cuò)誤幀數(shù)=語音誤判為噪聲幀數(shù)+噪聲誤判為語音幀數(shù)

        準(zhǔn)確率=(總幀數(shù)-錯(cuò)誤幀數(shù))/總幀數(shù)

        當(dāng)準(zhǔn)確率低于70%時(shí),則對(duì)應(yīng)的算法被認(rèn)為無效。

        圖9 CS-MFCC端點(diǎn)檢測結(jié)果

        端點(diǎn)檢測方法信噪比(SNR)0dB5dB10dB20dB30dB傳統(tǒng)雙門限算法失效失效94.2595.7396.18本文改進(jìn)算法91.6391.7596.3296.1694.63

        通過統(tǒng)計(jì)實(shí)驗(yàn)結(jié)果可知,在信噪比大于10 dB的情況下,傳統(tǒng)雙門限算法和本文改進(jìn)算法都能保持94%以上的準(zhǔn)確率,但當(dāng)信噪比低于10 dB時(shí),傳統(tǒng)雙門限算法性能表現(xiàn)不穩(wěn)定,幾乎無法有效地工作,而本文改進(jìn)的CS-MFCC端點(diǎn)檢測算法依然可以保持91%以上的準(zhǔn)確率。由此可見,傳統(tǒng)雙門限檢測算法雖簡單易實(shí)現(xiàn),但是抗噪性能太差,特別是在檢測弱摩擦音和結(jié)尾音符時(shí)存在明顯不足,無法在低信噪比環(huán)境下有效工作。而本文改進(jìn)算法利用壓縮感知與重構(gòu)進(jìn)行了降噪處理,同時(shí)采用 MFCC倒譜距離進(jìn)行端點(diǎn)檢測,具有較強(qiáng)的抗噪性能和魯棒性,在強(qiáng)噪聲等惡劣環(huán)境下亦可保持有效工作。

        文獻(xiàn)[15]提出的改進(jìn)的自適應(yīng)倒譜距離檢測算法是在傳統(tǒng)倒譜距離端點(diǎn)檢測算法基礎(chǔ)上引入倒譜距離乘數(shù)和門限增量系數(shù),進(jìn)一步提高了端點(diǎn)檢測準(zhǔn)確率,但是在低信噪比環(huán)境下存在漏檢、誤檢現(xiàn)象,特別是針對(duì)強(qiáng)度較弱的信號(hào)或者清音信號(hào),而本文提出的改進(jìn)CS-MFCC端點(diǎn)檢測算法有效地改善了這一現(xiàn)象。圖10為兩種改進(jìn)算法在SNR=-10 dB環(huán)境下的端點(diǎn)檢測結(jié)果。

        圖10 CS-MFCC和改進(jìn)倒譜距離端點(diǎn)檢測結(jié)果

        由圖10可知,文獻(xiàn)[15]提出的改進(jìn)算法漏檢了測試樣本的后兩個(gè)字符,特別是最后一個(gè)尾音字符,多次測試均為漏檢,而本文提出的CS-MFCC算法則依然可以有效檢測出語音端點(diǎn)。

        4 結(jié)束語

        本文將壓縮感知理論和MFCC倒譜系數(shù)相結(jié)合的方法應(yīng)用于連續(xù)語音端點(diǎn)檢測。在端點(diǎn)檢測之前利用壓縮感知與重構(gòu)進(jìn)行了降噪處理。通過實(shí)驗(yàn)證明,采用 MFCC倒譜距離對(duì)帶噪語音進(jìn)行語音端點(diǎn)檢測,較好地解決了傳統(tǒng)的雙門限算法在不同字間由于幅度變化大會(huì)產(chǎn)生誤判的問題,解決了傳統(tǒng)雙門限檢測方法在連續(xù)帶噪語音情況和低信噪比環(huán)境下端點(diǎn)檢測的不足。本文算法引入了壓縮感知理論進(jìn)行語音降噪,利用噪聲與語音信號(hào)在DCT域的差異性,去除語音的噪聲干擾,提高端點(diǎn)檢測算法的噪聲敏感性,很好地解決了文獻(xiàn)[15]在強(qiáng)度較弱的語音信號(hào)或清音信號(hào)下可能出現(xiàn)的丟失或誤檢問題,為連續(xù)語音識(shí)別系統(tǒng)提供了可靠的基礎(chǔ)。

        猜你喜歡
        端點(diǎn)門限信噪比
        非特征端點(diǎn)條件下PM函數(shù)的迭代根
        基于規(guī)則的HEV邏輯門限控制策略
        地方債對(duì)經(jīng)濟(jì)增長的門限效應(yīng)及地區(qū)差異研究
        中國西部(2021年4期)2021-11-04 08:57:32
        隨機(jī)失效門限下指數(shù)退化軌道模型的分析與應(yīng)用
        基于深度學(xué)習(xí)的無人機(jī)數(shù)據(jù)鏈信噪比估計(jì)算法
        不等式求解過程中端點(diǎn)的確定
        低信噪比下LFMCW信號(hào)調(diào)頻參數(shù)估計(jì)
        電子測試(2018年11期)2018-06-26 05:56:02
        低信噪比下基于Hough變換的前視陣列SAR稀疏三維成像
        參數(shù)型Marcinkiewicz積分算子及其交換子的加權(quán)端點(diǎn)估計(jì)
        基丁能雖匹配延拓法LMD端點(diǎn)效應(yīng)處理
        天天爽夜夜爽夜夜爽精品视频 | 中文字幕人妻互换av| 免费a级毛片在线播放| 综合色区亚洲熟妇另类| 性色av无码不卡中文字幕| 中文字幕永久免费观看| 中文字幕一区二区三区在线视频| 亚洲av高清一区二区| 国产激情一区二区三区在线蜜臀 | 射进去av一区二区三区| 在线视频观看国产色网| 人妻少妇乱子伦精品无码专区电影| 亚州少妇无套内射激情视频| 久久这里有精品国产电影网| 黄色大片国产精品久久| 成人偷拍自拍视频在线观看| 青青草国产精品一区二区| 成人无码一区二区三区网站| 日日噜噜夜夜狠狠2021| 精品人妻一区二区三区不卡毛片 | 东北寡妇特级毛片免费| 久久99热精品免费观看欧美| 蜜臀久久久精品国产亚洲av| 日韩一区av二区三区| 日本艳妓bbw高潮一19| 亚洲综合av在线在线播放| 亚洲无码美韩综合| 一区二区三区四区黄色av网站| 国产成人无码a在线观看不卡| 欧美饥渴熟妇高潮喷水水 | 免费人成在线观看播放视频| 国产免费观看黄av片| 乌克兰粉嫩xxx极品hd| 色播中文字幕在线视频| 午夜一区二区三区免费观看| 成年女人免费v片| 国产乱子伦农村叉叉叉| 精品在免费线中文字幕久久| 日本精品少妇一区二区| 永久免费毛片在线播放| 蜜桃视频一区二区三区在线观看|