亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于短時能量過零率和功率譜熵的語音端點(diǎn)檢測

        2014-11-25 11:00:39葛艷白艷萍胡紅萍
        數(shù)字化用戶 2014年18期
        關(guān)鍵詞:魯棒性

        葛艷  白艷萍  胡紅萍

        【摘 要】隨著語音技術(shù)的發(fā)展,語音識別技術(shù)應(yīng)用到各個領(lǐng)域,而端點(diǎn)檢測是語音識別系統(tǒng)中至關(guān)重要的一個環(huán)節(jié),語音端點(diǎn)檢測的精確度直接影響語音識別的準(zhǔn)確度.在噪聲環(huán)境下,語音端點(diǎn)檢測很困難,信噪比下降,本文就基于短時能量過零率和基于功率譜熵對所采集的音頻文件進(jìn)行端點(diǎn)檢測,然后對處理后的音頻進(jìn)行頻譜分析、對比,得出基于功率譜熵的端點(diǎn)檢測的魯棒性比較好,識別效果比較好。

        【關(guān)鍵詞】短時能量過零率 功率譜熵 端點(diǎn)檢測 魯棒性

        一、引言

        語音端點(diǎn)檢測是指從含噪語音中找到語音段的起始點(diǎn),端點(diǎn)檢測對孤立詞識別非常關(guān)鍵,語音識別一半以上的錯誤是由錯誤的端點(diǎn)檢測導(dǎo)致的.準(zhǔn)確的端點(diǎn)檢測還可以降低后續(xù)處理時間和存儲空間,使語音識別系統(tǒng)性能達(dá)到最佳.

        目前,基于能量的方法是目前語音端點(diǎn)檢測廣泛使用的方法,它在高信噪比條件下效果很好,但是當(dāng)信噪比很低時,純粹的能量參數(shù)效果不再令人滿意。本文就基于短時能量過零率和基于功率譜熵對所采集的音頻文件進(jìn)行端點(diǎn)檢測,分析對比證實(shí)了基于功率譜熵對語音識別有比較好的識別性。

        二、理論概述

        (一)基于短時能量和過零率的端點(diǎn)檢測

        1、短時能量

        由于語音信號的短時性,因此對數(shù)字化后的語音信號一般進(jìn)行分幀處理,并認(rèn)為1幀內(nèi)信號的頻譜特征和某些物理特征參量近似看做不變。1幀內(nèi)的信號能量稱為短時能量。

        語音和噪聲的區(qū)別可以體現(xiàn)在它們的能量上,語音段的能量比噪聲段能量大,語音段的能量是噪聲段能量疊加語音聲波能量的和。在信噪比很高時,那么只要計(jì)算輸入信號的短時能量或短時平均幅度就能夠把語音段和噪聲背景區(qū)分開。

        設(shè)第n幀語音信號的短時能量用En表示,則信號的短時能量定義為: 式中,N為信號幀長。

        2、過零率

        短時過零表示一幀語音信號波形穿過橫軸(零電平)的次數(shù)。過零分析是語音時域分析中最簡單的一種。對于連續(xù)語音信號,過零意味著時域波形通過時間軸;而對于離散信號,如果相鄰的取樣值的改變符號稱為過零。過零率就是樣本改變符號次數(shù)。

        定義信號的短時平均過零率Zn為:

        式中,為符號函數(shù),即:

        3、過零率的修正

        為盡可能減少低頻的干擾,在實(shí)際應(yīng)用中往往對過零率做出簡單的修正,修正的方法是對上面的定義做一些修改,即設(shè)定一個門限T,將過零率的定義修改為穿越該門限的次數(shù)。

        于是,有定義:

        (二)基于熵函數(shù)的語音端點(diǎn)檢測

        ShenJ L 首先將熵的概念引入到語音信號處理中,利用幅度譜熵在語音段與非語音段上頻譜的差異達(dá)到檢測語音端點(diǎn)的目的。在信息論中,用熵來表征信源輸出的平均信息量,假設(shè)信源發(fā)出有限個符號 ,它們組成的輸出序列前后符號之間相互統(tǒng)計(jì)獨(dú)立, 分別為 n個符號出現(xiàn)的概率,其定義式如下:

        信源熵是概率分布的函數(shù),而且概率分布越平坦熵值就越大。熵函數(shù)語音端點(diǎn)檢測就是通過檢測語音頻譜的平坦程度來實(shí)現(xiàn)的。對于非語音段,其能量比較平穩(wěn)的分布在各個頻率,因而其頻譜熵比較大。而對于語音段,聲音的能量主要集中在某幾個頻段上,因而其頻譜熵比較小。于是可以根據(jù)語音段和非語音段在譜熵上的差異來實(shí)現(xiàn)語音端點(diǎn)的檢測本文中采用功率譜熵的方法,功率譜熵函數(shù)的構(gòu)造構(gòu)成如下:

        首先對語音進(jìn)行分幀加漢明窗,幀成為256,幀移128,對每幀語音信號計(jì)算其短時自相關(guān)序列,對得到的序列進(jìn)行傅里葉變換即可得到功率譜密度。各頻率分量的歸一化功率譜密度函數(shù)可表示為:

        式中表示信號經(jīng)過FFT變換后的頻譜分量:表示某個頻率分量i所對應(yīng)的概率密度函數(shù);N表示FFT變換的長度(本文取256點(diǎn))。考慮到語音信號類似于功率信號,同時根據(jù)功率譜密度的對稱性,只取FFT一半的點(diǎn)來構(gòu)造以減少計(jì)算量。所以實(shí)際運(yùn)用中采用下式來計(jì)算歸一化功率譜密度函數(shù)

        對應(yīng)的每一幀語音信號的信息熵定義為

        H=

        由以上功率譜熵函數(shù)的構(gòu)造過程可以看到熵的大小由功率譜的方差來決定而不是信號的幅度,幅度的大小不會影響歸一化功率譜密度函數(shù),語音信號的譜熵特征分析都是通過檢測譜的平坦程度,從而達(dá)到語音端點(diǎn)檢測的目的。對于無聲段,它的能量在各頻率的分布比較平穩(wěn),反映到信息量上,認(rèn)為其所含的平均信息量即譜熵較大;而對于語音段,它的能量集中于某幾個頻段,起伏突變大,那么它所含的平均信息量即譜熵較小,于是可以利用兩者譜熵的差異,進(jìn)行語音段和無聲段的劃分。并且理論上,如果譜的分布保持不變,信號幅值的大小不會影響.。因而,功率譜熵對噪聲有一定的穩(wěn)健性。

        三、MATLAB對采集到的音頻進(jìn)行端點(diǎn)檢測實(shí)驗(yàn)

        在本論文所采集的音頻信號中,撥號音相當(dāng)于語音段(有聲段),其他的為靜音段(噪聲段),撥號音段平均能量最高,靜音段平均能量相對較低,整個端點(diǎn)檢測可分為四段:靜音段、過渡段、撥號段、結(jié)束。使用一個變量表示當(dāng)前狀態(tài)。靜音段,如果能量或過零率超過低門限,就開始標(biāo)記起始點(diǎn),進(jìn)入過渡段。過渡段當(dāng)兩個參數(shù)值都回落到低門限以下,就將當(dāng)前狀態(tài)恢復(fù)到靜音狀態(tài)。而如果過渡段中兩個參數(shù)中的任一個超過高門限,即被認(rèn)為進(jìn)入撥號段。處于撥號段時,如果兩參數(shù)降低到門限以下,而且總的計(jì)時長度小于最短時間門限,則認(rèn)為是一段噪音,繼續(xù)掃描以后的撥號音數(shù)據(jù),直至標(biāo)記結(jié)束點(diǎn)。從而達(dá)到分離出單個撥號音的效果。

        低噪音音頻875417基于短時能量過零率端點(diǎn)檢測 低噪音音頻875417基于功率譜熵的端點(diǎn)檢測。

        四、總結(jié)

        本文分別利用短時能量過零率和功率譜熵對銀行卡密碼,手機(jī)號,銀行卡號所采集的音頻數(shù)據(jù)進(jìn)行端點(diǎn)檢測實(shí)驗(yàn),此實(shí)驗(yàn)是在適當(dāng)?shù)驮胍粝虏杉模Y(jié)果顯示功率譜熵的檢測效果會好點(diǎn),而且魯棒性比較好,但如果噪聲再高點(diǎn),功率譜熵的結(jié)果也不好,故本文有待于進(jìn)一步研究。

        參考文獻(xiàn):

        [1]Dean J,Krusienski.Nvestigations Into Using Matlab For Acoustical Adaptive Filtering[J]. REU PENN STATE Annual Research, 2003, 1: 45-53.

        [2]陳亞勇.MATLAB 信號處理詳解[M]. 北京:人民郵電出版社,2000.

        [3]程佩青.數(shù)字信號處理.第三版[M]. 北京:清華大學(xué)出版社,2008.

        [4]Navarro-Mesa, J.An improved speech endpoint detection system in noisy environments by means of third-order spectra[J]. IEEE Signal Processing Letters, 1999, 6(9): 224-226.

        基金項(xiàng)目:

        國家自然基金(61275120)

        作者簡介:

        葛艷(1987—),女,山西呂梁,碩士,研究生,研究方向:語音端點(diǎn)檢測。

        猜你喜歡
        魯棒性
        考慮恒功率負(fù)載的直流微電網(wǎng)穩(wěn)定性與魯棒性控制策略
        武漢軌道交通重點(diǎn)車站識別及網(wǎng)絡(luò)魯棒性研究
        荒漠綠洲區(qū)潛在生態(tài)網(wǎng)絡(luò)增邊優(yōu)化魯棒性分析
        基于確定性指標(biāo)的弦支結(jié)構(gòu)魯棒性評價
        基于時差效用的雙目標(biāo)資源約束型魯棒性項(xiàng)目調(diào)度優(yōu)化
        一種基于三維小波變換的魯棒視頻水印方案
        一種基于奇異值分解的魯棒水印算法
        基于非支配解集的多模式裝備項(xiàng)目群調(diào)度魯棒性優(yōu)化
        基于遺傳算法的數(shù)字水印嵌入位置的優(yōu)化算法
        西南交通大學(xué)學(xué)報(bào)(2016年6期)2016-05-04 04:13:11
        成人做爰黄片视频蘑菇视频| 国产美女在线精品亚洲二区| 亚洲一区二区精品久久岳| 一区二区激情偷拍老牛视频av| av在线观看一区二区三区| 4399理论片午午伦夜理片| 欧美黄色免费看| 在线视频一区二区三区中文字幕| 美女用丝袜脚玩我下面| 国产青榴视频在线观看| 国产精美视频| 亚洲中文字幕人妻诱惑| 中文字幕漂亮人妻在线| 国产精品国产三级国av在线观看| 欧美日韩精品福利在线观看| 成人一区二区三区蜜桃| 黄色av一区二区在线观看| 国产69精品久久久久999小说| 91精品全国免费观看青青| 国产成人亚洲综合二区| 国产精品成人观看视频国产奇米 | 精品久久一品二品三品| 亚洲精品国产精品国自产| 色拍拍在线精品视频| 国产人成在线成免费视频| 精品在线视频在线视频在线视频| 97夜夜澡人人双人人人喊| 人妻AV无码一区二区三区奥田咲| 国产高清大片一级黄色| 高h喷水荡肉爽文np肉色学校| 人妻熟妇乱又伦精品视频app| 青青草免费激情自拍视频| 国产亚洲精品久久情侣| 中文www新版资源在线| 精品欧美久久99久久久另类专区 | 亚洲国产成人资源在线桃色| 杨幂一区二区系列在线| 色播亚洲视频在线观看| 亚洲AV一二三四区四色婷婷 | 国产一级一区二区三区在线播放| 亚洲国产av玩弄放荡人妇|