亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Mel頻率倒譜系數(shù)的說話人識別研究

        2016-06-06 05:37:03朱宇軒
        西部皮革 2016年10期
        關(guān)鍵詞:特征

        朱宇軒

        (西華大學(xué),四川 成都 610039)

        ?

        基于Mel頻率倒譜系數(shù)的說話人識別研究

        朱宇軒

        (西華大學(xué),四川 成都 610039)

        摘要:由于人耳對聲音頻率的感知不是線性的,通過短時傅里葉變化得到的語音信號短時譜是按實際語音頻率分布的,但符合人耳聽覺特性的頻率分布是按照臨界頻帶分布的。因此按實際頻率分布的頻譜作為語音特征時,由于它不符合人耳的聽覺特性,將會降低說話人識別系統(tǒng)的識別性能。

        關(guān)鍵詞:頻率倒譜;語音特征

        1Mel頻率倒譜系數(shù)(MFCC)

        MFCC是在頻譜上采用濾波器組的方法計算出來的,將語音頻率劃分成一系列的三角形濾波器序列,這組濾波器在頻率的坐標(biāo)上是等寬的。這是因為人類在對1000Hz以下的聲音頻率范圍的感知遵循近似線性的關(guān)系;對1000Hz以上的語音頻率范圍的感知不遵循線性關(guān)系,而是遵循在對數(shù)頻率坐標(biāo)上的近似線性關(guān)系。

        Mel頻率倒譜系數(shù)(MFCC)是使用傅立葉分析提取的語音特征參數(shù),是類似于指數(shù)的形式,Mel頻率可以用如下公式表示:

        Mel(f)=2595lg(1+f/700)

        (1)

        式中:f是以Hz為單位的實際頻率。對頻率軸的不均勻劃分是MFCC特征區(qū)別于普通倒譜特征的最重要的特點。語音頻率與Mel頻率的對應(yīng)關(guān)系如圖1所示。

        2頻率倒譜系數(shù)計算

        根據(jù)Zwicker的工作,Mel頻率的增長是與臨界帶寬的變化保持一致的,以Mel為單位的頻率刻度劃分與臨界帶寬在細(xì)節(jié)上并不精確相等,但這個差別是很小的。

        (1)將信號進(jìn)行分幀,預(yù)加重和加漢明窗處理,然后進(jìn)行短時傅里葉變換并得到其頻譜。

        (2)求出頻譜平方,即能量譜,并用M個Mel帶通濾波器進(jìn)行濾波;由于每一個頻帶中分量的作用在人耳中是疊加的,因此將每個濾波器頻帶內(nèi)的能量進(jìn)行疊加,這時第k個濾波器的輸出功率譜x′(k)。

        (3)將每個濾波器的輸出取對數(shù),得到相應(yīng)頻帶的對數(shù)功率譜;并進(jìn)行反離散余弦變換,得到L個MFCC系數(shù),一般L取12~16個左右。得到MFCC系數(shù)為

        (2)

        它將頻譜轉(zhuǎn)化為基于頻率的非線性頻譜,然而轉(zhuǎn)換到頻譜域上,由于充分考慮了人耳的聽覺特性,在一定程度上模擬了人耳對語音的處理特點,而且沒有任何提前假設(shè),MFCC 參數(shù)具有良好的識別性能和抗噪能力,在信道噪聲和頻譜失真的情況下具有較好的穩(wěn)健性。但是計算量和計算精度要求較高。

        3MFCC中的能量信息和動態(tài)參數(shù)

        短時能量是說話人識別中一個重要的參數(shù),由于短時能量對系統(tǒng)的識別性別有一定的提升作用,因此可以在說話人語音特征中加入能量參數(shù)作為特征向量的一維分量。

        假定語音段中長度為N的一幀{si(n),n=1,2,…,N},計算該幀的短時對數(shù)能量的公式如下:

        (3)

        為了減小不同語音段不同語音幀的能量差別,使其能夠與前面的倒譜特征系數(shù)一起作為向量計算,需對其進(jìn)行歸一化處理。

        (4)

        前面計算得到的MFCC倒譜系數(shù)為語音信號的靜態(tài)特征參數(shù),它只表征了語音譜的即時信息。研究發(fā)現(xiàn),語音倒譜的動態(tài)信息包含了與說話人有關(guān)的信息,可以將其用于提高說話人識別系統(tǒng)的識別率。

        語音信號的倒譜動態(tài)信息表示了語音特征參數(shù)隨時間變化的規(guī)律。語音倒譜特征隨時間的變化規(guī)律可由下式表示:

        (5)

        4總結(jié)

        在實際的應(yīng)用中窗函數(shù)h(k)一般采用矩形窗,k為常數(shù),一般取2,這樣的動態(tài)參數(shù)就是當(dāng)前幀的前兩幀和后兩幀的線性結(jié)合。用同樣的方法對一階動態(tài)參數(shù)進(jìn)行計算就得到了二階MFCC參數(shù)。在得到倒譜系數(shù)的動態(tài)信息后,一般的做法是將原始特征與動態(tài)特征參數(shù)結(jié)合,組成高維特征矢量作為訓(xùn)練和識別的一幀語音信號特征參數(shù)。實驗表明,使用MFCC及其一階和二階差分參數(shù)作為特征可顯著提高說話人識別系統(tǒng)的性能,它在一定程度上模擬了人耳對語音的處理特點,并具有一定的抗噪性能,進(jìn)一步地表示了說話人語音背后的隱性個性差異。

        參考文獻(xiàn):

        [1]徐波.語音識別技術(shù)與應(yīng)用的發(fā)展趨勢.中國計算機(jī)學(xué)會,2008,2:54~57.

        [2]李霄寒.基于概率統(tǒng)計模型的說話人確認(rèn)的研究[D].中國科學(xué)技術(shù)大學(xué),2003.

        [3]韓紀(jì)慶,張磊,鄭鐵然.語音信號處理[M].北京:清華大學(xué)出版社,2004,10~50.

        作者簡介:朱宇軒,男,漢族,四川南充,工人,大學(xué)本科,西華大學(xué),研究方向:電子、計算機(jī)。

        中圖分類號:TN912

        文獻(xiàn)標(biāo)志碼:A

        文章編號:1671-1602(2016)10-0014-01

        猜你喜歡
        特征
        抓住特征巧觀察
        離散型隨機(jī)變量的分布列與數(shù)字特征
        具有兩個P’維非線性不可約特征標(biāo)的非可解群
        月震特征及與地震的對比
        如何表達(dá)“特征”
        被k(2≤k≤16)整除的正整數(shù)的特征
        不忠誠的四個特征
        詈語的文化蘊(yùn)含與現(xiàn)代特征
        新聞傳播(2018年11期)2018-08-29 08:15:24
        抓住特征巧觀察
        基于特征篩選的模型選擇
        精品中文字幕在线不卡| 亚洲天堂中文| 少妇高潮无码自拍| 一本色道久久88加勒比综合| 色欲欲www成人网站| 亚洲国产无套无码av电影| 中文AV怡红院| 中文字幕一区二区在线看| 狂猛欧美激情性xxxx大豆行情| 国产绳艺sm调教室论坛| 欧美日韩精品福利在线观看| 天堂av一区一区一区| 亚洲一区二区在线观看网址| 久久精品亚洲国产av网站| 亚洲精品成人无百码中文毛片| 国产白袜脚足j棉袜在线观看| 中文字幕精品亚洲人成| 国内精品人人妻少妇视频| 精品少妇一区二区三区免费 | 国产精品亚洲av无人区一区蜜桃| 亚洲精品国产第一区二区| 久久综合九色综合欧美狠狠 | 亚洲成a人网站在线看| 国产极品大秀在线性色| 特黄aaaaaaaaa毛片免费视频| 国产午夜福利短视频| 国产精品亚洲综合色区丝瓜| av中国av一区二区三区av| 极品少妇一区二区三区四区| 操出白浆在线观看| 亚洲香蕉久久一区二区| 亚洲av色影在线| 亚洲av无码乱码国产精品fc2 | 国产av精品一区二区三区视频| 亚洲熟妇无码久久精品| 人人妻人人爽人人做夜欢视频九色| 欧美在线Aⅴ性色| 99久久99久久久精品蜜桃| 污污内射在线观看一区二区少妇| 亚洲精品6久久久久中文字幕| 日本一区二区三区精品免费|