亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于聽覺模型的說話人語音特征提取*

        2012-08-08 02:31:52何朝霞
        關(guān)鍵詞:基底膜特征參數(shù)識別率

        何朝霞,潘 平

        (貴州大學(xué) 計算機科學(xué)與信息學(xué)院,貴州 貴陽 550025)

        聲音的感受細(xì)胞在內(nèi)耳的耳蝸部分,而基底膜是耳蝸接收聲音最重要的組織。聲波在外耳腔引起空氣振動,從而引起行波沿基底膜的傳播[1]?;啄?nèi)有許多平行走向的膠原樣纖維,稱為聽弦。聽弦長短不同,靠近蝸底較窄,靠近蝸頂較寬?;啄ぜs有24 000條聽弦,能夠?qū)Σ煌l率的聲音產(chǎn)生共鳴,分別反映不同頻率的聲音[2]。不同頻率的聲音產(chǎn)生不同的行波,其峰值出現(xiàn)在基底膜的不同位置上,研究發(fā)現(xiàn),不同的聲音頻率沿著基底膜的分布是對數(shù)型的[3]。

        早在1992年,PATTERSON R就提出了耳蝸模型,該模型是基于一系列帶通濾波器——Gammatone濾波器組[4]實現(xiàn)的,該濾波器組能夠很好地模擬基底膜的分頻特性。本文提出了一種基于Gammatone濾波器組的特征提取方法,該方法能夠很好地提取說話人語音信號的特征,并且具有很高的識別率。

        1 Gammatone濾波器

        Gammatone濾波器的時域表達形式[5]為:

        其中,a為濾波器增益,f為中心頻率,φ為相位,n為濾波器階數(shù)。各種研究表明,n=4時,Gammatone濾波器就有很好的模擬特性。ERB(f)為Gammatone濾波器的等效矩形帶寬[6],它與中心頻率 f的關(guān)系[7]為:

        式(2)還可以寫成如下形式:

        其中,EarQ=9.264 49,min BW=24.7,order=1。

        由于在實際應(yīng)用中,增益a和初始相位φ不會影響濾波器的性能,因此可以忽略,所以只要確定Gammatone濾波器的中心頻率,其性能也就確定了。中心頻率f的計算公式[8]為:

        其中,fH為濾波器的截止頻率,v為濾波器的重疊因子。

        Gammatone濾波器的時域表達式為沖擊響應(yīng)函數(shù),將其進行傅里葉變換就可以得到其頻率響應(yīng)特性。不同中心頻率的Gammatone濾波器的幅頻響應(yīng)曲線如圖1所示。

        取n=4,將式(1)進行拉普拉斯變換得到:

        其中,b=2πERB(f),ω=2πf。

        將 G(s)轉(zhuǎn)換為 z變換 G(z),再反變換得到:

        將語音信號與g(n)卷積就可以得到濾波器的輸出。

        2 特征提取過程

        從上述Gammatone濾波器的介紹,仿照MFCC參數(shù)提取過程,考慮將Gammatone濾波器組運用到說話人識別中參數(shù)的提取過程,這樣就更加符合人耳的聽覺特性。該提取過程如圖2所示,具體步驟如下。

        圖2 基于Gammatone濾波器組的參數(shù)提取流程

        (1)為了提升高頻部分,使信號的頻譜變得平坦,將語音信號經(jīng)過預(yù)加重數(shù)字濾波器H(z)=1-0.937 5z-1。

        (2)將預(yù)加重后的信號進行分幀,幀長256點,幀移100點,加漢明窗;再經(jīng)過離散傅里葉變換(DFT)得到頻譜特性,求出頻譜平方,即能量譜。

        (3)設(shè)計 Gammatone濾波器組。Gammatone濾波器組的中心頻率在50 Hz~3 000 Hz之間。這里采用的是4階Gammatone濾波器,其通道數(shù)N和帶寬可以調(diào)節(jié),根據(jù)式(3),取0

        (4)經(jīng)過Gammatone濾波器組后得到相應(yīng)頻帶的能量,再進行對數(shù)運算和反離散余弦IDCT變換,就可以得到靜態(tài)特征參數(shù)了。

        3 仿真實驗

        仿真實驗的語料庫來源于貴州省公安廳提供的語料及學(xué)校部分學(xué)生隨機利用MP4所得的錄音,語料時間各不相同。采用高斯混合模型(GMM)進行與文本相關(guān)的說話人確認(rèn)實驗。

        圖4為 48通道 Gammatone濾波器組(order=1時)的幅頻曲線。

        圖5為某一說話人語音的波形及其經(jīng)過特征提取系統(tǒng)(系統(tǒng)中Gammatone濾波器組為48通道)所得到的GFCC系數(shù)輸出曲線。

        從圖 5(b)可以可以看出,該系數(shù)含有豐富的內(nèi)容,對識別率的提高有很大的幫助。下面將該特征運用到GMM識別系統(tǒng)中,具體結(jié)果如下。

        首先是不同時間長度的語音信號,時間長度分別為5 s、20 s、50 s,將其在 64 通道 Gammatone 濾波器組所得到的靜態(tài)特征參數(shù)(簡稱GFCC)與 MFCC(Mel濾波器組維數(shù)為24)靜態(tài)參數(shù)在識別系統(tǒng)中進行了識別率的對比,其結(jié)果如圖6所示。

        從圖6可以看出,64通道的GFCC靜態(tài)特征參數(shù)比MFCC靜態(tài)特征具有更好的識別率。

        同時,將不同order值、不同濾波器組通道數(shù)所得的GFCC參數(shù)在識別系統(tǒng)中進行了識別率比較,如圖7所示。其中,order值分別為 0.1、0.5、1,濾波器組通道數(shù)分別為48、64、128。從圖 7可以看出,濾波器組通道數(shù)越高,識別率越高;order值越小,識別率越高。

        本文介紹了基于人耳聽覺特性的Gammatone濾波器組的特征提取方法,并通過實驗驗證了該特征在濾波器通道數(shù)較多或ERB(f)較小時具有較高的識別率。但是同時也得出只有在濾波器組通道數(shù)較高時才有較高的識別率,增加了數(shù)據(jù)的復(fù)雜度。在以后的研究中需要考慮通過降低濾波器組的通道數(shù)提高識別率的方法。

        [1]JOHANNESMA P I M.The pre-response stimulus ensemble of neurons in the cochlear nucleus[C].Proceedings of the Symposium on Hearing Theory, 1972:58-69.

        [2]COOKE M P.Modeling auditory proeessing and organization[M].Cambridge,U.K: Cambridge University Press,1993.

        [3]韓紀(jì)慶,張磊,鄭浩然.語音信號處理[M].北京:清華大學(xué)出版社,2008.

        [4]SLANEY M.An efficient implementation of the pattersonholdswort auditory filter bank.Apple ComPuter Teehnieal RePort#35 Pereeption GrouP-Advaneed Technology GrouP[R].ComPuter, Inc:Apple, 1993.

        [5]Shao Yang,Wang Deliang.Robust speaker identification using auditory features and computational auditory scene analysis[C].IEEE International Conference on Acoustics,Speech, and Signal Processing,2008,5:1589.

        [6]SRINIVASAN S, Wang Deliang.Transforming Binary uncertainties for robust speech recognition [C].IEEE Transactions on Audio, Speech and Language Processing,2007,15(7):2130-2140.

        [7]Wang Deliang,BROWN G J.Computational auditory scene analysis: principles, algorithms, and applications[M].Hoboken, NJ: Wiley-IEEE Press, 2006.

        [8]王男,錢志鴻,王雪,等.基于伽馬通濾波器組的聽覺特征提取算法研究[J].電子學(xué)報,2010,38(3).

        猜你喜歡
        基底膜特征參數(shù)識別率
        新生小鼠耳蝸基底膜的取材培養(yǎng)技術(shù)*
        故障診斷中信號特征參數(shù)擇取方法
        基于特征參數(shù)化的木工CAD/CAM系統(tǒng)
        基于類圖像處理與向量化的大數(shù)據(jù)腳本攻擊智能檢測
        計算機工程(2020年3期)2020-03-19 12:24:50
        基于真耳分析的助聽器配戴者言語可懂度指數(shù)與言語識別率的關(guān)系
        提升高速公路MTC二次抓拍車牌識別率方案研究
        豚鼠耳蝸基底膜響應(yīng)特性的實驗測試與分析
        振動與沖擊(2018年4期)2018-03-05 00:34:24
        基于PSO-VMD的齒輪特征參數(shù)提取方法研究
        Fibulin-2在診斷乳腺基底膜連續(xù)性的準(zhǔn)確性研究
        高速公路機電日常維護中車牌識別率分析系統(tǒng)的應(yīng)用
        精品视频在线观看日韩| 欧美专区在线| 久久久国产不卡一区二区| 国产白浆大屁股精品视频拍| 色综合久久中文字幕综合网| 特级a欧美做爰片第一次| 久久aⅴ无码一区二区三区| 蜜桃av噜噜一区二区三区香| 日韩av天堂一区二区| 又粗又黄又猛又爽大片免费| 国内揄拍国内精品| 久久高潮少妇视频免费| 漂亮人妻被强了中文字幕| 免费a级毛片无码av| 欧美激情区| 亚洲一区二区三区av色婷婷| 欲女在线一区二区三区| 在线人成免费视频69国产| 亚洲偷自拍另类图片二区| 少妇性l交大片免费1一少| 女人张开腿让男人桶爽| 日韩a无v码在线播放| 69国产成人综合久久精| 91久久香蕉国产熟女线看| 久久www免费人成精品| 真正免费一级毛片在线播放| 亚洲一区二区不卡日韩| 国产成人精品一区二区20p| 亚洲综合无码无在线观看| 国产国拍亚洲精品午夜不卡17| 国产主播一区二区三区在线观看| 丰满人妻被两个按摩师| 日本亚洲国产一区二区三区| 久久久精品国产亚洲麻色欲| 亚洲精品一区三区三区在线| 久久综合狠狠色综合伊人| 91福利视频免费| 日本一二三区在线视频观看 | 在线 | 一区二区三区四区| 久久精品国产亚洲AⅤ无码| 最新国产精品国产三级国产av|