亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于FPGA的語(yǔ)音特征參數(shù)提取模塊的設(shè)計(jì)

        2019-07-23 07:20:54馬智愚
        通信電源技術(shù) 2019年6期
        關(guān)鍵詞:特征參數(shù)頻域濾波器

        馬智愚

        (福州大學(xué) 物理與信息工程學(xué)院,福建 福州 350116)

        0 引 言

        隨著人工智能和物聯(lián)網(wǎng)技術(shù)的興起,語(yǔ)音識(shí)別技術(shù)的應(yīng)用范圍越來(lái)越廣。語(yǔ)音識(shí)別技術(shù)可用語(yǔ)音取代手工來(lái)執(zhí)行命令,甚至可聽懂并預(yù)測(cè)人們的講話,加以處理后可完成特定動(dòng)作[1]。隨著手機(jī)語(yǔ)音助手和智能音箱等移動(dòng)終端的普及,語(yǔ)音識(shí)別系統(tǒng)對(duì)性能和功耗的要求越來(lái)越高。

        特征參數(shù)提取是語(yǔ)音識(shí)別的關(guān)鍵問題。目前,語(yǔ)音識(shí)別系統(tǒng)中比較常用的是Mel頻率倒譜系數(shù)(MFCC)、線性預(yù)測(cè)倒譜系數(shù)(LPCC)及線性倒譜對(duì)(LSP)等。相較于其他參數(shù),MFCC特征參數(shù)充分考慮人耳聽覺結(jié)構(gòu)、人類發(fā)聲的機(jī)理特性及人耳的聽覺感知情況,已成為語(yǔ)音識(shí)別任務(wù)中應(yīng)用最廣泛、最成功的特征參數(shù)[2]。

        MFCC特征參數(shù)提取的計(jì)算量大且計(jì)算復(fù)雜。目前許多提取方法都是基于軟件或DSP核心平臺(tái),但是嵌入式系統(tǒng)對(duì)硬件環(huán)境和實(shí)時(shí)性要求更高,普通處理器已不能滿足速度和精度的需要。FPGA在數(shù)字處理領(lǐng)域具有較高性能且設(shè)計(jì)靈活,本文以FPGA為平臺(tái)設(shè)計(jì)語(yǔ)音MFCC特征提取的全硬件結(jié)構(gòu),滿足了嵌入式系統(tǒng)的應(yīng)用要求[3]。

        1 MFCC特征參數(shù)提取算法

        MFCC特征參數(shù)是由Davies和Mermelstein提出的,Mel頻率倒譜系數(shù)依據(jù)人耳聽覺系統(tǒng)的生理特性描述,考慮到了人耳聽覺系統(tǒng)的非線性特性,不同于物理學(xué)對(duì)頻率的描述[4]。通常,頻率f與Mel頻率的轉(zhuǎn)換公式為:

        其中,f為實(shí)際頻率,單位為Hz;fMel為Mel頻率,單位為Hz。Mel特征參數(shù)提取的流程框圖如圖1所示。

        圖1 MFCC特征參數(shù)提取流程框圖

        具體提取步驟包括預(yù)處理、FFT運(yùn)算、計(jì)算Mel濾波能量及計(jì)算離散余弦變換。

        1.1 預(yù)處理

        預(yù)處理主要包含預(yù)加重、分幀及加窗。預(yù)加重的目的是補(bǔ)償高頻分量的損失,凸顯共振峰。預(yù)加重濾波器可設(shè)為:

        其中,α是預(yù)加重系數(shù),通常取0.9~1。

        分幀是將N個(gè)語(yǔ)音采樣點(diǎn)集合成一個(gè)觀測(cè)單位。因?yàn)檎Z(yǔ)音信號(hào)具有短時(shí)平穩(wěn)的特性,所以將語(yǔ)音信號(hào)分成較短的幀,每幀信號(hào)可看作穩(wěn)定的語(yǔ)音信號(hào)。為使各個(gè)相鄰幀之間的參數(shù)能夠平穩(wěn)過(guò)渡,在相鄰兩幀之間會(huì)有重疊部分,包含M個(gè)取樣點(diǎn)。N為幀長(zhǎng),M為幀移,為方便后續(xù)的FFT運(yùn)算,N通常取256或512,M通常取128。

        加窗是將每一幀代入窗函數(shù),目的是平滑語(yǔ)音幀,消除各個(gè)幀兩端可能造成的信號(hào)不連續(xù)性。因?yàn)镈FT運(yùn)算和FFT運(yùn)算需要周期性延拓,所以時(shí)域中的突變點(diǎn)會(huì)對(duì)頻譜造成明顯影響,如頻譜泄露。常用的窗函數(shù)有方窗、漢明窗及漢寧窗等,根據(jù)窗函數(shù)的頻域特性,常采用漢明窗。漢明窗的公式為:

        1.2 FFT運(yùn)算

        語(yǔ)音信號(hào)在時(shí)域上的變換無(wú)法看出信號(hào)特性,所以將它轉(zhuǎn)化為頻域的能量分布來(lái)觀察。頻譜公式為:

        其中,i為當(dāng)前幀數(shù);Si(n)為一幀內(nèi)加窗后的語(yǔ)音信號(hào);N為幀長(zhǎng),N=256;k為諧波次數(shù)。

        功率譜公式為:

        1.3 計(jì)算Mel濾波能量

        Mel濾波是利用同人耳聽覺相似的三角濾波器組對(duì)語(yǔ)音信號(hào)的幅度平方譜進(jìn)行平滑[5]。每個(gè)濾波器的傳遞函數(shù)為:

        其中,k為當(dāng)前頻率;m為第m個(gè)濾波器;f(m)為第m個(gè)濾波器的中心頻率。

        計(jì)算在每個(gè)Mel濾波器中的對(duì)數(shù)能量。相當(dāng)于把每幀的能量譜E(i,k)與Mel濾波器的頻域Hm(k)相乘并相加,公式為:

        其中,i為第i幀語(yǔ)音信號(hào),m為第m個(gè)Mel濾波器(共有M個(gè)),M通常取22~26。

        1.4 計(jì)算離散余弦變換

        把Mel濾波器的能量取對(duì)數(shù)后進(jìn)行DCT變換,得到MFCC參數(shù)[6]。公式為:

        其中,L指MFCC系數(shù)階數(shù),通常取12~16。

        2 FPGA設(shè)計(jì)

        2.1 整體設(shè)計(jì)

        圖2為總體結(jié)構(gòu)圖,由蜂鳥e203 MCU作為主機(jī),MFCC特征參數(shù)提取模塊作為從機(jī),兩者通過(guò)蜂鳥e203的ICB自定義總線相連接。

        圖2 總體結(jié)構(gòu)圖

        2.2 特征參數(shù)提取模塊設(shè)計(jì)

        MFCC特征參數(shù)模塊的內(nèi)部結(jié)構(gòu)如圖3所示。其中,輸入的語(yǔ)音信號(hào)采樣頻率是8 kHz,采樣精度是16 bit帶符號(hào)數(shù)。運(yùn)算中的中間數(shù)據(jù)都采用16 bit的定點(diǎn)數(shù)據(jù)表示。所有小數(shù)部分的運(yùn)算都采用定點(diǎn)數(shù)移位的方法實(shí)現(xiàn)。

        預(yù)加重模塊將式(1)簡(jiǎn)化為:

        圖3 特征參數(shù)提取模塊內(nèi)部結(jié)構(gòu)圖

        此簡(jiǎn)化方法避免了乘法運(yùn)算,通過(guò)加法器和移位寄存器實(shí)現(xiàn)。

        分幀采用FIFO實(shí)現(xiàn),設(shè)定每一幀語(yǔ)音長(zhǎng)度為256個(gè)采樣點(diǎn),幀移為128個(gè)采樣點(diǎn)。加窗運(yùn)算常采用查表法和Cordic算法,查表法運(yùn)算速度快,但精度稍差;Cordic算法精度高,但運(yùn)算周期較長(zhǎng)??紤]語(yǔ)音信號(hào)需要實(shí)時(shí)處理,采用查表法。在Matlab中算出窗函數(shù)的表單元,然后和分幀后的信號(hào)進(jìn)行乘法運(yùn)算[7]。

        FFT變換調(diào)用了Quartus中的FFT IP核,參數(shù)配置信息如圖4所示。其中,F(xiàn)FT的點(diǎn)數(shù)為一幀的長(zhǎng)度即256,輸入/輸出數(shù)據(jù)都是16位數(shù)據(jù)。

        通過(guò)Mel濾波器組的能量通過(guò)查找表的方法實(shí)現(xiàn)。Mel濾波器組是由M個(gè)三角濾波器疊加而成的,濾波器個(gè)數(shù)M取24,先在Matlab中算出每組濾波器的中心頻率點(diǎn)、上限頻率點(diǎn)及下限頻率點(diǎn),將每組數(shù)據(jù)存入rom中,通過(guò)計(jì)數(shù)器來(lái)控制頻域信號(hào)與Mel濾波器運(yùn)算。

        離散余弦變換是將Mel頻譜變換到時(shí)域,獲得最終的MFCC特征參數(shù)。對(duì)數(shù)運(yùn)算采用查找表的方法實(shí)現(xiàn),然后通過(guò)計(jì)數(shù)器實(shí)現(xiàn)乘累加和。

        最后輸出數(shù)據(jù)由控制單元通過(guò)ICB總線連接到MCU。

        圖4 FFT配置信息

        3 結(jié) 論

        本文在DE2-115 FPGA平臺(tái)上,以蜂鳥e203 MCU作為主機(jī),設(shè)計(jì)了一個(gè)MFCC特征參數(shù)提取模塊。相較于軟件實(shí)現(xiàn)方法,利用IP核和查找表方法的信號(hào)處理運(yùn)算速度大幅提高。處理結(jié)果與Matlab中計(jì)算結(jié)果的誤差在1%以內(nèi),基本可滿足系統(tǒng)實(shí)時(shí)處理要求。

        猜你喜歡
        特征參數(shù)頻域濾波器
        基于無(wú)擾濾波器和AED-ADT的無(wú)擾切換控制
        故障診斷中信號(hào)特征參數(shù)擇取方法
        基于特征參數(shù)化的木工CAD/CAM系統(tǒng)
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        開關(guān)電源EMI濾波器的應(yīng)用方法探討
        電子制作(2018年16期)2018-09-26 03:26:50
        頻域稀疏毫米波人體安檢成像處理和快速成像稀疏陣列設(shè)計(jì)
        基于PSO-VMD的齒輪特征參數(shù)提取方法研究
        基于TMS320C6678的SAR方位向預(yù)濾波器的并行實(shí)現(xiàn)
        基于改進(jìn)Radon-Wigner變換的目標(biāo)和拖曳式誘餌頻域分離
        一種基于頻域的QPSK窄帶干擾抑制算法
        国产精品久久久久久久久鸭| 丰满人妻中文字幕一区三区| 在线观看人成视频免费| 女人扒开屁股爽桶30分钟| 国产一区a| 男女发生关系视频网站| 国产精品毛片久久久久久l| 亚洲人妻有码中文字幕| 亚洲av迷人一区二区三区| 亚洲熟妇自偷自拍另欧美| 欧美喷潮久久久xxxxx| 亚洲人成无码网站十八禁| 亚洲中文字幕乱码一二三| 台湾佬中文网站| 看国产黄大片在线观看| 99精品久久久中文字幕 | 性久久久久久| 欧美丰满熟妇乱xxxxx图片| 成人免费无码视频在线网站| av天堂吧手机版在线观看| 久久精品一区二区三区蜜桃| 中文字幕日韩人妻不卡一区| 亚洲男人天堂网站| 日日噜噜夜夜久久密挑| 狠狠综合久久av一区二区蜜桃 | 国产亚洲婷婷香蕉久久精品| 国产成人自拍视频在线免费| 国产亚洲精品久久情侣| 亚洲av无码精品蜜桃| 亚洲毛片在线播放| 亚洲国产线茬精品成av| 欧美v国产v亚洲v日韩九九| 国产极品美女高潮抽搐免费网站| 黄色大片一区二区中文字幕| 日韩女同在线免费观看| 亚洲精品成人无码中文毛片| 国产女精品| 国产av精品一区二区三区视频| 日本污ww视频网站| 极品美女扒开粉嫩小泬| 国产一区二区三区四区色|