亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Matlab的英語語音自動評價方法研究

        2014-12-11 13:28:06孫藝璇
        江蘇科技信息 2014年23期
        關鍵詞:男聲語音能量

        孫藝璇

        (南京郵電大學,江蘇 南京 210046)

        0 引言

        語音識別技術自1952 年起至今經歷了幾十年的發(fā)展歷史,從識別10 個英文單詞開始到現在能夠建立一個完整的語音識別系統。近年來人們的研究思路和研究框架也在不斷發(fā)生變化,從模式匹配轉到統計模型,識別的成功率也在不斷的提高,對于非特定人的孤立詞和小詞匯量的識別成功率現已達到98%。雖然現今語音識別技術還不能完全模擬出人的發(fā)聲系統,還需要隨著不同的語音識別系統改變發(fā)音方式,但是人類在未來一定會建立一個非常完善的語音識別系統。

        1 現有語音識別方法存在的缺陷

        語音特征提取是語音識別的第一步,目前語音特征提取的方法一般有線性預測編碼系數LPC 參數,Mel 頻域倒譜系數MFCC 及小波變換系數分析法等。雖然它們有很多優(yōu)點,但也存在一些不足之處。例如,對輔音描述能力較差,在有噪環(huán)境下以及頻譜失真環(huán)境下的表現糟糕,多次用到FFT 導致算法復雜度提高等。

        2 對語音特征的提取

        下面給出“help the local economy”標準英音的語音信號,運用15 個語音特征分別進行分析。

        2.1 預處理

        預處理也被稱為前段處理,是在語言信號被讀取之后首先進行的步驟,放在語音特征的提取之前,能夠放大語音信號中的有效成分,提高語音識別的精確程度。預處理主要包括預加重,加窗分幀3 個部分。

        2.2 預加重

        預加重能夠去除口腔等人體部分對于語音高頻部分的壓制和削弱作用,通過對語音信號施加一個高通濾波器,文章分別嘗試了IIR 以及FIR 濾波器,用以抵消口腔對于語音高音部分的壓制。公式為:

        文章嘗試對對語音信號作用IIR 以及FIR 濾波器來實現語音信號的預加重。

        2.3 分幀

        因為語音數據內容過大,將語音所有的采樣點作為輸入是不合適的,這樣不僅計算量大,無法體現語音過程短時變化特點,而且只有等到整段語音接收結束后才能開始對語音進行識別,不能實時流處理。所以分幀技術的應用是必要的,將語音信號分割成較小的等長的語音片段,并近似認為語音內部音頻信息穩(wěn)定。通過分幀,既能保有語音的局部特征,還能夠找到幀與幀之間的聯系。計算機的采樣頻率為44100Hz,實驗中選取語音幀長為32ms,幀移為16ms。在Matlab 中用y=enframe(x,framelength,step)進行分幀,每幀長framelength,分得的幀數是nf=fix((nx-framelength+step)/step);其中nx 是x 的長度。y 是framelength×nf 或nf×framelength 的數組,取決于x 是列數據還是行數據。

        2.4 加窗

        在信號處理中,加窗處理是不可避免的,因為我們難以對無限長的序列進行測量和運算,因此原始信號需要被采樣時間截斷,實現信號長度的有限化。然后用截斷后的信號進行周期延拓,形成一個虛擬的無限長信號,再進行相關分析。但是這些被截斷的信號會發(fā)生頻譜畸變,即頻譜能量泄露。為了減少這種頻譜能量的泄露,我們就需要采用不同的截取函數來對信號進行截斷,這些截斷函數,就被我們稱為窗函數。常用的窗函數有矩形窗,三角窗,漢寧窗,指數窗等。在文章中主要選擇了2種有代表性窗函數對信號進行處理,能夠精確讀出主瓣寬度,主瓣寬度窄且利于分辨的矩形窗和分析窄帶信號,旁瓣幅度較小的漢寧窗。

        2.5 短時譜

        短時譜在語音信號增強方面有著廣泛的應用,方法簡單,使用信噪比范圍較大,并且適用于實時處理。

        2.6 加矩形窗的倒譜與復倒譜

        很多時候,在知道信號之后,我們需要反過來求解聲門信號或者聲道沖擊響應。這就需要在知道卷積的情況下,利用“解卷”來求得參與卷積的各個信號。同態(tài)處理就是一種常用的解卷方法,語音信號在進行同態(tài)分析后得到語音信號的倒譜參數。卷積同態(tài)處理的基本思路就是運用Z 變換將卷積變?yōu)槌朔e,在取對數運算過后,由乘積變?yōu)榧臃ㄟ\算。表達如下:

        而復倒譜就是由信號的Z 變換取對數運算之后的逆Z 變換,表達如下:

        在文章中運用了矩形窗和漢明窗求取信號的倒譜域復倒譜。

        2.7 短時能量

        短時能量:語音信號的能量隨時間變化,清音與濁音之間的能量變化十分明顯。因此對語音的短時能量進行分析,同時可以描述語音的短時變化特征。定義短時能量為:

        2.8 過零率

        過零率:過零率可以粗略估計語音信號的頻譜特性。當離散時間相鄰兩個樣點的正負號相異時,被稱之為“過零”。統計單位時間內樣點值改變符號的次數即可以得到平均過零率。定義短時平均過零率:

        2.9 短時平均幅度

        短時能量因為計算時用的是信號的平方,所以它對信號高電平十分敏感。因此,采用另外一個度量語音幅度變化值得函數,它與短時平均能量的 區(qū)別在于在取樣時,小取樣值與大取樣值不會因為平方而造成較大差異。短時平均幅度函數:

        2.10 語音端點

        所謂的語音端點檢測就是想找出語音的起始點與終止點,能夠減少計算量以及提高語音識別的精確度。同時在一定程度上,能夠避免噪音干擾。文章采用雙門限的方法來進行語音端點檢測,其重點是綜合利用語音的短時能量以及短時過零率兩個特征。先利用語音短時能量來制定一個較高的門限。然后用噪音的能量在制定一個較低的門限,這就完成了初級的語音端點的檢測。然后開始再一輪的語音端點檢測,由于語音很有可能由能量很弱的清音開始,所以需要運用過零率來設置一個新的較低的門檻。這就基本完成了語音的端點檢測。

        將語音端點的位置表示出來,即:

        2.11 短時自相關

        自相關函數用來測量語音信號自身時間波形的相似性。由于清濁音發(fā)音機制的不同,因此在波形上存在這較大的差異。濁音在波形上存在著一定的周期性,波形之間相似性較好,而清音在時間波形上則存在隨機噪音的特性,樣點間的相似性較差。自相關函數表示為:

        2.12 持續(xù)時間

        發(fā)音持續(xù)時間的長短主要決定了聲音的長短,也成為音長。

        實驗結果:T=1.1916

        2.13 語譜圖

        語譜圖反應了語音信號的動態(tài)頻率特性。水平方向是時間軸,豎直方向是頻率軸,圖上的變化的紋路代表了不同時刻的語音短時譜。語譜圖由于其不同的灰度,形成不同的紋路,被稱為“聲紋”。

        2.14 基音周期

        聲音是由發(fā)音體經過一系列震動產生的,在這個過程中,頻率和振幅各不相同。在這些振動中,由頻率最低的振動發(fā)出的音就成為基音,它決定著音高。

        人在發(fā)出濁音時,產生一股準周期脈沖氣流,刺激聲道后就產生濁音,又稱有聲語言,它攜帶著語音中的大部分能量,這種聲帶振動的頻率成稱為基頻,相應的周期就被稱為基音周期。它由聲帶逐漸開啟到面積最大,逐漸關閉至完全閉合,完全閉合3 部分組成。文章采用自相關法來進行語音的基音周期檢測。

        2.15 共振峰

        共振峰是指在聲音的頻譜上,能量相對集中的一些區(qū)域。文章采用線性預測的方法來求得語音信號的共振峰。

        在以上提取的15 個語音特征中,每個語音特征的數據表均可表示為一個行矩陣,這也是文章采用的語音識別方法所需要用到的。

        詳細來說,如果將一段語音的上文提到的所有語音特征都計算出來,每一個語音特征都能夠用一個行矩陣來表示。在間隔一定距離對語音特征的行矩陣進行數據提取,同時保證提取到的15 個甚至21 個行向量的容量相同。從上文中的21 個數據表中提取數據或者根據15 個語音特征結果提取數據。數據不足則用0 元素補足。提取一定數量m 的數據組成的新的行矩陣,一定程度上就能夠充分代表這段語音的數據。然后將這15 個或21 個特征行向量組成15*m 或21*m 的矩陣。最后在進行語音比對時,我們可以直接將不同語音得到的矩陣直接進行對比。

        文章直接采用15 個語音特征的結果來提取標準男聲英音信號的數據并構成語音特征15*1000 的矩陣,忽略得到語音特征的中間過程。例如,在獲取預加重過程中對語音信號進行的IIR 及FIR 濾波器處理的高通濾波。為了方便顯示,截取標準男聲英音信號15*1000 特征矩陣的一部分與母語為漢語的女聲英音信號15*1000 特征矩陣的一部分進行對比。下一步是需要厘清標準男聲英音信號15×1000 特征矩陣部分及母語為漢語的女聲英音信號15*1000 特征矩陣的一部分,如表1、表2 所示。

        表1 標準男聲英音信號15×1000 特征矩陣部分

        表2 母語為漢語的女聲英音信號15*1000 特征矩陣的一部分

        經過實驗,將男聲英音標準語音信號與內容相同但母語為漢語的女聲英音信號進行對比,首先對這樣的兩個語音信號進行特征提取,在經過矩陣的數據對比之后,得到語音內容的相似度為0.96 的結果。下一步是需要厘清男聲英音標準語音信號和母語為漢語的女聲英音信號,如圖1、圖2 所示。

        文章采用的矩陣對比的方法是Matlab 中自帶的求矩陣相似度的corr2 函數,返回值范圍在[-1,1]之間,完全相關的兩個矩陣返回值為1 或-1,完全不相關的兩個矩陣的返回值為0,矩陣相似度越高返回值越接近1。

        文章僅對標準男聲英音信號與內容相同,均為“help the local economy”,但母語為漢語的女聲英音信號進行對比,得到語音識別結果為大概0.96 的相似度。由此能夠初步判斷2 段語音內容基本相同。這種方法的可行性以及準確度還需要大量的實驗來進行驗證。這種語音識別技術成熟之后,可以用于英語學習的人群,提供給他們一種糾正英語發(fā)音的方式,面對數據可以直觀的看到發(fā)音需要改進的地方。

        圖1 男聲英音標準語音信號

        圖2 母語為漢語的女聲英音信號

        3 結論

        語音特征矩陣法分析語音信號基本克服了其他幾種語音分析方法的不足,因為有足夠多的語音特征,即使有些語音不適用于某幾種語音特征的提取,還有足夠多的其他語音特征可以用于語音之間的相互比對。同時,因為不同語音特征波形圖的差別,即使適當縮小每一個語音特征所提取的數據行向量的容量,也能夠相對充分的表示一段語音信號,可以在數據庫中輕易找到與實驗語音相匹配的內容。因此,這種方法復雜度較低,識別效果較好。但矩陣法分析語音信號的不足之處在于還需要更完善的矩陣對比方法,很有可能會由于矩陣對比方法的不足導致語音信號識別的準確度降低。而且一旦需要更細致的對發(fā)音相似的語音信號進行識別,就需要注意對語音特征行矩陣的數據提取的足夠多來保證語音信號的準確性,這樣無疑會增加方法的計算量。

        [1]王彪.基于Matlab 的語音識別系統研究[J].計算機與數字工程,2011(12).

        [2]陰艷麗.基于MATLAB 語音信號處理的研究[J].中國新技術新成品,2012(12).

        [3]奉小慧.音頻噪聲環(huán)境下唇動信息在語音識別中的應用技術研究[D].廣州:華南理工大學,2010.

        猜你喜歡
        男聲語音能量
        豐碑(男聲獨唱)
        心聲歌刊(2020年1期)2020-04-21 09:25:02
        能量之源
        魔力語音
        基于MATLAB的語音信號處理
        電子制作(2019年14期)2019-08-20 05:43:38
        夢中的騎手(男聲獨唱)
        心聲歌刊(2019年3期)2019-06-06 02:52:32
        基于MQ3與MP3的價廉物美的酒駕語音提醒器
        電子制作(2019年9期)2019-05-30 09:42:10
        中 年 人
        對方正在輸入……
        小說界(2018年5期)2018-11-26 12:43:42
        詩無邪傳遞正能量
        中華詩詞(2017年4期)2017-11-10 02:18:29
        初中男聲合唱教學的探索
        国产亚洲3p一区二区| 成人久久久久久久久久久| 黄色a级国产免费大片| 久久中文精品无码中文字幕| 欧美三级不卡视频| 激情综合五月天开心久久| 亚洲av乱码国产精品观看麻豆| 热门精品一区二区三区| 国产丝袜美腿在线视频| 极品人妻少妇av免费久久| 国产成人精品久久亚洲高清不卡| 国产成人精品一区二区三区| 漂亮人妻被中出中文字幕久久| 中文亚洲欧美日韩无线码| 亚洲av色无码乱码在线观看 | 男女男在线精品网站免费观看| 国产一区视频在线免费观看| 国产精品深夜福利免费观看| 日本五十路熟女在线视频| 尤物蜜桃视频一区二区三区 | 国产特级毛片aaaaaa高清| 二区三区视频| 亚洲av一二三又爽又爽又色| 亚洲最大av在线精品国产| 欧美又大粗又爽又黄大片视频| 99999久久久久久亚洲| 国产美女自慰在线观看| 麻豆第一区MV免费观看网站| 国产精品女同久久免费观看 | 91色综合久久熟女系列| 制服丝袜一区二区三区| 色妞色视频一区二区三区四区| 99久久精品费精品国产一区二区 | 国产精彩视频| 少妇高潮精品正在线播放| 精品国产一区二区三区三| 北条麻妃国产九九九精品视频| 海角国精产品一区一区三区糖心| а中文在线天堂| 免费的黄网站精品久久| 91国产精品自拍在线观看|