亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于連續(xù)隱馬爾科夫的語音識別模型

        2013-04-29 00:44:03梁浩楊光宇
        無線互聯(lián)科技 2013年6期

        梁浩 楊光宇

        摘 要:本文針對問題一建立了基于連續(xù)隱馬爾科夫模型的語音識別系統(tǒng)的模型。該語音識別系統(tǒng)包括預處理,特征提取以及聲學模型三個部分。問題二要求以一個實際的例子則對問題一中建立的模型進行驗證。我們選擇了“話費查詢”這個功能進行測試。待測語音信號依次經(jīng)過預處理、特征提取、訓練與識別。

        關鍵詞:語音識別;隱馬爾科夫模型;預處理特

        1 模型的建立與驗證

        本文我們所建立的語音識別門模型包括語音信號預處理模塊、特征提取模塊及模式庫訓練和待測語音識別模塊。

        1.1 預處理

        預處理主要包括預加重,加窗分幀處理,端點檢測和降噪處理四個過程。

        1.1.1 預加重模型

        預加重的中心思想是利用信號特性和噪聲特性的差別來有效地對信號進行處理。即在噪聲引入之前采用適當?shù)木W(wǎng)絡,人為地加重發(fā)射機輸入調(diào)制信號的高頻分量。

        1.1.2 加窗分幀處理模型

        本文中選擇Hamming窗進行加窗分幀處理,Hamming窗函數(shù)如下:

        1.1.3 端點檢測模型

        本文使用雙門限端點檢測對語音信號進行端點處理。

        1.1.4 降噪處理模型

        FIR濾波器的基本結構可以理解為一個分節(jié)的延時線,把每一節(jié)的輸出加權累加,可得到濾波器的輸出,F(xiàn)IR濾波器的沖激響應h(n)是有限長的,數(shù)學上M階FIR濾波器可以表示為:

        1.2 特征提取模型

        特征提取就是從語音信號中提取具有代表性的、合適的特征參數(shù)。爾頻率倒譜系數(shù)(MFCC)能更加充分的利用人耳的聽覺特性,因此本文中我們提取的特征參數(shù)是MFCC。

        P個MFCC系數(shù)公式為:

        1.3 訓練與識別模型——連續(xù)隱馬爾科夫模型

        模式匹配是通過計算待識別語音與已知語音庫中語音的相似度對語音進行識別,是多維模式識別系統(tǒng)中最常用的一種方法。模式匹配分為訓練和識別兩個階段。

        常用的模式匹配方法有動態(tài)時間規(guī)整算法以及隱馬爾科夫模型等。本文選用連續(xù)隱馬爾科夫模型對語音信號進行識別和訓練。

        1.3.1 模型建立

        HMM模型可以記為:λ=(π,A,B)。A為狀態(tài)轉移矩陣為:B為觀察值概率密度矩陣,πi為各狀態(tài)其實概率分布。

        1.3.2 模型求解

        HMM在語音識別中需要解決估值、解碼和訓練三個基本問題。

        ⑴估值問題

        對于給定的觀察序列O=(O1,O2,…,OT)和模型λ=(π,A,B),前向概率求解。

        ⑵解碼問題

        對于給定的觀察序列O=(O1,O2,…,OT)和模型λ=(π,A,B),求模型λ對應于觀測序列O的最佳狀態(tài)序列Q*=q1*,…qT*,即尋找使P(O—λ)達到最大時,O所對應的狀態(tài)序列,可以采用Viterbi算法求解。

        ⑶訓練算法

        對于給定的觀測序列O=(O1,O2,…,OT),如何修正模型λ參數(shù),使得模型產(chǎn)生觀測序列O的概率P(O—λ)最大,一般采用Baum—Welch算法。算法步驟為:確定A,B的初始值,利用前向-后向算法求前向概率和后向概率,利用重估公式求ai,j和bi(j),判斷是否收斂:求出P(O—λ)并計算 。如果 小于給定的閾值 則結束,反之回到第二步繼續(xù)進行循環(huán)。

        1.3.3 語音識別模型

        對待識別語音信號映射為觀察序列,然后對各模型求概率,其中概率最大的模型對應的詞即為識別結果。

        假設每個詞wi,都對應一個觀察序列O=[O1,O2,…,OT]T,則語音識別的問題可以認為是在已知語音觀察序列O的情況下,尋找與其最匹配的wi,即計算出argimax{P(wi—O)}。

        由于P(wi)和P(O)都可以確定,因此式(5.3.19)的大小由P(O—wi)決定。若其對應的隱馬爾科夫模型為λi,則:

        P(O—wi)=P(O—λi)

        其中,P(O—λi)可用前向-后向概率算法求出。然后找出最大的P(O—λi),則其模型對應的詞即為識別結果。

        1.4 模型的驗證

        問題二要求以一個實際的例子驗證語音識別模型。我們選擇了“話費查詢功能”進行驗證。為了達到這個目標,由問題二中的規(guī)則可知我們需要以比較連貫的語速用標準普通話說出“話費”。首先對該語音進行預加重。

        我們用識別正確率以及識別時間這兩個指標對系統(tǒng)的性能進行評價。在識別時我們用了十個不同個人錄制的“話費”信號進行測試,識別的正確率和識別的所需時間如下表:

        由上表可得:

        語音識別系統(tǒng)的正確率為:7/10*100%=70%

        平均識別時間為:(42+39+48+45+40+42+46+49+43+37)/10=43.1ms

        由此可見問題一中的模型具有較高的識別率,問題二中制定的規(guī)則也可以使用,且識別的時間較短可以滿足用戶對于應答及時性的要求,這樣可以提升用戶體驗。

        2 模型評價

        2.1 模型評價

        2.1.1 模型優(yōu)點

        預處理使得需要處理的數(shù)據(jù)量減少,提高了系統(tǒng)的處理效率也提高了識別的正確率;

        梅爾頻率倒譜參數(shù)具有識別性能力和抗噪能力;

        隱馬爾科夫模型識別的正確率要高于動態(tài)時間規(guī)整算法,同時識別的時間要比動態(tài)時間規(guī)整算法短;

        2.1.2 模型缺點

        系統(tǒng)結構簡單,只能識別特定的詞匯,不夠智能。

        連續(xù)隱馬爾科夫模型的計算比較復雜。

        [參考文獻]

        [1]百度百科.預加重,http://baike.baidu.cn/view/515154.htm,2013年5月26日.

        [2]王明奇.基于HMM的孤立詞語音識別系統(tǒng)的研究.畢業(yè)論文,2007年.

        [3]wangzi371312.數(shù)字化語音的分幀加窗處理.http://hi.baidu.com/wangzi371312/item/64897e6f2741d50ca0cf0f53,2013年5月26日.

        [4]百度文庫.端點檢測,http://wenku.baidu.com/view/86236edbad51f01dc281f14d,2013年5月26日.

        久久精品国产精品国产精品污| 丝袜美腿国产一区二区| 久久精品国产亚洲av热一区| 国产青春草在线观看视频| 国产精品国产三级久久| 亚洲狠狠婷婷综合久久久久| 大胸少妇午夜三级| 久久婷婷综合色丁香五月| 亚洲免费毛片网| 香港三级日本三韩级人妇久久| 日韩av激情在线观看| 欧美老妇人与禽交| 久久精品国产亚洲片| 六月婷婷亚洲性色av蜜桃| 狠狠色噜噜狠狠狠777米奇小说| 成av人片一区二区三区久久| 伊人亚洲综合网色AV另类| 国产天堂av手机在线| 国产美女高潮流白浆视频| 日本a级片免费网站观看| 国产精品免费看久久久8| 国产成人av一区二区三区无码| 亚洲AV色欲色欲WWW| 男人天堂亚洲天堂av| 久爱www人成免费网站| 国产精品视频一区二区噜噜| 亚洲精品123区在线观看| 最新国产精品国产三级国产av| 大香焦av一区二区三区| 欧美大片aaaaa免费观看| 荡女精品导航| 日韩精品极品视频在线观看蜜桃 | 国产边摸边吃奶叫床视频| 国产精品福利自产拍久久| 国产午夜精品久久久久九九| 在线小黄片视频免费播放| 久久99国产精品久久99| 中文字幕影片免费在线观看| 国产av乳头久久一区| 亚洲一区二区二区视频| 吃奶摸下的激烈视频|