亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于HTK的日語(yǔ)連續(xù)語(yǔ)音識(shí)別系統(tǒng)的建立與研究

        2013-12-31 00:00:00孫一鳴劉葳

        摘要:本文簡(jiǎn)單介紹了幾種減少噪音帶來(lái)的待識(shí)別信號(hào)特征與模型特征不匹配的方法,針對(duì)噪音環(huán)境下語(yǔ)音特征的變化特點(diǎn),重點(diǎn)分析了歸一化方法,并對(duì)動(dòng)態(tài)范圍調(diào)整方法做了重點(diǎn)的介紹。通過(guò)分析孤立詞識(shí)別中存在的問(wèn)題,提出了在連續(xù)語(yǔ)音特征曲線中基于動(dòng)態(tài)范圍調(diào)整的新方法。

        關(guān)鍵詞:連續(xù)語(yǔ)音識(shí)別;動(dòng)態(tài)范圍調(diào)整;歸一化;算法

        中圖分類號(hào):TN912.34

        當(dāng)噪音引起連續(xù)語(yǔ)音信號(hào)失真時(shí),提取的連續(xù)語(yǔ)音特征曲線也會(huì)在時(shí)域和頻域內(nèi)失真[1]。如果用帶噪特征去匹配純凈語(yǔ)音的特征模型,會(huì)造成帶噪特征與模型之間的不匹配,這就導(dǎo)致了識(shí)別率的下降。

        在連續(xù)語(yǔ)音識(shí)別中為了減少上述不匹配的問(wèn)題,有三種主要解決技術(shù)。一是多條件或者多類型的訓(xùn)練方法,也就是使用帶噪數(shù)據(jù)來(lái)進(jìn)行訓(xùn)練[2]。雖然這個(gè)方法能夠在特定的噪音環(huán)境下可以得到較好的識(shí)別精度,但是如果噪音環(huán)境發(fā)生變化識(shí)別精度還會(huì)急劇的降低。換言之,如果待識(shí)別數(shù)據(jù)與模型數(shù)據(jù)的條件(環(huán)境)不同,如:信噪比或者噪聲類型,在待識(shí)別數(shù)據(jù)和模型之間仍會(huì)存在不匹配的現(xiàn)象。二是采用自適應(yīng)模型方法[3],通過(guò)自適應(yīng)模型來(lái)減少不匹配的問(wèn)題。這種訓(xùn)練模型方法同時(shí)使用純凈和噪音數(shù)據(jù)來(lái)進(jìn)行訓(xùn)練,這又會(huì)導(dǎo)致模型的區(qū)分度不高,同樣會(huì)是識(shí)別精度下降。三是采用特征歸一化方法,這種方法雖然不能從根本上改變待識(shí)別特征與模型之間的不匹配,但是在一定程度上會(huì)保留模型的區(qū)分度并減少由于環(huán)境變化導(dǎo)致帶噪語(yǔ)音失真的影響。本文主要研究第三種方法。

        語(yǔ)音增強(qiáng)和特征補(bǔ)償方法以恢復(fù)語(yǔ)音特征為目的,但是特征歸一化方法只是對(duì)語(yǔ)音特征的某些統(tǒng)計(jì)信息進(jìn)行改變,并期望由此減少噪聲引起的失真。不論是語(yǔ)音補(bǔ)償還是特征補(bǔ)償,都需要改變語(yǔ)音的特征向量,而傳統(tǒng)的歸一化方法只是對(duì)語(yǔ)音特征統(tǒng)計(jì)信息的范圍進(jìn)行處理,提出的算法在保證原有語(yǔ)音統(tǒng)計(jì)信息的前提下,適當(dāng)改變部分語(yǔ)音特征向量。從而減少由噪音引起的語(yǔ)音特征曲線的失真。

        動(dòng)態(tài)范圍調(diào)整方法屬于歸一化方法的一種,能夠?qū)Ω蓛艉蛶г胝Z(yǔ)音的特征統(tǒng)計(jì)信息處理到相對(duì)較小的一個(gè)范圍內(nèi)。歸一化方法能夠根據(jù)一些模板值減少噪音特征在統(tǒng)計(jì)信息上的影響。相比使用歸一化方法之前,在干凈語(yǔ)音特征和帶噪語(yǔ)音特征之間的不匹配部分會(huì)顯著減少。語(yǔ)音增強(qiáng)一般應(yīng)用在時(shí)域和頻域中恢復(fù)語(yǔ)音特征的質(zhì)量。特征補(bǔ)償方法通常應(yīng)用在加強(qiáng)連續(xù)語(yǔ)音系數(shù)在對(duì)數(shù)濾波階數(shù)和頻譜域使用。

        減少待識(shí)別語(yǔ)音特征和模型的不匹配的方法雖然不是提高語(yǔ)音識(shí)別魯棒性的唯一方法,但卻是一種很有效的方法。通過(guò)這種方法可以減少待識(shí)別特征和模型之間的不匹配使得識(shí)別性能得以提高。

        1 噪音對(duì)孤立詞語(yǔ)音數(shù)據(jù)的影響

        加法性噪音和乘法性噪音是影響語(yǔ)音信號(hào)最普通的兩種噪音類型。例如:加法性噪音包含背景噪音,交通噪音,等等。乘法性噪音主要是傳輸過(guò)程中產(chǎn)生的信道失真。例如麥克風(fēng)自身的噪音,房間的反射噪音等等。干凈的語(yǔ)音信號(hào)首先被信道失真所干擾,進(jìn)一步被加法性噪音干擾。

        包含噪音的頻譜可以用如下公式描述:

        噪音干擾在增益部分和直流分量部分的影響是不同的,如圖1所示:在孤立詞識(shí)別中,很多實(shí)驗(yàn)表明使用DRA方法對(duì)加法性噪音和乘法性噪音都具有很好的性能。

        圖2展示了噪音影響在孤立詞中的性能。在圖2中,有兩條不同的特征曲線,曲線表示了干凈語(yǔ)音和10db信噪比的噪音特征在第二項(xiàng)MFCC中。者兩條曲線來(lái)源于同一個(gè)語(yǔ)音數(shù)據(jù)。

        然而,由于噪音嚴(yán)重的影響,噪音下的MFCC特征曲線的動(dòng)態(tài)范圍要小于干凈語(yǔ)音的MFCC特征曲線的動(dòng)態(tài)范圍。如果使用干凈語(yǔ)音特征建立HMM訓(xùn)練模型,能夠獲得理想的模型并在同等條件下獲得更高的識(shí)別率。但是對(duì)噪音下的語(yǔ)音識(shí)別,由于上述的原因,自動(dòng)語(yǔ)音識(shí)別系統(tǒng)無(wú)法在任何噪音下獲得正確的識(shí)別結(jié)果。雖然DRA歸一化方法能夠在孤立詞識(shí)別中獲得較好的識(shí)別結(jié)果,但直接用于連續(xù)語(yǔ)音識(shí)別并不是特別的理想。

        圖2展示了在孤立詞中不匹配的峰值。DRA歸一化方法算法使用最大值的方法將頻譜系數(shù)范圍標(biāo)準(zhǔn)化到一個(gè)統(tǒng)一的范圍。在每個(gè)維度,DRA方法將干凈或者帶噪語(yǔ)音頻譜系數(shù)的動(dòng)態(tài)范圍調(diào)整到同一個(gè)標(biāo)準(zhǔn)范圍中。但在孤立詞識(shí)別中,特征曲線中的峰值是有限的。歸一化方法非常適用于孤立詞識(shí)別。而連續(xù)語(yǔ)音識(shí)別特征曲線的峰值要遠(yuǎn)多于孤立詞識(shí)別,歸一化方法并不直接適用。

        2 噪音對(duì)連續(xù)語(yǔ)音數(shù)據(jù)的影響

        對(duì)連續(xù)語(yǔ)音特征曲線來(lái)說(shuō),不匹配的峰值隨著語(yǔ)音特征曲線的增長(zhǎng)而增加,語(yǔ)音特征曲線的動(dòng)態(tài)范圍隨著噪音的增加而減少。因此簡(jiǎn)單的歸一化算法不能有效適用連續(xù)語(yǔ)音識(shí)別。

        我們的目標(biāo)是縮小待識(shí)別噪音特征曲線與干凈的語(yǔ)音特征曲線之間的差異。經(jīng)過(guò)噪音魯棒性方法和DRA方法,語(yǔ)音信號(hào)中的直流分量的不同得以減少,特征曲線中不匹配的峰值也得以減少。

        基于前面提到的孤立詞識(shí)別的歸一化方法,我們可以假設(shè)噪音沒(méi)有改變?cè)械奶卣髑€的統(tǒng)計(jì)順序,也就是在語(yǔ)音特征曲線上會(huì)存在很多峰值,如第一高峰值,第二高峰值,等等。在連續(xù)語(yǔ)音特征中,全局的統(tǒng)計(jì)信息的匹配就在整個(gè)訓(xùn)練數(shù)據(jù)集中顯得比較重要。一般來(lái)說(shuō),這些特征曲線上的峰值信息代表了元音的語(yǔ)音特征。隨著訓(xùn)練量的增加,這些峰值信息一般會(huì)集中到相對(duì)穩(wěn)定的區(qū)域。但實(shí)際上,噪音通常會(huì)改變特征曲線的統(tǒng)計(jì)順序。如果能恢復(fù)部分特征曲線上統(tǒng)計(jì)信息的順序,就能增加這些峰值的匹配幾率。

        雖然通過(guò)上述的圖示可以看出通過(guò)歸一化方法可以增加干凈語(yǔ)音特征曲線和帶噪語(yǔ)音特征曲線的擬合程度,連續(xù)語(yǔ)音特征曲線中存在較多的峰值,帶噪語(yǔ)音特征曲線會(huì)改變一些峰值的統(tǒng)計(jì)信息,因此把歸一化方法簡(jiǎn)單的使用到連續(xù)語(yǔ)音識(shí)別中無(wú)法達(dá)到如圖的擬合程度。提出的算法可以盡最大可能恢復(fù)帶噪語(yǔ)音的峰值統(tǒng)計(jì)信息。

        使用DRA歸一化能提高特征曲線的峰值匹配概率。孤立詞特征曲線通常不含靜音部分,但在連續(xù)語(yǔ)音中,語(yǔ)音之間存在由于思考或者換氣產(chǎn)生的靜音,在此部分仍然使用歸一化方法在過(guò)渡位置會(huì)放大只有噪音的信號(hào)特征。這就導(dǎo)致了連續(xù)語(yǔ)音特征在此部分無(wú)法匹配。

        根據(jù)上面的討論,可以通過(guò)下面兩步對(duì)特征曲線進(jìn)行處理。

        第一步:從連續(xù)語(yǔ)音數(shù)據(jù)中提取所有的短句子。

        估計(jì)無(wú)音部分。連續(xù)語(yǔ)音包含許多無(wú)音部分和只有噪音的部分,因?yàn)檫@些部分不適合使用DRA。在下一步中消除連續(xù)語(yǔ)音特征曲線中各個(gè)動(dòng)態(tài)范圍的不平衡性。

        第二步:把選取出來(lái)的短句子分成更小的片段,在每個(gè)片段中使用歸一化方法。

        如果片段的長(zhǎng)度接近短句長(zhǎng)度,導(dǎo)致識(shí)別結(jié)果與傳統(tǒng)DRA方法接近,如果片段的長(zhǎng)度特別小,則導(dǎo)致識(shí)別精度急劇下降。根據(jù)實(shí)驗(yàn)得到經(jīng)驗(yàn)數(shù)據(jù)當(dāng)片段長(zhǎng)度為80幀時(shí),識(shí)別精度最高。不同片段長(zhǎng)度得到的識(shí)別結(jié)果如下圖:

        3 小結(jié)

        在訓(xùn)練過(guò)程中使用大量的數(shù)據(jù)可以使各個(gè)音素的模型逐漸集中在某一個(gè)范圍。對(duì)于測(cè)試數(shù)據(jù)來(lái)說(shuō),音素的范圍很有可能與模型不在同一個(gè)范圍內(nèi),待識(shí)別音素是有限的,不可知的。

        使用噪音魯棒性方法和DRA在建立區(qū)分度較高模型方法,這些魯棒性方法在發(fā)音較短的孤立詞識(shí)別中展現(xiàn)了良好的識(shí)別性能,并說(shuō)明了這些方法無(wú)法直接在連續(xù)語(yǔ)音識(shí)別中的原因。

        雖然在帶噪語(yǔ)音特征曲線和干凈語(yǔ)音特征曲線仍然有不匹配的峰值,需要指出的是,對(duì)比使用傳統(tǒng)的DRA算法,減少了不匹配的峰值。由此可以看出,使用提出的算法調(diào)整帶噪語(yǔ)音特征曲線可以增加峰值部分的匹配幾率。使用該算法在干凈和噪音環(huán)境下可以提高整體的識(shí)別性能。特別指出的是,提出的算法大幅提高了在噪音環(huán)境下的連續(xù)語(yǔ)音識(shí)別性能,根本原因就是相對(duì)于傳統(tǒng)的DRA,選擇了更合適的調(diào)整值,適當(dāng)?shù)姆糯罅朔逯?。該算法在語(yǔ)音頻譜系數(shù)的對(duì)數(shù)系數(shù)特征里也適用。

        參考文獻(xiàn):

        [1]張雄偉等編著.現(xiàn)代語(yǔ)音處理技術(shù)及應(yīng)用[M].機(jī)械工業(yè)出版社,2003.

        [2]王欣,羅代升,王正勇.基于改進(jìn)譜減算法的語(yǔ)音增強(qiáng)研究[J].成都信息工程學(xué)院學(xué)報(bào),2007(02).

        [3]孔浩,楊勇,王國(guó)胤.基于多分類器融合的語(yǔ)音識(shí)別方法研究[J].重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2011(04).

        国产三级精品三级| 日美韩精品一区二区三区| 亚洲熟少妇一区二区三区| 日韩在线永久免费播放| 久久人妻内射无码一区三区| 伊人网在线视频观看| 日韩精品一二区在线视频| 国产精品国三级国产a| 精品久久久久久无码中文字幕 | 成年男女免费视频网站| 日韩不卡无码三区| 日本成人午夜一区二区三区| 高潮潮喷奶水飞溅视频无码| 熟妇人妻中文字幕无码老熟妇| 色二av手机版在线| av手机免费在线观看高潮| 国产av麻豆精品第一页| 国产 一二三四五六| 无遮挡边摸边吃奶边做视频免费| 国产在线视欧美亚综合| av男人天堂网在线观看| 欧美嫩交一区二区三区| 一本一道波多野结衣一区| 亚洲AV无码国产精品久久l| av在线一区二区精品| 亚洲欧美日韩另类精品一区| 精品国精品国产自在久国产应用| 亚洲情精品中文字幕有码在线| 白白色发布的在线视频| 亚洲毛片αv无线播放一区| 丝袜足控一区二区三区 | 亚洲欧洲免费无码| 男男车车的车车网站w98免费| 国产精品国产三级国产av创| 国产精品高清视亚洲一区二区| 玩弄人妻少妇精品视频| 999久久久精品国产消防器材| 国产精品国产三级国产一地 | 国内偷拍视频一区二区| 国产精品亚洲а∨无码播放| 亚洲人成绝费网站色www|