亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種改進(jìn)型HMM說話人識別算法

        2012-11-24 02:17:40張會林
        關(guān)鍵詞:模型

        陶 潔,張會林

        (上海理工大學(xué) 光電信息與計(jì)算機(jī)工程學(xué)院,上海 200090)

        近年來,隨著語音識別技術(shù)的不斷發(fā)展,語音識別系統(tǒng)的性能不斷提高,隱馬爾可夫模型方法是當(dāng)中的一個(gè)主要識別方法。語音識別系統(tǒng)的識別率十分依賴于模型的訓(xùn)練,而經(jīng)典的訓(xùn)練算法(Baum-Welch算法)有一個(gè)致命的弱點(diǎn),即最終所得的解十分依賴于初始值的選取,所以總是局部最優(yōu)解,影響了整個(gè)系統(tǒng)的識別率。本文將遺傳算法植入HMM模型參數(shù)的優(yōu)化當(dāng)中,使得整個(gè)語音識別系統(tǒng)的識別效果大大改善。

        1 遺傳算法

        遺傳算法將自然界的生物進(jìn)化原理引入待優(yōu)化參數(shù)形成的編碼串聯(lián)群體中,按所選擇的適應(yīng)度函數(shù)通過遺傳中的復(fù)制、交叉及變異對個(gè)體進(jìn)行篩選,使得適應(yīng)度高的個(gè)體被保留下來,組成新的群體。通過不斷迭代,保留下的個(gè)體適應(yīng)度不斷提高,直到滿足一定的條件。從數(shù)學(xué)的角度解釋,可以簡單地認(rèn)為,基因重組使子代基因趨向于局部最優(yōu)解,而基因變異能使子代基因突破局部范疇,經(jīng)過多代的交叉和變異,達(dá)到全局最優(yōu)解。

        根據(jù)待優(yōu)化問題的數(shù)學(xué)模型,定義適應(yīng)度函數(shù)F(ai),其中 ai為其中的一條染色體,則 F(ai)就是判斷該染色體優(yōu)劣的依據(jù)。對于每一代基因,計(jì)算所有染色體的適應(yīng)度函數(shù),進(jìn)行排序,選擇一定數(shù)目的優(yōu)秀染色體,用于產(chǎn)生子代的父代樣本。

        復(fù)制操作只能從舊種群中選擇出較優(yōu)秀的染色體,但是不能創(chuàng)造出新的染色體。交叉操作模擬了生物進(jìn)化過程中的交配過程,通過兩條染色體的分離重組,產(chǎn)生新的優(yōu)良物種。圖1為多點(diǎn)交叉重組的示意圖。交叉過程為:在匹配池中任選兩條染色體,隨機(jī)選擇一點(diǎn)或多點(diǎn)交換點(diǎn),然后交換雙親染色體交換點(diǎn)右邊的部分,即可得到兩條新的子代染色體。

        圖1 多點(diǎn)交叉重組

        最佳基因是在一代一代的基因重組和基因變異中產(chǎn)生的?;蛲蛔冇脕砟M生物在自然的遺傳環(huán)境中由于各種偶然因素引起的變異突變,它以很小的概率隨機(jī)地改變?nèi)旧w編碼串中的某一位。變異算法有利于局部最優(yōu)處跳出,防止算法過早地收斂。

        遺傳算法的具體實(shí)現(xiàn)步驟如下:

        (1)隨機(jī)產(chǎn)生最初的染色體群體 p={a1,a2,…,aL},ai為其中的一條染色體。

        (2)計(jì)算各個(gè)染色體的適應(yīng)度函數(shù) F(ai),并對適應(yīng)度函數(shù) F(ai)進(jìn)行排序,根據(jù)設(shè)定的門限選取一定數(shù)目的優(yōu)秀染色體作為產(chǎn)生子代染色體的父代樣本。

        (3)以一點(diǎn)或多點(diǎn)交叉產(chǎn)生新的子代染色體,交叉點(diǎn)隨機(jī)生成。

        (4)設(shè)定變異概率門限,根據(jù)生成的隨機(jī)數(shù)決定染色體中的某個(gè)變量是否有突變發(fā)生。

        2 HMM說話人識別系統(tǒng)

        識別主要有兩個(gè)任務(wù):一個(gè)是對每個(gè)HMM模型的訓(xùn)練,也就是計(jì)算HMM參數(shù);另一個(gè)是識別任務(wù),也就是已知了參考模型的HMM參數(shù),決定未知模式與哪個(gè)參考模式是最佳匹配。訓(xùn)練采用Baum-Welch算法,識別采用Viterbi算法。

        2.1 Baum-Welch估計(jì)

        給定一個(gè)觀察值序列 O=o1,o2,…,oN,以及一個(gè)需要通過訓(xùn)練進(jìn)行重估參數(shù)的 HMM模型 M={A,B,π}。重估公式如下:

        利用式(1)、(2),訓(xùn)練步驟如下:

        (1)給未知模型假設(shè)初始條件,計(jì)算 P(X|S)。

        (2)使用式(1)、(2),由當(dāng)前的模型參數(shù)的估計(jì)值,重新估計(jì)新的模型S的參數(shù)。

        (3)計(jì)算 P(X|S)。 如果 P(X|S)-P(X|S)>ε,S=S 并且回到步驟(1),否則停止。

        2.2 Viterbi識別

        給 定 一 個(gè) 觀 察 值 序 列 O=o1,o2, … ,oN, 以 及 一 個(gè)HMM模型M={A,B,π},在最佳的意義上確定一個(gè)狀態(tài)序列 S=s1,s2,…,sN。 這里的“最佳”是指使 P(O,S|M)最大。 P(O,S|M)計(jì)算式為:

        觀察式(3),定義每步轉(zhuǎn)移的代價(jià)為

        3 用遺傳算法改進(jìn)HMM

        基于遺傳算法改進(jìn)的HMM系統(tǒng)的設(shè)計(jì)模型如圖2所示。

        圖2 改進(jìn)型HMM系統(tǒng)

        在將遺傳算法引入HMM訓(xùn)練的過程中,首先要解決的是染色體的構(gòu)造問題。將HMM模型的所有參數(shù)排列成一串,構(gòu)成染色體。對于語音識別,采用自左向右的HMM模型,本文中為5狀態(tài)自左向右只含一階跳轉(zhuǎn)的HMM模型。HMM模型 λ={A,B,π},參數(shù)由初始狀態(tài)向量π、狀態(tài)轉(zhuǎn)移矩陣A及每個(gè)狀態(tài)的輸出概率密度函數(shù)組成。向量π含有5個(gè)元素,轉(zhuǎn)移矩陣A中共含有元素25個(gè),其中不為0的參數(shù)為9個(gè)。各狀態(tài)的輸出概率密度函數(shù) bj(o)=ΣcjkN(o,μjk,Σjk)。 其中 j代表狀態(tài),cjk為混合系數(shù),N()為高斯分布,μjk為平均矢量,Σjk為協(xié)方差矩陣。語音特征參數(shù)采用24階Mel倒譜系數(shù),選取為5個(gè)高斯概率密度函數(shù)的混合。將初始狀態(tài)向量π、轉(zhuǎn)移矩陣A和混合系數(shù)矩陣c的參數(shù)共5+9+25=39個(gè)按行組成一串,形成染色體的前一部分,將平均矢量μjk和協(xié)方差矩陣Σjk共 5×5×(10+24×24)=14 650 個(gè)參數(shù)按行組成一串,形成染色體的后一部分。在染色體前一部分的行向量之和均為1。因此,需要在生成每一代染色體前,對這一部分行向量所對應(yīng)的每一段染色體進(jìn)行歸一化,以滿足HMM的約束條件。

        實(shí)驗(yàn)中,染色體的前一部分依概率進(jìn)行二點(diǎn)或多點(diǎn)交叉,而后一部分染色體只進(jìn)行多點(diǎn)交叉,多點(diǎn)交叉概率為 ρc=0.8。染色體前一部分的變異概率為 ρm=0.1,后一部分變異概率為ρm=0.04。此外,設(shè)置系統(tǒng)最大進(jìn)化代數(shù)為 100。

        4 實(shí)驗(yàn)結(jié)果分析

        實(shí)驗(yàn)基于HMM進(jìn)行語音識別,訓(xùn)練數(shù)據(jù)取自10人,在不同SNR下獲取語音數(shù)據(jù),時(shí)間長度為5 s,采樣率為8 kHz,A/D轉(zhuǎn)換精度為16 bit,單聲道。遺傳算法的優(yōu)化過程中適應(yīng)度函數(shù)F的變化過程如圖3所示。語音識別系統(tǒng)識別結(jié)果如表1所示。

        圖3 適應(yīng)度函數(shù)F變化過程

        表1 兩種系統(tǒng)不同SNR下識別率比較

        表1中,系統(tǒng)I為基于HMM的語音識別系統(tǒng),系統(tǒng)II為基于遺傳算法改進(jìn)的HMM語音識別系統(tǒng)。從實(shí)驗(yàn)結(jié)果可以看出,基于遺傳算法改進(jìn)的HMM模型對語音識別率有較大改善,平均提高了4~5個(gè)百分點(diǎn)。

        本應(yīng)用基于HMM語音識別算法,結(jié)合遺傳算法進(jìn)行HMM模型訓(xùn)練并將其應(yīng)用于到語音識別中。經(jīng)過實(shí)際驗(yàn)證,計(jì)算簡單,效果好,基本達(dá)到了設(shè)計(jì)目的和現(xiàn)實(shí)要求。

        [1]張思才,張方曉.一種遺傳算法適應(yīng)度函數(shù)的改進(jìn)方法[J].計(jì)算機(jī)應(yīng)用與軟件,2011,23(2):108-110.

        [2]MANIEZZO V.Genetic evolution of the topology and weight distribution of neural networks[J].IEEE Transactions on Neural Networks, 1994, 5(6):900~909.

        [3]TERASHIMA R, YOSHIMURA T, WAKITA T.Prediction method of speech recognition performance based on HMM-based speech synthesis technique[J].IEEE Transactions on Electronics, Information and Systems,2010,130: 557-564.

        [4]胡廣書.現(xiàn)代信號處理教程[M].北京:清華大學(xué)出版社,2004.

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機(jī)模型
        提煉模型 突破難點(diǎn)
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達(dá)及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        亚洲黄色av一区二区三区| 欧美a在线播放| av无码电影一区二区三区| sm免费人成虐漫画网站| 欧美a级在线现免费观看| 国产精品18久久久久久麻辣| 亚洲国产成人无码影院| 亚洲综合天堂一二三区| 国产成人精品一区二区20p| 性色做爰片在线观看ww| 中文字幕不卡在线播放| 性一交一乱一乱一视频亚洲熟妇 | 大ji巴好深好爽又大又粗视频| 国产成人精品日本亚洲| 国产自在自线午夜精品视频在| 久久影院最新国产精品| 亚洲av中文无码乱人伦下载| 亚洲欧洲精品成人久久曰影片| 久久夜色精品国产噜噜噜亚洲av| 亚洲一区二区在线观看av| 免费不卡在线观看av| av无码精品一区二区三区四区| 超级少妇一区二区三区| 天堂蜜桃视频在线观看| 天堂网在线最新版www| 好吊妞人成免费视频观看| 久久久成人av毛片免费观看| 日本最新一区二区三区视频观看 | 精品国产91久久综合| 久久精品一区一区二区乱码| 领导边摸边吃奶边做爽在线观看| a级黑人大硬长爽猛出猛进| 亚洲av一区二区国产精品| 91久久偷偷做嫩模影院| 亚洲а∨精品天堂在线| 人妻精品丝袜一区二区无码AV | 亚洲成人av在线播放不卡| 国产精品久久久亚洲| 精品人体无码一区二区三区| 日韩精品视频免费福利在线观看| 岛国熟女精品一区二区三区|