亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        支持向量機(jī)在語音識別中的應(yīng)用

        2015-03-02 12:05:33高家寶
        軟件導(dǎo)刊 2015年1期
        關(guān)鍵詞:機(jī)器學(xué)習(xí)

        摘要:支持向量機(jī)采用數(shù)學(xué)方法和優(yōu)化技術(shù),將向量映射到一個更高維的空間里,建立一個有最大間隔的超平面,其在語音識別技術(shù)中應(yīng)用廣泛。

        闡述語音識別技術(shù)及支持向量機(jī)的原理,介紹支持向量機(jī)在語音識別中的應(yīng)用。

        關(guān)鍵詞:語音識別;支持向量機(jī);機(jī)器學(xué)習(xí)

        DOIDOI:10.11907/rjdk.143728

        中圖分類號:TP301

        文獻(xiàn)標(biāo)識碼:A 文章編號文章編號:16727800(2015)001003902

        基金項(xiàng)目基金項(xiàng)目:廣西教育廳科研基金(201010LX454)

        作者簡介作者簡介:高家寶(1976-),男,廣西平南人,桂林電子科技大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院碩士研究生,河池學(xué)院現(xiàn)代教育技術(shù)中心工程師,研究方向?yàn)橛?jì)算機(jī)應(yīng)用。

        0 引言

        語音識別起源于上世紀(jì)50年代,它首次實(shí)現(xiàn)了10個英文數(shù)字的語音識別,開始了語音識別研究工作的序幕。語音識別技術(shù)就是讓計(jì)算機(jī)通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的現(xiàn)代信息技術(shù),其關(guān)鍵技術(shù)是語音識別單元的選取和特征參數(shù)的提取。近20年來,語音識別技術(shù)研究工作取得了顯著進(jìn)展,開始從實(shí)驗(yàn)室研究逐步走向市場應(yīng)用。人們預(yù)測,在不久的將來,語音識別技術(shù)會溶入到工業(yè)、軍事、通信、醫(yī)療、汽車內(nèi)環(huán)境噪音抑制、測謊、家庭服務(wù)等各個領(lǐng)域,并對各領(lǐng)域的發(fā)展起到強(qiáng)有力的推動作用。漢字語音錄入就是語音識別技術(shù)在實(shí)際生活中的一個具體應(yīng)用例子。IT界很多專家學(xué)者都認(rèn)為語音識別技術(shù)是2000年以來信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。

        語音識別是一門交叉學(xué)科,也是模式識別的一個非常重要分支,它與生理學(xué)、心理學(xué)、語言學(xué)、計(jì)算機(jī)科學(xué)以及信號處理等都有密切的聯(lián)系,其最終目的就是要實(shí)現(xiàn)人與機(jī)器進(jìn)行自然語言通信,用語言代替手指來操縱計(jì)算機(jī)。

        支持向量機(jī)(Support Vector Machine,SVM)是Corinna Cortes和Vapnik等于1995年首先提出的,它采用數(shù)學(xué)方法和優(yōu)化技術(shù),將向量映射到一個更高維的空間里,并在這個空間里建立一個有最大間隔的超平面,便于解決數(shù)據(jù)挖掘中的問題,在某種程度上攻克了“維數(shù)災(zāi)難”和“過學(xué)習(xí)”等困難,并在語音識別、生物信息等領(lǐng)域應(yīng)用。近年來,把支持向量機(jī)應(yīng)用到語音識別技術(shù)中研究越來越多,取得了很大的成就[13]。

        1 支持向量機(jī)原理

        1.1 線性支持向量機(jī)

        考慮訓(xùn)練集Τ={(x1,y1),…,(xl,yl)}∈(Rn×Y)l,其中xi∈Rn,yi∈Y={1,-1},i=1,…,l.若存在ω∈Rn,b∈R和正數(shù)ε,使得對所有使yi=1的下標(biāo)i,有(ω·xi)+b≥ε,而對所有使yi=-1的下標(biāo)i,有(ω·xi)+b≥-ε,則稱訓(xùn)練集T線性可分,也稱相應(yīng)的分類問題是線性可分的。對線性可分問題,可轉(zhuǎn)化為求解變量ω和b凸的二次規(guī)劃問題。

        minω,b12ω2s.t. yi((ω·xi)+b)≥1,i=1,…,l.(1)

        對一般分類問題(包括線性不可分問題),可引入松弛變量ξi≥0,i=1,…,l。把問題(1)改為原始優(yōu)化問題

        minω,b,ξ12ω2+C∑li=1ξis.t. yi((ω·xi)+b)≥1-ξi,i=1,…,l,(2)ξi≥0,i=1,…,l,

        其中ξ=(ξ1,…,ξl)T,C>0是一個懲罰參數(shù)。

        1.2 非線性支持向量機(jī)

        把“線性分劃”推廣到“非線性分劃”,只需引進(jìn)一個適當(dāng)?shù)淖儞QΦ。引進(jìn)從空間Rn到Hilbert空間Η的變換x=Φ(x)。

        Φ:Rn→Ηx→x=Φ(x).(3)

        訓(xùn)練集T經(jīng)變換(3)后變?yōu)?/p>

        ΤΦ={(xi,yi),i=1,…,l}∈(Η×Y)l,(4)

        其中xi=Φ(xi)∈Η,yi∈Y={-1,1},i=1,…,l。此時,非線性分劃解的優(yōu)化問題為:

        minω,b,ξ12ω2+C∑li=1ξi

        s.t. yi((ω·Φ(xi))+b)≥1-ξi,i=1,…,l(5)ξi≥0,i=1,…,l.

        1.3 常用核函數(shù)

        1.3.1 最基本的核函數(shù)

        (1)定義在Rn×Rn上的函數(shù)Κ(x,x′)=(x·x′)是核函數(shù)。(2)若f(x)是定義在Rn上的實(shí)值函數(shù),則Κ(x,x′)=f(x)f(x′)是核函數(shù)。

        1.3.2 多項(xiàng)式核函數(shù) d為正整數(shù),則d階齊次多項(xiàng)式函數(shù)Κ(x,x′)=(x·x′)d及d階非齊次多項(xiàng)式函數(shù)Κ(x,x′)=((x·x′)+1)d都是核函數(shù)。

        1.3.3 Gauss徑向基核函數(shù) 以σ為參數(shù)的Gauss徑向基函數(shù)Κ(x,x′)=exp(-x-x′2σ2)是核函數(shù)。

        2 支持向量機(jī)在語音識別中的應(yīng)用

        使用支持向量機(jī)進(jìn)行語音識別步驟:

        ①輸入語音數(shù)據(jù);

        ②選擇核函數(shù)類型(包括選擇核函數(shù)類型、多項(xiàng)式核函數(shù)、RBF 核函數(shù)及其它核函數(shù));

        ③選擇模型參數(shù);

        ④解決二次優(yōu)化問題;

        ⑤支持向量集;

        ⑥分類器。

        支持向量機(jī)學(xué)習(xí)性能的好壞關(guān)鍵在于核函數(shù)及其參數(shù)選擇。用戶在利用支持向量機(jī)進(jìn)行求解分類問題時,首先需要選擇一個核函數(shù)類型,然后確定核函數(shù)的參數(shù)和懲罰因子。核函數(shù)對應(yīng)于非線性映射函數(shù)及其特征空間,確定了核函數(shù)就等于確定了非線性映射和特征空間。由此可見,要想支持向量機(jī)有突出的推廣效果,首先必須選取適當(dāng)?shù)暮撕瘮?shù)并將數(shù)據(jù)映射到正確的特征空間。如果核函數(shù)不同,那么數(shù)據(jù)映射到特征空間也相應(yīng)不一樣。用戶在確定了核函數(shù)的類型后,接下來要做的就是選擇相應(yīng)的參數(shù),其參數(shù)值直接決定著支持向量機(jī)的分類精度和學(xué)習(xí)性能。

        綜上所述,核函數(shù)類型、核參數(shù)和懲罰因子的選擇在不同程度上影響著支持向量機(jī)的性能。但是,支持向量機(jī)的核函數(shù)及參數(shù)選擇直到現(xiàn)在還沒有形成統(tǒng)一的模式,也沒有找出指導(dǎo)支持向量機(jī)核函數(shù)及參數(shù)選擇的好辦法,用戶對參數(shù)選擇只能根據(jù)以往經(jīng)驗(yàn)和頻繁進(jìn)行對比實(shí)驗(yàn),存在著很大的局限性。

        語音信號中含有豐富的信息,特征提取是從語音信號中提取出有效信息,它是語音識別的關(guān)鍵。機(jī)器對語音信號進(jìn)行分析處理,去掉與語音識別無關(guān)的冗余信息, 提取能夠有效表征說話人特征的參數(shù)。對于非特定人語音識別來說,應(yīng)盡可能地使特征參數(shù)更多地反映語義信息,盡可能降低說話人的個人信息;對于特定人語音識別來說,則恰好相反。在實(shí)際應(yīng)用中,通常直接把語音數(shù)據(jù)文件作為處理對象,人為地添加高斯白噪聲。語音特征可采用 MFCC特征、LPC特征、LPCC特征或ZCPA特征。說話人在發(fā)同一個音時,其持續(xù)時間長度和各音素的相對時長都是隨機(jī)變化的,為了便于處理,將提取的特征參數(shù)通過動態(tài)時間歸整算法進(jìn)行時間歸一化處理,然后作為支持向量機(jī)的輸入?yún)?shù)。在支持向量機(jī)語音識別系統(tǒng)中,可以通過采用不同的核函數(shù)對語音信息進(jìn)行訓(xùn)練和識別,以取得最好的識別結(jié)果。

        3 結(jié)語

        支持向量機(jī)是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的機(jī)器學(xué)習(xí)方法,其應(yīng)用范圍廣泛,如:語音識別、數(shù)據(jù)挖掘和神經(jīng)網(wǎng)絡(luò)等,有相對完善的理論基礎(chǔ)。雖然支持向量機(jī)在理論上有明顯優(yōu)勢,但支持向量機(jī)起步較晚,應(yīng)用研究相對滯后,科研成果不夠突出,目前,大多數(shù)是做仿真和對比實(shí)驗(yàn)。支持向量機(jī)的應(yīng)用研究是一個很有潛力的研究方向。

        猜你喜歡
        機(jī)器學(xué)習(xí)
        基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
        基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
        時代金融(2016年27期)2016-11-25 17:51:36
        前綴字母為特征在維吾爾語文本情感分類中的研究
        下一代廣播電視網(wǎng)中“人工智能”的應(yīng)用
        活力(2016年8期)2016-11-12 17:30:08
        基于支持向量機(jī)的金融數(shù)據(jù)分析研究
        基于Spark的大數(shù)據(jù)計(jì)算模型
        基于樸素貝葉斯算法的垃圾短信智能識別系統(tǒng)
        基于圖的半監(jiān)督學(xué)習(xí)方法綜述
        機(jī)器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
        極限學(xué)習(xí)機(jī)在圖像分割中的應(yīng)用
        亚洲国产av导航第一福利网| 一区二区二区三区亚洲| 国产亚洲精品一区二区无| 4hu四虎永久在线观看| 在线综合网| 日韩av在线不卡观看| 亚洲中文字幕久久精品色老板| 18精品久久久无码午夜福利 | 无码国产色欲xxxxx视频| 亚洲欧美日韩国产精品一区| 精品女同一区二区三区亚洲| 日本道色综合久久影院| 中年熟妇的大黑p| 亚洲午夜成人片| 国产免费一区二区三区在线观看| 久久亚洲av成人无码国产最大| 国产精品自在线拍国产| 色www亚洲| 国产av麻豆精品第一页| 国产精品福利一区二区| 日日噜噜夜夜狠狠久久无码区 | 自拍偷拍一区二区三区四区| 国产最新女主播福利在线观看| 久久精品国产精品国产精品污| 免费看国产成年无码av| 国产三级视频在线观看国产 | 亚洲av无码专区国产乱码4se| 亚洲日本中文字幕天天更新| 99精品国产兔费观看久久| 亚洲国产一区二区,毛片| 浪货趴办公桌~h揉秘书电影| 亚洲巨乳自拍在线视频| 久久久精品2019免费观看| 亚洲日本一区二区三区四区| 久久成人国产精品免费软件 | 午夜无码国产18禁| 精品粉嫩av一区二区三区| 激情航班h版在线观看| 一本久到久久亚洲综合| 久久国产精品亚洲我射av大全| 成人免费看aa片|