亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于免疫遺傳優(yōu)化支持向量機的普米語孤立詞語譜圖分類

        2019-01-22 11:55:10董華珍潘文林王翠和麗華楊建香解學(xué)琴
        關(guān)鍵詞:語譜適應(yīng)度語音

        董華珍,潘文林,2,王翠,和麗華,楊建香,解學(xué)琴

        (1.云南民族大學(xué) 數(shù)學(xué)與計算機科學(xué)學(xué)院,云南 昆明 650500)(2.云南民族大學(xué) 云南省高校物聯(lián)網(wǎng)應(yīng)用技術(shù)重點實驗室,云南 昆明 650500)

        普米族主要分布在云南省的蘭坪、寧蒗、永勝、麗江等縣和迪慶藏族自治州的中甸、維西和德欽等縣,約22 000人;四川省木里、鹽源以及九龍等縣,約有25 000人;近年來由于受漢族文化和“大雜居小聚居”民族居住狀況的影響,標(biāo)準(zhǔn)普米語語音逐年受到各類語言的嚴(yán)重侵蝕,保護(hù)和傳承普米族語言文化已迫在眉睫[1].以云南省蘭坪縣河西區(qū)箐花公社錄制的普米語孤立詞為研究對象,借助語譜圖研究其特征,最終實現(xiàn)普米語孤立詞分類.

        1 語音識別相關(guān)研究工作

        目前,語音識別的方法可以歸結(jié)基于語音信號和基于語譜圖2種.

        1) 基于語音信號的方法.語音信號是一種非線性隨機并存在混沌的機制,就目前而言處理這種機制的模型主要語音信號的線性模型和非線性模型兩種.線性模型的理論基礎(chǔ)是確定性線性系統(tǒng)理,而非線性模型則視語音信號為一些調(diào)幅—調(diào)頻信號的疊加,其核心是瞬時頻率.在此之前本團(tuán)隊基于語音信號的普米語語音識別,已取得了一些成果[2-4].

        2) 基于語譜圖的方法.語譜圖被稱為“可視化的語音”,二維平面上水平方向是時間軸,垂直方向是頻率軸,坐標(biāo)點值為語音數(shù)據(jù)能量,采用二維平面表達(dá)三維信息,顏色的深淺反映了語音能量值的大小.由于語譜圖的可視性較強,人們借助語譜圖完成了一系列的語音處理工作.潘凌云等[5]憑借語譜圖,利用自適應(yīng)閾值技術(shù)尋找每個音素段的邊緣,實現(xiàn)了音素的分割.宋洋[6]提取語譜圖的邊界特征和二值特征作為語譜特征,通過構(gòu)造BP神經(jīng)網(wǎng)絡(luò)實現(xiàn)維吾爾語音素分類.唐閨臣等[7]通過提取語譜圖中的Hu不變矩特征、紋理特征和部分語譜特征,基于SVM實現(xiàn)了對語音情感的分類.向建軍等[8]將語譜圖的頻域圖矩陣進(jìn)行投影后的值作為特征值,并利用SVM實現(xiàn)2字漢語詞匯語音識別.Steinber等[9]通過將語譜圖進(jìn)行小波變換,對語譜圖邊緣進(jìn)行分割,實現(xiàn)了語音的識別.Ajmera等[10]利用Radon變換(RT)和離散余弦變換(DCT)從語譜圖中提取有效的聲學(xué)特征,實現(xiàn)與文本無關(guān)的說話人識別.Y Li[11]借助語譜圖提取LBP向量,利用動態(tài)時間調(diào)整(DTW)算法實現(xiàn)LBP向量的最佳匹配,實現(xiàn)了說話人識別.Sain[12]通過提取語譜圖的數(shù)據(jù)驅(qū)動特征,使用標(biāo)準(zhǔn)方差來定義語譜圖的特征,實現(xiàn)了語音分類,且魯棒性較高.

        普米語孤立詞語譜圖分類屬于模式識別領(lǐng)域[13].目前,常用模式識別算法主要有:神經(jīng)網(wǎng)絡(luò)(ANN)[14]、k-近鄰分類器(KNNC)[15]、支持向量機(SVM)等.神經(jīng)網(wǎng)絡(luò)(ANN)、k-近鄰分類器(KNNC)進(jìn)行模型訓(xùn)練時需要大量訓(xùn)練樣本.此外,神經(jīng)網(wǎng)絡(luò)(ANN)是基于經(jīng)驗風(fēng)險最小化,面臨“過學(xué)習(xí)的風(fēng)險”問題.SVM是建立在統(tǒng)計學(xué)理論的VC維理論的結(jié)構(gòu)風(fēng)險最小化準(zhǔn)則基礎(chǔ)之上,有很強的學(xué)習(xí)能力和泛化能力;針對有限小樣本情況,SVM可以得到現(xiàn)有信息下的最優(yōu)分類模式;算法最終轉(zhuǎn)換為一個凸2次規(guī)劃問題,可以得到全局最優(yōu)解[16].

        各個獨立核的懲罰參數(shù)c和核函數(shù)參數(shù)g的確定將直接影響到SVM的分類效果.目前,各種不同的現(xiàn)代智能優(yōu)化方法被廣泛應(yīng)用于模式識別的參數(shù)優(yōu)化當(dāng)中,例如粒子群算法(PSO)[17]、遺傳算法(GA)[18]和模擬退火算法(SA)[19]等.這些算法在實際應(yīng)用中有著各自的優(yōu)缺點:PSO算法逼近最優(yōu)解速度快,但在處理復(fù)雜的多峰搜索問題時,局部尋優(yōu)能力較差;GA算法具有良好的并行搜索能力,但由于存在染色體的趨同效應(yīng)產(chǎn)生早熟現(xiàn)象;SA算法有較強的串行搜索能力,但收斂速度慢.免疫遺傳算法(IGA)[20]是在GA的基礎(chǔ)上發(fā)展起來的,它在保留GA隨機全局并行搜索優(yōu)點的同時,避免了GA中早熟現(xiàn)象的不利影響.

        為了提高支持向量機的分類精度以及泛化能力,本文在對支持向量機中核函數(shù)性能進(jìn)行分析的基礎(chǔ)上,實現(xiàn)基于免疫遺傳優(yōu)化支持向量機的普米語孤立詞語譜圖分類.

        2 支持向量機(SVM)

        C-SVM是比較常見的二分類支持向量機模型,接下來將對C-SVM以及核函數(shù)進(jìn)行詳細(xì)介紹.

        2.1 二分類支持向量機(C-SVM)

        1) 設(shè)已知一個訓(xùn)練集:

        T={(xi,yi),…,(xl,yl)}∈(X×Y)l.

        (1)

        其中,xi∈Rn,yi∈{-1,1},xi(i=1,…,l)是特征向量,yi是類別標(biāo)簽,yi對應(yīng)第i個輸入的特征向量xi.

        2) 選取適當(dāng)?shù)膮?shù)C和核函數(shù)K(xi,xj),并構(gòu)造如下最優(yōu)模型:

        (2)

        2.2 核函數(shù)

        SVM中通過引入核函數(shù),可以有效避免高維內(nèi)積運算.在支持向量機中,常用核函數(shù)主要包括以下4種:

        1)線性核函數(shù):K(X,Y)=K(X,Y);

        2)多項式核函數(shù):K(X,Y)=(X·Y+c)d;c為常數(shù),d為多項式階數(shù);

        3)高斯徑向基核函數(shù):K(X,Y)=exp(-γ‖X-Y‖2), ‖X-Y‖是X-Y的2階范數(shù),c為常數(shù);

        4)兩層感知器核函數(shù):K(X,Y)=tan(ν(X,Y)-c),c為衰減參數(shù),ν是刻度.

        3 基于免疫遺傳優(yōu)化支持向量機的語譜圖分類

        由于每個孤立詞語音信號音頻的不同,因此,每張語譜圖中頻率的情況也就不同.為此,需要對每張語譜圖進(jìn)行預(yù)處理:將語譜圖轉(zhuǎn)化為二值圖像,采用迭代最優(yōu)閥值法截取圖像中包含特征的最大區(qū)域,并將區(qū)域轉(zhuǎn)化為16×16大小的圖片.最終,語譜圖頻域的位置像素點灰度值為1,其他位置灰度值為0.本文將提取普米語孤立詞語譜圖的二值特征,每張語譜圖的特征是16×16維.

        首先將原始數(shù)據(jù)分為訓(xùn)練集和測試集,由于對語譜圖進(jìn)行標(biāo)準(zhǔn)化處理,所以無需對數(shù)據(jù)進(jìn)行歸一化處理,之后利用訓(xùn)練樣本對SVM模型進(jìn)行訓(xùn)練,由得到的模型可以預(yù)測測試集對應(yīng)的分類標(biāo)簽,基于支持向量機的普米語語譜圖分類流程如圖1所示.

        3.1 選定訓(xùn)練集和測試集

        從語料庫中挑選普米語孤立詞80個,每個孤立詞讀5遍,總計得到400條普米語孤立詞語音.并將這400條語音經(jīng)過傅里葉變換生成語譜圖.從這400張語譜圖中隨機選擇320張作為訓(xùn)練集,80張作為測試集.提取每張語譜圖的二值特征,得到用以描述每個孤立詞語譜圖的一個16×16矩陣.

        3.2 核函數(shù)的比較

        對于相同的測試集,4種核函數(shù)的預(yù)測分類準(zhǔn)確率如圖1所示.

        表1 4種核函數(shù)的預(yù)測分類準(zhǔn)確率

        實驗結(jié)果表明,采用徑向基函數(shù)作為SVM的核函數(shù),預(yù)測分類準(zhǔn)確率最高.

        3.3 網(wǎng)格法選擇最優(yōu)參數(shù)

        在上述核函數(shù)的對比實驗中,SVM中的c(懲罰參數(shù))和g(核函數(shù)參數(shù))是憑測試經(jīng)驗給定的,因此,需要對參數(shù)進(jìn)行優(yōu)化.在使用SVM進(jìn)行分類時,一般是使用網(wǎng)格法對參數(shù)c和g進(jìn)行優(yōu)化,圖2為SVM的分類結(jié)果.x軸表示log2(c)的值,y軸表示log2(g)的值,等高線為取相應(yīng)的log2(c)和log2(g)值后,與之對應(yīng)的分類準(zhǔn)確率.圖2從實驗結(jié)果圖可以得出,當(dāng)log2(c)的范圍縮小到[2,4],log2(g)的范圍縮小到[-4,-3]時,在上述粗略選擇的基礎(chǔ)上再利用SVMcgForClass(Libsvm中的函數(shù),可對參數(shù)進(jìn)行優(yōu)化)選擇更好的參數(shù).最終,網(wǎng)格法優(yōu)化分類準(zhǔn)確率為89%,此時c=5.278,g=0.062 5.

        3.4 免疫遺傳算法尋找最優(yōu)參數(shù)

        在采用網(wǎng)格優(yōu)化參數(shù)的過程中只能找到局部最優(yōu)參數(shù).由于免疫遺傳算法在遺傳算法中加入了免疫算子,能有效避免未成熟收斂問題.隨機全局并行搜索的特點,又保留種群中高適應(yīng)度的抗體,因此免疫遺傳算法被用于該模型參數(shù)的全局尋優(yōu)在免疫遺傳支持向量機(SVM)中,利用IGA優(yōu)化懲罰參數(shù)c和核函數(shù)參數(shù)g.首先以c和g構(gòu)造抗體初始向量:X=[c,g],為了使SVM的實際輸出與期望輸出之間的誤差平方和達(dá)到最小,定義SVM訓(xùn)練樣本分類準(zhǔn)確率E(xi)作為適應(yīng)度函數(shù)f(xi),且f(xi)=E(xi).其中,f(xi)為第i個抗體的適應(yīng)度,E(xi)表示第i個抗體對應(yīng)的支持向量機的交叉驗證的分類平均正確率.IGA-SVM具體步驟如下,流程圖如圖3所示.

        1)確定抗原、抗體、最大迭代次數(shù)及種群濃度閾值;

        2)計算當(dāng)前抗體群的濃度及每個抗體的適應(yīng)度,對當(dāng)前種群中抗體的適應(yīng)度由高到低進(jìn)行排序,選出適應(yīng)度最高的抗體并保留;

        3)若抗體群的抗體數(shù)目大于種群規(guī)模,則去除適應(yīng)度較低的抗體,以維系抗體群規(guī)模不變,否則繼續(xù)下一步;

        4)若抗體群的濃度小于或等于閾值,則將保存的抗體替換適應(yīng)度最小的抗體并轉(zhuǎn)入下一步;否則對當(dāng)前抗體群中的適應(yīng)度相同的抗體進(jìn)行免疫接種,并隨機產(chǎn)生種群規(guī)模的40%的個體加入到當(dāng)前抗體群中;

        5)計算當(dāng)前抗體群中的每一個抗體的適應(yīng)度;

        6)根據(jù)抗體的適應(yīng)度算出相應(yīng)的選擇概率,接著進(jìn)行選擇、復(fù)制操作;

        7)對抗體群進(jìn)行相應(yīng)的交叉、變異操作;

        8)若滿足滿足終止條件,則停止程序;不滿足,則返回(2),繼續(xù)執(zhí)行.

        基于IGA-SVM的普米語孤立詞語譜圖分類準(zhǔn)確率如圖4所示,從圖4可以看當(dāng)c=4.594 8和g=0.062 5時,分類準(zhǔn)確率可以達(dá)到91%.

        4 結(jié)語

        本文選用普米語孤立詞為研究對象, 采用徑向基函數(shù)做了2組對比實驗.基于網(wǎng)格法,得到了最優(yōu)參數(shù)c=5.278,g=0.062 5,分類準(zhǔn)確率為89%; 基于IGA-SVM,得到最優(yōu)參數(shù)c=4.594 8,g=0.062 5分類準(zhǔn)確率為91%.因此,免疫遺傳算法是普米語孤立詞語譜圖分類最有效的方法.

        猜你喜歡
        語譜適應(yīng)度語音
        改進(jìn)的自適應(yīng)復(fù)制、交叉和突變遺傳算法
        計算機仿真(2022年8期)2022-09-28 09:53:02
        魔力語音
        HR-DCGAN方法的帕金森聲紋樣本擴充及識別研究
        基于MATLAB的語音信號處理
        電子制作(2019年14期)2019-08-20 05:43:38
        基于MQ3與MP3的價廉物美的酒駕語音提醒器
        電子制作(2019年9期)2019-05-30 09:42:10
        對方正在輸入……
        小說界(2018年5期)2018-11-26 12:43:42
        基于時頻域特征的場景音頻研究
        語譜圖二次傅里葉變換特定人二字漢語詞匯識別
        基于空調(diào)導(dǎo)風(fēng)板成型工藝的Kriging模型適應(yīng)度研究
        中國塑料(2016年11期)2016-04-16 05:26:02
        面向語音情感識別的語譜圖特征提取算法
        日本亲近相奷中文字幕| 久久久久成人精品免费播放| 日韩精品极品免费观看| 麻豆成人久久精品一区| 成人艳情一二三区| 波多野结衣乳巨码无在线| 99在线视频精品费观看视| 久久精品一区二区三区夜夜| 桃红色精品国产亚洲av| 亚洲h在线播放在线观看h| 日韩成人免费一级毛片| 人妻一区二区三区免费看| 精品少妇一区二区三区免费 | 婷婷久久亚洲中文字幕| 欧洲乱码伦视频免费| 午夜亚洲www湿好爽| 高清国产美女av一区二区| 日本频道一区二区三区| 日本少妇春药特殊按摩3| 波多野结衣免费一区视频| 国产日产亚洲系列av| 日本免费一区二区三区在线播放| 真实国产老熟女无套中出| 人妻少妇偷人精品无码| 国产精品国产三级在线专区| 无套内射在线无码播放| 日本又黄又爽gif动态图| 亚洲成精品动漫久久精久| 亚洲av午夜福利精品一区不卡| 免费a级毛片18禁网站app| 国内少妇自拍区免费视频| 日本最新在线一区二区| 国产精品妇女一区二区三区| 国产精品9999久久久久| 在线视频一区二区日韩国产| 国产高清在线精品一区不卡 | 久久频道毛片免费不卡片| 久久亚洲精品中文字幕蜜潮| 公与淑婷厨房猛烈进出| 国产亚洲精久久久久久无码77777 丝袜足控一区二区三区 | 亚洲精品国偷拍自产在线观看|