呂志浩+馬赫+魯潤(rùn)南
摘 要 隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,語音情感識(shí)別成為人工智能領(lǐng)域的研究熱點(diǎn)。語音情感識(shí)別包括語音信號(hào)預(yù)處理、特征參數(shù)提取和情感識(shí)別分類器等。本文著重對(duì)語音情感的特征提取方法與特征計(jì)算的分類進(jìn)行研究,采用對(duì)情感語音進(jìn)行預(yù)處理,包括抗混疊濾波、預(yù)加重、加窗以及端點(diǎn)檢測(cè)等,對(duì)高興、憤怒和悲傷3種語音情感提取短時(shí)能量、過零率、短時(shí)幅度以及MFCC等參數(shù),根據(jù)柏林情感語音庫中的90句情感語音,使用模糊K近鄰算法對(duì)語音的3種情感進(jìn)行識(shí)別。
關(guān)鍵詞 語音情感;特征提取;模糊K近鄰算法
中圖分類號(hào) TP3 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1674-6708(2016)172-0279-02
K近鄰算法運(yùn)用統(tǒng)計(jì)學(xué)的方式,即“物以類聚”的簡(jiǎn)便方式將待測(cè)樣本與訓(xùn)練樣本中K個(gè)距離權(quán)重最近的類別分為一種類別[ 1 ]。這種方式簡(jiǎn)單快捷,易于實(shí)施,但也存在相應(yīng)不足之處,譬如,需要計(jì)算所有待測(cè)樣本進(jìn)入決策,存在一定決策風(fēng)險(xiǎn)與冗余度大的缺點(diǎn),為突破以往的K近鄰算法的瓶頸,下面提出一種基于模糊集理論K近鄰算法進(jìn)行整改,并通過Matlab 2014軟件進(jìn)行實(shí)驗(yàn)仿真的方式驗(yàn)證其在語音情感特征提取的作用。
1 K近鄰分類算法以及模糊集理論
1.1 K近鄰分類算法
K近鄰(K-Nearest Neighbor, KNN)算法基本原理較為簡(jiǎn)便[ 2 ],即在一個(gè)多維度空間內(nèi)Rn內(nèi),計(jì)算待測(cè)樣本中的矩陣數(shù)據(jù)x,依次與該空間內(nèi)的其他已訓(xùn)練好的樣本數(shù)據(jù)求距離,而后選取數(shù)值K個(gè)樣本點(diǎn),各不同訓(xùn)練樣本比較距離值的大小,則待測(cè)樣本的類別就被分類在距離值最多的那一類中來。
5)然后再利用FKNN進(jìn)行識(shí)別分類。
2 基于FKNN 的語音情感識(shí)別實(shí)驗(yàn)
首先介紹一下實(shí)驗(yàn)環(huán)境:筆記本電腦4G/2G,Windows7系統(tǒng)/Matlab2014,所選語音數(shù)據(jù)庫為柏林語音情感庫(16kHz 16Bit量化的單聲道wav格式)。各分為3類語句:高興、悲傷、憤怒各30段不同語句的語音段。實(shí)驗(yàn)選取3種情感分類(高興、悲傷、憤怒),分別對(duì)3種感情進(jìn)行短時(shí)特征參數(shù)的提取。
2.1 實(shí)驗(yàn)過程
該實(shí)驗(yàn)的特征參數(shù)提取大致流為:讀取語音文件,通過加漢明窗分幀,計(jì)算短時(shí)能量、幅度、過零率。使用Matlab 2014對(duì)樣本語音進(jìn)行特征提取并記錄相關(guān)統(tǒng)計(jì)結(jié)果進(jìn)行分析,而后對(duì)每一樣本進(jìn)行訓(xùn)練,提取其參數(shù)結(jié)果。
2.2 實(shí)驗(yàn)結(jié)果分析
實(shí)驗(yàn)對(duì)比了未改進(jìn)的KNN算法與改進(jìn)后的FKNN算法分別采用兩種實(shí)驗(yàn),其中K的取值不同。具體結(jié)果如圖1所示。
3 結(jié)論
通過圖表分析可得通過改進(jìn)后的算法對(duì)語音情感的提取更為準(zhǔn)確,可以提到2個(gè)百分點(diǎn)。隨著k值得增大,識(shí)別的效果越好,當(dāng)然所需時(shí)間也增加。整個(gè)識(shí)別過程中不管是KNN還是FKNN對(duì)憤怒識(shí)別率都較其他情感高??傮w來說,模糊K近鄰算法在考慮到各參數(shù)對(duì)語音情感提取的權(quán)重不同進(jìn)行合理了的“協(xié)調(diào)”使得實(shí)驗(yàn)結(jié)果更加令人滿意。
參考文獻(xiàn)
[1]王吉林,夏菽蘭,趙力.基于模糊K近鄰的模糊支持向量機(jī)的語音情感識(shí)別[J].微電子學(xué)與計(jì)算機(jī),2014(4).
[2]Hui Wang.Nearest neighbors by neighborhood counting. Pattern Analysis and Machine Intelligence, IEEE Transactions on .2006.
[3]韓文靜,李海峰,阮華斌,等.語音情感識(shí)別研究進(jìn)展綜述[J].軟件學(xué)報(bào),2014,25(1):37-50.
[4]金鑫.淺談情感模型及建模方法研究[J].科技創(chuàng)新與生產(chǎn)力,2015(11):55-56.