吳劍英+杜勇+趙忠華
【摘要】 本文主要探究云計算平臺下的語音信號處理技術(shù)應(yīng)用,在傳統(tǒng)的處理方式中,主要是通過單臺計算機(jī)來完成,而云計算模式下,通過MapReduce模型及SVM信號處理,可以將數(shù)據(jù)信息通過多臺計算機(jī)來完成,提升了準(zhǔn)確率和效率。
【關(guān)鍵詞】 云計算平臺 SVM MapReduce模型
前言:
隨著科技的不斷發(fā)展,研究人員致力于通過機(jī)器來讀取人們的情感,加強(qiáng)人機(jī)交互能力[1]。而在人機(jī)交互中,語音信號處理技術(shù)是重要的手段。因此,探究云計算平臺下語音信號處理技術(shù)的應(yīng)用具有重要的價值。
一、漢語語音識別特征
在現(xiàn)代語音識別系統(tǒng)中,神經(jīng)網(wǎng)絡(luò)、K近鄰法以及貝葉斯分類器均對情感的識別具有一定的效果[2]。而云計算模式下,對語音信號進(jìn)行處理,是通過對短時能量相關(guān)特征參數(shù)、基音頻率相關(guān)特征參數(shù)以及共振峰頻率相關(guān)特征參數(shù)等參數(shù)的識別來完成,其可以對數(shù)據(jù)信號進(jìn)行泛化處理,明確各種情感的信號波動變化,具有較高的準(zhǔn)確率和處理效率。
二、MapReduce模型分析
MapReduce模型是將數(shù)據(jù)通過多臺計算機(jī)進(jìn)行處理的過程,在節(jié)點(diǎn)的計算中,對各個計算機(jī)的記過進(jìn)行合成,其主要過程包括以下幾種:Map、Partition、Sort以及Reduce等[3]。Map的執(zhí)行過程是將處理任務(wù)分配到多臺計算機(jī)中,Reduce的過程是對計算機(jī)的處理結(jié)果進(jìn)行合成。在Map過程中,系統(tǒng)會將龐大的數(shù)據(jù)信息劃分為固定若干片段,將片段分解為鍵值對(K1,V1),之后會通過Hadoop平臺來分析相關(guān)任務(wù),建立Map函數(shù),通過鍵值對計算出相應(yīng)的結(jié)果(K2,V2),根據(jù)計算結(jié)果,可以將數(shù)據(jù)進(jìn)行排序。在Reduce過程中,計算系統(tǒng)會將Map計算結(jié)果進(jìn)行綜合排序,通過輸入排序,可以獲取原始數(shù)據(jù)(K1,V1)??梢?,在云計算平臺下,對MapReduce模型進(jìn)行綜合應(yīng)用分析,可以實(shí)現(xiàn)對語音信號的綜合處理,具有重要的應(yīng)用價值。
三、SVM信號處理
在云計算的環(huán)境下,采用Hadoop平臺,可以實(shí)現(xiàn)并行計算,具有較高的效率及準(zhǔn)確率。通過Reduce以及Map操作系統(tǒng)進(jìn)行數(shù)據(jù)處理,可以將分析任務(wù)分配到多臺計算機(jī)中進(jìn)行,提升了系統(tǒng)的計算效率。在數(shù)據(jù)分析過程中,通過Map操作,可以對計算節(jié)點(diǎn)的數(shù)據(jù)進(jìn)行向量計算,通過匯總,得出向量AIISVs,再通過模型的建立,可以求出測試結(jié)果 Rs,經(jīng)過Reduce處理獲取最終判定結(jié)果。在SVM信號處理中,其主要包括模型如下:第一,預(yù)處理過程,根據(jù)HDFS的需求,對數(shù)據(jù)進(jìn)行分塊,分解數(shù)據(jù)塊,以此來分配到計算機(jī)中。第二,在建立模型時,需要初始化相關(guān)數(shù)據(jù),通過RBF核函數(shù)進(jìn)行綜合分析。第三,通過模型進(jìn)行語音識別訓(xùn)練,對測試數(shù)據(jù)進(jìn)行優(yōu)化。通過SVM信號處理系統(tǒng),可以實(shí)現(xiàn)對語音信號的并行計算,提升了計算的準(zhǔn)確率。
四、實(shí)驗(yàn)論證
在云計算平臺下的語音信號處理中,通過實(shí)驗(yàn)可以進(jìn)行驗(yàn)證。實(shí)驗(yàn)主機(jī)為Name Node 型號,CPU是i5 4950處理器。內(nèi)存是8GB,硬盤位500GB,Hadoop的版本型號為1.02。在實(shí)驗(yàn)中,采用千兆交換機(jī)進(jìn)行連接,對漢語語言情感數(shù)據(jù)庫數(shù)據(jù)進(jìn)行綜合分析,在本次研究中,在數(shù)據(jù)庫中抽取憤怒、恐懼、愉悅以及平靜四個情緒數(shù)據(jù),采用語音進(jìn)行識別,共選取600條數(shù)據(jù),基于云就是那平臺下的語音信號處理結(jié)果如表1所示。
從表1的數(shù)據(jù)中可以看出,語音識別的準(zhǔn)確率在70%左右,基本可以滿足使用需求,另外,本次研究采用Hadoop集群平臺,在處理的過程中,加速比達(dá)到3.8.說明在云計算模式下,對語音信號進(jìn)行處理,具有更高的效率。
五、結(jié)語
情感識別已經(jīng)成為現(xiàn)代人機(jī)交互的重要識別過程,本文主要對云計算平臺下的語音信號識別進(jìn)行分析,通過提取相關(guān)參數(shù),對模型進(jìn)行泛化測試。另外,通過MapReduce模型及SVM信號處理,可以提升語音信號處理效率。經(jīng)過試驗(yàn)論證,云計算模式下的語音信號識別準(zhǔn)確率達(dá)到70%以上,具有較強(qiáng)的優(yōu)勢。
參 考 文 獻(xiàn)
[1]王鼎,錢科軍,高一丹,等.云計算平臺技術(shù)及其在電網(wǎng)調(diào)度中的應(yīng)用[J].電網(wǎng)與清潔能源,2015,04:72-78.
[2]孟祥萍,周來,王暉,等.云計算技術(shù)在未來智能電網(wǎng)信息處理平臺中的應(yīng)用[J].計算機(jī)測量與控制,2015,10:3508-3511.
[3]丁巖,楊慶平,錢煜明.基于云計算的數(shù)據(jù)挖掘平臺架構(gòu)及其關(guān)鍵技術(shù)研究[J].中興通訊技術(shù),2013,01:53-56.