摘要:本文介紹了基于嵌入式操作系統(tǒng)Windows CE和ARM平臺的語音識別系統(tǒng),該系統(tǒng)使用了小波神經(jīng)網(wǎng)絡(luò)技術(shù)。系統(tǒng)使用S3C2410芯片進行控制和語音識別,使用SPCE061A芯片完成訓練算法、語音信號特征提取,具有較好的可移植性,在小波神經(jīng)網(wǎng)絡(luò)算法的幫助下,系統(tǒng)有較高的識別率。
關(guān)鍵詞:小波;神經(jīng)網(wǎng)絡(luò);語音識別;嵌入式系統(tǒng)
中圖分類號:TP311.52 文獻標識碼:A 文章編號:1007-9599 (2012) 09-0000-02
一、引言
語音識別是將人類語音信號進行預處理、特征提取,然后和測試、訓練后存儲在計算機中的標準模型進行比較,得出判定和識別結(jié)果。從本質(zhì)上講,語音識別是通過先進的計算機、信號處理技術(shù)將語音信號轉(zhuǎn)變?yōu)橛嬎銠C可以識別的二進制編碼,并進行處理的技術(shù)。語音識別技術(shù)在智能家電、工業(yè)現(xiàn)場控制、機器人等領(lǐng)域有廣闊的應用前景。
早期的語音識別技術(shù)多基于線性系統(tǒng)理論,但人的發(fā)音是復雜的非線性過程,以線性系統(tǒng)理論為基礎(chǔ)的語音識別技術(shù)局限性較大。近年來,非線性技術(shù)逐漸運用到了語音識別領(lǐng)域,國內(nèi)外學者研究較多的理論有人工神經(jīng)網(wǎng)絡(luò)、小波變換等非線性技術(shù)。
小波變化具有時頻局部性等特點,神經(jīng)網(wǎng)絡(luò)具有自適應性好、容錯性強等優(yōu)點,結(jié)合以上兩種技術(shù)的優(yōu)點,本文介紹了一種基于小波變換神經(jīng)網(wǎng)絡(luò)的嵌入式語音識別系統(tǒng),該系統(tǒng)是智能輪椅的組成部分,可以讓輪椅使用者通過語音直接控制輪椅的行動。
二、系統(tǒng)設(shè)計
(一)語音識別原理概述
現(xiàn)有技術(shù)條件下,語音識別一般分為兩個步驟,第一步是系統(tǒng)訓練, 第二步是語音識別。在系統(tǒng)訓練階段, 核心任務是基于選定的識別方法,建立基本語音單元的聲學模型,進而得到語音特征參數(shù),這一過程也稱為“學習”。在語音識別階段,系統(tǒng)使用特定算法提取語音信號的特征參數(shù),根據(jù)一定判別準則和系統(tǒng)模型進行比較,得出識別結(jié)果。語音識別的原理如圖1所示。