許永樂
摘 要:目前,大部分家電設(shè)備操控均是選擇單獨(dú)的遙控設(shè)備,經(jīng)過獨(dú)立分開的微處理芯片幫助控制。然而智能家庭語音遙控系統(tǒng)屬于一類嵌入類式集成系統(tǒng),其也是一類非接觸類型識別技術(shù)。這種遙控系統(tǒng)是通過使用者的聲音來實現(xiàn)控制設(shè)備的開關(guān)操作。
關(guān)鍵詞:智能;語音遙控系統(tǒng);語音識別
所謂語音識別技術(shù)指的是設(shè)備經(jīng)過識別過程以及理解環(huán)節(jié)將用戶聲音信號轉(zhuǎn)換成對應(yīng)的命令信號或是文本信息的一類高新技術(shù)[1]。近年來,語音識別不斷被運(yùn)用在科研領(lǐng)域事業(yè),使得語音識別技術(shù)不斷得到完善、成熟,而語音識別技術(shù)在日常生活中的應(yīng)用具有很大的發(fā)展空間,為人們的日常工作、生活提供了很大的便利。
1 語音系統(tǒng)工作原理簡單介紹
系統(tǒng)通過向使用者提供一定的語音命令學(xué)習(xí)以及識別功能,使用者事先針對家電設(shè)備的遙控語音信號以及紅外或RF無線信號完成配對學(xué)習(xí)以及存儲操作??刂婆_在進(jìn)行運(yùn)作中,語音系統(tǒng)利用輸入進(jìn)來的語音信號來完成命令識別,按照識別所得結(jié)果來進(jìn)行動作查找,查找位置為內(nèi)部結(jié)構(gòu)的動作庫,然后通過指定的紅外或RF無線信號輸出通道輸出配對精確的控制信號,再對各種家電設(shè)備實行遙控,從而實現(xiàn)語音系統(tǒng)控制臺的功能作用。
2 語音識別系統(tǒng)中簡單命令菜單分析
這個命令菜單主要包括:讀取命令、刪除命令以及添加命令三個不同內(nèi)容。使用者可以按照實際需要來選擇命令,其中Cancel鍵可以返回上級菜單命令,現(xiàn)主要分析刪除和添加命令。
2.1 分析刪除命令
這個命令的操作較簡單,使用者需要將待刪除命令的相關(guān)口令輸入進(jìn)去并按下OK鍵就能完成。這一過程中若系統(tǒng)尋找到對應(yīng)的命令內(nèi)容就會出現(xiàn)“刪除成功”提示,否則系統(tǒng)就會提示“刪除失敗”信息。
2.2 分析添加命令
首先實現(xiàn)一個新命令的添加操作包括:口令錄入以及紅外線信號錄入。使用者可以通過麥克風(fēng)設(shè)備進(jìn)行多次口令錄入操作,而系統(tǒng)會顯示已經(jīng)完成錄入的口令內(nèi)容,例如:關(guān)閉空調(diào)、開空調(diào)等。除此之外,使用者也應(yīng)使該遙控系統(tǒng)記錄好與該口令內(nèi)容相對的紅外線信號,在紅外線遙控器中按下關(guān)閉按鈕。完成這兩個操作內(nèi)容,新命令內(nèi)容就添加成功完成了。
3 語音識別系統(tǒng)中的關(guān)鍵技術(shù)介紹
3.1 語音識別技術(shù)
整個系統(tǒng)結(jié)構(gòu)的核心內(nèi)容是語音識別技術(shù),大部分系統(tǒng)功能均可以通過語音識別系統(tǒng)來幫助推動各系統(tǒng)運(yùn)作[2]。而語音識別模塊設(shè)計質(zhì)量以及運(yùn)行有效性會對整個系統(tǒng)功能運(yùn)行情況產(chǎn)生重要影響。該系統(tǒng)設(shè)計工作包括很多學(xué)科內(nèi)容以及很多技術(shù)難點(diǎn),并且一個企業(yè)在短期內(nèi)自行投入資金研究語音識別相關(guān)技術(shù)算法要花費(fèi)很多費(fèi)用,這種做法不現(xiàn)實??梢栽谝延姓Z音識別系統(tǒng)基礎(chǔ)上,采用該系統(tǒng)的API來實現(xiàn)系統(tǒng)功能。在進(jìn)行研發(fā)過程中,可以選用SAPI15.0來充當(dāng)技術(shù)研發(fā)平臺。其中,SAPISDK產(chǎn)品是微軟公司開發(fā)的一個語音應(yīng)用方面的開發(fā)工具包,該工具包中包括有SAPI、語音合成引擎以及語音識別引擎等。而SAPI內(nèi)容中含有訓(xùn)練導(dǎo)向、語音識別管理、資源以及語法編譯等設(shè)計接口。
其中,語音引擎可以通過SAPI和DDI層實現(xiàn)交互工作,而應(yīng)用程序可以通過這兩個接口來實現(xiàn)通信。熟悉使用API,可以使設(shè)計者更好、更快的實現(xiàn)語音識別應(yīng)用系統(tǒng)。為了提高系統(tǒng)底層結(jié)構(gòu)能力,可以在系統(tǒng)中增加命令列表識別以及語音模糊化功能。前者是采用SAPIA所具有的語法構(gòu)造能力,而構(gòu)造僅會識別特定命令列表內(nèi)容的一種識別設(shè)備。其中語音模糊化是通過采用某一個算法程序把一個精確的漢子變化為一個讀音信息從而實現(xiàn)模糊匹配。
3.2 2.4G無線通信技術(shù)
隨著無線通信技術(shù)的發(fā)展,2.4G無線通信技術(shù)日益受到重視和使用,原因有三:首先它是一個全球性的頻段,開發(fā)的產(chǎn)品具有全球通用性;其次,它整體的頻寬勝于其他ISM頻段,這就提高了整體數(shù)據(jù)傳輸速率,允許系統(tǒng)共存;第三就是產(chǎn)品尺寸,2.4GHz通信芯片和天線的體積相當(dāng)小。
2.4G無線技術(shù)采用全雙工模式傳輸,傳送速率高達(dá)2 Mbps,抗干擾性能比之前的315、433、868、915MHz有絕對的優(yōu)勢;對于較大容量的數(shù)據(jù)傳輸更具吸引力,如雙向語音傳輸、光標(biāo)控制、游戲手柄等功能。
2.4G無線通信技術(shù)中常用的芯片有挪威Nordic公司的nRF24LE1無線芯片模組、以色列RFWave公司的RFW102無線芯片模組等。例如根據(jù)設(shè)計需求、性能及成本估算,可以采用nRF24LE1和nRF24LU1+作為處理主芯片進(jìn)行數(shù)據(jù)傳輸。nRF24LE1用作每個節(jié)點(diǎn)的收發(fā)主控芯片,其內(nèi)部有增強(qiáng)型的8051 MCU和內(nèi)嵌2.4G低功耗無線收發(fā)內(nèi)核nRF24L01P兩個部分,傳輸速率最高達(dá)到2 Mbps,保證大容量數(shù)據(jù)的無線快速傳輸。MCU和無線收發(fā)內(nèi)核之間通過SPI接口進(jìn)行通信。
4 結(jié)語
綜上所述,智能家庭語音識別系統(tǒng)在日常應(yīng)用過程中不僅方便,而且其軟硬件還具有較大范圍的擴(kuò)張作用。其中搜索引擎與系統(tǒng)相互結(jié)合能具備一個功能強(qiáng)大的語音搜索功能。若能深入識別該系統(tǒng)的加密功能,然后對各命令內(nèi)容實現(xiàn)安全等級劃分,例如幫助禁止一些特定命令內(nèi)容的使用,幫助識別兒童的聲音,防止兒童啟動電氣設(shè)備等。該系統(tǒng)中還可以在硬件設(shè)備上進(jìn)行擴(kuò)展,比如:通過語音來幫助控制門的開關(guān)以及窗簾的伸展和拉緊。
[參考文獻(xiàn)]
[1]薛同澤,陳書旺.語音識別的智能門控系統(tǒng)設(shè)計[J].微計算機(jī)信息.2008(14):86-89.
[2]陳立文,王盛邦,鄺宇恒,朱建新,王國楓.智能家庭語音遙控系統(tǒng)的設(shè)計與實現(xiàn)[J].2008(06):155-157.