徐國(guó)成
摘 要:本系統(tǒng)設(shè)計(jì)的智能家居系統(tǒng),是基于LD3320語(yǔ)音識(shí)別芯片的非特定人識(shí)別的功能而設(shè)計(jì)的,實(shí)現(xiàn)語(yǔ)音控制設(shè)計(jì)了了兩級(jí)語(yǔ)音指令來(lái)控制,控制電位器打開(kāi)與關(guān)閉,進(jìn)而來(lái)控制與之相連的電器,實(shí)現(xiàn)用戶(hù)發(fā)出語(yǔ)音指令后精確控制電器開(kāi)、關(guān)的功能,可以給我們的生活帶來(lái)極大的便利。
關(guān)鍵詞:語(yǔ)音識(shí)別;單片機(jī)
0 引言
語(yǔ)音處置和分辨技術(shù)始于1950年以后,經(jīng)過(guò)70年科研人員的不斷摸索和鉆研,已趨于成熟,從孤立、單一詞組的識(shí)別到非固定人、大詞匯量的連續(xù)語(yǔ)音識(shí)別甚至固定人的語(yǔ)音識(shí)別,一系列的創(chuàng)新使得人類(lèi)與計(jì)算機(jī)之間的溝通橋梁增加了一個(gè)人類(lèi)語(yǔ)音。近年來(lái),作為直接有效的人與機(jī)器之間的交互方式,語(yǔ)音識(shí)別在工業(yè)制造過(guò)程、現(xiàn)代化居家生活和醫(yī)療衛(wèi)生體系等方面應(yīng)用逐漸增加,在嵌入式系統(tǒng)領(lǐng)域中,具有很高研究?jī)r(jià)值及發(fā)展?jié)摿Α?/p>
讓機(jī)械理解聽(tīng)懂人類(lèi)的聲音,這是我們長(zhǎng)期以來(lái)求之不得的事情。語(yǔ)音識(shí)別是一個(gè)復(fù)雜有深度的學(xué)科,涉及到多學(xué)科、多領(lǐng)域的研究分析,語(yǔ)音識(shí)別的發(fā)展與其他領(lǐng)域密不可分,依賴(lài)于眾多領(lǐng)域上的研究成果。語(yǔ)音識(shí)別技術(shù)就是讓機(jī)器通過(guò)分辨和聽(tīng)懂人們的語(yǔ)言,把聲音信號(hào)轉(zhuǎn)換為對(duì)應(yīng)的機(jī)械動(dòng)作或者指令的一種高新技術(shù)。
語(yǔ)音識(shí)別系統(tǒng)的分類(lèi)方式及依據(jù)是根據(jù)對(duì)說(shuō)話(huà)人說(shuō)話(huà)方式的要求,可以大致分為兩類(lèi),一類(lèi)是:?jiǎn)蝹€(gè)字(詞)語(yǔ)音識(shí)別系統(tǒng),另一類(lèi)是:多個(gè)字語(yǔ)音識(shí)別系統(tǒng),以及多個(gè)詞組語(yǔ)音識(shí)別系統(tǒng)。深一步可以分為兩個(gè)方向:一是根據(jù)對(duì)說(shuō)話(huà)人的關(guān)聯(lián)程度可以劃分為固定人和非固定人語(yǔ)音識(shí)別系統(tǒng);二是根據(jù)字詞數(shù)量的多少,可以分為小詞組系統(tǒng)、中等詞組系統(tǒng)、大詞組系統(tǒng),以及無(wú)限詞組系統(tǒng)。不同的語(yǔ)音識(shí)別系統(tǒng),每種系統(tǒng)的實(shí)現(xiàn)方式可能不一樣,單是所用的基礎(chǔ)處理方式大致都一樣。
1 系統(tǒng)方案設(shè)計(jì)
此次設(shè)計(jì)制作的語(yǔ)音控制系統(tǒng),語(yǔ)音識(shí)別部分核心原件使用的LD3320芯片,控制系統(tǒng)的單片機(jī)用的是STC89C52單片機(jī)。通過(guò)主控單片機(jī)控制LD3320語(yǔ)音芯片內(nèi)部寄存器以此達(dá)到實(shí)現(xiàn)語(yǔ)音識(shí)別控制的效果。通過(guò)聲音采集器將聲音信息采集傳送到LD3320進(jìn)行頻譜解析,解析后將獲取到的語(yǔ)音特點(diǎn)和自定義的識(shí)別詞組列表中的關(guān)鍵詞組進(jìn)行對(duì)比匹配,找出關(guān)鍵詞組作為語(yǔ)音識(shí)別結(jié)果輸出給主控單片機(jī),單片機(jī)根據(jù)不同的語(yǔ)音輸入情況改變P1端口的電頻實(shí)現(xiàn)對(duì)家用電器的智能控制。
2 硬件電路設(shè)計(jì)
2.1 控制模塊設(shè)計(jì)
系統(tǒng)主控單元采用是STC89C52型單片機(jī)。與其他單片機(jī)相比STC89C52具有較強(qiáng)的數(shù)據(jù)處理功能,且I/O口控制靈活。
2.2 語(yǔ)音識(shí)別模塊設(shè)計(jì)
采用LD3320 芯片作為語(yǔ)音識(shí)別芯片,該芯片之所以不需要接外部存儲(chǔ)設(shè)備,是因?yàn)樗鼉?nèi)部已經(jīng)集成了大量的簡(jiǎn)便算法,識(shí)別起來(lái)快速并且穩(wěn)定性很高,因此廣受設(shè)計(jì)者的使用,在完成非特定人的語(yǔ)音識(shí)別時(shí),使用LD3320芯片就不需要使用者在使用前來(lái)錄取聲音作為標(biāo)本,語(yǔ)音識(shí)別率波動(dòng)性一直都較小,誤差率要比較低。
2.3語(yǔ)音識(shí)別原理
語(yǔ)音識(shí)別主要原理是:先分析語(yǔ)音特征,建立起合理的需要識(shí)別的語(yǔ)言模型,再將這些模型轉(zhuǎn)化為語(yǔ)音指令詞語(yǔ)列表,寫(xiě)入LD3320芯片內(nèi),然后通過(guò)聲音采集器獲取語(yǔ)音特征樣本,將采集到的聲音信號(hào)送入芯片內(nèi)部,然后芯片將收到的信息進(jìn)行分析,提取特征,并根據(jù)它內(nèi)部的特殊算法和編輯好的關(guān)鍵詞列表一一匹配,將匹配結(jié)果一串口的形式發(fā)給單片機(jī)。
3 系統(tǒng)軟件設(shè)計(jì)
3.1 系統(tǒng)初始化
在開(kāi)始識(shí)別之前,需要你對(duì)系統(tǒng)進(jìn)行初始化操作。接通好電源后,給單片機(jī)提供電源,程序開(kāi)始執(zhí)行,調(diào)用初始化函數(shù)對(duì)單片機(jī)進(jìn)行初始化處理,然后指示燈是否正常量滅,以此來(lái)驗(yàn)證單片機(jī)是否工作。緊接著對(duì)LD3320其進(jìn)行初始化,再對(duì)串口進(jìn)行初始化,設(shè)置語(yǔ)音模塊寄存器對(duì)其識(shí)別指令、ASR進(jìn)行初始化操作。
3.2 指令設(shè)置
為降低其他音源影響,減小識(shí)別誤差,本系統(tǒng)使用兩級(jí)指令進(jìn)行控制。在程序中定義多個(gè)維度的數(shù)組的寫(xiě)入我們需要識(shí)別的關(guān)鍵詞,設(shè)置開(kāi)始時(shí)的語(yǔ)音指令為“智能家居”,第二次語(yǔ)音指令為“開(kāi)燈”、“關(guān)燈”,“開(kāi)空調(diào)”、“關(guān)空調(diào)”、“開(kāi)窗簾”、“關(guān)窗簾”、“開(kāi)電視”、“關(guān)電視”等;所有的指令,都是以漢字拼音的方式添加數(shù)組中,作為識(shí)別關(guān)鍵字,例如添加“智能家居”命令,則寫(xiě)入其漢字拼音“zhi neng jia ju”,漢字拼音之間需要用空格隔開(kāi)。當(dāng)語(yǔ)音模塊采集到語(yǔ)音指令“智能家居”時(shí),提示燈閃爍一下,表示采集到聲音,然后接收到語(yǔ)音指令“開(kāi)空調(diào)”時(shí),空調(diào)自動(dòng)打開(kāi),接收語(yǔ)音指令“關(guān)空調(diào)”時(shí),空調(diào)自動(dòng)關(guān)閉。
3.3 中斷處理
當(dāng)語(yǔ)音模塊采集到音頻信號(hào)時(shí),返回語(yǔ)音模塊內(nèi)部寄存器的識(shí)別狀態(tài)碼,進(jìn)入到單片機(jī)中斷處理函數(shù),開(kāi)始執(zhí)行識(shí)別驗(yàn)證,如果讀取到的識(shí)別狀態(tài)碼在寄存器中有相應(yīng)的存儲(chǔ)值與其匹配,那么可以認(rèn)為語(yǔ)音指令正確,將數(shù)據(jù)通過(guò)串口串口傳送給主控單片機(jī),單片機(jī)接收到語(yǔ)音模塊的信號(hào)后控制相應(yīng)的引腳進(jìn)行高低電平輸出,進(jìn)而控制燈泡量滅。
4 系統(tǒng)測(cè)試
4.1? 綜合調(diào)試
把硬件系統(tǒng)和軟件系統(tǒng)進(jìn)行整合,對(duì)期間出現(xiàn)的故障進(jìn)行排除,使兩者融合,實(shí)現(xiàn)完整的系統(tǒng)功能。選取了不同的人來(lái)進(jìn)行測(cè)試,以此來(lái)驗(yàn)證系統(tǒng)的對(duì)非特定人的語(yǔ)音識(shí)別效果,判定系統(tǒng)功能的穩(wěn)定性,每個(gè)人都進(jìn)行了20次測(cè)試,本語(yǔ)音識(shí)別對(duì)于非特定人的識(shí)別誤差率控制在10%以?xún)?nèi),識(shí)別正確率達(dá)到設(shè)計(jì)預(yù)期要求。
5 結(jié)論
本語(yǔ)音識(shí)別控制系統(tǒng)用的是價(jià)格較低廉LD3320語(yǔ)音識(shí)別芯片作為識(shí)別主要部件而設(shè)計(jì)、制作的。芯片LD3320擁有強(qiáng)大的非特定人語(yǔ)音識(shí)別能力,能夠?qū)崟r(shí)修改編寫(xiě)識(shí)別詞組列表,使用者只需要把要識(shí)別的語(yǔ)音關(guān)鍵字的拼音,寫(xiě)入到LD3320芯片就可以進(jìn)行識(shí)別。某種意義上說(shuō)做到了單個(gè)芯片的語(yǔ)音識(shí)別,大量的語(yǔ)音識(shí)別搜索引擎以及海量的語(yǔ)音記錄都被集成在芯片里面,內(nèi)部配置完整高效的模數(shù)/數(shù)模轉(zhuǎn)換電路,用52級(jí)別的單片機(jī)采用并口連接的方式與LD3320相連,就可以實(shí)現(xiàn)語(yǔ)音識(shí)別功能。
參考文獻(xiàn)
[1]十六位單片機(jī)未處理器原理及應(yīng)用.張培仁等編著.清華大學(xué)出版社2005.05
[2]實(shí)用語(yǔ)音識(shí)別基礎(chǔ).王炳錫等編著,國(guó)防工業(yè)出版社.2005.01
[3]單片機(jī)語(yǔ)音技術(shù)及凌陽(yáng)16位51單片機(jī)應(yīng)用.李晶皎編著.北京航空社.2003.11
[4]數(shù)字語(yǔ)音處理.姚天任主編,華中工學(xué)院出版社,1992.04
[5]胡光銳,語(yǔ)音處理與識(shí)別,上海科學(xué)技術(shù)文獻(xiàn)出版社,1994.
[6]趙立,語(yǔ)音信號(hào)處理,機(jī)械工業(yè)出版社,2003.
[7]全國(guó)大學(xué)生電子設(shè)計(jì)競(jìng)賽組委會(huì).全國(guó)大學(xué)生電子設(shè)計(jì)競(jìng)賽獲獎(jiǎng)作品選編.北京:北京理工大學(xué)出版社,2005.