林發(fā)輝
【摘要】 本文對(duì)室內(nèi)語音無線識(shí)別及求救設(shè)備的設(shè)計(jì)思路和主要技術(shù)進(jìn)行了分析和設(shè)計(jì)。設(shè)備運(yùn)行過程中,以單片機(jī)為主控芯片,主要應(yīng)用語音識(shí)別和無線傳輸兩個(gè)環(huán)節(jié)完成呼救音的識(shí)別和呼救監(jiān)控的觸發(fā),能夠?qū)⑶缶刃畔⒓皶r(shí)傳遞給救援人員,保證了家居安防和人們的生命財(cái)產(chǎn)安全。
【關(guān)鍵詞】 單片機(jī) 語音識(shí)別 無線求救 室內(nèi)安全
一、前言
及時(shí)報(bào)警在家居安防監(jiān)控過程中非常重要。在很多場合下,遇險(xiǎn)后報(bào)警人是無法通過正常方式報(bào)警的,例如入室搶劫時(shí)被害人會(huì)被蒙住嘴和眼睛,突發(fā)疾病的人無法清晰、大聲的求救。因此,在出現(xiàn)突發(fā)情況時(shí),簡單的聲音呼救是沒有效果的,必須通過一定的識(shí)別設(shè)備,及時(shí)接收并識(shí)別輕微的、模糊的聲音,這對(duì)提高家居環(huán)境的安全度具有重要的意義。在實(shí)際應(yīng)用過程中,識(shí)別設(shè)備在接收到真的呼救信號(hào)后,能夠觸發(fā)監(jiān)控探頭將現(xiàn)場的圖像記錄下來,并將信息及時(shí)傳遞到救援機(jī)構(gòu)或報(bào)警人親屬,這樣就能讓報(bào)警人獲得便捷、快速和有效的保護(hù)。本文基于單片機(jī)構(gòu)建了一套室內(nèi)語音識(shí)別及無線求助系統(tǒng),該系統(tǒng)實(shí)現(xiàn)了室內(nèi)報(bào)警語音的識(shí)別和報(bào)警信號(hào)的傳輸,創(chuàng)新地將無線通信技術(shù)和語音識(shí)別技術(shù)結(jié)合起來。從實(shí)際情況出發(fā),使得家居用戶在緊急情況發(fā)生時(shí)不需要尋找報(bào)警和通訊設(shè)備,只需要?jiǎng)涌诰湍芡瓿汕缶裙ぷ鳌?/p>
二、系統(tǒng)框架分析
2.1主控芯片
本系統(tǒng)主要基于STM8系列的單片機(jī)對(duì)室內(nèi)語音識(shí)別系統(tǒng)進(jìn)行設(shè)計(jì)。單片機(jī)作為系統(tǒng)的主控芯片,對(duì)整個(gè)系統(tǒng)的架構(gòu)設(shè)計(jì)優(yōu)化、信息傳輸速度提升、系統(tǒng)開發(fā)維護(hù)都具有重要的作用。該系列的單片機(jī)包含8位框架結(jié)構(gòu),其中,CPU包含6個(gè)寄存器,這些寄存器對(duì)提高數(shù)據(jù)的訪問和處理能力十分重要。另外,該系列單片機(jī)具有支持20個(gè)尋址方式和80個(gè)基本語句的指令集,并且CPU的所有寄存器都具有可尋址地址。而且,該系統(tǒng)的單片機(jī)保密功能良好,目前處于世界領(lǐng)先的地位,對(duì)保護(hù)我們的知識(shí)產(chǎn)權(quán),維護(hù)項(xiàng)目成果在市場競爭中的正當(dāng)性具有重要的意義。
2.2系統(tǒng)流程控制
當(dāng)出現(xiàn)求救信號(hào)后,系統(tǒng)首先使用麥克風(fēng)采集室內(nèi)的語音信息,然后在通過無線傳輸模塊將聲音信號(hào)轉(zhuǎn)化成電信號(hào)并傳送給單片機(jī),在微控制器——單片機(jī)的控制下,首先由語音識(shí)別模塊對(duì)聲音信號(hào)進(jìn)行判斷和分析,如果確認(rèn)收到的信號(hào)為求救信號(hào),則當(dāng)單片機(jī)收到語音識(shí)別模塊確認(rèn)后,將控制通信模塊將求救信息發(fā)送出去。同時(shí),設(shè)備的液晶顯示屏上會(huì)出現(xiàn)求救時(shí)間的發(fā)生時(shí)間,設(shè)備喇叭會(huì)發(fā)出報(bào)警聲,直到使用按鍵輸入后才能取消報(bào)警。詳細(xì)的系統(tǒng)流程控制圖如圖1所示。
三、語音識(shí)別控制
本系統(tǒng)中的語音識(shí)別是設(shè)備的重要組成部分。使用語音識(shí)別是提高室內(nèi)安防效果的重要途徑。按照實(shí)際的需求,報(bào)警對(duì)象可以發(fā)出一些簡單的聲音入室搶劫時(shí)被害人會(huì)被蒙住嘴和眼睛,突發(fā)疾病的人無法清晰、大聲的求救。這種聲音模式是不引人注意的,用力幅度也是比較小的,但是其中仍然包含可用的音頻數(shù)據(jù)。這種聲音數(shù)據(jù)在呼救現(xiàn)場不會(huì)引起人們的注意,沉悶而且單調(diào),同時(shí),這種聲音還有其他的一些特點(diǎn),例如,呼救音在時(shí)域上具有非常強(qiáng)的穩(wěn)定性。
在時(shí)域上,能夠針對(duì)此類信號(hào)提取短時(shí)平均過0率和能量。而且,按照實(shí)際的需要,此類語音識(shí)別主要針對(duì)特定人語音的識(shí)別,只有設(shè)定的呼救者發(fā)出呼救并被確認(rèn)以后,語音識(shí)別模塊才能被觸發(fā)并使整個(gè)系統(tǒng)開始工作。具體實(shí)現(xiàn)的功能需求包括:能夠?qū)艚械恼Z音信號(hào)進(jìn)行識(shí)別。識(shí)別技術(shù)對(duì)語音文本的內(nèi)容要求不高,只要能夠識(shí)別簡單的音素及其組合即可。這時(shí)人們?cè)谔厥猸h(huán)境下必須發(fā)出的聲音的。但是,只能采用特意拖長的發(fā)音時(shí)間及反復(fù)的相同的語音信號(hào)進(jìn)行呼救;能夠?qū)φf話的人的身份進(jìn)行識(shí)別的功能,以確定特定的呼救用戶;對(duì)識(shí)別的結(jié)果提供一種觸發(fā)手段,例如遠(yuǎn)程報(bào)警、觸發(fā)報(bào)警鈴、打開視頻監(jiān)控等。
本裝置語音識(shí)別的過程如圖2所示。
語音識(shí)別最主要的部分是對(duì)特征的提取和模式的匹配。所謂特征提取,又包括語音前端處理與特征提取。前者指語音采樣、分幀、A/D變換、特征提取和端點(diǎn)檢測(cè)等。首先要識(shí)別特定人的聲音,并對(duì)聲音進(jìn)行采樣。系統(tǒng)語音的采樣和A/D變換都是通過硬件完成的。采集的數(shù)據(jù)表明:成年人的有意識(shí)低音能夠延續(xù)7.5左右,而普通的無求救意識(shí)發(fā)音不會(huì)存在如此上的時(shí)間,而且也不會(huì)保持持續(xù)的穩(wěn)定的頻率和振幅。除此之外,呼救音的具體長短能夠根據(jù)口型、聲帶、肺活量和堵塞物的進(jìn)行分析。例如,不同的堵塞物,或者不同的堵塞方式,都會(huì)造成差異的波形變異特征,這種數(shù)據(jù)規(guī)律是可尋的。因此,語音識(shí)別的著眼點(diǎn)就在于疊加多個(gè)特征量,形成多層次的識(shí)別模型。
四、數(shù)據(jù)無線傳輸控制
無線數(shù)據(jù)傳輸模塊主要基于GPRS網(wǎng)絡(luò)進(jìn)行信號(hào)傳輸。這種傳輸方式成本較低,適用于短距離傳輸?shù)那闆r,非常適合家居語音識(shí)別及求救系統(tǒng)的應(yīng)用環(huán)境。GPRS在進(jìn)行無線信息傳輸時(shí),目前常用的是多媒體服務(wù)MMS,因此我們只需要將報(bào)警信息按照MSS協(xié)議進(jìn)行打包,就能快速完成信息的傳輸過程。其中,報(bào)警信息數(shù)據(jù)包括WSP和WTP兩種結(jié)構(gòu)。
在本系統(tǒng)研發(fā)過程中,我們應(yīng)用NRb24LO1無線傳輸模塊,這個(gè)模塊屬于2.4G信息傳輸,內(nèi)容集成了PCB天線,調(diào)制過程為GFSK,在國際通用頻段ISM上共有125個(gè)頻點(diǎn),能夠保證2M數(shù)據(jù)的高速傳輸。該模塊還將高度信號(hào)處理功能集成進(jìn)來,這里面主要包括自動(dòng)應(yīng)答和自動(dòng)重發(fā)數(shù)據(jù)包等。
模塊內(nèi)置的點(diǎn)對(duì)點(diǎn)通信控制和CRC容錯(cuò)機(jī)制,能夠保證數(shù)據(jù)的安全、穩(wěn)定傳輸,另外,還包括了載波檢測(cè)和傳輸錯(cuò)誤計(jì)數(shù)等功能,能夠進(jìn)行跳頻設(shè)置。模塊的SPI結(jié)構(gòu)能夠與單片機(jī)直接相連或使用單片機(jī)進(jìn)行模擬,內(nèi)部的FIFO能夠處理各種高、低速的接口,并選擇性打開某些接收通道,因此能夠適應(yīng)各類型單片機(jī)的使用。
五、結(jié)論
總的來說,本設(shè)備以單片機(jī)為控制核心,并在它的基礎(chǔ)上完成了語音識(shí)別模塊和無線傳輸模塊的設(shè)計(jì)開發(fā),系統(tǒng)運(yùn)行所需的成本較小,而且由于使用單片機(jī)進(jìn)行集中控制,系統(tǒng)具有反應(yīng)迅速、呼叫方便、操作便捷的特點(diǎn),且可以設(shè)置呼叫不被察覺的模式,從而真正實(shí)現(xiàn)了安全求救的目的。另外,該設(shè)備的語音識(shí)別誤報(bào)率較低,市場推廣前景十分廣闊。
參 考 文 獻(xiàn)
[1]張雄偉,陳亮,楊吉斌.現(xiàn)代語音處理技術(shù)及應(yīng)用[M].北京:機(jī)械工業(yè)出版社,2003.
[2]陳濤.基于DSP的語音信號(hào)識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)[D].成都:成都理工大學(xué),2010.
[3]林瑋,楊莉莉,徐柏齡.基于修正MFCC參數(shù)漢語耳語音的話者——識(shí)別[J].南京大學(xué)學(xué)報(bào)(自然科學(xué)版),2006,(01):54-62.