王悅銘 祝思雨 康雅婷
摘 要:現(xiàn)代生活節(jié)奏快,更新快,所有的更新?lián)Q代都是為了讓人們的生活更加輕松美好。年輕人容易心浮氣躁,馬馬虎虎,經(jīng)常找不到東西。老年人容易記憶力下降,經(jīng)常上一秒還記得自己把東西放在了哪里,下一秒就忘記了。每天都有人在為找不到某樣?xùn)|西而苦惱煩悶,這種新型實用語音識別系統(tǒng)可以很好的解決找不到東西的問題,使人們的現(xiàn)實生活狀態(tài)進一步貼切于心理期望狀態(tài),提高人們的幸福感。同時,這種系統(tǒng)的外形美觀,會被人們所喜愛,可能會成為一種新型的時尚元素。
關(guān)鍵詞: 語音識別;語音感應(yīng);便攜尋找;獨立專屬
一、語音識別感應(yīng)系統(tǒng)的研究背景以及以往裝置研究現(xiàn)狀分析
1.研究背景
1.1語音識別感應(yīng)系統(tǒng)的設(shè)計背景
隨著科學(xué)技術(shù)的不斷發(fā)展,語音識別(Speech Recognition)技術(shù)隨之出現(xiàn)語音識別技術(shù)就是讓機器通過識別和理解把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。語音識別是一門交叉學(xué)科,它正逐步成為信息技術(shù)中人機接口的關(guān)鍵技術(shù),語音識別技術(shù)與語音合成技術(shù)的結(jié)合,使人們能夠甩掉鍵盤,通過語音命令進行操作。語音技術(shù)的應(yīng)用已經(jīng)成為一個具有競爭性的新興高技術(shù)產(chǎn)業(yè)。當(dāng)今,語音識別產(chǎn)品在人機認交互應(yīng)用中己經(jīng)占到越來越大的比例。
1.2以往研究現(xiàn)狀分析
國內(nèi)外研究現(xiàn)狀語音識別的研究工作可以追溯到20世紀(jì)50年代AT&貝爾實驗室的Audry系統(tǒng),它是第一個可以識別十個英文數(shù)字的語音識別系統(tǒng)。但真正取得實質(zhì)性進展,并將其作為一個重要的課題開展研究則是在60代末70年代初。這首先是因為計算機技術(shù)的發(fā)展為語音識別的實現(xiàn)提供了硬件和軟件的可能,更重要的是語音信號線性預(yù)測編碼(LPC)技術(shù)和動態(tài)時間規(guī)整(DTW)技術(shù)的提出,有效的解決了語音信號的特征提取和不等長匹配問題。
隨著消費電子的快速發(fā)展,更加智能化設(shè)備的快速普及,各種新型技術(shù)也隨應(yīng)產(chǎn)生。語音作為基本的、主要的、關(guān)鍵的交互方式,越來越多的應(yīng)用于智能設(shè)備的交互應(yīng)用中。由于現(xiàn)階段消費電子作為整個系統(tǒng)的設(shè)計短板,各個系統(tǒng)設(shè)計廠家、平臺以及關(guān)鍵器件廠家都想在功耗上面做出更多的貢獻。
二、新型語音識別感應(yīng)系統(tǒng)研究內(nèi)容
該系統(tǒng)主要由外部雙層保護殼、供電裝置、充放電裝置、語音識別裝置、語音播放裝置五大模塊組成。針對此五大模塊做以下細化設(shè)計。
該系統(tǒng)外部保護殼包含兩層,其中最里面一層外殼采用輕便堅固的金屬外殼,其外層可以包裝上橡膠外殼,使其觸感柔軟舒適,其次橡膠外殼具有良好的彈塑性、緩沖性、絕緣性和防水性。同時根據(jù)使用人群的不同外層材料可以具有一定的變化。使其具有更大的推廣度。
針對供電裝置采用1000mA不含有金屬態(tài)鋰的鋰離子電池,安全可靠并且可以重復(fù)使用。相比堿性鋅錳電池、干電池等常用電池,其鋰離子電池具有能量高,壽命長,體積小,額定電壓高,高功率承受力,自放電率低,無毒、無害、綠色環(huán)保、無污染,循環(huán)性能優(yōu)越、可快速充放電、充電效率高達100%的優(yōu)點。
該裝置采用通用型YU1150/YU115W插頭與普通型USB數(shù)據(jù)線為電池充電,YU1150/YU115W的輸出功率為5.0V-1.2A,即使在電量用盡的情況下也能在40分鐘內(nèi)完成充電。
語音識別裝置(其工作原理如圖1所示):語音識別芯片也叫語音識別IC,與傳統(tǒng)的語音芯片相比,語音識別芯片最大的特點就是能夠語音識別,可以根據(jù)語音命令執(zhí)行相應(yīng)的回復(fù)。該裝置通過MIC接口輸入聲音信號,之后將聲音信號進行頻譜分析提取聲音特征,語音識別器會識別出語言文字中的關(guān)鍵詞,并送入MCU(單片機)進行處理,辨別是否在系統(tǒng)的關(guān)鍵詞列表內(nèi),從而快速做出進一步做出反應(yīng)。目的是在于使用者能夠盡可能快的接收到該系統(tǒng)反應(yīng),,以便于使用者及時找到所需物。
麥克風(fēng)可以根據(jù)采集的外部聲音信號是否超過預(yù)設(shè)閥值選擇進入語音識別模式或待機模式,以此延長待機時長;減少必要的運行部件的使用頻率,以此延長該裝置的使用壽命。
三、新型語音識別感應(yīng)系統(tǒng)的實現(xiàn)
該語音識別感應(yīng)系統(tǒng)如圖2所示,其實際大小與一個U盤大小相似。包括外殼本體1內(nèi)層為金屬材料、外層多變(可為具有舒適美觀等特點的橡膠、毛絨、布料。形狀可根據(jù)市場需求更改),所述外殼本體的中部設(shè)有凹槽3,凹槽3放置鋰離子電池,外殼本體的下部還設(shè)有凹槽4、凹槽5,凹槽4內(nèi)放置語音識別裝置,凹槽5內(nèi)放置語音播放裝置。凹槽3鋰電池與設(shè)在外殼本體上部凹槽2的5v充電接口連接,通過充電管理裝置對鋰電池進行充電管理。
其工作流程如圖3所示。先將該語音識別感應(yīng)裝置連接到如鑰匙等易丟失的物品上,給裝置預(yù)先錄入指定語音命令,語音接收裝置負責(zé)接收外界傳來的各種語音,在使用過程中若找不到鑰匙在哪里了,可以發(fā)出特定語音指令,當(dāng)語音識別裝置識別到與預(yù)先錄入到模板庫的語音樣本相匹配的特定語音指令信號后,觸發(fā)語音播放裝置,發(fā)出回應(yīng)信號,讓人可以根據(jù)聲源找尋攜帶該新型語音識別感應(yīng)系統(tǒng)的物品所在地,從而找到物品。
四、總結(jié)與展望
語音識別技術(shù)發(fā)展到今天,特別是中小詞匯量非特定人語音識別系統(tǒng)識別精度已經(jīng)大于98%,對特定人語音識別系統(tǒng)的識別精度就更高。這些技術(shù)已經(jīng)能夠滿足通常應(yīng)用的要求。由于大規(guī)模集成電路技術(shù)的發(fā)展,這些復(fù)雜的語音識別系統(tǒng)也已經(jīng)完全可以制成專用芯片,大量生產(chǎn)。調(diào)查統(tǒng)計表明多達85%以上的人對語音識別的信息 查詢服務(wù)系統(tǒng)的性能表示滿意??梢灶A(yù)測在近五到十年內(nèi),語音識別系統(tǒng)的應(yīng)用將更加廣泛。
該語音識別感應(yīng)系統(tǒng)為一種輕奢侈品,時尚美觀,并且可以為人提供切實的便利,新鮮電子產(chǎn)品對于年輕人總有無限的吸引力,尤其該產(chǎn)品外觀美麗可愛,更加符合潮流消費的理念,因而“新型語音識別感應(yīng)系統(tǒng)”的研究成功必然會受到社會普遍關(guān)注和支持。
參考文獻:
[1]徐楊飛,魏建強,崔瑋瑋,用于語音識別系統(tǒng)的增益處理方法及裝置,北京,中國專利, 2020
[2]鐘穎,基于DSP的語音識別系統(tǒng)的研究與實現(xiàn),2017
[3]董國超,寇凈磊,語音識別技術(shù)及應(yīng)用綜述,湖北,2009
[4]譚保華,熊建民,劉幺和,語音識別技術(shù)概述,武漢,430068
[5]張成海,張鐸,現(xiàn)代自動識別技術(shù)與應(yīng)用,2003