呂從強(qiáng)
摘要:針對(duì)智能家居而言,它是一個(gè)非常典型的的3C系統(tǒng),將計(jì)算機(jī)以及通信等集為一體。通過各種技術(shù)的應(yīng)用連接家庭智能設(shè)備,主要包括網(wǎng)絡(luò)傳輸技術(shù)、音視頻技術(shù)、信息處理技術(shù)等,利用效率極高的管理系統(tǒng)對(duì)全部設(shè)備進(jìn)行統(tǒng)一管控。根據(jù)人類交流的實(shí)際情況來看,最為直接的一種方式為語言交流。當(dāng)應(yīng)用智能家居的時(shí)候,有機(jī)結(jié)合語音識(shí)別技術(shù)和控制技術(shù),這是現(xiàn)在一個(gè)熱門話題。隨著智能手機(jī)的應(yīng)運(yùn)而生,不斷促進(jìn)語音識(shí)別技術(shù)發(fā)展。專用語音識(shí)別芯片在傳統(tǒng)智能家居系統(tǒng)中主要被用來管控智能設(shè)備,目前所研究出的語音識(shí)別產(chǎn)品通常將互聯(lián)網(wǎng)作為重要依靠。為使硬件資源得到有效節(jié)約,并且改進(jìn)與完善互聯(lián)網(wǎng)存在的問題和缺陷,本文探究了智能家居中在線語音識(shí)別技術(shù)的應(yīng)用。
關(guān)鍵詞:智能家居;在線;語音識(shí)別技術(shù)
引言:
隨著社會(huì)的發(fā)展和科學(xué)技術(shù)的進(jìn)步,廣大群眾的生活水平不斷提升,在日常生活中越來越頻繁地與機(jī)器進(jìn)行交流。家庭是人們生活中最頻繁和最直接的互動(dòng)形式,各種家用電器已融入人們的生活。隨著生活節(jié)奏的加快,人們更傾向于與家庭智能互動(dòng)而不是傳統(tǒng)的家用機(jī)器按鈕,從而創(chuàng)造了智能家居的概念。語言是人與人之間最自然、最直接的交流方式。隨著軟硬件的快速發(fā)展和各種模型的改進(jìn),語音識(shí)別技術(shù)正變得越來越成熟。
一、語音識(shí)別與智能家居
在智能家居市場(chǎng)不斷發(fā)展的過程中,充分結(jié)合智能家居和語音,在此基礎(chǔ)上互聯(lián)網(wǎng)巨頭進(jìn)入到智能家居行業(yè)中。日益加大Apple HomeKit智能家居平臺(tái)和Siri的整合強(qiáng)度。再如微軟,對(duì)Cortana這一語音助手進(jìn)行發(fā)布,突出其在智能家居行業(yè)中的重要地位,使其成為互動(dòng)門戶。由眾多互聯(lián)網(wǎng)行業(yè)巨頭向語音領(lǐng)域加大投入能夠看出,目前智能家居與在線語音的融合已經(jīng)成為一種必然趨勢(shì)。在今后的智能家居設(shè)備中,語音這種人類最直接與方便的交流方式占據(jù)著舉足輕重的地位[1]。
1.語音識(shí)別技術(shù)
語音識(shí)別技術(shù)還可被稱之為自動(dòng)語音識(shí)別,也就是ASR,該技術(shù)主要服務(wù)于人類,主要目的是轉(zhuǎn)化存在于我們語音之中詞匯,使其成為計(jì)算機(jī)能夠讀寫的輸入。相較于說話者識(shí)別及其確認(rèn),存在較大差異,通常所識(shí)別和確認(rèn)的是說話者,并非蘊(yùn)含其中的詞匯內(nèi)容。將語音識(shí)別技術(shù)結(jié)合機(jī)器翻譯等處理技術(shù),能夠組建成復(fù)雜度更高的應(yīng)用程序[2]。隨著語音識(shí)別技術(shù)的不斷發(fā)展,目前已經(jīng)在計(jì)算機(jī)的多種處理技術(shù)中占據(jù)至關(guān)重要的地位,成為一項(xiàng)關(guān)鍵技術(shù)。
2.語音識(shí)別算法
目前,代表性語音識(shí)別方法主要包括動(dòng)態(tài)時(shí)間規(guī)整技術(shù)、隱馬爾可夫模型、矢量量化、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、獨(dú)立分量分析等方法。
動(dòng)態(tài)時(shí)間扭曲(DTW)是一種簡(jiǎn)單有效的非特定人員語音識(shí)別方法。解決了具有不同發(fā)音長(zhǎng)度的模板匹配問題,這是語音識(shí)別技術(shù)中早期且更常用的算法。
隱馬爾可夫模型(HMM)是語音信號(hào)處理中的統(tǒng)計(jì)模型。由于模式庫是通過重復(fù)訓(xùn)練形成的最佳模型參數(shù),并且具有與訓(xùn)練輸出信號(hào)一致的高概率,代替預(yù)先存儲(chǔ)的模式樣本,并且在識(shí)別過程期間,將與要識(shí)別的語音序列和 HMM參數(shù)之間的最大似然比相對(duì)應(yīng)的最佳狀態(tài)序列用作識(shí)別輸出,因此是較理想的語音識(shí)別模型。
矢量量化是信號(hào)壓縮的重要方法。與HMM相比,矢量量化主要應(yīng)用于孤立詞匯的小詞匯量和詞匯量。
人工神經(jīng)網(wǎng)絡(luò)(ANN)本質(zhì)上是一種模擬人類神經(jīng)活動(dòng)原理的自適應(yīng)非線性動(dòng)力學(xué)系統(tǒng)。憑借其適應(yīng)性、并行性、容錯(cuò)性和學(xué)習(xí)特性,其強(qiáng)大的分類和輸入輸出功能在語音識(shí)別中具有吸引力。
支持向量機(jī)是一種應(yīng)用統(tǒng)計(jì)理論的新型學(xué)習(xí)機(jī)模型。支持向量機(jī)因其良好的理論基礎(chǔ)而被廣泛應(yīng)用于各個(gè)領(lǐng)域。近年來,已經(jīng)進(jìn)行了許多研究以使用支持向量機(jī)對(duì)揚(yáng)聲器進(jìn)行建模[3]。
二、基于 NL6621 嵌入式硬件設(shè)計(jì)
用于語音識(shí)別的硬件平臺(tái)主要包括中央處理單元NL6621、可讀寫存儲(chǔ)器、聲卡芯片vs1003以及一些外圍設(shè)備。MCU采用的最高主頻為160 MHz,支持802.llb/g/n/i/e/p和Wi- Fidirect、BSSSTA、軟AP、Wi-Fi保護(hù)設(shè)置以及WMM-PS和WPA/WPA2安全協(xié)議。編解碼器芯片是vs1003它與核心控制器NL6621的數(shù)據(jù)通信是通過SPI總線執(zhí)行的。它集成了麥克風(fēng)輸入、音頻輸出和IMA ADPCM編碼,用于麥克風(fēng)輸入或線路輸入,以便有效接收和播放音頻信息。
三、基于 NL6621 嵌入式軟件設(shè)計(jì)
軟件設(shè)計(jì)主要包括兩部分:軟件控制嵌入式系統(tǒng)和基于HMM技術(shù)的語音識(shí)別算法。主要使用NL6621提供的軟件開發(fā)套件,使用SDK編寫應(yīng)用程序,包括硬件引腳初始化、波特率匹配、錄制文件配置、Wi- Fi配置、錄制、音頻文件格式轉(zhuǎn)換,編程需要使用編程工具進(jìn)行編程。系統(tǒng)然后開始工作,通過語音輸入設(shè)備MIC收集語音,并通過聲卡VS1003輸入語音。
四、智能家居中在線語音識(shí)別技術(shù)的應(yīng)用
1.在智能電視中的應(yīng)用
該應(yīng)用包括語音輸入、處理和執(zhí)行三個(gè)部分。第一種是語音輸入,可以通過遙控器、智能電視的內(nèi)置麥克風(fēng)或相應(yīng)的移動(dòng)應(yīng)用程序完成。但是,使用移動(dòng)應(yīng)用程序需要用戶將移動(dòng)電話和電視放在同一網(wǎng)段上,并通過WiFi傳輸語音數(shù)據(jù)。用戶可以通過告知他們的需求來實(shí)現(xiàn)智能電視操作,例如更換頻道、瀏覽網(wǎng)頁或打開下載的應(yīng)用程序。第二是處理語言信號(hào)。首先,通過網(wǎng)絡(luò),在特征提取和降噪處理之后,語音信號(hào)被發(fā)送到網(wǎng)絡(luò)識(shí)別客戶端。然后,網(wǎng)絡(luò)識(shí)別客戶端將其發(fā)送到智能電視以執(zhí)行命令。第二是在本地識(shí)別。最后,在語音識(shí)別引擎處理語音信號(hào)之后,執(zhí)行用戶命令將命令發(fā)送到相應(yīng)的接口,以實(shí)現(xiàn)相應(yīng)的功能模塊。
2.在空調(diào)方面的應(yīng)用
目前,由于家中的空調(diào)大多數(shù)沒有連接到網(wǎng)絡(luò),因此語音信號(hào)的識(shí)別通常在本地進(jìn)行,所以不能通過網(wǎng)絡(luò)進(jìn)行語音輸入。那么,用戶只能通過遙控器或家用空調(diào)的內(nèi)置麥克風(fēng)輸入語音。語音的處理也需要在本地完成,這需要用戶建立自己的同義詞庫。在空調(diào)處理之后,用戶自己的語音特征向量被存儲(chǔ)在同義詞庫中。創(chuàng)建詞匯表后,用戶命令的執(zhí)行很簡(jiǎn)單。例如,如果用戶想將溫度升至26°C,他只需要說“空調(diào)”,“電梯”“2”,“6”和“空調(diào)可以正確地處理和執(zhí)行用戶的命令。
3.在照明方面的應(yīng)用
在家庭照明系統(tǒng)中主要有兩種組成部分,一是語音采集設(shè)備,二是控制中心。相較于智能電視與智能空調(diào),家庭照明系統(tǒng)存在著較大差異,必須進(jìn)行布線。但是,所應(yīng)用的語音輸入方法一致,同時(shí)語音信號(hào)能夠通過不同類型的語音獲取設(shè)備進(jìn)行收集,比如內(nèi)置麥克風(fēng)或者是遠(yuǎn)程設(shè)備。根據(jù)大部分家庭照明系統(tǒng)的實(shí)際情況來看,在采集語音信號(hào)時(shí)均應(yīng)用內(nèi)置麥克風(fēng),而且會(huì)產(chǎn)生比較大的噪聲,所以有必要加大降噪強(qiáng)度,和家庭應(yīng)用的空調(diào)相同,該系統(tǒng)同樣沒有與網(wǎng)絡(luò)設(shè)備連接,所以必須在本地識(shí)別語音信號(hào),還能夠利用同義詞建立這一方式達(dá)到目的。對(duì)比家庭空調(diào),該方式的更為簡(jiǎn)單便捷,最后將同義詞詞庫存放于存儲(chǔ)器內(nèi),便可實(shí)現(xiàn)智能化目的。
結(jié)束語:
綜上所述,在線語音識(shí)別技術(shù)已經(jīng)被廣泛應(yīng)用于智能家居中,如上述所呈現(xiàn)的智能電視、照明以及空調(diào)等,除此之外還有掃地機(jī)器人等方方面面的應(yīng)用。通過應(yīng)用在線語音識(shí)別技術(shù)能夠使廣大群眾的家庭生活發(fā)生翻天覆地的變化。
參考文獻(xiàn)
[1]侯猛,胡曉紅,趙航濤.在線語音識(shí)別技術(shù)在智能家居中的應(yīng)用[J].信息與電腦(理論版),2018(24):118-120.
[2]孫羽川. 工程模擬器音效仿真及語音通話系統(tǒng)設(shè)計(jì)[D].西安理工大學(xué),2018.
[3]伍斯龍. 群智感知中語音識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)[D].華南理工大學(xué),2013.
(作者單位:江蘇崇德電子有限公司)