常鈺坤,楊海燕,陳瀟杰,周萍
(1.桂林電子科技大學(xué) 信息與通信學(xué)院,廣西桂林,541004;2.桂林信息科技學(xué)院 電子工程學(xué)院,廣西桂林,541004)
隨著人們對(duì)高質(zhì)量生活的不斷追求,傳統(tǒng)鎖具式門禁逐漸失去主導(dǎo)地位,新一代智能門禁成為市場(chǎng)新寵。對(duì)比傳統(tǒng)鎖具式門禁,智能門禁系統(tǒng)在使用更方便的同時(shí)其安全性和用戶體驗(yàn)均有極大的提升。目前指紋識(shí)別、人臉識(shí)別等生物識(shí)別技術(shù)已經(jīng)廣泛應(yīng)用于市場(chǎng)上的門禁系統(tǒng),不足之處在于同時(shí)也導(dǎo)致了更多的私人信息被迫暴露,比如人臉識(shí)別的門禁系統(tǒng)對(duì)身份信息的泄漏。密切接觸的指紋識(shí)別門禁類別,因其采集信息需要密切接觸使得應(yīng)用受到限制。相比于指紋信息和人臉信息,聲紋信息的獲取更容易得到人們的許可,且不易泄漏身份信息,因此聲紋識(shí)別技術(shù)結(jié)合動(dòng)態(tài)指令控制在智能門禁系統(tǒng)的應(yīng)用有其市場(chǎng)應(yīng)用需求。聲紋識(shí)別的智能門禁系統(tǒng)利用不同說話人聲紋信息差異來識(shí)別開鎖人身份,無需接觸,使用方便,安全性高。
基于聲紋識(shí)別的智能門禁系統(tǒng),通??紤]結(jié)合聲紋識(shí)別技術(shù)和動(dòng)態(tài)指令作為智能門禁開啟的鑰匙,客戶端采集用戶聲紋信息,可進(jìn)行用戶的聲紋注冊(cè),以及提供隨機(jī)的八位動(dòng)態(tài)數(shù)字密碼進(jìn)行聲紋驗(yàn)證。服務(wù)器端輸出給定的隨機(jī)數(shù)字提醒用戶采集聲紋信息,并上傳至云服務(wù)器,并進(jìn)行聲紋認(rèn)證和信息記錄,判別后通過網(wǎng)絡(luò)發(fā)送控制指令來控制門禁狀態(tài),并將判別結(jié)果同步返回客戶端,實(shí)現(xiàn)近程控制;管理后臺(tái)可實(shí)時(shí)查詢門鎖狀態(tài)信息和用戶信息;同時(shí)允許同一網(wǎng)絡(luò)下的客戶端與門禁系統(tǒng)配對(duì),配對(duì)成功則允許客戶端實(shí)現(xiàn)遠(yuǎn)程開鎖。同時(shí)采用Web 網(wǎng)頁形式展示給服務(wù)端后臺(tái),方便管理員對(duì)系統(tǒng)的遠(yuǎn)程管理和監(jiān)控,對(duì)出入信息進(jìn)行管理,以保證安全度。
智能語音門禁系統(tǒng)的客戶端基本架構(gòu)包括主控制器模塊、繼電器模塊、電源模塊、OLED 顯示模塊和語音識(shí)別模塊等。在此基礎(chǔ)上,也可結(jié)合云平臺(tái),增加手機(jī)無線遠(yuǎn)程解鎖功能,通過云服務(wù)器將智能門禁系統(tǒng)與手機(jī)APP 進(jìn)行連接,并在同一局域網(wǎng)下通過一鍵配置實(shí)現(xiàn)互通,增加系統(tǒng)的實(shí)用性,安全性、可靠性。
考慮到個(gè)人情緒以及身體狀況的變化對(duì)聲紋信息的影響,本文基于聲紋識(shí)別的智能門禁系統(tǒng)設(shè)計(jì)結(jié)合動(dòng)態(tài)指令和聲紋識(shí)別技術(shù)共同作為門鎖開啟的鑰匙。系統(tǒng)設(shè)計(jì)框圖如圖1 所示,其中客戶端、服務(wù)器端和門禁端在同一網(wǎng)絡(luò)中,以增加系統(tǒng)的安全性;客戶端和服務(wù)器通過WiFi 進(jìn)行通信,控制模塊不僅適用本智能門禁系統(tǒng),也可嵌入到不同的電控鎖中,具備通用性設(shè)計(jì)。
圖1 聲紋門禁系統(tǒng)框圖
智能門禁系統(tǒng)的硬件部分以STM32F103RET6 單片機(jī)作為核心控制器,協(xié)調(diào)各部分電路工作;采用一體式WiFi透?jìng)髂K進(jìn)行收發(fā)控制指令;最終由繼電器開關(guān)電路控制門禁鎖。主要模塊設(shè)計(jì)如下。
2.1.1 核心控制模塊
考慮到門禁系統(tǒng)連續(xù)工作的要求,ARM 內(nèi)核的STM32系列單片機(jī)具有優(yōu)異的運(yùn)算速度和擴(kuò)展能力,外設(shè)資源豐富。經(jīng)過調(diào)研,系統(tǒng)的核心控制電路采用STM32 系列的STM32F103RET6 單片機(jī)作為主控制芯片,通過串口和上層的WiFi 模塊進(jìn)行通訊,再將控制信號(hào)作用于下層繼電器控制模塊。
2.1.2 語音識(shí)別模塊
考慮到門禁系統(tǒng)對(duì)聲紋信息的采集與響應(yīng)速度有著極高的要求,經(jīng)過調(diào)研,選擇了智能離線語音識(shí)別模塊HLK-V20。該模塊使用32 位基于RSIC 硬件架構(gòu)的音頻內(nèi)核,并加入了DSP 運(yùn)算指令集,專門負(fù)責(zé)語音信號(hào)的傳輸、數(shù)字化音頻處理,符合本設(shè)計(jì)需要進(jìn)行離線語音識(shí)別監(jiān)測(cè)的應(yīng)用場(chǎng)景。
2.1.3 WiFi 通訊電路
考慮到門禁系統(tǒng)的便捷性和實(shí)時(shí)性,本系統(tǒng)特意設(shè)置將門鎖連接到WiFi 網(wǎng)絡(luò)上,利用ESP8266-12FWiFi 構(gòu)成無線傳輸模塊,從而實(shí)現(xiàn)遠(yuǎn)程控制與管理。WiFi 模塊集成了MAC、基頻芯片、射頻收發(fā)單元以及功率放大器,有兩種無線組網(wǎng)方式:無線接入點(diǎn)AP 和無線站點(diǎn)STA,運(yùn)行頻率達(dá)80MHz??紤]AP 模式下WiFi 模塊不需要連接外圍設(shè)備,即可實(shí)現(xiàn)無線終端到設(shè)備的連接,故首先在AP 模式下通過網(wǎng)頁配置模塊參數(shù),接入門禁系統(tǒng)所在的無線網(wǎng)絡(luò),然后選取STA 方式,完成WiFi 模塊初始化。WiFi 模塊通訊電路框圖如圖2 所示。
圖2 WiFi 通訊電路框圖
2.1.4 繼電器控制電路
繼電器控制模塊基本功能是通過小能量電流信號(hào)來自動(dòng)控制大能量電流。本系統(tǒng)設(shè)計(jì)中,繼電器模塊驅(qū)動(dòng)電路采用ULN2003A,主要由模塊驅(qū)動(dòng)集成電路和控制繼電器兩個(gè)部分組成,如圖3 所示。
圖3 繼電器電路模塊
智能聲紋門禁系統(tǒng)的軟件設(shè)計(jì)根據(jù)功能區(qū)分采用分塊設(shè)計(jì),主要考慮兩部分,設(shè)計(jì)方案如圖4 所示。第一部分包括對(duì)語音數(shù)據(jù)的預(yù)處理和基于深度學(xué)習(xí)完成用戶聲學(xué)模型的訓(xùn)練與建立;第二部分則針對(duì)實(shí)時(shí)語音進(jìn)行采集、預(yù)處理以及聲紋識(shí)別等過程。2.2.1 聲紋模型主干網(wǎng)絡(luò)選擇針對(duì)智能語音門禁系統(tǒng)的應(yīng)用場(chǎng)景,僅需要對(duì)所采集的語音信息中的關(guān)鍵詞進(jìn)行識(shí)別,因此設(shè)計(jì)中不考慮語言模型。
圖4 軟件系統(tǒng)總體方案框圖
殘差神經(jīng)網(wǎng)絡(luò)(ResNet)屬于深度學(xué)習(xí)領(lǐng)域問題中的基礎(chǔ)特征分類網(wǎng)絡(luò)。其獨(dú)特之處在于將網(wǎng)絡(luò)劃分成一個(gè)個(gè)殘差子單元,將元素的相乘操作變成了相加操作,網(wǎng)絡(luò)在反向傳播避免了梯度消失,使得層數(shù)很深的網(wǎng)絡(luò)時(shí)淺層參數(shù)也能得到更新,減少了信息丟失問題。本文選用ResNet50 作為聲紋識(shí)別聲學(xué)模型主干網(wǎng)絡(luò),同時(shí)加入正則化和Dropout 層以減緩過擬合現(xiàn)象,通過池化層降維,全連接層進(jìn)行特征重組。ResNet50 結(jié)構(gòu)如圖5 所示,聲紋模型如圖6 所示。
圖5 Res Net 中殘差單元結(jié)構(gòu)圖
圖6 聲紋模型建立
2.2.2 可視化界面設(shè)計(jì)
為了服務(wù)器端使用方便友好,設(shè)計(jì)了可視化界面??梢暬缑娼Y(jié)構(gòu)圖如圖7 所示,可視化設(shè)計(jì)結(jié)果如圖8 所示。
圖7 可視化界面結(jié)果圖
圖8 主交互界面效果圖
軟件部分調(diào)試運(yùn)行在Google Colab 平臺(tái)進(jìn)行,平臺(tái)服務(wù)器GPU 型號(hào)為Tesla T4,Python 軟件版本為V3.7。調(diào)試流程如圖9 所示。其中ResNet50 網(wǎng)絡(luò)的輸入為(128,None,1),經(jīng)過ResNet50 網(wǎng)絡(luò)的殘差單元運(yùn)算,其參數(shù)為23558528 個(gè),Output Shape 為(None,4,None,2048)。經(jīng)過activity_regularization 層和dropout 層,其Output Shape 不發(fā)生變化,沒有新增參數(shù)。池化層,也稱為下采樣層,其主要作用是“降維”,將Output Shape“降維”變?yōu)?None,2048),不需要新增參數(shù)。Dense 層是基本神經(jīng)網(wǎng)絡(luò),其參數(shù)等于輸入數(shù)據(jù)維度加“1”再乘以神經(jīng)元個(gè)數(shù),為40980,Output Shape 為(None,20)。
圖9 系統(tǒng)調(diào)試流圖
訓(xùn)練和測(cè)試循環(huán)中插入損失值和準(zhǔn)確率,訓(xùn)練過程和訓(xùn)練結(jié)束后部分輸出顯示分別如圖10,圖11 所示,測(cè)試損失如圖12 所示。分析以上圖可以發(fā)現(xiàn),通過每一批輸出的損失值和準(zhǔn)確率的變化可以看出,通過訓(xùn)練,數(shù)據(jù)送入模型參數(shù)進(jìn)行測(cè)試時(shí)其損失值在波動(dòng)中逐漸減小,其準(zhǔn)確率在波動(dòng)中不斷增大,模型參數(shù)在不斷整合數(shù)據(jù)的特征。經(jīng)過長時(shí)間的訓(xùn)練之后,其訓(xùn)練損失值趨于“0”,準(zhǔn)確率趨于“1”。用測(cè)試集進(jìn)行測(cè)試可以觀察到最后損失值基本穩(wěn)定在0.56左右,準(zhǔn)確率基本穩(wěn)定在0.92 左右。
圖10 訓(xùn)練中部分損失值與準(zhǔn)確率輸出截圖
圖11 訓(xùn)練結(jié)束損失值和準(zhǔn)確率輸出截圖
圖12 測(cè)試損失值變化圖
圖13 服務(wù)器端門禁的狀態(tài)
(1)近程開門功能測(cè)試
近程的語音開門功能,主要依靠HLK-V20 模塊完成,設(shè)置的關(guān)鍵命令詞為“打開開關(guān)”,HLK-V20 模塊接收到語音數(shù)據(jù)后,觸發(fā)控制繼電器模塊,完成電控鎖開關(guān)操作。服務(wù)器端門鎖狀態(tài)顯示為“1”,即處于開鎖狀態(tài)。
(2)遠(yuǎn)程開門功能測(cè)試
遠(yuǎn)程開門功能測(cè)試步驟如下:
①手機(jī)APP 與WiFi 模塊均連接上機(jī)智云平臺(tái)才能實(shí)現(xiàn)遠(yuǎn)程控制。手機(jī)APP 首先通過網(wǎng)絡(luò)一鍵配置連接上設(shè)備,如圖14 所示。
圖14 APP 連接設(shè)備
②將APP 與設(shè)備及門禁系統(tǒng)配對(duì)后,再將APP 與云端相連接,如圖15 所示。
圖15 設(shè)備連接機(jī)智云
③上述兩個(gè)步驟完成后,將APP 中的門禁開關(guān)打開,如圖16 所示。
圖16 APP門禁開關(guān)
可以看到將APP 上的開關(guān)打開,門禁系統(tǒng)中的電控鎖打開,同時(shí)在服務(wù)器端接收到門禁狀態(tài)的數(shù)據(jù)為“1”,表示門禁已經(jīng)打開。服務(wù)器端狀態(tài)如圖17 所示,客戶端狀態(tài)如圖18 所示。
圖17 服務(wù)器端門禁狀態(tài)顯示
圖18 客戶端門禁系統(tǒng)狀態(tài)變化
本文設(shè)計(jì)完成了聲紋識(shí)別系統(tǒng)聲學(xué)模型的建立與訓(xùn)練,并設(shè)計(jì)實(shí)現(xiàn)了以STM32 為主控模塊,結(jié)合繼電器模塊、OLED 顯示模塊、WiFi 電路等模塊組成的門禁系統(tǒng),實(shí)現(xiàn)了具有實(shí)時(shí)顯示功能的非接觸式的智能語音控制門禁系統(tǒng)。設(shè)計(jì)過程從實(shí)用性出發(fā),提供了兩種開鎖方式:一是利用語音識(shí)別模塊實(shí)現(xiàn)本地語音開鎖;二是利用WiFi 模塊作為手機(jī)APP 與門禁系統(tǒng)之間通信橋梁,通過機(jī)智云平臺(tái)作為中轉(zhuǎn)服務(wù)器端,實(shí)現(xiàn)對(duì)門禁系統(tǒng)進(jìn)行遠(yuǎn)程控制和開鎖,并實(shí)時(shí)顯示門鎖狀態(tài)。通過軟件仿真、遠(yuǎn)程/近程測(cè)試,驗(yàn)證了智能語音控制門禁系統(tǒng)的有效性,實(shí)現(xiàn)了對(duì)門禁系統(tǒng)的控制和管理。所設(shè)計(jì)的系統(tǒng)特色之處在于軟件部分基于先進(jìn)的深度學(xué)習(xí)算法進(jìn)行仿真實(shí)現(xiàn),同時(shí)硬件電路+云平臺(tái)提供兩種開鎖方式--本地輸入開鎖和云平臺(tái)遠(yuǎn)程控制開鎖,具有很好的安全保證。同時(shí)為了提升用戶的友好使用感,設(shè)置了多種方式的門禁控制,使用方便簡(jiǎn)潔,具有一定的實(shí)用價(jià)值和推廣價(jià)值。