陳 奎,邢雪妍,田欣沅,王吉豪,王 順
(1.徐州工程學(xué)院 信電工程學(xué)院,江蘇 徐州 221018;2.江蘇省智慧工業(yè)控制技術(shù)重點(diǎn)建設(shè)實(shí)驗(yàn)室,江蘇 徐州 221111;3.長(zhǎng)春財(cái)經(jīng)學(xué)院 信息工程學(xué)院,吉林 長(zhǎng)春 130122)
目前聲紋、指紋、人臉等生物識(shí)別技術(shù)迅猛發(fā)展,廣泛應(yīng)用于網(wǎng)購(gòu)、銀行、公安、電子護(hù)照等.基于人臉識(shí)別的門(mén)禁系統(tǒng)在很多中高端智能樓宇和智能庫(kù)房中的應(yīng)用越來(lái)越多.人臉識(shí)別方便靈活、衛(wèi)生健康、適用性強(qiáng),只要配合完善的人員管理和門(mén)鎖控制,就可實(shí)現(xiàn)安全的刷臉進(jìn)門(mén).卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)是近年發(fā)展起來(lái),并引起廣泛重視的一種高效的圖像識(shí)別方法.參照CNN深層神經(jīng)網(wǎng)絡(luò)框架[1-3],文中利用Matlab設(shè)計(jì)與實(shí)現(xiàn)了一種10層CNN人臉識(shí)別模型并通過(guò)腳本節(jié)點(diǎn)導(dǎo)入到基于LabVIEW的門(mén)禁的控制與管理系統(tǒng).實(shí)驗(yàn)實(shí)測(cè)表明:人臉識(shí)別模型的準(zhǔn)確率適用,模型的泛化效果良好,LabVIEW門(mén)禁系統(tǒng)工作可靠,遠(yuǎn)程控制正常.
圖1 門(mén)禁系統(tǒng)組成
面向智能樓宇和智慧倉(cāng)儲(chǔ)的實(shí)際需求,文中所提人臉識(shí)別門(mén)禁系統(tǒng)具有嵌入式圖像采集、圖像遠(yuǎn)程傳輸、圖像預(yù)處理、CNN人臉識(shí)別、門(mén)禁管理數(shù)據(jù)庫(kù)以及門(mén)禁權(quán)限管理等功能[4].CNN人臉識(shí)別模型由Matlab通過(guò)離線訓(xùn)練、交叉驗(yàn)證生成,其余功能由LabVIEW VI實(shí)現(xiàn).
門(mén)禁系統(tǒng)組成如圖1所示,主要包括三個(gè)部分,即基于STM32與OV2640的嵌入式圖像采集與門(mén)鎖控制裝置,基于RS232與TCP協(xié)議的圖像與數(shù)據(jù)傳輸控制,基于LabVIEW VI和ACCESS數(shù)據(jù)庫(kù)的門(mén)禁信號(hào)操作與管理系統(tǒng).
鎖具采用磁力鎖,通過(guò)繼電器控制開(kāi)關(guān),通過(guò)門(mén)磁輸入監(jiān)控鎖具狀態(tài).利用LabVIEW的WEB發(fā)布實(shí)現(xiàn)門(mén)禁系統(tǒng)的遠(yuǎn)程登錄和監(jiān)控.
門(mén)禁系統(tǒng)設(shè)計(jì)基本流程如圖2所示.軟件系統(tǒng)包括:基于Matlab的 CNN人臉識(shí)別模型的設(shè)計(jì)、離線訓(xùn)練和驗(yàn)證、LabVIEW門(mén)禁在線的控制與管理系統(tǒng).CNN包括卷積層、池化層、全連接層與softmax輸出層[5-8].門(mén)禁管理LabVIEW系統(tǒng)包括TCP連接管理、圖像獲取與傳輸、圖像預(yù)處理和人臉圖像識(shí)別、數(shù)據(jù)庫(kù)檢索和記錄、鎖具操作碼下行傳輸?shù)?
圖2 門(mén)禁系統(tǒng)設(shè)計(jì)基本流程
目前,有許多CNN架構(gòu)的變體,但其基本結(jié)構(gòu)非常相似.CNN基本體系結(jié)構(gòu)通常由三種網(wǎng)絡(luò)層構(gòu)成,分別是卷積層、降采樣層(又稱(chēng)池化層)和全連接層.如圖3所示,采用10層CNN模型LeNet-5架構(gòu)設(shè)計(jì),輸入層輸入RGB三通道的32×32像素的圖片.首個(gè)卷積層用5×5卷積核得到和卷積核數(shù)量相同大小為28×28的特征圖,然后將這些特征圖按一定的方式組合起來(lái)作為卷積層的輸出,經(jīng)過(guò)2次卷積和采樣,獲得5×5特征圖作為全連接層的輸入.2個(gè)全連接層后采用softmax全連接,得到激活值,即卷積神經(jīng)網(wǎng)絡(luò)提取到的圖片特征.
圖3 學(xué)習(xí)模型設(shè)計(jì)
1) 卷積層
CNN的基本卷積濾波器是底層局部圖像塊(patch)的一個(gè)廣義的線性模型(GLM).不同的卷積核提取的圖像有不同的特征,如顏色分布、紋理特征、邊界特征等.
CNN卷積運(yùn)算實(shí)現(xiàn)權(quán)值共享和稀疏權(quán)重,模擬出細(xì)胞簡(jiǎn)單的局部感受野.稀疏權(quán)重使得核的大小遠(yuǎn)小于輸入的大小,有效地減少網(wǎng)絡(luò)的運(yùn)算量.
2)池化層
池化函數(shù)使用某一位置的相鄰輸出的總體統(tǒng)計(jì)特征代替網(wǎng)絡(luò)在該位置的輸出,有效地減少了輸入?yún)⒓舆\(yùn)算的神經(jīng)單元,池化數(shù)學(xué)表達(dá)式為:
3) 激活函數(shù)選擇
激活函數(shù)使得各連網(wǎng)絡(luò)之間的連接關(guān)系變?yōu)榉蔷€性.
LabVIEW門(mén)禁系統(tǒng)程序框圖如圖4所示.
圖4 LabVIEW門(mén)禁系統(tǒng)程序框圖
1) TCP連接管理
門(mén)禁系統(tǒng)包括多個(gè)嵌入式系統(tǒng)管理多個(gè)磁力鎖.每個(gè)嵌入式設(shè)備與LabVIEW門(mén)禁管理系統(tǒng)構(gòu)成星型網(wǎng)絡(luò),獨(dú)立通過(guò)TCP協(xié)議申請(qǐng)與系統(tǒng)連接.
系統(tǒng)采用典型的LabVIEW隊(duì)列結(jié)構(gòu)來(lái)管理前端多個(gè)嵌入式系統(tǒng)的TCP連接,包括TCP連接進(jìn)隊(duì)循環(huán)和出隊(duì)處理循環(huán).
2) 圖像與鎖控?cái)?shù)據(jù)傳輸
針對(duì)每一個(gè)出隊(duì)的TCP連接,通過(guò)應(yīng)用層會(huì)話接收OV2640圖像數(shù)據(jù)并截取有效部分,接收和發(fā)送門(mén)鎖狀態(tài)數(shù)據(jù)和操作數(shù)據(jù).
3) 人臉識(shí)別腳本節(jié)點(diǎn)
將訓(xùn)練和驗(yàn)證后CNN模型的predict函數(shù)使用Matlab Script節(jié)點(diǎn)引入LabVIEW中.Script節(jié)點(diǎn)的輸入為預(yù)處理后的圖像數(shù)據(jù),輸出為識(shí)別后的人員的標(biāo)號(hào).
4) 數(shù)據(jù)庫(kù)設(shè)計(jì)與檢索
圖5 部分人臉圖像
為管理和記錄用戶信息、門(mén)鎖信息和門(mén)操作記錄信息,系統(tǒng)采用ACCESS數(shù)據(jù)庫(kù)設(shè)計(jì)Man、Door和Record 3個(gè)數(shù)據(jù)表.門(mén)鎖操作時(shí),根據(jù)人臉識(shí)別結(jié)果檢索Man表與Door表,進(jìn)行合法性判斷和權(quán)限對(duì)比,同時(shí)在Record表中記錄門(mén)操作的詳細(xì)信息,包括時(shí)間、門(mén)號(hào)、人員、門(mén)動(dòng)作等信息.
數(shù)據(jù)庫(kù)連接使用DSN數(shù)據(jù)源名稱(chēng),直接使用SQL語(yǔ)句字符串實(shí)現(xiàn)查詢(xún)、插入等數(shù)據(jù)庫(kù)操作.
實(shí)測(cè)過(guò)程中,人臉圖像數(shù)據(jù)集中包含有15人,每人100幅臉部圖像,共計(jì)1 500幅.OV7670的圖像的原始分辨率為320×240, 使用Matlab中的imresize函數(shù)可將其調(diào)整為100×100,如圖5所示.
數(shù)據(jù)集按7∶3的比例劃分為訓(xùn)練集和測(cè)試集.訓(xùn)練采用隨機(jī)梯度下降SGD(stochastic gradient descent)方式迭代10次,基礎(chǔ)學(xué)習(xí)率為0.001.訓(xùn)練集的正確率為0.987 8,測(cè)試集的正確率為0.988 5,從而表明泛化效果較好.
實(shí)測(cè)采取真人實(shí)測(cè),將OV2640攝像頭安裝在門(mén)上,10個(gè)人共進(jìn)行112次開(kāi)門(mén)實(shí)驗(yàn).識(shí)別結(jié)果是出錯(cuò)6次、未識(shí)別10次、識(shí)別成功96次.
基于LeNet-5架構(gòu)設(shè)計(jì)10層CNN用來(lái)實(shí)現(xiàn)人臉識(shí)別并使用LabVIEW構(gòu)建了一個(gè)完整的門(mén)禁智能管理系統(tǒng).系統(tǒng)具有多點(diǎn)圖像采集與傳輸、人臉識(shí)別和門(mén)鎖控制、數(shù)據(jù)庫(kù)門(mén)鎖操作管理等實(shí)用功能.研究結(jié)果表明整體結(jié)構(gòu)合理,工作正常,具有一定的借鑒作用和實(shí)用性.