李玉玲 王祥仲
摘 要:針對開放機房存在的安全隱患,提出通過卷積神經(jīng)網(wǎng)絡(luò)進行人臉識別的管理方法。在中心服務(wù)器中建立在校學生人臉識別采集庫,通過卷積神經(jīng)網(wǎng)絡(luò)的卷積、池化算法建立卷積神經(jīng)網(wǎng)絡(luò)模型,構(gòu)建人臉識別控制機制;并對人臉識別在開放機房應(yīng)用中的布局、工作原理、運行過程及測試進行研究。通過測試,發(fā)現(xiàn)人臉識別率達到98.8%,大大增加了開放機房的安全性,同時通過對后臺數(shù)據(jù)庫中不同時段上機人數(shù)進行統(tǒng)計,從而合理調(diào)整機器數(shù)量,提高管理效率。
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);人臉識別;開放機房;特征提取;反向傳播;數(shù)據(jù)傳輸
中圖分類號:TP393文獻標識碼:A文章編號:2095-1302(2020)06-000-05
0 引 言
隨著各大學校學分制的實行、學生自主學習時間的增加、學習自由度的提升,各個學校機房開放勢在必行!然而開放機房最大的問題在于如何保障安全,保障系統(tǒng)安全和網(wǎng)絡(luò)安全是重點考慮的兩個方面。
目前的開放機房管理方式為刷卡或指紋識別上機,但兩者都有其弊端。刷卡上機,上機者必須攜帶本人校園卡進行身份認證,如果校園卡丟失,存在被他人代用的隱患;采用指紋識別的機房管理方式相比刷卡上機的安全程度有所提高,但指紋識別存在誤識率較高,識別速度慢,以及指紋采集設(shè)備磨損或其他原因影響識別效果等問題[1]。
人臉識別可以加強機房操作的安全性。人臉識別是基于人的臉部特征信息進行身份識別的一種生物識別技術(shù)。用攝像機或攝像頭采集含有人臉的圖像或視頻,并自動在圖像中檢測和跟蹤,進而對檢測到的人臉進行識別[2]。
1 人臉識別的研究現(xiàn)狀
早期的人臉識別系統(tǒng)都是在手工提取特征[3]的基礎(chǔ)上,應(yīng)用分類算法進行識別。由于容易受到光線明暗、背景變化、姿態(tài)特征等諸多因素的干擾,使得通過手工提取的特征在以上外界因素發(fā)生變化時,導致原始圖像出現(xiàn)結(jié)構(gòu)丟失、特征描述不全面和不確定等問題,這些缺陷導致人臉識別率低[4]、可靠性差、無法進行大面積推廣等。
基于卷積神經(jīng)網(wǎng)絡(luò)CNN進行人臉識別是近年來隨著計算機技術(shù)、圖像處理技術(shù)、模式識別技術(shù)等快速進步而出現(xiàn)的一種嶄新的生物特征識別技術(shù)?;诰矸e神經(jīng)網(wǎng)絡(luò)的人臉識別算法具備神經(jīng)網(wǎng)絡(luò)學習能力、抗干擾能力較強等特點,非線性映射能力、容錯能力、泛化能力、魯棒性較好。
2 卷積神經(jīng)網(wǎng)絡(luò)算法
卷積神經(jīng)網(wǎng)絡(luò)包含了一個由卷積層和池化層(子采樣層)構(gòu)成的特征抽取器[5]。在卷積神經(jīng)網(wǎng)絡(luò)的卷積層中,一個神經(jīng)元只與部分鄰層神經(jīng)元連接。在CNN卷積層中[6],通常包含若干個特征平面(Feature Map),每個特征平面由一些矩形排列的神經(jīng)元組成,同一特征平面的神經(jīng)元共享權(quán)值,共享的權(quán)值即卷積核。卷積核一般以隨機小數(shù)矩陣的形式初始化,在網(wǎng)絡(luò)訓練過程中,卷積核將學習得到合理的權(quán)值。共享權(quán)值(卷積核)[7]的好處是減少了網(wǎng)絡(luò)各層之間的連
接[8],降低了過擬合的風險。子采樣也叫做池化(pooling),子采樣可以看作是一種特殊的卷積過程。卷積和子采樣大大簡化了模型復雜度與模型參數(shù)。
通常,CNN的結(jié)構(gòu)形式為數(shù)據(jù)層(data layer)→卷積層(convolutional layer)→池化層(pooling layer)→…(重復卷積、池化層)→全連接層(fully connected layer)→輸出結(jié)果層(output result layer),其中最重要的為卷積層和池化層[9]。
2.1 卷積層
在卷積層中,特征圖的每一個神經(jīng)元與前一層的局部感受野[10]相連接,與一個可學習的卷積核卷積,經(jīng)過卷積操作提取局部特征。卷積層的計算公式[11]:
式中:l代表層數(shù);mj代表輸入層的感受野;h代表卷積核;hlij是該層神經(jīng)元j與前一層神經(jīng)元i的連接強度;bjl是該層神經(jīng)元j的偏置;f(·)表示激活函數(shù)[12]。卷積層的前一層可以是初始圖像,也可以是卷積層或者下采樣層生成的特征圖。卷積核與局部感受野進行點乘,然后求和加偏置,卷積核內(nèi)部的參數(shù)可訓練,偏置的初始值[13]為0。
卷積層的計算方法:假設(shè)有輸入圖像A(5,5)和卷積核B(3,3),那么B卷積A的結(jié)果就是B矩陣在A矩陣上滑動,即B矩陣與A矩陣所有連續(xù)的3×3子矩陣做“對應(yīng)元素積之和”運算[14],此時的結(jié)果如圖1所示。
2.2 池化層
卷積神經(jīng)網(wǎng)絡(luò)的一個重要概念為池化層,池化層又叫下采樣層,一般在卷積層之后。在下采樣中,計算圖像某區(qū)域特征值時,需要對該區(qū)域進行分析和統(tǒng)計,用新的特征來表達該區(qū)域的總體特征。這個區(qū)域為池化域,其過程為池化[13],輸入的特征圖經(jīng)過池化操作后,個數(shù)不變,邊長變?yōu)橹暗?/n(n為池化的尺寸)。池化層對輸入做降采樣,減少參數(shù)的數(shù)量,防止過擬合現(xiàn)象的發(fā)生。常用的池化做法是對每個濾波器的輸出求最大值、平均值等。
2.2.1 池化層的前向傳播
池化層的前向傳播方法通常為最大值池化(max-pooling)和平均值池化(mean-pooling)。
最大值池化取池化域中的最大值作為下采樣特征圖的特征值。平均值池化是對池化域內(nèi)所有值求和并取其平均值作為下采樣特征圖的特征值[15]。最大值池化(max-pooling)[16]如圖2所示,選出每個區(qū)域中的最大值作為輸出。平均值池化(mean-pooling)如圖3所示,需計算每個區(qū)域的平均值作為輸出[17]。
2.2.2 池化層的反向傳播
在池化層進行反向傳播時[18],max-pooling和mean-pooling采用不同的方式[19]。
對于max-pooling,在前向計算時,選取每個2×2區(qū)域中的最大值,并記錄最大值在每個小區(qū)域中的位置。在反向傳播時,只有最大值對下一層有貢獻,所以將殘差傳遞到該最大值的位置[20],區(qū)域內(nèi)其他2×2-1=3個位置置零,其中4×4矩陣中非零的位置即為計算出來的每個小區(qū)域的最大值的位置,如圖4所示。
對于mean-pooling,我們需要把殘差平均分成2×2=4份,傳遞到前邊小區(qū)域的4個單元即可,具體過程如圖5所示。
3 人臉識別在開放機房中的應(yīng)用
3.1 結(jié)構(gòu)布局
因人臉識別[21]所具有的自然性、非強制性、非接觸性特點,不易被復制,有著無法被替代的唯一性,相較其他生物識別技術(shù)而言,用戶無需與設(shè)備直接接觸,安全又衛(wèi)生。
通過對全校在校學生信息的采集,基于卷積神經(jīng)網(wǎng)絡(luò)人臉識別模型的構(gòu)建與人臉在線識別,識別正確者可以順利進入系統(tǒng),非在校生及其他人員無法隨意進入系統(tǒng),極大地保證了機房的系統(tǒng)安全、網(wǎng)絡(luò)安全。人臉識別在開放機房的布局如圖6所示。系統(tǒng)由中心服務(wù)器、人臉識別控制器、交換機、客戶端(學生機)、攝像頭組成。
3.2 工作原理
人臉識別技術(shù)是基于人的臉部特征,對輸入的人臉圖像進行判斷。首先判斷是否存在人臉,如果存在,則進一步給出每張臉主要面部器官的位置信息。并依據(jù)這些信息,進一步提取人臉中蘊涵的面部特征。如果是初次信息采集,則直接將結(jié)果存入人臉資料庫;如果并非初次采集,則進行人臉識別,并將其與已知的人臉資料庫中的圖像進行對比,從而完成身份識別[22]。人臉識別在開放機房的工作原理如圖7所示。
通過客戶端進行在線人臉識別驗證輸入,驗證輸入數(shù)據(jù)通過內(nèi)部局域網(wǎng)由用戶管理服務(wù)器發(fā)送至構(gòu)建有人臉識別模型的中心服務(wù)器,人臉識別結(jié)果通過內(nèi)部局域網(wǎng)返回給用戶管理服務(wù)器和各客戶端。
(1)進行人臉圖像采集,在中心服務(wù)器中建立學生人臉識別采集庫。每一位學生在上機前,需在客戶端(學生機)攝像頭前獲得輸入圖像。
(2)客戶端把圖像傳到人臉識別控制器,對輸入的人臉圖像與服務(wù)器圖片庫中的圖像進行比對,判斷其是否存在。若身份識別通過,則客戶端自動開機,進入操作系統(tǒng);否則,無法開機進入操作系統(tǒng)。
3.3 網(wǎng)絡(luò)結(jié)構(gòu)
通過每個機房內(nèi)的RG-S2952G千兆交換機把中心服務(wù)器、客戶端、人臉識別機連接起來,再通過RG-S8610交換機的三層交換功能連接到校園網(wǎng)絡(luò)路由器,經(jīng)防火墻連接到Internet網(wǎng)絡(luò)。機房內(nèi)的千兆交換機保證了客戶端與中心服務(wù)器之間進行數(shù)據(jù)傳輸?shù)膶崟r性,中心服務(wù)器通過防火墻的過濾,能夠很大程度上保證中心服務(wù)器數(shù)據(jù)的安全。網(wǎng)絡(luò)結(jié)構(gòu)如圖8所示。
3.4 識別過程
通過用戶管理服務(wù)器錄入學生個人信息并采集人臉樣本后,對采集的人臉樣本進行預處理,之后將人臉樣本與學生個人信息相關(guān)聯(lián);用戶管理服務(wù)器將關(guān)聯(lián)后的學生個人信息與人臉樣本發(fā)送至中心服務(wù)器;將人臉的特征與存儲于人臉庫中的人臉特征進行對比;當測試人臉的特征與存儲于人臉庫中的人臉特征間的相似度未達到指定閾值時,提示測試者對當前所給出的人臉庫中最大相似度的人臉特征進行判斷;若人臉庫中最大相似度的人臉特征與測試人臉一致,則將定時器清零,計算機開啟。系統(tǒng)流程如圖9所示。
4 人臉識別在開放機房中的應(yīng)用測試
4.1 人臉識別管理部門的添加
利用云服務(wù)器建立人臉識別數(shù)據(jù)庫,進行管理部門添加,如圖10所示。北京聯(lián)合大學生物化學工程學院機房中心為該管理部門添加管理員和團隊成員,如添加有誤,可以刪減修改,保證團隊成員的正確性和完整性。
4.2 人臉錄入管理
待管理部門成員信息添加完畢后,開始進行人臉圖像采集,存入人臉錄入管理庫中。如果錄入人臉圖像有誤,可以刪減,保證人臉圖像采集的正確性;及時更新人臉圖像數(shù)據(jù)庫,保證人臉圖像采集庫的有效性。北京聯(lián)合大學生物化學工程學院機房中心人臉錄入管理界面如圖11所示。
4.3 人臉識別測試
通過添加學校2 016位在職學生和老師的基本信息,分別在白天和夜晚,日光、燈光兩種不同的光照條件下,對503名常用機房的師生進行人臉圖像庫取樣,然后分不同時段進行采樣人臉識別測試,其中白天的測試中有500名學生一次性通過,有3名學生在第二次人臉識別時通過,一次性通過率達到99.4%;晚上在燈光下測試的學生中有494名學生一次性通過,通過率達到98.2%,有3名學生在第二次人臉識別時通過。卷積神經(jīng)網(wǎng)絡(luò)的人臉識別如圖12所示,測試結(jié)果見表1所列。
4.4 人臉識別數(shù)據(jù)統(tǒng)計
利用人臉識別數(shù)據(jù)庫中的數(shù)據(jù)進行統(tǒng)計。日統(tǒng)計,即對每日上機的學生總數(shù)進行統(tǒng)計;月統(tǒng)計,即對每月上機的學生總數(shù)進行統(tǒng)計。人臉識別數(shù)據(jù)統(tǒng)計如圖13所示。系統(tǒng)也可以記錄學生特定時間段的上機量,進而通過對學生在某個時間段上機量數(shù)據(jù)庫的分析,精確統(tǒng)計人數(shù),以便及時調(diào)整該時間段的機器數(shù)。
5 結(jié) 語
本文通過對卷積神經(jīng)網(wǎng)絡(luò)算法的人臉識別研究分析,并將此算法應(yīng)用在開放機房的安全管理,設(shè)計開放機房應(yīng)用的結(jié)構(gòu)布局,分析工作原理、運行過程并進行人臉識別測試;通過測試,達到98.8%的人臉識別率,增加了開放機房的安全性;通過人臉識別數(shù)據(jù)管理,既能滿足學生上機需求,提高資源利用率,同時又節(jié)省機房管理時間、提升管理效率。該系統(tǒng)具有很強的社會價值和推廣意義。
注:本文通訊作者為王祥仲。
參考文獻
[1]張靜端.基于人臉識別技術(shù)的圖書館門禁系統(tǒng)的研究[J].現(xiàn)代電子技術(shù),2016,39(18):99-103.
[2]解駿.基于卷積神經(jīng)網(wǎng)絡(luò)的人臉識別研究[J].軟件導刊,2018(17):25-27.
[3]陳耀丹,王連明.基于卷積神經(jīng)網(wǎng)絡(luò)的人臉識別方法[J].東北師大學報(自然科學版),2016(2):70-76.
[4] QUIONERO CANDELA J,SUGIYAMA M,SCHWAIGHOFER A,et al.Dataset Shift in Machine Learning [M]. Cambridge,USA:The MIT Press,2009.
[5]周飛燕.卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J].計算機學報,2017(6):1233-1236.
[6] CHU J L,KRZYZAK A. Analysis of feature maps selection in supervised learning using convolutional neural networks[C]// Proceedings of the 27th Canadian Conference on Artificial Intelligence,Montreal,Canada,2014:59-70.
[7] LECUN Y,BOTTOU L,BENGIO Y,et al. Gradient-based learning applied to document recognition [J]. Proceedings of the IEEE,1998,86(11):2278-2324.
[8] GAO Ligang,CHEN Paiyu,YU Shimeng. Demonstration of convolution kernel operation on resistive cross-point array [J]. IEEE electron device letters,2016,37(7):870-873.
[9]陳旭.卷積網(wǎng)絡(luò)深度學習算法與實例[J].廣東工業(yè)大學學報,2017(6):20-26.
[10] HUBEL D H,WIESEL T N. Receptive fields,binocular interaction and functional architecture in the cats visual cortex [J].The journal of physiology,1962,160(1):106-154.
[11] SYAFEEZA A R,KHALIL-HANI M,LIEW S S,et al. Convolutional neural network for face recognition with pose and Illumination Variation [J]. International journal of engineering & technology,2014,6(1):44-57.
[12] NAIR V,HINTON G E,F(xiàn)ARABET C. Rectified linear units improve restricted Boltzmann machines [C]// Proceedings of the 27th International Conference on Machine Learning. Haifa,Israel,2010:807-814.
[13]彭清.卷積神經(jīng)網(wǎng)絡(luò)在車輛識別中的應(yīng)用[J].計算機科學與探索,2018(12):282-291.
[14]盧宏濤.深度卷積神經(jīng)網(wǎng)絡(luò)在計算機視覺中的應(yīng)用研究綜述[J].數(shù)據(jù)采集與處理,2016(1):1-17.
[15] BOUREAU Y L,ROUX N L,BACH F,et al. Ask the locals: Multi-way local pooling for image recognition [C]// Proceedings of the 2011 International Conference on Computer Vision. Barcelona,Spain,2011:2651-2658.
[16] ZEILER M D,F(xiàn)ERGUS R. Stochastic pooling for 3557v1[Z].2013.
[17]景晨凱.基于深度卷積神經(jīng)網(wǎng)絡(luò)的人臉識別技術(shù)綜述[J].計算機應(yīng)用與軟件,2018(1):223-231.
[18] KRIZHEVSDY A,SUTSKEVER? HINTON G. Imagenet classification with deep convolutional neural networks [C]// Proceedings of the Advances in Neural Information Processing Systems. Lake Tahoe,USA,2012:1097-1105.
[19]李國和,喬英漢,吳衛(wèi)江,等.深度學習及其在計算機視覺領(lǐng)域中應(yīng)用[J].計算機應(yīng)用研究,2019(12):2.
[20] YOO H J. Deep convolution neural networks in computer vision: A review [J]. IEIE transactions on smart processing and computing,2015,4(1):35-43.
[21]張富為.基于卷積神經(jīng)網(wǎng)絡(luò)的構(gòu)件分類策略的研究[J].計算機工程與應(yīng)用,2019,55(8):201-207.
[22]楊巨成.基于深度學習的人臉識別方法研究綜述[J].天津科技大學學報,2016(12):1-10.
[23] LECUN Y,BOSER B DENKER J S,et al. Backpropagation applied to handwritten zip code recognition [J]. Neural computation,1989,11(4):541-551.