杭子皓 李艷靈
(信陽師范學(xué)院 河南省信陽市 464000)
現(xiàn)階段,在實(shí)際針對(duì)校園進(jìn)行管理的過程中,為了保證校園環(huán)境的安全性,為學(xué)生營造良好的學(xué)習(xí)環(huán)境,學(xué)校設(shè)計(jì)了智慧校園人臉識(shí)別系統(tǒng),其在實(shí)際應(yīng)用的過程中,具有較強(qiáng)的針對(duì)性,一對(duì)一進(jìn)行身份識(shí)別和驗(yàn)證。目前,人臉識(shí)別系統(tǒng)已經(jīng)成為數(shù)字化校園、智慧校園建設(shè)的重要措施,而且也為校園視頻監(jiān)控提供了強(qiáng)有力的支持。智慧校園人臉識(shí)別系統(tǒng)可以幫助學(xué)校一對(duì)一了解學(xué)生以及教師的行動(dòng)軌跡,進(jìn)而提升校園管理的有效性以及管理水平,既做到了事后提供數(shù)據(jù),又可以實(shí)現(xiàn)事前預(yù)警的目的,為校園管理奠定了堅(jiān)實(shí)的基礎(chǔ)。
卷積神經(jīng)網(wǎng)絡(luò),其主要是在神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上應(yīng)用卷積計(jì)算的方式,并利用卷積層獲取卷積核獲取圖形的特征,而卷積簡單來說就是加權(quán)求和,其中權(quán)值矩陣也被稱之為加權(quán)模板,其還被稱之為卷積核和濾波器,而卷積核之間存在一定的差異性,不同的卷積核擁有不同的功能,比如說模糊處理、圖像分割以及邊緣檢測等。在實(shí)際應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)的過程中,通常會(huì)經(jīng)過多次卷積,進(jìn)而保證圖像信息獲取的準(zhǔn)確性以及精準(zhǔn)性,同時(shí)也可以獲取更深層次的圖像特征,這也為后續(xù)的分類以及預(yù)測提供了強(qiáng)有力的支持。與傳統(tǒng)機(jī)器學(xué)習(xí)方法相比,卷積神經(jīng)網(wǎng)絡(luò)的作用和價(jià)值更為明顯,因此被大范圍應(yīng)用于人臉識(shí)別系統(tǒng)之中,比如說智慧校園建設(shè)、機(jī)場旅客離港等,相關(guān)研究人員針對(duì)此進(jìn)行了更為深入地研究和分析,保證其發(fā)揮出明顯優(yōu)勢(shì)和作用,其也成為當(dāng)前重點(diǎn)研究對(duì)象。卷積神經(jīng)網(wǎng)絡(luò)本質(zhì)如圖1所示。
圖1:卷積神經(jīng)網(wǎng)絡(luò)本質(zhì)
對(duì)于卷積神經(jīng)網(wǎng)絡(luò)的構(gòu)成來說,其具有傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的輸入層以及輸出層,同時(shí)也具有自身特有的卷積層、池化層以及全連接層。
1.1.1 卷積層
其在實(shí)際運(yùn)行的過程中,主要是依靠卷積核,針對(duì)圖像對(duì)象進(jìn)行卷積運(yùn)算。通常情況下來講,卷積層內(nèi)存在多個(gè)不同的卷積核,進(jìn)而實(shí)現(xiàn)對(duì)圖像進(jìn)行深層次特征獲取的目的。根據(jù)研究調(diào)查顯示,圖像特征獲取其內(nèi)容較為繁雜且涉及眾多的數(shù)據(jù)信息,此時(shí)就可以發(fā)揮池化層的作用,對(duì)特征圖像的維度進(jìn)行整理篩選,減少不必要的數(shù)據(jù)信息。
1.1.2 池化層
其也被稱之為抽樣層,其在實(shí)際運(yùn)行的過程中,主要是在特定的區(qū)域內(nèi)展開工作,對(duì)提出的圖像特征進(jìn)行整合。其設(shè)置在卷積層之后,因此單個(gè)區(qū)域范圍內(nèi)的像素通常存在相似性的特點(diǎn),而此時(shí),在實(shí)際開展工作的過程中,相關(guān)工作人員只需要某一個(gè)或者幾個(gè)值就可以表示整體區(qū)域范圍內(nèi)的特征。池化層在開展工作的過程中,存在多種方法,典型的是均值池化、隨機(jī)池化以及最大池化。而現(xiàn)階段,較為常用的是最大池化方法,其主要是選擇某個(gè)區(qū)域內(nèi)的最大值,并對(duì)其進(jìn)行相應(yīng)的處理[1]。
1.1.3 全連接層
其也被稱之為FC 層,一般將其布置在卷積神經(jīng)網(wǎng)絡(luò)的左后一個(gè)部分,其主要是將卷積核提取的深層特征進(jìn)行轉(zhuǎn)化,將二維特征轉(zhuǎn)化為一維定向,便于后續(xù)的分析和處理。
1.2.1 局部連接
其余全連接相對(duì)。卷積神經(jīng)網(wǎng)絡(luò)的主要作用是對(duì)圖像進(jìn)行處理,并獲取深層特征,但是在實(shí)際進(jìn)行圖像處理時(shí),其會(huì)受到點(diǎn)像素的影響,特別是距離較近的點(diǎn)像素,其與圖像處理之間具有較強(qiáng)的關(guān)聯(lián)性,但是相對(duì)來說距離較遠(yuǎn)的點(diǎn)像素對(duì)其影響較弱。由此可見,卷積神經(jīng)網(wǎng)絡(luò)在實(shí)際處理圖像的過程中,神經(jīng)節(jié)點(diǎn)只需要與局部卷積核區(qū)域進(jìn)行連接即可,這樣可以在很大程度上提升整體工作效率,節(jié)約圖像特征獲取的時(shí)間資源。
1.2.2 權(quán)值共享
卷積神經(jīng)網(wǎng)絡(luò)在實(shí)際進(jìn)行圖像處理的過程中,通常會(huì)涉及眾多數(shù)據(jù)參數(shù),而權(quán)值共享可以有效降低其數(shù)量。由此可見。如果卷積層中的卷積核提取了一個(gè)圖像中某個(gè)區(qū)域的特征,那么從理論上來看,這個(gè)卷積核適用于此圖像的其他區(qū)域,而這就在很大程度上降低了出現(xiàn)參數(shù)重復(fù)的情況,有效減少參數(shù)數(shù)量,也避免了一個(gè)卷積核被重復(fù)利用的概率。通常情況下來講,在實(shí)際獲取圖像特征的過程中,僅依靠一個(gè)卷積核就可以獲取整個(gè)圖像中同類型的特征,最終形成完整的特征圖,而卷積層內(nèi)設(shè)置多個(gè)卷積核的主要目的是獲取更深層次的圖像特征,而在此過程中也可以進(jìn)行訓(xùn)練,有助于提升學(xué)習(xí)效率,但同時(shí)也降低了學(xué)習(xí)難度。
當(dāng)前學(xué)校為了提升整體管理質(zhì)量以及管理效率,以卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),設(shè)計(jì)了智慧校園人臉識(shí)別系統(tǒng)。與傳統(tǒng)機(jī)器學(xué)習(xí)相比,卷積神經(jīng)網(wǎng)絡(luò)在實(shí)際應(yīng)用的過程中其優(yōu)勢(shì)和作用更為突出,其是一種深度前饋人工神經(jīng)網(wǎng)絡(luò),在實(shí)際處理的過程中,其會(huì)對(duì)周圍單元進(jìn)行響應(yīng),進(jìn)而實(shí)現(xiàn)圖像處理的目的,這也是其被應(yīng)用于圖像識(shí)別的主要原因。對(duì)于卷積神經(jīng)網(wǎng)絡(luò)來說,其局部鏈接以及權(quán)值共享特點(diǎn),使其為人臉識(shí)別系統(tǒng)提供了強(qiáng)有力的支持,其與現(xiàn)實(shí)世界中的深入神經(jīng)網(wǎng)絡(luò)的一致性相對(duì)來說更強(qiáng),而且權(quán)值共享也減少了不必要的參數(shù)數(shù)量,減低了整體的復(fù)雜性。
對(duì)于智慧校園人臉識(shí)別系統(tǒng)來說,首先要做的就是獲取校園內(nèi)學(xué)生以及教師的人臉圖像信息。人臉識(shí)別系統(tǒng)在實(shí)際運(yùn)行的過程中,主要是通過分析人臉特征識(shí)別身份的一種更為有效的方法,因此需要對(duì)相關(guān)學(xué)生以及教師的人臉信息進(jìn)行采集。通常情況下來講,新生在入校報(bào)名登記的過程中,會(huì)統(tǒng)一進(jìn)行人臉圖像采集,此時(shí)可以應(yīng)用PCP 人像采集系統(tǒng)4.0,其主要是對(duì)靜態(tài)圖像進(jìn)行相應(yīng)的采集,在計(jì)算機(jī)中以JPG 的形式進(jìn)行儲(chǔ)存,并生成人臉圖像文件,但是在實(shí)際進(jìn)行儲(chǔ)存的過程中對(duì)于文件的大小進(jìn)行了相應(yīng)的規(guī)定,要求其大小不得超過100K,同時(shí)需要對(duì)各個(gè)文件進(jìn)行命名,其命名方式為“學(xué)生姓名+學(xué)號(hào)”,并以班級(jí)為單位進(jìn)行分類整理,而對(duì)于教職工來說,其命名方式為“教職工姓名+工號(hào)”[2]。最后,在完成人臉圖像采集之后,需要對(duì)圖像文件進(jìn)行相應(yīng)的處理,生成對(duì)應(yīng)的編碼,這樣可以為后續(xù)計(jì)算機(jī)的處理提供便利條件。學(xué)生的人臉圖像不僅可以用于識(shí)別系統(tǒng),同時(shí)也可以應(yīng)用于學(xué)生證以及學(xué)習(xí)檔案之中,無需學(xué)生上交圖片信息,而對(duì)于教職工的人臉圖像來說,可以應(yīng)用于考勤系統(tǒng)之中,在實(shí)際進(jìn)行設(shè)計(jì)的過程中,需要將其與考勤系統(tǒng)搭建聯(lián)系,并由攝像機(jī)直接獲取圖像信息,而且其也可以批量導(dǎo)入或者是導(dǎo)出圖像與數(shù)據(jù),為考勤系統(tǒng)提供了強(qiáng)有力的支持。
在實(shí)際利用卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)智慧校園人臉識(shí)別系統(tǒng)的過程中,需要在卷積神經(jīng)網(wǎng)絡(luò)之前輸入學(xué)習(xí)數(shù)據(jù),這一操作的主要目的是實(shí)現(xiàn)對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理的目的。而其中訓(xùn)練數(shù)據(jù)可以選擇olivettifaces 人臉數(shù)據(jù)庫,此數(shù)據(jù)庫是由紐約大學(xué)研究建立,其規(guī)模相對(duì)來說比較小,整個(gè)數(shù)據(jù)庫內(nèi)僅存在40 個(gè)人的人臉圖像信息,但是對(duì)于每個(gè)人來說收集了10 張人臉圖像樣本,最終構(gòu)成一個(gè)由400 小圖像共同組成的大圖像,大圖像尺寸為1190*942,小圖像的尺寸為57*47,在實(shí)際進(jìn)行訓(xùn)練的過程中,需要對(duì)訓(xùn)練數(shù)據(jù)的RGB 數(shù)據(jù)范圍進(jìn)行相應(yīng)的控制,保證其處于[0,255]的范圍之內(nèi),且不需要再次進(jìn)行統(tǒng)一處理,但是需要對(duì)圖片進(jìn)行去均值以及白化預(yù)處理操作。在實(shí)際進(jìn)行去均值的過程中,其主要是將各個(gè)特征值減數(shù)據(jù)集RGB 通道的均值,進(jìn)而改變數(shù)據(jù)分布,將其轉(zhuǎn)變?yōu)榫禐?、方差為1 的數(shù)據(jù),在實(shí)際進(jìn)行數(shù)據(jù)訓(xùn)練的過程中,需要將訓(xùn)練數(shù)據(jù)導(dǎo)入到numpy 庫之中。而白化預(yù)處理操作的主要目的是對(duì)數(shù)據(jù)參數(shù)進(jìn)行處理,減少重復(fù)數(shù)據(jù),避免圖像特征出現(xiàn)相似性的特點(diǎn),進(jìn)而使得訓(xùn)練數(shù)據(jù)具有相同的分布。一般來說CNN 在訓(xùn)練的過程中,具有監(jiān)督的作用,其針對(duì)圖像格式進(jìn)行處理,保證其一致性,并對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行處理,使其帶上標(biāo)簽(labels),簡單來說,就是使一個(gè)人的10 張圖像設(shè)置為同一個(gè)標(biāo)簽,在設(shè)計(jì)標(biāo)簽的過程中,其值域需要符合激活函數(shù)的數(shù)值,最后將已經(jīng)完成命名的400 張圖像進(jìn)行分區(qū)劃分,分別為數(shù)據(jù)集、驗(yàn)證集以及訓(xùn)練集。
在卷積神經(jīng)網(wǎng)絡(luò)之中,卷積層是最為重要的一項(xiàng)內(nèi)容,其主要是提取人臉圖像信息的特征,在實(shí)際進(jìn)行特征提取的過程中,主要是利用卷積核完成這一操作,并對(duì)輸入的圖像進(jìn)行卷積基礎(chǔ)[3]。卷積核在實(shí)際進(jìn)行圖像特征提取的過程中,其會(huì)按照水平方向或者是垂直方向進(jìn)行滑動(dòng),一般來說是按照特定步長進(jìn)行滑動(dòng),卷積核每次移動(dòng)一個(gè)步長,都會(huì)對(duì)圖像進(jìn)行具有規(guī)律性的掃描,進(jìn)而提取圖像特征,隨后會(huì)針對(duì)視野范圍內(nèi)的輸入圖像以及filter 相對(duì)應(yīng)位置的元素進(jìn)行運(yùn)算,先相乘,隨后再進(jìn)行求和運(yùn)算,最后再加上偏置項(xiàng),最終得到的運(yùn)算結(jié)果,并在卷積核位置相對(duì)應(yīng)的輸出特征特圖像上放置最終結(jié)果,最后停止滑動(dòng)后,可以得到一張全新的特征圖。對(duì)比與其他運(yùn)算來說,卷積運(yùn)算是一種線性運(yùn)算方式,在實(shí)際應(yīng)用的過程中,需要引用非線性函數(shù),即激活函數(shù),其主要目的是提升網(wǎng)絡(luò)性能條件,進(jìn)而保證卷積神經(jīng)網(wǎng)絡(luò)的非線性能力,保證運(yùn)算的全麥能行以及完整性,最終在完成卷積運(yùn)算之后,還需要進(jìn)行激勵(lì)函數(shù)運(yùn)算,進(jìn)而將最終結(jié)果輸入至池化層之中。在實(shí)際進(jìn)行激勵(lì)函數(shù)計(jì)算的過程中,通常會(huì)應(yīng)用Relu 激勵(lì)函數(shù),其在整體計(jì)算的過程中發(fā)揮著重要的作用和價(jià)值,且具有應(yīng)用優(yōu)勢(shì),與其他函數(shù)計(jì)算相比,在是計(jì)算的過程中收斂迅速、求梯度更為簡單,且對(duì)于輸入的負(fù)值來說,可以全部輸出為0,而對(duì)于輸入的正值來說,保證原樣輸出。
通常情況下來講,智慧校園人臉識(shí)別系統(tǒng)在實(shí)際運(yùn)行工作的過程中,卷積層神經(jīng)網(wǎng)絡(luò)在開展運(yùn)算時(shí),通常需要對(duì)圖像進(jìn)行分類處理,而在實(shí)際進(jìn)行圖像分類的過程中,通常情況下來講,更加關(guān)心圖像中某一個(gè)特征是否出現(xiàn),但是卻不需要考慮特征出現(xiàn)的具體位置,但是這也對(duì)整體運(yùn)算和特征提取帶來了一定的難度,傳統(tǒng)神經(jīng)網(wǎng)絡(luò)無法滿足這一內(nèi)容,而卷積神經(jīng)網(wǎng)絡(luò)中的池化層可以解決此項(xiàng)難題。池化層在實(shí)際運(yùn)行的過程中,也需要獲取相對(duì)應(yīng)的圖像信息,但是其工作具有平移不變的特點(diǎn),也正是此特點(diǎn)解決了上述問題。在實(shí)際利用卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)智慧校園人臉識(shí)別系統(tǒng)設(shè)計(jì)的過程中,池化層位于中間位置,其主要目的是減少圖像特征象關(guān)參數(shù)數(shù)量,其在很大程度上降低了運(yùn)算的難度以及強(qiáng)度,進(jìn)而節(jié)約了一定的時(shí)間資源,也提升了整體運(yùn)算的效率,提升運(yùn)算速度,減少過擬合[4]。池化層在實(shí)際操作的過程中,可以從根本上減少網(wǎng)絡(luò)參數(shù),并對(duì)其整體結(jié)構(gòu)進(jìn)行優(yōu)化。池化層在實(shí)際進(jìn)行結(jié)構(gòu)優(yōu)化的過程中,可以應(yīng)用不同的方式,比如說平均池化、最大池化等,但是從當(dāng)前的實(shí)際情況來看,現(xiàn)階段應(yīng)用最為廣泛的是最大池化。比如說,對(duì)于2*2 的窗口來說,想要選出最大數(shù)值最為輸出矩陣的相應(yīng)元素的值。如圖2所示。
圖2:最大池化
對(duì)于卷積層以及池化層來說,其參數(shù)數(shù)據(jù)通常呈現(xiàn)對(duì)應(yīng)的特點(diǎn),簡單來說就是數(shù)據(jù)參數(shù)成對(duì)出現(xiàn),在卷積層提取圖像特征之后,需要通過池化層的處理操作,其不會(huì)改變圖像特征,但是可以對(duì)重復(fù)或者是具有相似性的特征進(jìn)行處理,實(shí)現(xiàn)特征降維的目的,其可以在很大程度上避免出現(xiàn)過擬合的情況,同時(shí)也可以提升網(wǎng)絡(luò)對(duì)圖像的魯棒性。
全連接層主要布置在池化層之后,其主要目的是將圖像特征進(jìn)行分類。全連接層在實(shí)際運(yùn)行的過程中,其每個(gè)節(jié)點(diǎn)都會(huì)與上一層的全部節(jié)點(diǎn)相連接,這樣可以將卷積層獲取的所有圖像特征進(jìn)行整合、處理,形成一個(gè)完整的圖像特征系統(tǒng)。而為了便于后續(xù)工作的進(jìn)行,全連接層還需要將卷積層提取的二維特征圖轉(zhuǎn)變?yōu)閷?duì)應(yīng)的一維向量,隨后需要對(duì)向量進(jìn)行乘法運(yùn)算,最終實(shí)現(xiàn)降低維度的目的[5]。
輸出層是整體卷積神經(jīng)網(wǎng)絡(luò)中的最后一個(gè)步驟。布置分類器的主要目的是將全連接層分類的圖像特征按照概率進(jìn)行分布,而輸出相當(dāng)于概率或者是分類的結(jié)果。在實(shí)際進(jìn)行分類的過程中,需要應(yīng)用分類函數(shù),比如說softmax 函數(shù),其在實(shí)際應(yīng)用的過程中,其出書信號(hào)可以保持在[0,1]的范圍之內(nèi),而且其輸出總和為1。因此在實(shí)際進(jìn)行運(yùn)算的過程中,可以將softmax 函數(shù)的結(jié)果作為概率分布,通常情況下來講,神經(jīng)網(wǎng)絡(luò)只是將輸出最大神經(jīng)元所對(duì)應(yīng)的類別視為最終識(shí)別結(jié)果。
在卷積神經(jīng)網(wǎng)絡(luò)的支持下,完成智慧校園人臉識(shí)別系統(tǒng)的設(shè)計(jì)后,為了保證整體系統(tǒng)運(yùn)行的有效性,保證學(xué)校在實(shí)際進(jìn)行管理的過程中,可以實(shí)時(shí)且全面地了解學(xué)生的行動(dòng)軌跡,需要對(duì)智慧校園人臉識(shí)別系統(tǒng)進(jìn)行試驗(yàn)?zāi)M,這樣可以保證智慧校園人臉識(shí)別系統(tǒng)應(yīng)用的穩(wěn)定性,提升對(duì)學(xué)生管理的質(zhì)量以及效率。相關(guān)研究人員首先需要進(jìn)行初步測試,了解智慧校園人臉識(shí)別系統(tǒng)的性能,在實(shí)際進(jìn)行測試的過程中,相關(guān)工作人員可以將olivettifaces 人臉數(shù)據(jù)庫中10 個(gè)人共計(jì)100 張人臉圖像作為樣本,并對(duì)人臉圖像特征信息進(jìn)行提取。從最終結(jié)果來看,其可以實(shí)現(xiàn)人臉識(shí)別的目的,同時(shí)也可以保證人臉識(shí)別的精準(zhǔn)性以及可靠性。當(dāng)攝像機(jī)獲取人臉信息之后,其可以與數(shù)據(jù)庫內(nèi)輸入的人臉特征進(jìn)行對(duì)比,并進(jìn)相應(yīng)的匹配,當(dāng)其相似程度達(dá)到95%,那么可以說明智慧校園人臉識(shí)別系統(tǒng)設(shè)計(jì)符合標(biāo)準(zhǔn),可以滿足學(xué)校管理的需求,可以投入使用之中?;诰矸e神經(jīng)網(wǎng)絡(luò)的智慧校園人臉識(shí)別系統(tǒng)的設(shè)計(jì),其不僅可以對(duì)學(xué)生的日常行為進(jìn)行管理,同時(shí)其可以與智能監(jiān)控系統(tǒng)建立聯(lián)系,進(jìn)而提升校園整體的安全性,為學(xué)生提供良好的學(xué)習(xí)環(huán)境。
綜上所述,隨著科學(xué)技術(shù)、信息技術(shù)以及計(jì)算技術(shù)的不斷發(fā)展和進(jìn)步,其為卷積神經(jīng)網(wǎng)絡(luò)提供了強(qiáng)有力的支持,而且也為生物識(shí)別檢測技術(shù)奠定了堅(jiān)實(shí)的基礎(chǔ),具體表現(xiàn)為人臉識(shí)別系統(tǒng)。現(xiàn)階段,大部分校園在設(shè)計(jì)建設(shè)智慧校園人臉識(shí)別系統(tǒng)的過程中,通常會(huì)應(yīng)用卷積神經(jīng)網(wǎng)絡(luò),其可以獲取圖像特征,并對(duì)人臉定位以及人臉識(shí)別,有助于實(shí)現(xiàn)對(duì)校園環(huán)境進(jìn)行全面智能監(jiān)控的目的。