韋大歡 蘇燕
摘 要:文章提出一種基于BP神經(jīng)網(wǎng)絡(luò)的人臉識別系統(tǒng),該系統(tǒng)采取預(yù)處理方法來確保人臉識別準確率不會因圖像背景及光照條件等特征的變化而下降,同時通過直方圖平衡、橢圓遮罩以及濾波等處理方式,以使系統(tǒng)具備更高的人臉識別準確率。
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò);人臉識別;模式識別;圖像預(yù)處理
0? ? 引言
計算機技術(shù)的快速發(fā)展,使得各種新興技術(shù)不斷涌現(xiàn),人臉識別技術(shù)便是其中之一。在人機交流、安全驗證以及公安系統(tǒng)等各個領(lǐng)域,人臉識別技術(shù)都有其巨大的應(yīng)用價值。人們可以利用人臉識別來進行檔案管理、視頻會議乃至醫(yī)學(xué)醫(yī)療?,F(xiàn)階段,人們已普遍使用智能手機來進行購物、交流,這也促使人臉識別技術(shù)的應(yīng)用場景不斷增多。但是,人們在用智能手機對人臉圖像進行掃描時,容易因背景及光照條件的變化而影響到人臉識別結(jié)果。對于該問題,需要采取人臉圖像的預(yù)處理措施來消除這種不利影響,并且以BP神經(jīng)網(wǎng)絡(luò)為核心設(shè)計相應(yīng)的人臉識別系統(tǒng)。
1? ? 預(yù)處理策略
1.1? viola-jones算法
在一幅圖像中,如果某個或多個區(qū)域中存在人臉時,便可通過人臉檢測技術(shù)來進行定位。對于人臉檢測技術(shù)來說,其主要采用viola-jones算法,viola-jones算法具有三大要點,分別是Haar-like特征、Cascade結(jié)構(gòu)與AdaBoost算法。其中Haar-like特征通過積分圖像來對矩形區(qū)域中存在的差分信號進行快速計算,而AdaBoost算法則能夠?qū)tump函數(shù)進行結(jié)合,以便于選擇的弱分離器具有較強的區(qū)分能力,通過對這些弱分類器進行線性組合,以此提高分類性能。對于Cascade結(jié)構(gòu)來說,其具有早期決策作用,這使其能夠?qū)Ψ侨四槖呙璐翱谶M行快速拋棄,采用viola-jones人臉檢測算法,能夠?qū)D像中存在的人臉進行快速定位,并且采取類似于人眼的方式來進行興趣區(qū)域處理,以此對人臉中的相關(guān)特征圖像進行截取。
1.2? 基于人眼識別的興趣區(qū)域處理
在人臉識別系統(tǒng)中,需以人眼識別為原理,將人臉圖像中的人臉作為興趣區(qū)域進行處理后,能夠?qū)θ四槄^(qū)域中的人臉特征進行截圖,然后采取預(yù)處理方法來提取圖像特征,以使光照與背景變化給人臉識別準確率造成的不利影響得到有效消除。系統(tǒng)需要采取直方圖平衡化處理方式來進行圖像處理,這樣圖像的對比度能夠顯著提高,以使圖像能夠在更大范圍中進行灰度值取值,從而提高了圖像的清晰度。系統(tǒng)還可采取濾波處理來對圖像中的噪點進行清除,最后系統(tǒng)還能利用橢圓遮罩處理方法,使圖像中與人臉不相關(guān)的背景圖案被有效屏蔽[1]。
2? ? BP神經(jīng)網(wǎng)絡(luò)
2.1? BP神經(jīng)網(wǎng)絡(luò)模型的建立
對于BP神經(jīng)網(wǎng)絡(luò)來說,其是一種多層前饋網(wǎng)絡(luò),該網(wǎng)絡(luò)是以誤差逆?zhèn)鞑ニ惴▉黹_展訓(xùn)練的。在BP神經(jīng)網(wǎng)絡(luò)中包括3個層次,即輸入層、隱藏層與輸出層,并通過全連接來映射層和層之間的關(guān)系。這3層中的神經(jīng)單元并未進行連接,通過層層處理,能夠使輸入向量X=(x1,x2…xn)在向量Y=(y1,y2...yn)中進行非線性映射。在人臉識別過程中應(yīng)用BP神經(jīng)網(wǎng)絡(luò)后,其網(wǎng)絡(luò)神經(jīng)結(jié)構(gòu)共包括3層,輸入層、隱藏層和輸出層的數(shù)量均為一層。
在BP神經(jīng)網(wǎng)絡(luò)中的各個神經(jīng)單元相當于獨立的感知設(shè)備,通過神經(jīng)單元能夠使實數(shù)值向量轉(zhuǎn)化成輸入?yún)?shù),通過對輸入的線性組合進行計算,并分析結(jié)果與某個閥值之間的大小。當結(jié)果比閥值大時,則輸出值為1反之則為-1。在本文中通過sigmoid壓縮函數(shù)來設(shè)置感知設(shè)備,輸入向量則通過sigmoid函數(shù)進行計算并輸出,以此獲得壓縮輸出值,從而確保整個BP神經(jīng)網(wǎng)絡(luò)能夠快速收斂。
在BP神經(jīng)網(wǎng)絡(luò)中,通過反向傳播算法的應(yīng)用,利用反向傳播過程中產(chǎn)生的誤差值,以此對網(wǎng)絡(luò)各個神經(jīng)單元所賦有的權(quán)重進行適當調(diào)整,這樣便可獲得神經(jīng)網(wǎng)絡(luò)的穩(wěn)定收斂權(quán)值,從而使訓(xùn)練得以順利宛成。待訓(xùn)練完畢時,在新的圖像中,其新的輸入向量X=(x1,x2,…,xn)能夠獲得具有唯一性的輸出向量,即Y=(y1,y2,…,yn),該向量Y能夠當作圖像的最終識別結(jié)果。
2.2? 設(shè)置沖量項
對于BP神經(jīng)網(wǎng)絡(luò)來說,其在收斂訓(xùn)練過程中需要應(yīng)用到反向傳播算法,由于利用梯度下降算法會造成BP神經(jīng)網(wǎng)絡(luò)的收斂速度降低或出現(xiàn)局部最優(yōu)解問題,所以需要從思維理解上把梯度下降算法比喻成球是沿著誤差曲面進行向下滾落的,這樣沖量項的作用便相當于小球從一次迭代至下次迭代過程中的滾動方向是相同的。通過沖量能夠使球在誤差曲面中滾下時可能會產(chǎn)生局部最小值,由于其同樣發(fā)揮著增大搜索步長的作用,所以能夠加快BP神經(jīng)網(wǎng)絡(luò)的收斂速度。通過對沖量項進行引入,并對反向傳播算法公式進行替換,便可得出算法主循環(huán)中經(jīng)過n次迭代后的權(quán)值更新結(jié)果[2]。
3? ? 基于BP神經(jīng)網(wǎng)絡(luò)的人臉識別系統(tǒng)
3.1? 系統(tǒng)設(shè)計
在基于BP神經(jīng)網(wǎng)絡(luò)的人臉識別系統(tǒng)中,主要包含三大模塊,分別是圖像采集預(yù)處理模塊、神經(jīng)網(wǎng)絡(luò)訓(xùn)練模塊以及人臉識別模塊。其中,圖像采集預(yù)處理模塊能夠通過opencv來實現(xiàn)圖像采集,而攝像頭則是圖像信息采集的重要設(shè)備。此外,該模塊還對ROI算法進行了應(yīng)用,以此實現(xiàn)圖像預(yù)處理,進而消除光照條件和背景變化給人臉識別率造成的不利影響。對于神經(jīng)網(wǎng)絡(luò)訓(xùn)練模塊來說,則能夠處理大量的訓(xùn)練數(shù)據(jù),該模塊能夠?qū)P神經(jīng)網(wǎng)絡(luò)模型進行構(gòu)建,以此確定不同因素的權(quán)值。對于人臉識別模塊來說,該模塊能夠?qū)⒉杉降膱D像信息錄入已構(gòu)建完畢的BP神經(jīng)網(wǎng)絡(luò)模型,以便于通過BP神經(jīng)網(wǎng)絡(luò)模型來對圖像信息進行訓(xùn)練與計算,并采用歐式距離來判定結(jié)果,以此獲得準確的識別結(jié)果。
3.2? 系統(tǒng)實驗
為了驗證基于BP神經(jīng)網(wǎng)絡(luò)的人臉識別系統(tǒng)的應(yīng)用效果,本文采用opencv筆記本攝像頭來對全班學(xué)生的人臉照片進行采集,全班共計45名學(xué)生。每名學(xué)生的人臉圖像采集數(shù)量為10張,其中八張用于BP神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練數(shù)據(jù)集,另外兩張則作為測試識別結(jié)果的數(shù)據(jù)集。獲得的訓(xùn)練數(shù)據(jù)集數(shù)量為360張,而對于結(jié)果測試數(shù)據(jù)集,其數(shù)量則為90張。在人臉圖像中,每張圖像中的像素均為28×23,像素點數(shù)量為644個,該系統(tǒng)應(yīng)用圖像預(yù)處理模塊,采取基于人眼識別的興趣區(qū)域處理策略,在人臉數(shù)據(jù)集被處理以后用于測試數(shù)據(jù)。
在基于BP神經(jīng)網(wǎng)絡(luò)的人臉識別系統(tǒng)中,其系統(tǒng)模型共包括3層,在輸入層中共包含644個神經(jīng)單元,這些神經(jīng)單元均有對應(yīng)的像素點輸入。而在隱藏層中的神經(jīng)單元則共計20個,在輸入層中的神經(jīng)單元數(shù)量為6個。在對BP神經(jīng)網(wǎng)絡(luò)進行建立以后,需要應(yīng)用反向傳播算法來進行訓(xùn)練,以此獲得能夠?qū)θ四樳M行準確識別的BP神經(jīng)網(wǎng)絡(luò)模型。在識別人臉圖像過程中,針對輸出層中的輸出結(jié)果,其判定需要依據(jù)歐式距離來實現(xiàn)。比如在輸出層中的神經(jīng)單元中,其輸出結(jié)果分別是0.1,0.2,0.1,0.2和0.9,然后針對該結(jié)果和全班所有同學(xué)的標準輸出對歐式距離進行依次計算,將歐式距離最小的目標作為對應(yīng)的判定結(jié)果。通過計算可以得知,歐式距離最小的人臉圖像為一號同學(xué)的人臉[3]。
3.3? 結(jié)果分析
本文分別對圖像預(yù)處理模塊處理之前的數(shù)據(jù)集和處理之后的數(shù)據(jù)集進行了測試對比。經(jīng)測試結(jié)果表明,系統(tǒng)利用圖像預(yù)處理模塊對圖像數(shù)據(jù)集進行處理以后,其處理效果要比未處理之前的效果好得多,這也使系統(tǒng)對人臉的識別準確率在原有基礎(chǔ)上提高了6%。
4? ? 結(jié)語
綜上所述,本文提出通過viola-jones算法和基于人眼識別的圖像興趣處理策略來實現(xiàn)系統(tǒng)的人臉識別功能,采取圖像采集預(yù)處理模塊、神經(jīng)網(wǎng)絡(luò)訓(xùn)練模塊以及人臉識別模塊這三大模塊的開發(fā),以此消除光照條件和背景變化給人臉識別率造成的不利影響,提高系統(tǒng)的人臉識別準確率,從而使BP神經(jīng)網(wǎng)絡(luò)模型能夠依據(jù)歐式距離來獲得準確的人臉判定結(jié)果。
[參考文獻]
[1]馮建洋,諶海云.基于人工神經(jīng)網(wǎng)絡(luò)的人臉識別研究[J].自動化與儀器儀表,2017(5):24-26,29.
[2]王士東,陳標,李遠,等.基于彈性BP神經(jīng)網(wǎng)絡(luò)的人臉識別系統(tǒng)[J].科技經(jīng)濟導(dǎo)刊,2017(26):24-25.
[3]韓瑞瑞,張尤賽.基于PCA/ICA的人臉識別片上系統(tǒng)的設(shè)計與實現(xiàn)[J].自動化技術(shù)與應(yīng)用,2019(2):129-134.
(編輯 傅金睿)