亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Sobel算子改進卷積神經(jīng)網(wǎng)絡(luò)的人臉識別

        2018-11-22 06:18:30賀興時
        渭南師范學院學報 2018年20期
        關(guān)鍵詞:人臉識別特征

        黃 劍,賀興時

        (西安工程大學 理學院,西安710048)

        人臉識別作為一種模式識別和機器視覺的生物識別方法,是近年來十分火熱的一個研究課題。[1-3]因為人臉識別不需要人的被動配合,能夠在不接觸人的情況下遠距離采集人臉圖像,充分表現(xiàn)了它的非接觸性和友好性,人臉識別技術(shù)是一項魯棒性好、使用方便、安全性高的生物識別技術(shù)。[4]由于人臉識別的這些優(yōu)勢,這項技術(shù)被應用于諸多領(lǐng)域,如公司單位檔案管理、日??记?、門禁安全系統(tǒng)驗證、各種人機交互、公安部門追蹤嫌疑人員、日常治安管理、戰(zhàn)場敵我識別、對敵高效打擊等。故對于人臉識別技術(shù)的研究不僅是學術(shù)的需要,更是社會發(fā)展的需求。

        表1 生物特征識別技術(shù)性能比較

        人臉識別技術(shù)與其他生物特征識別技術(shù)的性能比較,具有一定的優(yōu)勢[5](如表1所示):直觀、準確、穩(wěn)定性好,具有很高的可采集性,不但可以在任何一個場所用于多種用途,而且不需要人為操作,是一種非接觸的友好的生物識別技術(shù),可接受性非常高。

        幾何特征法是一種較早的人臉識別方法[6],通過提取人眼睛、嘴巴、鼻子等重要特征的位置和幾何形狀作為分類特征,雖然該方法比較符合人臉識別的原理,而且容易理解,存儲空間也小,不會過多地占據(jù)資源,對光照敏感度也低。但幾何特征法的難點在于怎樣建立一個好的模型來精準地提取人臉的幾何特征,而且穩(wěn)定性不高,識別效果也不理想。

        特征臉方法(PCA)是20世紀90年代初期Turk和Pentland兩個人提出的[7],也是比較流行的一種方法,其主要思想是從統(tǒng)計的角度出發(fā),找出人臉圖像分布的基本元素,即用人臉圖像樣本的協(xié)方差矩陣的特征向量來近似地表示人臉圖像。但是特征臉方法在引入光線差別、角度不同以及人臉的尺寸大小不一的情況下識別效果會大大下降。

        還有更多的人臉識別方法如表2所述。

        表2 人臉識別方法對比

        綜合起來神經(jīng)網(wǎng)絡(luò)是更好的選擇,特別是卷積神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)是神經(jīng)網(wǎng)絡(luò)中應用廣泛且網(wǎng)絡(luò)性能較好的一種結(jié)構(gòu),是一種自適應的非線性動態(tài)網(wǎng)絡(luò)系統(tǒng),卷積神經(jīng)網(wǎng)絡(luò)具有局部連接、權(quán)值共享及采樣池化的操作等特點,可以非常有效地使網(wǎng)絡(luò)的復雜度降低。通過減少訓練參數(shù)數(shù)目,使得網(wǎng)絡(luò)模型對扭曲、平移、縮放等操作擁有了一定程度的不變性,而且還擁有強魯棒性和一定的容錯能力,相比于其他結(jié)構(gòu)也更加容易訓練和優(yōu)化,基于這些優(yōu)點,在人臉識別研究領(lǐng)域,卷積神經(jīng)網(wǎng)絡(luò)具有很大的研究意義和應用價值,并且在應用領(lǐng)域也有十足的發(fā)展。本文提出了一種改進的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),再加上用Sobel算子[14-15]進行預處理,使得網(wǎng)絡(luò)速度更快,該方法相比于傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)在識別率和識別時間上都有了一定的提升。

        1 神經(jīng)網(wǎng)絡(luò)

        卷積神經(jīng)網(wǎng)絡(luò)是一種深度神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)結(jié)構(gòu)多層,比較復雜,而且每一層都含有多個神經(jīng)元,通過模擬視覺皮層各個層次的細胞處理視覺信息的過程對圖像進行從粗略到細致的特征提取。普通的人臉識別方法在圖片存在光照、表情、姿態(tài)等問題的時候,識別的準確率和速度會急劇下降,但是卷積神經(jīng)網(wǎng)絡(luò)卻可以解決這些問題,因為卷積神經(jīng)網(wǎng)絡(luò)是一種自學習的識別系統(tǒng),一般分為有監(jiān)督學習和無監(jiān)督學習兩種形式,隨著卷積網(wǎng)絡(luò)層數(shù)的增多,無監(jiān)督式學習用的人越來越多,但是有監(jiān)督學習的準確度和速率也不輸于無監(jiān)督學習,而且在純粹的分類問題上更具優(yōu)勢。[16]卷積神經(jīng)網(wǎng)絡(luò)的主要結(jié)構(gòu)為輸入層、卷積層、下采樣層(池化層)、全連層和輸出層。[17]基本的卷積神經(jīng)網(wǎng)絡(luò)如圖1所示,一般的卷積神經(jīng)網(wǎng)絡(luò)卷積層通過接受上一層的經(jīng)過訓練的特征來用卷積核進行卷積并求和,然后將所得結(jié)果通過激活函數(shù)形成當前層的特征,再作為下一層的輸入。

        圖1 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖

        1.1 卷積層

        卷積層的計算公式為:

        圖2 最大池化說明圖

        1.2 池化層

        接下來的一層為降采樣層,即池化層,將前一層的像素矩陣平均分為多個n×n的像素矩陣塊,一般取用每個矩陣塊里的最大值作為該矩陣的新值,也就是常說的最大池化,如圖2所示,這樣就會使原矩陣維度減小,可以大幅度地減少計算量,并且能夠有效避免由于特征過多而引起的過擬合現(xiàn)象。其公式表達為:

        1.3 全連層

        全連層是將上一層所產(chǎn)生的每一個與特征圖相對應的二維數(shù)組轉(zhuǎn)化為一維數(shù)組,然后再將轉(zhuǎn)化所得的所有一維數(shù)組拼接成一個特征長向量作為全連層的輸入,其公式一般為:

        1.4 分類器

        支持向量機SVM(Support Vector Machines)[17]能夠很好地避免過學習、欠學習、維數(shù)災難以及陷入局部最小值的問題,很多學者已經(jīng)將其很好地應用于分類和模式識別方面。在解決人臉識別問題的時候,即處理多分類問題的時候,我們也可以用SVM來進行。在本文中,我們選用的是一個層次結(jié)構(gòu)的多類別支持向量機。基本思想就是將所有樣本先進行一個二分類,即分成兩個子類,然后再將每一個分出來的子類再分成下一級的兩個子類,如此循環(huán),最后得到每一個單獨的類,即在本文中將每一個人的人臉圖分為一類,使得網(wǎng)絡(luò)最后的分類能夠有更高的準確率。

        2 人臉識別網(wǎng)絡(luò)模型

        2.1 傳統(tǒng)CNN網(wǎng)絡(luò)

        卷積神經(jīng)網(wǎng)絡(luò)是一種非全連的多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),一般由卷積層、池化層、全連層組成,輸入的圖像最先通過卷積層進行卷積,得到一定數(shù)量的特征圖,然后再經(jīng)過池化層對特征進行一定的模糊處理,最后再通過全連層輸出一組特征向量,來作為分類器的輸入進行分類識別,傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。

        圖3 傳統(tǒng)卷積網(wǎng)絡(luò)結(jié)構(gòu)圖

        圖4 Sobel算子預處理效果圖

        卷積神經(jīng)網(wǎng)絡(luò)中間的卷積層和池化層相互交替組合成為神經(jīng)網(wǎng)絡(luò)的隱層,如圖3所示,人臉圖像作為輸入層,通過卷積層1得到若干個特征圖,然后由池化層1進行池化,池化的尺度可以自由設(shè)定,池化后的特征圖再經(jīng)過卷積層2進行卷積,將所得的特征圖再經(jīng)過池化層2進行池化,池化后作為全連層的輸入,進行人臉圖像特征的識別,最后通過分類器輸出得到識別結(jié)果。

        2.2 改進的CNN網(wǎng)絡(luò)

        圖片經(jīng)過Sobel算子處理和細化后所得的圖片效果如圖4所示,處理以后對于整個識別過程會更加簡單,因為經(jīng)過預處理的圖片的特征紋理會更加明顯,雖然會損失部分比較細微的特征,但是對于絕大多數(shù)紋理特征會起到放大作用,能夠加快整個網(wǎng)絡(luò)的識別速度和精確度。

        本文采用的卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖5所示,由圖可以看出,在該神經(jīng)網(wǎng)絡(luò)中,輸入圖片大小為80×80,且經(jīng)過歸一化和Sobel算子預處理,第一個卷積層和第二個卷積層所用的卷積核都為3×3,步長為1。該結(jié)構(gòu)與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)有所區(qū)別,為兩次連續(xù)卷積后再與池化層相連接,兩次連續(xù)卷積后能夠更好地保留特征,使得整個學習過程更加的高效,提高網(wǎng)絡(luò)的學習效率。然后重復兩次,即卷積層1、卷積層2和池化層1后有卷積層3、卷積層4和池化層2,池化層選用的是最大池化,步長為2,將圖片大小變成了40×40,然后再進行一次卷積,經(jīng)過兩個全連層,第一個全連層為512維,第二個全連層則得到200維的特征矩陣,再通過SVM分類器進行多項分類,得到結(jié)果。

        圖5 改進CNN結(jié)構(gòu)圖

        在這里不需要對圖片的背景、光線等做預處理,因為使用的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)在非線性降維的過程中,可以自動地排除這些因素的影響。而且在本文的網(wǎng)絡(luò)訓練開始之前,使用了Sobel算子對圖像進行了預處理。Sobel算子是一種梯度幅值檢測算子,采用了3×3的卷積模板對監(jiān)測圖像進行加權(quán)平均或鄰域平均,然后通過一階微分計算檢測出圖像邊緣點。設(shè)為函數(shù)圖像,則它在點處的梯度是一個矢量,定義如下:

        其中:$f (x,y)用來表示梯度的模,它的值可以由下式計算得出:

        在激活函數(shù)選擇上,一般的ReLU是當輸入小于0時,輸出全都是0;而當輸入大于0時,輸出就是輸入。該函數(shù)的收斂速度相比于其他激活函數(shù)更快,而且當x<0時,ReLU為硬飽和;當x>0時,則不存在飽和問題,即梯度不會飽和,即ReLU能夠在x>0時保持梯度不衰減,這樣能夠在很大程度上緩解梯度消失的情況。但是會存在很多神經(jīng)元壞死的情況,導致一定的信息損失。而本文所用的改進的激活函數(shù)為RReLU(Randomized leaky Rectified Linear Unit),函數(shù)圖如圖6所示,圖中a是一個高斯分布中隨機選擇出來的,然后在測試的過程中加以修正,其公式如下:

        雖然其數(shù)學形式與PReLU一樣,但是RReLU是一種非確定性的激活函數(shù),它的參數(shù)是不固定的,隨機產(chǎn)生。這種隨機性就像是一個噪聲,能夠在很大程度上起到正則作用。所以用在人臉識別上,能夠使網(wǎng)絡(luò)在訓練和測試的過程中花費更少的時間,取得更加穩(wěn)定且突出的效果。

        圖6 激活函數(shù)示例圖

        3 實驗

        3.1 數(shù)據(jù)庫

        本文中訓練和測試所用到的人臉數(shù)據(jù)為FERET人臉數(shù)據(jù)庫,該庫包含有200個不同人物的人臉圖片,每個人有7張人臉圖片,這7張包含了同一個人臉在不同的光線條件下不同的面部表情和姿態(tài)等特征,且經(jīng)過了歸一化處理,每一張圖都是灰度圖,分辨率均為80×80,如圖7所示。

        圖7 FERET人臉庫部分圖片示例

        ORL人臉庫包含有40個不同年齡、不同性別和不同種族的對象。每個人10幅圖像共由400幅灰度圖像組成,圖片大小為92×112,在預處理之前將其處理成灰度圖,大小為80×80,并且圖中有表情、姿態(tài)的變化以及是否戴眼鏡的區(qū)別,增加了樣本的多樣性,圖片背景為黑色,如圖8所示。

        圖8 ORL人臉庫部分圖片示例

        3.2 實驗步驟

        (1)用Sobel算子對人臉圖片進行預處理,首先計算出圖片的Sobel水平梯度和Sobel垂直梯度,然后進一步計算出圖像的Sobel梯度;

        (2)設(shè)計網(wǎng)絡(luò)結(jié)構(gòu),將經(jīng)過預處理的圖片作為網(wǎng)絡(luò)的輸入;

        (3)對網(wǎng)絡(luò)進行訓練,并加以調(diào)整,使網(wǎng)絡(luò)穩(wěn)定;

        (4)提取網(wǎng)絡(luò)參數(shù),并進行測試;

        (5)經(jīng)過測試以后,確認網(wǎng)絡(luò)的穩(wěn)定和效果良好,能夠很好地完成人臉識別。

        3.3 實驗結(jié)果分析

        本文所使用的CNN網(wǎng)絡(luò)是在CAFFE環(huán)境下運行的,對基礎(chǔ)的網(wǎng)絡(luò)進行改進,并用CUDA進行加速處理,然后與3種人臉識別方法做對比實驗,實驗結(jié)果如表3所示。

        表3 實驗結(jié)果對比

        由表3可以看出,在FERET人臉庫中,PCA的識別率為83.6%,識別時間達3.81 s;BP神經(jīng)網(wǎng)絡(luò)的識別率為81.2%,識別時間為5.05 s;改進的神經(jīng)網(wǎng)絡(luò)方法在識別率上提高了15%,在識別時間上更是縮短了4.6 s;改進的卷積神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)相比較,雖然在識別時間上差別并不明顯,僅僅縮短了0.06 s,但在識別率卻提高了3.5%。在ORL人臉庫中,PCA的識別率為83.2%,識別時間為3.9 s;BP神經(jīng)網(wǎng)絡(luò)識別率是81.1%,識別時間為5.15 s,改進的神經(jīng)網(wǎng)絡(luò)在識別率上提高了15.5%,在識別時間上縮短了4.65 s;與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)相比較,識別時間縮短了0.08 s,識別率提高了3.5%。改進網(wǎng)絡(luò)不僅在識別率上有顯著的提升,而且在識別時間上也有了明顯的縮短。所以,本文改進的識別方法具有一定的可行性。

        4 結(jié)語

        通過對比可以看出,本文提出的新的卷積神經(jīng)網(wǎng)絡(luò)由于增加了預處理以及結(jié)構(gòu)上的重新設(shè)計,相對于之前的一些方法在識別速度與準確率上都有很大的提高。通過人臉庫樣本的訓練以后,取得的效果比較好,在實際應用中,由于結(jié)構(gòu)簡單,對設(shè)備要求更加普通化、簡單化,能夠更好地應用于生活和工作。而且如果能夠?qū)Ω嗟娜四槑爝M行訓練和測試,相信本文提出的網(wǎng)絡(luò)能夠有更好的效果。接下來的工作就是對更多的人臉庫進行訓練和測試,并在實時的人臉識別上做更多工作,做出能夠更加穩(wěn)定快速的進行識別的網(wǎng)絡(luò)模型。

        猜你喜歡
        人臉識別特征
        抓住特征巧觀察
        人臉識別 等
        作文中學版(2022年1期)2022-04-14 08:00:34
        新型冠狀病毒及其流行病學特征認識
        揭開人臉識別的神秘面紗
        學生天地(2020年31期)2020-06-01 02:32:06
        如何表達“特征”
        不忠誠的四個特征
        當代陜西(2019年10期)2019-06-03 10:12:04
        基于(2D)2PCA-LBP 的人臉識別方法的研究
        電子制作(2017年17期)2017-12-18 06:40:55
        抓住特征巧觀察
        人臉識別在高校安全防范中的應用
        電子制作(2017年1期)2017-05-17 03:54:46
        基于類獨立核稀疏表示的魯棒人臉識別
        計算機工程(2015年8期)2015-07-03 12:19:07
        精品亚亚洲成av人片在线观看| 午夜精品久久久久久久久久久久| 丝袜足控一区二区三区 | 欧美精品高清在线xxxx| 在线观看高清视频一区二区三区| 超碰国产精品久久国产精品99| 插b内射18免费视频| 在线免费毛片| 精品国产亚洲av成人一区| 午夜精品免费视频一区二区三区| 日本大骚b视频在线| 国内露脸中年夫妇交换| 丰满少妇人妻无码超清| 一区二区三区免费观看日本| 久久综合九色综合久99| 午夜亚洲www湿好大| 日韩午夜在线视频观看| 日本美女在线一区二区| 毛片无码国产| 一本大道东京热无码中字| 国产一区二区三区免费小视频| 中国一级黄色片久久久| 国产精品成人观看视频| 国产免费网站看v片元遮挡| 免费人妻精品区一区二区三| 香蕉成人伊视频在线观看| 精品午夜福利无人区乱码一区| 性一交一乱一伦一视频一二三区| 国产亚洲一区二区精品| 少妇人妻中文字幕hd| 久久国产精品无码一区二区三区| 亚洲情精品中文字幕有码在线| 青青草视频在线观看色| 欧美xxxx色视频在线观看| 无遮挡中文毛片免费观看| 最新日本女优中文字幕视频| 久久天天躁狠狠躁夜夜不卡| 波多野结衣中文字幕在线视频| 自拍偷拍一区二区三区四区| 久久无码高潮喷水抽搐| 国产真人无码作爱视频免费|