亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于VGGNet和多譜帶循環(huán)網(wǎng)絡的高光譜人臉識別系統(tǒng)

        2019-08-01 01:57:38謝志華江鵬余新河張帥
        計算機應用 2019年2期
        關(guān)鍵詞:深度神經(jīng)網(wǎng)絡卷積神經(jīng)網(wǎng)絡

        謝志華 江鵬 余新河 張帥

        摘 要:為了提高光譜人臉數(shù)據(jù)表征人臉特征的有效性,提出一種基于VGGNet和多譜帶循環(huán)訓練的高光譜人臉識別方法。首先,在光譜人臉圖像的預處理階段,采用多任務卷積神經(jīng)網(wǎng)絡(MTCNN)進行高光譜人臉圖像的精確定位,并利用混合通道的方式對高光譜人臉數(shù)據(jù)進行增強;然后,基于卷積神經(jīng)網(wǎng)絡(CNN)結(jié)構(gòu)建立一個面向高光譜人臉識別的VGG12深度網(wǎng)絡;最后,基于高光譜人臉數(shù)據(jù)的特點,引入多譜帶循環(huán)訓練方法訓練建立的VGG12網(wǎng)絡,完成最后的訓練和識別。在公開的UWA-HSFD和PolyU-HSFD高光譜人臉數(shù)據(jù)集的實驗結(jié)果表明,所提方法取得了比其他深度網(wǎng)絡(如DeepID、DeepFace、VGGNet)更好的識別性能。

        關(guān)鍵詞:高光譜人臉識別;卷積神經(jīng)網(wǎng)絡;VGGNet,;多譜帶循環(huán)訓練;深度神經(jīng)網(wǎng)絡

        中圖分類號: TP183; TP391.4

        文獻標志碼:A

        Abstract: To improve the effectiveness of facial feature represented by hyperspectral face data, a VGGNet and multi-band recurrent training based method for hyperspectral face recognition was proposed. Firstly, a Multi-Task Convolutional Neural Network (MTCNN) was used to locate the hyperspectral face image accurately in preprocessing phase, and the hyperspectral face data was enhanced by mixed channel. Then, a Convolutional Neural Network (CNN) structure based VGG12 deep network was built for hyperspectral face recognition. Finally, multi-band recurrent training was introduced to train the VGG12 network and realize the recognition based on the characteristics of hyperspectral face data. The experimental results of UWA-HSFD and PolyU-HSFD databases reveal that the proposed method is superior to other deep networks such as DeepID, DeepFace and VGGNet.

        Key words: hyperspectral face recognition; Convolutional Neural Network (CNN); VGGNet; multi-band recurrent training; Deep Neural Network (DNN)

        0 引言

        隨著遙感技術(shù)的發(fā)展,光譜成像已經(jīng)在農(nóng)業(yè)、生物醫(yī)學等方面得到了廣泛的應用,其中研究人員已經(jīng)表明[1]:人臉的不同部位具有巨大光譜變異性。而高光譜成像能夠捕獲這種變異性特征,使得高光譜圖像具有更多的判別信息,因此可以將高光譜成像技術(shù)用于人臉識別。

        同傳統(tǒng)的RGB圖像相比,高光譜成像具有顯著優(yōu)勢:1)對于圖像中的每個像素,高光譜相機能獲取大量連續(xù)的光強度,即圖像中的每一個像素都包含一個連續(xù)的光譜,可以非常精確地描述場景中物體的細節(jié);2)高光譜影像能感知多種被探測物的大小、形狀、缺陷等外部品質(zhì)特征,大大提高了成像的精度和可靠性;3)高光譜數(shù)據(jù)能夠探測具有診斷性光譜吸收特征的物質(zhì),能準確地區(qū)分人臉的各個部分,對于人臉的檢測和識別能力有極大提高。此外,對于人臉圖像,高光譜圖像與RGB圖像相比具有更多的譜帶信息[1]。

        文獻[2]首次將高光譜人臉圖像應用到人臉識別中,證明了不同光譜對人臉組織的差異性;在文獻[3]中,Chang等經(jīng)過測試表明,在不同的光源強度下,如鹵素燈、熒光燈、白天光照,高光譜人臉比可見光下的人臉更具魯棒性;Di等[4]也做了類似工作,他們的研究表明,在光譜測量中,光譜的譜帶與血紅蛋白有著密切的關(guān)系,特別是高光譜譜帶比其他譜帶更具鑒別力,并挑選了高光譜中33個譜帶進行研究,證明了高光譜的多個波段比單個波段和可見光RGB波段在人臉識別上的效果好;文獻[5]通過滑動窗口的方式將多維的高光譜人臉圖像融合成二維的灰度圖像,然后利用偏最小二乘回歸進行識別,驗證了高光譜人臉識別的有效性;魏冬梅等[6]將波段選擇與Gabor特征融合,通過分析不同波段的光學特性,減少了冗余光譜對識別的影響;Ghasemzadeh等[7]將三維小波變換同時應用于時空域提取高光譜人臉的譜間和空間特征。

        目前,高光譜的人臉識別研究主要集中在手工特征提取及其改善[5],較少關(guān)注深度學習特征的提取。鑒于高光譜成像的低信噪比和數(shù)據(jù)復雜性,研究有利于高光譜人臉識別的深度特征十分必要。本文借鑒深度卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network, CNN)在傳統(tǒng)可見光人臉識別的研究,基于高光譜成像數(shù)據(jù)的特點,提出了基于 VGGNet和多譜帶循環(huán)的高光譜人臉識別方法,建立并訓練了一個適合高光譜人臉識別的VGG12深度網(wǎng)絡。

        1 高光譜人臉識別方法

        1.1 高光譜人臉預處理

        在深度學習人臉識別研究中,人臉的精確定位是不可缺少的一部分,本文采用級聯(lián)網(wǎng)絡來整合多任務卷積神經(jīng)網(wǎng)絡(Multi-Task Convolutional Neural Network, MTCNN)人臉檢測[8]。該方法由三個階段組成[8]:第一階段由淺層的全卷積網(wǎng)絡快速產(chǎn)生候選窗體;第二階段使用增強的CNN在候選窗體中選出更精準的窗體,丟棄大量的重疊窗體;第三階段使用輸出CNN實現(xiàn)候選窗體去留,同時顯示五個面部關(guān)鍵點定位。具體實現(xiàn)方法為:

        1)采用四層的全卷積神經(jīng)網(wǎng)絡,即Propose-Net(P-Net),去獲得候選窗體和邊界回歸向量,其中前三個卷積核的大小為3×3,最后一個大小為1×1;同時,候選窗體根據(jù)邊界框進行校準。然后,利用非極大值抑制方法去除重疊窗體。

        2)將經(jīng)過P-Net確定的、包含候選窗體的圖片送入Refine-Net(R-Net),網(wǎng)絡最后選用全連接的方式進行訓練。利用邊界框向量微調(diào)候選窗體,再利用非極大值抑制的方法再次去除重疊窗體。

        1.2 網(wǎng)絡模型

        為了進行高光譜人臉識別,搭建了如圖1所示的12層網(wǎng)絡模型,包含11個卷積層和1個全連接層。由于和VGGNet網(wǎng)絡類似[11],每個卷積核的大小都是3×3,因此將此模型命名為VGG12。在VGG12中,前兩層(conv1,conv2)是兩個64通道的卷積層,所有卷積層的步長(stride)都為1,周圍填充(padding)也為1,因此conv1和conv1不會降低維度,會提取更多的特征。conv2后面是最大池化層,由于池化之后特征圖縮小為原來的1/4,為了最大限度地保留特征,在進行conv3時又將卷積核的數(shù)量增加一倍,因此conv3的特征圖形是conv2的兩倍,此時特征圖的大小變成了輸入的四分之一。從con1到conv8都采用類似的方法,即每兩個連續(xù)的卷積層后都加上一個最大池化層。conv9、conv10、conv11是三個連續(xù)的卷積層,都由相同數(shù)量和大小的卷積核卷積運算而來。conv11包含了一個最大池化層,用來減少特征數(shù)量。最后的第12層是全連接層用來特征提取,網(wǎng)絡的損失函數(shù)為softmax。

        1.3 多譜帶循環(huán)訓練

        已有深度神經(jīng)網(wǎng)絡VGGNet處理的圖片都是三通道的[12],因此已有的深度學習模型對三通道的數(shù)據(jù)更有效,本文提出的模型和VGGNet一樣都采用3×3的卷積核,具有一定的共性。為了利用已有網(wǎng)絡的這種共性,提出了一種多譜帶循環(huán)訓練的方法,如圖2所示。

        2 實驗和分析

        實驗數(shù)據(jù)集為兩個常用的高光譜人臉數(shù)據(jù)庫UWA-HSFD和PolyU-HSFD[5]。PolyU-HSFD數(shù)據(jù)庫的波段范圍為400~720nm,每個樣本共有33個譜帶的二維圖像,實驗數(shù)據(jù)集采用24個人構(gòu)成的161幅圖像為原始訓練樣本,141幅圖像作為測試樣本;UWA-HSFD數(shù)據(jù)庫的波段范圍與PolyU-HSFD相同,每個樣本共33個譜帶,數(shù)據(jù)集選取48個人構(gòu)成的158幅圖像作為訓練樣本,96幅圖像作為測試樣本。為了驗證本文方法的有效性,在上述兩個數(shù)據(jù)集上分別做了以下

        3 結(jié)語

        本文提出了一種基于深度學習特征的高光譜人臉識別方法?;诟吖庾V人臉成像的特點和數(shù)據(jù)規(guī)模限制,結(jié)合預處理和多譜帶循環(huán)訓練方法,構(gòu)建了一個有效的VGG12深度網(wǎng)絡。實驗結(jié)果表明,提出的深度學習高光譜人臉識別方法優(yōu)于已有的人臉識別深度網(wǎng)絡。

        參考文獻:

        [1] OSIA N, BOURLAI T. A spectral independent approach for physiological and geometric based face recognition in the visible, middle-wave and long-wave infrared bands[J]. Image and Vision Computing, 2014, 32(11): 847-859.

        [2] PAN Z, HEALEY G E, PRASCAD M, et al. Face recognition in hyperspectral images [C]// CVPR03Proceedings of the 2003 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Washington, DC: IEEE Computer Society, 2003: 334-339.

        [3] CHANG H, KOSCHAN A, ABIDI B, et al. Fusing continuous spectral images for face recognition under indoor and outdoor illuminants[J]. Machine Vision and Applications, 2010, 21(2): 201-215.

        [4] DI W, ZHANG L, ZHANG D. Studies on hyperspectral face recognition in visible spectrum with feature band selection[J]. IEEE Transactions on Systems, Man and Cybernetics — Part A: Systems and Humans, 2010, 40(6): 1354-1361.

        [5] UZAIR M, MAHMOOD A, MIAN A. Hyperspectral face recognition with spatiospectral information fusion and PLS regression[J]. IEEE Transactions on Image Processing, 2015, 24(3): 1127-1137.

        [6] 魏冬梅, 張立人, 胡楠楠,等. 聯(lián)合空譜信息和Gabor特征的高光譜人臉識別算法[J]. 北京理工大學學報,2017,37(10):1077-1083. (WEI D M, ZHANG L R, HU N N, et al. Hyperspectral face recognition with spatial-spectral fusion information and Gabor feature[J]. Transactions of Beijing Institute of Technology, 2017, 37(10):1077-1083.)

        [7] GHASEMZADEH A, DEMIREL H. 3D discrete wavelet transform-based feature extraction for hyperspectral face recognition [J]. IET Biometrics, 2018, 7(1): 49-55

        [8] ZHANG K, ZHANG Z, LI Z, et al. Joint face detection and alignment using multi-task cascaded convolution networks [J]. IEEE Signal Processing Letters, 2016, 23(10): 1499-1503.https://arxiv.org/ftp/arxiv/papers/1604/1604.02878.pdf網(wǎng)上只找到PDF

        [9] 楊楠, 南琳, 張丁一, 等. 基于深度學習的圖像描述研究[J]. 紅外與激光工程,2018,47(2): 203002. (YANG N, NAN L, ZHANG D Y, et al. Research on image interpretation based on deep learning[J]. Infrared and Laser Engineering, 2018, 47(2): 203002.)

        [10] SZEGEDY C, LIU W, JIA Y Q, et al. Going deeper with convolutions [C]// Proceedings of the 2015 IEEE Conference on Computer Vision and Pattern Recognition. Piscataway, NJ: IEEE, 2015: 1-9.

        [11] SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition [EB/OL]. [2018-03-22]. https://arxiv.org/pdf/1409.1556.pdf.

        [12] 張國山, 張培崇, 王欣博. 基于多層次特征差異圖的視覺場景識[J]. 紅外與激光工程, 2018, 47(2): 203004. (ZHANG G S, ZHANG P C, WANG X B, Visual place recognition based on multi-level feature difference map[J]. Infrared and Laser Engineering, 2018, 47(2): 203004.)

        [13] KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet classification with deep convolutional neural networks [C]// NIPS12Proceedings of the 25th International Conference on Neural Information Processing Systems. Lake Tahoe, Nevada: Curran Associates Inc., 2012, 1: 1097-1105.

        [14] MOLLAHOSSEINI A, CHAN D, MAHOOR M H. Going deeper in facial expression recognition using deep neural networks [C]// Proceedings of the 2016 IEEE Winter Conference on Applications of Computer Vision. Piscataway, NJ: IEEE, 2016: 1-10.

        [15] SUN Y, WANG X, TANG X O. Deep learning face representation from predicting 10000 classes [C]// CVPR 14Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition. Washington, DC: IEEE Computer Society, 2014: 1891-1898.

        [16] TAIGMAN Y, YANG M, RANZATO M, et al. DeepFace: closing the gap to human-level performance in face verification [C]// CVPR 14Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition. Washington, DC: IEEE Computer Society, 2014: 1701-1708.

        [17] IOFFE S, SZEGEDY C. Batch normalization: accelerating deep network training by reducing internal covariate shift [C]// Proceedings of the 32nd International Conference on Machine Learning. [S.l.]: ICML, 2015: 448-456.http://proceedings.mlr.press/v37/ioffe15.htmlhttps://arxiv.org/pdf/1502.03167.pdf

        猜你喜歡
        深度神經(jīng)網(wǎng)絡卷積神經(jīng)網(wǎng)絡
        基于大數(shù)據(jù)網(wǎng)絡的運動損傷評估模型研究
        試論基于深度神經(jīng)網(wǎng)絡的汽車車型識別問題
        深度神經(jīng)網(wǎng)絡的發(fā)展現(xiàn)狀
        基于卷積神經(jīng)網(wǎng)絡溫室智能大棚監(jiān)控系統(tǒng)的研究
        基于深度卷積神經(jīng)網(wǎng)絡的物體識別算法
        深度學習算法應用于巖石圖像處理的可行性研究
        軟件導刊(2016年9期)2016-11-07 22:20:49
        基于深度神經(jīng)網(wǎng)絡的身份識別研究
        基于深度卷積網(wǎng)絡的人臉年齡分析算法與實現(xiàn)
        軟件工程(2016年8期)2016-10-25 15:47:34
        基于卷積神經(jīng)網(wǎng)絡的樹葉識別的算法的研究
        人工智能與語音識別技術(shù)
        国产欧美va欧美va香蕉在| 免费的黄网站精品久久| 人妻av在线一区二区三区| 一区二区三区无码高清视频| 一本一道av中文字幕无码| 国产精品亚洲А∨天堂免下载| 激情一区二区三区视频| 精品国产日韩一区2区3区| 国产成人av一区二区三区| 伊人99re| 亚洲一区二区三区国产精品| 亚洲天堂一区av在线| 久久久久久好爽爽久久| 亚洲一级电影在线观看| 偷拍熟女露出喷水在线91| 曰韩无码av一区二区免费| 国产成人精品日本亚洲| 69av视频在线| 国产精品久久婷婷免费观看| 永久免费人禽av在线观看| 亚洲av日韩精品久久久久久 | 日产精品久久久久久久蜜臀 | 97丨九色丨国产人妻熟女| 精品人妻伦九区久久aaa片69| 高清国产美女一级a毛片在线| 亚洲精品国产av成拍色拍| 国产色欲av一区二区三区| 少妇厨房愉情理伦片bd在线观看| 亚洲高清一区二区三区在线观看 | 日本精品久久久久中文字幕| 国内精品无码一区二区三区| 蜜桃av无码免费看永久| 最新日本人妻中文字幕| 一边吃奶一边摸做爽视频| 国产精品亚洲午夜不卡| 亚洲一区二区av天堂| 亚洲一区自拍高清亚洲精品| 最新国产三级| 久久精品国产亚洲av日韩精品| 国产a级三级三级三级| 人人妻人人玩人人澡人人爽|