亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        融合Gabor特征與投影字典對(duì)學(xué)習(xí)的人臉識(shí)別算法

        2016-11-30 07:51:36付宇賢彭良玉
        圖學(xué)學(xué)報(bào) 2016年2期
        關(guān)鍵詞:范數(shù)識(shí)別率字典

        付宇賢, 彭良玉, 彭 輝

        (湖南師范大學(xué)物理與信息科學(xué)學(xué)院,湖南 長沙 410081)

        融合Gabor特征與投影字典對(duì)學(xué)習(xí)的人臉識(shí)別算法

        付宇賢, 彭良玉, 彭輝

        (湖南師范大學(xué)物理與信息科學(xué)學(xué)院,湖南 長沙 410081)

        為了獲得更好的人臉特征,有效地提高算法的識(shí)別率,提出了一種聯(lián)合Gabor特征與投影字典對(duì)學(xué)習(xí)的人臉識(shí)別算法G-DPL。算法使用Gabor小波提取人臉圖像的局部特征,對(duì)特征向量使用PCA與LDA的方法進(jìn)行降維。將投影字典對(duì)學(xué)習(xí)算法與降維后的Gabor特征融合,然后進(jìn)行分類識(shí)別。提出的G-DPL算法在ORL庫上整體識(shí)別率達(dá)到99.00%,特征維數(shù)為39維。在AR庫上識(shí)別率達(dá)到96.14%,特征維數(shù)為99維。提出的G-DPL算法在占用較少空間的同時(shí)能夠獲得更高的識(shí)別率,對(duì)實(shí)際應(yīng)用具有一定的參考價(jià)值。

        人臉識(shí)別;Gabor;投影字典對(duì)

        人臉識(shí)別作為計(jì)算機(jī)視覺與模式識(shí)別領(lǐng)域最常見且最具有挑戰(zhàn)性的課題,已經(jīng)被學(xué)者們廣泛研究了幾十年[1-4],提出了許多有代表性的方法,具有顯著的研究價(jià)值。識(shí)別算法的精度與魯棒性在很大程度上取決于使用什么樣的特征來描述人臉。Turk 和Pentland[1]提出了Eigenface的識(shí)別方法,通過將人臉圖像數(shù)據(jù)投影到一個(gè)子空間,可降低原本的數(shù)據(jù)維度,而降低了維度的數(shù)據(jù)之間方差最大,并使用最近鄰分類器進(jìn)行分類。獲得了較為理想的識(shí)別效果,被認(rèn)為是人臉識(shí)別領(lǐng)域最經(jīng)典的算法之一,奠定了子空間人臉識(shí)別算法的基礎(chǔ)。Belhumeur等[2]的Fisherface方法是將帶上標(biāo)簽的人臉圖像數(shù)據(jù),通過投影的方式,投影到維度更低的空間中,使得投影后類別內(nèi)的數(shù)據(jù)距離更加集中,類別間的數(shù)據(jù)距離更加分散,也獲得了不錯(cuò)的識(shí)別效果,但是,這些特征在遇到表情光照等改變時(shí),識(shí)別率與魯棒性下降很快。Liu和Wechsler[5]提出的Gabor特征Fisher分類方法,通過計(jì)算每個(gè)像素點(diǎn)的Gabor特征,然后使用增強(qiáng)的判別分析方法進(jìn)行識(shí)別,為了解決Gabor特征維數(shù)過高,采用了PCA的方法進(jìn)行降維,取得了良好的識(shí)別效果。

        近年來,稀疏表征理論在圖像處理與模式識(shí)別中的應(yīng)用引起了廣泛的研究興趣,W right等[6]將基于稀疏表示的分類算法(sparse representation classification, SRC)應(yīng)用到人臉識(shí)別算法中,并且建立了分類問題的SRC框架。SRC算法用訓(xùn)練樣本構(gòu)成字典矩陣,通過l1范數(shù)最小化來計(jì)算測(cè)試樣本相對(duì)于字典矩陣的稀疏表示系數(shù),根據(jù)各類別對(duì)應(yīng)的稀疏系數(shù)計(jì)算重構(gòu)誤差,把測(cè)試樣本分在最小距離對(duì)應(yīng)的類別中。為了加快算法運(yùn)行時(shí)間,Zhang 等[7]指出了 SRC算法的成功實(shí)際上歸因?yàn)閰f(xié)同表示,而不是l1范數(shù)的稀疏性約束。l1范數(shù)的稀疏性約束使得SRC算法的計(jì)算代價(jià)相當(dāng)高,為了降低計(jì)算代價(jià),提出了協(xié)同表示的人臉識(shí)別算法。在信號(hào)的稀疏表示過程中,字典扮演了重要的角色,Yang 等[8]提出的FDDL算法,通過對(duì)編碼殘差與編碼系數(shù)應(yīng)用Fisher準(zhǔn)則,取得了不錯(cuò)的分類效果,在大多數(shù)基于字典的算法中,都要使用l0或者l1范數(shù)最小化求解編碼系數(shù),使得計(jì)算代價(jià)相當(dāng)大,為此,Gu等[9]提出了投影字典對(duì)學(xué)習(xí)的算法,在提高識(shí)別性能的同時(shí)降低了時(shí)間的復(fù)雜度。為了獲得更好地識(shí)別性能,本文將Gabor特征引入投影字典對(duì)學(xué)習(xí)的算法中,獲得了更加精準(zhǔn)的分類效果。

        1 基本理論與算法實(shí)現(xiàn)

        1.1Gabor小波變換的紋理特征描述

        文獻(xiàn)[10]已證明了Gabor特征描述能夠取得非常好地識(shí)別效果,其具有優(yōu)良的空間局部性和方向選擇性,并可很好地抓住圖像的局部特征。2D-Gabor 小波的核函數(shù)定義為:

        其中,方括號(hào)中的第一項(xiàng)決定了Gabor核的震蕩部分,第二項(xiàng)則為補(bǔ)償直流分量,用以消除核函數(shù)相應(yīng)對(duì)圖像亮度絕對(duì)值的依耐性。x、y 表示像素點(diǎn)的坐標(biāo)值,u代表Gabor 小波的方向,k表示總方向數(shù),v代表 Gabor 小波的尺度因子,參數(shù)的取值決定了高斯窗口的大小,這里取σ=2π。對(duì)于人臉紋理特征提取,通常選取 5個(gè)尺度,8個(gè)方向。Gabor濾波可以看作一個(gè)對(duì)方向和尺度敏感的有方向性的顯微鏡[11],能夠?qū)θ四槇D像產(chǎn)生強(qiáng)烈的響應(yīng)。對(duì)ORL庫中的任意一幅圖像進(jìn)行5個(gè)尺度,8個(gè)方向上的Gabor 紋理特征提取,圖1為經(jīng)采樣得到的Gabor核函數(shù)的實(shí)部在空域中的圖示,從圖上可以明顯地看出尺度與方向的變化導(dǎo)致濾波器的變化情況。原始圖像為圖2所示,圖3為原始圖像與圖1中相應(yīng)位置的Gabor核函數(shù)進(jìn)行卷積得到的幅值。

        圖1 常用的5個(gè)尺度(自上而下v分別為0~4),8個(gè)方向(自左而右u分別為0~7)Gabor核的實(shí)部圖示

        圖2 原始圖像

        圖3 40個(gè)Gabor 小波幅值圖譜

        1.2投影字典對(duì)學(xué)習(xí)

        假設(shè)X=[ X1,…, Xk,…,XK]表示K個(gè)人的p維訓(xùn)練樣本,其中Xk∈Rp× n是訓(xùn)練樣本集的類別k,而 n是每一個(gè)類別的樣本個(gè)數(shù)。傳統(tǒng)的字典學(xué)習(xí)如下式:

        其目的在于學(xué)習(xí)一個(gè)分析字典D來稀疏表示信號(hào)X,但是傳統(tǒng)的字典模型都使用了l0或l1范數(shù)來求解編碼系數(shù),耗費(fèi)了大量的時(shí)間。Gu等[9]提出了新穎的字典對(duì)學(xué)習(xí)模型,編碼系可以通過簡單的線性投影獲得,大大節(jié)省了算法時(shí)間。字典對(duì)模型如下式:

        其中,ψ(D, P, X, Y)是一些判別函數(shù),D與P形成一個(gè)字典對(duì),分析字典P用來分析編碼X,綜合字典D用來重構(gòu)X。字典對(duì)學(xué)習(xí)的判別能力依靠的是合適的判別促進(jìn)函數(shù)ψ(D, P, X, Y)的設(shè)計(jì)。依據(jù)文獻(xiàn)[9]的分析,字典對(duì)的模型可以進(jìn)一步化為:

        1.3融合 Gabor特征與投影字典對(duì)學(xué)習(xí)的算法

        稀疏編碼過程可看成一個(gè)強(qiáng)大的分類器,對(duì)于更好的特征可以得到更加精準(zhǔn)的分類。Gabor特征向量是一個(gè)描述局部特征能力非常強(qiáng)的特征向量,張宏星等[12]將Gabor特征與協(xié)同表示的算法相結(jié)合,取得了不錯(cuò)的效果。本文將Gabor特征引入投影字典對(duì)學(xué)習(xí)算法的框架中,提出了融合Gabor特征與投影字典對(duì)學(xué)習(xí)的人臉識(shí)別算法。該算法的過程如下:

        Gabor小波與投影字典對(duì)學(xué)習(xí)分類流程。

        輸入:提取訓(xùn)練圖像與測(cè)試圖像的Gabor特征,使用PCA與LDA進(jìn)行降維,得到較低維數(shù)的K類訓(xùn)練樣本X=[X1, X2,…XK],測(cè)試樣本y,設(shè)置參數(shù)λ、τ、m。

        1. 使用Frobenious范數(shù)初始化D(0)和P(0),t=0;

        2. while 不收斂do;

        3. t←t+1;

        4. for i=1: K do;

        5. 更新Ak(t)通過公式:

        8. end for;

        9. end while;

        輸出:分析字典P,綜合字典D。

        分類:計(jì)算測(cè)試樣本y所屬的類別:

        2 實(shí)驗(yàn)結(jié)果分析

        在ORL與AR人臉庫上進(jìn)行驗(yàn)證本文所提出的實(shí)驗(yàn)方法。實(shí)驗(yàn)平臺(tái):Matlab2012a,臺(tái)式計(jì)算機(jī):Windows 732位,四核3.30 GHz,4 GB內(nèi)存。

        ORL人臉庫包含40個(gè)人的400幅正面圖像,每幅圖像大小為112×92。部分圖像如圖4所示,包含了表情、光照、姿態(tài)的變化。隨機(jī)選取每個(gè)人的5幅圖像用于訓(xùn)練,剩下的5幅圖像用于測(cè)試。測(cè)試結(jié)果如表1所示。為了消除隨機(jī)性,本次實(shí)驗(yàn)重復(fù)5次,取平均識(shí)別率。

        圖4 ORL人臉庫中部分圖像

        表1 ORL上測(cè)試結(jié)果

        AR人臉庫包含126個(gè)人的4 000幅正面圖像,都是在不同光照條件下采集的,部分原始圖像如圖 5所示。與文獻(xiàn)[7]相同,本文將圖像裁剪為60×43,使用由50個(gè)男性和50個(gè)女性組成的子集,每個(gè)人的 7幅在光照與表情改變條件下采集的圖像作為訓(xùn)練圖像,每個(gè)人的另外 7幅在光照與表情改變條件下采集的圖像作為測(cè)試圖像,測(cè)試結(jié)果如表2所示。

        圖5 AR人臉庫中部分圖像

        表2 AR上測(cè)試結(jié)果

        所有用來對(duì)比的算法中的參數(shù)統(tǒng)一與參考文獻(xiàn)中一致。本文在提取Gabor特征之后,使用PCA 與LDA的方法降維。其他參數(shù)與文獻(xiàn)[9]一致。經(jīng)驗(yàn)時(shí)間為一個(gè)樣本從特征提取到識(shí)別完成所用時(shí)長,不包含訓(xùn)練時(shí)間。

        由表1和表2的數(shù)據(jù)可看出,在ORL與AR人臉庫上,本文提出的算法具有最佳的識(shí)別效果,在ORL上的特征維數(shù)為39維,在AR人臉庫上的特征維數(shù)為99維。其中文獻(xiàn)[6-8]在AR人臉庫上獲得最高識(shí)別率的特征維數(shù)為300維,而文獻(xiàn)[9]中的隨機(jī)臉會(huì)占用比文獻(xiàn)[6-8]更多的空間,盡管算法運(yùn)行速度不及文獻(xiàn)[9],但相對(duì)于文獻(xiàn)[6], [8]等亦具有優(yōu)勢(shì)。

        字典的使用在稀疏編碼過程中扮演著重要的角色,然而許多字典學(xué)習(xí)模型僅僅使用表示系數(shù)或表示冗余的判別信息。文獻(xiàn)[8]提出了一個(gè)于Fisher判別準(zhǔn)則的字典學(xué)習(xí),字典中的原子與樣本的類別相關(guān),不但編碼冗余能夠被用來區(qū)分不同的類別,而且編碼系數(shù)有較小的類內(nèi)散布和較大的類間散布。雖然獲得了較高的識(shí)別率,但是l0或l1范數(shù)的使用,使得算法的計(jì)算負(fù)擔(dān)比較大。Gabor特征在增強(qiáng)人臉特征的同時(shí),對(duì)圖像在一定范圍內(nèi)的局部變化具有一定的容忍度,因?yàn)镚abor濾波能夠獲得圖像的一些相應(yīng)的方向頻率信息以及局部的顯著特征。文獻(xiàn)[12]的結(jié)果充分說明了局部特征與稀疏編碼算法融合的有效性,在提高識(shí)別率的同時(shí)加快了算法的運(yùn)行速度。而文獻(xiàn)[9]的結(jié)果充分說明了投影字典對(duì)學(xué)習(xí)相對(duì)于目前提出的字典學(xué)習(xí)算法的優(yōu)勢(shì),不管是在識(shí)別率還是算法的運(yùn)行速度方面都是最佳的。

        3 結(jié) 論

        本文提出了一種融合Gabor特征與投影字典對(duì)學(xué)習(xí)的人臉識(shí)別算法。首先提取人臉圖像的 Gabor特征,使用PCA與LDA的方法對(duì)高維的數(shù)據(jù)進(jìn)行降維,將降維的數(shù)據(jù)引入投影字典對(duì)學(xué)習(xí)的框架中進(jìn)行分類。在標(biāo)準(zhǔn)人臉數(shù)據(jù)庫上進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果表明,該算法在占用較低空間和消耗較少時(shí)間的同時(shí)提高了識(shí)別率,說明了算法融合的可行性與有效性。但該算法相比于某些算法會(huì)消耗更多的時(shí)間。

        進(jìn)一步研究內(nèi)容包括:①研究類似的紋理描述算子與稀疏編碼組合,比如LGBP[13]、MBP[14]等,獲得更優(yōu)的識(shí)別效果。②尋求更加簡單魯棒的算法融合,使得非理想條件下算法識(shí)別率與算法的魯棒性提高。③找到更加有效的特征描述也是未來研究人臉識(shí)別的方向之一。

        [1] Turk M, Pentland A. Eigenfaces for recognition [J]. Cognitive Neuroscience, 1991, 3(1): 71-86.

        [2] Belhumeur P N, Hespanha J P, Kriengman D J. Eigenfaces vs. fisherfaces: recognition using class specific linear projection [J]. Pattern Analysis and Machine Intelligence, 2013, 19(7): 711-720.

        [3] Gao S H, Kui J, Zhuang L S, et al. Neither global nor local: regularized patch-based representation for single sample per person face recognition [J]. International Journal of Computer Vision , 2015, 111(3): 365-383.

        [4] 陳皓, 霍星. 視頻監(jiān)控中人臉識(shí)別算法穩(wěn)定性的改進(jìn)[J]. 圖學(xué)學(xué)報(bào), 2011, 32(6): 53-56.

        [5] Liu C J, Wechsler H. Gabor feature based classification using the enhanced fisher linear discriminant model for face recognition [J]. Image Processing, 2002, 11(4): 467-476.

        [6] Wright J, Yang A Y, Ganesh A, et al. Robust face recognition via sparse representation [J]. Pattern Analysis and Machine Intelligence, 2009, 31(2): 210-227.

        [7] Zhang L, Yang M, Feng X C. Sparse representation or collaborative representation: which helps face recognition? [C]//IEEE International Conference on Computer Vision. New York: IEEE Press, 2011: 471-478.

        [8] Yang M, Zhang L, Feng X C, et al. Fisher discrimination dictionary learning for sparse representation [J]. Computer Vision, 2014, 109(3): 209-232.

        [9] Gu S H, Zhang L, Zuo W M, et al. Projective dictionary pair learning for pattern classification [J]. Neural Information Processing Systems, 2014, 1: 793-801.

        [10] 山世光. 人臉識(shí)別中若干關(guān)鍵問題的研究[D]. 北京:中國科學(xué)院計(jì)算技術(shù)研究所, 2004.

        [11] Lee T S. Image representation using 2d Gabor wavelets [J]. Pattern Analysis and Machine Intelligence, 1996, 18(10): 959-971.

        [12] 張宏星, 鄒剛, 趙鍵, 等. 基于Gabor特征與協(xié)同表示的人臉識(shí)別算法[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2014, 35(2): 665-670.

        [13] Zhang W C, Shan S G, Gao W, et al. Local Gabor binary pattern histogram sequence (LGBPHS): a novel non-statistical model for face representation and recognition [J]. Computer Vision, 2005, 1(1): 786-791.

        [14] Yang M, Zhang L, Zhang L et al. Monogenic binary pattern (MBP): a novel feature extraction and representation model for face recognition [C]//IEEE Conference Computer Pattern Recognition. New York: IEEE Press, 2010: 2680-2683.

        Face Recognition Methods Fusing Gabor Feature and Projective Dictionary Pair Learning

        Fu Yuxian,Peng Liangyu,Peng Hui

        (College of Physics and Information Science, Hunan Normal University, Changsha Hunan 410081, China)

        In order to obtain better face features and enhance the recognition rate of algorithm, a face recognition algorithm based on Gabor feature and projective dictionary pair learing named G-DPL is proposed in this paper. The local feature of face image are extracted by Gabor wavelet and PCA and LDA scheme is used to reduce the feature dimension. Projective dictionary pair learning algorithm and dimensionality reduced Gabor feature are fused to identify the classification. The recognition rate of G-DPL algorithm can reach 99.00% under ORL database. Featuredimensionality is 39. G-DPL can reach 96.14% on AR database. Feature dimensionality is 99. The proposed G-DPL algorithm can obtain higher recognition rate while taking up less space, which has certain reference value for practical application.

        face recognition; Gabor; projective dictionary pair

        TP 391.4

        10.11996/JG.j.2095-302X.2016020214

        A

        2095-302X(2016)02-0214-04

        2015-04-02;定稿日期:2015-10-23

        付宇賢(1989–),男,湖南岳陽人,碩士研究生。主要研究方向?yàn)閿?shù)字圖像處理與模式識(shí)別。E-mail:363533517@qq.com

        彭良玉(1965–),女,江西九江人,教授,博士,碩士生導(dǎo)師。主要研究方向?yàn)閿?shù)字圖像處理。E-mail:liangyu_peng@163.com

        猜你喜歡
        范數(shù)識(shí)別率字典
        開心字典
        家教世界(2023年28期)2023-11-14 10:13:50
        開心字典
        家教世界(2023年25期)2023-10-09 02:11:56
        基于類圖像處理與向量化的大數(shù)據(jù)腳本攻擊智能檢測(cè)
        基于真耳分析的助聽器配戴者言語可懂度指數(shù)與言語識(shí)別率的關(guān)系
        提升高速公路MTC二次抓拍車牌識(shí)別率方案研究
        基于加權(quán)核范數(shù)與范數(shù)的魯棒主成分分析
        矩陣酉不變范數(shù)H?lder不等式及其應(yīng)用
        我是小字典
        正版字典
        讀者(2016年14期)2016-06-29 17:25:50
        高速公路機(jī)電日常維護(hù)中車牌識(shí)別率分析系統(tǒng)的應(yīng)用
        国产三级av在线播放| 国产丝袜在线精品丝袜| 18禁美女裸体网站无遮挡| 国产69精品一区二区三区| 亚洲国产一区二区视频| 国产精品美女一区二区视频 | 日韩一级黄色片一区二区三区 | 亚洲av第一页国产精品| 免费在线观看视频专区| 蜜桃av噜噜一区二区三区策驰| 亚瑟国产精品久久| 亚洲黄色一级毛片| 国产一区二区三区蜜桃av| 国产乱人精品视频av麻豆网站| 国产综合无码一区二区辣椒| 国产自精品| 亚洲精品中文字幕乱码人妻| 在线视频国产91自拍| 人妻少妇久久中文字幕一区二区| 精品视频在线观看免费无码| 亚洲天堂一区二区三区视频| 亚洲日韩成人无码| 狠狠色丁香久久婷婷综合蜜芽五月| 国产在线视频h| 精品国产一区二区三区a| 亚洲日韩国产一区二区三区| 无码AV高潮喷水无码专区线| 精品粉嫩国产一区二区三区| 三级国产精品久久久99| 特级做a爰片毛片免费看108| 97在线视频免费| 一本色道88久久加勒比精品| 一本色道久久88亚洲精品综合| 国产午夜成人久久无码一区二区| 亚洲日本视频一区二区三区| 午夜视频国产在线观看| 成人性做爰aaa片免费看| 日韩精品视频在线观看免费| 黄色国产精品福利刺激午夜片| 曰韩亚洲av人人夜夜澡人人爽| 久久久伊人影院|