亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于深度信念網(wǎng)絡(luò)和多任務(wù)學(xué)習(xí)的人臉識(shí)別

        2016-07-23 20:21:14李鑫張俊
        電腦知識(shí)與技術(shù) 2016年17期
        關(guān)鍵詞:人臉識(shí)別

        李鑫++張俊

        摘 要:針對(duì)如何提高人臉識(shí)別率的問題,該文引入多任務(wù)學(xué)習(xí)機(jī)制,通過在深度信念網(wǎng)絡(luò)中構(gòu)建多任務(wù)分類器。利用多個(gè)相關(guān)任務(wù)的并行處理能夠使分類器從輸入端獲得更多信息,來提高分類器的分類能力。并可以通過多個(gè)相關(guān)任務(wù)權(quán)值競(jìng)爭(zhēng),減小過擬合對(duì)分類器的影響。實(shí)驗(yàn)結(jié)果表明,利用深度信念網(wǎng)絡(luò)構(gòu)造多任務(wù)學(xué)習(xí)分類器,相對(duì)于單任務(wù)學(xué)習(xí)而言,多任務(wù)學(xué)習(xí)機(jī)制能夠有效提高人臉識(shí)別精度。

        關(guān)鍵詞:深度信念網(wǎng)絡(luò);多任務(wù)學(xué)習(xí);人臉識(shí)別

        中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)17-0165-04

        Abstract:Aiming at improving face recognition rate, this paper introduces multi-task learning mechanism, constructing multi-task learning classification in output layer of deep belief network. Related tasks using multiple parallel processing enables the classifier to get more information from the input terminal, to improve the ability of classifier. And through multiple related tasks weight competition ,the impact of over-fitting classifier is reduced. Experimental results show that the deep belief network learning classifier constructed multi-task, with respect to single-task learning, the multi-task learning mechanism can effectively improve the recognition accuracy.

        Key words:deep belief network; multi-task learning; face recognition

        如今人臉識(shí)別技術(shù)在生活中扮演著越來越重要的角色,人臉識(shí)別技術(shù)被廣泛應(yīng)用于各類智能系統(tǒng),如圖片自動(dòng)歸檔系統(tǒng)、身份驗(yàn)證系統(tǒng)等。人臉識(shí)別也成為機(jī)器學(xué)習(xí)領(lǐng)域中的一個(gè)研究熱點(diǎn)。

        深度信念網(wǎng)絡(luò)(Deep Belief Network, DBN)作為一種特殊的人工神經(jīng)網(wǎng)絡(luò)其具有良好的特征提取能力,它通過無監(jiān)督的預(yù)訓(xùn)練和有監(jiān)督的微調(diào)獲得較好的網(wǎng)絡(luò)權(quán)值,逐層地對(duì)特征進(jìn)行抽取,進(jìn)而獲得較好特征。文獻(xiàn)[1]利用了DBN優(yōu)異的特征表示能力,在圖像識(shí)別問題中得到了較好的識(shí)別率。

        多任務(wù)學(xué)習(xí)是一種打破傳統(tǒng)研究觀念的研究方法,利用在多個(gè)相關(guān)任務(wù)并行處理過程中權(quán)值共享可以提高系統(tǒng)的泛化能力特性,進(jìn)而可以解決因樣本相對(duì)不足而造成的分類器泛化能力不強(qiáng)的問題。在神經(jīng)網(wǎng)絡(luò)中引入多任務(wù)學(xué)習(xí)機(jī)制,可以利用多個(gè)相關(guān)任務(wù)的權(quán)值共享來減弱過擬合對(duì)神經(jīng)網(wǎng)絡(luò)的影響。文獻(xiàn)[2]將深度信念網(wǎng)絡(luò)與多任務(wù)學(xué)習(xí)結(jié)合用于表情識(shí)別獲得了較好的效果。文獻(xiàn)[3]提出了一種基于多任務(wù)學(xué)習(xí)的人臉方法也獲得了較好的識(shí)別效果,提高了圖像識(shí)別的精度,文獻(xiàn)[4,5]將多任務(wù)學(xué)習(xí)應(yīng)用在圖像分類中,文獻(xiàn)[6,7]將多任務(wù)學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)結(jié)合應(yīng)用于分類問題都取得不錯(cuò)的效果。

        針對(duì)如何提高人臉識(shí)別率的問題,本文利用深度信念網(wǎng)絡(luò)提取圖像特征并在DBN輸出層構(gòu)建有監(jiān)督多任務(wù)學(xué)習(xí)分類器對(duì)人臉圖像進(jìn)行識(shí)別,提高了人臉識(shí)別的精度。

        1 深度信念網(wǎng)絡(luò)與多任務(wù)學(xué)習(xí)

        1.1 RBM受限玻爾茲曼機(jī)

        受限玻爾茲曼機(jī)(Restricted Boltzmann Machine, RBM)為兩層隨機(jī)網(wǎng)絡(luò)結(jié)構(gòu),RBM的兩層分別為可視層(v層)與隱含層(h層),可視層與隱含層之間的連接為全連接,隱含層與可視層層內(nèi)均無連接,v層偏置為b, h層偏置為c,其結(jié)構(gòu)示意圖如圖1所示。

        Roux等人證明了只要h層節(jié)點(diǎn)足夠多,RBM能夠擬合任意離散分布[8]。RBM網(wǎng)絡(luò)結(jié)構(gòu)中隱含層為二值變量,可視層為二值變量或者[0 1]之間的數(shù)值。假設(shè)隱含層有m個(gè)節(jié)點(diǎn),可視層有n個(gè)節(jié)點(diǎn),對(duì)于一組狀態(tài)(v, h),RBM系統(tǒng)具備的能量定義為:

        公式中參數(shù)vi表示可視層第i個(gè)節(jié)點(diǎn)狀態(tài),參數(shù)hj則表示隱含層第j個(gè)節(jié)點(diǎn)的狀態(tài)。[θ]為RBM結(jié)構(gòu)參數(shù),即[θ]={Wij,bi ,cj }。當(dāng)[θ]確定時(shí),得到RBM結(jié)構(gòu)基于(v,h)狀態(tài)的概率p為:

        Z([θ])為歸一化項(xiàng)。由RBM網(wǎng)絡(luò)層間全連接層內(nèi)無連接結(jié)構(gòu)特性可知,當(dāng)可視層節(jié)點(diǎn)值給定時(shí)各隱含層節(jié)點(diǎn)之間激活概率相互獨(dú)立,由網(wǎng)絡(luò)的對(duì)稱性可知,當(dāng)隱含層節(jié)點(diǎn)值給定時(shí),RBM網(wǎng)絡(luò)的可視層節(jié)點(diǎn)之間激活概率相互獨(dú)立。第i個(gè)可視層節(jié)點(diǎn)的激活概率p(vi=1|h,[θ])可由公式得出,第j個(gè)隱含層節(jié)點(diǎn)的激活概率p(hj=1|h,[θ])可由公式得出。

        公式(4)和(5)中sigmoid(x)為激活函數(shù),其公式為sigmoid(x)=1/1+e-x。由上述公式可以得出RBM對(duì)于觀測(cè)數(shù)據(jù)v的概率分布如公式(6)。

        為確定該分布,需要調(diào)節(jié)參數(shù)[θ]即調(diào)節(jié)W,b,c??梢岳脤?duì)比散度(Contrastive Divergence, CD)算法對(duì)訓(xùn)練樣本M進(jìn)行訓(xùn)練,訓(xùn)練RBM模型的過程中采用訓(xùn)練公式(7)-(2)進(jìn)行訓(xùn)練。其中[v(0)=M],[α] 為學(xué)習(xí)速率。

        大量實(shí)驗(yàn)證明RBM網(wǎng)絡(luò)是一種有效的特征提取機(jī)制,堆疊多個(gè)RBM組成網(wǎng)絡(luò)能夠在大部分分類和特征學(xué)習(xí)中提取更加抽象的特征,經(jīng)過無監(jiān)督的預(yù)訓(xùn)練與有監(jiān)督的全局微調(diào)后可以得到較優(yōu)化網(wǎng)絡(luò)模型。

        1.2 DBN深度信念網(wǎng)絡(luò)

        自Hinton[9]等人在神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上提出深度信念網(wǎng)絡(luò)以來,DBN在機(jī)器學(xué)習(xí)及人工智能領(lǐng)域得到了廣泛的應(yīng)用,DBN作為一種概率生成模型在特征提取及分類問題上均表現(xiàn)出良好的性能。經(jīng)典深度信念網(wǎng)絡(luò)由若干層受限玻爾茲曼機(jī)及輸出層組合而成,以包含兩個(gè)RBM的DBN網(wǎng)絡(luò)為例進(jìn)行說明,其模型結(jié)構(gòu)如圖2所示。在深度信念網(wǎng)絡(luò)中,RBM層訓(xùn)練屬于無監(jiān)督訓(xùn)練過程,其利用對(duì)比散度方法進(jìn)行逐層貪婪預(yù)訓(xùn)練,每一層的訓(xùn)練結(jié)果作為下一層的輸入,頂層為有監(jiān)督訓(xùn)練模型。本文利用經(jīng)典DBN網(wǎng)絡(luò)進(jìn)行實(shí)驗(yàn),在預(yù)訓(xùn)練完成后再實(shí)現(xiàn)對(duì)DBN網(wǎng)絡(luò)整體的權(quán)值進(jìn)行微調(diào)。

        實(shí)驗(yàn)中輸入為多維圖像像素?cái)?shù)據(jù),輸入數(shù)據(jù)與第一層隱含層構(gòu)成RBM網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練過程采用CD算法進(jìn)行逐層訓(xùn)練。當(dāng)?shù)谝粚佑?xùn)練完成后,將產(chǎn)生的參數(shù)W0作為固定參數(shù)輸入第二層RBM中進(jìn)行訓(xùn)練,依此順序進(jìn)行逐層訓(xùn)練直至訓(xùn)練出頂層RBM網(wǎng)絡(luò)參數(shù)完成預(yù)訓(xùn)練,并將所得參數(shù)輸入到下一層進(jìn)行有監(jiān)督的訓(xùn)練并利用誤差反向傳播算法對(duì)整體網(wǎng)絡(luò)權(quán)值進(jìn)行微調(diào),進(jìn)而增加整體網(wǎng)絡(luò)模型的準(zhǔn)確性和各層間聯(lián)系程度。

        1.3 多任務(wù)學(xué)習(xí)

        多任務(wù)學(xué)習(xí)最早由Caruana提出[10],多任務(wù)學(xué)習(xí)打破傳統(tǒng)任務(wù)分而治之的思想,對(duì)多個(gè)相關(guān)任務(wù)進(jìn)行并行訓(xùn)練能夠考慮到相關(guān)任務(wù)之間的聯(lián)系,提高輸入相關(guān)信息的獲取量,進(jìn)而可以解決因樣本相對(duì)不足而造成的分類器泛化能力不強(qiáng)的問題。并可以通過多個(gè)相關(guān)任務(wù)之間的權(quán)值共享進(jìn)而提高網(wǎng)絡(luò)模型的泛化能力,同時(shí)多個(gè)任務(wù)的權(quán)值進(jìn)行競(jìng)爭(zhēng)能夠有效抑制模型的過擬合程度,提高模型的識(shí)別精度,多任務(wù)學(xué)習(xí)結(jié)構(gòu)示意圖如圖3所示。

        本文在輸入端輸入多個(gè)任務(wù)訓(xùn)練數(shù)據(jù),需要說明的是一個(gè)整體數(shù)據(jù)中包含多任務(wù)信息而非分別輸入三個(gè)任務(wù)信息,并通過在深度信念網(wǎng)絡(luò)的輸出層構(gòu)建多任務(wù)分類器使訓(xùn)練過程中分類器能夠充分利用多個(gè)相關(guān)任務(wù)所包含的信息,進(jìn)而來提高人臉的識(shí)別的精度。其結(jié)構(gòu)如圖4所示。

        2 實(shí)驗(yàn)及結(jié)果分析

        本文使用的數(shù)據(jù)集為CMU人臉數(shù)據(jù)集。因數(shù)據(jù)集中存在極少幾張圖片損壞,用數(shù)據(jù)集中同種類別替代。最終數(shù)據(jù)集中包含640張人臉圖像,圖像信息包括人臉信息,人臉的方向(直,向上,向左,向右),人眼信息(是否佩戴墨鏡)。本次實(shí)驗(yàn)使用數(shù)據(jù)集中128*120分辨率的圖像。任務(wù)1為識(shí)別人臉,構(gòu)造任務(wù)2為識(shí)別人臉方向,任務(wù)3為人眼是否佩戴墨鏡。取數(shù)據(jù)集中480張為訓(xùn)練集,160張為測(cè)試集進(jìn)行測(cè)試,數(shù)據(jù)集部分圖像如圖5所示。

        3 結(jié)束語

        深度信念網(wǎng)絡(luò)能夠有效提取圖像特征,并通過輸出層進(jìn)行有效的分類,對(duì)深度信念網(wǎng)絡(luò)做進(jìn)一步研究有很強(qiáng)的實(shí)用價(jià)值。在DBN網(wǎng)絡(luò)中應(yīng)用多任務(wù)學(xué)習(xí)構(gòu)建多任務(wù)分類器,能夠在樣本相對(duì)不多的情況下使分類器同時(shí)關(guān)注多個(gè)相關(guān)任務(wù)即在訓(xùn)練過程中多個(gè)相關(guān)任務(wù)權(quán)值共享,進(jìn)而使分類器從輸入端獲取更多的相關(guān)信息量,同時(shí)可以利用多個(gè)相關(guān)任務(wù)權(quán)值競(jìng)爭(zhēng)減少過擬合對(duì)分類器的影響,進(jìn)而提高對(duì)人臉的識(shí)別率。

        參考文獻(xiàn):

        [1] Liu P, Han S, Meng Z, et al. Facial expression recognition via a boosted deep belief network[C]. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2014: 1805-1812.

        [2] Xia R, Liu Y. Leveraging valence and activation information via multi-task learning for categorical emotion recognition[C]. Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on. IEEE, 2015: 5301-5305.

        [3] 周茜. 基于多任務(wù)學(xué)習(xí)的人臉識(shí)別方法[D]. 西北大學(xué), 2013.

        [4] 劉成, 彭進(jìn)業(yè). 基于多任務(wù)學(xué)習(xí)的自然圖像分類研究[J]. 計(jì)算機(jī)應(yīng)用研究, 2012, 29(7): 2773-2775.

        [5] Ding C, Xu C, Tao D. Multi-task pose-invariant face recognition[J]. Image Processing, IEEE Transactions on, 2015, 24(3): 980-993.

        [6] Huang Z, Li J, Siniscalchi S M, et al. Rapid Adaptation for Deep Neural Networks through Multi-Task Learning[C]. Sixteenth Annual Conference of the International Speech Communication Association. 2015.

        [7] Ye Q, Munro P W. Improving a Neural Network Classifier Ensemble with Multi-task Learning[C]. Neural Networks, 2006. IJCNN'06. International Joint Conference on. IEEE, 2006: 5164-5170.

        [8] Le Roux N, Bengio Y. Representational power of restricted Boltzmann machines and deep belief networks[J]. Neural computation, 2008, 20(6): 1631-1649.

        [9] Hinton G E, Salakhutdinov R R. Reducing the dimensionality of data with neural networks[J]. Science, 2006, 313(5786): 504-507.

        [10] Caruana R. Multitask learning[M]. Learning to learn. Springer US, 1998: 95-133.

        猜你喜歡
        人臉識(shí)別
        人臉識(shí)別 等
        揭開人臉識(shí)別的神秘面紗
        人臉識(shí)別技術(shù)的基本原理與應(yīng)用
        電子制作(2019年14期)2019-08-20 05:43:34
        人臉識(shí)別技術(shù)在高速公路打逃中的應(yīng)用探討
        基于(2D)2PCA-LBP 的人臉識(shí)別方法的研究
        電子制作(2017年17期)2017-12-18 06:40:55
        淺談人臉識(shí)別技術(shù)
        人臉識(shí)別在高校安全防范中的應(yīng)用
        電子制作(2017年1期)2017-05-17 03:54:46
        巡演完美收官 英飛拓引領(lǐng)人臉識(shí)別新潮流
        人臉識(shí)別在Android平臺(tái)下的研究與實(shí)現(xiàn)
        基于Metaface字典學(xué)習(xí)與核稀疏表示的人臉識(shí)別方法
        亚洲一区av无码少妇电影| 日韩精品一区二区三区在线观看的| 久久精品无码一区二区三区蜜费| 真人男女做爰无遮挡免费视频 | 天堂av一区二区在线| av网址大全在线播放| 国产熟女露脸大叫高潮| 国产午夜在线视频观看| 免费乱理伦片在线观看 | 婷婷综合另类小说色区| 国产乱子乱人伦电影在线观看| 韩国精品一区二区三区无码视频 | 久久精品人妻中文av| 中文字幕久久精品一区二区| 国产在线观看午夜视频| 在线视频国产91自拍| 欧美亚洲日本国产综合在线美利坚| 人妻丰满熟妇无码区免费| 欧美粗大猛烈老熟妇| 八区精品色欲人妻综合网| 麻豆国产高清精品国在线| 免费在线观看一区二区| 国产尤物自拍视频在线观看| 久久99热国产精品综合| 亚洲日韩av一区二区三区中文| 四虎国产精品永久在线国在线| 看av免费毛片手机播放| 久久精品国产第一区二区三区| 欧美黑人疯狂性受xxxxx喷水| 国产在线观看黄| 日韩精品一区二区三区四区五区六| 日本精品一区二区三区试看| 国模冰莲自慰肥美胞极品人体图 | 亚洲精品无码久久久久| 亚洲一区二区久久青草| 91情侣在线精品国产免费| 成人国产一区二区三区av| 精品国产亚洲级一区二区| 国产人妻鲁鲁一区二区| 国产又色又爽又黄的| 亚洲色欲久久久久综合网|