孫抒雨+韓冰
摘 要:作為最重要的一種模式識(shí)別分類,根據(jù)人的臉面部特征進(jìn)行辨識(shí)對(duì)比進(jìn)而判斷是否相同,人臉識(shí)別逐步在現(xiàn)實(shí)生活中起到重要的作用。但當(dāng)前絕大多數(shù)對(duì)比方法,耗時(shí)較長,達(dá)不到滿意效果,本論文探討一種基于小波權(quán)位的能快速提高辨識(shí)效率的方法。
關(guān)鍵詞:人臉識(shí)別 權(quán)位 小波
中圖分類號(hào):TU201 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2014)04(c)-0030-01
1 人臉識(shí)別研究現(xiàn)狀簡介
伴隨著計(jì)算機(jī)技術(shù)的發(fā)展,在識(shí)別技術(shù)領(lǐng)域里從簡單的痕跡識(shí)別包括我們熟知的腳印、指紋、行為等逐步衍生出來虹膜既眼球識(shí)別、人的面部識(shí)別再到更高級(jí)的通過血液、皮毛的DNA識(shí)別。
信息技術(shù)的提升大大促進(jìn)了識(shí)別技術(shù)的發(fā)展,并為其廣泛應(yīng)用提供了技術(shù)保障。但DNA等識(shí)別技術(shù)還達(dá)不到實(shí)時(shí)性。所以人臉識(shí)別作為現(xiàn)在主流的識(shí)別應(yīng)用技術(shù)之一,它的應(yīng)用的還是非常廣泛的,在機(jī)場、住宅、會(huì)議等安檢設(shè)施,到一些大公司企業(yè)上班簽到、銀行等行政部門自主服務(wù)、服務(wù)公安安全信息等都被廣泛的實(shí)用。
2 人臉識(shí)別的主要方法及面臨的問題
當(dāng)下的人臉識(shí)別流行的算法主要是對(duì)人臉的面部特征進(jìn)行數(shù)據(jù)量化,在進(jìn)一步對(duì)量化后的矩陣進(jìn)行計(jì)算,然后與數(shù)據(jù)庫的信息通過類比方式比對(duì),相同數(shù)量達(dá)到一定閾值是判斷相同或不同。但是有一個(gè)無法回避的問題就是對(duì)人臉特征提取后為了追求高比較識(shí)別的精確度會(huì)造成很大的數(shù)據(jù)量,進(jìn)而給后續(xù)的計(jì)算帶來很大的負(fù)擔(dān),大到不能支持或延時(shí)實(shí)時(shí)識(shí)別。因此,識(shí)別精確度和對(duì)比時(shí)間成為一組不可調(diào)和的矛盾,怎樣來選合適的點(diǎn),既能保證識(shí)別精度又不太增加識(shí)別時(shí)間,成為當(dāng)今主要的課題研究。
3 一種能快速提高人臉識(shí)別效率的算法
在這里主要介紹一下提高識(shí)別效率的方法,在人的面部特征通過數(shù)據(jù)量化分析之后,通常有進(jìn)行小波變換、離散分析、及近年來廣泛應(yīng)用的PCA、2DPCA/LDA等不同的方法。這里我們通過一組數(shù)據(jù)說明一下,在一個(gè)靜態(tài)圖像如128×128個(gè)點(diǎn),為了提高辨識(shí)精度經(jīng)過小波變換或離散變換后,我們就拿最常用的40組小波函數(shù)窗口為例矩陣的為數(shù)可達(dá)到655360位,如果直接進(jìn)行比對(duì)的話很顯然計(jì)算量很大,嚴(yán)重的影響速度。但是我們經(jīng)過反復(fù)的實(shí)驗(yàn)得知在這655360個(gè)點(diǎn)中,其中有很少個(gè)點(diǎn)但集中了整幅圖像的絕大部分能量,因?yàn)樵谝徽眻D像中臉頰、額頭、毛發(fā)等都占了大部分篇幅,但絕大部分人來說都沒有什么特征,對(duì)于辨識(shí)來說沒有什么影響或者說作用非常小。因此我們提出找出其中集中了主要能量的點(diǎn),把他們集中并且重新組成一個(gè)新的矩陣向量,直接用他們進(jìn)行下一步的對(duì)比,這樣會(huì)很少消耗資源。
根據(jù)我們前面提及的所謂小波變換,其實(shí)就是參考它具有的多窗口特性,能使原先的一幅平面圖形立體化。其對(duì)最終的識(shí)別精度提效明顯,這也是我們把128×128轉(zhuǎn)化為655360的一個(gè)主要原因,但是怎樣去尋找那部分高作用點(diǎn)呢?這里我們引入一個(gè)權(quán)位概念,如大家熟知的個(gè)十百千萬,其中萬的權(quán)最高大于其它,1個(gè)萬要遠(yuǎn)遠(yuǎn)大于99個(gè)十等等。因此,我們?nèi)デ髾?quán)最高的點(diǎn)像素。在655360個(gè)點(diǎn)中權(quán)越大對(duì)比其它人臉來說效果就越明顯差別大,對(duì)于自己的人臉圖像點(diǎn)來說越不明顯差別小。因此,我們可以把它定義為一種數(shù)學(xué)模型中極間方差和極內(nèi)方差來求。步驟如下:
Step 1把我們剛才得到的655360個(gè)點(diǎn)的坐標(biāo)從新組成系數(shù)矩陣C。
Step 2 推導(dǎo)出C的平均值:
Q為訓(xùn)練類,P為樣本,x,y為點(diǎn)的位置。
Step 3 推導(dǎo)出C的方差:
Step 4 推導(dǎo)出均值:
Step 5 推導(dǎo)出均值:
Step 6 推導(dǎo)出方差:
Step 7 推導(dǎo)出點(diǎn)的貢獻(xiàn)值(H):
1≤c≤M,1≤y≤N
在第七步之后我們就能夠找到一些對(duì)于用來對(duì)比貢獻(xiàn)值不同的點(diǎn),我們按照需要挑選一些貢獻(xiàn)大的點(diǎn),在把這些點(diǎn)重新集合在一起,用這些點(diǎn)來進(jìn)行計(jì)算對(duì)比。而選取點(diǎn)的個(gè)數(shù)我們可以經(jīng)過試驗(yàn)反復(fù)驗(yàn)證。以上算法通過ORL和YALE人臉識(shí)別集合庫,驗(yàn)證得到貢獻(xiàn)值集中在絕少部分點(diǎn)上(60~70個(gè))(如圖1)。
通過上面試驗(yàn)我們能夠看出對(duì)于不同人臉庫即人臉表情、姿態(tài)等影響對(duì)于點(diǎn)的貢獻(xiàn)是不同的。我們在把這些點(diǎn)對(duì)應(yīng)的位置坐標(biāo)記錄下來,用來與人臉庫中人臉進(jìn)行計(jì)算速度要快很多提高20%左右,而精度下降較少3%左右。
參考文獻(xiàn)
[1] Shen Cong, Xiao-Gang R, Tian -Lu M.Writer IdentificatiGabor Wavelet. Proceedings of the 4th World CoIntelligent Control and Automation[Z].2002,3:2061-2064.
[2] 李銘.自動(dòng)人臉檢測與識(shí)別系統(tǒng)的研究[D].北京交通大學(xué),2006.
[3] 孫抒雨.基于Gabor特征的人臉識(shí)別算法研究[D].遼寧科技大學(xué),2012.
[4] 李曉東.人臉識(shí)別算法研究[D].南京:東南大學(xué),2009.endprint
摘 要:作為最重要的一種模式識(shí)別分類,根據(jù)人的臉面部特征進(jìn)行辨識(shí)對(duì)比進(jìn)而判斷是否相同,人臉識(shí)別逐步在現(xiàn)實(shí)生活中起到重要的作用。但當(dāng)前絕大多數(shù)對(duì)比方法,耗時(shí)較長,達(dá)不到滿意效果,本論文探討一種基于小波權(quán)位的能快速提高辨識(shí)效率的方法。
關(guān)鍵詞:人臉識(shí)別 權(quán)位 小波
中圖分類號(hào):TU201 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2014)04(c)-0030-01
1 人臉識(shí)別研究現(xiàn)狀簡介
伴隨著計(jì)算機(jī)技術(shù)的發(fā)展,在識(shí)別技術(shù)領(lǐng)域里從簡單的痕跡識(shí)別包括我們熟知的腳印、指紋、行為等逐步衍生出來虹膜既眼球識(shí)別、人的面部識(shí)別再到更高級(jí)的通過血液、皮毛的DNA識(shí)別。
信息技術(shù)的提升大大促進(jìn)了識(shí)別技術(shù)的發(fā)展,并為其廣泛應(yīng)用提供了技術(shù)保障。但DNA等識(shí)別技術(shù)還達(dá)不到實(shí)時(shí)性。所以人臉識(shí)別作為現(xiàn)在主流的識(shí)別應(yīng)用技術(shù)之一,它的應(yīng)用的還是非常廣泛的,在機(jī)場、住宅、會(huì)議等安檢設(shè)施,到一些大公司企業(yè)上班簽到、銀行等行政部門自主服務(wù)、服務(wù)公安安全信息等都被廣泛的實(shí)用。
2 人臉識(shí)別的主要方法及面臨的問題
當(dāng)下的人臉識(shí)別流行的算法主要是對(duì)人臉的面部特征進(jìn)行數(shù)據(jù)量化,在進(jìn)一步對(duì)量化后的矩陣進(jìn)行計(jì)算,然后與數(shù)據(jù)庫的信息通過類比方式比對(duì),相同數(shù)量達(dá)到一定閾值是判斷相同或不同。但是有一個(gè)無法回避的問題就是對(duì)人臉特征提取后為了追求高比較識(shí)別的精確度會(huì)造成很大的數(shù)據(jù)量,進(jìn)而給后續(xù)的計(jì)算帶來很大的負(fù)擔(dān),大到不能支持或延時(shí)實(shí)時(shí)識(shí)別。因此,識(shí)別精確度和對(duì)比時(shí)間成為一組不可調(diào)和的矛盾,怎樣來選合適的點(diǎn),既能保證識(shí)別精度又不太增加識(shí)別時(shí)間,成為當(dāng)今主要的課題研究。
3 一種能快速提高人臉識(shí)別效率的算法
在這里主要介紹一下提高識(shí)別效率的方法,在人的面部特征通過數(shù)據(jù)量化分析之后,通常有進(jìn)行小波變換、離散分析、及近年來廣泛應(yīng)用的PCA、2DPCA/LDA等不同的方法。這里我們通過一組數(shù)據(jù)說明一下,在一個(gè)靜態(tài)圖像如128×128個(gè)點(diǎn),為了提高辨識(shí)精度經(jīng)過小波變換或離散變換后,我們就拿最常用的40組小波函數(shù)窗口為例矩陣的為數(shù)可達(dá)到655360位,如果直接進(jìn)行比對(duì)的話很顯然計(jì)算量很大,嚴(yán)重的影響速度。但是我們經(jīng)過反復(fù)的實(shí)驗(yàn)得知在這655360個(gè)點(diǎn)中,其中有很少個(gè)點(diǎn)但集中了整幅圖像的絕大部分能量,因?yàn)樵谝徽眻D像中臉頰、額頭、毛發(fā)等都占了大部分篇幅,但絕大部分人來說都沒有什么特征,對(duì)于辨識(shí)來說沒有什么影響或者說作用非常小。因此我們提出找出其中集中了主要能量的點(diǎn),把他們集中并且重新組成一個(gè)新的矩陣向量,直接用他們進(jìn)行下一步的對(duì)比,這樣會(huì)很少消耗資源。
根據(jù)我們前面提及的所謂小波變換,其實(shí)就是參考它具有的多窗口特性,能使原先的一幅平面圖形立體化。其對(duì)最終的識(shí)別精度提效明顯,這也是我們把128×128轉(zhuǎn)化為655360的一個(gè)主要原因,但是怎樣去尋找那部分高作用點(diǎn)呢?這里我們引入一個(gè)權(quán)位概念,如大家熟知的個(gè)十百千萬,其中萬的權(quán)最高大于其它,1個(gè)萬要遠(yuǎn)遠(yuǎn)大于99個(gè)十等等。因此,我們?nèi)デ髾?quán)最高的點(diǎn)像素。在655360個(gè)點(diǎn)中權(quán)越大對(duì)比其它人臉來說效果就越明顯差別大,對(duì)于自己的人臉圖像點(diǎn)來說越不明顯差別小。因此,我們可以把它定義為一種數(shù)學(xué)模型中極間方差和極內(nèi)方差來求。步驟如下:
Step 1把我們剛才得到的655360個(gè)點(diǎn)的坐標(biāo)從新組成系數(shù)矩陣C。
Step 2 推導(dǎo)出C的平均值:
Q為訓(xùn)練類,P為樣本,x,y為點(diǎn)的位置。
Step 3 推導(dǎo)出C的方差:
Step 4 推導(dǎo)出均值:
Step 5 推導(dǎo)出均值:
Step 6 推導(dǎo)出方差:
Step 7 推導(dǎo)出點(diǎn)的貢獻(xiàn)值(H):
1≤c≤M,1≤y≤N
在第七步之后我們就能夠找到一些對(duì)于用來對(duì)比貢獻(xiàn)值不同的點(diǎn),我們按照需要挑選一些貢獻(xiàn)大的點(diǎn),在把這些點(diǎn)重新集合在一起,用這些點(diǎn)來進(jìn)行計(jì)算對(duì)比。而選取點(diǎn)的個(gè)數(shù)我們可以經(jīng)過試驗(yàn)反復(fù)驗(yàn)證。以上算法通過ORL和YALE人臉識(shí)別集合庫,驗(yàn)證得到貢獻(xiàn)值集中在絕少部分點(diǎn)上(60~70個(gè))(如圖1)。
通過上面試驗(yàn)我們能夠看出對(duì)于不同人臉庫即人臉表情、姿態(tài)等影響對(duì)于點(diǎn)的貢獻(xiàn)是不同的。我們在把這些點(diǎn)對(duì)應(yīng)的位置坐標(biāo)記錄下來,用來與人臉庫中人臉進(jìn)行計(jì)算速度要快很多提高20%左右,而精度下降較少3%左右。
參考文獻(xiàn)
[1] Shen Cong, Xiao-Gang R, Tian -Lu M.Writer IdentificatiGabor Wavelet. Proceedings of the 4th World CoIntelligent Control and Automation[Z].2002,3:2061-2064.
[2] 李銘.自動(dòng)人臉檢測與識(shí)別系統(tǒng)的研究[D].北京交通大學(xué),2006.
[3] 孫抒雨.基于Gabor特征的人臉識(shí)別算法研究[D].遼寧科技大學(xué),2012.
[4] 李曉東.人臉識(shí)別算法研究[D].南京:東南大學(xué),2009.endprint
摘 要:作為最重要的一種模式識(shí)別分類,根據(jù)人的臉面部特征進(jìn)行辨識(shí)對(duì)比進(jìn)而判斷是否相同,人臉識(shí)別逐步在現(xiàn)實(shí)生活中起到重要的作用。但當(dāng)前絕大多數(shù)對(duì)比方法,耗時(shí)較長,達(dá)不到滿意效果,本論文探討一種基于小波權(quán)位的能快速提高辨識(shí)效率的方法。
關(guān)鍵詞:人臉識(shí)別 權(quán)位 小波
中圖分類號(hào):TU201 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2014)04(c)-0030-01
1 人臉識(shí)別研究現(xiàn)狀簡介
伴隨著計(jì)算機(jī)技術(shù)的發(fā)展,在識(shí)別技術(shù)領(lǐng)域里從簡單的痕跡識(shí)別包括我們熟知的腳印、指紋、行為等逐步衍生出來虹膜既眼球識(shí)別、人的面部識(shí)別再到更高級(jí)的通過血液、皮毛的DNA識(shí)別。
信息技術(shù)的提升大大促進(jìn)了識(shí)別技術(shù)的發(fā)展,并為其廣泛應(yīng)用提供了技術(shù)保障。但DNA等識(shí)別技術(shù)還達(dá)不到實(shí)時(shí)性。所以人臉識(shí)別作為現(xiàn)在主流的識(shí)別應(yīng)用技術(shù)之一,它的應(yīng)用的還是非常廣泛的,在機(jī)場、住宅、會(huì)議等安檢設(shè)施,到一些大公司企業(yè)上班簽到、銀行等行政部門自主服務(wù)、服務(wù)公安安全信息等都被廣泛的實(shí)用。
2 人臉識(shí)別的主要方法及面臨的問題
當(dāng)下的人臉識(shí)別流行的算法主要是對(duì)人臉的面部特征進(jìn)行數(shù)據(jù)量化,在進(jìn)一步對(duì)量化后的矩陣進(jìn)行計(jì)算,然后與數(shù)據(jù)庫的信息通過類比方式比對(duì),相同數(shù)量達(dá)到一定閾值是判斷相同或不同。但是有一個(gè)無法回避的問題就是對(duì)人臉特征提取后為了追求高比較識(shí)別的精確度會(huì)造成很大的數(shù)據(jù)量,進(jìn)而給后續(xù)的計(jì)算帶來很大的負(fù)擔(dān),大到不能支持或延時(shí)實(shí)時(shí)識(shí)別。因此,識(shí)別精確度和對(duì)比時(shí)間成為一組不可調(diào)和的矛盾,怎樣來選合適的點(diǎn),既能保證識(shí)別精度又不太增加識(shí)別時(shí)間,成為當(dāng)今主要的課題研究。
3 一種能快速提高人臉識(shí)別效率的算法
在這里主要介紹一下提高識(shí)別效率的方法,在人的面部特征通過數(shù)據(jù)量化分析之后,通常有進(jìn)行小波變換、離散分析、及近年來廣泛應(yīng)用的PCA、2DPCA/LDA等不同的方法。這里我們通過一組數(shù)據(jù)說明一下,在一個(gè)靜態(tài)圖像如128×128個(gè)點(diǎn),為了提高辨識(shí)精度經(jīng)過小波變換或離散變換后,我們就拿最常用的40組小波函數(shù)窗口為例矩陣的為數(shù)可達(dá)到655360位,如果直接進(jìn)行比對(duì)的話很顯然計(jì)算量很大,嚴(yán)重的影響速度。但是我們經(jīng)過反復(fù)的實(shí)驗(yàn)得知在這655360個(gè)點(diǎn)中,其中有很少個(gè)點(diǎn)但集中了整幅圖像的絕大部分能量,因?yàn)樵谝徽眻D像中臉頰、額頭、毛發(fā)等都占了大部分篇幅,但絕大部分人來說都沒有什么特征,對(duì)于辨識(shí)來說沒有什么影響或者說作用非常小。因此我們提出找出其中集中了主要能量的點(diǎn),把他們集中并且重新組成一個(gè)新的矩陣向量,直接用他們進(jìn)行下一步的對(duì)比,這樣會(huì)很少消耗資源。
根據(jù)我們前面提及的所謂小波變換,其實(shí)就是參考它具有的多窗口特性,能使原先的一幅平面圖形立體化。其對(duì)最終的識(shí)別精度提效明顯,這也是我們把128×128轉(zhuǎn)化為655360的一個(gè)主要原因,但是怎樣去尋找那部分高作用點(diǎn)呢?這里我們引入一個(gè)權(quán)位概念,如大家熟知的個(gè)十百千萬,其中萬的權(quán)最高大于其它,1個(gè)萬要遠(yuǎn)遠(yuǎn)大于99個(gè)十等等。因此,我們?nèi)デ髾?quán)最高的點(diǎn)像素。在655360個(gè)點(diǎn)中權(quán)越大對(duì)比其它人臉來說效果就越明顯差別大,對(duì)于自己的人臉圖像點(diǎn)來說越不明顯差別小。因此,我們可以把它定義為一種數(shù)學(xué)模型中極間方差和極內(nèi)方差來求。步驟如下:
Step 1把我們剛才得到的655360個(gè)點(diǎn)的坐標(biāo)從新組成系數(shù)矩陣C。
Step 2 推導(dǎo)出C的平均值:
Q為訓(xùn)練類,P為樣本,x,y為點(diǎn)的位置。
Step 3 推導(dǎo)出C的方差:
Step 4 推導(dǎo)出均值:
Step 5 推導(dǎo)出均值:
Step 6 推導(dǎo)出方差:
Step 7 推導(dǎo)出點(diǎn)的貢獻(xiàn)值(H):
1≤c≤M,1≤y≤N
在第七步之后我們就能夠找到一些對(duì)于用來對(duì)比貢獻(xiàn)值不同的點(diǎn),我們按照需要挑選一些貢獻(xiàn)大的點(diǎn),在把這些點(diǎn)重新集合在一起,用這些點(diǎn)來進(jìn)行計(jì)算對(duì)比。而選取點(diǎn)的個(gè)數(shù)我們可以經(jīng)過試驗(yàn)反復(fù)驗(yàn)證。以上算法通過ORL和YALE人臉識(shí)別集合庫,驗(yàn)證得到貢獻(xiàn)值集中在絕少部分點(diǎn)上(60~70個(gè))(如圖1)。
通過上面試驗(yàn)我們能夠看出對(duì)于不同人臉庫即人臉表情、姿態(tài)等影響對(duì)于點(diǎn)的貢獻(xiàn)是不同的。我們在把這些點(diǎn)對(duì)應(yīng)的位置坐標(biāo)記錄下來,用來與人臉庫中人臉進(jìn)行計(jì)算速度要快很多提高20%左右,而精度下降較少3%左右。
參考文獻(xiàn)
[1] Shen Cong, Xiao-Gang R, Tian -Lu M.Writer IdentificatiGabor Wavelet. Proceedings of the 4th World CoIntelligent Control and Automation[Z].2002,3:2061-2064.
[2] 李銘.自動(dòng)人臉檢測與識(shí)別系統(tǒng)的研究[D].北京交通大學(xué),2006.
[3] 孫抒雨.基于Gabor特征的人臉識(shí)別算法研究[D].遼寧科技大學(xué),2012.
[4] 李曉東.人臉識(shí)別算法研究[D].南京:東南大學(xué),2009.endprint