紀(jì)姝伊
(長(zhǎng)春理工大學(xué) 計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,長(zhǎng)春 130022)
當(dāng)前,各種現(xiàn)代科技快速發(fā)展,人們獲取圖像的方式也更加的便捷,在此基礎(chǔ)上,人臉的識(shí)別技術(shù)也有了長(zhǎng)足的進(jìn)展[1-3]。在近幾年,對(duì)人臉識(shí)別的研究,大多數(shù)是使用深度學(xué)習(xí)類的方法,該類方法具有很好的識(shí)別性[4-5]。這主要是針對(duì)人的面部識(shí)別方面進(jìn)行的研究,以人工神經(jīng)網(wǎng)絡(luò)作為基礎(chǔ)創(chuàng)建的,當(dāng)前的深度學(xué)習(xí)手段已經(jīng)比較普及,而且具有很高的識(shí)別度。這種識(shí)別手段主要來(lái)自人工的神經(jīng)網(wǎng)絡(luò)系統(tǒng),通過(guò)對(duì)人的大腦進(jìn)行模擬分析進(jìn)而建立相關(guān)的數(shù)據(jù),仿照人的大腦對(duì)相關(guān)圖像參數(shù)進(jìn)行解析,這是一種無(wú)需監(jiān)督的學(xué)習(xí)手段。深度學(xué)習(xí)有比較多的方法,卷積神經(jīng)網(wǎng)絡(luò)就是簡(jiǎn)稱為CNN的一種深度學(xué)習(xí)手段,這種學(xué)習(xí)方法使用的比較多,因?yàn)樗木W(wǎng)絡(luò)模型比較簡(jiǎn)單而且具有自動(dòng)化的識(shí)別數(shù)據(jù),不過(guò)對(duì)于人的面部辨識(shí)方面來(lái)說(shuō)很多經(jīng)典的手段還是值得更加深入的研究的,比方說(shuō)是參數(shù)的降維解析算法,本文主要對(duì)以稀疏表示為基礎(chǔ)的圖嵌入降維解析算法進(jìn)行更加深入的分析,進(jìn)一步使面部識(shí)別時(shí)辨識(shí)度得到提高。
表情圖像的預(yù)處理包括表情圖像子區(qū)域的分割以及表情圖像的歸一化處理,前者指從表情圖像分割出與表情最相關(guān)的子區(qū)域,而后者包括圖像的灰度均衡和尺度歸一。圖像預(yù)處理的好壞直接影響表情特征提取的效果和計(jì)算量。
通過(guò)小波變換處理后,變換特征的維數(shù)有了明顯的提高,因此,在整個(gè)實(shí)驗(yàn)的過(guò)程中都通過(guò)均勻下采樣方法來(lái)處理Gabor小波,以此來(lái)實(shí)現(xiàn)降維。表情特征提取可分為兩步:歸一化后的表情圖像的網(wǎng)格化和彈性圖的構(gòu)造。
小波變換后生成的特征矢量模較大。針對(duì)上面分割及歸一化后的表情子圖像,首先對(duì)表情子圖像進(jìn)行網(wǎng)格化處理,即使用固定尺寸的網(wǎng)格進(jìn)一步分割表情子圖像。識(shí)別時(shí)采用彈性圖匹配算法,通過(guò)適當(dāng)改變表情模板的網(wǎng)格結(jié)點(diǎn)間距離,找到表情模板與待識(shí)別表情圖像的最佳匹配,從而實(shí)現(xiàn)表情的分類與識(shí)別。
本階段的任務(wù)是將經(jīng)網(wǎng)格化后的人臉子圖像轉(zhuǎn)換為表情特征彈性圖(或稱作表情屬性拓?fù)鋱D)。即對(duì)人臉子圖像的每一個(gè)網(wǎng)格進(jìn)行Gabor小波變換,取變換后的小波系數(shù)作為該網(wǎng)格的特征矢量,所有網(wǎng)格的特征矢量則構(gòu)成了表情特征彈性圖。
通過(guò)SR-Graph方法來(lái)進(jìn)行模型的建立,尋找樣本點(diǎn)Xi的鄰近樣本點(diǎn)。采用歐氏距離作為測(cè)度來(lái)尋找每個(gè)樣本點(diǎn)Xi的k個(gè)最近鄰的樣本點(diǎn)??捎肵n來(lái)表示這k個(gè)最近鄰的樣本點(diǎn)組成的集合,求解樣本點(diǎn)間的權(quán)值矩陣權(quán)Wij,表示第j個(gè)樣本點(diǎn)對(duì)重構(gòu)第i個(gè)樣本點(diǎn)的貢獻(xiàn),當(dāng)兩個(gè)數(shù)據(jù)點(diǎn)越相近時(shí),兩者之間的權(quán)值也就越大。該方法的特點(diǎn)有兩個(gè)方面:一是使用SR-Graph方法,能夠在降維的過(guò)程中保持很好的魯棒性,能夠盡可能的保證不依賴參數(shù);二是能夠同時(shí)確定權(quán)值和圖邊,進(jìn)而能更容易的建立優(yōu)良模型。
借助Matlab手段進(jìn)行相關(guān)的仿真模擬,進(jìn)而更好的對(duì)前文提出的以稀疏表示為基礎(chǔ)的圖嵌入降維解析算法進(jìn)行解析,下面選取PIE參數(shù)存儲(chǔ)空間里的少量Pose-05作為示例,選取示例遵循以下準(zhǔn)則:首先是選擇第一個(gè)人的第二張圖片作為測(cè)試示例,以隨機(jī)選擇的十個(gè)人中的前面二十張照片作為訓(xùn)練示例的集合(不包括測(cè)試示例),所說(shuō)的字典指的就是它,下面的圖1表示的是用字典以稀疏表示的手段進(jìn)行測(cè)試示例分析從而得到的所有參數(shù)圖像,字典里面除了零以外的參數(shù)相對(duì)應(yīng)的原子情況也在圖中。通過(guò)實(shí)驗(yàn)?zāi)軌虻玫剑簣D里面有五個(gè)參數(shù)是非零的,它們是1號(hào)、4號(hào)、11號(hào)、15號(hào)、17號(hào),與之相對(duì)的原則參數(shù)是這些非零系數(shù)所對(duì)應(yīng)的原則數(shù)值,為0.008,0.2103,0.0297,0.0923,0.6435。除去非零的參數(shù)以外,還可以知道有不是絕對(duì)零值的參數(shù),之所以這樣是因?yàn)檫@些數(shù)據(jù)都比較小,影響不大,可以忽略。其次,使用以上非零參數(shù)相對(duì)的結(jié)果圖片進(jìn)行二號(hào)測(cè)試圖片的再一次構(gòu)造時(shí),重構(gòu)的殘差十分小,這就表示之前選取的樣本中已經(jīng)具有二號(hào)圖像的參數(shù)。所以,能夠在訓(xùn)練樣本的集合中直接將二號(hào)圖像刪除。
圖1 2號(hào)圖像稀疏表示后的系數(shù)及其對(duì)應(yīng)的圖片
圖2表示的是二號(hào)樣本相對(duì)別的樣本的歐氏距離,本文為了將結(jié)果比較明顯的表示出來(lái)把前面三十個(gè)距離進(jìn)行了增大,可以參見(jiàn)圖3。
通過(guò)圖2展現(xiàn)的二號(hào)測(cè)試圖片相對(duì)全部訓(xùn)練樣本的歸一化距離,能夠發(fā)現(xiàn)二號(hào)的歸一化距離相對(duì)別的樣本而言比較小。
圖2 2號(hào)測(cè)試圖像與所有訓(xùn)練樣本的歸一化距離
圖3 2號(hào)測(cè)試圖像與前30個(gè)訓(xùn)練樣本的歸一化距離
通過(guò)圖3能夠發(fā)現(xiàn):對(duì)于之前提到的非零參數(shù)對(duì)應(yīng)的圖像以及二號(hào)測(cè)試樣本來(lái)說(shuō),它們的歐式距離全都相對(duì)小得多,不過(guò)這并不能說(shuō)明其稀疏數(shù)值大小不為零,比方說(shuō)11號(hào)圖像,通過(guò)稀疏表示選取的樣本相對(duì)通常根據(jù)距離選擇樣本的不同之處就在于此,同時(shí)也就比較好的表示稀疏描述在人大腦的主觀感知表示參數(shù)的具體情況。
本文主要使用ORL免費(fèi)的人臉存儲(chǔ)空間對(duì)以稀疏表示的圖嵌入降維解析手段進(jìn)行效果檢驗(yàn)。本文使用的以稀疏表示為基礎(chǔ)的圖嵌入降維解析算法,主要是兩個(gè)可以變化的參數(shù),它們是:重構(gòu)殘差閾值λ以及稀疏表示的系數(shù)閾值μ。此次測(cè)試再一次選擇隨機(jī)的樣本集合(不能選擇前一次已經(jīng)選取的樣本),測(cè)試的條件同前一次測(cè)試一樣,一個(gè)小組要做十次平行測(cè)試,以十組測(cè)試的平均值作為辨別度。假設(shè)確定的數(shù)值λ大小為0.145,通過(guò)變換稀疏表示的系數(shù)閾值,分別獲得在稀疏閾值不一樣時(shí)的辨識(shí)度以及壓縮好壞。得到的相關(guān)數(shù)據(jù)參見(jiàn)下面的表格1和2。
如表1所示,從ORL人臉數(shù)據(jù)庫(kù)中λ=0.145時(shí)的識(shí)別率中可以看出,本文提出的基于稀疏表示的圖嵌入降維算法在ORL人臉數(shù)據(jù)庫(kù)中λ=0.145時(shí)具有比較好的識(shí)別率。
通過(guò)表2里的相關(guān)數(shù)據(jù),能夠發(fā)現(xiàn)當(dāng)選取的樣本數(shù)量越多的時(shí)候,稀疏表示的系數(shù)閾值就會(huì)隨之增大。對(duì)于ORL參數(shù)存儲(chǔ)空間來(lái)說(shuō),每一個(gè)人都會(huì)有一張不同的面部表情圖片。能夠?qū)⑦@些圖片作為訓(xùn)練的樣本,因?yàn)樯厦娴娜N非負(fù)矩陣的解析方法全部是無(wú)監(jiān)督的解析手段,也就是說(shuō),能夠以不同的類別為依據(jù)迅速地找到相關(guān)的訓(xùn)練樣本。緊接著,對(duì)其做降維操作,進(jìn)而將維度較高的面部圖片換算成維度較低的參數(shù)。
表1 ORL人臉數(shù)據(jù)庫(kù)中λ=0.145時(shí)的識(shí)別率(%)
以稀疏表示為基礎(chǔ)的圖嵌入降維解析的面部辨識(shí)流程如圖4所示。第一就是要提前對(duì)測(cè)試以及訓(xùn)練的相關(guān)圖片進(jìn)行處理,其次就要通過(guò)Gabor的小波變換獲得圖片里的表征性參數(shù),緊接著用以稀疏表示為基礎(chǔ)的圖嵌入降維解析手段得到需要的面部辨識(shí)結(jié)果。
表2 ORL人臉數(shù)據(jù)庫(kù)中λ=0.145時(shí)的選樣樣本數(shù)
圖4 稀疏表示的圖嵌入降維算法的人臉識(shí)別過(guò)程
人臉識(shí)別的使用會(huì)受到光照以及障礙物等諸多條件的影響,這些外在因素會(huì)對(duì)實(shí)際使用面部識(shí)別時(shí)造成很大的影響,進(jìn)而導(dǎo)致分辨率下降。通過(guò)對(duì)前人的成果進(jìn)行分析以及自己測(cè)試的基礎(chǔ)上能夠知道:對(duì)于人的面部識(shí)別來(lái)說(shuō),以稀疏表示為基礎(chǔ)的解析算法具有自身特殊的優(yōu)勢(shì),當(dāng)面部識(shí)別受到光照以及遮擋的時(shí)候,其展現(xiàn)了令人滿意的魯棒性以及優(yōu)越性。因此,在圖嵌入的降維解析算法里引進(jìn)稀疏表示的手段可以增強(qiáng)識(shí)別率。
[1]王心醉,郭立紅,楊麗梅,等.基于AdaBoost的人臉檢測(cè)算法[J].長(zhǎng)春理工大學(xué)學(xué)報(bào):自然科學(xué)版,2009,32(2):248-250.
[2]李陽(yáng).基于三維模型子空間監(jiān)督學(xué)習(xí)法的二維人臉識(shí)別[J].長(zhǎng)春理工大學(xué)學(xué)報(bào):自然科學(xué)版,2009,32(3):442-446,435.
[3]胡建軍.稀疏表示在人臉識(shí)別中的應(yīng)用[D].長(zhǎng)沙:中南大學(xué),2014.
[4]張其文,莊新磊.基于監(jiān)督協(xié)同近鄰保持投影的人臉識(shí)別算法[J].計(jì)算機(jī)科學(xué),2015,42(5):309-314.
[5]丁正明.流形學(xué)習(xí)方法在視頻人臉識(shí)別中的應(yīng)用基礎(chǔ)研究[D].成都:電子科技大學(xué),2013.
[6]邢云.基于壓縮感知理論的人臉識(shí)別方法研究[D].大連:大連理工大學(xué),2010.
[7]張翠萍,蘇光大.人臉識(shí)別技術(shù)綜述[J].中國(guó)圖像圖形學(xué)報(bào),2000,5(11):885-894.
[8]鄧承志.圖像稀疏表示理論及其應(yīng)用研究[D].武漢:華中科技大學(xué),2008.
[9]郭志強(qiáng).基于子空間分析的人臉識(shí)別算法研究[D].武漢:武漢理工大學(xué),2010.
[10]張春梅,尹中科,肖明霞.基于冗余字典的信號(hào)超完備表示與稀疏分解[J].科學(xué)通報(bào),2006,51(6):628-633.
長(zhǎng)春理工大學(xué)學(xué)報(bào)(自然科學(xué)版)2018年1期