樂(lè)新宇,肖小霞
(1.廣東省龍川縣廣播電視臺(tái),廣東 龍川 517300;2.武漢大學(xué) 計(jì)算機(jī)學(xué)院,湖北 武漢 430072)
人臉識(shí)別[1]是模式識(shí)別和計(jì)算機(jī)視覺(jué)領(lǐng)域中一個(gè)非常重要的研究課題,眾多學(xué)者對(duì)該課題展開了研究,提出了一系列經(jīng)典的人臉識(shí)別方法。例如,文獻(xiàn)[2]提出了基于主成分分析(PCA)的特征提取方法來(lái)完成人臉識(shí)別任務(wù),但該方法由于沒(méi)有很好地利用人臉的局部信息,因此識(shí)別率不高[3],而且可能導(dǎo)致小樣本問(wèn)題[4]。
針對(duì)PCA應(yīng)用于人臉識(shí)別問(wèn)題上的不足,文獻(xiàn)[5]提出了二維主成分分析(2DPCA)方法來(lái)進(jìn)行人臉識(shí)別,通過(guò)計(jì)算維度低得多的協(xié)方差矩陣在一定程度上提高了人臉識(shí)別的精度,但該方法沒(méi)有考慮協(xié)方差矩陣中行與行之間的相關(guān)性,對(duì)于復(fù)雜環(huán)境下的人臉識(shí)別問(wèn)題不能得到最優(yōu)解[6-7]。在此基礎(chǔ)上,有研究者分析了待考察圖像的列和行的關(guān)系[8],對(duì)2DPCA進(jìn)行了改進(jìn),提出了(2D)2PCA來(lái)解決復(fù)雜環(huán)境下的人臉識(shí)別問(wèn)題,取得了與2DPCA一樣的識(shí)別精度[9-10]。此外,文獻(xiàn)[11-15]相繼提出了分塊PCA(BPCA)方法、PCA(BPCA_L1)方法和2DKPCA來(lái)進(jìn)行人臉識(shí)別。雖然這些方法能夠滿足大多數(shù)場(chǎng)景下的人臉識(shí)別需求,但還普遍存在著由于局部信息丟失所導(dǎo)致的識(shí)別精度低的問(wèn)題。
鑒于此,文中提出一種新的基于2DPCA的算法,以高效地實(shí)現(xiàn)人臉識(shí)別,并通過(guò)AR和ORL兩個(gè)人臉數(shù)據(jù)庫(kù)上的實(shí)驗(yàn)驗(yàn)證該方法的有效性。
(2D)2PCA認(rèn)為2DPCA實(shí)質(zhì)上是對(duì)圖像的行方向的運(yùn)算,通過(guò)同時(shí)考慮圖像行方向和列方向的運(yùn)算,(2D)2PCA可以得到2個(gè)方向的2DPCA值。
(1)
定義圖像的總體散布矩陣為:
(2)
1.1.1 行方向2DPCA
(3)
通過(guò)式3可知,可以通過(guò)計(jì)算圖像行向量的外積獲得圖像的總體散布矩陣G,即提出的2DPCA算法從本質(zhì)上說(shuō)是對(duì)圖像做行方向的運(yùn)算。
1.1.2 列方向2DPCA
假設(shè)有一個(gè)列向量彼此正交的矩陣Z∈Rm×q(q≤m),將A向Z投影得到一個(gè)大小為q×n的矩陣B:
B=ZTA
(4)
(5)
得到總體散布矩陣G和G'后,設(shè)通過(guò)行方向2DPCA和列方向2DPCA獲得的投影矩陣分別為X和Z。文中的(2D)2PCA同時(shí)將圖像A向X和Z做投影,可以得到一個(gè)大小為q×d矩陣的C:
C=ZTAX
(6)
其中,C表示(2D)2PCA在A上提取得到的特征矩陣。一般而言,q值要遠(yuǎn)遠(yuǎn)小于m,即相比于2DPCA在A上提取得到的特征矩陣為Y(m×d),文中算法顯著降低了特征矩陣的維度,節(jié)省了存儲(chǔ)空間,提高了運(yùn)算效率。
首先,將待測(cè)試的每一幅圖像劃分為多個(gè)不重疊的塊,塊的數(shù)目預(yù)先指定,每個(gè)塊都涵蓋了圖像的某些局部特征;然后,采用(2D)2PCA算法將每個(gè)塊的內(nèi)容轉(zhuǎn)換到某個(gè)能夠保持該塊大部分信息的子空間中,相當(dāng)于獲得塊的一種稀疏表示,去除那些對(duì)于分類不起作用的局部特征。下面給出表示該過(guò)程的兩個(gè)步驟。
1.2.1 圖像分塊
假設(shè)Ai∈RH×W表示第i幅待測(cè)試圖像,采用矩陣Ai將圖像劃分為Nb=DH×DW個(gè)塊。其中,DH和DW分別表示垂直方向和水平方向上分割的數(shù)目,如式7所示。分別利用w=W/DW和h=H/DH計(jì)算每個(gè)塊的寬度和高度。
(7)
1.2.2 提取特征
(8)
(9)
(10)
(11)
(12)
(13)
在這種方式下,式14對(duì)于每一個(gè)樣本Ai,有相同塊數(shù)目的特征矩陣,但獲得的低維的特征矩陣為:
(14)
(15)
采用具有Nb個(gè)最近鄰居節(jié)點(diǎn)的分類器來(lái)找到待測(cè)試樣本的標(biāo)簽,這里Nb相當(dāng)于塊的數(shù)目。對(duì)于任意一個(gè)塊,每個(gè)分類器在給定的置信度條件下為輸入塊的每個(gè)類進(jìn)行投票。就L類問(wèn)題而言,每個(gè)分類器將獲得L個(gè)置信度。因此,為了對(duì)輸入的測(cè)試圖像進(jìn)行分類,首先為每個(gè)類計(jì)算它們的置信度之和,然后從中選出和值最大的那個(gè)類作為輸出類。
假設(shè)Cl,k表示某一待測(cè)試圖像中第k個(gè)塊的內(nèi)容隸屬于第l類的置信度,則可以定義Cl,k為:
(16)
假設(shè)Dl,k表示某一待測(cè)試圖像中第k個(gè)塊和第l類圖像對(duì)應(yīng)塊之間的最小距離,則有:
(17)
其中,‖·‖F(xiàn)ro表示Frobenius范式。
式16中的參數(shù)σ一般來(lái)說(shuō)是某一正常數(shù),它和Dl,k共同影響到置信度的計(jì)算。如果σ越小,則Dl,k的選取對(duì)于置信度越重要;如果σ接近于0,則分類等價(jià)于通過(guò)簡(jiǎn)單投票來(lái)決定標(biāo)簽屬于哪一類的問(wèn)題,此時(shí)不能得到最優(yōu)的分類結(jié)果。此外,對(duì)于待測(cè)試圖像,所有分類的置信度之和應(yīng)該總是為1,即有:
(18)
通過(guò)式18的處理,可以獲得參數(shù)σ的歸一化常量,并使得置信度的計(jì)算與塊中距離的遠(yuǎn)近無(wú)關(guān)。然后,采用式19計(jì)算得到待測(cè)試圖像隸屬于第l類的置信度之和:
(19)
根據(jù)式19可知,對(duì)于任意的待測(cè)試圖像,如果所有的分類中類l具有最大的置信度之和,則認(rèn)為該測(cè)試圖像屬于類l。
實(shí)驗(yàn)主要分為兩部分:第一部分在AR人臉庫(kù)中選擇有遮擋(眼鏡和圍巾)圖片進(jìn)行實(shí)驗(yàn);第二部分為算法識(shí)別時(shí)間實(shí)驗(yàn)。
所有實(shí)驗(yàn)中,對(duì)所有方法使用Frobenius范式作為距離函數(shù):
(20)
其中,F(xiàn)和Fi是Rh×w中的兩個(gè)特征矩陣。
在遮擋仿真中,主要包含圍巾遮擋和墨鏡圍巾遮擋。具體而言,在AR人臉庫(kù)中選擇了存在遮擋情況的120個(gè)目標(biāo)進(jìn)行了實(shí)驗(yàn)。
(1)圍巾遮擋。
在所選擇的120個(gè)目標(biāo)對(duì)象中,選擇20幅僅光照、情緒變化的圖像,其中12幅不存在陰影遮擋的圖像作為訓(xùn)練集,剩下8幅存在遮擋情況的圖像作為測(cè)試集。圖1給出了AR人臉庫(kù)的一個(gè)目標(biāo)示例。在AR人臉庫(kù)上的識(shí)別率對(duì)比如表1所示。
圖1 來(lái)自AR人臉庫(kù)的一個(gè)目標(biāo)
算法30541203002DPCA57.4674.2385.0292.36(2D)2PCA57.7274.4685.1693.87BPCA57.6074.2885.0592.72LBDPCA57.3074.1184.9593.63B(2D)2PCA61.3276.4085.7395.50
(2)眼鏡遮擋。
在所選擇的120個(gè)目標(biāo)對(duì)象中,選擇20幅僅光照、情緒變化的圖像,其中12幅不存在陰影遮擋的圖像作為訓(xùn)練集,剩下8幅存在遮擋情況的圖像作為測(cè)試集。在AR人臉庫(kù)上對(duì)2DPCA[5]、(2D)2PCA[8]、BPCA[12]、LBDPCA[14]和文中方法的識(shí)別率進(jìn)行了比較,結(jié)果如表2所示。
表2 AR庫(kù)眼鏡遮擋時(shí)各算法的識(shí)別率 %
由表1、表2可知,人臉有遮擋時(shí),B(2D)2PCA一致優(yōu)于其他方法。
僅識(shí)別率高于其他算法還不足以說(shuō)明文中方法的優(yōu)越性,為評(píng)測(cè)文中方法的性能,在AR、ORL人臉庫(kù),以識(shí)別一張圖像為例,將文中方法與其他人臉識(shí)別算法在識(shí)別時(shí)間上進(jìn)行了比較。仿真實(shí)驗(yàn)中所采用的環(huán)境設(shè)置為:Intel Core i3 6100處理器,內(nèi)存8 G,存儲(chǔ)空間1 TB,仿真工具采用Matlab R2016a。以AR和ORL人臉庫(kù)中的識(shí)別任務(wù)為測(cè)試對(duì)象,得到的仿真結(jié)果見表3,可以看到文中算法比傳統(tǒng)算法的效率要高。仔細(xì)分析原因可知,文中提出的B(2D)2PCA算法即使面對(duì)非常復(fù)雜的外在因素干擾(比如光照、陰影遮擋等),仍然能夠快速地提取用于人臉識(shí)別的關(guān)鍵特征,因此極大地節(jié)省了算法的空間搜索時(shí)間,取得了更好的效率。
表3 各算法在AR和ORL人臉庫(kù)上的識(shí)別耗時(shí)比較 s
針對(duì)現(xiàn)有人臉目標(biāo)識(shí)別算法的不足之處,采用主成分分析技術(shù),提出了一種改進(jìn)的人臉目標(biāo)識(shí)別算法。該算法能夠在光照受限、遮擋等復(fù)雜環(huán)境下對(duì)人臉進(jìn)行準(zhǔn)確識(shí)別,具有較好的應(yīng)用前景。在下一步工作中,將對(duì)該算法進(jìn)行擴(kuò)展研究,以進(jìn)一步提升算法的人臉識(shí)別效率。