譚 萍, 王 兵
(1. 蘭州文理學院 數字媒體學院, 蘭州 730000; 2. 中國科學院 近代物理研究所,蘭州 730000)
人臉識別依托科學技術的快速發(fā)展逐漸成為身份驗證研究的關鍵技術,彩色人臉識別近幾年也越加受到關注.彩色圖像針對傳統(tǒng)的灰度圖像來說涵蓋了相對更多的信息,如何更加充分運用每個彩色分量間的互補信息,剔除冗余信息,從而獲得更多有效的特征是目前彩色人臉識別技術亟待解決的問題[1-2].傳統(tǒng)的整體正交分析[3](holistic orthogonal analysis,HOA)以及統(tǒng)計正交分析[4](statistically orthogonal analysis,SOA)在提取鑒別特征時分別運用沒有監(jiān)督的正交算法及統(tǒng)計正交約束的算法來剔除三個彩色分量特征間的相似性,并沒有考慮三個彩色分量數據集間的相似性,從而把有利及不利于識別的同類及異類樣本相似性一并剔除掉,降低了特征的鑒別性能[5].針對傳統(tǒng)算法存在的問題,本文研究了基于彩色分量特征層雙重鑒別相似性分析的人臉圖像鑒別特征提取方法.
(1)
(2)
(3)
(4)
設計基于相關性度量的雙重鑒別相似性分析(CM-DDSA)方法的目標函數為
(5)
式中:wR、wG及wB分別為R、G及B色彩分量的投影變換矩陣;α>0、β>0及γ>0分別為權重系數.
可將式(5)改寫為
(6)
式中,
wR、wG及wB可以利用式(7)進行求解,即
Pw=QΛw
(7)
式中:
CM-DDSA方法具體操作流程如下:
1) 依照式(7)運算總體投影變換矩陣w;
2) 經過拆分w獲得R、G及B三個彩色分量的投影變換矩陣wR、wG及wB;
5) 運用基于相關性度量的最近鄰分類器完成分類識別.
為了驗證CM-DDSA算法性能,本文采集AR[6]、FRGC-v2[7]和LFW[8]三個彩色人臉圖像數據庫中圖片分別與傳統(tǒng)整體正交分析(HOA)及統(tǒng)計正交分析(SOA)方法進行了對比分析.
AR彩色人臉圖像數據庫擁有126個人的4 000多幅正面彩色人臉圖像,個人圖像中很大程度上存在表情、光照、遮擋以及采樣時間等不同.本文擇取該數據庫中100個人臉圖像,其中每個人包含20幅圖像,總計共20×100=2 000幅圖像.每幅彩色圖像均通過裁剪,僅僅保留人臉及周邊區(qū)域,經過處理后每幅圖像像素是60×60,其中某個人的圖像樣本如圖1所示.
圖1 AR 彩色人臉數據庫中某人圖像樣本Fig.1 Image samples for a certain person in AR color face database
FRGC-v2相對來說是一個范圍比較大的彩色人臉圖像數據庫,擇取training集合中222個人的圖片,每個人均擁有20幅不同的圖像.針對每一幅彩色圖像完成校正(確保兩眼都保持水平)、縮放以及裁剪等處理,最終僅僅保留人臉及周邊區(qū)域,經過處理后每幅圖像像素為60×60,其中某個人的圖像樣本如圖2所示.
圖2 FRGC-v2彩色人臉數據庫中某人圖像樣本Fig.2 Image samples for a certain person in FRGC-v2 color face database
LFW彩色人臉圖像數據庫擁有5 749人的13 233幅彩色人臉圖像,其中1 680人具有兩張以上圖像,圖像全都是從網絡上運用Viola-Jones人臉探測器采集獲得的,并且圖像在很大程度上都存在不同.針對擇取的原始圖像完成縮放以及裁剪等處理,最終僅保留人臉及周邊區(qū)域,經過處理后每幅圖像像素是60×60,其中某個人的圖像樣本如圖3所示.
為了有效設置參數,在每種數據庫中每個類別任意擇取8個彩色人臉圖像樣本當做訓練樣本,其余樣本作為測試樣本,完成20次隨機測試.依照得到的平均識別率確定最優(yōu)參數,三種數據庫在采用CM-DDSA方法時平均識別率隨參數ξ的變化情況如圖4~6所示.
圖5 FRGC-v2數據庫平均識別率隨ξ的變化Fig.5 Change of average recognition rate with ξ in FRGC-v2 database
圖6 LFW數據庫平均識別率隨ξ的變化Fig.6 Change of average recognition rate with ξ in LFW database
根據圖4~6中應用CM-DDSA方法的結果可知,在AR人臉彩色圖像數據庫中,人臉圖像色彩區(qū)域變化較大,故數據保留的信息量不能太少,當信息量數值低于要求數值會降低人臉特征識別能力;相比而言,在FRGC-v2和LFW人臉區(qū)域變化較小的數據庫上,降維后彩色人臉圖像數據保留的信息量適中時效果最好,當信息量增高或降低均會對識別效果有比較明顯的不利影響.
在AR、FRGC-v2以及LWF三個數據庫內,CM-DDSA方法的平均識別率分別在ξ=64、ξ=0.5以及ξ=0.5的位置獲得最大值,所以在數據庫內完成實驗分析時均擇取上述的ξ值.
鑒別能力[9]運算公式為
(8)
式中:Sbi為i彩色分量數據集特征的類間散布矩陣;Swi為i彩色分量數據集特征的類內散布矩陣.
HOA、SOA以及CM-DDSA方法獲取的R、G及B彩色分量特征鑒別性能實驗結果如表1所示.
表1 平均鑒別性能實驗結果Tab.1 Experimental results of average authentication performance
根據表1可知,在HOA和SOA方法中,DC(R)>DC(G)>DC(B),尤其是DC(R)和DC(G)的值在很大程度上存在不同.而CM-DDSA方法中DC(R)、DC(G)及DC(B)的差異相對來說非常小,從而表明CM-DDSA特征提取在很大程度上解決了三個彩色分量特征鑒別性能差異大的問題.
為了量化每個彩色分量間的相似性,設定x及y分別代表維數相同的兩個彩色分量圖像樣本向量,則它們之間相似性[10]為
(9)
將AR、FRGC-v2以及LWF三個數據庫中的圖像分別經過HOA、SOA以及CM-DDSA方式處理之后,三個彩色分量特征間的平均相似性值和平均識別率分別見表2~5所示.
表2 AR數據庫三個彩色分量特征間的平均相似性Tab.2 Average similarity between three color component features in AR database
表3 FRGC-v2數據庫三個彩色分量特征間的平均相似性Tab.3 Average similarity between three color component features in FRGC-v2 database
表4 LWF數據庫三個彩色分量特征間的平均相似性Tab.4 Average similarity between three color component features in LWF database
表5 平均識別率Tab.5 Average recognition rate %
根據表2~4可知,CM-DDSA方法的平均相似性值在很大程度上高于HOA以及SOA方法,從而表明該方法在很大程度上保留了三個彩色分量特征之間的平均相似性.根據表5能夠獲知,CM-DDSA方法保留更多的三個彩色分量特征之間的相似性,其在很大程度上增加了特征的鑒別能力,提升了識別效果.
本文提出了基于彩色分量特征層雙重鑒別相似性分析的人臉圖像鑒別特征提取方法CM-DDSA,其運用相關性度量各個彩色分量數據集內部以及不同彩色分量數據集之間的相似性.CM-DDSA與HOA、SOA方法相比在很大程度上保留了更多的有利于識別的同類樣本相似性,提升了特征的鑒別能力,同時CM-DDSA方法并沒有運用串行的特征提取,在很大程度上解決了HOA及SOA方法中三個彩色分量特征的鑒別能力存在很大差異的問題.