丁朔
摘要:該文研究人工智能中人臉識(shí)別的問題,由于受到光照以及人臉表情等各種因素的影響,論文中我采用的是改進(jìn)的主成分分析算法(PCA)和Fisher LDA(FLD)算法相結(jié)合,使PCA算法具有灰度歸一化的能力。首先將訓(xùn)練樣本的人臉圖像進(jìn)行預(yù)處理,將每一張圖片轉(zhuǎn)換成一個(gè)列向量,最后所有的列向量合成一個(gè)矩陣。利用K-L變換提取一個(gè)低位特征空間來表示人臉圖像,得到特征臉空間。在Fisher鑒別準(zhǔn)則下,求一個(gè)最佳鑒別方向,從高位特征向量投影到最佳鑒別方向上構(gòu)成一個(gè)鑒別特征空間,訓(xùn)練樣本獲最佳描述特征,然后將特征臉空間降維,得到各類人臉特征庫,接著將待識(shí)別的人臉進(jìn)行PCA降維以及通過FLD分類器,在特征臉數(shù)據(jù)庫中尋求與該人臉歐氏距離最近的人臉圖像。該文算法是用人臉數(shù)據(jù)庫進(jìn)行測試。最終確定本論文的方案切實(shí)可行,能夠?qū)⑷四樀母鞣N表情以及圖片缺失或者重組等特殊情況均可識(shí)別并匹配。
關(guān)鍵詞:改進(jìn)的PCA算法;FLD算法;K-L變換;最佳描述特征
中圖分類號:TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號:1009-3044(2016)08-0164-02
1 算法
本課題的思想是在人臉識(shí)別過程中,光照對于識(shí)別率的影響很大,為了克服光照條件對于特征值即特征空間的影響,我們對主成分分析法PCA算法進(jìn)行改進(jìn),使其具有灰度歸一化的能力然后將其與Fisher LDA方法相結(jié)合,克服人臉識(shí)別過程中光照對于識(shí)別目標(biāo)的影響,進(jìn)一步提高人臉識(shí)別的準(zhǔn)確率。
首先處理樣本訓(xùn)練庫,利用K-L變換提取低位特征空間,然后利用主成分分析法PCA提取已定位的人臉區(qū)域得到人臉特征,從而得到特征臉空間。Fisher線形判別方法(FLD)是在Fisher鑒別準(zhǔn)則函數(shù)去極值的情況下,求得一個(gè)最佳鑒別方向,然后從高位特征向量投影到該最佳鑒別方向上構(gòu)成一個(gè)一維的鑒別特征空間。將Fisher線性判別推廣到C-1個(gè)判決函數(shù)下,即:從N維空間向C-1維空間作相應(yīng)的投影,利用這個(gè)投影矩陣將訓(xùn)練樣本轉(zhuǎn)化為MEF空間并且獲得最佳描述特征,然后求出類內(nèi)散布矩陣與類間散布矩陣,取K個(gè)最大的特征構(gòu)成FLD投影矩陣,將最佳描述特征在FLD矩陣上投影,獲得最佳分類特征。然后將特征臉空間降維,接著對每個(gè)類的典型樣本進(jìn)行投影,得到各類樣本的投影特征得到該人臉特征庫,最后將待識(shí)別的人臉進(jìn)行PCA降維以及FLD分類器,在特征臉數(shù)據(jù)庫中尋求與該人臉歐氏距離最近的人臉圖像。
2 流程圖
3 步驟
3.1 訓(xùn)練人臉庫的數(shù)據(jù)處理
訓(xùn)練的人臉庫中共有P張M*N大小的人臉圖,將每一張圖片轉(zhuǎn)換成一個(gè)列向量,最后P個(gè)列向量合成一個(gè)M*N行P列的矩陣T。
3.2 特征臉的計(jì)算以及特征向量的選取
一幅大小為X*Y的圖像可表示為n(n=x*y)維空間中的一個(gè)點(diǎn),這個(gè)點(diǎn)的坐標(biāo)對應(yīng)著原圖中的一個(gè)圖像單元或者稱為像素。如果樣本空間共有M幅圖像,那么這M幅圖像對應(yīng)于n維空間中的M個(gè)點(diǎn),由于都是人類圖像,所以在圖像空間中是相互聚集在一個(gè)較近的鄰域中,我們利用K-L變換提取一個(gè)低位特征空間來表示每幅人臉圖像,從而得到特征臉空間。
得到由特征臉組成的降維子空間W后,每幅圖像向其投影,獲得的坐標(biāo)系數(shù)即為該圖像在該子空間的位置也就是該同學(xué)通過PCA變換的展開系數(shù),即:該圖像的代數(shù)特征,用于人臉識(shí)別的依據(jù)。因此在獲得特征臉空間后,通過對每個(gè)類的典型樣本進(jìn)行投影,得到各類樣本得到投影特征得到該人臉特征庫作為接下來匹配和識(shí)別的搜索空間。
步驟如下:
(1) 計(jì)算樣本差圖:[f=f-X]
(2) 在特征子空間上進(jìn)行投影:[y=WTf]其中[W=[w1,w2…wm]]
(3) 將y在特征搜索空間進(jìn)行匹配,以與特征自空間中最短歐式距離以及人臉閾值作為匹配準(zhǔn)則。降維后維數(shù)減少,但實(shí)際應(yīng)用中不是每一個(gè)特征向量都有保留的意義,在PCA運(yùn)算中,我們通常選取前m個(gè)特征值最大的特征向量,使得貢獻(xiàn)率[e=i=1mλii=1Mλi≥0.99]。
3.3 學(xué)習(xí)過程
(1) 假設(shè)有M個(gè)N維訓(xùn)練樣本的c類人臉庫[Xij(i=1,2,3...cj=1,2,3...m)],[Xij]表示第i類別的第j個(gè)標(biāo)本,利用改進(jìn)的PCA算法經(jīng)過灰度歸一化的樣本協(xié)方差矩陣進(jìn)行計(jì)算,最后得到PCA變換矩陣。
(2) 通過PCA變換矩陣將訓(xùn)練樣本集降維,轉(zhuǎn)化為MEF空間并提取最佳描述特征。
(3) 計(jì)算由訓(xùn)練集最佳描述特征向量構(gòu)建的類內(nèi)散布矩陣[Sw]和類間散步矩陣[Sb],計(jì)算[Sw-1Sb]的C-1個(gè)最大特征值對應(yīng)的特征向量,構(gòu)成FLD變換矩陣。
(4) 通過FLD變換矩陣將MEF空間轉(zhuǎn)換為K維的最佳鑒別特征空間,并獲得最佳鑒別分類特征,根據(jù)分類特征構(gòu)成人臉特征數(shù)據(jù)庫。
3.4 目標(biāo)識(shí)別
(1) 將某個(gè)待識(shí)別的目標(biāo)樣本人臉圖片X通過PCA變換得到m維空間中的最佳特征描述向量。
(2) 對最佳描述特征向量進(jìn)行FLD變換得到線性空間最佳分類特征向量。
(3) 尋找到和目標(biāo)樣本歐氏距離最近的特征數(shù)據(jù)庫中的人臉進(jìn)行識(shí)別。
4 評價(jià)與展望
PCA算法是無監(jiān)督學(xué)習(xí)法,屬于自動(dòng)聚類,一旦偏離方向會(huì)產(chǎn)生非常大的錯(cuò)誤;同時(shí)Fisher線性判別法屬于監(jiān)督學(xué)習(xí),但人臉識(shí)別屬于高維小樣本的問題,所以投影矩陣進(jìn)行降維后容易造成類內(nèi)散步矩陣奇異。為了得到最佳的鑒別向量,本課題的解決方案是基于改進(jìn)的主成分分析法PCA算法與Fisher線性判別相結(jié)合的方案,該方案比單純使用PCA算法或者FLD算法的識(shí)別效果都要好,利用人臉數(shù)據(jù)庫進(jìn)行測試,最終確定本文算法的識(shí)別率較高。缺點(diǎn)就是樣本訓(xùn)練時(shí)間和計(jì)算時(shí)間都一般,改進(jìn)的PCA算法具有灰度歸一化的能力,能夠克服光照對識(shí)別人臉的影響,但本解決方案仍然有待改進(jìn)的地方,例如:未達(dá)到實(shí)際應(yīng)用要求的樣本訓(xùn)練時(shí)間以及計(jì)算時(shí)間、人臉的校準(zhǔn)問題、年齡問題、遮掩等問題進(jìn)行研究,進(jìn)一步找到更有效的人臉識(shí)別方式。