摘要:Fisherface算法是由Ronald Fisher發(fā)明的,是一種基于人的臉部特征信息進行身份識別的生物識別技術?,F(xiàn)提出一種基于FisherFace算法的人臉識別方案,建立在人臉圖像預處理的過程已經完成的基礎之上,進行特征提取和匹配識別的操作。該方案基于LDA和PCA理論,是對原有數據進行整體降維進而映射到低維空間去的方法。
關鍵詞:FisherFace算法;PCA(主成分分析);LDA(線性判別分析)
0 ? ?引言
近年來,隨著科技的不斷進步,人臉識別技術在日常生活中有了非常廣泛的應用。Fisherface算法所基于的LDA理論和特征臉方法中用到的PCA理論有相似之處,都是對原有數據進行整體降維進而映射到低維空間的方法。然而,由于PCA這種方法存在著缺陷:圖像中所有的像素都被賦予了同等的地位,光照、角度、尺寸以及表情等因素都會導致識別率的下降。而LDA方法的計算過程要反復做矩陣運算,計算量會非常大,而且還容易引起累計誤差,非常影響計算的精度。因此,將PCA和LDA二者結合是一種值得期待的分類辦法[1]。
1 ? ?原理
本次方案采用的是PCA和LDA相結合的方法。PCA,主要用于數據降維,對于一系列樣本的特征所組成的多維向量,這些向量中的某些元素本身并沒有區(qū)分性。例如:某個元素在所有的樣本中都為1,或者與1的差距極小,那么這個元素本身就沒有了區(qū)分性,如果用它做特征來區(qū)分的話,貢獻就會非常小。因此,我們的目的就是要找出那些變化大的元素,也即方差大的那些維,從而篩除掉那些變化不大的維,使得留下來的那些特征都是“精品”,同時這也讓計算量變小了。
Fisherface方法實際上涉及的是維數壓縮的問題,如果能把多維特征空間上的點都投影到一條直線上,那么就能把特征空間壓縮成一維。問題的關鍵就是如何找到這條直線的方向,如果找得好的話,就會分得好;如果找得不好的話,就會都混在一起。因此,F(xiàn)isherface方法的主要目標就是:找到這個最好的直線方向以及實現(xiàn)向最好的方向投影的變換。這個投影變換恰恰就是所尋求的解向量W*,這就是Fisherface算法的基本問題[2]。
假設樣品訓練集和待測樣品的特征數為n。為了找到最佳的投影方向,需要計算出各類均值、樣品類內離散度矩陣Si、總類間離散度矩陣Sw以及樣品類間離散度矩陣Sb。根據Fisherface準則,找出最佳的投影準則,將訓練集內所有的樣品進行投影,使其投影到一維Y空間。因為Y空間是一維的,所以需要找出Y空間的劃分邊界點,找到邊界點以后,我們就可以對待測樣品進行一維Y空間的投影,進而判斷它的投影點與分界點的關系,從而將其歸類[3]。
綜上可知,F(xiàn)isherface方法的核心就是投影,該方法的一維實現(xiàn)可描述為:
(1)計算各類樣品均值向量mi,mi是各個類的均值,Ni是ωi類的樣品個數。
mi=X ? ?i=1,2,…,n
(2)計算樣品類內離散度矩陣Si和總類間離散度矩陣Sw:
Si=(X-mi)(X-mi)T ? ?i=1,2,…,n
Sw=Si
(3)計算樣品類間離散度矩陣Sb:
Sb=(m1-m2)(m1-m2)T
(4)求向量W*。我們希望在投影后,一維Y空間中的各類樣品能夠盡可能地分開,也就是希望兩類樣品均值的差m1-m2越大越好,同時也希望各類樣品內部能夠盡量密集,也就是希望類內的離散度越小越好。因此,可以定義Fisherface準則函數:
JF(W)=
使得JF(W)取得最大值的W*為W*=Sw -1(m1-m2)。
(5)將訓練集內所有樣品進行投影:
y=(W*)TX
(6)計算在投影空間上的分割閾值y0:
在一維Y空間,各類樣品均值i為:
i=y ? ? ?i=1,2,…,n
樣品類內離散度矩陣i2和總類間離散度矩陣w為:
i2=(y-i)2
w=i2
閾值y0的選取可以有不同的方案,較常見的一種是:
y0=
另一種是:
y0=+
(7)對于給定的X,計算出它在W*上的投影y。
(8)根據決策規(guī)則進行分類:
y>y0?X∈ω1
y 2 ? ?過程及結果 本次仿真方案使用ORL人臉數據庫,共40個類別(人),每類10張人臉圖像,其中9張用于訓練,存于TrainDataBase目錄下,另外1張用于測試,存于TestDataBase目錄下。因而訓練樣本圖像一共360個,測試樣本圖像一共40個。Matlab程序框圖如圖1所示。 3 ? ?操作過程及界面 輸入:程序運行時,會提示用戶輸入測試圖像的編號(40個人每人1張,共40張,打亂類別,隨機編號),用戶可根據提示輸入1~40中的任意一個,如圖2所示。 輸出:程序運行后,會在命令窗口給出識別結果,同時顯示測試圖像及測試圖像所屬類別下任意一張圖像,如圖3所示。 準確率:在方案設置的訓練樣本數和測試樣本數相同的情況下,本程序可實現(xiàn)完美識別,識別準確率100%,如圖4所示。 4 ? ?結語 本次方案用ORL人臉數據庫驗證了基于LDA和PCA理論的FisherFace算法的有效性。人臉識別系統(tǒng)主要包括四部分:人臉圖像采集及檢測、人臉圖像預處理、人臉圖像特征提取以及匹配與識別。本方案建立在前兩個過程已經完成的基礎上,進行特征提取以及匹配識別的操作。 [參考文獻] [1] 張雨婷,陳軍華,楊新凱,等.一種改進的PCA+LDA人臉識別算法[J].電腦知識與技術,2020,16(3):221-222. [2] 劉亮.基于PCA和LDA改進算法的人臉識別技術研究[J].無線互聯(lián)科技,2019,16(17):110-111. [3] 馬帥旗.改進PCA- LDA的人臉識別算法研究[J].陜西理工大學學報(自然科學版),2019,35(2):62-66. 收稿日期:2020-07-31 作者簡介:王麗娟(1990—),女,河南正陽人,講師,研究方向:應用數學。