任成娟
(寶雞文理學院 計算機科學系,陜西 寶雞 721000)
由于計算機人臉識別在管理、公共安全等領域有著巨大的應用前景,目前已成為人工智能和模式識別領域的一個研究熱點。特征提取是計算機人臉識別的核心步驟,子空間分析方法因其具有技術代價小、易實現(xiàn)、描述能力強和可分性好等優(yōu)點被廣泛地應用于人臉特征提取,成為目前人臉識別的主流方法之一。近年來許多研究成果表明,人臉圖像很可能位于一個非線性流形上。He等人提出了局部保持映射算法(Locality Preserving Projections,LPP)并將其成功地應用于人臉識別。提出一種奇異值分解的LPP_SIFT和巴氏距離相結合的人臉識別算法,利用奇異值分解的LPP_SIFT對樣本進行降維特征提取,以此保留有效的特征信息,降維的樣本進行巴氏距離迭代,這樣降低最小錯誤率上界,提高分類效果,提高人臉識別的識別率。
在n維人臉特征向量空間中,先驗概率相同的ij兩類正態(tài)分布時的巴氏距離uij()Bayes最小錯誤率εij上界的關系
n維人臉特征空間,類ij的類間散布矩陣:
n維人臉特征空間,類ij均值向量分別為Mi和Mj。
SIFT算法具有較好的魯棒性、準確的定位、可重復性強等優(yōu)點。對旋轉、尺度、光照等多種幾何不變性保持得很好,穩(wěn)定性高。但SIFT算法仍存在一些缺點如算法比較復雜,特征維數(shù)較高,導致圖像匹配時運算時間長、速度慢,很難滿足實時性要求[1-3]。為了達到降低特征維數(shù),降低計算復雜度,提高識別率的目的LPP_SIFT算法被提出。在本文,為了避免在特征選取過程中矩陣產(chǎn)生奇異,因此對矩陣進行奇異值分解,找到一個正交矩陣,將奇異矩陣投影到這個正交矩陣使其成為非奇異矩陣,以此解決LPP計算過程中的奇異值問題,從而提高算法的識別效果。
第1步,采用SIFT算法前面三步對訓練樣本提取特征點。圍繞N個特征點的周圍選取41*41圖像像素區(qū),接著求對應像素的水平和垂直方向梯度,如此就得到了特征矩陣中的一列向量。將一個特征點的3 042維高維梯度向量進行歸一化,然后計算特征矩陣,最后把高維向量映射到低維空間。
第2步,利用LPP算法為特征點構造鄰域圖和鄰接矩陣。用k-nearest neighbors找鄰居并且鄰居限制在類內。待每個樣本點尋找鄰居后,以每個樣本點xi為圖G的頂點i。在頂點i與頂點 j之間連接一條邊(權值 wij,如果 xi是 xj的鄰居或者xj是xi的鄰居)
第3步,求特征值。求如下廣義特征值問題:XLXTa=λXDXTa。本文提到的新方法是為了解決XDXT的奇異性問題。
對D1進行奇異值分解得:D1=U∧VT
其中,五個轉型包括:業(yè)務量快速增長時期已經(jīng)過去,開始向病種結構轉型;向??啤I(yè)特色凸顯方向轉型;醫(yī)療內涵質量向臨床能力轉型,真正體現(xiàn)診療能力;員工基本完成學歷學位教育,開始向素質能力上轉型;管理從院、科兩級負責制向院-科-組三級管理上轉型。“這六年,我們就是根據(jù)當時提的五個總體的轉型發(fā)展的需求和想法,逐步地推廣實施。”他說。
這里U和V是正交矩陣。Ur為單位正交矩陣。在進行LPP運算時,先將樣本xi∈Rm在矩陣Ur下投影得到UTrxi,然后再令yi=xTiUrz并最小化求解,等到新的目標函數(shù):
計算 (D)-1L的d個最小特征值對應的向量并且組成投影矩陣R。則原始的樣本數(shù)據(jù)轉化為
當空間維數(shù)很大時,利用巴氏距離進行特征提取非常困難。LPP能夠保留人臉的流型結構,降低圖像維數(shù)。本文把巴氏距離與奇異值分解的LPP結合進行人臉特征選擇。若m維特征空間中,存在Z個類別,且先驗概率相等,Bayes最小錯誤率上界可用巴氏距離表示為:
設 X=[x1,x2,x3,…,xn]T為人臉的特征矩陣,X 為需要變換降維的矩陣,根據(jù)結論可知采用迭代法求解特征選擇矩陣X。若迭代步長是λ,第r次迭代式是
1)參數(shù)初始設置
參數(shù)初始設置主要包括:巴氏距離與LPP結合識別率、訓練時間、測試時間、初始類數(shù)、每類訓練樣本數(shù)、每類樣本數(shù)、學習樣本總數(shù)、測試樣本總數(shù)等初始值設置。
2)從人臉圖庫中獲取圖片數(shù)據(jù)轉換成矩陣。
主要包括以下操作:定義圖像矩陣、從數(shù)據(jù)庫中讀訓練樣本、把讀取的訓練樣本轉換成數(shù)值矩陣、計算投影矩陣、讀測試樣本。
3)奇異值分解的LPP投影降維
構建領域圖,領域矩陣,求解特征值和特征向量,最后得到特征矩陣。
4)求測試樣本的和均值的差。
5)用巴氏距離求出數(shù)據(jù)與樣本哪個相近。
設置初始值,λ=0.01,γ=0.000 1為初始值;
a 利用公式(3)(4)(5)(6)分別求出對應樣本的的矩陣和均值;
b用3)步求出樣本的方差矩陣和k維復合矩陣,m維復合矩陣;
d 再把第(1)(2)(3)步中求得的數(shù)據(jù)代入(15);
f求識別率。
ORL圖像庫共40個人,每一個人10幅圖像。同一個人的不同圖像間只有一些細微差別,所有的圖像都面部朝外,且在同一黑色背景下拍攝而得。ORL圖像庫原始每一幅圖像的大小為112*92。本文采用雙線性插值將人臉圖片調整為64*64(圖1)。下面的實驗值均是10次實驗的平均值,每次每個樣本選擇5個圖像做訓練,5個圖像用做測試。
圖1 經(jīng)過調整后的部分樣本圖像(ORL人臉庫)Fig.1 Some cropped and resized sample images from ORL database
圖2 4種算法在ORL上的識別率對比Fig.2 Comparison of recognition rate four methods on ORL database
圖2 給出了SIFT、LPP_SIFT、BSLPP以及本文提出方法的識別率對比,維數(shù)的變化從5到55。表1給出了這4種算法最高識別率以及對應的維數(shù)(120)和訓練時間的對比。根據(jù)圖中曲線的變化本文所提出的算法取得了最好的效果。原因在于本文所提出的算法不僅保留了原算法的優(yōu)點,對人臉局部和流型結構的較好描述,關鍵在于利用巴氏距離對降維的樣本進行迭代,這樣降低最小錯誤率上界,所以識別率有所提高,對人臉局部的變化具有較好的魯棒性和穩(wěn)定性。奇異值分解的LPP_SIFT和巴氏對距離算法在人臉識別中的結合使得識別率和運行時間均有一定程度的提高。正如得到的表1的情況一致。
表1 4種算法在ORL數(shù)據(jù)庫上的數(shù)據(jù)對比Tab.1 Comparison of on data four methods on ORL database
經(jīng)過許多研究表明,LPP_SIFT算法在人臉識別中已經(jīng)得到了成功的運用,但是LPP算法在特征的提取過程中容易遇到奇異問題。針對這個缺點,文本把奇異值分解的LPP_SIFT算法和巴斯距離相結合,經(jīng)過實驗表明,本文所改進的方法,在一定程度上,對識別率以及訓練時間都有所提高,進而說明了改進方法的有效性。
[1]Rao A S,Georgeff M P,Allen J,et al.Modeling rationalagent swithin a BDIarchitecture[J].Proceedings of KR..91.Morgan Kaufman Publ ishers,1991:473-484.
[2]Yan K,Rahul S.PCA-SIFT:A more distinctive representation for local image descriptors[C]//CVPR 2004:Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition.Piscataway, NJ:IEEE Press,2004:506-513.
[3]Stefan Z,Alexei E.Detection of multiple deformable objects using PCA-SIFT [C]//AAAI-07/IAAI-07:Proceedings of National Conference on Artificial Intelligence.New York:AAAI Press,2007:1127-1132.
[4]Balasubramanian V,Ye J,Panchanathan S.Biased manifold embedding:a frameworkfor person independent head pose estimation[C].IEEE Conference on Computer Vision and Pattern Recognition,2007:1-7.
[5]YU Wei-wei.Face recognition using discriminant locality preserving projections[J].Image and Vision Computing,2006,24(3):239-248.
[6]Yang D,Andrzej S.Performance evaluation of lowdimensional SIFTs[C]//ICIP 2010:Proceedings of 2010 IEEE International Conference on Image Processing,Piscataway,NJ:IEEEPress,2010:2729-2732.
[7]Deutsch D.Quantum Theory,the Church-Turing Principle and the Universal Quantum Computer[J].Proceedings of the Royal Societ y,Series A,400:97-117.
[8]Van Linder B,vander Hoek W,Meyer J-J C.Seeing is believing (and so are hearin g and jumping)[J].Journal of Logic, Language and In format ion,1997(6):33-61.
[9]侯一民,孫嘉兵,張宇.基于小波包降噪和Hilbert譜奇異值的滾動軸承故障診斷[J].陜西電力,2013(11):41-44.HOU Yi-min,SUN Jia-bing,ZHANG Yu.Fault diagnosis of rolling bearing based on wavelet packet denoising and Hilbert specetum singular valeu decomposition[J].Shaanxi Electric Power,2013(11):41-44.