侯文濤,林嘉宇
(國防科學技術大學電子與通信工程學院,長沙410073)
人臉檢測作為計算機視覺的一個重要分支,廣泛應用于身份驗證、智能監(jiān)控等領域。常見人臉檢測方法[1]有:基于幾何特征的方法、基于膚色模型的方法和基于統(tǒng)計理論的方法。以上三種方法性能各異,在特定的條件下都能取得較好的效果。當然缺點也不容忽視,比如基于幾何特征的方法在簡單背景正面人臉情況下效果較好;基于膚色模型的方法對光照強度比較敏感;基于統(tǒng)計理論的方法需要前期訓練。
基于核回歸法的人臉檢測方法有三個顯著的優(yōu)點:一是對光照敏感性低;二是無需先期統(tǒng)計訓練;三是檢測快、易實現(xiàn)。
相對于通過處理觀察所得的數(shù)據(jù)而確定信號模型參數(shù)的參數(shù)法,核回歸法是一種非參數(shù)估計方法,主要特點[2]:回歸模型完全由數(shù)據(jù)驅動,適應能力強,穩(wěn)健性高。
非參數(shù)回歸方法一般回歸模型如下:
其中Yi為從觀測點xi得到的觀測值,m(xi)是未知回歸函數(shù),εi是獨立同分布零均值噪聲。非參數(shù)估計就是通過已知的Yi估計出回歸函數(shù)。
非參數(shù)回歸方法一般包括局部回歸和正交回歸,局部回歸又可分為核回歸、局部多項式回歸、近鄰回歸和穩(wěn)健回歸。本文采用的是核回歸法(NW估計),其一般形式為:
N-W估計實際上是一種簡單的加權平均估計,上式中m^Hi(x)表示估計值,Yi代表像素點灰度值,xi是一個2 ×1 像素點坐標,i=1,2,3...p2(p為選擇的采樣窗口大小)。特別指出,上式中KH(xix)就是核回歸法的關鍵—核函數(shù),其值與H和xix有關。H是2×2光滑矩陣,所謂“光滑”就是保證估計得到m^H(x)逼近真實的回歸函數(shù)m(x)。
在使用核回歸法計算時,先逐次選取原始數(shù)據(jù)中連續(xù)的局部數(shù)據(jù),而后通過核函數(shù)計算得到局部數(shù)據(jù)點的權,最后通過加權平均求和得到估計值m^H(x),這也是稱之為局部回歸的原因。
與圖像降噪、修復的常用方法比較,核回歸法除了利用圖像的表面信息之外,還根據(jù)每個數(shù)據(jù)點的重要性給其復“權”,從而達到更理想效果。
目前,已經(jīng)廣泛使用的人臉檢測方法在提取圖像特征時,立足點都集中在諸如膚色特征、幾何特征、統(tǒng)計特征等方面。當然,核回歸方法應用到人臉檢測技術時,問題的焦點也在于如何有效提取圖像特征。
觀察(2)式,WHi(x)是直接從局部窗口數(shù)據(jù)計算得到的權數(shù)據(jù)。顯而易見,圖像內容不同對應的是像素數(shù)據(jù)不同,不同像素數(shù)據(jù)計算得到的權也是不同的,那么這個“權”是否可以作為圖像的特征進行提取,從而進行匹配呢?沿著這個思路進一步研究,發(fā)現(xiàn)這是一個將核回歸法應用到人臉檢測方面的可行途徑。首先,把要提取的圖像特征命名為“權特征”,下面介紹具體的做法。
在核回歸法中,權的計算公式是:
顯然,計算“權”的問題需要處理的關鍵是核函數(shù)選擇。一般情況下,核函數(shù)的選取要滿足諸多要求,通常都選擇高斯核。
在介紹高斯核之前,先對其進行說明,根據(jù)[5]和[6]研究,H作為2×2光滑矩陣主要目的是保證估計得到值與實際數(shù)值差距盡量小,而且H矩陣要在圖像變化劇烈的區(qū)域對核影響要大,變化平緩的區(qū)域對核的影響要小,所以文獻中給出H矩陣形式為:
其中,h是全局光滑參數(shù)[3],它的選取要滿足非參數(shù)估計法中的缺一交叉驗證方法(leave-one-out cross validation,CV)。Ci是水平和垂直兩個方向梯度的協(xié)方差。下面,寫出高斯核函數(shù)的具體形式:
xi是圖像像素點坐標且為列向量,Ci的計算參見文獻[7]。至此,聯(lián)合公式(3)和(4),就得到了“權特征”計算的具體形式。
上一小節(jié)中建立了“權特征”模型,具體到怎樣利用該模型進行人臉檢測,就是下面的主要內容。
人臉檢測的兩個關鍵步驟是特征提取與特征匹配。提取特征可以利用“權特征”模型,其余需要研究的問題就是匹配了。在進行匹配研究之前,我們先對提取的“權特征”進行分析。在第二節(jié)中已經(jīng)強調所謂的“權”是局部數(shù)據(jù)點的“權”,因此需要一個固定大小的采樣窗口(設為P)在水平和垂直方向上逐次計算圖像的局部“權特征”,并將每個窗口數(shù)據(jù)點對應的“權”值按照一定順序存儲為一個列向量,如此一來,圖像中包含的窗口數(shù)(設為圖像中包含的窗口數(shù))就對應列向量個數(shù),將這些列向量合并為一個矩陣(n×P2),這就得到了圖像的“權特征”。
理解了“權特征”的具體形式,可以看出特征匹配問題就是矩陣相關問題。矩陣相關問題類似于向量相關[8],可以通過定義兩個矩陣之間的Frobenius內積來衡量它們之間相關程度。設兩個權特征矩陣F1,F(xiàn)2∈RP2×n,則 F1,F(xiàn)2的內積為:
如果F1,F(xiàn)2的內積值越接近1則表示它們所代表的圖像塊相似度越高。至此,基于核方法的人臉檢測原理已基本介紹完畢。下面給出具體實現(xiàn)步驟:
假設人臉模板圖像為Q,待檢測圖像為T(為了方便實驗進行,可使圖像Q大小與圖像T中人臉大小相近),選定的窗口大小為5×5,即P2=52=25。下面,給出編程實現(xiàn)的步驟:
(1)對圖像Q和T進行規(guī)范化處理,使之水平和垂直方向的像素數(shù)都是窗口數(shù)5的倍數(shù)且余2。
(2)分別計算Q和T的“權特征矩陣”WQ,WT。
(3)采用PCA(主分量分析法)對WQ,WT進行降維得到 FQ,F(xiàn)T。
(4)將FQ,F(xiàn)T沿水平和垂直方向逐點進行匹配檢測。
(5)在圖像中標記符合匹配條件的人臉位置。
為了檢驗該方法效果,任意選取一個模板人臉圖像,如圖1。在四種不同情況下進行實驗,下面逐一進行說明。
圖1 模板人臉
(1)分辨率較高的簡單背景圖像檢測
從實驗結果看,簡單背景圖像人臉檢測效果較好,圖2的3張人臉均被檢測得到。
圖2 簡單背景圖像(800×630,72dpi)
圖3 簡單背景圖像人臉檢測效果
(2)分辨率較高的復雜背景圖像檢測
從實驗結果看,復雜背景人臉檢測效果也較好。圖4的32張人臉均被檢測得到,說明該方法檢測準確率較高。
圖4 復雜背景圖像(1600×920,72dpi)
圖5 復雜背景圖像人臉檢測效
(3)逆光和曝光補償圖像檢測對比
從實驗對比結果看,該方法在逆光(即人臉區(qū)域光照低)情況下,仍然有較好的檢測效果,說明該方法的檢測效果受光照影響較小。如圖6-圖9所示。
圖6 逆光拍攝圖像(600×800,72dpi)
圖7 逆光拍攝圖像人臉檢測效果
圖8 逆光拍攝時加閃光(600×800,72dpi)
圖9 逆光拍攝加閃光人臉檢測效果
(4)降低分別率的圖像檢測
從圖10-圖11的實驗對比結果看,降低圖像分辨率后有漏檢情況出現(xiàn),分析原因在于降低分辨率后,單位面積的像素點變少,可利用的“權特征”信息相對變少,從而會出現(xiàn)漏檢情況。
圖10 圖2的降質圖像(556×441,50dpi)
圖11 圖2的降質圖像檢測效果
從前面的介紹來看,基于核回歸法的人臉檢測模型原理簡單,易于理解。從實驗結果看,該方法有三個明顯特點:①檢測準確率較高;②對光照敏感度低;③在復雜背景下的檢測性能較好。
當然,和其它人臉檢測技術相比較,該方法雖然具有一些不錯的性能,但是仍然有不盡如人意的方面,比如:①在實驗時,高斯核函數(shù)的參數(shù)選取一定程度上要依賴實驗經(jīng)驗;②該方法僅僅依賴圖像的數(shù)據(jù)特征—“權特征”,當圖像分辨率低時,會有誤檢情況。以上這些方面都將作為下步工作研究的重點,盡量使該方法進一步完善,使之更為有效。
[1] 黃福珍,蘇劍波.人臉檢測[M].上海:上海交通大學出版社,2006.
[2] L Wasserman.現(xiàn)代非參數(shù)統(tǒng)計[M].吳喜之,譯.北京:科學出版社,2008.
[3] Wand M P,Jones M C.Kernel Smoothing[C].Monographs on Statistics and Applied Probability,New York:Chapman & Hall,1995.
[4] Hardle W,Muller M,Sperlich S,Werwatz A.Nonparametric and Semiparametric Models[C].Springer Series in Statistics.New York:Springer,2004.
[5] Hiroyuki Takeda,Sina Farsiu and Peyman Milanfar.Kernel Regression for Image Processing and Reconstruction[J].IEEE TRANSACTIONS ON IMAGE PROCESSING,2007,16(2):349-366.
[6] Ruppert D,Wand M P.Multivariate locally weighted least squares regression[J].Ann.Statist,1994,22(3):1346-1370.
[7] Feng X,Peyman Milanfar.Multiscale principal components analysis for image local orientation estimation[C].presented at the 36th Asilomar Conf.Signals,Systems and Computers,Pacific Grove,CA.2002.
[8] Ma Y,Lao S,Takikawa E,Kawade M.Discriminant Analysis in Correlation Similarity Measure Space[J].Proc.Int’l Conf.Machine Learning,2007,227:577-584.
[9] Hae Jong Seo,Peyman Milanfar.Training-Free,Generic Object Detection Using Locally Adaptive Regression Kernels[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2010,32(9):1688-1704.
[10] Viola P,ones M.Robust Real-Time Object Detection[J].Int’l J.Computer Vision,2004,57(2):137-154.
[11] 劉向東,陳兆乾.人臉識別技術的研究[J].計算機研究與發(fā)展,2004,41(7):1074-1080.
[12] 孫德山.支持向量機分類與回歸方法研究[D].長沙:中南大學博士學位論文,2004.