熊海涵
(成都理工大學 信息科學技術(shù)學院,四川 成都 610059)
目前 Gabor展開和變換被認為是信號與圖像表示的最好方法之一。在給定綜合窗下如何求解分析窗和Gabor變換系數(shù)是 Gabor變換中要解決的最基本問題。但是為了使Gabor變換的計算更加簡單,人們提出了另一種實數(shù)形式的離散Gabor變換方法(簡稱RDGT),此方法并可運用快速離散Hartley變換算法去計算Gabor變換系數(shù),因為實數(shù)形式的離散Gabor變換系數(shù)和復數(shù)形式的離散Gabor變換系數(shù),它們的實部和虛部有著十分簡單的加減關(guān)系,前者的計算與后者的計算是完全可以替代的,這樣就使得Gabor復變換系數(shù)的計算量得到了大大的簡化;復數(shù)形式的離散Gabor逆變換比實數(shù)形式離散Gabor逆變換慢得很多,而且,實值Gabor變換在實際應用中更加方便于軟件與硬件的實現(xiàn)。
人臉圖像中,眼睛部位的灰度值與周圍環(huán)境的灰度值有明顯的差異,眼睛區(qū)域周圍其灰度值是最小的,我們可以利用此特征并使用積分投影的方法來定位眼睛。積分投影函數(shù)是我們最為常見的投影函數(shù)之一。假設 R(x,y)對應表示點(x,y)處像素灰度值,垂直積分投影函數(shù)與水平積分投影函數(shù)在區(qū)間[x1,x2]和[y1,y2]內(nèi)的分別表示為 Sv(x)和Sh(y),那么Sh(y)和Mh(y)的值也會體現(xiàn)圖像中某一行像素的灰度值的變化,因此,圖像中的特征就通過對積分投影函數(shù)值的分析得到了提取。
人臉圖像中眼睛區(qū)域的灰度特征與其它部位有明顯的不同,積分投影能讓我們很容易得到眼睛部位所在的大致位置。假設被處理圖像為R(x,y),圖像的大小為M×N,則該圖像的水平灰度投影函數(shù)可以用如下的公式表示:
其中ph(y)為水平灰度投影曲線。
垂直投影函數(shù)可以表示為
pv(x)反應灰度的垂直投影,我們稱為垂直灰度投影曲線。垂直灰度投影曲線中,因為頭發(fā)的低灰度產(chǎn)生了水平投影曲線的低谷,所以可以確定人的頭頂部分位于前段谷區(qū)域;人的額頭部位與鼻中部在該曲線的最大值點與次最大值點分別得到了體現(xiàn)。人眼位置對應于曲線中的最大值點和次最大值點之間的低谷,因此人眼所處的大致水平位置即對應人臉圖像中最大值點和次最大值點之間的那部分圖像。利用該特性就可以將原來的人臉圖像縮小到基本上只有眉毛和眼睛的圖像區(qū)域。
利用上述垂直積分投影已經(jīng)可以將范圍縮小到眉眼區(qū)域,去除臉部鼻子和嘴巴周期的干擾。如果在此基礎(chǔ)上進行水平積分投影的話,均勻的灰度曲線就不會形成。因為眉毛和眼睛的灰度在垂直位置上明顯比周圍低,波谷在眼睛和眉毛重合的地方也就會形成得比較明顯。 眼睛的垂直位置得到定位之后要縮小查找眼睛的范圍,要想找到準確的眼睛位置就必須沿著該垂直位置進行查找。
上述方法結(jié)合了現(xiàn)有的眼睛定位技術(shù),創(chuàng)新的選擇運用Gabor小波濾波消除孤立點和光線的影響,為定位打下了良好的基礎(chǔ)。利用灰度積分即可確定眼睛所在的垂直位置,進一步縮小了查找范圍,最后精確定位人眼的位置。該方法總體實現(xiàn)起來比較簡單,且運算速度快,計算復雜度較低。但是不足的是該方法相對于有較大偏轉(zhuǎn)角度和復雜背景的情況定位不夠理想,所以這方面也將是下一步的研究重點。
本實驗大部分采用Yale人臉數(shù)據(jù)庫和ORL人臉庫:Yale人臉數(shù)據(jù)庫由耶魯大學計算視覺與控制中心創(chuàng)建,包含 15位志愿者的165張圖片,包含光照,表情和姿態(tài)。英國劍橋大學的Olivetti研究中心的圖像庫(ORL),其中這個圖庫包含了40個人,每個人有10張圖片,分別對應不同的表情,光照、姿態(tài)、人臉圖之間的差別較大。
實驗中所處理的圖像為灰度圖,為了實現(xiàn)其廣泛性,我采用了電腦中隨機的兩張生活照片和yale人臉圖像,然而找到的圖像數(shù)據(jù)量比較大,所以我將其中兩張圖片拿出來做實驗,并選擇圖像的面部,從而可以大大減少matlab的運算量和運算時間。如果采用的圖像為真彩色的,在使用之前先做了一些處理轉(zhuǎn)化為灰度圖像。
為了證明該方法的普遍性和說服力,同時也隨機調(diào)取了yale人臉圖片庫的人臉圖片進行實驗,隨機列舉以下兩張人臉圖片和對應的實驗結(jié)果。
經(jīng)過Gabor濾波后和定位后的圖像:
本文提出了基于 Gabor小波濾波然后灰度積分投影計算人眼區(qū)域算法。通過在Yale人臉庫和實際采集圖像的實驗證明,該算法有以下優(yōu)點:(1)根據(jù)人眼區(qū)域的豎直梯度圖像特性,較為準確的檢測到人眼的縱坐標。(2)使用Gabor濾波器強化了人眼眉毛區(qū)域信息,并弱化了其它部分信息。實驗證明本文提出的定位方法能快速可靠的定位人眼。
本實驗采用的是英國劍橋大學 Olivetti研究中心和Yale人臉庫中的人臉圖像庫。平均每幅圖像約需在PC 機上用Matlab 仿真,一幅圖片的處理時間約為0.7666s。
表1 算法時間測試比較
表2 在ORL人臉庫和Yale人臉庫上的實驗結(jié)果
從結(jié)果可以看出,本文所提出的方法,定位準確,而且速度優(yōu)于現(xiàn)有的其他常用算法,為后續(xù)的其它處理奠定了堅實的基礎(chǔ)。
[1]薛玉利. 基于 Gabor變換的特征提取及其應用,碩士學位論文,山東,山東大學,2004年.
[2]岡薩雷斯,數(shù)字圖像處理第二版,電子工業(yè)出版社,2008年11月.
[3]周開利,鄧春暉,MATLAB基礎(chǔ)及其應用教程。北京大學出版社,2007年3月第一版,157-209
[4]John G.Daugman.High Confidence Visual Recognition oPersons by a Test of Statistical Independence[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1993,15(11):1148-1161.