段 萍 ,楊 龍 ,劉祥樓
(東北石油大學(xué)電子科學(xué)學(xué)院,黑龍江大慶市163318)
隨著信息化技術(shù)、計算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,可視化的人臉圖像資源將變得越來越多。建立快速高效的人臉圖像檢索機(jī)制,己經(jīng)成為電子信息領(lǐng)域內(nèi)亟待解決的問題。人臉圖像檢索在公安(罪犯識別等)、安全驗證系統(tǒng)、、醫(yī)學(xué)、檔案管理、人機(jī)交互系統(tǒng)等方面有巨大的應(yīng)用前景,是當(dāng)前模式識別和人工智能領(lǐng)域的一個研究熱點和極富挑戰(zhàn)性的課題?;谡Z義描述的人臉圖像檢索方法,吸取了人臉分割、特征分類、語義檢索等方法的優(yōu)點,通過對面部器官的幾何特征點檢測來設(shè)定不同的面部器官形狀特征參數(shù),建立語義化的圖像特征數(shù)據(jù)庫,使之建立的語義人臉圖像檢索系統(tǒng),具有快速、高效、實用的特點。而眼睛作為臉部特征的重要組成部分,是人臉上最顯著,最穩(wěn)定的特征,對于人臉信息的處理具有重要的意義,不僅可以提高人臉識別和檢測的速度,而且能夠降低識別算法的復(fù)雜度。當(dāng)前學(xué)術(shù)領(lǐng)域關(guān)于眼部特征提取的研究有很多,主要涉及眼部特征提取的各個環(huán)節(jié),如人眼定位,人眼區(qū)域分割,人眼特征提取等。在此對這些主要常見的方法進(jìn)行分析和討論,最后對基于眼部特征語義化圖像檢索的發(fā)展和應(yīng)用做一個簡單的展望。
人眼特征提取技術(shù)在人臉識別和人眼虹膜識別系統(tǒng)中都占有十分重要的地位,但無論是在那種圖像檢索系統(tǒng)中的應(yīng)用,其人眼特征提取技術(shù)主要是由人眼定位,人眼區(qū)域分割,人眼特征提取3個方面。
要想得到人臉眼間帶狀區(qū)域,首先得定位出雙眼的位置來。眼睛定位在人臉識別中具有非常重要的地位,于是人們研究各種算法來實現(xiàn)眼睛定位,目前,眼睛定位算法主要是利用待檢測圖像中的灰度、紋理、眼睛形狀或輪廓特征定位眼睛,如基于輪廓檢測的眼睛定位算法[1]和基于灰度投影或改進(jìn)的灰度投影法[2,3]等。文獻(xiàn)[1]根據(jù)眼睛的灰度及輪廓結(jié)構(gòu)特征在人臉中的對稱性和灰度值的集中區(qū)域,提出了一種結(jié)合人臉中眼睛的灰度及面積信息的人眼定位新算法。文獻(xiàn)[2]在計算圖像水平方向灰度投影時,加入像素點的位置方差特征,準(zhǔn)確地找出了眼睛的水平位置,更加精確地定位眼睛坐標(biāo)。文獻(xiàn)[3]則提出利用二維的方式進(jìn)行人眼定位的方法,重新建立了基于區(qū)域的人眼窗口投影模型,給出了區(qū)域投影函數(shù)(RPF)的描述,根據(jù)區(qū)域內(nèi)灰度分布特性實現(xiàn)了人眼粗定位和精定位。
邊緣特征分析法是利用圖像的垂直灰度投影曲線,根據(jù)凸峰寬度和人臉區(qū)域的水平灰度投影曲線預(yù)測選定人眼在眉眼區(qū)域的大概位置,通過檢測眉眼部位的邊緣及邊緣分組,確定雙眼的坐標(biāo)位置。
對眼睛的定位Jian_Hong Hu[4]等提出Sobel算子法,對人臉區(qū)域的灰度圖用Sobel濾波器進(jìn)行水平邊緣檢測,Sobel算子對于象素的位置的影響做了加權(quán),因此效果更好,使用的Sobel算子:
如果用一個正方形作模板,使其在利用Sobel算法處理后生成的梯度圖像中移動,求出正方形大小范圍像素值的和,因此在圖像左上和右上1/4區(qū)域內(nèi),像素值的和最大的正方形對應(yīng)的位置,就是左右眼位置,即可把左右眼分割出來。
對于構(gòu)造正方形模板。根據(jù)人臉“三庭五眼”的比例,人眼寬度大致為臉寬的五分之一,因而選取的正方形的邊長為臉寬的五分之一,設(shè)其為x,則濾波算子如下:
利用Sobel算子法對人臉眼間帶狀區(qū)域圖像進(jìn)行五官分割,利用人臉眼間帶狀區(qū)域二值圖的邊緣圖,可以有效地把頭發(fā)及衣物的干擾完全去除。
2.3.1 眼睛的幾何模型
由于自然的多樣性,沒有兩個人的眼睛是完全一樣的,根據(jù)人眼的形狀不同,人們用了許多簡潔而形象化的詞語來描述它們,稱之為眼睛的語義特征。例如眼睛的大小不同,上眼皮的單雙形狀不同,內(nèi)眼角之間距離不同,眼珠的橢圓化程度不同等等。通過進(jìn)一步分析和處理,在得到了眼睛的形狀和邊緣輪廓等關(guān)鍵特征后,就能找到眼睛所對應(yīng)的幾何位置,并由此定義一些眼睛形狀特征參數(shù),將眼睛形狀的分類用參數(shù)值的不同范圍來表示[6]。眼睛的幾何模型如圖1所示。
a、c表示人眼睛內(nèi)外眼角,b、d表示人眼睛得上下邊緣,求的眼睛邊緣點參數(shù)便可得兩眼之間距離的長短;眼珠的長徑和短徑;眼珠的圓度;旋轉(zhuǎn)傾斜程度等形狀參數(shù),而這些形狀參數(shù)能在一定程度上反映出眼睛的基本形狀特征。
2.3.2 眼睛特征的提取
對于眼睛特征的提取,國內(nèi)外學(xué)者提出了許多算法。其中最常用的是基于模板匹配的算法和基于特征點的算法?;谀0迤ヅ涞乃惴ㄊ且x一個眼睛模板,基于特征點的算法則是定位眼睛特征點,例如眼睛角點,然后利用特征點構(gòu)造出眼睛輪廓。還有一類算法將模板匹配和特征點信息相結(jié)合,這類算法具備特征點和模板匹配的優(yōu)點,如一種改進(jìn)Snake眼睛輪廓提取算法和基于梯度估計的眼睛角點提取算法[7]和一種改進(jìn)的Canny邊緣檢測法[8]。
對人眼區(qū)域圖進(jìn)行Canny邊緣檢測,檢測出的邊緣圖。然后進(jìn)行垂直積分投影,根據(jù)垂直積分投影曲線,如圖2所示,可以分別確定左右眼的最左、最右邊緣點。
圖1 眼睛的幾何模型
圖2 眼部邊緣圖的垂直積分投影曲線
由左眼最右邊緣點及右眼最左邊緣點的水平坐標(biāo)可求出兩眼中心點的水平坐標(biāo),然后以把人眼邊緣圖一分為二成左眼邊緣圖和右眼邊緣圖,分別對左右眼邊緣圖作水平積分投影,可確定左眼及右眼的最上邊緣點和最下邊緣點。
目前人臉圖像檢索領(lǐng)域研究發(fā)展的新趨勢是基于語義的圖像檢索,而為了克服傳統(tǒng)人臉圖像檢索理論研究中的難點,同時使人臉圖像檢索技術(shù)能夠進(jìn)一步實用化,在針對語義圖像檢索理論研究的基礎(chǔ)上,優(yōu)化人臉分割、特征分類、語義檢索等各環(huán)節(jié)的方法,力求避開圖像之間繁瑣的匹配處理過程,探索基于語義描述的特定人臉圖像檢索的新方法。而眼睛作為臉部特征的重要組成部分,通過對面部器官眼睛的幾何特征點檢測來設(shè)定不同的形狀特征參數(shù),建立語義化的圖像特征數(shù)據(jù)庫,使之所建立的語義人臉圖像檢索系統(tǒng)更加快速、高效、實用。
[1]鐵俊波,朱俊星.基于輪廓檢測的眼睛定位算法[J].人工智能及識別技術(shù),2010,20(6):5572-5573
[2]王錕,田翔.一種改進(jìn)的基于灰度投影的人眼定位算法[J].科學(xué)技術(shù)與工程,2011,16(11):3845-3847
[3]王文成,常發(fā)亮.一種基于區(qū)域投影的人眼精確定位方法[J].光電子·激光,2011,22(4):618-622
[4]HU J,WANG R.Compression of personal identification pictures using vector quantization with facial feature correction [J].Optical Engineering,1996,35(11):198-203
[5]肖發(fā)遠(yuǎn).證件照片的臉部對象分割與檢索研究[D].上海:上海大學(xué),2005:25-32
[6]陳粟.基于語義描述的特定人臉圖像檢索[D].合肥:中國科學(xué)技術(shù)大學(xué),2005:18-43
[7]黎云漢.人臉特征提取與跟蹤[D].杭州:浙江大學(xué),2008:41-46
[8]張明.基于語義特征的人臉特征提取方法的研究[D].東北石油大學(xué),2011:18-21