西南交通大學電氣工程學院 鐵俊波 朱俊星 黃 進 唐蘭君
基于輪廓檢測的眼睛定位方法
西南交通大學電氣工程學院 鐵俊波 朱俊星 黃 進 唐蘭君
此文是西南交通大學2009年國家創(chuàng)新性實驗計劃項目研究成果,受全國大學生創(chuàng)新性實驗計劃項目資金資助,項目名稱:人臉識別相關核心技術研究及系統(tǒng)實現(xiàn),項目編號091061309
人臉識別是模式識別學科的一大研究熱點,廣泛地應用于保密系統(tǒng)、可視電話系統(tǒng)以及人機交互系統(tǒng)等領域。眼睛定位是人臉識別中一個重要的信息,本文根據(jù)人臉中眼睛的灰度及形狀信息,提出了一種新的,基于輪廓檢測的眼睛定位算法。實驗結果表明此算法具有較好的準確性和可行性。
人臉識別 眼睛定位 算法
人臉識別在保密系統(tǒng)、可視電話系統(tǒng)以及人機交互系統(tǒng)等領域有著廣泛的應用前景。
眼睛作為人臉的重要特征,在人臉檢測和識別中都發(fā)揮著重要的作用。目前人臉識別常用方法大致分為基于幾何特征、基于代數(shù)特征的識別和基本神經(jīng)網(wǎng)絡的識別方法。近年來,研究眼睛定位算法較多,主要有區(qū)域分割法、灰度投影法等,區(qū)域分割法首先對人臉的二值圖像進行區(qū)域分割, 然后設定一系列經(jīng)驗值和支持函數(shù)定位眼睛; 灰度投影法對人臉圖像進行水平和垂直方向的投影,根據(jù)波峰、波谷的分布信息來定位眼睛;邊緣提取法首先對人臉圖像進行邊緣提取, 然后用霍夫變換檢測眼球,構造一個眼部模板,用一系列函數(shù)從能量角度找出眼睛;統(tǒng)計學習法將人眼區(qū)域看作一類模式,使用大量不同條件下的人眼與非人眼樣本, 借助統(tǒng)計分析理論和機器學習方法提取人眼共有的一些特征, 實現(xiàn)人眼檢測。上述方法都取得了一定的成功,但普遍存在收斂速度慢、計算量大、定位不夠準確等缺陷。
本算法根據(jù)眼睛的兩大結構特征:①在人臉中具有對稱性;②其灰度值集中在某個區(qū)域,提出了一種結合人臉中眼睛的灰度及面積信息的人眼定位新算法,并具體實現(xiàn)。
1. 濾除噪聲
通過攝像頭得到的圖像中,一般含有一定的噪聲,為了在后面的眼睛定位中得到更好的效果,在一開始,使用了canny濾波,濾除了一定的噪聲。
2. 基于整個圖像的灰度值對圖像進行二值化
圖像二值化的目的是使眼部區(qū)域凸顯出來,而圖像二值化處理的關鍵是閾值的選擇,閾值選擇的原則是選擇和眼睛較為接近的灰度值,本文選擇一種可變的閾值。
如果將整幅灰度圖像的灰度值從大到小排成數(shù)列:
其中,“T-N,”代表最小的灰度值,“TN,”代表最大的灰度值,我們定義T0為整幅圖的平均灰度值,則為