武曉勇 王鵬 亢衡 崔家禮
摘要:人眼作為面部的主要特征,對其形狀分類可以為身份識別(如虹膜識別和人臉識別)等應用提供非常重要的信息,而聚類為分類提供依據。本文提出了一種眼睛形狀聚類算法,該算法分為以下幾大部分:第一部分確定眼睛輪廓,對輸入人眼圖片進行關鍵點檢測;第二部分根據輪廓點對能夠描述人眼形狀的相關特征進行提??;最后,通過K-means聚類算法對提取的特征進行聚類。算法共得到7個眼睛形狀聚類。
關鍵詞:虹膜識別,關鍵點檢測,特征提取,眼睛形狀聚類
1 引言
隨著機器視覺、人工智能等領域技術的飛躍,IT行業(yè)進入了認知時代[1],虹膜識別、刷臉支付等生物特征識別技術出現(xiàn)在日常生活中。與傳統(tǒng)的身份驗證方法(身份證件、銀行卡、口令等)相比,生物特征有不易復制,不易丟失等顯著優(yōu)點[2]。
眼睛作為具有高度辨識性的面部器官之一,在虹膜識別和人臉識別等領域起著關鍵的作用。在虹膜識別中,眼睛檢測是預處理的第一步,也是至關重要的一步。大型的面部特征數據庫能夠根據人眼形狀劃分為多個子面部特征數據庫,從而為縮小身份搜尋范圍提供極其有效的信息,在此基礎上進行人臉識別將會大幅提高識別速度[3-5]。在此背景下,基于關鍵點的眼睛形狀聚類算法實現(xiàn)有著深遠的應用前景和研究價值。
2 算法流程
在通過神經網絡等方法進行人眼檢測后,基于關鍵點的眼睛形狀聚類算法總流程包括輪廓點檢測、特征提取與眼形聚類幾個主要步驟。人眼輪廓點的位置信息為后續(xù)特征提取及眼形聚類提供了數據支持。
2.1確定眼睛輪廓
本文采用AlexNet模型,AlexNet具備5個卷積層和3個全連接層[14]。
(1)卷積層
卷積層共有5層。在后續(xù)參數優(yōu)化過程中,一個卷積核與一個差值相映射,即本卷積層里每個卷積核與上層輸入的每個偏差值相映射。
(2)全連接層
全連接層共有3層,上一層輸出的特征圖與本層全連接,本文采用tf.reshape()將特征圖轉換為一維尺度,輸出值遵循dropout規(guī)則[6-13]。
3 實驗結果
實驗數據集來自劍橋大學Rainbow Group,該數據集包含11382個眼睛特寫圖像[12]。本算法利用了眼周12個坐標點,左眼角關鍵點序號為0,其他關鍵點按照順時針依次排列,分別記為p0,p1,…,p11。人眼樣本及輪廓點如圖1所示。
人眼圖像共聚成7類,其特征數據如表1所示。根據數據和直觀認識,7類眼形分別命名為細長眼、梭形眼、上斜眼、標準眼、杏眼、半月眼、瞇縫眼。
4 結論
本文提出一種基于關鍵點的眼睛形狀聚類算法。該算法基于關鍵點檢測技術,提取眼周相關數據,對目標眼形進行聚類。
基于關鍵點的眼睛形狀聚類算法不足之處在于:人眼關鍵點檢測環(huán)節(jié),受圖片中眼周陰影、睫毛等因素影響,關鍵點定位精確度不高,影響聚類效果。
本文受北京市教委面上(KM201510009005)等資助。
參考文獻
[1]沈曉衛(wèi).IT行業(yè)已進入認知時代,掌握這5點很關鍵.[EB/OL].http://www.sohu.com /a/ 133469 919_38932 7,2017.
[2]王濤.基于臉部生物特征及人眼定位的身份識別系統(tǒng)[D].蘭州:蘭州大學,2010.
[3]孫勁光,榮文釗.曲線相似度眼型分類[J].計算機科學與探索,2017,11(8):1305-1313.
[4]劉歡喜.人體生物特征的綜合分析與應用[D].上海:上海交通大學,2010.
[5]RainbowGroup.RenderingofEyes for Eye-Shape Registration andGazeEstimation.[EB/OL].http://www.cl.cam.ac.uk/research/rainbow/projects/syntheseyes/,2015.
[6]賈瑞鳳,馬曾,侯春龍.以Python為工具培養(yǎng)學生計算思維[J].電腦知識與技術,2018,14(02):117-118.
[7]Tensorflow官方網站.Tensorflow簡介.[EB/OL]. https://www.tensorflow.org/,2016.
[8]張立毅.神經網絡盲均衡理論、算法與應用[M].北京:清華大學出版社,2013,43-44.
[9]Wikipedia.Convolutional neural network.[EB/OL]. https://en.wikipedia .org /wiki/ Convolutional_ neural_ network,2018.
[10]SVL.Module 2:Convolutional Neural Networks.[EB/OL]. http://cs231n.github.io/ convol- utional-networks/#conv,2018.
[11]ujjwalkarn.An Intuitive Explanation of Convolutional Neural Networks.[EB/OL].https:// ujjwalkarn.me /20 16/08/11/intuitive-explanation-convnets/,2016-8-11.
[12]Fredrik Lundh.An Introduction To Tkinter[EB/OL].http://effbot.org/tkinterbook /tkinter -whats-tkinter.ht - m,1999.
[13]朱威,屈景怡,吳仁彪.結合批歸一化的直通卷積神經網絡圖像分類算法[J].計算機輔助設計與圖形學學報,2017,29(9):1650-1657.
[14]Alex Krizhevsky,,Ilya Sutskever,,and Geoffrey E. Hinton. ImageNet Classification with Deep Convo lutional Neural Networks[J].COMMUNICATIONS OF THE ACM,2017,60(6):84-90.
[15]Wikipedia.Cross entropy.[EB/OL]. https://en.wikipedia.org/wiki/Cross_entropy,2018- 1-13.
[16]索紅光,王玉偉.一種用于文本聚類的改進k-means算法[J].山東大學學報(理學版),2008,43(1):60-64.
(作者單位:北方工業(yè)大學信息學院)