摘?要:ID識(shí)別是21世紀(jì)以來(lái)的熱門(mén)技術(shù),常用的ID技術(shù)有指紋、人臉、瞳孔識(shí)別等。人臉識(shí)別技術(shù)是其中較為靈活的技術(shù)之一,基于深度學(xué)習(xí)的人臉識(shí)別技術(shù)能夠克服傳統(tǒng)識(shí)別對(duì)環(huán)境因素要求較高的場(chǎng)合,本文就社區(qū)人臉識(shí)別實(shí)現(xiàn)的技術(shù)途徑進(jìn)行探討介紹。
關(guān)鍵詞:人臉識(shí)別;圖像分割;數(shù)據(jù)采集
中圖分類號(hào):TP520.20??文獻(xiàn)標(biāo)識(shí)碼:A??文章編號(hào):
摘?要:ID recognition is a popular technology since the 21st century.The commonly used ID technologies include fingerprint,face,pupil recognition and so on.Face recognition technology is one of the more flexible technologies.The face recognition technology based on deep learning can overcome the situation that traditional recognition requires higher environmental factors.This paper discusses the technical ways of community face recognition.
要實(shí)現(xiàn)人臉識(shí)別,綜合國(guó)際國(guó)內(nèi)文獻(xiàn)及工程實(shí)際,大致分為如下幾個(gè)模塊,分別為數(shù)據(jù)采集、圖像分割(人臉提取模塊)、特征提取、動(dòng)態(tài)識(shí)別模塊。
一、數(shù)據(jù)采集
人臉數(shù)據(jù)采集通常都是通過(guò)攝像傳感器,有兩種方式,一種是傳統(tǒng)的利用攝像傳感器進(jìn)行拍照,另一種是高清攝像頭,通過(guò)攝像,然后對(duì)攝像形成的視頻進(jìn)行幀分析。無(wú)論是哪種方式,最終都是獲取靜態(tài)圖像,并對(duì)其進(jìn)行有效數(shù)據(jù)與無(wú)關(guān)數(shù)據(jù)的分割,并對(duì)有效的圖像信息進(jìn)行保存和分析。
二、圖像分割
圖像分割,就是將一幅圖像按某種策略分塊割開(kāi),并且確保所分割后的塊之間無(wú)交疊現(xiàn)象。從這個(gè)概念中我們可以看出,要確保對(duì)一幅圖像的 分割成功,首先要保證我們分割后的塊之間屬性無(wú)交疊,也就是說(shuō),在對(duì)圖像分割之前,我們要預(yù)知分割后的各塊具有鮮明的特征屬性。由于等待分割的圖像內(nèi)容的不同導(dǎo)致要預(yù)知圖像被分割后的每一塊的特征屬性鮮明度隨之不同,從而使圖像分割時(shí)的塊區(qū)域選擇發(fā)生變化,這就是圖像分割中特征屬性與塊區(qū)域之間的相互聯(lián)系。由此可見(jiàn)圖像分割技術(shù)要解決的最基本問(wèn)題就是對(duì)圖像特征屬性的提取和圖像區(qū)域的劃分。
目前圖像分割的算法理論和相關(guān)技術(shù)已經(jīng)相對(duì)成熟,有閾值分割方法、聚類分割方法、邊緣檢測(cè)分割方法等,這些方法經(jīng)過(guò)多年的理論和實(shí)踐研究,在很多領(lǐng)域已經(jīng)有了較為良好甚至優(yōu)秀的應(yīng)用,比如車牌識(shí)別,壓線檢測(cè)等?;谶@些方法,也形成了一系列圖像分割的應(yīng)用,在人臉檢測(cè)范疇中,就有face_recognition、openCV等優(yōu)秀的第三方庫(kù)。
三、特征提取
對(duì)人臉數(shù)據(jù)進(jìn)行采集后,并不是簡(jiǎn)單的進(jìn)行存儲(chǔ),而是要進(jìn)行特征的提取以便于后續(xù)的識(shí)別,同時(shí)還需要的相同的人臉進(jìn)行聚類。主要分為傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。他們都是通過(guò)對(duì)數(shù)據(jù)采集,進(jìn)行模型訓(xùn)練,而后能夠?qū)Τ霈F(xiàn)的人臉數(shù)據(jù)進(jìn)行判斷、預(yù)測(cè)和分類。
傳統(tǒng)機(jī)器學(xué)習(xí),典型的有sklearn等經(jīng)典的第三方庫(kù),并提供了線性、kmean、隨機(jī)樹(shù)、卷積神經(jīng)網(wǎng)絡(luò)等通用的學(xué)習(xí)和預(yù)測(cè)算法,在某些單一應(yīng)用場(chǎng)景且目標(biāo)數(shù)據(jù)相關(guān)度比較高的情況下效果良好。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的分支,是一種以人工神經(jīng)網(wǎng)絡(luò)為架構(gòu),對(duì)數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的算法。至今已有數(shù)種深度學(xué)習(xí)框架,如深度神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)和深度置信網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò)已被應(yīng)用在計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、自然語(yǔ)言處理、音頻識(shí)別與生物信息學(xué)等領(lǐng)域并獲取了極好的效果。特別是深度學(xué)習(xí)能夠?qū)⒆钚碌娜四様?shù)據(jù)用于模型的更新,以便于進(jìn)行更精準(zhǔn)的識(shí)別。
社區(qū)環(huán)境下,人的數(shù)量本身較多,且年齡差距較大,傳統(tǒng)機(jī)器學(xué)習(xí)適應(yīng)性較差,靈活度不足?;谏鐓^(qū)的人臉識(shí)別較適合應(yīng)用深度學(xué)習(xí),深度學(xué)習(xí)目前主流的開(kāi)源學(xué)習(xí)框架有TensorFlow、Caffe、Keras等,同時(shí)國(guó)內(nèi)百度飛漿深度學(xué)習(xí)框架也比較完善。就TensorFlow和百度飛漿比較來(lái)說(shuō),TensorFlow使用靈活性高,使用范圍廣,百度飛漿使用相對(duì)簡(jiǎn)單,性能好,這兩和主流的深度學(xué)習(xí)框架都是比較好的選擇。
四、動(dòng)態(tài)識(shí)別
動(dòng)態(tài)人臉識(shí)別是不需要停駐等待,你只要出現(xiàn)在一定識(shí)別范圍內(nèi),無(wú)論你是行走還是停立,系統(tǒng)就會(huì)自動(dòng)進(jìn)行識(shí)別,也就是說(shuō),人以自然的形態(tài)走過(guò)去,攝像頭會(huì)進(jìn)行信息的抓拍和采集,發(fā)出相應(yīng)的指令,進(jìn)行動(dòng)態(tài)人臉識(shí)別。
社區(qū)人臉識(shí)別的特殊性在于,人員結(jié)構(gòu)復(fù)雜,且一般不需要提供被識(shí)別人的清晰照片,但是進(jìn)出社區(qū)的人員一般比較固定。所以社區(qū)人臉識(shí)別需要經(jīng)過(guò)一段時(shí)間的數(shù)據(jù)采集,搜索并存儲(chǔ)本社區(qū)人員的人臉數(shù)據(jù),同時(shí)進(jìn)行存儲(chǔ),特征提取后進(jìn)行模型建立,以便于人臉數(shù)據(jù)庫(kù)的建立。
運(yùn)用TensorFlow等深度學(xué)習(xí)框架通過(guò)采集的數(shù)據(jù)進(jìn)行人臉模型建立之后,就可以進(jìn)行動(dòng)態(tài)識(shí)別了,動(dòng)態(tài)識(shí)別中,對(duì)于已經(jīng)正確識(shí)別的,通過(guò)綠色框線進(jìn)行標(biāo)識(shí),未識(shí)別的即為疑似陌生人,工作人員可以上前查問(wèn)并作相應(yīng)處理。
參考文獻(xiàn)
[1]井慧娟 張花馗.淺談圖像分割技術(shù) [].《湖南冶金職業(yè)技術(shù)學(xué)院學(xué)報(bào)》 2008年03期
[2]王立凱.基于卷積神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別研究與設(shè)計(jì) [].通信電源技術(shù)2019,36(07),117-118
[3]崔慶華.基于深度學(xué)習(xí)的人臉識(shí)別技術(shù)分析[].計(jì)算機(jī)產(chǎn)品與流通 2020,(05),136
作者簡(jiǎn)介:秦程(1988-),男,重慶涪陵人,重慶工貿(mào)職業(yè)技術(shù)學(xué)院講師。研究方向:工業(yè)機(jī)器人。