侯現(xiàn)坤,周瑋
(宿州學(xué)院,安徽宿州,234000)
關(guān)鍵字:口罩遮擋;hog 特征;區(qū)域比例;邊緣檢測(cè)
人臉識(shí)別是目前主流生物特征識(shí)別技術(shù)(Biometrics),在生活中有著廣泛用途,應(yīng)用于門(mén)禁考勤系統(tǒng),電腦手機(jī)安全防范,ATM 機(jī)智能報(bào)警系統(tǒng),人物追蹤等領(lǐng)域。具有誤識(shí)率低,難仿冒,不易察覺(jué),不需接觸,自然性等優(yōu)點(diǎn)。因此受到了很多研究者關(guān)注,劉瑞欽[1]提出使用多尺度直方圖解決了特征提取時(shí)塊的大小選擇問(wèn)題,使用歐拉公式對(duì)矩陣進(jìn)行白化處理,實(shí)驗(yàn)表明在FERET 數(shù)據(jù)庫(kù)上識(shí)別準(zhǔn)確度很高。袁寶華[2]基于水平長(zhǎng)直線(xiàn)檢測(cè)的口罩檢測(cè),首先對(duì)圖片歸一化處理,根據(jù)眉毛粗定位其他器官,通過(guò)檢測(cè)波峰來(lái)判斷長(zhǎng)直線(xiàn)的有無(wú),判斷出口罩位置。蔣嬋,黃晁,陳春燕[3]通過(guò)數(shù)據(jù)增強(qiáng)方法,對(duì)訓(xùn)練集進(jìn)行手動(dòng)遮擋,使用平均臉策略,對(duì)遮擋區(qū)域進(jìn)行分割和處理,獲得類(lèi)似于自然遮擋圖像,解決了訓(xùn)練集樣本不足的問(wèn)題。林勝光[4]基于神經(jīng)網(wǎng)絡(luò)結(jié)合區(qū)域權(quán)值,并對(duì)中間卷積層進(jìn)行高斯濾波處理,利用使用濾波后的特征進(jìn)行人臉對(duì)比,提高人臉識(shí)別的準(zhǔn)確度。本文根據(jù)霍夫直線(xiàn)檢測(cè)判斷人臉是否佩戴口罩,并通過(guò)提取未遮擋部分hog 特征,對(duì)分類(lèi)器進(jìn)行級(jí)聯(lián)來(lái)提高口罩遮擋人臉識(shí)別的準(zhǔn)確度。
高斯卷積把原始圖片與卷積核中心重疊對(duì)應(yīng)位置相乘,卷積核每次移動(dòng)一個(gè)像素,卷積后得到一張新的圖片,原圖片根據(jù)卷積核的大小,選用不同的padding 方式,保證得到的圖片和原始圖片一樣的尺度。使用的高斯核其取自二維高斯分布,對(duì)高斯核歸一化卷積之后,保證得到的新的圖片像素值在0 到255,高斯核中心像素點(diǎn)周?chē)闹禃?huì)對(duì)其產(chǎn)生影響。基于高斯核得到的新的圖像,像素點(diǎn)的值因受到周?chē)袼攸c(diǎn)的值產(chǎn)生影響,圖像過(guò)度更加平滑,并去掉隨機(jī)噪聲。
圖1 原始圖像
圖2 灰度圖像
圖3 二值化圖像
灰度處理使三種色彩分量R,G,B 的值相同,基于加權(quán)平均值法,當(dāng)其權(quán)重不同時(shí),形成不同灰度的灰度圖像,使其產(chǎn)生的圖片符合人眼視覺(jué)感受?;叶忍幚砜商岣叱绦蜻\(yùn)算速度。二值化設(shè)定一個(gè)閾值將圖像像素點(diǎn)灰度值設(shè)置為0 或255。
基于形態(tài)學(xué)圖像處理算法腐蝕與膨脹[5]提取圖像成分,去除二值化圖像噪點(diǎn)。利用結(jié)構(gòu)單元對(duì)目標(biāo)圖像進(jìn)行腐蝕操作,如果結(jié)構(gòu)單元像素點(diǎn)完全處于目標(biāo)圖像里,那么結(jié)構(gòu)單元原點(diǎn)所在位置可以輸出。如果結(jié)構(gòu)單元像素點(diǎn)超出目標(biāo)區(qū)域,則結(jié)構(gòu)單元原點(diǎn)位置不能輸出,因此目標(biāo)區(qū)域邊界就會(huì)被腐蝕。腐蝕可以縮小或者細(xì)化二值圖像中的物體,腐蝕操作將小于結(jié)構(gòu)單元的圖像細(xì)節(jié)從圖像中濾除。
膨脹操作,結(jié)構(gòu)單元像素點(diǎn)可以超出目標(biāo)區(qū)域范圍,但必須有一部分像素點(diǎn)在目標(biāo)區(qū)域范圍中,結(jié)構(gòu)單元原點(diǎn)所在位置才能輸出。如果結(jié)構(gòu)單元像素點(diǎn)和目標(biāo)區(qū)域沒(méi)有聯(lián)系,結(jié)構(gòu)單元中心位置不能輸出?;谂蛎洸僮魇鼓繕?biāo)區(qū)域范圍比之前擴(kuò)大,可以使斷裂部分被連接起來(lái)。
基于開(kāi)操作先腐蝕后膨脹,可以使物體的輪廓更加的平滑并消除細(xì)小的突出物,但是也可能會(huì)導(dǎo)致細(xì)微連接處斷開(kāi)較窄的狹頸。由于有些部分通過(guò)開(kāi)操作之后,出現(xiàn)新的斷裂無(wú)法恢復(fù),并不是我們所期望。為解決這個(gè)問(wèn)題,使用閉操作先膨脹后腐蝕,平滑輪廓的一部分與開(kāi)操作相反,其通常會(huì)彌合較窄的間斷和細(xì)長(zhǎng)的溝壑,消除小的空洞,填補(bǔ)輪廓的斷裂。
圖像canny 邊緣檢測(cè)[6]圖像在垂直于邊緣的方向上像素變化很大。因圖像是離散的,可根據(jù)差商的極限對(duì)圖像近似求導(dǎo)。使用核對(duì)圖像分別進(jìn)行豎向和橫向兩次卷積,基于豎向和橫向卷積的圖像,得到原始圖像的梯度的幅值和梯度的方向,賦值越大更有可能是邊,保留梯度方向最大的幅值,對(duì)非極大值進(jìn)行抑制。因像素點(diǎn)離散,梯度方向可能沒(méi)有幅值存在,則需基于線(xiàn)性差值模擬出兩個(gè)點(diǎn)的幅值與中間點(diǎn)幅值進(jìn)行比較,如果中間點(diǎn)大于另外模擬出的點(diǎn)則將其保留,認(rèn)為其是該梯度方向最大的值,否則舍棄該點(diǎn)。邊緣的連接和閾值化把灰度小于最小閾值的點(diǎn)去除,大于最大閾值的點(diǎn)保留。去除一些點(diǎn)后圖像會(huì)斷斷續(xù)續(xù),為解決此問(wèn)題,將遍歷大于最大閾值的點(diǎn),此點(diǎn)如果其八領(lǐng)域內(nèi)存在閾值,其值介于最大閾值和最小閾值中間把它連接起來(lái)。
圖4 腐蝕圖像
圖5 膨脹圖像
霍夫直線(xiàn)檢測(cè)[7]遍歷每一個(gè)像素點(diǎn),如果是黑色點(diǎn)不執(zhí)行操作,如果是白色點(diǎn)獲取其x,y 坐標(biāo)帶入不同的角度,求出不同的r,直到所有的邊緣點(diǎn)都遍歷完,出現(xiàn)最多的r 和角度組合最有可能是直線(xiàn)。
圖6 邊緣檢測(cè)圖像
圖7 霍夫直線(xiàn)檢測(cè)圖像
基于霍夫直線(xiàn)檢測(cè)以及利用hsv 作為膚色檢測(cè)判斷出未遮擋部分,提取未遮擋部分Hog 特征[8(]方向梯度直方圖)作為分類(lèi)對(duì)象,其不依賴(lài)于顏色,圖像梯度可以分解為水平和豎直方向梯度。水平梯度計(jì)算首先要從左向右掃描,計(jì)算該方向上的像素值的差值。在從上到下掃描計(jì)算豎直方向梯度,利用水平方向梯度和豎直方向梯度,提取圖像hog 特征?;谔荻戎狈綀D訓(xùn)練分類(lèi)器來(lái)檢測(cè)物體,根據(jù)水平和豎直方向上的梯度可以計(jì)算出圖片總體的梯度值和梯度角??偺荻却笮『头较蛴孟蛄勘硎?,該向量表達(dá)兩個(gè)像素的特征,因次壓縮了圖片信息,壓縮后的圖像可以表達(dá)圖像中的主要特征。
Pca 降維[9]首先計(jì)算多維數(shù)據(jù)中二維變量的平均測(cè)量值,根據(jù)平均值,計(jì)算出數(shù)據(jù)的中心,移動(dòng)數(shù)據(jù)的中心并確保數(shù)據(jù)中心在圖形中原點(diǎn)的位置,移動(dòng)數(shù)據(jù)并不會(huì)改變數(shù)據(jù)點(diǎn)彼此之間的相對(duì)位置,通過(guò)移動(dòng)后的圖像擬合出一條直線(xiàn)。選定一條穿過(guò)原點(diǎn)的隨機(jī)線(xiàn)為量化擬合數(shù)據(jù)程度,數(shù)據(jù)投影到該線(xiàn)段,測(cè)量數(shù)據(jù)到直線(xiàn)的距離。找到使這些投影點(diǎn)到直線(xiàn)距離總和最小的線(xiàn)或找到使投影點(diǎn)到原點(diǎn)距離最大的線(xiàn),旋轉(zhuǎn)選定的直線(xiàn),使這些投影點(diǎn)到直線(xiàn)距離總和最小,盡可能擬合數(shù)據(jù)。把最佳擬合線(xiàn)距離的平方和稱(chēng)為pca 特征值。另外一個(gè)主成分通過(guò)原點(diǎn)垂直pca 無(wú)需更多優(yōu)化,因主成分必須保證線(xiàn)性無(wú)關(guān),所以垂直pca,選擇pca 呈現(xiàn)水平狀態(tài),用投影點(diǎn)定位圖中樣本位置,特征值通過(guò)把數(shù)據(jù)投影到主成分上來(lái)獲得。計(jì)算每個(gè)主成分的差異,選取占絕大多數(shù)差異率的主成分,使用保留的主成分的特征值去表達(dá)特征。
根據(jù)提取出的hog 特征,使用提升學(xué)習(xí)(boosting)基于A(yíng)daBoost 產(chǎn)生弱預(yù)測(cè)模型,并加權(quán)累加到總模型中。原始訓(xùn)練集訓(xùn)練形成弱學(xué)習(xí)器,在構(gòu)建下一個(gè)弱學(xué)習(xí)器時(shí)會(huì)考慮前一個(gè)訓(xùn)練集中的模型的效果。根據(jù)前一個(gè)訓(xùn)練集的效果去更改原來(lái)樣本權(quán)重,樣本數(shù)目不會(huì)因此改變,修改之后依次遞推進(jìn)行一系列的迭代,迭代到錯(cuò)誤率足夠小,多個(gè)弱學(xué)習(xí)器預(yù)測(cè)結(jié)果進(jìn)行加權(quán)融合。算法會(huì)為每一個(gè)樣本賦予一個(gè)權(quán)重,每次用訓(xùn)練好的學(xué)習(xí)器預(yù)測(cè)樣本,如何某一個(gè)樣本預(yù)測(cè)的越來(lái)越正確 則將其權(quán)重降低,否則提高樣本的權(quán)重。權(quán)重越高的樣本在下一次迭代訓(xùn)練中所占的比重就越大,使越難區(qū)分的樣本在訓(xùn)練過(guò)程中會(huì)變得越重要?;贠penCV 實(shí)例化分類(lèi)器實(shí)現(xiàn)對(duì)人臉,鼻子,嘴巴的檢測(cè),如果檢測(cè)到嘴巴說(shuō)明沒(méi)有佩戴口罩。
本文闡述了口罩遮擋人臉識(shí)別方法,首先對(duì)人臉圖像進(jìn)行高斯卷積使圖像更加平滑,對(duì)二值化的圖像進(jìn)行開(kāi)操作和閉操作去除圖像中的噪點(diǎn)。對(duì)嘴巴檢測(cè)判斷是否佩戴口罩,基于霍夫直線(xiàn)檢測(cè)和提取人臉部的膚色信息判斷出未遮擋部分。提取未遮擋部分hog 特征,基于分類(lèi)器級(jí)聯(lián)識(shí)別出口罩遮擋人臉,提高口罩遮擋人臉識(shí)別的準(zhǔn)確度。