陳 凡,童 瑩,曹雪虹
(1.南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003;2.南京工程學(xué)院 通信工程學(xué)院,江蘇 南京 211167)
復(fù)雜環(huán)境下基于視覺(jué)顯著性的人臉目標(biāo)檢測(cè)
陳 凡1,童 瑩2,曹雪虹2
(1.南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003;2.南京工程學(xué)院 通信工程學(xué)院,江蘇 南京 211167)
當(dāng)前復(fù)雜環(huán)境下人臉識(shí)別因受目標(biāo)背景雜亂等因素影響,分類(lèi)效果不理想。針對(duì)此問(wèn)題,提出了基于視覺(jué)顯著性的人臉目標(biāo)檢測(cè)方法,利用基于圖論的視覺(jué)顯著性算法(Graph-Based Visual Saliency,GBVS)提取復(fù)雜環(huán)境中的人臉目標(biāo)的顯著圖,對(duì)顯著圖進(jìn)行閾值分割和形態(tài)學(xué)操作得到二值人臉目標(biāo)區(qū)域,以區(qū)域質(zhì)心為中心,以區(qū)域邊緣到質(zhì)心的最小距離為邊長(zhǎng),截取圖像中的準(zhǔn)確人臉區(qū)域,實(shí)現(xiàn)復(fù)雜環(huán)境下的人臉目標(biāo)檢測(cè)。在LFW數(shù)據(jù)庫(kù)上的實(shí)驗(yàn)結(jié)果表明,所提算法能夠準(zhǔn)確地完成“摳圖”的任務(wù),具有較為理想的人臉檢測(cè)效果,因算法實(shí)現(xiàn)過(guò)程無(wú)需人工干預(yù),可有效摒除雜亂背景干擾,且提高了檢測(cè)速度,實(shí)現(xiàn)了無(wú)監(jiān)督的人臉檢測(cè),為智能化人臉識(shí)別提供了理論研究基礎(chǔ)。
復(fù)雜環(huán)境;基于圖論的視覺(jué)顯著性算法;視覺(jué)顯著性;人臉檢測(cè)
隨著圖像處理和模式識(shí)別技術(shù)的發(fā)展,人臉識(shí)別技術(shù)已經(jīng)成為現(xiàn)代模式識(shí)別和人工智能領(lǐng)域的研究熱點(diǎn)之一。其中,人臉檢測(cè)是人臉識(shí)別的預(yù)處理步驟,可以有效去除背景干擾,尤其對(duì)復(fù)雜環(huán)境下的人臉識(shí)別,進(jìn)行人臉檢測(cè)尤為重要。人臉檢測(cè)在近二十年的時(shí)間內(nèi)取得了長(zhǎng)足的發(fā)展,各種各樣的人臉檢測(cè)算法層出不窮,主要包括基于模板匹配的人臉檢測(cè)算法和基于膚色模型的檢測(cè)算法兩類(lèi)[1]?;谀0迤ヅ涞娜四槞z測(cè)方法[2-3]是根據(jù)先驗(yàn)數(shù)據(jù)歸納出一個(gè)統(tǒng)一的模板,然后根據(jù)一個(gè)能量函數(shù)確定被檢測(cè)域中與模板匹配度最高的區(qū)域,即人臉區(qū)域?;谀w色模型的人臉檢測(cè)算法[4]主要依據(jù)是在彩色圖像中,人臉的膚色是區(qū)別與非臉的一個(gè)顯著特征。兩種方法各有利弊[5]?;谀0迤ヅ涞娜四槞z測(cè)算法原理簡(jiǎn)單,速度快,但由于不同人臉差異很大,很難設(shè)計(jì)出精確匹配的模板,再加上環(huán)境的復(fù)雜性,很難獲得理想的人臉檢測(cè)效果?;谀w色模型的算法是在彩色圖像中檢測(cè)人臉的一種很常用的算法,但由于人體其他部位可能具有和人臉相同的膚色,比如男性赤膊等,并且某些場(chǎng)景中的背景也可能會(huì)和人臉皮膚有相同的模型分布,因此該方法魯棒性差。
為了解決復(fù)雜環(huán)境下的人臉檢測(cè)問(wèn)題[6-7],比如光照、多姿態(tài)、面部遮擋、復(fù)雜背景等因素的影響,提出了基于視覺(jué)顯著性的人臉檢測(cè)算法。視覺(jué)注意機(jī)制是人類(lèi)視覺(jué)的一項(xiàng)重要的心理調(diào)節(jié)機(jī)制,視覺(jué)顯著性是利用人的視覺(jué)注意機(jī)制,在大量的視覺(jué)信息中迅速找到顯著的或感興趣的物體。當(dāng)人眼看到一幅帶有復(fù)雜背景的圖片時(shí),一般情況下,會(huì)把注意力放在圖像中最顯著的區(qū)域。因此,所提出的基于視覺(jué)顯著性的人臉檢測(cè)算法,可以利用視覺(jué)注意機(jī)制,從復(fù)雜背景中快速鎖定人臉目標(biāo)。相比傳統(tǒng)的人臉檢測(cè)算法,不僅可以不受光照、姿態(tài)、遮擋等因素的干擾,準(zhǔn)確檢測(cè)到人臉區(qū)域,而且無(wú)人工干預(yù),實(shí)現(xiàn)過(guò)程更加智能化。為后續(xù)人臉特征提取、分類(lèi)提供了有效信息輸入,一方面降低了提取特征的計(jì)算量,縮短了特征提取的時(shí)間,另一方面,去除了干擾因素,使特征提取更準(zhǔn)確,識(shí)別率也將大大提高。
當(dāng)前,視覺(jué)顯著性算法的研究已取得很多成果。早期Itti提出生物學(xué)啟發(fā)計(jì)算模型[8]。之后,Harel等改進(jìn)了Itti模型,引入馬爾可夫鏈,提出基于圖的顯著性(Graph-Based Visual Saliency,GBVS)模型[9],拓寬了顯著性方法計(jì)算的思路。接著,提出了基于頻率調(diào)制的顯著性(Frequency-Tuned Saliency,F(xiàn)TS)模型[10],此算法在自然圖像的顯著性檢測(cè)方面有不錯(cuò)的效果。為彌補(bǔ)之前顯著圖算法只能檢測(cè)出獨(dú)立物體或者主體物體的弊端,Goferman S等提出基于內(nèi)容感知的顯著性檢測(cè)(Context-Aware Saliency Detection,CASD)模型[11],此方法可以檢測(cè)出體現(xiàn)圖像語(yǔ)義的區(qū)域。因?yàn)镚BVS方法提取的顯著圖的灰度較平均,可以定位出大致目標(biāo)人臉區(qū)域,而其他顯著圖方法或忽略了目標(biāo)信息在顯著圖中的完整性[12],或檢測(cè)的目標(biāo)區(qū)域細(xì)節(jié)紋理太過(guò)清晰,顯然不利于后續(xù)對(duì)顯著圖進(jìn)行閾值分割得到模板的工作。為此,提出了基于視覺(jué)顯著性的人臉目標(biāo)檢測(cè)方法,該方法利用基于圖論的顯著性模型獲取人臉區(qū)域的顯著圖。在輸入具有復(fù)雜背景的圖片后,應(yīng)用GBVS獲取人臉圖像的視覺(jué)顯著圖,并對(duì)其進(jìn)行閾值分割得到一幅二值模板。因該模板是比較粗糙的,包含一些小的信息干擾或丟失,因而引入形態(tài)學(xué)操作得到更加精確的二值模板。尋找精確的二值模板中白色區(qū)域的質(zhì)心,并以區(qū)域質(zhì)心為中心,以區(qū)域邊緣到質(zhì)心的最小距離為邊長(zhǎng),截取圖像中的準(zhǔn)確人臉區(qū)域,從而檢測(cè)到目標(biāo)人臉。
看到一幅圖像,第一眼關(guān)注的是圖像中最吸引眼球的區(qū)域。這部分人眼感興趣的區(qū)域因?yàn)楹椭車(chē)尘坝泻艽蟮牟町悾愿菀鬃屓瞬煊X(jué),這就是人類(lèi)的視覺(jué)注意機(jī)制。顯著區(qū)域最能表現(xiàn)此幅圖像的主要內(nèi)容,包含原圖的信息量最大,因此可以利用視覺(jué)注意機(jī)制進(jìn)行復(fù)雜環(huán)境下的目標(biāo)人臉檢測(cè)。GBVS算法在特征提取的過(guò)程中類(lèi)似Itti算法去模擬視覺(jué)原理,但在顯著圖生成的過(guò)程引入馬爾可夫連,用純數(shù)學(xué)計(jì)算得到顯著值。圖1是視覺(jué)顯著圖的獲取流程。
圖1 GBVS顯著圖獲取示意圖
視覺(jué)顯著圖獲取步驟如下:
(1)輸入一幅大小為250×250的灰度圖片,利用高斯核函數(shù)平滑圖像,每次將分辨率降低為原來(lái)的1/2,下采樣4次,實(shí)驗(yàn)中只用第2,3,4次采樣得到的圖像。分別提取這3幅圖像的亮度和方向特征,其中方向特征是提取的0°,45°,90°,135°方向的信息,最后可得到15幅底層特征圖(圖像尺寸32×32)。
(2)把這15幅特征圖依次作為輸入,計(jì)算每幅圖的激活圖。對(duì)每一幅特征圖,以圖中的每一個(gè)像素點(diǎn)為節(jié)點(diǎn),根據(jù)像素點(diǎn)間的灰度值相似度和像素點(diǎn)位置間的距離(歐氏距離)作為連接權(quán)值,建立一個(gè)全連通的有向圖GA,如圖2所示。
從節(jié)點(diǎn)(i,j)到節(jié)點(diǎn)(p,q)的有向邊會(huì)賦予一個(gè)權(quán)值W((i,j),(p,q)),權(quán)值定義為:
W((i,j),(p,q))=d((i,j)‖(p,q))·F(i-p,j-q)
(1)
其中,d((i,j)‖(p,q))表示節(jié)點(diǎn)(i,j)和節(jié)點(diǎn)(p,q)之間灰度值M(i,j)和M(p,q)的相似程度,計(jì)算公式為:
(2)
圖2 有向圖構(gòu)建示意圖
F(a,b)表示節(jié)點(diǎn)(i,j)與節(jié)點(diǎn)(p,q)位置間的歐氏距離,計(jì)算公式為:
(3)
(3)連接權(quán)值矩陣(1 024×1 024),并進(jìn)行歸一化,使矩陣每列之和為1,形成馬爾可夫狀態(tài)轉(zhuǎn)移矩陣。
(4)對(duì)馬爾可夫轉(zhuǎn)移矩陣進(jìn)行多次迭代,直到馬爾可夫鏈達(dá)到平穩(wěn)分布。馬爾可夫鏈的平穩(wěn)分布反映了隨機(jī)游走者到達(dá)每個(gè)節(jié)點(diǎn)/狀態(tài)消耗的時(shí)間。節(jié)點(diǎn)視覺(jué)特征越相似,權(quán)值就越大,轉(zhuǎn)移概率越大,在兩點(diǎn)之間游走花費(fèi)的時(shí)間就短;反之,則越長(zhǎng)。視覺(jué)特征越不相似的點(diǎn)越顯著。
(5)找到馬爾可夫矩陣的主特征向量(1 024×1),主特征向量是主特征值對(duì)應(yīng)的向量,矩陣的多個(gè)特征值中模最大的特征值叫主特征值,對(duì)應(yīng)圖像的顯著節(jié)點(diǎn)。把主特征向量重新排列成2維(32×32)的形式,就得到了激活圖,并進(jìn)行歸一化。
(6)按照上面的方法得到每個(gè)特征通道的特征圖的激活圖,再把各個(gè)特征通道內(nèi)激活圖相加,最后把亮度和方向特征通道激活圖都疊加起來(lái),就得到了視覺(jué)顯著圖。
算法流程圖如圖3所示。
圖3 所提算法流程圖
所提出的算法,其輸入是一幅250×250的灰度圖像,輸出是包含目標(biāo)人臉區(qū)域的圖像。算法可分為兩部分:第一部分是利用視覺(jué)注意機(jī)制獲取目標(biāo)人臉區(qū)域的顯著圖部分,具體算法已給出;第二部分是利用顯著圖提取人臉區(qū)域圖像部分,具體實(shí)現(xiàn)步驟如下:
(1)輸入圖像是一幅250×250的灰度圖片I(x,y),利用GBVS算法提取目標(biāo)人臉區(qū)域顯著圖,記為S(x,y)。
(2)采用雙三次插值算法調(diào)整S(x,y)圖像尺寸為250×250,把S(x,y)中的每個(gè)像素按照灰度值強(qiáng)弱劃分成n個(gè)等級(jí)(n一般取99),返回第m個(gè)百分位值,此處m取60。把這個(gè)值作為閾值,分割顯著圖S(x,y)得到模板M1(x,y)。
(3)判斷模板M1(x,y)是否有冗余,若是,則執(zhí)行步驟(5);否則執(zhí)行步驟(6)。
(4)判斷模板M1(x,y)是否完全覆蓋了目標(biāo)人臉區(qū)域,若否,則執(zhí)行步驟(5);若是,則執(zhí)行步驟(6)。
(5)調(diào)整模板M1(x,y)得到精細(xì)模板M2(x,y)。如果模板M1(x,y)余留了目標(biāo)人臉以外的區(qū)域,就把M1(x,y)中的冗余區(qū)域刪除,只保留有用的區(qū)域;如果M1(x,y)沒(méi)有完全覆蓋整個(gè)目標(biāo)人臉區(qū)域,就對(duì)M1(x,y)實(shí)施閉運(yùn)算;如果M1(x,y)丟失信息過(guò)多,就對(duì)M1(x,y)進(jìn)行孔洞填充。
(6)確定目標(biāo)人臉區(qū)域。初始化變量sum_x、sum_y、area,用以記錄精細(xì)模板M2(x,y)中非零區(qū)域橫縱坐標(biāo)之和與非零區(qū)域數(shù)目。遍歷M2(x,y),如果其中某個(gè)像素點(diǎn)值為1,就把a(bǔ)rea值加1,sum_x和sum_y的值分別加上該點(diǎn)對(duì)應(yīng)的橫縱坐標(biāo)值。遍歷完M2(x,y)之后,用area對(duì)sum_x和sum_y求平均就得到M2(x,y)的質(zhì)心p。用edge函數(shù)處理M2(x,y),得到M2(x,y)區(qū)域邊緣的二值圖像,求出質(zhì)心p到區(qū)域邊緣的最小距離d。以p為中心,以d為邊長(zhǎng)作正方形,這個(gè)正方形區(qū)域就是目標(biāo)人臉?biāo)诘膮^(qū)域。
(7)將輸入圖片I(x,y)與目標(biāo)人臉區(qū)域作匹配就得到最終的人臉檢測(cè)圖。
對(duì)所提出的算法在LFW(LabeledFacesintheWild)人臉數(shù)據(jù)庫(kù)[13]上進(jìn)行了實(shí)驗(yàn)。這個(gè)數(shù)據(jù)庫(kù)包含5 749個(gè)不同人13 233張人臉圖片,圖片大小為250×250,其中1 680個(gè)人有兩張以上的圖片,剩余的4 069個(gè)人只有一張圖片,有些圖片中含有不只一張人臉,但是目標(biāo)人臉是位于圖片中間,不是目標(biāo)人臉的人臉均被視為背景,每張圖片都分配了唯一的統(tǒng)一格式的名字標(biāo)識(shí)。實(shí)驗(yàn)采用的計(jì)算機(jī)硬件配置是Intel(R)Core(TM)i5-5200@ 2.20GHz2.20GHz,4.00GB內(nèi)存,其軟件環(huán)境是Windows8操作系統(tǒng),程序使用Matlab2014a語(yǔ)言進(jìn)行編寫(xiě)。主要包括以下三個(gè)實(shí)驗(yàn)仿真。
3.1 所提出算法與Itti、CASD人臉檢測(cè)效果比較
采用GBVS、Itti、CASD三種顯著圖算法提取同一幅圖片的視覺(jué)顯著圖,再用閾值分割的方法得到二值模板,然后把二值模板與輸入圖片相乘得到人臉區(qū)域分割圖,結(jié)果如圖4所示。
圖4 不同的顯著圖方法分割的人臉效果圖
通過(guò)分析比較圖4中三種顯著圖方法分割人臉區(qū)域的效果,可以看出,GBVS顯著圖方法提取的目標(biāo)顯著區(qū)域輪廓模糊,閾值分割更容易區(qū)分與非臉區(qū)域,因此更完整地分割出了目標(biāo)人臉,既無(wú)較多冗余信息,也沒(méi)丟失面部信息;Itti方法忽略了目標(biāo)信息在圖像中的完整性,效果次之,可以看到嘴巴區(qū)域信息完全丟失,此外,還殘留了些許的衣服領(lǐng)口信息;CASD方法提取的顯著區(qū)域紋理過(guò)于詳細(xì),灰度值差異大,不利于二值化分割,不僅額頭、臉頰、鼻梁有嚴(yán)重的信息丟失,而且綬帶和衣領(lǐng)部分有較多冗余信息,分割效果最差。
3.2 所提出算法與基于模板的人臉檢測(cè)效果比較
基于模板的人臉檢測(cè)(Template-Based Face Detection,TBFD)方法是通過(guò)定位輸入圖片中人的兩只眼睛,獲取眼睛之間的線段距離D,再分別以D的中點(diǎn)為端點(diǎn),向上0.5D距離和向下1.5D距離為另一端點(diǎn)作線段,以D和2D確定的矩形區(qū)域?yàn)槿四樐0褰厝≥斎雸D片,從而達(dá)到人臉檢測(cè)的目的。對(duì)大多數(shù)圖片而言,TBFD方法和基于GBVS的人臉檢測(cè)方法都能得到很好的效果,將其稱(chēng)為典型圖片。但有的圖片不然,這些圖片用所提出的基于GBVS的人臉檢測(cè)方法要比TBFD的人臉檢測(cè)方法好得多,稱(chēng)之為非典型圖片。圖5(a)、(b)各列出了幾張典型和非典型的圖片,以及采用所提出的算法和TBFD方法的人臉檢測(cè)效果。
圖5 所提出算法與TBFD方法檢測(cè)得到的典型與非典型圖片
從圖5(a)、(b)中可以看出,在處理正面人臉圖片時(shí),所提出算法和TBFD方法得到的人臉檢測(cè)效果相差無(wú)幾,都準(zhǔn)確提取出了圖片中的目標(biāo)人臉區(qū)域。但是如果圖片中人臉存在姿態(tài)的變化,因?yàn)槿说膬裳壑g的距離D隨姿態(tài)發(fā)生改變,TBFD方法中以D和2D確定的矩形區(qū)域不能再截取到完整的目標(biāo)人臉,所以圖5(b)中TBFD方法檢測(cè)到的人臉信息丟失嚴(yán)重,單從人臉檢測(cè)結(jié)果判斷已經(jīng)不能辨識(shí)出這個(gè)人了,因此檢測(cè)效果不如所提出的算法好。此外,還可以從算法消耗時(shí)間上比較兩種算法的優(yōu)劣。算法消耗時(shí)間從輸入一張圖片開(kāi)始計(jì)時(shí)直到目標(biāo)人臉被檢測(cè)出停止計(jì)時(shí)。通過(guò)實(shí)驗(yàn)得到所提出算法和TBFD方法消耗的時(shí)間結(jié)果如表1所示。
表1 所提出算法與TBFD方法檢測(cè)時(shí)間比較
從表1中可以看出,所提出算法與TBFD方法檢測(cè)目標(biāo)人臉?biāo)牡臅r(shí)間是不同的,所提出算法消耗時(shí)間明顯低于TBFD方法。所提出算法耗費(fèi)的時(shí)間在顯著圖獲取、模板獲取、模板調(diào)整、目標(biāo)人臉區(qū)域獲取上,因?yàn)樗惴ㄟ\(yùn)行迅速,所以處理一張圖片只需1.27s。而TBFD方法消耗的時(shí)間在定位人的兩只眼睛和人的反應(yīng)時(shí)間上,其中人的反應(yīng)時(shí)間更長(zhǎng),所以處理一張圖片平均消耗的時(shí)間是4.80s。此外,TBFD方法還存在檢測(cè)方法機(jī)械,檢測(cè)出的目標(biāo)人臉圖像分辨率較低等問(wèn)題。綜合考慮兩種算法在人臉檢測(cè)效果與消耗時(shí)間兩個(gè)方面上的性能,前者算法更有效。
3.3 所提出算法在非控人臉識(shí)別中的應(yīng)用
從LFW數(shù)據(jù)庫(kù)中選出有20張以上(包括20張)圖片的人作為實(shí)驗(yàn)數(shù)據(jù),總共62類(lèi)人,共3 023張圖片。把這3 023張圖片作為輸入,利用所提出算法提取目標(biāo)人臉區(qū)域得到另一個(gè)新的人臉數(shù)據(jù)庫(kù)(記為L(zhǎng)FW-GBVS)。隨機(jī)抽取數(shù)據(jù)庫(kù)中每類(lèi)人的10張圖片作為訓(xùn)練樣本,每類(lèi)人剩下的圖片留作測(cè)試,即每個(gè)人臉數(shù)據(jù)庫(kù)共620個(gè)訓(xùn)練樣本,2 403個(gè)測(cè)試樣本。
采用HOG算法[14]對(duì)兩個(gè)人臉數(shù)據(jù)庫(kù)進(jìn)行特征提取,并用SVM分類(lèi)器[15]進(jìn)行分類(lèi),得到的實(shí)驗(yàn)結(jié)果如表2所示。
表2 LFW與LFW-GBVS人臉庫(kù)的識(shí)別性能比較
從表2可以看出,LFW-GBVS人臉庫(kù)的識(shí)別性能得到很大提升,識(shí)別率提高到72.53%,是LFW人臉庫(kù)識(shí)別率的2倍;識(shí)別時(shí)間為57.8 s,降為原來(lái)的1/4。因此,所提出算法在非控人臉識(shí)別方面是實(shí)用且有效的,這為今后研究非控環(huán)境下的人臉識(shí)別提供了技術(shù)支持。
為解決復(fù)雜環(huán)境下因受目標(biāo)背景雜亂等因素影響人臉識(shí)別分類(lèi)效果不理想的問(wèn)題,提出了一種基于視覺(jué)顯著性的復(fù)雜環(huán)境下的人臉檢測(cè)方法。該方法根據(jù)GBVS算法獲得人臉顯著圖,根據(jù)顯著圖選擇閾值進(jìn)行閾值分割得到二值模板,對(duì)模板進(jìn)行調(diào)整直到最優(yōu),找到模板中的目標(biāo)人臉?biāo)趨^(qū)域,將目標(biāo)人臉區(qū)域與輸入圖片匹配檢測(cè)到人臉目標(biāo)。實(shí)驗(yàn)結(jié)果表明,所提出的方法能有效摒除雜亂背景干擾,顯著提高非控環(huán)境下人臉識(shí)別的準(zhǔn)確率,且與其他人臉檢測(cè)方法相比,不僅準(zhǔn)確度高,而且算法運(yùn)行快速,適用于非控環(huán)境下的人臉檢測(cè)問(wèn)題。
[1] Yun J U,Lee H J,Paul A K,et al.Face detection for video summary using illumination-compensation and morphological processing[J].Pattern Recognition Letters,2009,30(9):856-860.
[2] Yilmaz S.Gray level based face detection using template face mask and L1 norm[J].IJWA,2010,2(4):243-249.
[3] Cheng J.A multi-template combination algorithm for protein comparative modeling[J].BMC Structural Biology,2008,8(1):18.
[4] Du C,Zhu H,Luo L M,et al.Face detection in video based on AdaBoost algorithm and skin model[J].Journal of China Universities of Posts and Telecommunications,2013,20(13):6-9.
[5] 姚 坤.人臉檢測(cè)技術(shù)綜述[J].電子技術(shù)與軟件工程,2014(13):122.
[6] 廖廣軍.復(fù)雜條件下的人臉檢測(cè)與識(shí)別應(yīng)用研究[D].廣州:華南理工大學(xué),2014.
[7] 葉海燕.復(fù)雜條件下的人臉檢測(cè)與識(shí)別應(yīng)用研究[J].新課程,2015(1):6-7.
[8] Itti L, Koch C. Computational modelling of visual attention[J].Nature Reviews Neuroscience,2001,2(3):194-203.
[9] Harel J, Koch C, Perona P. Graph-based visual saliency[C]//Advances in neural information processing systems.[s.l.]:[s.n.],2006:545-552.
[10] Achanta R, Hemami S,Estrada F,et al.Frequency-tuned salient region detection[C]//Proc of IEEE conference on computer vision and pattern recognition.[s.l.]:IEEE,2009:1597-1604.
[11] Goferman S,Zelnik-Manor L,Tal A.Context-aware saliency detection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2012,34(10):1915-1926.
[12] 趙宏偉,陳 霄,劉萍萍,等.視覺(jué)顯著目標(biāo)的自適應(yīng)分割[J].光學(xué)精密工程,2013,21(2):531-538.
[13] Huang G B,Ramesh M,Berg T,et al.Labeled faces in the wild:a database for studying face recognition in unconstrained environments[R].Massachusetts:University of Massachusetts,Amherst,2007.
[14] Dalal N,Triggs B.Histograms of oriented gradients for human detection[C]//Proc of IEEE conference on computer vision and pattern recognition.[s.l.]:IEEE,2005:886-893.
[15] Cortes C,Vapnik V.Support vector machine[J].Machine Learning,1995,20(3):273-297.
Face Target Detection of Visual Saliency in Complex Environment
CHEN Fan1,TONG Ying2,CAO Xue-hong2
(1.College of Communications and Information Engineering,Nanjing University of Posts and Telecommunications,Nanjing 210003,China; 2.College of Communication Engineering,Nanjing Institute of Technology,Nanjing 211167,China)
At present,the classification accuracy of face recognition in complex environment is not satisfied because of the background clutter and other factors.To solve this problem,a face detection algorithm based on visual saliency has been proposed,in which graph based visual salient algorithm is employed to extract salient maps of face region in complex environment and then threshold segmentation and morphological operations is run to get the binary face marks and the centroid is taken as center as well as the minimum distance of the region edge and centroid as side length to crop the accurate area of target face to achieve the goal of face detection in complex environment.Results of experiments on the LFW image database show that the proposed algorithm can accurately fulfill “matting” tasks and achieve good results in face detection,the process of which needs no artificial participation,and can effectively exclude the interference of pell-mell background besides having improved the detection rate,realizing the unsupervised face detection,providing a theoretical foundation for intelligent research of face recognition.
complex environment;GBVS;visual saliency;face detection
2016-02-25
2016-07-06
時(shí)間:2017-01-04
國(guó)家自然科學(xué)基金資助項(xiàng)目(61471162);江蘇省自然科學(xué)基金(BK20141389);南京工程學(xué)院科研基金(QKJA201304)
陳 凡(1991-),女,碩士研究生,研究方向?yàn)閳D像處理與模式識(shí)別;童 瑩,副教授,研究方向?yàn)閳D像處理與模式識(shí)別;曹雪虹,教授,研究方向?yàn)闊o(wú)線通信系統(tǒng)與信息理論。
http://www.cnki.net/kcms/detail/61.1450.TP.20170104.1023.038.html
TP273
A
1673-629X(2017)01-0048-05
10.3969/j.issn.1673-629X.2017.01.011