劉篤晉 鄧小亞 蒲國(guó)林
摘要:人臉檢測(cè)是人臉識(shí)別的前提和基礎(chǔ),同時(shí)在數(shù)字視頻處理、身份驗(yàn)證、基于內(nèi)容的檢索、視覺檢測(cè)等方面都有著非常重要的應(yīng)用價(jià)值,該文對(duì)基于數(shù)字圖像處理的彩色人臉檢測(cè)的各個(gè)步驟包括圖像去噪、圖像邊緣檢測(cè)、圖像分割、圖像光照影響的去除等的發(fā)展現(xiàn)狀進(jìn)行了研究,并指出了各個(gè)步驟以后的發(fā)展方向。
關(guān)鍵詞:人臉檢測(cè);圖像去噪;四元素;蜂群算法;光照處理
中圖分類號(hào):TP393文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2012)29-7076-02
人臉檢測(cè)就是在具有復(fù)雜背景的圖像中檢測(cè)有無人臉,從而判斷是否有人存在,若存在人臉時(shí),則提取出人臉圖像信息。它是人臉識(shí)別[1]的兩個(gè)步驟即人臉檢測(cè)和人臉識(shí)別兩個(gè)步驟中的第一個(gè)重要步驟,早期的人臉識(shí)別主要是針對(duì)標(biāo)準(zhǔn)的正面人臉圖像,而這標(biāo)準(zhǔn)正面人臉圖像是在環(huán)境、光照、人臉姿態(tài)等都是在理想情況下獲得的,因而此人臉圖像在光照、人臉姿態(tài)、環(huán)境等發(fā)生變化后的適應(yīng)性是相當(dāng)差,因而早期的人臉檢測(cè)并無多大實(shí)際價(jià)值,而隨著近年來生物特別識(shí)別技術(shù)的發(fā)展,使得人臉識(shí)別系統(tǒng)對(duì)自然環(huán)境具有了較強(qiáng)的自適應(yīng)能力和學(xué)習(xí)能力,并且在數(shù)字視頻處理、身份驗(yàn)證、基于內(nèi)容的檢索、視覺檢測(cè)等方面人臉檢測(cè)都有著非常重要的應(yīng)用價(jià)值,因而人臉檢測(cè)的研究受到越來越多研究人員的重視,從某種程度上說,當(dāng)前人臉識(shí)別的應(yīng)用范圍遠(yuǎn)遠(yuǎn)不如人臉檢測(cè),因而本文主要研究人臉檢測(cè)問題。
國(guó)內(nèi)的人臉自動(dòng)檢測(cè)技術(shù)雖然起步較晚,但近年來許多人臉檢測(cè)算法已經(jīng)接近甚至超過國(guó)際先進(jìn)水平,如國(guó)內(nèi)的浙江大學(xué)、廈門大學(xué)及電子科技大學(xué)等等以及一些實(shí)力雄厚的高新技術(shù)開發(fā)公司,國(guó)家的重大支持項(xiàng)目、863計(jì)劃等都大力支持人臉檢測(cè)的相關(guān)研究。而國(guó)外的針對(duì)人臉檢測(cè)研究與發(fā)展進(jìn)步很快,出現(xiàn)了許多經(jīng)典高效的算法[2],但在對(duì)象不配合或者光照、姿態(tài)變化差異較大的情況下適應(yīng)性仍然較差,因而近年來,對(duì)人臉檢測(cè)的研究主要集中在姿態(tài)及光照變化較大的方面,如基于adaboost的人臉檢測(cè),基于四元數(shù)的彩色人臉圖像檢測(cè),和以及基于gabor和SVM的彩色人臉圖像檢測(cè)。
總的來說,不管那種人臉檢測(cè)算法,在基于數(shù)字圖像的人臉檢測(cè)方面都主要包括人臉圖像去噪、人臉圖像邊緣檢測(cè)及分割和對(duì)人臉圖像進(jìn)行去除光照影響的處理等等。因而上述步驟也是本文研究人臉圖像檢測(cè)的主要內(nèi)容。
1 人臉圖像去噪
噪聲對(duì)人臉圖像檢測(cè)有著非常大的影響,較好的圖像去噪能力是檢驗(yàn)一個(gè)圖像處理系統(tǒng)是否優(yōu)秀的重要標(biāo)準(zhǔn),若噪聲處理不好,將會(huì)出現(xiàn)漏檢甚至根本檢測(cè)人臉的現(xiàn)象,因而,多年來人們對(duì)噪聲反復(fù)進(jìn)行了研究,產(chǎn)生了許多經(jīng)典的算法 [3],雖然這些經(jīng)典的算法在某些情況下確實(shí)產(chǎn)生了一定作用,但最終都沒有出現(xiàn)一種通用而又有著理想效果的算法,相關(guān)研究人員在該領(lǐng)域進(jìn)行了不懈的努力,其中在人臉圖像去噪中運(yùn)用小波理論的方法[4]有著較好的效果,隨著小波理論的發(fā)展,逐漸出現(xiàn)了閾值收縮和比例收縮這兩類有著較大影響的基于小波變換的閾值去噪方法,雖然這兩種方法在噪聲較小的情況下,可以取得較好的效果,但在噪聲比較大時(shí),效果仍然不理想。
近年來出現(xiàn)一種將快速粒子優(yōu)化算法[5]運(yùn)用于圖像去噪中的去噪方法,其快速粒子優(yōu)化算法中的閾值尋優(yōu)是通過將圖像作為粒子,然后以粒子的兩個(gè)極值的不斷更新來實(shí)現(xiàn)的,由于快速粒子優(yōu)化算法中的速度和位置更新公式采用了更適合算法收斂的參數(shù),因而該算法所求得的最優(yōu)解即準(zhǔn)確又靈活,用此最優(yōu)解來求基于小波變換閾值去噪算法中的閾值,不僅PSNR明顯提高而且有著更好的感官視覺,由于該算法自身的優(yōu)勢(shì)還使得即使噪聲方差較大,PSNR仍然能有較高的值,但此算法易受圖像預(yù)處理現(xiàn)象的影響,還有可能會(huì)出現(xiàn)粒子群收斂困難的現(xiàn)象,有待于今后進(jìn)一步研究。
2 人臉圖像邊緣檢測(cè)
人臉圖像邊緣檢測(cè)在人臉檢測(cè)中是至關(guān)重要的一步,此步是后面的人臉圖像分割以及光照影響處理等的基礎(chǔ),目前灰度圖像的人臉邊緣檢測(cè)技術(shù)已取得很大進(jìn)步,但是真實(shí)的人臉圖像卻不是純粹的灰度圖像所能表示的,而純粹的灰度圖像的人臉檢測(cè)效果由于人臉膚色的影響,結(jié)果并不盡如人意,因而人們開始運(yùn)用彩色圖像來進(jìn)行人臉檢測(cè),但是目前常用的彩色圖像基本上是采用三色分離方法來表示的,如R G B三色分離的顏色空間,當(dāng)采用傳統(tǒng)的彩色人臉圖像邊緣檢測(cè)算法如Laplacian算法、Canny算子、Sobel算子、Prewitt算子、Robert算子等進(jìn)行人臉檢測(cè)時(shí),由于這些算法基本上都是對(duì)各個(gè)彩色分量分別處理,然后再按某種方法將結(jié)果進(jìn)行合成最后才進(jìn)行人臉檢測(cè),或采用將灰度圖像直接擴(kuò)展的方法,上述算法無法做到用一個(gè)元素來表示一個(gè)彩色像素,甚至很少考慮各個(gè)彩色分量的關(guān)系處理,并且由于彩色人臉圖像采用了三色分離的方法,也就是說一張圖片要用三個(gè)矩陣來表示,處理的數(shù)據(jù)量是相當(dāng)?shù)拇?,因而效果也是相?dāng)?shù)牟睢?/p>
四元數(shù)的發(fā)現(xiàn)是數(shù)學(xué)上的大事,在彩色圖像處理領(lǐng)域里也正產(chǎn)生重要的影響,主要是由于四元數(shù)自然的特性,使得當(dāng)四元數(shù)的實(shí)部為零時(shí),可以將一個(gè)彩色像素用一個(gè)線虛四元數(shù)表示,在許多研究人員和科研機(jī)構(gòu)的不懈努力下,將四元數(shù)用于彩色圖像邊緣檢測(cè)中,產(chǎn)生了一些有效的方法(如矢量點(diǎn)乘、色彩差分等),這些方法都是運(yùn)用四元數(shù)原理將一個(gè)彩色像素作為一個(gè)整體來進(jìn)行處理的,因而具有明顯的優(yōu)勢(shì),同時(shí)在彩色人臉圖像邊緣檢測(cè)中,其中[6]采用將一種改進(jìn)的粒子群優(yōu)化算法和四元數(shù)理論結(jié)合的方法,將四元數(shù)理論和粒子群相結(jié)合引入彩色圖像邊緣檢測(cè)中,由于該方法將四元數(shù)和改進(jìn)粒子優(yōu)化算法的優(yōu)勢(shì)相結(jié)合,因而很好地克服了傳統(tǒng)彩色圖像邊緣檢測(cè)的缺陷,有著良好的邊緣提取效果,在人臉圖像邊緣檢測(cè)的細(xì)微色彩變化方面、紋理細(xì)小的細(xì)節(jié)方面、人臉圖像邊緣提取的精度及速度方面,都達(dá)到了較理想的效果,故有著較強(qiáng)的推廣和實(shí)用價(jià)值。
3 人臉圖像分割
在人臉圖像分割方面,經(jīng)過過去幾十年的探索,人們對(duì)利用圖像閾值進(jìn)行圖像分割的技術(shù)已取得了許多成果,如為了達(dá)到理想的分割效果將最大類間方差法與互信息相結(jié)合,或采用二維熵來判斷閾值向量是利用了灰度—梯度共生矩陣,以及采用基于模糊邏輯推理系統(tǒng)的動(dòng)態(tài)閾值選擇方法,其中的閾值選取采用模糊理論來處理,以解決精準(zhǔn)農(nóng)業(yè)作業(yè)的定位問題。Otsu在1979年在判決分析最小二乘法原理的基礎(chǔ)上提出了最大類間方差法,該方法有著較強(qiáng)的適應(yīng)性且算法簡(jiǎn)單,故而在自動(dòng)圖像閾值選取方法方面使用廣泛,但由于類間方差最大閾值的選取計(jì)算量呈幾何級(jí)數(shù)增長(zhǎng),因而限制了此算法的應(yīng)用。
文獻(xiàn)[7]提出了一種基于蜂群算法的圖像分割方法,此方法將基于蜂群算法的二維Otsu算法應(yīng)用于被分成若干窗口的圖像中,比模糊集理論圖像分割方法、圖像熵圖像分割方法、基于粒子群優(yōu)化算法的圖像分割方法等在,在人臉圖像中的突發(fā)噪聲能有效地消除,同時(shí)采用多個(gè)閾值能充分考慮到各個(gè)像素的實(shí)際情況,大大提高了像素歸類的準(zhǔn)確率,同時(shí)采用多窗口分割對(duì)保持圖像的多樣性,具有重要的意義,總之,該算法能使得圖像分割迅速、準(zhǔn)確。
4 人臉圖像光照影響的處理
經(jīng)過前面的幾步后,已經(jīng)分割出類似的人臉圖像了,但是此分割出的類似人臉圖像的人臉檢測(cè)準(zhǔn)確率并不高,主要原因是光照對(duì)人臉圖像的影響,因此必須進(jìn)行去光照的處理,根據(jù)2007年3月美國(guó) NIST報(bào)告顯示在光照變化較大情況下的人臉檢測(cè)準(zhǔn)確率遠(yuǎn)遠(yuǎn)不能滿足實(shí)際的需要,而根據(jù) Adini的研究表明較大光照的變化給人臉圖像檢測(cè)的影響有時(shí)會(huì)超過不同的人臉圖像之間的變化,研究人員對(duì)影響人臉光照的因素進(jìn)行了大量研究[8],提出了一些有效的處理影響人臉光照的方法,總的來說,大概有三大類,分別是采用不敏感視覺特征的方法、采用變換的方法以及采用光照補(bǔ)償?shù)姆椒ā?/p>
5 結(jié)論
人臉檢測(cè)是在人臉信息處理方面、人工智能、模式識(shí)別以及機(jī)器視覺等方面都有著非常重要的作用,但由于影響人臉檢測(cè)準(zhǔn)確率的各個(gè)因素較難以處理,許多研究人員從不同角度、不同方向、不同途徑進(jìn)行研究,已取得了一些可喜的成果,這既需要對(duì)不同學(xué)科方向有著深入研究,同時(shí)又要能綜合各學(xué)科知識(shí)來進(jìn)行全局研究,才能提出切實(shí)有效的提高人臉檢測(cè)算法的方法。
本文對(duì)人臉檢測(cè)算法的各個(gè)步驟進(jìn)行了詳細(xì)的闡述,對(duì)各種相關(guān)算法優(yōu)缺點(diǎn)進(jìn)行了詳細(xì)分析,對(duì)人臉檢測(cè)算法各個(gè)步驟的發(fā)展指出了方向。
參考文獻(xiàn):
[1] 田捷 楊鑫.生物特征識(shí)別理論與應(yīng)用[M].北京:清華大學(xué)出版社,2009.
[2] 章毓晉.基于子空間的人臉識(shí)別[M].北京:清華大學(xué)出版社,2009.
[3] 岡薩雷斯.數(shù)字圖像處理[M].2版.北京:電子工業(yè)出版社,2008.
[4] 張曄,黃秀明.小波變換及在圖像處理中的小波特性分析[J].中國(guó)圖像圖形學(xué)報(bào),1997,2(7): 480-464.
[5] Liu Du-Jin, Li Si-ming, Sun Shu-xia,et al.application of fast particle swarm optimization algorithm in image denosie [J]. recent advances in csie2011,LNEE 126:559-566.
[6] 劉篤晉,孫淑霞,丁照宇,等.基于改進(jìn)粒子群算法的彩色圖像邊緣檢測(cè)方法[J].計(jì)算機(jī)工程, 2011,37(15):190-192.
[7] 劉篤晉,基于數(shù)字圖像處理的人臉檢測(cè)研究與實(shí)現(xiàn)[D].成都:成都理工大學(xué).
[8] 劉篤晉,孫淑霞,李思明.人臉識(shí)別中光照處理方法的分析[M].計(jì)算機(jī)系統(tǒng)應(yīng)用,2012,20(1):160-162.