文丨劉 博 郭若偉 王 巍
利用AdaBoost算法解決電視節(jié)目人物面部智能檢測問題
文丨劉 博 郭若偉 王 巍
本文在對人臉面部特點分析的基礎(chǔ)上,比較了幾種常用的面部智能檢測方法,提出利用AdaBoost技術(shù)解決面部智能檢測的基礎(chǔ)問題。設(shè)計了面部智能檢測流程,并對重要人物判別機制進行了設(shè)計。
面部智能檢測; 面部特點; Adaboost; 智能監(jiān)測
電視媒體作為最具影響力的大眾傳媒之一,擔(dān)負著宣傳黨的方針政策,傳達政令,引導(dǎo)輿論等多項社會職能。然而,發(fā)展迅猛的廣播電視業(yè)也面臨著諸多問題,如一些節(jié)目內(nèi)容低俗引起了社會關(guān)注。因此,如何利用技術(shù)手段,杜絕被限制的人物出鏡,防止違規(guī)節(jié)目播出,是電視節(jié)目智能監(jiān)測領(lǐng)域的新課題。AdaBoost算法在面部智能檢測方面的應(yīng)用,恰好為電視節(jié)目人物智能監(jiān)測提供可靠的技術(shù)支持。
面部包含著很多的特點信息,其中一些特點有:幾何特點、膚色特點和運動特點等。靜止圖像中的面部智能檢測主要采用幾何特點和膚色特點;電視節(jié)目中的面部智能檢測主要采用運動特點。
基于幾何特點的面部智能檢測是提取面部一些簡單的特點,然后對特點進行基于知識層面的分析[1]?;谀w色特點對于彩色的面部圖像而言。基于運動特點,可以通過比較面部或者面部區(qū)域相對背景的位置移動就可以定位面部,比如利用面部簡單的運動來定位面部。
面部智能檢測從不同的角度可以有很多種分類方法。主要思想就是對要檢測的面部進行建模,比較待檢測的區(qū)域和面部模型的匹配度,通過對匹配度的考察來得到可能存在的面部區(qū)域。下面是三種有代表性的面部智能檢測方法。幾何方法是根據(jù)人臉結(jié)構(gòu)的已有信息,利用向量來代表這些特點;膚色也是面部的一個顯著的特點;統(tǒng)計方法是將面部智能檢測看成一般的模式識別的問題,通過判斷這個數(shù)學(xué)高維向量所在的區(qū)域?qū)儆谀膫€模式即可完成對面部的檢測[2]。
面部只能檢測的主要評估指標有:誤檢率、檢測率、檢測速度以及魯棒性四個方面。誤檢率指的是將非面部窗口誤認為面部數(shù)目與圖像中檢測出的面部數(shù)值進行對比取值;檢測率指的是正確檢測出的面部數(shù)值與圖像中總面部的數(shù)值對比;檢測速度指的是面部檢測過程中消耗的時間,在檢測率較高、誤檢率較低的情況,速度越快越好;魯棒性指的是檢測系統(tǒng)對各種情況的適應(yīng)能力,如面部姿態(tài)變化、背景噪聲干擾及面部遮擋等情況。以上的四項指標相輔相成的。
Adaboost 是一種迭代算法,通過從大量的弱分類器中選取最具有分類能力的那些組合,構(gòu)成一個強分類器。其基本原理是針對不同的訓(xùn)練對象調(diào)教同一個分類器(弱分類器),之后,將這些不同訓(xùn)練集上的得到的分類器聯(lián)合起來,構(gòu)成一個綜合分類器(強分類器)。
多級分類器的結(jié)構(gòu)如圖1所示,前面一層的分類器對子窗口的圖像進行分類后,如果分類結(jié)果為“是”,那么可能包含面部的窗口就傳遞到下一個分類器,并且觸發(fā)下一個分類器進行處理,如此下去直到最后一個分類器。
圖1 多級分類器結(jié)構(gòu)
目前面部智能檢測作為一個獨立的研究課題,其應(yīng)用背景已經(jīng)遠遠超出了面部智能檢測的范疇,面部信息處理成為基于內(nèi)容的電視節(jié)目智能監(jiān)測研究中的一個焦點問題。
本文設(shè)計的面部智能檢測的步驟是這樣的:首先用大量人物圖像用Adaboost算法進行訓(xùn)練,得到一個AdaBoost算法形成的最終分類器,用最終分類器去區(qū)分面部和非面部;如果檢測結(jié)果為面部區(qū)域,就對檢測到的面部區(qū)域用膚色判別方法統(tǒng)計區(qū)域上的皮膚顏色的比例,從而判別其是否為面部圖像;經(jīng)過膚色比對的驗證并確認為面部區(qū)域,接著運用特點比對進行人物判別,如果視頻人物眾多,可以優(yōu)先比對重要人物的面部特點。面部智能檢測的流程如圖2所示。
圖2 面部智能檢測的流程
對各種識別算法,面部圖像的預(yù)處理和標準化是面部智能檢測一個必要的前期步驟,預(yù)處理的效果將會對后續(xù)的識別過程有非常大的影響。目前國內(nèi)外針對面部智能檢測的圖像預(yù)處理多傾向于對面部的標準化,即通過面部的灰度、投影等信息確定面部邊晃,并對圖像進行剪裁和縮放,使得面部的關(guān)鍵部位在圖像中的相對位置一致。
在一些電視節(jié)目中往往會出現(xiàn)人物眾多的情況,而其中一些的面部角色與電視節(jié)目毫無關(guān)系,而且有些人物不知道其身份,如果探測所有的面部并加以標識無關(guān)緊要又不現(xiàn)實。我們把人物的范圍縮小,主要針對電視節(jié)目中的重要人物,比如國家領(lǐng)導(dǎo)人以及限制出境的人物等,這樣就能在一定程度上探測出面部并進行過濾,將無關(guān)緊要人物濾掉。判斷重要任務(wù)主要注重以下幾點:
(1)人物面部在電視節(jié)目中出現(xiàn)的頻率以及時間長短。一般來說,重要的人物曝光率較高,而且都會伴有重要事件出現(xiàn),面部在鏡頭上持續(xù)的時間較長。根據(jù)以上特點,我們認為鏡頭出現(xiàn)的次數(shù)較多,持續(xù)時間較長的面部則代表著重要人物。此標準的界定與實現(xiàn)涉及到面部跟蹤及面部識別的問題,因為面部出現(xiàn)的次數(shù)需要判定面部相關(guān)性的問題,即驗證出現(xiàn)的面部是否是同一人,判斷持續(xù)時間需要對面部出現(xiàn)的開始幀與結(jié)束幀的信息,從而產(chǎn)生面部跟蹤報告。
(2)通過面部區(qū)域的出現(xiàn)位置判定人物的重要性。通過對電視節(jié)目的觀察,發(fā)現(xiàn)重要人物的面部一般出現(xiàn)在圖像的中央部位,不會出現(xiàn)在節(jié)目的邊界處,因此可以根據(jù)人物出現(xiàn)的位置來界定其人物的重要性。
(3)根據(jù)面部區(qū)域的大小來識別重要人物。電視節(jié)目中的重要人物雖然可能不是特寫鏡頭,但是面部的尺寸、在圖像所占比例也有一定特點。
本文利用Adaboost算法,設(shè)計了快速面部檢測判別流程。利用該算法,我們可以方便的在電視節(jié)目中識別出目標人員的面部特點。有助于廣電監(jiān)測部門迅速、準確地獲取電視節(jié)目人物的臉部圖像,對提高監(jiān)測人員的工作效率、加強廣播電視監(jiān)管有重要意義。
[1] 郭志波 嚴云洋 楊靜宇.一類視頻序列中的人臉檢測與實時跟蹤算法.計算機工程與應(yīng)用2007.43(28)
[2] 馮冬青 丁鍇.視頻中基于膚色模型的人臉檢測.計算機應(yīng)用與軟件.2010.27(2)
(國家廣播電影電視總局哈爾濱監(jiān)測臺,哈爾濱 150089)