李思潼 馮彥婕 杜帥 朱從亮 東北林業(yè)大學(xué)
近幾年,人機(jī)交互技術(shù)的應(yīng)用越來越廣泛,唇語識別作為人機(jī)交互中的關(guān)鍵技術(shù),也越發(fā)受到關(guān)注。谷歌DeepMind實(shí)驗(yàn)室提出了一種新的唇語識別技術(shù)LipNet。目前唇語識別技術(shù)主要是針對語音識別在噪聲較大環(huán)境下的識別率問題,作為對語音識別的補(bǔ)充和糾正。
關(guān)于唇語識別研究的熱點(diǎn)主要在嘴唇特征提取以及唇動特征跟蹤上,但如何從靜態(tài)圖片或動態(tài)視頻流中檢測出人臉和嘴唇區(qū)域并將嘴唇提取出來,對之后的嘴唇特征提取有著至關(guān)重要的影響。文獻(xiàn)提出了使用RGB色彩空間對嘴唇區(qū)域進(jìn)行提取,利用唇色與膚色在G、B分量上的差異對嘴唇進(jìn)行提取。本文使用開源的計算機(jī)視覺庫(OpenCv)中預(yù)先訓(xùn)練好的Harr Cascada分類器對人臉區(qū)域和嘴唇區(qū)域進(jìn)行檢測,之后對分割出來的嘴唇區(qū)域利用色彩空間進(jìn)行嘴唇提取。
Paul Viola提出了一種快速的人臉檢測算法,該算法是一種基于Haar-like特征和AdaBoost自適應(yīng)增強(qiáng)算法的人臉檢測算法,OpenCv中給出了該算法的實(shí)現(xiàn)。
Haar特征首先由Papageorgiou提出,用于對物體和人臉的快速檢測,之后Rainer Lienhart在文獻(xiàn)對其進(jìn)行了補(bǔ)充,形成了Haar-like矩形特征庫。本文所使用的OpenCv中的Harr Cascad分類器便是基于此特征庫編寫的。
由于使用Haar特征進(jìn)行檢測的特征數(shù)目過大,往往使用積分圖的方式對矩形特征值進(jìn)行計算。積分圖的計算方法如下:在圖像中取矩形D,其四個角的位置按順時針方向分別標(biāo)記為1、2、3、4,則其像素和可以根據(jù)如下公式計算:
AdaBoost算法是一個迭代過程,其思想是將分類效果較差的弱分類器組合起來,形成效果較好的強(qiáng)分類器。在過程中,AdaBoost算法不斷提高被錯誤分類的樣本的權(quán)值,使之在后面的訓(xùn)練中所占的比重更大,更新權(quán)值公式為
其中,Zm是規(guī)范化因子,am是基本分類器的系數(shù)
每一個Haar-like特征值便可視作一個弱分類器,通過AdaBoost算法后便可形成檢測能力較強(qiáng)的強(qiáng)分類器,多個強(qiáng)分類器通過級聯(lián)的方式組合起來,就形成了本文所使用的Harr Cascad分類器,如圖1所示。
圖1 級聯(lián)分類器
根據(jù)Haar-like特征和AdaBoost算法可以對人臉和嘴唇區(qū)域進(jìn)行檢測,并將檢測到的嘴唇區(qū)域分割出來,這樣可以去除膚色和周圍環(huán)境對嘴唇提取的干擾,從而可以使用基于色彩空間的方式將嘴唇提取出來。
OpenCv中已經(jīng)提供了訓(xùn)練好的Harr Cascad分類器,在haarcascades文件目錄下。本文使用haarcascade_frontalface_default.xml和haarcascade_mcs_mouth.xml分別檢測靜態(tài)圖片中的人臉和嘴唇區(qū)域,之后對檢測出的嘴唇區(qū)域進(jìn)行嘴唇提取。
對于輸入的人臉圖像,處理后的效果如圖2所示。
圖2 嘴唇提取的效果圖
可知,該方法可以較為準(zhǔn)確且完整地檢測出人臉和嘴唇區(qū)域,并有效地提取出嘴唇。
本文提出了一種利用Haar-like特征和AdaBoost算法對人臉和嘴唇區(qū)域進(jìn)行檢測及分割,并使用 色彩空間對分割出的嘴唇區(qū)域進(jìn)行嘴唇提取的方法。經(jīng)證明,該方法具有快速、準(zhǔn)確的特性,提取出的嘴唇輪廓較為完整。