劉宣彤
摘?要:在“互聯(lián)網(wǎng)+”技術(shù)的發(fā)展推動(dòng)下,人臉識(shí)別技術(shù)也逐漸趨于成熟,但是面部表情識(shí)別技術(shù)作為難點(diǎn)技術(shù),尚未被有效攻克,如果將面部表情識(shí)別技術(shù)與物聯(lián)網(wǎng)技術(shù)相結(jié)合,則會(huì)賦予計(jì)算機(jī)以人類的感情,有利于物聯(lián)網(wǎng)時(shí)代的開啟。本文通過對(duì)面部表情識(shí)別方法進(jìn)行分析,希望對(duì)促進(jìn)面部表情識(shí)別技術(shù)的發(fā)展有所幫助。
關(guān)鍵詞:深度學(xué)習(xí);面部表情;識(shí)別
面部表情是一種人類特有的情感表達(dá)方式,也是分析人類情感和行為的重要依據(jù),在“互聯(lián)網(wǎng)+技術(shù)”和人工智能技術(shù)發(fā)展的背景下,面部表情識(shí)別技術(shù)已經(jīng)成為人們重點(diǎn)關(guān)注的話題,并出現(xiàn)了多種識(shí)別方法。伴隨著芯片處理能力的不斷加強(qiáng),研究人員已經(jīng)將目光轉(zhuǎn)向深度學(xué)習(xí),已經(jīng)取得了初步的成效。因此,對(duì)基于深度學(xué)習(xí)的面部表情識(shí)別進(jìn)行研究,具有十分重要的意義。
一、深度學(xué)習(xí)
深度學(xué)習(xí)指的是在多層神經(jīng)網(wǎng)絡(luò)上,應(yīng)用不同種類的機(jī)器學(xué)習(xí)算法,對(duì)圖像、文本等問題進(jìn)行解決的算法集合。[1]基于深度學(xué)習(xí),計(jì)算機(jī)可以對(duì)數(shù)據(jù)結(jié)構(gòu)進(jìn)行發(fā)現(xiàn)和調(diào)整,并依據(jù)前一個(gè)圖層的表示,對(duì)每個(gè)圖層表示進(jìn)行計(jì)算。深度學(xué)習(xí)最顯著的特點(diǎn)就是特征學(xué)習(xí),其目的在于獲取分層特征信息,以此來解決傳統(tǒng)特征提取方法存在的問題。深度學(xué)習(xí)就是所謂的深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練,伴隨著硬件處理能力的不斷提升,重新成為了相關(guān)領(lǐng)域重點(diǎn)關(guān)注的內(nèi)容。
二、基于深度學(xué)習(xí)的面部表情識(shí)別分析
(一)面部表情圖像預(yù)處理
預(yù)處理是面部表情識(shí)別的重要步驟,其主要目的在于排除干擾特征提取的各項(xiàng)因素,例如:環(huán)境、姿勢(shì)和背景等,在干擾排除后,讓人類面部表情直接與系統(tǒng)相對(duì)接,促使面部特征對(duì)應(yīng)的語(yǔ)義位置準(zhǔn)確無誤。實(shí)現(xiàn)預(yù)處理的方法有以下幾種:一是人臉檢測(cè);二是人臉對(duì)齊;三是數(shù)據(jù)增強(qiáng);四是人臉歸一。
1.人臉檢測(cè)
人臉檢測(cè)主要是對(duì)人類的面部進(jìn)行檢測(cè),在檢測(cè)的同時(shí),排除干擾因素和其他區(qū)域。傳統(tǒng)的人臉檢測(cè)方法主要由人工操作完成,工作人員會(huì)利用專業(yè)的設(shè)備完成這項(xiàng)工作,但是這種檢測(cè)方法,無法有效克服環(huán)境因素的干擾,檢測(cè)效果十分有限。而隱馬爾可夫人臉檢測(cè)器應(yīng)用效果卻十分顯著,取得了廣泛的應(yīng)用。在深度學(xué)習(xí)階段,又出現(xiàn)了一系列先進(jìn)的人臉檢測(cè)器,不僅工作效率高,還能應(yīng)對(duì)各種干擾因素的影響。目前,級(jí)聯(lián)結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用,使人臉檢測(cè)性能得到顯著增強(qiáng)。
2.人臉對(duì)齊
為進(jìn)一步強(qiáng)化人臉檢測(cè)的效果,人臉對(duì)齊技術(shù)應(yīng)運(yùn)而生,人臉對(duì)齊好比在一個(gè)已經(jīng)設(shè)置好固定點(diǎn)位的系統(tǒng)中,對(duì)這些固定點(diǎn)進(jìn)行搜索,繼而構(gòu)成人臉的形狀。人臉對(duì)齊首先會(huì)由一個(gè)大致的形狀開始,然后不斷對(duì)人臉形狀進(jìn)行細(xì)化和估計(jì)。[2]在搜索點(diǎn)的過程中,需要使用以下兩種信息:一是人臉外觀;二是人臉形狀。形狀是指為搜索提供一個(gè)大致的范圍,目前使用最為廣泛的方法是IntraFacc軟件。
3.數(shù)據(jù)增強(qiáng)
深度學(xué)習(xí)雖然效果十分顯著,但對(duì)于數(shù)據(jù)的要求十分嚴(yán)格,只有確保數(shù)據(jù)量的充足有效,才能強(qiáng)化工作效果。但是現(xiàn)階段常用的FER數(shù)據(jù)集,卻無法完全滿足深度學(xué)習(xí)對(duì)數(shù)據(jù)的要求,繼而會(huì)導(dǎo)致過擬合現(xiàn)象的發(fā)生。因此,數(shù)據(jù)增強(qiáng)成為了保證面部表情識(shí)別有效性的重要步驟。目前,應(yīng)用效果顯著的數(shù)據(jù)增強(qiáng)方法有以下幾種:一是旋轉(zhuǎn)反射變換法;二是縮放變換法;三是尺度變換法;四是對(duì)比度變換法;五是顏色變化法。這些數(shù)據(jù)增強(qiáng)方法的應(yīng)用,促進(jìn)了面部表情識(shí)別技術(shù)的發(fā)展。
4.人臉歸一化
由于燈光和頭部姿勢(shì)的變化,會(huì)對(duì)面部表情識(shí)別效果造成直接的影響,因此,應(yīng)用人臉歸一化方法,消除這些變化的對(duì)識(shí)別效果的影響十分關(guān)鍵。常用的人臉歸一化方法為兩種:一是灰度歸一化;二是幾何歸一化。增加圖像的亮度,凸顯圖像的細(xì)節(jié),消除外界環(huán)境因素對(duì)圖像的干擾,是灰度歸一化的主要功能。除了增加亮度功能之外,灰度歸一化還可以調(diào)整對(duì)比度。對(duì)比度調(diào)整方法包括直方圖均衡化、IS歸一化、DCT歸一化和高斯歸一化法等。在這些方法中,比較適用于深度學(xué)習(xí)面部表情識(shí)別的方法為直方圖均衡化,究其原因,主要是這種方法較為穩(wěn)定,契合于網(wǎng)絡(luò)模型。幾何歸一化的功能是生成面部視圖,但現(xiàn)階段,該方法的發(fā)展還不完善,尚存在一定的不足。
(二)基于序列特征的方法
基于序列特征的方法主要有兩種:一種是光流法;另一種是模型法。其中光流法是指幀在變化過程中會(huì)凸顯出來一些重要的特征信息,在明確圖像序列目標(biāo)的構(gòu)造的基礎(chǔ)上,對(duì)目標(biāo)的形變和圖像顏色在空間和時(shí)間上的變化情況進(jìn)行把握,這種動(dòng)態(tài)化序列特征提取,應(yīng)用范圍十分廣泛。而模型法是指利用模型對(duì)人的面部進(jìn)行追蹤,并將通過追蹤獲取的模型和幀圖像信息作為依據(jù),對(duì)人的面部表情進(jìn)行有效的識(shí)別。
(三)深度卷積神經(jīng)網(wǎng)絡(luò)
深度神經(jīng)網(wǎng)絡(luò)已經(jīng)被廣泛應(yīng)用于視覺對(duì)象識(shí)別任務(wù)之中,它能夠使神經(jīng)網(wǎng)絡(luò)的大數(shù)據(jù)處理能力得到顯著提升,其方法是在神經(jīng)網(wǎng)絡(luò)內(nèi)構(gòu)建一個(gè)與人類大腦相似的學(xué)習(xí)結(jié)構(gòu)。這個(gè)學(xué)習(xí)結(jié)構(gòu)可以對(duì)一些多級(jí)表示和抽象進(jìn)行學(xué)習(xí),從而賦予計(jì)算法在聲音、文字和圖像中找到復(fù)雜模式的能力。研究人員在2012年發(fā)現(xiàn)將自動(dòng)編碼器應(yīng)用于CNN之中,做逐層訓(xùn)練,可以對(duì)高層次的網(wǎng)絡(luò)進(jìn)行訓(xùn)練,但經(jīng)過繼續(xù)研究,發(fā)現(xiàn)初始化策略的效果要優(yōu)于逐層訓(xùn)練,因而提出了批量歸一化方法,這一方法的使用,促進(jìn)了深層網(wǎng)絡(luò)的發(fā)展,從而使深層學(xué)習(xí)面部表情識(shí)別成為了可能。
三、結(jié)論
綜上所述,面部表情識(shí)別具有非常高的實(shí)用價(jià)值和商業(yè)價(jià)值。如今,對(duì)于面部表情識(shí)別的研究正在不斷進(jìn)行,在此期間,產(chǎn)生了多種方法和結(jié)構(gòu)。通過對(duì)這些方法進(jìn)行分析,有利于加深我們對(duì)面部表情識(shí)別的理解。
參考文獻(xiàn):
[1]陸嘉慧,張樹美,趙俊莉.基于深度學(xué)習(xí)的面部表情識(shí)別研究[J].計(jì)算機(jī)應(yīng)用研究,1-8[2019-03-07].
[2]夏晨.基于視頻序列的人臉表情識(shí)別方法研究[D].合肥工業(yè)大學(xué),2018.