亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于自監(jiān)督的人臉面部動(dòng)作單元檢測(cè)

        2022-03-09 07:25:04范耀文
        關(guān)鍵詞:三元組編碼器人臉

        范耀文

        (廣東工業(yè)大學(xué)自動(dòng)化學(xué)院,廣東 廣州 510006)

        人臉表情對(duì)于人際溝通至關(guān)重要,而一般對(duì)表情的六種分類并不足以概括人類所有各類豐富的面部表情,因此相關(guān)學(xué)者提出了面部動(dòng)作編碼系統(tǒng)FACS (Facial Action Coding System)[1],將面部各個(gè)肌肉群的運(yùn)動(dòng)進(jìn)行分類。隨著自監(jiān)督學(xué)習(xí)在機(jī)器視覺任務(wù)上的應(yīng)用不斷發(fā)展,使用自監(jiān)督方法實(shí)現(xiàn)面部動(dòng)作單元檢測(cè)也就成為了一個(gè)十分重要的研究課題。

        圖1 本文網(wǎng)絡(luò)結(jié)構(gòu)

        由于面部動(dòng)作單元(AU, Facial Action Unit)的標(biāo)注很困難,消耗大量人力,因此很多使用無標(biāo)注圖像的自監(jiān)督方法在近年來被不斷提出。FAb-Net[2]從無標(biāo)注的人臉視頻序列中提取圖像幀,通過編碼器對(duì)每幀圖像進(jìn)行特征提取,然后使用解碼器由兩幀圖像的特征解碼得到兩幀圖像之間的光流,由此可以通過圖像對(duì)中一張圖像生成得到另一張圖像,目標(biāo)是使生成圖像與輸入的另一張?jiān)紙D像盡可能的相同,以此實(shí)現(xiàn)該自編碼器網(wǎng)絡(luò)結(jié)構(gòu)的自監(jiān)督訓(xùn)練。TCAE[3]則在此基礎(chǔ)上進(jìn)行改進(jìn),將兩張圖像幀之間的光流解耦為大幅度整體的頭部姿態(tài)移動(dòng)和小幅度局部的面部表情變化。Lu 等人[4]提出的方法則不使用光流以及圖像重建,直接利用人臉面部動(dòng)作變化的時(shí)域連續(xù)性,按照時(shí)間順序?qū)拿恳粠瑘D像提取的特征構(gòu)造三元組損失函數(shù),以此實(shí)現(xiàn)自監(jiān)督訓(xùn)練,由于不需要解碼器,該網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)潔,而且有著很好的擴(kuò)展性。上述工作共同的不足之處在于,未能將個(gè)體信息以及背景信息去除,即對(duì)編碼器提取特征的解耦不夠充分,仍然含有大量無關(guān)信息,不利于后續(xù)下游任務(wù)階段的訓(xùn)練,影響最終所得到檢測(cè)器的性能。同時(shí),這些工作中的解碼器骨架都為最基本的卷積網(wǎng)絡(luò)或尺寸較小的ResNet,而后續(xù)被提出的ViT(Vision Transformer)[5]利用自注意力機(jī)制,在很多機(jī)器視覺任務(wù)上有著出色的表現(xiàn),這啟發(fā)了我們將ViT 應(yīng)用在人臉特征提取任務(wù)中。

        針對(duì)上述問題,本文在Lu 等[4]工作的基礎(chǔ)上,將編碼器改為ViT 結(jié)構(gòu),該網(wǎng)絡(luò)能夠更好地提取特征,從而提升下游任務(wù)的性能。并將特征解耦為個(gè)體特征以及表情特征,由于面部動(dòng)作單元檢測(cè)等任務(wù)是與個(gè)體無關(guān)的,因此將不含個(gè)體信息的表情特征提取出來,更有利于面部動(dòng)作單元檢測(cè)這個(gè)下游任務(wù)的訓(xùn)練和表現(xiàn)?;谶@些改進(jìn),本文提出的方法在同等實(shí)驗(yàn)條件下,在BP4D 數(shù)據(jù)集[6]上取得了超過其他已有最先進(jìn)方法的結(jié)果。

        1 本文方法

        1.1 整體結(jié)構(gòu)

        1.2 特征解耦

        為了給后續(xù)面部動(dòng)作單元檢測(cè)等下游任務(wù)提供含更少干擾信息的面部動(dòng)作特征,對(duì)提取出的特征進(jìn)行解耦,將其分為兩組:個(gè)體特征和表情特征。其中個(gè)體特征包含人物個(gè)體的臉型、頭發(fā)、服裝、圖像背景、光照環(huán)境等與面部表情無關(guān)的信息,而表情特征則是剔除掉上述干擾信息后較為純凈的只包含描述人臉表情和面部肌肉動(dòng)作的特征。

        為了實(shí)現(xiàn)該目的,本文方法利用了無標(biāo)注人臉視頻序列中天然存在的個(gè)體特征一致性,即在同一視頻片段中,人物個(gè)體相同,且拍攝的背景以及其他因素的變化基本不變,而表情則不斷地發(fā)生變化,由此我們可以限制同一視頻序列中不同幀的個(gè)體特征之間的差異。然而根據(jù)對(duì)比學(xué)習(xí)的理論經(jīng)驗(yàn),此時(shí)編碼器只需要輸出與輸入無關(guān)的恒定輸出,即可保證不同幀的個(gè)體特征完全相同,而并沒有提取人臉圖像中的信息,因此需要額外加入其他來自其他個(gè)體的人臉圖像作為負(fù)例,要求來自不同個(gè)體的人臉圖像幀的個(gè)體特征之間的差異盡可能的大。通過以上設(shè)計(jì),能夠?qū)⑷四樢曨l序列中不變的個(gè)體信息提取為個(gè)體特征,而將不斷變化的表情信息用表情特征進(jìn)行提取,實(shí)現(xiàn)了特征的解耦。

        1.3 三元組損失函數(shù)

        本文方法的損失函數(shù)由個(gè)體特征的三元組損失函數(shù)及表情特征的三元組損失函數(shù)兩部分組成,見圖2。三元組損失函數(shù)的基本構(gòu)造為:

        圖2 個(gè)體特征及表情特征的三元組損失函數(shù)

        其中d 代表兩個(gè)輸入之間的距離函數(shù),δ 為一避免負(fù)例差異總大于正例差異而設(shè)置的常數(shù)。三元組損失函數(shù)能夠同時(shí)限制使基準(zhǔn)與正例距離最小,而與負(fù)例之間的距離最大,這一特性十分適合本文所利用的自監(jiān)督信號(hào)。

        對(duì)于個(gè)體特征,來自同一視頻序列的不同幀之間應(yīng)該盡可能相似,而來自不同視頻序列的幀之間差異應(yīng)該盡可能大,并且由于本文方法以k 幀的視頻序列作為輸入,因此選定第一幀為基準(zhǔn)、其他個(gè)體的圖像作為負(fù)例后,能將剩余k-1 幀分別作為正例,可以構(gòu)造出個(gè)體特征的三元組損失函數(shù):

        Lu 等[4]的工作中使用了基于時(shí)域順序的三元組損失函數(shù),將視頻序列第一幀作為基準(zhǔn),取之后的兩幀圖像,由于人臉表情的變化是連續(xù)的,因此可以認(rèn)為在時(shí)間上更接近基準(zhǔn)幀的圖像應(yīng)該與基準(zhǔn)幀更接近,與之相比,時(shí)間上距離更遠(yuǎn)的圖像則應(yīng)有更大的差異。對(duì)于連續(xù)變化的表情信息,可以對(duì)本文方法中的表情特征構(gòu)造出以下三元組損失函數(shù):

        該損失函數(shù)利用了人臉表情在時(shí)域上的連續(xù)性,能夠驅(qū)使網(wǎng)絡(luò)提取人臉相關(guān)信息,實(shí)現(xiàn)網(wǎng)絡(luò)的自監(jiān)督訓(xùn)練。

        2 實(shí)驗(yàn)分析

        2.1 數(shù)據(jù)集與評(píng)價(jià)指標(biāo)

        訓(xùn)練集使用VoxCeleb1/2[7],該數(shù)據(jù)集含有超過6 千位名人明星接受采訪的約十五萬個(gè)視頻,涵蓋了大幅度的頭部姿態(tài)、低光、不同程度的鏡頭失焦模糊等極端情況。我們使用該數(shù)據(jù)集提供的已裁剪的人臉區(qū)域圖像,并使用數(shù)據(jù)集已有的按照人物個(gè)體不同而劃分的訓(xùn)練集和驗(yàn)證集。人臉圖像幀作為輸入給編碼器前,會(huì)與先前工作一樣,先進(jìn)行中央裁剪和尺寸歸一化。

        評(píng)估數(shù)據(jù)集為BP4D[6],該數(shù)據(jù)集含有23 位女性和18 位男性總共41 人的人臉視頻數(shù)據(jù),其中有接近15 萬幀二維人臉圖像帶有AU 標(biāo)注。為了證明本文方法的有效性,我們使用和先前方法同樣的數(shù)據(jù)集和處理流程進(jìn)行訓(xùn)練和評(píng)估,考慮到評(píng)估數(shù)據(jù)集分布上存在的不均衡,都使用F1-score 作為評(píng)價(jià)指標(biāo)。

        2.2 結(jié)果分析

        本文方法和其他已有自監(jiān)督方法的F1 結(jié)果在表1 中列出,其中FAb-Net[2]和TCAE[3]的結(jié)果取自Lu 等[4]論文中進(jìn)行的復(fù)現(xiàn)結(jié)果??梢钥闯霰疚姆椒ㄈ〉昧俗顑?yōu)的平均F1 分?jǐn)?shù),相比Lu 等提升了2%,證明了本文方法的有效性。

        表1 各方法在BP4D 數(shù)據(jù)集上的F1 結(jié)果

        本文方法在大多數(shù)AU 項(xiàng)都取得了最高的F1,然而和Lu 等的方法一樣,其中AU17 的檢測(cè)效果不如先前其他方法。AU17 是一個(gè)下巴向上收縮擠壓嘴唇的面部動(dòng)作,該面部動(dòng)作在外觀上呈現(xiàn)為下巴部分區(qū)域向上平移,因此先前一些基于光流的工作可能更適合該類AU。但AU23 抿嘴和AU24緊咬牙關(guān)兩項(xiàng)都有著加大的提升,合理的推測(cè)是因?yàn)楸疚姆椒ㄖ械奶卣鹘怦钇鹆俗饔?,特征解耦去除了干擾表情表征的個(gè)體信息,因此這兩個(gè)在顏色梯度上不明顯的面部動(dòng)作能夠被更好地檢測(cè)。

        2.3 消融實(shí)驗(yàn)分析

        本文通過消融實(shí)驗(yàn)證明了兩個(gè)改進(jìn)的有效性,比較了單獨(dú)替換ViT[5]作為編碼器,單獨(dú)解耦個(gè)體特征和表情特征,以及同時(shí)應(yīng)用兩者的結(jié)果,詳見表2。

        表2 消融實(shí)驗(yàn)結(jié)果

        由表中數(shù)據(jù)可知,單獨(dú)替換編碼器為ViT 可稍微提升性能,而單獨(dú)進(jìn)行特征解耦則的性能提升幅度比前者更大,同時(shí)應(yīng)用兩種改進(jìn),則最終f1-score 指標(biāo)結(jié)果有2%左右的提升。特征解耦的結(jié)構(gòu)設(shè)計(jì)能夠得到更少無關(guān)干擾信息的表情特征,能夠使ViT 編碼器更好地進(jìn)行人臉特征提取,從而提升最終整體面部動(dòng)作單元檢測(cè)器的性能。

        3 結(jié)論

        本文提出了基于自監(jiān)督的面部動(dòng)作單元檢測(cè)方法,進(jìn)一步提升了面部動(dòng)作單元檢測(cè)器的性能。該方法利用ViT 的出色性能,得以更好地提取包含面部信息的特征。同時(shí),對(duì)個(gè)體信息和表情信息進(jìn)行解耦,去除了表情特征中原版含有的和人物個(gè)體相關(guān)的信息,從而使面部動(dòng)作單元檢測(cè)等下游任務(wù)能夠得到具有更少干擾的面部表情特征。由于ViT 的自注意力機(jī)制需要較大的運(yùn)算量,因此后續(xù)的工作主要會(huì)降低編碼器部分的復(fù)雜度,轉(zhuǎn)而在網(wǎng)絡(luò)的整體架構(gòu)以及損失函數(shù)上進(jìn)行優(yōu)化和改進(jìn)。

        猜你喜歡
        三元組編碼器人臉
        基于語(yǔ)義增強(qiáng)雙編碼器的方面情感三元組提取
        軟件工程(2024年12期)2024-12-28 00:00:00
        基于帶噪聲數(shù)據(jù)集的強(qiáng)魯棒性隱含三元組質(zhì)檢算法*
        有特點(diǎn)的人臉
        關(guān)于余撓三元組的periodic-模
        三國(guó)漫——人臉解鎖
        基于FPGA的同步機(jī)軸角編碼器
        基于PRBS檢測(cè)的8B/IOB編碼器設(shè)計(jì)
        JESD204B接口協(xié)議中的8B10B編碼器設(shè)計(jì)
        電子器件(2015年5期)2015-12-29 08:42:24
        馬面部與人臉相似度驚人
        長(zhǎng)得象人臉的十種動(dòng)物
        奇聞怪事(2014年5期)2014-05-13 21:43:01
        国产女主播在线免费观看| 日韩最新在线不卡av| 无码国产精品第100页| 亚洲九九夜夜| 男女发生关系视频网站| 蜜桃激情视频一区二区| 91国内偷拍一区二区三区| 精品无码AⅤ片| 精品国产一区二区三区香蕉| 99精品国产一区二区三区a片| 女同三级伦理在线观看| 免费黄片小视频在线播放| 国产无套乱子伦精彩是白视频| 九色综合九色综合色鬼| 日韩成人无码| 亚洲精品无码国模| 亚洲国产精品久久久天堂不卡海量| 亚洲最稳定资源在线观看| 91精品啪在线观看国产色| 亚洲毛片免费观看视频| 内射白浆一区二区在线观看| 色一情一乱一伦| 欧美熟妇色ⅹxxx欧美妇| 日本久久久| 亚洲熟妇av日韩熟妇av| 成熟的女人毛茸茸色视频| 日韩 亚洲 制服 欧美 综合| 少妇人妻在线无码天堂视频网| 少妇特黄a一区二区三区| 国产精品18禁久久久久久久久| 精品国产97av一区二区三区| 亚洲乱码中文字幕在线播放 | 国产成人精品视频网站| 91精品啪在线观看国产色| 嫩草伊人久久精品少妇av| 国产精品网站在线观看免费传媒| 国产成人精品成人a在线观看| 日本中文字幕不卡在线一区二区| 久久99久久久精品人妻一区二区| 日韩av无码一区二区三区| 国产乱人伦av在线无码|