亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于隨機權(quán)重分配策略的面目表情識別

        2022-10-12 09:43:22張洋銘王藝凡
        重慶大學(xué)學(xué)報 2022年9期
        關(guān)鍵詞:準(zhǔn)確度預(yù)處理卷積

        張洋銘,吳 凱,王藝凡,利 節(jié)

        (1.復(fù)雜系統(tǒng)仿真總體重點實驗室,北京 100020;2.重慶科技學(xué)院 智能技術(shù)與工程學(xué)院,重慶 400000)

        面部表情是人際交往過程中表達情感和含意的重要手段之一[1]。近年來,面部表情識別在虛擬現(xiàn)實、智能教育系統(tǒng)、醫(yī)療衛(wèi)生和數(shù)據(jù)驅(qū)動動畫等領(lǐng)域都取得了較大進展[2-4]。面部表情識別主要是根據(jù)給定的人臉圖像來識別人臉的情緒和情感態(tài)度(如中性、憤怒、厭惡、恐懼、開心、傷心和驚嘆)[5]。一方面因在訓(xùn)練過程中表情標(biāo)注主觀性強,歧義較大,訓(xùn)練數(shù)據(jù)集標(biāo)注難度大,導(dǎo)致可訓(xùn)練樣少,甚至公開數(shù)據(jù)集均是缺乏多樣性的小數(shù)據(jù)樣本,導(dǎo)致訓(xùn)練困難和識別準(zhǔn)確度不高。目前眾多數(shù)據(jù)增強的預(yù)處理方法(比如隨機裁剪,隨機翻轉(zhuǎn)等)可以解決數(shù)據(jù)樣本缺失導(dǎo)致準(zhǔn)確度不能提高的問題[6],但采用具體模型適用于面部表情數(shù)據(jù)集的,才可以最大程度上提高識別的準(zhǔn)確率。

        筆者主要研究通過隨機數(shù)據(jù)增強策略并結(jié)合基于特征的方法以提高人臉面部表情識別準(zhǔn)確度,通過VGG19網(wǎng)絡(luò)提取面部表情特征并進行準(zhǔn)確識別。其中數(shù)據(jù)增強是采用5種數(shù)據(jù)增強方式(圖像旋轉(zhuǎn)、圖像平移、圖像縮放、圖像翻轉(zhuǎn)、圖像投射)隨機權(quán)重結(jié)合,通過實驗結(jié)果得出了哪種數(shù)據(jù)增強的分配策略更適用于面部表情識別,即在保證可訓(xùn)練的數(shù)據(jù)集具有多樣性的同時,得到更加準(zhǔn)確的識別模型并掌握其權(quán)重的分布情況。

        1 用于面目表情特征提取的網(wǎng)絡(luò)VGG19

        VGG在2014年由牛津大學(xué)著名研究組VGG(visua geometry group)提出,斬獲該年Imagenet競賽中定位任務(wù)(localization task)的第一名和分類任務(wù)(classification task)的第二名[7-8]。VGG19的結(jié)構(gòu)如下圖1它是由16個stride為1,padding為1的3×3卷積核與5個size為2,stride為2的maxpool層加上3個全連接層最后添加一個soft-max層組成的。VGG 19連續(xù)使用多個3×3卷積堆疊以便于優(yōu)化并取代大體積的卷積核。多層非線性層在增加網(wǎng)絡(luò)深度時,可以保證更復(fù)雜的模型學(xué)習(xí)而且代價更小(以至于達到參數(shù)更少的目標(biāo))。簡單地來說,在VGG中,用3個3×3卷積核代替7×7的卷核,用2個3×3卷積核代替5×5的卷積核。其主要目的在于是在同一感受野的條件下,提高卷積網(wǎng)絡(luò)的深度,在一定程度上提高神經(jīng)網(wǎng)絡(luò)提取特征的效果[9]。

        圖1 VGG19結(jié)構(gòu)圖Fig. 1 The structure diagram of VGG19

        2 隨機權(quán)重分布的數(shù)據(jù)增強

        將輸入圖像并行通過窮舉法策略,進行隨機分配權(quán)重的5種數(shù)據(jù)增強方式,再將其送入到面目表情檢測識別網(wǎng)絡(luò)中通過采用數(shù)據(jù)增強策略以達到可提高面目表情識別準(zhǔn)確率的目的。整體結(jié)構(gòu)框圖如圖2所示。將原始數(shù)據(jù)X通過隨機分配權(quán)重W1~W5得到分配后的圖像數(shù)據(jù)X1~X5,將其并行通過5種數(shù)據(jù)增強的圖像變換并結(jié)合原始數(shù)據(jù)組成新的數(shù)據(jù)集Y。將新的數(shù)據(jù)集Y送入到圖像特征提取VGG19網(wǎng)絡(luò)模型中,進行后續(xù)的面目表情識別處理。

        圖2 隨機權(quán)重分布的數(shù)據(jù)增強結(jié)構(gòu)圖Fig. 2 Data enhancement structure diagram of random weight distribution

        2.1 圖像旋轉(zhuǎn)(R)

        圖像旋轉(zhuǎn)是指將圖像以其中某一個點為旋轉(zhuǎn)中心旋轉(zhuǎn)一定角度,對圖像對齊起著極其重要作用。以矩陣變換來表示設(shè)點P0(x0,y0)逆時針旋轉(zhuǎn)θ角后對應(yīng)點為那么,旋轉(zhuǎn)前后點P(x0,y0)的坐標(biāo)分別為P(x,y)

        (1)

        (2)

        2.2 圖像平移(T)

        圖像的平移操作就是將圖像所有的像素點坐標(biāo)分別加上水平與垂直操作上的偏移量。對于平移變換假設(shè)水平偏移量為dx,垂直偏移量為dy,則平移變換的坐標(biāo)映射為

        (3)

        其逆變換為

        (4)

        x1與y1的矩陣變換可表示為式(5)

        (5)

        2.3 圖像縮放(Z)

        圖像縮放是指對圖像的大小進行調(diào)整的過程,是一種非平凡的過程,需要高效率,平滑和清晰,縮小圖像稱為下采樣,放大圖像稱為上采樣。

        (6)

        2.4 圖像翻轉(zhuǎn)(F)

        圖像的翻轉(zhuǎn)變換是從A(x,y)(二維坐標(biāo))到B(u,v)(二維坐標(biāo))的一種線性變換,其數(shù)學(xué)表達式為

        (7)

        式(7)分別為水平翻轉(zhuǎn),垂直翻轉(zhuǎn),對角線翻轉(zhuǎn)。且通過圖像的翻轉(zhuǎn)變換,可以使圖像達到180°的翻轉(zhuǎn)效果這樣就可以加大其樣本的多樣性。

        2.5 圖像投射(P)

        將一張圖像投影到一個新的平面為圖像的透射變換,其使用的變換公式為

        (8)

        將5種數(shù)據(jù)增強方法進行基于隨機權(quán)重分配策略結(jié)合其結(jié)果Y可表示為

        Y=W1XR+W2XT+W3XZ+W4XF+W5XP,

        (9)

        式中W1~W5分別表示5種數(shù)據(jù)增強方式的隨機權(quán)重分布。W1~W5X分別表示進行并行處理圖像數(shù)據(jù)。RX1為進行隨機旋轉(zhuǎn)的圖像樣本;TX2為隨機圖像平移的圖像樣本;ZX3為隨機圖像縮放的樣本;FX4為隨機圖像仿射變換的圖像樣本;PX5代表隨機透射變換的圖像樣本。

        3 實驗結(jié)果分析

        3.1 實驗數(shù)據(jù)集

        Fer2013人臉面部表情數(shù)據(jù)集是人臉面目表情研究中最常用的數(shù)據(jù)集之一并且在研究當(dāng)中占據(jù)了很高的地位,F(xiàn)er2013數(shù)據(jù)集已經(jīng)為使用者劃分好了訓(xùn)練集,驗證集和測試集。Fer2013數(shù)據(jù)集包含35 887張人臉圖片,其中訓(xùn)練集28 709張,驗證集3 589張,測試集3 589張。并該數(shù)據(jù)集中的圖像均是灰度圖像并且大小為48x48.樣本被劃分為0=anger(生氣)、1=disgust(厭惡)、2=fear(恐懼)、3=happy(開心)、4=sad(傷心)、5=surprised(驚訝)、6=normal(中性)7類。

        在Cohn-Kanade基礎(chǔ)上擴充數(shù)據(jù)集產(chǎn)生了CK+數(shù)據(jù)集,并在2010年發(fā)布。該數(shù)據(jù)集有20%的圖像數(shù)據(jù)當(dāng)作測試集并用于測試模型,80%的圖像數(shù)據(jù)用于訓(xùn)練模型。圖3,4分別展示了Fer2013和CK+人臉表情數(shù)據(jù)集對應(yīng)的7種表情。

        圖3 Fer2013數(shù)據(jù)集的7種表情圖像Fig. 3 Seven facial expressions of Fer2013 dataset

        圖4 CK+數(shù)據(jù)集的7種表情圖像Fig. 4 Seven facial expressions of ck+ dataset

        3.2 訓(xùn)練數(shù)據(jù)并驗證識別精準(zhǔn)度

        訓(xùn)練與測試數(shù)據(jù)集按8∶2劃分此整體數(shù)據(jù)集,并將訓(xùn)練集圖像基于遺傳算法的隨機分配策進行權(quán)重的劃分,并每次均采用相同的訓(xùn)練方式和識別網(wǎng)絡(luò)架構(gòu)進行實驗。為驗證其結(jié)果的通用性,實驗中將使用的模型為VGG19,Resnet,Googlenet,為了提高模型的整體識別能力,通過微調(diào)將模型調(diào)整到最佳結(jié)構(gòu)。訓(xùn)練的初始權(quán)重參數(shù)設(shè)置為Epoch=30時,batchsize=128,學(xué)習(xí)率為0.001,優(yōu)化算法采用隨機梯度下降(SGD),并在每訓(xùn)練1個Epoch后便用此權(quán)重測試一次測試集,并記錄每次實驗的精準(zhǔn)度。

        通過隨機算法生成不同的數(shù)據(jù)預(yù)處理子策略權(quán)重配比,比較實驗結(jié)果準(zhǔn)確度得出哪種比例數(shù)據(jù)預(yù)處理子策略配比方式更適用于面目表情識別網(wǎng)絡(luò)并可以提升識別準(zhǔn)確度。通過大量的等同條件重復(fù)實驗,選取識別準(zhǔn)確率最高的6種子策略權(quán)重配比方式,結(jié)果如表1所示。通過對比實驗可看出圖像旋轉(zhuǎn)和圖像平移2種數(shù)據(jù)增強子策略的權(quán)重比例增加,可一定程度上提高其模型的面目表情識別的準(zhǔn)確率。

        表1 在Fer2013和CK+ 數(shù)據(jù)集上數(shù)據(jù)預(yù)處理子策略配比最優(yōu)權(quán)重

        為了驗證實驗的正確性,手動將數(shù)據(jù)預(yù)處理子策略配比方式調(diào)成1∶ 1∶ 1∶ 1∶ 1的形式,通過將數(shù)據(jù)預(yù)處理子策略的任意一種子策略手動調(diào)成2,實驗結(jié)果如表2所示。

        表2 在Fer2013和CK+ 數(shù)據(jù)集上不同權(quán)重分配策略,準(zhǔn)確度測試比較

        繼續(xù)采用相同的數(shù)據(jù)預(yù)處理子策略權(quán)重配比方式,運用不同的網(wǎng)絡(luò)結(jié)構(gòu)在Fer2013訓(xùn)練集上訓(xùn)練表情識別模型,其性能在測試集上的結(jié)果比較如表3,驗證了其隨機權(quán)重分配策略的通用性。但是,表情識別領(lǐng)域可能存在更好的權(quán)重分配策略,在今后的工作中將進一步深入探究。

        表3 采用不同網(wǎng)絡(luò)結(jié)構(gòu)與相同權(quán)重分配策略,平均準(zhǔn)確度測試比較

        4 結(jié)束語

        筆者提出了一種在現(xiàn)有的表情識別算法訓(xùn)練和識別的網(wǎng)絡(luò)架構(gòu)基礎(chǔ)上增加了一種隨機權(quán)重分配進行數(shù)據(jù)增強的預(yù)處理方式,解決了由于在訓(xùn)練過程中表情標(biāo)注主觀性強,歧義較大,導(dǎo)致可訓(xùn)練樣本缺少,識別準(zhǔn)確度不高等問題。實驗結(jié)果表明,文中提出的方法可提高圖像的數(shù)據(jù)庫質(zhì)量,提高分類器的性能和面目表情識別的準(zhǔn)確率。

        猜你喜歡
        準(zhǔn)確度預(yù)處理卷積
        基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        幕墻用掛件安裝準(zhǔn)確度控制技術(shù)
        建筑科技(2018年6期)2018-08-30 03:40:54
        基于傅里葉域卷積表示的目標(biāo)跟蹤算法
        基于預(yù)處理MUSIC算法的分布式陣列DOA估計
        動態(tài)汽車衡準(zhǔn)確度等級的現(xiàn)實意義
        淺談PLC在預(yù)處理生產(chǎn)線自動化改造中的應(yīng)用
        絡(luò)合萃取法預(yù)處理H酸廢水
        基于自適應(yīng)預(yù)處理的改進CPF-GMRES算法
        一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識別方法
        厨房人妻hd中文字幕| 亚洲熟妇av日韩熟妇av| 日韩av一区二区在线观看| 亚洲精品一品区二品区三区| 成人毛片av免费| 青青视频一区| 一区二区在线视频大片| 国产高清在线一区二区不卡| 国模无码一区二区三区不卡| 精品无码久久久久久久动漫| 久久精品国产亚洲av成人擦边 | 无码人妻一区二区三区在线视频| 在线成人福利| 日韩极品免费在线观看| 校园春色人妻激情高清中文字幕| 激情综合色综合啪啪五月丁香| 夜夜综合网| 国产精品人成在线765| 国产黑丝美腿在线观看| 好日子在线观看视频大全免费动漫| 一区二区精品| 亚洲一区二区三区精品久久av| av无码一区二区三区| 日韩精品无码一区二区三区视频| 日韩中文字幕网站| 国产视频激情视频在线观看| 精品国产性色无码av网站| 四虎精品视频| 亚洲精品中文字幕乱码人妻| 熟妇人妻无乱码中文字幕av| 国产精品_国产精品_k频道| 日韩精品成人无码AV片| 日韩精品人妻视频一区二区三区| 色五月丁香五月综合五月| 国产一区二区波多野结衣| 丝袜美女美腿一区二区| 精品欧美一区二区三区久久久| 国产av无码专区亚洲av琪琪| 2021久久精品国产99国产| 亚洲一区亚洲二区视频在线| 国产精品毛片一区二区|