摘要:針對(duì)人臉識(shí)別過(guò)程中存在的拍攝角度、多姿態(tài)表情特征等影響識(shí)別精度和成功率的問(wèn)題,本文提出了一種基于仿射變化的多姿態(tài)人臉識(shí)別技術(shù)。該技術(shù)主要采用仿射變換和攝像成像原理,對(duì)不同角度以及多姿態(tài)人臉圖像進(jìn)行調(diào)整與歸一化處理,得到人臉矯正后的正面圖像,然后通過(guò)算法實(shí)現(xiàn)對(duì)人臉圖像的識(shí)別。最后,經(jīng)測(cè)試結(jié)果證明,本文提出的人臉識(shí)別技術(shù)不僅解決了多姿態(tài)特征變化對(duì)識(shí)別造成的影響,還從一定程度上提高了人臉識(shí)別的成功率。旨在為多姿態(tài)人臉識(shí)別技術(shù)研究提供相應(yīng)的參考。
關(guān)鍵詞:仿射變換;多姿態(tài);人臉識(shí)別技術(shù);姿態(tài)變化;算法設(shè)計(jì)
近年來(lái),人臉識(shí)別技術(shù)得到了快速發(fā)展。但由于人臉圖像存在傾斜等不同姿態(tài)特征變化情況,導(dǎo)致無(wú)法成功實(shí)現(xiàn)人臉識(shí)別[1]。為解決由多姿態(tài)變化導(dǎo)致的人臉識(shí)別率低等問(wèn)題,本文提出了一種人臉多姿態(tài)矯正方法。實(shí)現(xiàn)對(duì)人臉姿態(tài)的調(diào)整,然后利用算法完成對(duì)多姿態(tài)矯正后的人臉識(shí)別。最后,經(jīng)試驗(yàn)驗(yàn)證證明了本文方法的可行性。
一、基于仿射變換的多姿態(tài)人臉矯正算法研究
為了實(shí)現(xiàn)對(duì)多姿態(tài)的人臉圖像進(jìn)行矯正,將根據(jù)仿射變換提出并推出關(guān)于人臉的姿態(tài)調(diào)整公式,從而對(duì)應(yīng)的正面人臉圖像,有利于提高測(cè)試樣本與訓(xùn)練樣本的一致性[2]。
(一)仿射變換
仿射變換是一種二維坐標(biāo)之間的線性變換,它保持了圖像的“平直性”和“平行性”。在圖像處理中,仿射變換通常包括平移、縮放、旋轉(zhuǎn)等基本操作。通過(guò)調(diào)整仿射變換的參數(shù),我們可以實(shí)現(xiàn)對(duì)人臉圖像的姿態(tài)調(diào)整。結(jié)合成像原理和仿射變換推到的二維仿射變換(Affine Transform)公式:
(1)
式(1),X0的仿射變換后的結(jié)果為X。如果拍攝目標(biāo)和攝像機(jī)間距超過(guò)目標(biāo)的大小,通過(guò)仿射變換可將其看似透視變換。因此從幾何定義上來(lái)看,可以將其看作是兩個(gè)向量空間之間的仿射變換。所以,常見(jiàn)的仿射變換分為旋轉(zhuǎn)、縮放和平移三種。
(二)成像原理
計(jì)算機(jī)科學(xué)研究當(dāng)中透視投影的原理主要是通過(guò)投影線的觀察點(diǎn)為起始點(diǎn),而其成像模型則是經(jīng)常用到的模型。因此,點(diǎn)A的像a就是光線AB上的所有點(diǎn)的像,具體見(jiàn)圖1所示。
如果攝像機(jī)上的固定直角坐標(biāo)系為O-xyz,z軸與投影軸相互重合并指向?qū)?yīng)場(chǎng)景。而x、y軸則與圖像平面坐標(biāo)軸平行。在真實(shí)的攝像機(jī)中,圖像平面通常位于攝像機(jī)中心后方,并且投影圖像呈倒立現(xiàn)象。為了解決這一問(wèn)題,通常會(huì)將圖像平面位置設(shè)定在攝像機(jī)中心的前方。
(三)人臉姿態(tài)矯正算法設(shè)計(jì)
在對(duì)多姿態(tài)人臉識(shí)別過(guò)程中,想要提高人臉識(shí)別的識(shí)別率和精度,需要應(yīng)用人臉姿態(tài)矯正算法解決不同傾角的人臉圖像。因此,根據(jù)仿射變換和透視成像原理,在此基礎(chǔ)之上對(duì)人臉姿態(tài)進(jìn)行旋轉(zhuǎn)之后,轉(zhuǎn)換成幾何模型??梢越馕龀鲫P(guān)于人臉姿態(tài)圖像的變化,可以實(shí)現(xiàn)對(duì)人臉旋轉(zhuǎn)過(guò)程中產(chǎn)生的投影平面圖像進(jìn)行全面分析[3]。三維圖像中旋轉(zhuǎn)且投影的人臉平面圖像主要分為水平、垂直以及左右等旋轉(zhuǎn)類型。
1.人臉圖像的傾斜設(shè)計(jì)
如果旋轉(zhuǎn)變換的角度為θ1時(shí),那么在仿真變換理論中的旋轉(zhuǎn)變化公式(1)可以對(duì)發(fā)生傾斜的人臉圖像姿態(tài)進(jìn)行矯正調(diào)整。這樣就可以得到兩種不同的傾斜方向:左傾斜和右傾斜,從而就可以得到對(duì)應(yīng)的調(diào)整公式。根據(jù)公式即可以得到調(diào)整后的人臉圖像像素值所對(duì)應(yīng)的二維坐標(biāo),構(gòu)成新的人臉圖像便是調(diào)整之后的人臉圖像。
2.水平旋轉(zhuǎn)設(shè)計(jì)
人臉圖像在進(jìn)行水平旋轉(zhuǎn)時(shí),此人臉圖像的方向存在旋轉(zhuǎn)的角度。假設(shè)圖像中人臉的方向是朝左方向看去,那么圖像中的人臉輪廓信息呈現(xiàn)出一邊被壓縮,另一邊呈現(xiàn)放大的現(xiàn)象。人臉正面圖像中的人臉姿態(tài)兩邊等距長(zhǎng)度或者效果相同。假設(shè)以圖像中的人臉鼻尖為中心點(diǎn)劃線(界線),那么線左右兩邊的坐標(biāo)值分別取負(fù)值和正值。然后,通過(guò)對(duì)坐標(biāo)值的正負(fù)值進(jìn)行不同角度、不同尺度的旋轉(zhuǎn),就可以實(shí)現(xiàn)對(duì)圖像中的人臉姿態(tài)進(jìn)行矯正。簡(jiǎn)單來(lái)說(shuō),就是在人臉圖像中找到中心線,然后以中線為坐標(biāo)點(diǎn),進(jìn)行不同角度的壓縮或者擴(kuò)張,從而實(shí)現(xiàn)對(duì)人臉姿態(tài)的矯正。
3.垂直旋轉(zhuǎn)設(shè)計(jì)
當(dāng)對(duì)人臉圖像進(jìn)行垂直旋轉(zhuǎn)矯正時(shí),可以選擇將人臉圖像以鼻尖位置為中心劃分為上下兩部分,并通過(guò)擴(kuò)張或者壓縮的方式進(jìn)行矯正。然而,需要注意的是,與水平旋轉(zhuǎn)相似,垂直旋轉(zhuǎn)矯正也需要對(duì)圖像的像素點(diǎn)進(jìn)行不同角度的調(diào)整,以實(shí)現(xiàn)人臉姿態(tài)的正確糾正??梢越Y(jié)合水平和垂直旋轉(zhuǎn)的方式來(lái)綜合矯正人臉圖像,從而更準(zhǔn)確地調(diào)整人臉姿態(tài)。
二、基于仿射變換的人臉識(shí)別算法設(shè)計(jì)
(一)SURF特征
SURF特征(Speed-Up Robust Features)作為一種尺度旋轉(zhuǎn)不變的特征,具有檢測(cè)子和描述子兩個(gè)部分實(shí)現(xiàn)對(duì)特征的獲取。簡(jiǎn)單來(lái)說(shuō),該特征通過(guò)在人臉圖像當(dāng)中找到某個(gè)點(diǎn)或某一些點(diǎn),并對(duì)這些點(diǎn)的特征信息進(jìn)行提取,且提取過(guò)程當(dāng)中算法的檢測(cè)子和描述子等作用下對(duì)從圖像中提取的尺度和選擇變化特征進(jìn)行處理時(shí)具有穩(wěn)定特征。一般來(lái)說(shuō),SURF在人臉識(shí)別過(guò)程中,通過(guò)將人臉目標(biāo)和對(duì)象等圖像中所存在的所有興趣點(diǎn)進(jìn)行互相匹配,接著根據(jù)互相匹配的結(jié)果實(shí)現(xiàn)對(duì)目標(biāo)圖像中的位置進(jìn)行確認(rèn)。其中,感興趣點(diǎn)也可以 被稱為特征點(diǎn),它主要指人臉圖像當(dāng)中存在獨(dú)特位置的點(diǎn),可以是傾角點(diǎn)或者斑點(diǎn)等。而感興趣點(diǎn)的匹配存在距離,需要利用對(duì)模板圖像上感興趣點(diǎn)的描述矢量間的距離進(jìn)行精準(zhǔn)計(jì)算,從而才能夠進(jìn)一步判斷興趣點(diǎn)之間是否能夠匹配[4]。
(二)特征匹配算法設(shè)計(jì)
基于SURF特征的匹配算法主要分為檢測(cè)、描述以及匹配等3個(gè)部分組成。SURF算法在實(shí)時(shí)性上相較于SIFT(Scale-Invariant Feature Transform)算法有了顯著提升,并且在多幅圖片下具有更好的魯棒性。SURF的這些特性使其在計(jì)算機(jī)視覺(jué)任務(wù),如物體識(shí)別和3D重構(gòu)中,具有廣泛的應(yīng)用價(jià)值。具體流程見(jiàn)圖2所示。雖然SURF算法在很多情況下表現(xiàn)出色,但在實(shí)際應(yīng)用中可能還需要根據(jù)具體任務(wù)和數(shù)據(jù)集調(diào)整算法的參數(shù)和閾值,以達(dá)到最佳的匹配效果。對(duì)于涉及敏感信息或需要高可靠性的應(yīng)用,建議在部署前進(jìn)行充分的測(cè)試和驗(yàn)證。
(三)改進(jìn)的人臉識(shí)別算法
通過(guò)研究發(fā)現(xiàn)SURF算法在描述矢量和興趣點(diǎn)匹配等方面存在些許不足,對(duì)人臉圖像的表達(dá)能力以及處理時(shí)間方面存在一定程度的影響。因此,需要進(jìn)行算法改進(jìn)。通過(guò)深度學(xué)習(xí)技術(shù)的引入和算法改進(jìn),成功克服了SURF算法在人臉圖像表達(dá)和處理時(shí)間方面的不足,提出了一種更加高效和準(zhǔn)確的人臉圖像特征提取和匹配算法。這一成果為人臉識(shí)別等應(yīng)用領(lǐng)域的發(fā)展提供了新的思路和方法。
1.描述符矢量改進(jìn)
在對(duì)人臉識(shí)別過(guò)程當(dāng)中,算法在獲取描述矢量時(shí),存在只應(yīng)用特征點(diǎn)周?chē)?/3的信息量的曲線。因此,為了解決該問(wèn)題使得特征點(diǎn)周?chē)乃行畔⒛軌虻玫饺坷?,需要?duì)其描述矢量進(jìn)行改進(jìn)。首先,需要計(jì)算并獲取每一個(gè)特征點(diǎn)的描述矢量時(shí),需要對(duì)特征點(diǎn)的每個(gè)子塊進(jìn)行掩模處理,如選擇利用3×3大小的模塊對(duì)子塊進(jìn)行處理,然后再對(duì)每個(gè)子塊所相對(duì)應(yīng)的模板覆蓋的地方的值,接著將每個(gè)子塊模板的值進(jìn)行相加,計(jì)算得出最后的總和,去除在掩模過(guò)程當(dāng)中存在模板重疊的地方,由此就可以得到所需要的值,也是改進(jìn)后得到的描述矢量。
2.算法匹配改進(jìn)
為解決SURF算法在人臉圖像識(shí)別過(guò)程中,對(duì)感興趣點(diǎn)匹配時(shí)需要對(duì)模板和搜索圖像中的感興趣點(diǎn)的對(duì)應(yīng)描述符矢量,其處理時(shí)間增加,人臉識(shí)別率下降這一問(wèn)題。本文根據(jù)K-Means聚類算法,提出了一種對(duì)人臉圖像中人臉姿態(tài)的所有特征點(diǎn)進(jìn)行聚類的理論,實(shí)現(xiàn)對(duì)圖像中人臉姿態(tài)上的感興趣點(diǎn)進(jìn)行提取和聚類。簡(jiǎn)單來(lái)說(shuō),先利用聚類算法對(duì)圖像中的所有感興趣點(diǎn)進(jìn)行聚類處理,然后再采用SURF算法完成對(duì)相似的類之間的興趣點(diǎn)進(jìn)行互相匹配處理。這樣一來(lái),聚類算法的應(yīng)用,有效解決了SURF算法在搜索圖像上的興趣點(diǎn)的描述符矢量之間的距離進(jìn)行計(jì)算時(shí)存在的興趣點(diǎn)匹配時(shí)間增加、識(shí)別率降低的問(wèn)題,同時(shí)還進(jìn)一步提高人臉匹配的效率。
三、測(cè)試結(jié)果與分析
(一)測(cè)試環(huán)境搭建
為了進(jìn)一步證明本文提出的人臉識(shí)別技術(shù)的可行性,對(duì)所提出的方法展開(kāi)了實(shí)驗(yàn)研究。本次測(cè)試過(guò)程中所需要用到的人臉圖像主要來(lái)源于CMU Multi-PIE人臉數(shù)據(jù)庫(kù),共選擇抽取50個(gè)人,且每個(gè)人配備4幅不同姿態(tài)的人臉圖像和1幅正面人臉圖像。并將所有測(cè)試人員的正面人臉圖像設(shè)為訓(xùn)練集,其他不同姿態(tài)人臉圖像設(shè)為測(cè)試集。同時(shí),在進(jìn)行人臉識(shí)別時(shí),先對(duì)測(cè)試樣本的人臉圖像和訓(xùn)練樣本的人臉圖像進(jìn)行了統(tǒng)一化處理,并提取出了局部以及整體特征向量。測(cè)試環(huán)境選擇采用新型PC機(jī),該設(shè)備搭配了8GB內(nèi)存、Windows11操作系統(tǒng)、CPU5.8GHz以及Visual Studio 2005。
(二)人臉矯正算法測(cè)試
針對(duì)多姿態(tài)人臉矯正算法的測(cè)試,本文選擇以傾斜人臉圖像矯正為例展開(kāi)實(shí)驗(yàn)。首先,選擇進(jìn)行矯正的人臉圖像傾斜角度為25°,通過(guò)本文提出的算法經(jīng)過(guò)矯正給出了人臉的正面圖像,本文提出的基于仿射變換的人臉圖像矯正算法的可行性,能夠?qū)崿F(xiàn)對(duì)不同傾斜角度的人臉圖形進(jìn)行矯正處理,并生成正面的人臉圖像。在矯正效果、圖像質(zhì)量以及人臉檢測(cè)與對(duì)齊準(zhǔn)確性方面均取得了顯著的提升。因此,該算法在多姿態(tài)人臉矯正領(lǐng)域具有廣闊的應(yīng)用前景。
(三)人臉識(shí)別算法測(cè)試與分析
實(shí)驗(yàn)過(guò)程當(dāng)中,本文選擇利用改進(jìn)之后的SURF算法,從識(shí)別率和識(shí)別圖像所耗費(fèi)的時(shí)間等兩個(gè)方面進(jìn)行測(cè)試,發(fā)現(xiàn)本文提出的人臉識(shí)別算法的描述符矢量對(duì)人臉信息的識(shí)別具有較強(qiáng)的表達(dá)能力[5]。這說(shuō)明該算法的識(shí)別率有明顯的提升,耗費(fèi)時(shí)間有所下降。同時(shí),為了進(jìn)一步驗(yàn)證本文提出的改進(jìn)后算法的性能,選擇將其和傳統(tǒng)人臉識(shí)別算法之間進(jìn)行了對(duì)比實(shí)驗(yàn),具體結(jié)果見(jiàn)表1所示。
根據(jù)表1結(jié)果來(lái)看,本文提出的算法在對(duì)多姿態(tài)人臉圖像識(shí)別時(shí),比傳統(tǒng)識(shí)別算法的識(shí)別率有4%的提升,且在識(shí)別過(guò)程當(dāng)中,對(duì)于每一幅圖像的識(shí)別處理時(shí)間出現(xiàn)了明顯的降低,占比為23%上下。同時(shí),該算法在對(duì)經(jīng)過(guò)人臉姿態(tài)矯正算法進(jìn)行調(diào)整過(guò)的不同旋轉(zhuǎn)角度的人臉圖像進(jìn)行人臉識(shí)別時(shí),其矯正前后的人臉識(shí)別結(jié)果見(jiàn)圖3所示。從圖中可以發(fā)現(xiàn),不同傾斜角度的人臉圖像,在經(jīng)過(guò)矯正算法矯正之后,其識(shí)別率大致一樣。但針對(duì)左右旋轉(zhuǎn)的人臉和上下旋轉(zhuǎn)的人臉進(jìn)行識(shí)別時(shí),矯正之后的人臉識(shí)別率得到明顯地提升,由此說(shuō)明了本文提出的人臉?biāo)惴ǖ目尚行浴?/p>
四、結(jié)束語(yǔ)
綜上所述,通過(guò)對(duì)多姿態(tài)人臉識(shí)別中存在的問(wèn)題進(jìn)行研究,提出了意中基于仿射變換的多姿態(tài)人臉識(shí)別技術(shù)。重點(diǎn)對(duì)多姿態(tài)人臉矯正算法展開(kāi)了研究,發(fā)現(xiàn)該方法能夠在一定程度上的角度范圍中實(shí)現(xiàn)對(duì)多姿態(tài)人員圖像矯正,并給出正面的人臉圖像。同時(shí),利用算法對(duì)人臉進(jìn)行識(shí)別,經(jīng)測(cè)試證明本文提出的方法不僅可以更好地實(shí)現(xiàn)對(duì)多姿態(tài)人臉的矯正。這對(duì)未來(lái)多姿態(tài)人臉識(shí)別領(lǐng)域的研究具有重要現(xiàn)實(shí)意義。
作者單位:劉峰 房靈國(guó) 杜輝 孫杰 中鐵云網(wǎng)信息科技有限公司
參考文獻(xiàn)
[1]徐勝超.一種新的多姿態(tài)人臉圖像識(shí)別方法[J].計(jì)算機(jī)與數(shù)字工程,2023,51(2):468-471,478.
[2]解瑞云,海本齋,劉秀等.基于深度學(xué)習(xí)的多姿態(tài)人臉識(shí)別關(guān)鍵技術(shù)研究[J].河南工學(xué)院學(xué)報(bào),2023,31(1):19-23.
[3]顧立春,雷鳴.多姿態(tài)的人臉識(shí)別算法研究[J].電腦知識(shí)與技術(shù),2022,18(21):70-72.
[4]屈諾希.基于深度學(xué)習(xí)的人臉檢測(cè)方法[D].吉林:長(zhǎng)春工業(yè)大學(xué),2022.
[5]張毅.多姿態(tài)人臉識(shí)別關(guān)鍵技術(shù)研究[D].四川:四川大學(xué),2021.
劉峰(1986-),男,遼寧葫蘆島,本科,工程師,研究方向:信息化。