鄧熠 畢磊 薛甜 范亞江 侯丹
摘 要:人臉識(shí)別是一項(xiàng)熱門(mén)的計(jì)算機(jī)技術(shù)研究領(lǐng)域,同時(shí)也奠定了生物特征識(shí)別的研究方向。隨著技術(shù)的進(jìn)一步成熟和社會(huì)認(rèn)同度的提高,越來(lái)越多的學(xué)者將基于神經(jīng)網(wǎng)絡(luò)的多種深度學(xué)習(xí)方法結(jié)合起來(lái),但在人臉標(biāo)志檢測(cè)方面還存在精度問(wèn)題,由此提出一種深度卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法加以解決。深度學(xué)習(xí)以多層自編碼神經(jīng)網(wǎng)絡(luò)的方式進(jìn)行預(yù)訓(xùn)練,進(jìn)而結(jié)合人臉面部信息進(jìn)一步優(yōu)化神經(jīng)網(wǎng)絡(luò)權(quán)值的深度置信網(wǎng)絡(luò)(DBN)。文章基于深度學(xué)習(xí)人臉識(shí)別發(fā)展現(xiàn)狀進(jìn)行分析,目的是進(jìn)一步提高人臉識(shí)別精度。
關(guān)鍵詞:人臉識(shí)別;深度學(xué)習(xí);深度算法;發(fā)展現(xiàn)狀
1 背景介紹
大數(shù)據(jù)時(shí)代信息冗雜,爆炸式增長(zhǎng)的數(shù)據(jù)產(chǎn)生了信息泄露等嚴(yán)峻問(wèn)題,保密機(jī)制形同虛設(shè),信息時(shí)代面臨著前所未有的巨大挑戰(zhàn)。生物特征識(shí)別技術(shù)的出現(xiàn)恰好可以有效解決此問(wèn)題,這項(xiàng)技術(shù)具有不易偽造和唯一性,可以稱之為“信息技術(shù)安全守護(hù)者”。人臉識(shí)別技術(shù)作為生物特征識(shí)別技術(shù)的核心技術(shù)之一,繼承了其唯一性的特點(diǎn),而且包含人臉的光學(xué)表示。目前人臉識(shí)別技術(shù)被廣泛用于政府、軍隊(duì)、銀行、社會(huì)福利保障、電子商務(wù)、安全防務(wù)等領(lǐng)域[1]。
2?深度學(xué)習(xí)
深度學(xué)習(xí)(Deep Learning,DL)是機(jī)器學(xué)習(xí)領(lǐng)域中的一個(gè)研究方向,是一個(gè)復(fù)雜的機(jī)器學(xué)習(xí)算法,在語(yǔ)音和圖像識(shí)別方面取得的效果,遠(yuǎn)遠(yuǎn)超過(guò)先前的相關(guān)技術(shù)。它可以經(jīng)過(guò)層間的輪班訓(xùn)練和一般的微調(diào)迫使計(jì)算機(jī)進(jìn)行自我學(xué)習(xí),并且隨著網(wǎng)絡(luò)層的增加,學(xué)習(xí)能力逐漸被委托深入的學(xué)習(xí)理論,如對(duì)比度分集算法、背乘算法、時(shí)延神經(jīng)網(wǎng)絡(luò)等專家混合系統(tǒng),對(duì)于人工智能的發(fā)展具有重要意義[2-3]。
深度學(xué)習(xí)是學(xué)習(xí)樣本數(shù)據(jù)的內(nèi)在規(guī)律和表示層次,這些學(xué)習(xí)過(guò)程中獲得的信息對(duì)諸如文字,圖像和聲音等數(shù)據(jù)的解釋有很大的幫助。隨著深度學(xué)習(xí)的發(fā)展,人臉識(shí)別技術(shù)更加成熟。
在人臉識(shí)別領(lǐng)域中,深度學(xué)習(xí)一共有以下幾種典型應(yīng)用[4-5]:
(1)基于卷積神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別方法;
(2)深度非線性人臉形狀提取方法;
(3)基于深度學(xué)習(xí)的人臉姿態(tài)魯棒性建模;
(4)約束環(huán)境下的全自動(dòng)人臉識(shí)別;
(5)基于深度學(xué)習(xí)的視頻監(jiān)控下的人臉識(shí)別;
(6)基于深度學(xué)習(xí)的低分辨率人臉識(shí)別和其他基于深度學(xué)習(xí)的人臉相關(guān)信息的識(shí)別。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)是一類包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)的代表算法之一。基于卷積神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別方法,是深度監(jiān)督學(xué)習(xí)下的機(jī)器學(xué)習(xí)模型,它可以挖掘數(shù)據(jù)的局部特征,并提取全局特征,然后進(jìn)行分類,其權(quán)值共享結(jié)構(gòu)網(wǎng)絡(luò)更類似于生物神經(jīng)網(wǎng)絡(luò),被應(yīng)用于模式識(shí)別的各個(gè)領(lǐng)域。
2.1 ?深度學(xué)習(xí)概述及發(fā)展
深度學(xué)習(xí)是神經(jīng)網(wǎng)絡(luò)的重要組成部分,有時(shí)也被稱為深度神經(jīng)學(xué)習(xí)或深度神經(jīng)網(wǎng)絡(luò)。
深度學(xué)習(xí)是由Hinton等人于2006年基于深度信網(wǎng)(DBN)提出的非監(jiān)督貪心逐層訓(xùn)練算法。隨著目標(biāo)的正確識(shí)別逐漸成為人工智能的重要組成部分,基于深度學(xué)習(xí)的人臉識(shí)別目前也成了特征識(shí)別領(lǐng)域的研究熱點(diǎn)。
2.2 ?人臉識(shí)別細(xì)分類的深度學(xué)習(xí)算法
臉部表達(dá)模型分為二維臉部和三維臉部,即2D和3D臉部。二維人臉識(shí)別的研究時(shí)間比較長(zhǎng),方法流程也比較成熟,應(yīng)用于許多領(lǐng)域,但由于二維人臉識(shí)別信息存在深度數(shù)據(jù)丟失的缺陷,無(wú)法完全表達(dá)真實(shí)的人臉,因此在實(shí)際應(yīng)用中存在著識(shí)別準(zhǔn)確率低、活體檢測(cè)率低等問(wèn)題。
現(xiàn)在市場(chǎng)上的3D人臉識(shí)別根據(jù)使用相機(jī)成像原理主要分為:3D結(jié)構(gòu)光、TOF、雙目立體視覺(jué)。
2.3 ?人臉識(shí)別算法
最近的幾年來(lái),隨著相關(guān)領(lǐng)域人員對(duì)人臉識(shí)別的研究不斷深入,現(xiàn)有的人臉識(shí)別技術(shù)主要針對(duì)現(xiàn)實(shí)環(huán)境和現(xiàn)實(shí)應(yīng)用場(chǎng)景進(jìn)行識(shí)別,具體包括以下3個(gè)方面:
(1)人臉模型的設(shè)計(jì),包括線性鑒別分析、線性建模方法、非線性建模方法和三維人臉識(shí)別[4]。
(2)新特征表征,包括局部描述和深入研究,部分說(shuō)明和深度學(xué)習(xí)方法。
(3)新的數(shù)據(jù)源,包括視頻人臉識(shí)別以及草圖和近紅外圖像。
以下是較為經(jīng)典的三大人臉識(shí)別的經(jīng)典算法:
(1)Deep Face采用了一種基于監(jiān)測(cè)點(diǎn)的人臉檢測(cè)方法。臉部檢測(cè)部分將首先選取6個(gè)基準(zhǔn)點(diǎn),2個(gè)眼心,1個(gè)鼻點(diǎn),3個(gè)口點(diǎn),然后利用SVR對(duì)LBP特征進(jìn)行特征學(xué)習(xí),獲得標(biāo)記點(diǎn)。
(2)Face Net是谷歌提議的網(wǎng)絡(luò)結(jié)構(gòu),它可以靈活地使用22層 Zelier& Fergus的網(wǎng)絡(luò),也可以使用 inception網(wǎng)絡(luò),后者目前在物體識(shí)別方面比較有效。它的主要特點(diǎn)是利用3個(gè)單元之間的距離來(lái)構(gòu)造損失函數(shù)。
(3)Center Loss不同于三元損失,中心損失并不直接優(yōu)化距離,它保留了原來(lái)的分類模型,但是為每一類分別指定了一個(gè)分類中心。同一類圖像對(duì)應(yīng)的特征都應(yīng)盡可能接近其各自類別的中心,不同類別的中心應(yīng)盡可能遠(yuǎn)離。
3 人臉識(shí)別技術(shù)在深度學(xué)習(xí)中的廣泛應(yīng)用
在不久的將來(lái),全國(guó)主流的人臉識(shí)別技術(shù)將以識(shí)別13億人像為重點(diǎn)??梢灶A(yù)見(jiàn)的是,建立一個(gè)全國(guó)統(tǒng)一的人臉圖像數(shù)據(jù)庫(kù),使存儲(chǔ)在這個(gè)數(shù)據(jù)庫(kù)中的數(shù)十億張人臉圖像的容量達(dá)到幾十億甚至幾千億張。此時(shí),可以出現(xiàn)大量性能和關(guān)鍵功能相似的人臉。如果沒(méi)有基于深度學(xué)習(xí)的人臉識(shí)別技術(shù),就沒(méi)有辦法建立更加復(fù)雜多樣的人臉模型,這就是為什么要實(shí)現(xiàn)準(zhǔn)確快速的人臉識(shí)別會(huì)更加困難的原因。
4 未來(lái)的發(fā)展與問(wèn)題
如今,基于深度學(xué)習(xí)的人臉識(shí)別技術(shù)已經(jīng)取得了很大的階段性成功;而且有著非常廣闊和光明的前景和未來(lái),它的發(fā)展空間非常的大,但隨之而來(lái)也會(huì)產(chǎn)生相關(guān)如下的幾個(gè)問(wèn)題。
4.1 重心應(yīng)該偏移至數(shù)據(jù)方面
基于深度學(xué)習(xí)的人臉識(shí)別技術(shù)的三要素—算法、硬件、數(shù)據(jù),隨著相關(guān)科技的不斷發(fā)展和經(jīng)濟(jì)水平的提高,算法與硬件的技術(shù)障礙越來(lái)越小,但是數(shù)據(jù)之間的差異則顯得越來(lái)越突出。對(duì)于人臉識(shí)別來(lái)說(shuō),把握數(shù)據(jù)入口,形成算法—產(chǎn)品—數(shù)據(jù)的閉環(huán)生態(tài)是算法在未來(lái)取勝的關(guān)鍵。與此同時(shí),對(duì)海量數(shù)據(jù)的分析處理也將成為研究的重點(diǎn)。
4.2 發(fā)展終端和云端
目前,隨著 GPU和各種深度學(xué)習(xí)芯片等人臉識(shí)別技術(shù)的發(fā)展,使設(shè)備的運(yùn)算能力得到了很大的提高,同時(shí)隨著手機(jī)、智能家居等設(shè)備的普及,前端和云端將更加智能化。
4.3 安全和隱私權(quán)
如今,數(shù)據(jù)正呈指數(shù)增長(zhǎng),數(shù)據(jù)安全和隱私問(wèn)題也變得十分重要。而且臉部識(shí)別技術(shù)正好處在容易被不法分子利用的情況下,將面臨照片、視頻、面具等各種欺詐攻擊,臉部特征在傳輸、存儲(chǔ)過(guò)程中會(huì)受到黑客和其他犯罪嫌疑人的威脅,用戶在享受深度學(xué)習(xí)帶來(lái)的便利的同時(shí),也非常關(guān)心自己的數(shù)據(jù)是否被盜用、傳播等。對(duì)活體探測(cè)、隱私加密等問(wèn)題應(yīng)加強(qiáng)研究,防止不法分子利用漏洞來(lái)侵犯用戶的權(quán)益以及隱私[6]。
4.4 兼容性
當(dāng)前,隨著深度學(xué)習(xí)相關(guān)人臉識(shí)別技術(shù)的不斷發(fā)展,相關(guān)廠商也在不斷增加,但用戶往往需要根據(jù)自己的實(shí)際情況和需求來(lái)定制所需的人臉識(shí)別系統(tǒng),但該系統(tǒng)所涉及的技術(shù)層面很多,從硬件到軟件,都需要各大廠商的支持,因此需要考慮從底層到上層的界面開(kāi)發(fā)及兼容性問(wèn)題,以推動(dòng)其發(fā)展。
5 結(jié)語(yǔ)
伴隨著人工智能時(shí)代的不斷發(fā)展,深度學(xué)習(xí)在模式識(shí)別中的應(yīng)用不斷深化,在網(wǎng)絡(luò)復(fù)雜性方面,深度學(xué)習(xí)網(wǎng)絡(luò)也需要簡(jiǎn)化算法以提高其效率。因此在網(wǎng)絡(luò)功能方面,應(yīng)探索深度學(xué)習(xí)與其他模式識(shí)別模型的結(jié)合,以不斷擴(kuò)展網(wǎng)絡(luò)接口和功能??傊?,深度學(xué)習(xí)將為包括人臉識(shí)別在內(nèi)的模式識(shí)別應(yīng)用打開(kāi)新的局面。
[參考文獻(xiàn)]
[1]劉衛(wèi)凱,郝雅倩,鄭晗,等.人臉識(shí)別綜述[J].信息記錄材料,2018(7):13-14.
[2]夏志強(qiáng).人臉識(shí)別綜述[J].電子世界,2017(23):44.
[3]徐曉艷.人臉識(shí)別技術(shù)綜述[J].電子測(cè)試,2015(10):885-894.
[4]黨永成.人臉識(shí)別技術(shù)綜述及分析[J].電子技術(shù)與軟件工程,2018(3):158.
[5]金連文,鐘卓耀,楊釗,等.深度學(xué)習(xí)在手寫(xiě)漢字識(shí)別中的應(yīng)用綜述[J].自動(dòng)化學(xué)報(bào),2016(8):1125-1141.
[6]趙鵬,王斐,劉慧婷,等.基于深度學(xué)習(xí)的手繪草圖識(shí)別[J].工程科學(xué)與技術(shù),2016(3):94-99.
(編輯 傅金睿)