劉舒天
(長春金融高等??茖W(xué)校 吉林長春 130000)
身份認(rèn)證在現(xiàn)代社會各行業(yè)、領(lǐng)域都得到了普遍關(guān)注,是評估人員屬性、認(rèn)定其是否合法、查詢?nèi)藛T行蹤的一種重要措施。不同人員受到遺傳因素的影響,存在個人特點(diǎn)上的差異,這種差異是組織身份認(rèn)證的依據(jù)之一,如人員面部特征的不同,可作為分析、認(rèn)定其身份的可靠依據(jù),這也客觀催生了人臉檢測與識別技術(shù)[1]。該技術(shù)的出現(xiàn)時間不長,但因優(yōu)勢突出、應(yīng)用便捷,快速得到關(guān)注和運(yùn)用,就其運(yùn)用方式、困境和發(fā)展方向進(jìn)行分析,有助于推動技術(shù)的進(jìn)一步發(fā)展。
人臉檢測技術(shù)(Face Detection Technology)和人臉識別技術(shù)(Face Recognition Technology)帶有一定的遞進(jìn)關(guān)系,前者一般作為后者的前置階段,廣義的人臉識別技術(shù)也可包括人臉檢測,二者在技術(shù)和應(yīng)用方式、目的上帶有一定的互通性,可共同使用在人員身份認(rèn)證等活動中,并稱人臉檢測與識別技術(shù)。該技術(shù)通常利用終端設(shè)備進(jìn)行人臉信息的檢測,生成待檢測信息并做數(shù)字轉(zhuǎn)化,再利用分析比較的計算機(jī)技術(shù)識別人臉。從屬性上看,人臉檢測與識別技術(shù)可納入生物特征識別技術(shù)大范圍內(nèi),是對生物體(一般特指人)生物特征進(jìn)行分析,用以區(qū)分生物體個體。目前與之相關(guān)的技術(shù)還包括人臉追蹤偵測、自動調(diào)整影像放大、夜間紅外偵測、自動調(diào)整曝光強(qiáng)度等[2]。
在企業(yè)管理工作中,人臉檢測與識別技術(shù)的運(yùn)用主要用于人員身份的分析,包括企業(yè)考勤、區(qū)域獨(dú)立管理等。部分企業(yè)的核心技術(shù)區(qū)域并不廣泛開放進(jìn)出權(quán)限,需要組織獨(dú)立認(rèn)證,該模塊中人臉檢測與識別技術(shù)的運(yùn)用框架如圖1所示。
圖1 人臉檢測與識別技術(shù)的運(yùn)用框架(企業(yè)獨(dú)立認(rèn)證模塊)
對圖1 所示的工作框架進(jìn)行解析,可發(fā)現(xiàn)其大致分為4 個部分,即執(zhí)行終端、管理終端、信息庫、輔助結(jié)構(gòu)。
執(zhí)行終端主要用于人臉檢測工作,對待檢測人員的面部特征信息進(jìn)行收集(如圖2 所示),并做必要的數(shù)字化轉(zhuǎn)化,使其成為能夠被計算機(jī)讀取和使用的信息。此外執(zhí)行終端也提供反饋服務(wù),系統(tǒng)完成認(rèn)證后,將認(rèn)證結(jié)果反饋給待檢測人員,提示其進(jìn)行重復(fù)認(rèn)證或認(rèn)證已經(jīng)通過。執(zhí)行終端一般以數(shù)字化設(shè)備為中心,如數(shù)字化攝像機(jī)、顯示器等。
圖2 人臉檢測識別技術(shù)工作圖(面部特征分析)
管理終端即企業(yè)的信息化工作系統(tǒng),主要根據(jù)執(zhí)行終端收集的信息,對人員進(jìn)行識別。該模塊識別可分為兩種情況,即“合法—放行” “不合法—攔截、警報和重復(fù)認(rèn)證”。在執(zhí)行終端提供了待檢測人員信息后,管理平臺根據(jù)已經(jīng)建成的人臉信息庫信息,對待檢測人員進(jìn)行分析,主要以降維分析的方式做重點(diǎn)信息的對照,能夠匹配相關(guān)特征,滿足“合法—放行”要求,可允許人員進(jìn)入目標(biāo)工作區(qū)域;反之,人員面部特征與已經(jīng)建成的人臉信息庫信息不匹配,需要組織攔截,要求人員重復(fù)認(rèn)證,并將相關(guān)信息提供給管理處做備份,作為后續(xù)管理工作的開展依據(jù)。
信息庫是人臉檢測與識別技術(shù)運(yùn)用的關(guān)鍵依據(jù),企業(yè)需要在系統(tǒng)投入使用前首先進(jìn)行信息庫建設(shè),根據(jù)本企業(yè)的工作制度要求,將擁有目標(biāo)區(qū)域進(jìn)出權(quán)限的人員單獨(dú)列出,采集其面部信息,錄入信息庫中作為后續(xù)管理的依據(jù)。實(shí)際工作中,如果待檢測人員擁有進(jìn)出權(quán)限,其信息已經(jīng)被錄入信息庫,可通過實(shí)時檢測并進(jìn)入目標(biāo)區(qū)域,反之則予以攔截。高質(zhì)量的信息庫還應(yīng)擁有信息擴(kuò)展、復(fù)用等方面的優(yōu)勢,以服務(wù)企業(yè)的其他管理工作,改善人臉檢測與識別技術(shù)的運(yùn)用效果和技術(shù)覆蓋效應(yīng)。
輔助結(jié)構(gòu)包括警報器、通信系統(tǒng)等,這些結(jié)構(gòu)主要發(fā)揮輔助功能,作為人臉檢測與識別技術(shù)系統(tǒng)終端功能的輔助,或作為系統(tǒng)功能實(shí)現(xiàn)的輔助,帶有一定的共性、應(yīng)用性特征,能夠較為便捷地使用和更換,減少人臉檢測與識別技術(shù)系統(tǒng)建設(shè)的成本,提升其技術(shù)適用的普遍性。
人臉檢測與識別技術(shù)運(yùn)用的關(guān)鍵技術(shù),以智能技術(shù)為代表,以降維計算技術(shù)為核心。實(shí)際工作中,企業(yè)以及其他組織的人臉檢測和識別工作一般需要自動化進(jìn)行,在無人、半無人模式下,智能技術(shù)相關(guān)工作的開展提供了保障[3]。借助企業(yè)管理中心提供工作程序,以計算機(jī)程序提供管理邏輯,并組織執(zhí)行,人臉檢測與識別技術(shù)應(yīng)用的重復(fù)性,使智能技術(shù)的運(yùn)用有跡可循,也擁有良好的實(shí)現(xiàn)空間。只要企業(yè)預(yù)建設(shè)的信息庫信息豐富、完善,即可保證人臉檢測與識別技術(shù)的運(yùn)用質(zhì)量。
降維計算則是組織人臉實(shí)時識別的中心技術(shù),一方面人臉的特征各有不同,這是進(jìn)行人臉檢測、識別的關(guān)鍵,另一方面,人臉特征可通過多個維度分別獨(dú)立表達(dá),如果對所有維度進(jìn)行收集、分析、呈現(xiàn),計算機(jī)在短時間內(nèi)的工作負(fù)荷往往較大,因此,需要以降維計算的方式,使人臉最具特點(diǎn)的特殊信息得到捕捉和呈現(xiàn),與企業(yè)已經(jīng)建設(shè)完成的人臉信息庫內(nèi)信息進(jìn)行對照,以高效率、較精準(zhǔn)地完成識別[4]。降維計算應(yīng)用的基礎(chǔ)是既有的客觀信息,其數(shù)目越多,智能工作的精準(zhǔn)性越高,一般可選取3~4個維度進(jìn)行信息采集和對照,如眉間距、眉弓位置、嘴唇厚度等。
企業(yè)管理中,人臉檢測與識別技術(shù)的運(yùn)用一般是流程化的,以企業(yè)設(shè)定的工作系統(tǒng)要求為基礎(chǔ),也考慮技術(shù)的共性特點(diǎn),可大致分為3個步驟。
2.3.1 信息預(yù)處理、信息庫建設(shè)
在人臉檢測與識別技術(shù)正式投入前,首先對人員信息進(jìn)行收集、處理,建設(shè)信息庫,并保證信息庫內(nèi)信息與人臉檢測與識別技術(shù)工作系統(tǒng)處于同一個管理框架內(nèi)。
2.3.2 實(shí)時信息采集
當(dāng)人員嘗試進(jìn)出企業(yè)某些工作區(qū)域時,由系統(tǒng)對其面部信息進(jìn)行收集、傳輸,由企業(yè)管理平臺進(jìn)行管理,根據(jù)信息庫內(nèi)信息,做檢測和識別,以確定人員身份,確定其合法性[5]。
2.3.3 反饋和信息存儲
根據(jù)檢測識別結(jié)果,將對應(yīng)信息反饋給待檢測人員以及企業(yè)管理處,主要為放行信息、攔截信息,以及對應(yīng)的數(shù)字化工作報告。
通過計算機(jī)建立模擬實(shí)驗(yàn),選取沈陽市TX有限公司(下文簡稱TX 公司)為例,根據(jù)該企業(yè)提供的17 份資料建立模擬實(shí)驗(yàn)。17 份資料主要為企業(yè)內(nèi)17 個工作人員的面部照片,共計251張(其中標(biāo)準(zhǔn)照片51張),清晰度為720 P(51張)、480 P(144張)和360 P(56張);按照片內(nèi)容,可分為無裝飾照片146 張,裝飾照片105張,其中裝飾照片主要對面部特征進(jìn)行遮掩或部分遮掩。按曝光情況,包括強(qiáng)曝光照片52 張,普通曝光照片199張。將所有人員照片(標(biāo)準(zhǔn)照片51張)錄入計算機(jī)形成虛擬信息庫,開始組織實(shí)驗(yàn)。不做實(shí)驗(yàn)條件的其他調(diào)整,只考慮正常狀態(tài)下系統(tǒng)對不同照片的識別能力,所獲結(jié)果如表1所示。
表1 實(shí)驗(yàn)信息
清晰度不同的實(shí)驗(yàn)照片,基本均可得到識別,總數(shù)為199 張,識別率為99.5%,這表明不同清晰度不嚴(yán)重影響人臉檢測與識別技術(shù)的運(yùn)用質(zhì)量。存在裝飾的情況下,照片的可識別能力下降,45 張未能得到識別的均為有裝飾照片,這表明當(dāng)面部特征被遮掩、部分遮掩時,人臉檢測與識別技術(shù)不能有效完成識別,識別率只有77.5%。曝光強(qiáng)度也影響照片的識別效率,19 張未能有效識別的照片均為強(qiáng)曝光照片。
人臉檢測與識別技術(shù)的運(yùn)用普遍,但仍存在不足,其典型問題之一是對動態(tài)變化無法有效匹配。包括模擬實(shí)驗(yàn)中有無裝飾的影響,也包括人員年齡變化、表情變化導(dǎo)致的面部特征波動,這些因素在實(shí)際工作中比較常見,影響也較突出。在公安部門的管理工作中,如果人員信息(面部特征)在較長時間未能得到更新,其面部特征的變化往往比較明顯,很難繼續(xù)利用此前建立的信息庫進(jìn)行對照分析,以致檢測和識別效果失真。
工作環(huán)境即人臉檢測與識別技術(shù)的運(yùn)用環(huán)境,常規(guī)的企業(yè)管理、辦公室管理通常無須考慮環(huán)境影響,如果人臉檢測與識別技術(shù)工作系統(tǒng)處于一些特殊環(huán)境下,則需要考慮環(huán)境破壞,如模擬實(shí)驗(yàn)中,強(qiáng)曝光環(huán)境影響照片的識別效率,只有90.5%的照片得到識別。此外,如果工作區(qū)域存在電磁干擾問題,雖然不影響照片質(zhì)量,但會對系統(tǒng)內(nèi)的通信活動造成影響,導(dǎo)致識別過程延誤、識別質(zhì)量下降等問題。系統(tǒng)軟件、硬件配置情況影響人臉檢測與識別技術(shù)的內(nèi)部工作環(huán)境,原則上需要加強(qiáng)配置管理,質(zhì)量較差的計算機(jī)可能無法在短時間內(nèi)完成降維計算,也影響人臉檢測與識別技術(shù)應(yīng)用效果。
早在2014年,人臉檢測與識別技術(shù)的工作質(zhì)量已經(jīng)滿足一般要求,對人臉識別的準(zhǔn)確率可達(dá)到95%甚至97%以上,超過人工識別效果。然而由于人臉檢測與識別技術(shù)的運(yùn)用環(huán)境各有不同,其進(jìn)一步運(yùn)用往往受到制約,如上文所述的動態(tài)信息匹配問題,即便人員面部出現(xiàn)特征波動、佩戴了飾物,人工識別的準(zhǔn)確率依然較高,而智能識別尚不具備此方面的能力,出現(xiàn)錯誤識別的可能性較高。一般認(rèn)為人臉識別的精確度達(dá)到72%,即表示識別成功,而在香港中文大學(xué)教授湯曉鷗、王曉剛及其研究團(tuán)隊的研究中,其研發(fā)的DeepID人臉識別技術(shù),準(zhǔn)確率超過99%,由于其技術(shù)實(shí)現(xiàn)難度較大,仍不能普遍運(yùn)用。設(shè)法提升人臉檢測與識別技術(shù)的精度,是未來相關(guān)技術(shù)的核心進(jìn)步方向。
在對人臉進(jìn)行檢測時,目前普遍使用的終端采集模式,如果檢測范圍內(nèi)的標(biāo)的物比較簡單,信息采集工作也可以比較順利地進(jìn)行。如果檢測范圍內(nèi)標(biāo)的物較多,則可能出現(xiàn)檢測對象信息采集上的困擾。如多人進(jìn)入畫面、活動物進(jìn)行檢測范圍,信息采集的質(zhì)量往往因此下降,系統(tǒng)可能錯誤選擇采集對象,將其他人物的面部作為采集的原始對象,或?qū)⑵渌顒游镒鳛槿四樳M(jìn)行信息采集,此類問題比較普遍,影響人臉檢測與識別技術(shù)的運(yùn)用。
人臉檢測與識別技術(shù)的發(fā)展,會更多關(guān)注動態(tài)因素的分析、研究。如人員面部特征的變化,以時間為參數(shù),人員面部特征的變化并非完全無跡可尋,當(dāng)前部分研究部門已經(jīng)通過AI 智能完成了一些人員面部特點(diǎn)變化模擬,但由于尚不能獲取被模擬者面部變化特征的真實(shí)照片,其模擬結(jié)果的可靠性依然有待評價。人員面部飾物、表情等因素帶來的影響,也正在得到控制。在一些技術(shù)較發(fā)達(dá)的國家、地區(qū),已經(jīng)支持全面部特征的綜合分析,雖然其分析方式依然不能完全擺脫降維計算的范圍,但動態(tài)分析能夠更有效地獲取人員面部特征,使實(shí)時信息收集檢測、識別的效率和精度得到了一定程度的提升。
環(huán)境對人臉檢測與識別技術(shù)的運(yùn)用存在直接影響,未來除在系統(tǒng)建設(shè)方面尋求優(yōu)化外,還要求對周邊工作環(huán)境進(jìn)行分析。系統(tǒng)建設(shè)原則上要求選取性能較佳的硬件設(shè)備,如果設(shè)備內(nèi)需要進(jìn)行信息庫(即人臉信息庫)建設(shè),其磁盤空間理論上不宜低于1 TB,虛擬內(nèi)存應(yīng)達(dá)到8 GB 以上,以快速組織計算,完成降維分析和識別。系統(tǒng)工作環(huán)境應(yīng)遠(yuǎn)離大型用電設(shè)備、變電室、配電站、架空線路。為保證信息傳輸?shù)馁|(zhì)量,可考慮在系統(tǒng)內(nèi)放置提純器,以清除其他通信噪聲的干擾,保證人臉檢測與識別技術(shù)的運(yùn)用效果和作業(yè)精度[6]。
工作質(zhì)量的改進(jìn)是人臉檢測與識別技術(shù)發(fā)展的基本思路、方向,主要要求根據(jù)其當(dāng)前工作的不足分析原因,根據(jù)原因分析可行的優(yōu)化策略,直接改進(jìn)相關(guān)工作效果。例如:很多企業(yè)運(yùn)用的人臉檢測設(shè)備在清晰度上存在不足,部分終端設(shè)備的分辨率只有240 P,難以對復(fù)雜圖像、相似的面部特征進(jìn)行區(qū)別,此類設(shè)備的優(yōu)化思路主要強(qiáng)調(diào)提升清晰度,使其達(dá)到360 P 或480 P以上的水平,保證復(fù)雜圖像的解析能力,使相似的面部特征能夠得到區(qū)分,改進(jìn)識別能力。其他方面的分析、處理也遵循此思路,關(guān)注優(yōu)化的針對性。
檢測方式的優(yōu)化,可以直接提升人臉檢測與識別技術(shù)的運(yùn)用質(zhì)量,未來主要強(qiáng)調(diào)改善工作的智能化水平,將人臉的基本特征進(jìn)行提煉,生成一個工作模型,之后編寫為固定程序,植入人臉檢測與識別技術(shù)系統(tǒng)內(nèi),使系統(tǒng)在工作過程中能夠主動完成核心標(biāo)的物的鎖定,完成對非標(biāo)的物的顧慮,包括檢測范圍內(nèi)其他人員的面部、活動物等,以保證信息實(shí)時收集的質(zhì)量和準(zhǔn)確性,提升人臉檢測與識別技術(shù)應(yīng)用質(zhì)量。
綜上所述,人臉檢測與識別技術(shù)的優(yōu)勢突出,可廣泛提升管理質(zhì)量,應(yīng)結(jié)合其現(xiàn)有不足、積極尋求改進(jìn)。結(jié)合企業(yè)管理工作,可知人臉檢測與識別技術(shù)的運(yùn)用需要以穩(wěn)定的物理、技術(shù)框架為基礎(chǔ),重視終端和管理端技術(shù)聯(lián)用,模擬分析則表明技術(shù)應(yīng)用的價值理想。當(dāng)前人臉檢測與識別技術(shù)存在一定不足,對動態(tài)變化的匹配能力不高,工作質(zhì)量、檢測方式有待優(yōu)化。未來其發(fā)展除強(qiáng)調(diào)基礎(chǔ)技術(shù)的改進(jìn)外,也關(guān)注上述問題應(yīng)對,以提升動態(tài)分析能力、優(yōu)化檢測方式、改進(jìn)工作質(zhì)量為目標(biāo),進(jìn)一步擴(kuò)展技術(shù)的運(yùn)用空間、發(fā)揮其積極作用。