陳春杰
(常州市公安局,江蘇 常州 213000)
步態(tài)識別作為一種新興的生物特征識別技術(shù),步態(tài)識別利用圖像和視頻序列,通過建立模型提取目標(biāo)人物步態(tài)輪廓特征,從而對人物目標(biāo)進(jìn)行身份識別。與人像識別、指紋識別等生物特征相比,步態(tài)識別具有遠(yuǎn)距離、非受控、多視角和不容易偽裝等優(yōu)點(diǎn),最適合在視頻監(jiān)控中應(yīng)用的生物特征識別方法之一。本文將針對步態(tài)特征的身份識別方法與算法展開分析[1]。
在步態(tài)特征身份識別檢測過程中,運(yùn)動目標(biāo)檢測是重要環(huán)節(jié),是了解和掌握運(yùn)動目標(biāo)步態(tài)特征的前提?;趫D像排序,通過背景建模、減除,將得到的前景圖像展開形態(tài)學(xué)處理,再進(jìn)行連通性分析,并剪裁圖像,最后利用邊緣提取技術(shù),提取運(yùn)動目標(biāo),進(jìn)而提取運(yùn)動目標(biāo)的特征[2]。
2.1.1 圖像提取
在步態(tài)特征的身份識別過程中,通過幀差法、光流法以及背景減除法提取序列圖像。其中,幀差法對背景逐漸轉(zhuǎn)變狀況并不敏感;光流法計(jì)算煩瑣、缺少實(shí)時性成效;而背景減除法快捷、簡便,適宜視頻采集設(shè)備選擇的場景。文章通過背景減除法提取運(yùn)動目標(biāo)特征,它主要包括3種算法,即混合高斯函數(shù)(Mixture of Gaussian,MOG)、GMG、MOG2。其中,GMG算法是用較少的圖像進(jìn)行背景建模的,精準(zhǔn)度不高,當(dāng)前運(yùn)用并不多。本文選擇MOG2算法進(jìn)行前景提取,是基于高斯混合模型的前景分割算法,是各像素選擇適當(dāng)數(shù)量的高斯分布,MOG2算法更加適合在亮度轉(zhuǎn)變出現(xiàn)的場景轉(zhuǎn)變。此種算法,能夠進(jìn)行陰影檢測,速度超過MOG算法[3]。MOG2算法前景提取圖如圖1所示。
圖1 MOG2算法前景提取圖
2.1.2 形態(tài)學(xué)處理
利用背景減除法得到步態(tài)圖像存在噪聲、空洞等現(xiàn)象,為避免此種現(xiàn)象對識別分析產(chǎn)生的影響,可通過圖像形態(tài)學(xué)處理方式處理得到的二值步態(tài)圖像。比較常用的形態(tài)學(xué)處理包括腐蝕、膨脹、開/閉操作等方法。首先,腐蝕是指更加簡便地清除不相關(guān)元素,能夠消除圖像中的噪聲等,公式為其中A為圖像,B為結(jié)構(gòu)元素,為B對A進(jìn)行腐蝕操作,即通過B遍歷A,清除二者不完全相交的元素值,從而完成腐蝕。其次,膨脹可看作簡便的連接操作,能夠修復(fù)圖像中的斷裂情況,公式為,其中A為圖像,b為結(jié)構(gòu)元素B有關(guān)中心點(diǎn)的映射,為B對A進(jìn)行膨脹,即通過B遍歷A,記錄二者在交集點(diǎn)進(jìn)行膨脹。在腐蝕與膨脹的前提下,還需要進(jìn)行開/閉操作。開操作可以使物體輪廓更加平滑,切斷細(xì)小間隔,公式為其中A為圖像,B為結(jié)構(gòu)元素,為B對A進(jìn)行開操作。閉操作不僅可以充分填充圖像空洞,還能夠使物體邊緣更加平滑,公式為其中A為圖像,B為結(jié)構(gòu)元素,為B對A進(jìn)行閉操作。文章對于二值化后步態(tài)圖像先進(jìn)行開操作,再進(jìn)行閉操作。形態(tài)學(xué)處理的前后對比圖如圖2所示。
圖2 形態(tài)學(xué)處理前后對比示意圖
2.1.3 互通性
將互相連通位置進(jìn)行套標(biāo)記,并且計(jì)算像素點(diǎn)情況,然后按照像素點(diǎn)數(shù)量,可以明確身體和背景區(qū)域,并且體現(xiàn)出步態(tài)特征,同時還可以有效地清除噪聲區(qū)影響。
2.1.4 圖像剪裁
在進(jìn)行圖像剪裁過程中,應(yīng)當(dāng)凸顯剪裁重點(diǎn),這樣操作的主要目的,就是為了進(jìn)一步清除背景中的多余信息。在剪裁過程中,不僅要注意圖像尺寸,還應(yīng)確保圖像的完整性。
2.1.5 圖像輪廓提取
在辨識步態(tài)特征時,應(yīng)當(dāng)根據(jù)重點(diǎn)區(qū)域,在圖像區(qū)域邊緣,通過邊緣跟蹤算法對剪裁圖像提取輪廓線,從而得到更精準(zhǔn)的人體步態(tài)特征[4]。
特征提取是基于運(yùn)動目標(biāo)檢測的前提下,對圖像序列展開周期性監(jiān)測,對關(guān)鍵幀進(jìn)行提取,從而掌握人體輪廓特征、肢體動作特征與反射對稱特征,綜合特征矢量,在分類器中識別步態(tài)特征。
2.2.1 步態(tài)周期檢測
人體在運(yùn)動過程當(dāng)中,步態(tài)體現(xiàn)出相應(yīng)的周期性,根據(jù)身體結(jié)構(gòu)、個體習(xí)慣以及行為規(guī)律進(jìn)行重復(fù)性動作。通常情況下,兩步可以作為一個步態(tài)周期。由于步態(tài)具有煩瑣性,周期難以完全精準(zhǔn),所以可以參考大概值。檢測步態(tài)周期時,通過快捷、簡便的方式,不僅能夠預(yù)估步態(tài)周期,還可以按照人體行走動作特征開展全方位分析,從而得到精準(zhǔn)的步態(tài)周期。
2.2.2 圖像幀提取
由于步態(tài)周期的不同,在對運(yùn)動目標(biāo)進(jìn)行圖像幀提取過程中,要根據(jù)顯示情況,提取其中的關(guān)鍵幀,這樣才能充分體現(xiàn)步態(tài)情況,從而精準(zhǔn)把握特征。
2.2.3 步態(tài)特征提取
提取步態(tài)特征包含人體外部輪廓特征、肢體動作特征與反射對稱特征等要素。通過傅里葉描述子對人體外部輪廓特征進(jìn)行提取,可以全面體現(xiàn)步態(tài)特征;反射對稱特征是按照人體走路的動作習(xí)慣,把反射對稱特征當(dāng)作步態(tài)差別依據(jù),進(jìn)行多方面分析,從而完成基于步態(tài)特征的身份識別。
視頻采集設(shè)備通常是固定的,容易造成在視頻設(shè)備采集范疇內(nèi),運(yùn)動目標(biāo)外形是從小到大再變小的過程。在提取步態(tài)特征時,統(tǒng)一目標(biāo)圖像能夠更容易被識別。通過圖像歸一化方式,讓各個運(yùn)動目標(biāo)圖像統(tǒng)一,包含圖像當(dāng)中運(yùn)行目標(biāo)的大小以及區(qū)域位置等。在系統(tǒng)程序當(dāng)中,制定圖像尺寸,把目標(biāo)圖像統(tǒng)一成64 px×64 px[5]。
基于智能手機(jī)設(shè)計(jì)快捷簡單的數(shù)據(jù)提取軟件。傳感器相應(yīng)頻率在5 000 Hz,為確保檢測數(shù)據(jù)盡量全面地描述目標(biāo)運(yùn)動,并且不加大后續(xù)計(jì)算工作量,程序運(yùn)行時長設(shè)置每0.02 s讀取一次數(shù)據(jù),也就是數(shù)據(jù)樣本采集頻率在50 Hz,同時記錄被檢測人員的五種運(yùn)動數(shù)據(jù)[6]。所選擇被檢測者身高在160~180 cm,體重在45~85 kg,年齡在20~45歲。在相同空氣流通、地面摩擦、衣著相近以及健康的前提下,經(jīng)過10組各100 s的自然行走進(jìn)行檢測,得到50組五種實(shí)時數(shù)據(jù),總共200 000條實(shí)時檢測記錄數(shù)據(jù),讓實(shí)驗(yàn)結(jié)果更精準(zhǔn)可靠[7]。針對每一個步態(tài)序列來講,開展步態(tài)檢測算法對運(yùn)動目標(biāo)進(jìn)行跟蹤。圖3呈現(xiàn)步態(tài)模式時空變化。訓(xùn)練與投影前,其輪廓圖像序列轉(zhuǎn)化成1D距離信號序列,通過距離信號序列,以PCA訓(xùn)練過程來執(zhí)行。按照特征空間特征幅度與相應(yīng)積累的方差曲線,選擇用前10個特征值與相應(yīng)特征向量構(gòu)建特征空間轉(zhuǎn)化矩陣。圖4呈現(xiàn)三種角度下的特征形狀信號,其體現(xiàn)步態(tài)運(yùn)動對稱特征。FERET算法識別主要分為兩種:一種是半自動算法,這種算法需要人工方式來指出圖像當(dāng)中人兩眼中心的坐標(biāo);另一種是全自動算法,這種算法可以自動定位圖像中人臉,然后進(jìn)行充分識別。在測試時,人臉圖像可以分為兩個集合:一個是已知身份的人圖像組成的目標(biāo)集;另一個是輸入算法,對未知身份人圖像組成的探測集和查詢集。通過測試可以發(fā)現(xiàn),主要問題就在于識別算法對于光照變化比較敏感,因此在查詢圖像和目標(biāo)圖像時,應(yīng)當(dāng)注意其他情況的影響[8]。
圖3 步態(tài)模式時空變化圖
圖4 三種角度下的特征形狀信號圖
3.2.1 識別性能
在具體應(yīng)用過程中,應(yīng)當(dāng)充分考量小數(shù)量樣本情況,然后通過留一交叉驗(yàn)證法,可以得到更高的識別率。之后針對相同角度,還有各個序列狀況,每次都預(yù)留一個樣本序列,同時訓(xùn)練剩余序列,最后再根據(jù)剩余樣本進(jìn)行相近性歸類,并預(yù)留部分樣本。在這個過程中,針對各角度狀況進(jìn)行了重復(fù)。表1匯總了身份識別算法和正確分類率(CCR),因此實(shí)驗(yàn)結(jié)果非常顯著。比分類誤差通過ROS,能夠定義檢測度量類型,并在最前n個匹配值間,積累了概率p(n)。性能統(tǒng)計(jì)特性,利用了累積匹配分值標(biāo)識,將階次n表示在橫軸上,而垂直抽表示了正確匹配累積百分比[9]。通過ROS對算法和性能進(jìn)行評估,如圖5所示。FERET算法運(yùn)用了STC和NED度量累積匹配圖,其中(a)運(yùn)用了STC度量,(b)運(yùn)用了投影實(shí)線和標(biāo)本投影虛線NED度量,因此正確分類率等價于p(1)。
表1 算法的正確分類率
3.2.2 校驗(yàn)性能
運(yùn)用留一校驗(yàn)法,對錯誤接受率(FAR)與錯誤決絕率(FRR)進(jìn)行預(yù)估。并運(yùn)用剩余樣本訓(xùn)練分類器,之后在多個類別當(dāng)中校驗(yàn)留出的樣本,如圖6所示,呈現(xiàn)基于NED度量ROC曲線,其中能夠看出對應(yīng)于0°、45°、90°角度等誤差率(EER)分別為20%、13%與9%。
圖6 基于NED度量ROC曲線
3.2.3 結(jié)果分析
根據(jù)圖5能夠得出以下幾個結(jié)論:
圖5 FERET算法識別結(jié)果
第一,在一定情況下,STC能夠有效捕捉時空特性,并且識別率較好。由于每幀分割誤差,或者是相應(yīng)序列間的衣著抖動影響,使得幀間區(qū)別累積到一定程度時,會提升總時空匹配誤差;當(dāng)總體序列統(tǒng)計(jì)平均數(shù)值,投影可以有效克服每幀間的噪聲問題。
第二,標(biāo)本投影NED和單一序列投影NED對比執(zhí)行情況分析。由于不同階段的步態(tài)間存在細(xì)微差異,所以運(yùn)用單一隨機(jī)樣本序列進(jìn)行對比,可以給指定人體提供更加標(biāo)準(zhǔn)的步態(tài)模式。
第三,正面識別性能較好。由于角度和輪廓形狀沒有明顯變化,在提取特征時,更多的是對個體外形信息進(jìn)行捕捉[10]。
當(dāng)前算法主要是在小規(guī)模數(shù)據(jù)庫中對性能進(jìn)行評估。此樣本數(shù)據(jù)來源于國外,包含7個人,每人4個序列,總共28個步態(tài)序列。個體針對固定設(shè)備來講是側(cè)面運(yùn)動的,全部凸顯國際于25幀/秒的速度進(jìn)行拍攝,并且原始大小在384 px×288 px。另外對比實(shí)驗(yàn)和文中不同的是其選用運(yùn)動圖像的相關(guān)圖當(dāng)作原始特征,并且通過特征空間轉(zhuǎn)化降低特征向量位數(shù),本文選擇側(cè)面角度的NLPR數(shù)據(jù)庫對此算法進(jìn)行檢測,最好識別率在73%,即便其與本文算法性能相近,但計(jì)算時長遠(yuǎn)遠(yuǎn)高于本文算法。對比二者,首先,和以往對比,由于特征提取簡便,本文算法更加容易實(shí)現(xiàn);其次,識別算法性能評估是在當(dāng)前大規(guī)模數(shù)據(jù)庫中開展,以往是在小規(guī)模樣本數(shù)據(jù)庫中完成;再次,識別性能與小樣本數(shù)據(jù)庫對比,識別率低;最后,以往是指單一側(cè)面角度開展,而本文從三個角度進(jìn)行分析,同時觀察步態(tài)特征調(diào)整對角度的敏感性。
與虹膜識別、人臉識別、指紋識別等身份識別技術(shù)相比,基于步態(tài)特征的身份識別有著較明顯的優(yōu)勢。今后,通過不斷優(yōu)化和改進(jìn)算法模型,進(jìn)一步提高算法的識別率,從而更好地將基于步態(tài)特征的身份識別技術(shù)運(yùn)用于相關(guān)領(lǐng)域,為社會提供更安全、可靠的服務(wù)。