孫延鵬,賀韶楓,屈樂樂
(沈陽航空航天大學(xué)電子信息工程學(xué)院,遼寧沈陽 110136)
近年來,人體身份識別技術(shù)在門禁系統(tǒng)、安防監(jiān)控和醫(yī)療診斷等領(lǐng)域有廣泛應(yīng)用。目前,指紋識別[1]、人臉識別[2]以及虹膜識別等人體身份識別技術(shù),都驗證了方法的可行性。但是指紋識別需要手指直接接觸傳感器,有衛(wèi)生隱患存在[3];人臉識別和虹膜識別主要是通過攝像機(jī)獲取信息,然而攝像機(jī)仍存在根本性的缺陷,例如,無法處理突然的閃光或在光線不足或惡劣天氣條件下進(jìn)行記錄,此外,在隱私敏感區(qū)域操作時,相機(jī)的無限制使用也受到爭議[4]。因此采用雷達(dá)傳感器進(jìn)行人體身份識別近年來受到越來越多的關(guān)注。一方面雷達(dá)傳感器是在一定的視線范圍內(nèi)發(fā)射電磁信號,雷達(dá)傳感器不易受到光線以及環(huán)境的影響,并且雷達(dá)信號能夠穿透墻壁、服飾等障礙物[5];另一方面雷達(dá)傳感器是以非接觸方式運(yùn)行,不要求測試者攜帶任何設(shè)備或者要求測試者合作[6],這極大程度地保護(hù)了個人隱私。
基于雷達(dá)傳感器的人體身份識別核心是通過人體步態(tài)來實現(xiàn)身份識別,人體步態(tài)可以簡單地定義為“走路方式”,影響人體的走路步態(tài)主要是個人的生理因素或者環(huán)境,從而使人體之間步態(tài)存在多樣性,其中對微多普勒特征的研究最具代表性[7-9]。文獻(xiàn)[10]提出提取人體步態(tài)的微多普勒特征和微動距離時間特征實現(xiàn)人體身份識別的方法,但需要提取步態(tài)數(shù)據(jù)立方體,采集過程比較繁瑣,同時數(shù)據(jù)量也過大。文獻(xiàn)[11]使用深度卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行基于步態(tài)微多普勒的人體識別,其平均識別準(zhǔn)確率從4 人的97.1%下降到20 人的68.9%,在識別能力上是欠佳的。文獻(xiàn)[12]提出了一種微多普勒分離方法,通過短時分?jǐn)?shù)傅里葉變換方法分離軀干微多普勒信號來提高身份識別的準(zhǔn)確性,使用深度卷積神經(jīng)網(wǎng)絡(luò)對10 個人的平均準(zhǔn)確率達(dá)到85.6%,但是實現(xiàn)算法的復(fù)雜度較高,實驗的準(zhǔn)確率還有待提高。文獻(xiàn)[13]在遷移學(xué)習(xí)框架下使用ResNet-50 網(wǎng)絡(luò)對步態(tài)微多普勒數(shù)據(jù)集進(jìn)行識別。文獻(xiàn)[14]采用一種多尺度特征聚合策略的普通卷積神經(jīng)網(wǎng)絡(luò)來解決識別問題,但其網(wǎng)絡(luò)過于簡單和樣本數(shù)量不足。文獻(xiàn)[15]提出一種基于時頻濾波和維特比算法的微多普勒信號分離方法,但是該算法主要受到瞬時頻率估計和時頻濾波器的限制。
針對上述問題,本文以調(diào)頻連續(xù)波(Frequency Modulation Continuous Wave,F(xiàn)MCW)雷達(dá)為基礎(chǔ),提出一種基于微多普勒信號分離和SqueezeNet 的人體身份識別方法。首先通過FMCW 雷達(dá)采集人體行走步態(tài)的回波數(shù)據(jù)并進(jìn)行預(yù)處理,再使用運(yùn)動目標(biāo)顯示(Moving Target Indication,MTI)濾波器對慢時間維進(jìn)行線性濾波處理,有效地濾除背景雜波,然后經(jīng)過短時傅里葉變換(Short-Time Fourier Transform,STFT)得到人體的微多普勒時頻譜圖[16],使用閾值法對時頻譜圖進(jìn)行微多普勒信號分離,進(jìn)而得到人體軀干與四肢分離的時頻譜圖,將時頻譜圖輸入到SqueezeNet網(wǎng)絡(luò)訓(xùn)練,最后利用Softmax分類器對人體身份進(jìn)行分類和識別。
本文使用FMCW 雷達(dá)實測人體步態(tài)回波數(shù)據(jù),對4 名測試者的步態(tài)回波數(shù)據(jù)進(jìn)行預(yù)處理,得到相對應(yīng)的微多普勒時頻譜圖。FMCW 雷達(dá)回波數(shù)據(jù)預(yù)處理方法如圖1所示。
圖1 回波數(shù)據(jù)預(yù)處理流程圖
將FMCW 雷達(dá)回波信號重構(gòu)得到二維數(shù)組,M是慢時間維采樣個數(shù),即一次采樣所含周期個數(shù),L是快時間維采樣個數(shù),即一個調(diào)頻周期的采樣點數(shù)。首先,對圖1中的矩陣列方向在快時間維進(jìn)行離散傅里葉變換(Discrete Fourier Transform,DFT),從而得到測試者距離雷達(dá)的距離信息。對測試者行走步態(tài)所在的距離單元的信號進(jìn)行相干疊加,其中距離單元范圍是10~30;其次,使用MTI 濾波器對慢時間維數(shù)據(jù)序列進(jìn)行線性濾波處理,將背景雜波有效地濾除,再沿慢時間維進(jìn)行短時傅里葉變換,從而得到微多普勒時頻譜圖,如圖2所示。其中,STFT 的窗函數(shù)是時間窗大小為0.2 s 以及重疊因子為0.95的漢寧窗。
圖2 人體步態(tài)時頻譜圖
FMCW 雷達(dá)信號沿快時間維經(jīng)過DFT 得到距離時間圖,滑動窗口沿時間軸截取,然后進(jìn)行短時傅里葉變換得到微多普勒時頻譜圖,但是由于受到軀干回波強(qiáng)烈的影響,很難從肢體微動作獲取相關(guān)精細(xì)的特征,這對于基于雷達(dá)傳感器開展人員身份識別工作,難度有所提升,因此實現(xiàn)人體步態(tài)微多普勒信號分離是有必要的。目前人們對微多普勒信號的分離是非常感興趣的,但是需要特定雷達(dá)系統(tǒng)以及提取目標(biāo)距離和頻率特征來實現(xiàn),過程很復(fù)雜。鑒于此,本文提出了一種使用閾值法對時頻譜圖進(jìn)行微多普勒信號分離的方法。該方法簡單、運(yùn)算效率高、速度快。
采用閾值法對時頻譜圖進(jìn)行微多普勒信號分離的關(guān)鍵是閾值的選取,本文選取閾值的方法是信號強(qiáng)度直方圖法。通過人體軀干微動并且四肢不動,可得到類似人體行走步態(tài)的軀干微多普勒特征,如圖3所示,代表軀干微動信號強(qiáng)度分布直方圖,-50~-25 dB之間代表實驗中的背景信號,-18~0 dB 之間代表軀干微動信號。圖4 表示人體行走步態(tài)微多普勒信號強(qiáng)度分布直方圖,是通過測試者正常行走測得的,其中包含測試者四肢和軀干的微多普勒特征,-25~-18 dB 之間代表四肢微動信號,從圖中可看出-18 dB 位置出現(xiàn)小波峰,表示包含人體行走步態(tài)四肢的微多普勒信號多。同時,由圖3 和圖4 也可直觀地得出,將本閾值設(shè)為-18 dB的合理性。
圖3 軀干微動信號強(qiáng)度分布直方圖
圖4 步態(tài)微多普勒信號強(qiáng)度分布直方圖
由于軀干的雷達(dá)橫截面通常遠(yuǎn)大于四肢的雷達(dá)橫截面,使其回波能量比較大[17],因此時頻譜圖中能量最強(qiáng)的部分來自軀干,而能量較弱的部分來自四肢,如圖5所示。信號強(qiáng)度的dB 值與時頻譜圖中顏色條(colorbar)是對應(yīng)的,通過colorbar 非常直觀地顯示,時頻譜圖中軀干信號與四肢信號對應(yīng)部分,實驗將滿足閾值條件小于-18 dB 的信號保留,得到四肢信號的時頻譜圖,從而實現(xiàn)對微多普勒信號的分離,如圖6所示,圖中分別表示了男性測試者和女性測試者的四肢與軀干的時頻譜圖。
圖5 未進(jìn)行微多普勒信號分離的時頻譜圖
圖6 進(jìn)行微多普勒信號分離的時頻譜圖
由圖5、圖6可以看出,經(jīng)過微多普勒信號分離后,測試者四肢的時頻譜圖更容易發(fā)現(xiàn)他們之間細(xì)微的差異,因此四肢的微動特征更加明顯,更有利于實現(xiàn)人體身份的識別研究。
卷積神經(jīng)網(wǎng)絡(luò)是一種特殊深層神經(jīng)網(wǎng)絡(luò),廣泛應(yīng)用于圖像識別領(lǐng)域之中,具有特征提取和分類過程結(jié)合的全局訓(xùn)練特點,因此對圖像有著相對準(zhǔn)確的識別能力。本文用于時頻譜圖識別的卷積神經(jīng)網(wǎng)絡(luò)是輕量級的SqueezeNet網(wǎng)絡(luò),該網(wǎng)絡(luò)主要的模塊是Fire 模塊,如圖7所示,此模塊主要包含Squeeze 層和Expand 層,這使網(wǎng)絡(luò)的參數(shù)大大降低,其網(wǎng)絡(luò)配置如表1所示,SqueezeNet 網(wǎng)絡(luò)的性能與AlexNet[12]相接近,但是模型參數(shù)僅有AlexNet的約1/60,模型大小也比AlexNet網(wǎng)絡(luò)小得多。
表1 SqueezeNet網(wǎng)絡(luò)配置表
圖7 Fire模塊的結(jié)構(gòu)
圖7中,H是特征圖的高,W是特征圖的寬,M是特征圖的通道數(shù),S1,e1,e2均為卷積層輸出的通道數(shù)。
原始的SqueezeNet 網(wǎng)絡(luò)最后5 層的配置是識別1 000 個類別,而本文實測的數(shù)據(jù)集是對4 個人進(jìn)行人體身份識別,因此,遷移學(xué)習(xí)模式下的SqueezeNet 網(wǎng)絡(luò)僅需要保留到表1 中的Drop9 層。網(wǎng)絡(luò)中最后一個可學(xué)習(xí)層即倒數(shù)第五層是1×1的卷積層,將其替換為4 分類的新卷積層,最后輸入到Softmax分類器中,對目標(biāo)進(jìn)行識別與分類。
Softmax 是機(jī)器學(xué)習(xí)中非常重要的工具之一,它還可以作為激活函數(shù)位于深度學(xué)習(xí)之中,Softmax 函數(shù)又稱為歸一化指數(shù)函數(shù),由于本實驗做的是多分類任務(wù),即可以看作是二分類函數(shù)在分類任務(wù)上的推廣,最后是將多分類結(jié)果通過概率的形式呈現(xiàn)出來。
Softmax 分類器將N維特征向量作為輸入,然后將每一維的值轉(zhuǎn)換成[0,1]之間的實數(shù),其公式如下:
分類,ai是該分類的值。由Softmax 分類器輸出的概率之和為1,最終Softmax 分類器選取概率值最大的類別作為輸出。
本實驗采用K 波段FMCW 雷達(dá),有4名測試者參與實驗,采集測試者步態(tài)回波數(shù)據(jù)。該雷達(dá)在FMCW 模式下工作于24 GHz,F(xiàn)MCW 雷達(dá)參數(shù)如表2所示。其中,有2名男性和2名女性,平均體重分別為70 kg/高185 cm 和53 kg/高163 cm,年齡在20~25 歲之間。圖8 顯示了實驗場景,每名測試者的采集次數(shù)為100 次,每次采集時間設(shè)定為6 s,測試總組數(shù)為100×4=400組。
表2 FMCW 雷達(dá)參數(shù)
圖8 實驗場景
通過實驗,每個人的步態(tài)數(shù)據(jù)總量為100 個,數(shù)據(jù)主要經(jīng)過STFT 得到時頻圖像,因此本文把基于微多普勒的人體步態(tài)識別問題轉(zhuǎn)化為圖像識別問題,其中,SqueezeNet網(wǎng)絡(luò)學(xué)習(xí)率為0.003,但是為了網(wǎng)絡(luò)適應(yīng)本實驗所實測的數(shù)據(jù)集,將遷移學(xué)習(xí)的網(wǎng)絡(luò)中新層的權(quán)重學(xué)習(xí)率因子和偏差學(xué)習(xí)率因子分別更改為20,其目的是加快遷移層的學(xué)習(xí)速度。
為了評估本實驗方法的分類性能,將數(shù)據(jù)集按照8∶2的比例劃分訓(xùn)練集和數(shù)據(jù)集,可以通過混淆矩陣看到實驗結(jié)果。如圖9 和圖10所示,橫軸代表4 個類別的預(yù)測值,縱軸代表4 個類別的真實值,圖中藍(lán)色對角線區(qū)域表示分類正確的數(shù)量,粉色區(qū)域代表分類出錯的個數(shù),相比于未進(jìn)行微多普勒信號分離的人體身份識別測試結(jié)果,完成微多普勒信號分離的人體身份識別測試結(jié)果的分類錯誤較少,圖9表示的未進(jìn)行微多普勒信號分離的人體身份識別準(zhǔn)確率為93.5%,而圖10 表示的進(jìn)行微多普勒信號分離的人體身份識別準(zhǔn)確率為98.75%,由此可得,經(jīng)過微多普勒信號分離后人體身份識別準(zhǔn)確率提高了5.25%,因為人體步態(tài)的差異主要體現(xiàn)在走路四肢的差異。因此,實現(xiàn)微多普勒信號分離的研究方法,使肢體信號特征更明顯,有利于增強(qiáng)人體身份識別的效果。
圖9 未進(jìn)行微多普勒信號分離的測試結(jié)果
圖10 進(jìn)行微多普勒信號分離的測試結(jié)果
本文采用的人體身份識別網(wǎng)絡(luò)是SqueezeNet輕量級網(wǎng)絡(luò),輕量級網(wǎng)絡(luò)旨在保持模型精度基礎(chǔ)上進(jìn)一步減少模型參數(shù)量和復(fù)雜度,下面將SqueezeNet 網(wǎng)絡(luò)與文獻(xiàn)[11-14]中網(wǎng)絡(luò)模型進(jìn)行比較,比較結(jié)果如圖11、圖12所示。
圖11 不同訓(xùn)練集性能比較
圖12 網(wǎng)絡(luò)性能對比
訓(xùn)練集的大小是影響人體步態(tài)識別性能的一個實際因素,在數(shù)據(jù)采集過程中,人體步態(tài)數(shù)據(jù)集的采集是一個費時費力的過程。在這種情況下,我們將訓(xùn)練集的規(guī)模占比分別設(shè)為20%、40%、60%、80%,對4 個網(wǎng)絡(luò)進(jìn)行性能比較。如圖11所示,每個網(wǎng)絡(luò)隨著訓(xùn)練集占比減少,網(wǎng)絡(luò)性能都在降低,這可能是因為步態(tài)訓(xùn)練數(shù)據(jù)過少時出現(xiàn)過擬合問題,但是SqueezeNet網(wǎng)絡(luò)的性能還是優(yōu)于其他網(wǎng)絡(luò)。由柱狀圖可以看出,SqueezeNet網(wǎng)絡(luò)在訓(xùn)練樣本很少的時候也有較高的性能,在小樣本學(xué)習(xí)中更占有優(yōu)勢。
與此同時,本文還通過其他方面對網(wǎng)絡(luò)性能進(jìn)行了比較,主要是通過測試時間、準(zhǔn)確率、網(wǎng)絡(luò)參數(shù)量這三方面,如圖12所示,為了避免實驗的偶然性,該數(shù)據(jù)是進(jìn)行5次實驗取平均。由折線圖可直觀看出,相對于其他網(wǎng)絡(luò),SqueezeNet 網(wǎng)絡(luò)測試時間是比較短的,能夠在短時間內(nèi)完成步態(tài)識別人體身份工作;其次是網(wǎng)絡(luò)準(zhǔn)確率方面,4 個網(wǎng)絡(luò)都有較高的準(zhǔn)確率,但是本文使用的SqueezeNet網(wǎng)絡(luò)還是略高一些;最后,每個網(wǎng)絡(luò)的參數(shù)量還是差別很大的,AlexNet 網(wǎng)絡(luò)的參數(shù)量是SqueezeNet 網(wǎng)絡(luò)約68 倍。由此可以得出結(jié)論,之于各方面因素的考慮,本文所提的SqueezeNet網(wǎng)絡(luò)模型在雷達(dá)人體身份識別方面優(yōu)于其他模型。
本文提出一種基于微多普勒信號分離和SqueezeNet的人體身份識別方法。對區(qū)分、識別不同行走的人方面有巨大的潛力。本文實現(xiàn)了微多普勒信號分離方法,實驗結(jié)果表明,該方法的性能優(yōu)于未進(jìn)行微多普勒信號分離的人體身份識別方法。同時,本文通過采用輕量級SqueezeNet 網(wǎng)絡(luò),已經(jīng)實現(xiàn)了對4個人的分類與識別問題。
雖然本文的實驗結(jié)果是令人滿意的,但仍需要做一些改進(jìn)。一方面,我們將進(jìn)一步增加步態(tài)數(shù)據(jù)集的規(guī)模和復(fù)雜性,例如增加測試者的人數(shù)以及不同動作;另一方面,我們需增強(qiáng)我們實驗的應(yīng)用性能,比如,同時進(jìn)行多人身份識別以及拒絕未知身份的人員識別。