張 丹,譚運(yùn)林,邱嘉煒,徐悅月,田林芳,張連明
(湖南師范大學(xué)信息科學(xué)與工程學(xué)院,中國(guó) 長(zhǎng)沙 410081)
身份識(shí)別在生活中扮演著重要的角色?,F(xiàn)有的身份識(shí)別方法主要分為兩大類:一類是基于計(jì)算機(jī)視覺[1,2]的方式,通過攝像頭采集人的行為動(dòng)作圖像進(jìn)行特征提取與識(shí)別。該方法存在隱私問題,且有遮擋時(shí)會(huì)影響識(shí)別效果。另一類是基于人的生理特征,通過采集人的指紋[3]及虹膜[4]等生理特征信息進(jìn)行識(shí)別。但該方法要求人員與檢測(cè)設(shè)備有一個(gè)較近的距離。本文提出了一種基于Wi-Fi信道狀態(tài)信息(Channel State Information, CSI)的身份識(shí)別技術(shù),利用Wi-Fi信號(hào)進(jìn)行身份識(shí)別成本低,不泄露隱私,也不要求人與設(shè)備之間有很近距離,適合家庭環(huán)境。該方法在智能家居和家庭防盜方面有著廣闊的應(yīng)用前景。
CSI包含每個(gè)子載波的相位、幅度等信息,受組合時(shí)延、振幅衰減和相位偏移等多種因素影響。本文利用它所傳輸?shù)倪@些信息進(jìn)行識(shí)別。每個(gè)人的體型、肢體擺動(dòng)幅度以及行為習(xí)慣都會(huì)對(duì)CSI信息造成不同的影響,本文通過對(duì)這些信息的分析和處理來進(jìn)行識(shí)別。
近年來有大量工作致力于利用Wi-Fi來進(jìn)行環(huán)境感知和行為分析。Bahl[5]等提出利用接收信號(hào)強(qiáng)度(Received Signal Strength, RSS)進(jìn)行室內(nèi)定位。然而,其檢測(cè)結(jié)果的精度并不高,主要是因?yàn)镽SS穩(wěn)定性較差。隨后研究者發(fā)現(xiàn),相比于RSS,CSI更加穩(wěn)定,CSI是物理層信息,具有更好的細(xì)粒度和魯棒性。因此,CSI得到了很快發(fā)展,有了很多研究應(yīng)用。如行為識(shí)別[6-9]、室內(nèi)定位[10-12]、心跳呼吸檢測(cè)[13-14]、跌倒檢測(cè)[15-16]、擊鍵檢測(cè)[17]、身份識(shí)別[18-21]、入侵檢測(cè)[22]等。 在身份識(shí)別方面,已有多個(gè)團(tuán)隊(duì)進(jìn)行研究。如Zeng等[18]提出WiWho,通過WiFi感知人體運(yùn)動(dòng)步態(tài)從而區(qū)分不同人,實(shí)現(xiàn)身份識(shí)別,相應(yīng)的識(shí)別率為80%~92%。Wii[19]不僅對(duì)單個(gè)步伐進(jìn)行提取,還對(duì)連續(xù)多個(gè)步伐進(jìn)行特征提取,且分類時(shí)利用GMM模型,識(shí)別準(zhǔn)確率平均為98.7%,當(dāng)有8個(gè)人時(shí),識(shí)別準(zhǔn)確率為90.9%。WiFi-ID[20]則是直接對(duì)整個(gè)行走行為進(jìn)行分析。對(duì)于從2~6個(gè)人的群體,其識(shí)別率為77%~93%。本文加入子載波篩選及行走區(qū)間檢測(cè)等算法提出了一種新的身份識(shí)別系統(tǒng),具有較高的識(shí)別率。
圖1 系統(tǒng)框圖Fig. 1 System block diagram
本文提出一個(gè)基于Wi-Fi信號(hào)的身份識(shí)別系統(tǒng)。該系統(tǒng)包括數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、行走區(qū)間檢測(cè)及分類4個(gè)階段。系統(tǒng)框架圖如圖1所示。
CSI是物理層信息,反映了信道狀態(tài)特征。每組CSI值包含了正交頻分復(fù)用(OFDM)子載波的幅度和相位信息:
H(k)=|H(k)|ej∠H(k),
(1)
其中,H(k)為第k個(gè)子載波的值;|H(k)|代表第k個(gè)子載波的幅值,∠H(k)為第k個(gè)子載波的相位信息。
IEEE 802.11標(biāo)準(zhǔn)使用OFDM調(diào)制信號(hào),將信號(hào)通過56個(gè)正交子載波進(jìn)行傳送。通過使用Intel 5300網(wǎng)卡[20]或者Atheros網(wǎng)卡[21]及其相應(yīng)工具可以實(shí)現(xiàn)CSI數(shù)據(jù)收集,CSI數(shù)據(jù)為56×Nt×Nr個(gè)數(shù)據(jù)流組成。其中,Nt代表發(fā)送天線個(gè)數(shù),Nr代表接收天線個(gè)數(shù),可表示為矩陣H:
(2)
Hnm代表第n根發(fā)射天線,第m根接收天線之間的CSI,每個(gè)Hnm包含56個(gè)載波。
由圖2可知,商用Wi-Fi網(wǎng)卡中提供的CSI值中存在著固有噪聲。人體活動(dòng)對(duì)信號(hào)帶來的影響主要是在頻譜的低頻部分0~40 Hz[16],噪聲的頻率主要位于頻譜的高頻部分。
圖2 原始CSI波形圖Fig. 2 Original CSI waveform
為了減少噪聲本文采用Butterworth濾波器。其原理如下:
|H(ω)|2=1/[1+(ω/ωc)2n]=1/[1+ε2(ω/ωp)2n],
(3)
其中,n為濾波器階數(shù),ωc為通帶截止頻率,ωp為通頻帶邊緣頻率。圖3是濾波后的波形,可以看出濾波后波形變得更為平整。
圖3 Butterworth濾波Fig. 3 Butterworth filtering
由于發(fā)送端和接收端持續(xù)工作,在沒有人移動(dòng)的情況下,CSI數(shù)據(jù)捕捉到的是周圍環(huán)境噪聲的影響(圖4)。這些數(shù)據(jù)對(duì)于身份認(rèn)證是無用的,需要舍棄。當(dāng)人穿過視線路徑(LOS)時(shí)會(huì)引起CSI波形變化,這些數(shù)據(jù)應(yīng)被保存用于識(shí)別(圖5中藍(lán)色部分應(yīng)被丟棄數(shù)據(jù),紅色為保留下來的數(shù)據(jù))。因此,本文提出了一種行走區(qū)間檢測(cè)算法(ADA),如下所示。
圖4 無人行走時(shí)CSI波形Fig. 4 CSI waveform when no one walks
圖5 ADA異常檢測(cè)Fig. 5 ADA anomaly detection
ADA算法:
1)輸入:butter濾波后的CSI載波H(k),異常持續(xù)時(shí)間T
2)輸出:行走引起的異常數(shù)據(jù)
6)If峰峰值<閾值2 去掉這個(gè)中心點(diǎn)。
收到的CSI信息為Nt×Nr對(duì),在實(shí)驗(yàn)中共6對(duì)。圖6繪制了不同天線對(duì)的不同子載波幅度波形圖。圖6(b)可以看出不是所有天線對(duì)接收到的CSI都可以用來識(shí)別,經(jīng)過實(shí)驗(yàn)分析選用了天線對(duì)1,3,5。每一對(duì)收發(fā)天線均含有56個(gè)子載波信息,圖6(a)(c)可以看出并不是所有子載波信息都是有用的,無用子載波在很大程度上影響了分類結(jié)果。通過計(jì)算每一個(gè)子載波的標(biāo)準(zhǔn)偏差,來選取標(biāo)準(zhǔn)偏差大于均值的子載波。
圖6 不同天線對(duì)不同子載波波形(a)第一對(duì)天線子載波波形;(b)第四對(duì)天線子載波波形;(c)第五對(duì)天線子載波波形Fig. 6 (a) First pair of antenna subcarrier waveforms, (b) Fourth pair of antenna subcarrier waveforms, (c) Fifth antenna subcarrier waveform
經(jīng)過預(yù)處理和異常檢測(cè)后,從CSI幅度中提取以下幾個(gè)特征作為分類器特征值:均值、標(biāo)準(zhǔn)差、中位數(shù)絕對(duì)偏差、峰度、信息熵、峰值因子、偏度系數(shù)、峰峰值、方差及均方根,其計(jì)算方法如表1所示。
表1 特征選取
分類器采用林智仁等開發(fā)設(shè)計(jì)的LIBSVM[22]進(jìn)行分類。提取CSI幅度的特征值形成樣本數(shù)據(jù)。對(duì)SVM進(jìn)行訓(xùn)練得到身份識(shí)別模型。最后對(duì)測(cè)試數(shù)據(jù)進(jìn)行分類。本文從不同天線及不同融合方式等角度進(jìn)行了識(shí)別準(zhǔn)確率的對(duì)比。
硬件平臺(tái)搭建:使用一臺(tái)配備Atheros無線網(wǎng)卡(AR9380)的臺(tái)式電腦作為接收器。運(yùn)行Ubuntu 14.04的操作系統(tǒng)。發(fā)射機(jī)采用wdr4310路由器,使其運(yùn)行在2.4 GHz 802.11n模式下。發(fā)送端與接收端相距1.6 m。
圖7 實(shí)驗(yàn)場(chǎng)景圖Fig. 7 Scene diagram of the experiment
軟件環(huán)境:采用由Xie[21]團(tuán)隊(duì)研發(fā)的開源驅(qū)動(dòng)程序Atheros-CSI-Tool來提取CSI數(shù)據(jù)。路由器持續(xù)向PC端發(fā)送數(shù)據(jù)包,PC端提取CSI數(shù)據(jù)。采樣率為250 包·s-1。實(shí)驗(yàn)場(chǎng)景如圖7所示。
方式1:將兩個(gè)往返異常段每一段都提取10個(gè)特征值,總共40個(gè)特征值。再利用SVM算法構(gòu)建分類模型進(jìn)行分類。從圖8可以看出使用不同天線對(duì)的識(shí)別準(zhǔn)確率不同,當(dāng)同時(shí)選取3對(duì)天線進(jìn)行識(shí)別時(shí)準(zhǔn)確率最高,4個(gè)人識(shí)別率達(dá)到82.5%。原因是一對(duì)天線僅包含部分信息,而3對(duì)天線所包含的信息更全面。圖9是SVM分類所得的混淆矩陣。
圖8 分類結(jié)果Fig. 8 Classification results
圖9 混淆矩陣Fig. 9 Confusion matrix
方式2:將兩個(gè)往返異常段先進(jìn)行融合后提取10個(gè)特征值,再利用SVM算法構(gòu)建分類模型進(jìn)行分類。圖10可以看出該方法同樣是采用3對(duì)天線識(shí)別準(zhǔn)確率最高。對(duì)比方式1可以看出此種方式準(zhǔn)確率更高,4個(gè)人識(shí)別率達(dá)到87.5%。圖11是SVM分類所得的混淆矩陣。
圖10 融合后的分類結(jié)果Fig. 10 Classification results after fusion
圖11 融合后的混淆矩陣Fig. 11 Confusion matrix after fusion
本文提出了一種基于Wi-Fi信道狀態(tài)信息的身份識(shí)別系統(tǒng)。通過濾波及行走區(qū)間檢測(cè)等方法處理CSI數(shù)據(jù),進(jìn)行分類識(shí)別。實(shí)驗(yàn)表明該系統(tǒng)具有較高的準(zhǔn)確率,2人平均識(shí)別率為95%,3人平均識(shí)別率為90%,4人平均識(shí)別率為87.5%。本文僅對(duì)CSI幅值信息進(jìn)行處理,未來還可能進(jìn)一步研究同時(shí)處理幅值和相位信息,以期得到更高的準(zhǔn)確率。