郇戰(zhàn) 陳學(xué)杰 呂士云 耿宏楊
摘 要:為了提高現(xiàn)有基于智能手機(jī)加速度傳感器步態(tài)身份識別的性能,提出了一種基于多分類器融合(MCF)的識別方法。首先,針對現(xiàn)有方法所提取的步態(tài)特征較為單一的問題,對單個步態(tài)周期提取相對勻變加速度的速度變化量,以及單位時間內(nèi)加速度變化量作為兩類新特征(共16個);其次,將新特征結(jié)合常用的時域、頻域特征組成新的特征集,用于訓(xùn)練識別效果與訓(xùn)練時間俱佳的多個分類器;最后,采用多尺度投票法(MSV)對多分類器的輸出進(jìn)行融合處理,得到最終的分類結(jié)果。為了檢測該方法的性能,采集了32個志愿者的步態(tài)數(shù)據(jù)。實(shí)驗(yàn)結(jié)果表明,新特征對于單個分類器的識別率平均提升5.95個百分點(diǎn),最終通過MSV融合算法的識別率為97.78%。
關(guān)鍵詞:多分類器融合;融合算法;多尺度投票法;步態(tài)特征;運(yùn)動特征
中圖分類號: TP391.4
文獻(xiàn)標(biāo)志碼:A
文章編號:1001-9081(2019)03-0712-07
Abstract: To improve the performance of gait recognition based on smartphone accelerometer, a recognition method based on Multiple Classifier Fusion (MCF) was proposed. Firstly, as the gait features extracted from the existing methods were relatively simple, the speed variation of the relative gradual acceleration extracted from each single gait cycle and the acceleration variation per unit time were taken as two new types of features (16 in total). Secondly, combing the new features with the frequently-used time domain and frequency domain features to form a new feature set, which could be used to train multiple classifiers with excellent recognition effect and short training time. Finally, Multiple Scale Voting (MSV) was used to fuse the output of the multiple classifiers to obtain the final classification result. To test the performance of the proposed method, the gait data of 32 volunteers were collected. Experimental results show that the recognition rate of new features for a single classifier is increased by 5.95 % on average, and the final recognition rate of MSV fusion algorithm is 97.78%.
Key words: Multiple Classifier Fusion (MCF); fusion algorithm; multiple scale voting; gait feature; motion feature
0 引言
人類的步態(tài)包含非常獨(dú)特的模式,可用于身份的識別和驗(yàn)證。傳統(tǒng)的基于可穿戴式傳感器步態(tài)身份識別都是通過在人體固定部位捆綁專用傳感器采集步態(tài)數(shù)據(jù)[1];近年來,智能手機(jī)的快速普及其及功能的不斷發(fā)展,使在不影響用戶正常工作、學(xué)習(xí)和生活的情況下,利用智能手機(jī)內(nèi)置的加速度傳感器對用戶進(jìn)行步態(tài)身份識別變?yōu)榭赡躘2]。但是由于智能手機(jī)種類繁雜、內(nèi)置加速度傳感器性能差異較大等因素,都使得最終采集到的數(shù)據(jù)差異較大,識別的難度大,從而直接影響識別的準(zhǔn)確率和可信度。
為了提高步態(tài)識別的準(zhǔn)確率,國內(nèi)外的研究者們對基于智能手機(jī)加速度傳感器的步態(tài)身份識別進(jìn)行持續(xù)性的探索研究,目前的研究成果主要體現(xiàn)在以下三個方面:
1)步態(tài)周期提取與特征選擇。文獻(xiàn)[3]利用形狀上下文(Shape Context, SC)和線性時間歸一化(Linear Time Normalization, LTN)相結(jié)合提取典型周期,通過典型周期特征來表示整個步態(tài)數(shù)據(jù)特征,實(shí)驗(yàn)結(jié)果表明身份識別的準(zhǔn)確率達(dá)到97.1%。文獻(xiàn)[4]分別從步態(tài)數(shù)據(jù)中提取步態(tài)頻率、對稱系數(shù)、數(shù)值波動范圍和特征曲線的相似系數(shù)作為特征,最后根據(jù)這些特征提出權(quán)重投票機(jī)制進(jìn)行分類識別,實(shí)驗(yàn)結(jié)果表明提出的這幾類特征能夠有效地進(jìn)行分類識別。
2)改進(jìn)或提出新的分類算法。文獻(xiàn)[5]提出一種新的動態(tài)時間規(guī)整(Dynamic Time Warping, DTW)算法,將特征點(diǎn)的時間和幅值作為一個二維序列采用波峰和波谷成對搜索最小累計(jì)距離路徑,再通過閾值判斷實(shí)現(xiàn)身份識別,但是該方法目前只在小樣本內(nèi)得到驗(yàn)證。文獻(xiàn)[6]提出了一種分段線性逼近(Piecewise Linear Approximation, PLA)的步態(tài)周期提取方法,在原有支持向量機(jī)(Support Vector Machine, SVM)高斯內(nèi)核的基礎(chǔ)上引入一種新型的彈性距離度量核(Gaussian Dynamic Time Wrap, GDTW)函數(shù),通過實(shí)驗(yàn)驗(yàn)證DTW和PLA兩種方法在提取步態(tài)周期方面的性能,結(jié)果表明提出的方法極大地改善了分類結(jié)果。
3)利用集成學(xué)習(xí)通過構(gòu)建多個學(xué)習(xí)器完成學(xué)習(xí)任務(wù)。文獻(xiàn)[7]利用蟻群算法優(yōu)選特征訓(xùn)練多分類器,提出高可信度加權(quán)投票法對分類器輸出進(jìn)行融合處理,最終模型識別率較單一分類器提升3%以上;文獻(xiàn)[8]利用多個極速學(xué)習(xí)機(jī)的輸出進(jìn)行簡單均值算法融合處理,最終模型輸出識別準(zhǔn)確率比單個極速學(xué)習(xí)機(jī)高出3.6%。集成學(xué)習(xí)優(yōu)點(diǎn)在于通過將多個學(xué)習(xí)器進(jìn)行結(jié)合,常可以獲得比單一學(xué)習(xí)器更優(yōu)越的泛化性能,但這也取決于融合算法的選取,適當(dāng)?shù)娜诤纤惴ㄍ梢垣@得較好的泛化能力,反之亦然。
上述文獻(xiàn)對人員加速度信號作了普適性的特征選取,并取得了較好的識別率,但并未對人員步行時的運(yùn)動特征進(jìn)行探究;并且都選取識別率最好的單一分類器進(jìn)行探究。針對上述不足,本文從步態(tài)數(shù)據(jù)中提取加速度變化率以及相對于勻加速度的速度變化量作為新特征,結(jié)合常用時頻域特征對多個分類器進(jìn)行建模識別,并且提出多尺度投票法(Multiple Scale Voting, MSV)進(jìn)行融合處理,進(jìn)而得到最終的識別結(jié)果。
1 數(shù)據(jù)采集與預(yù)處理
為了提高現(xiàn)有基于智能手機(jī)加速度傳感器的步態(tài)身份識別性能,提出了一種基于多分類器融合(Multiple Classifier Fusion, MCF)的識別方法,具體算法流程如圖1所示。
1.1 數(shù)據(jù)采集
為了獲取穩(wěn)定的步態(tài)數(shù)據(jù),傳統(tǒng)都是將傳感器固定在腰后部、大腿根部、手臂、腳踝等幾個位置,但是當(dāng)放置在手臂和腳踝進(jìn)行數(shù)據(jù)采集時,由于手部和腳部的一系列不自主的抖動,造成信號中夾雜較多的噪聲,進(jìn)而影響所獲得數(shù)據(jù)的完整性和穩(wěn)定性;為了增加步態(tài)數(shù)據(jù)信號采集時候的穩(wěn)定性,在采集數(shù)據(jù)時將智能手機(jī)放置在大腿根部的褲子口袋中,并且利用內(nèi)置的加速度傳感器來采集數(shù)據(jù),具體放置位置如圖2所示。采集數(shù)據(jù)時利用三星Note Ⅱ系列的智能手機(jī)進(jìn)行采集,采樣頻率為100Hz。
1.2 數(shù)據(jù)預(yù)處理
人員運(yùn)動時原始加速度信號中含有高頻噪聲,主要來自兩個方面:一是手機(jī)加速度傳感器本身的原因;二是在采集步態(tài)數(shù)據(jù)的過程中,因人體的生理抖動產(chǎn)生的噪聲??紤]到加速度傳感器自身靈敏度較高這一特性,即使細(xì)小的抖動也會影響加速度數(shù)值的變化,進(jìn)而會影響之后的特征提取和分類識別率;因此,在保留有用信息的同時,也需要盡量地去除噪聲對數(shù)據(jù)的干擾。針對步態(tài)特征信號主要集中在數(shù)據(jù)的較低頻率部分,采用3階巴特沃斯低通濾波器[9]進(jìn)行濾波去除高頻噪聲,圖3為濾波前后的步態(tài)數(shù)據(jù)。
2 周期劃分與特征提取
2.1 周期劃分
常用的周期劃分方法有基于幀分割[10-11]和基于周期分割兩種?;趲指?,又被稱為基于固定滑動窗口的分割;窗口表示一次被用于處理的數(shù)據(jù)量,因此該方法就是按照固定數(shù)據(jù)長度進(jìn)行周期劃分。該方法能夠快速地實(shí)現(xiàn)時間序列的分割處理;窗口又被分為重疊的和不重疊窗口,主要是由窗口大小和滑動步長決定;該方法由于實(shí)現(xiàn)簡單,在目前的研究中常被使用,雖然該方法有很好的實(shí)時性以及能夠保持步態(tài)的模式特征,但是卻不能很好地反映步態(tài)的相位以及不能解決步態(tài)模式引起的時間變化問題。與基于幀分割不同,基于周期的分割方法以步態(tài)周期為基礎(chǔ),能夠充分體現(xiàn)出步態(tài)數(shù)據(jù)的隱藏生物特征??紤]到步態(tài)加速度數(shù)據(jù)通常表現(xiàn)為一組具有周期性特性的數(shù)據(jù),因此本文采用基于周期的分割方法。具體算法主要分為以下3個步驟:
步驟1 周期長度估算。據(jù)統(tǒng)計(jì)正常人平均0.8s到1.2s步行兩步,由于在采集數(shù)據(jù)時只放置了一個手機(jī)在右側(cè)的褲口袋中,因此兩步剛好對應(yīng)數(shù)據(jù)上的一個周期;再加之采樣頻率被設(shè)置為100Hz,因此一個周期對應(yīng)的數(shù)據(jù)點(diǎn)大約在80~120個。
步驟2 周期檢測。利用局部極小值[12]對步態(tài)數(shù)據(jù)進(jìn)行周期檢測,即認(rèn)為兩個相鄰極小值之間所包含的數(shù)據(jù)為單個步態(tài)周期。
步驟3 剔除異常周期。通過上述兩個步驟,可以把步態(tài)數(shù)據(jù)劃分成單個步態(tài)周期,但是這些周期并不是全都適合用于特征提取,需要對這些周期進(jìn)行篩選,剔除異常周期。本文在剔除非正常周期時采用DTW計(jì)算相似距離,將那些距離相差較大的周期剔除。
經(jīng)過上述步驟所提取不同個體的單個步態(tài)周期如圖4所示。
2.2 特征提取
特征提取是為了從已獲得的單個步態(tài)周期中提取可以表征個體身份的特征向量,是分類識別技術(shù)中的關(guān)鍵所在,特征提取的效果會直接影響分類器的訓(xùn)練以及最終分類識別的準(zhǔn)確率。
2.2.1 傳統(tǒng)步態(tài)特征
傳統(tǒng)的基于加速度信號特征提取方法有時域分析法[13]、頻域分析法[14]和時頻域分析法[15]。結(jié)合上述方法提取傳統(tǒng)特征有平均值、標(biāo)準(zhǔn)差、步頻、四分位距、能量、過零數(shù)、偏度、峰度、均方根、周期長度、傅里葉系數(shù)、步速等。其中可以被用來表示步態(tài)數(shù)據(jù)信號的波形特點(diǎn)和簡單的統(tǒng)計(jì)特征,如平均值、標(biāo)準(zhǔn)差、過零數(shù)等一系列時域特征;又如步數(shù)、步頻等一系類特征可以用來表征個體的生物特征;而諸如傅里葉系數(shù)等都是頻域特征,通常被用來表示個體步態(tài)中的周期性信息。雖然傳統(tǒng)特征計(jì)算簡單,但是很少有可以表征個體步態(tài)運(yùn)動過程中的特征,而且利用傳統(tǒng)特征所取得的識別率并不高。
2.2.2 運(yùn)動特征
針對傳統(tǒng)特征不能很好體現(xiàn)步態(tài)的生物特征,本文提出一種新的步態(tài)特征提取方法,用于提取個體的運(yùn)動特征。眾所周知,加速度傳感器采集的步態(tài)數(shù)據(jù)是一個連續(xù)的時間序列;從運(yùn)動的角度,個體的步行是一個變加速度運(yùn)動。對于一個變加速度運(yùn)動可以結(jié)合下面兩個角度進(jìn)行刻畫:1)可以將變加速度運(yùn)動按照加速度數(shù)值大小增加和減少進(jìn)行分割,將其劃分成變加速和變減速兩種類別,再用單位時間內(nèi)變加速和變減速的加速度變化量描述變加速度運(yùn)動;2)對于單個變加速運(yùn)動區(qū)間,通過計(jì)算其相對于勻加速度的速度變化量,用以刻畫改區(qū)間運(yùn)動的相對穩(wěn)定程度。文獻(xiàn)[16]通過步行動作的生物力學(xué)原理分析得出:足地接觸力在每個步態(tài)周期轉(zhuǎn)折點(diǎn)出現(xiàn)極值,足跟著地時有一極大值,隨著足部逐漸放平,受力面積逐漸增大,受力減少,足部完全放平時受力達(dá)到最小,至足跟離地,足趾蹬地時出現(xiàn)另一極大值,即在整個步態(tài)周期中受力曲線具有典型的對稱雙峰性質(zhì),那么加速度曲線也應(yīng)該呈現(xiàn)出雙峰性質(zhì),并且研究認(rèn)為不同年齡人體的足地接觸力無顯著性差異。因此結(jié)合上述分析,本文對單個步態(tài)周期提取周期起點(diǎn)(start)、第一個極大值點(diǎn)(maxf)、第一個極小值(minf)、最后一個極小值(mine)、最后一個極大值(maxe)、步態(tài)周期終點(diǎn)(end)6個特征點(diǎn),將步態(tài)數(shù)據(jù)分成5個變加速運(yùn)動的區(qū)間,不同個體的區(qū)間劃分的結(jié)果如圖5所示;將兩兩特征點(diǎn)之間的連線視作為勻加速運(yùn)動,因此單位時間內(nèi)變加速和變減速的加速度變化量就可以被表示為這五條直線的斜率;而單個區(qū)間內(nèi)相對勻加速運(yùn)動的速度變化量可以用原始變加速度曲線與勻加速直線所圍成的面積表示。因此,本文新添16個特征值,即6個特征值點(diǎn)、5個斜率以及5個面積。新特征的提取流程如圖6所示,具體步驟如下。
3 分類器融合算法
單個分類器通常只對個別個體具有較高的識別率,因此本文為了實(shí)現(xiàn)各個分類器之間優(yōu)勢互補(bǔ),將多分類器的輸出通過融合算法得到最終的識別結(jié)果。融合算法在多分類器融合模型中有著至關(guān)重要的地位,它的好壞將直接決定著最終的識別率。傳統(tǒng)投票法[17]是最常用的融合算法之一,其基本的表決規(guī)則是每個分類器都具有投票權(quán),仲裁原則是少數(shù)服從多數(shù),但是由于每個分類器的性能不同,對于每個人的識別效果也有較大差異,因此傳統(tǒng)的投票法很難結(jié)合多個分類器的優(yōu)勢,達(dá)到預(yù)期的識別效果。針對傳統(tǒng)投票法存在的不足,本文將投票法的表決原則結(jié)合其仲裁原則進(jìn)行改進(jìn),提出一種多尺度投票法(Multiple Scale Voting, MSV)。MSV算法的基本思想是:一個未知樣本在多分類器經(jīng)過投票法不能非常準(zhǔn)確對樣本類別進(jìn)行判斷時,結(jié)合各個分類器對其輸出類別的識別率、F1_score等多個尺度對樣本進(jìn)行分類;MSV算法不僅保留了傳統(tǒng)投票法的特點(diǎn),而且結(jié)合了單一分類器對不同類型樣本的識別性能,使得各分類器優(yōu)勢互補(bǔ)。MSV算法主要分為提取判別因子和構(gòu)建表決函數(shù)兩個步驟,具體流程如圖7所示。
3.1 提取判別因子
3.2 構(gòu)建表決函數(shù)
式(15)、(16)分別是第4個表決權(quán)重分配和表決函數(shù)。
對于一個未知樣本x,先經(jīng)過多分類器進(jìn)行分類,然后將多分類器分類結(jié)果經(jīng)過MSV融合算法得到最終的分類所屬label,并且可以用式(17)予以計(jì)算:
4 實(shí)驗(yàn)結(jié)果與分析
4.1 實(shí)驗(yàn)準(zhǔn)備
4.1.1 實(shí)驗(yàn)數(shù)據(jù)與環(huán)境
本文利用在數(shù)據(jù)采集中介紹的采集方法,針對32名年齡在25歲左右的志愿者進(jìn)行數(shù)據(jù)采集,其中男女生各16名,他們身高均在150~190cm,在采集過中志愿者在水平的地面上用他們正常步行模式行走大約100m的距離;每位志愿者需要被采集30組獨(dú)立的實(shí)驗(yàn)數(shù)據(jù),以避免整體實(shí)驗(yàn)數(shù)據(jù)具有偶然性,保證數(shù)據(jù)能夠更好地刻畫出個體的步態(tài)特征。
實(shí)驗(yàn)環(huán)境:本文以python 3.6作為軟件平臺;硬件平臺采用Intel Core i7處理器,主頻為2.7GHz,內(nèi)存為8GB;并且采用64位Windows 10操作系統(tǒng)。
4.1.2 多分類器選擇
基分類器選擇是多分類器融合的基礎(chǔ),為了盡可能選擇優(yōu)秀的分類器用于融合,本文選擇以下10個常用的分類器作為備選項(xiàng),如表1所示。
4.2 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
為了測試傳統(tǒng)特征在本文所采集數(shù)據(jù)上的表現(xiàn),驗(yàn)證本文提出的新特征可分性、新特征與傳統(tǒng)特征融合效果以及MSV多分類器融合算法的性能,主要通過設(shè)計(jì)以下2個實(shí)驗(yàn)予以驗(yàn)證。
1)多分類器篩選。
多分類器篩選的目的很明確就是從10個備選的分類器中選擇最為合適的分類器作融合。為了完成多分類器的篩選本文主要通過以下3個小實(shí)驗(yàn)予以論證:
a)通過傳統(tǒng)特征來驗(yàn)證所采集到的數(shù)據(jù)具有良好的可分性,并從備選的10個基分類器中選中合適的分類器用于融合。
b)通過利用備選的10個基分類器對新特征進(jìn)行分類,同樣也尋找適合融合的備選分類器,并與傳統(tǒng)特征所選分類器進(jìn)行對比。
c)對比新特征與傳統(tǒng)特征對樣本的區(qū)分能力;并且融合新特征與傳統(tǒng)特征進(jìn)行分類,同樣從備選分類器中進(jìn)行選擇最終合適的分類器,并與前兩者選出的分類器進(jìn)行比較,最終確定融合的分類器。
2)通過實(shí)驗(yàn)對比驗(yàn)證MSV融合算法的可靠性。
為了更好地訓(xùn)練每一個分類器、對每一個分類器進(jìn)行更好的評判,以及獲得用于MSV融合算法先驗(yàn)知識,如:分類器對于單個個體的識別率、召回率等,本文在所有的分類實(shí)驗(yàn)中將實(shí)驗(yàn)數(shù)據(jù)平均分成10等份,其中6份作為訓(xùn)練集,在訓(xùn)練時采用十折的方法對分類器進(jìn)行訓(xùn)練;2份作為測試集,用于測試分類器以及獲取先驗(yàn)知識;2份作為驗(yàn)證集,主要驗(yàn)證算法的可靠性以及融合算法的融合效果。
4.2.1 多分類器篩選
a)結(jié)合2.2.1節(jié)所介紹的傳統(tǒng)步態(tài)特征,本文對X、Y、Z軸的單個步態(tài)周期分別提取下述15個傳統(tǒng)特征值用于分類實(shí)驗(yàn),分別是:均值、標(biāo)準(zhǔn)差、偏度、峰度、均方根、過零率、四分位距、周期長度、能量以及前6位傅里葉系數(shù),由于這些是常見的時頻域以及統(tǒng)計(jì)學(xué)特征,其計(jì)算公式也相對簡單,在此不再贅述。
b) 從X、Y、Z軸的單個步態(tài)周期分別提取本文所介紹的相對勻加速運(yùn)動的速度變化量等16個新特征,采用備選的10個分類器進(jìn)行分類實(shí)驗(yàn)。
c)將針對X、Y、Z軸的單個步態(tài)周期分別所提取的15個傳統(tǒng)特征值和16個新特征值(一共93個特征,3×15個傳統(tǒng)特征,3×16個新特征)進(jìn)行融合,首先通過ReliefF算法[18]計(jì)算各個特征對樣本的區(qū)分能力,來驗(yàn)證新特征是否具有更好的可分性;其次,同樣采用備選的分類器進(jìn)行分類實(shí)驗(yàn)。
令本文所選取傳統(tǒng)特征集為T1;新特征集為T2;新特征和傳統(tǒng)特征融合特征集為T3。
表2、圖8分別是10個備選分類器在T1、T2、T3三個特征集上的測試集識別率以及訓(xùn)練一次對應(yīng)分類器和測試集所需要的時間,圖9為93個不同步態(tài)特征所對應(yīng)的ReliefF值。
由表2的T1列可得,本文采集的步態(tài)數(shù)據(jù)針對傳統(tǒng)特征在大部分的備選分類器上都獲得不錯的識別率,最高識別率可以達(dá)到91.7%,這從側(cè)面說明個體的步態(tài)特征作為生物特征的一種能夠很好用于人員識別,傳統(tǒng)步態(tài)特征對步態(tài)具有一定的可分性,但是識別率并不是很高。
由表2的T2列可得,本文提取的新特征值對比傳統(tǒng)特征值在各個分類器的分類效果上有所欠缺,但是識別率相差并不算很大,最小相差的識別為0.83個百分點(diǎn),最大相差15.01個百分點(diǎn);新特征達(dá)到的最高識別率為89.40%,與傳統(tǒng)特征的最高識別率相差2.3個百分點(diǎn),說明新特征本身就具有較好的可分性,為下面特征融合奠定理論依據(jù)。
由ReliefF算法可知,特征對應(yīng)的ReliefF值越大,說明該特征對樣本具有更大的區(qū)分能力;通過圖9可得,在前10的ReliefF值對應(yīng)的特征中新特征占有6個,并且這6個新特征值ReliefF值和為0.314,4個傳統(tǒng)特征ReliefF值和為0.174;在前40的ReliefF值對應(yīng)的特征中新特征占有20個,并且這20個新特征值ReliefF值和為0.571,20個傳統(tǒng)特征ReliefF值和為0.529;在所有93個特征中新特征ReliefF值和為0.861,傳統(tǒng)特征ReliefF值和為0.737。綜合上述分析可以得出:新特征相比傳統(tǒng)特征具有更好的分類效果。由表2的T3列可得,新特征和傳統(tǒng)特征相融合對于所有備選分類器的識別率都有較大幅度提升,相比傳統(tǒng)特征平均提升5.95個百分點(diǎn)的識別率,最高識別率可以達(dá)到95.47%,說明特征融合是很成功。
通過表2可以得出,在10個備選分類器中C3、C4、C5、C6、C7、C8、C10這7個分類器無論是在傳統(tǒng)特征、新特征還是傳統(tǒng)特征與新特征融合都取得較好的識別率,體現(xiàn)出這7個分類器具有很好的穩(wěn)定性;通過圖8可以得出C8、C10這兩個分類器在訓(xùn)練時需要消耗大量時間,如果用于分類器融合會大幅度融合分類器的時間消耗;因此綜合時間消耗和準(zhǔn)確率兩方面考慮,本文選用C3、C4、C5、C6、C7作為融合算法的基分類器。
4.2.2 MSV融合算法驗(yàn)證
本文主要通過兩個方面來驗(yàn)證MSV融合算法:第一通過對比單一分類器在三種特征集下驗(yàn)證集的識別率和MSV算法融合之后的識別率;第二通過對比MSV融合算法和不同多分類器融合算法的識別率。表3是所選擇的5種基分類器在三種特征集下驗(yàn)證集的識別率;表4是不同融合算法識別率的對比實(shí)驗(yàn)結(jié)果。
通過表3和表2可以得出,所選的5種基分類器無論在測試集還是驗(yàn)證集都有較好的識別效果,并且識別率幾乎一致,表現(xiàn)出所選基分類器擁有很好的穩(wěn)定性。
通過表3和表4可以得出,傳統(tǒng)投票法和MSV算法在三種上所得到的識別率相差不是很大,MSV算法取得的識別率最小只高出0.2個百分點(diǎn),最大高出2.02個百分點(diǎn);但是傳統(tǒng)投票法相比MSV算法缺乏穩(wěn)定性,例如,在新特征集基分類器的最高識別率為89.73%,而傳統(tǒng)投票法融合之后的識別率反而低了1.63個百分點(diǎn);出現(xiàn)上述現(xiàn)象可以歸納為以下兩個原因:其一,由于基分類器的識別率都比較高,這樣就造成對于一個未知樣本大多數(shù)基分類器都會大概率輸出正確且一致的分類結(jié)果,致使通過傳統(tǒng)投票法之后得到較高的識別率,例如,在傳統(tǒng)特征集有4個基分類器的識別率高于88%,在融合特征集上4個基分類器識別率高于92%,所以在這兩類特征集上傳統(tǒng)投票法都取得較高的識別率,對比與MSV算法也相差不大;其二,由于傳統(tǒng)投票法是按照少數(shù)服從多數(shù)的準(zhǔn)則進(jìn)行融合,這樣就會造成如果基分類器的識別率都不是很高,導(dǎo)致有很多未知樣本經(jīng)過傳統(tǒng)投票法融合之后,所謂的少數(shù)和多數(shù)相差很小;假設(shè)對于部分未知樣本,5個基分類器有2個基分類器輸出一致的結(jié)果,而其他3個基分類器輸出的結(jié)果各不相同,這樣傳統(tǒng)投票法只有小幾率會預(yù)測出正確的樣本分類,從而致使傳統(tǒng)投票法融合后識別率不高,甚至?xí)陀诨诸惼鞯淖R別率,造成傳統(tǒng)投票法具有不穩(wěn)定性,例如在新特征集上有4個基分類器的識別率低于86%,致使經(jīng)過傳統(tǒng)投票法融合后識別率僅為88.10%,低于C5分類器的識別率。通過對比其他的多分類器融合算法,三種特征集在MSV算法融合后識別率都有所提高,并且在各個特征集上的識別率都要優(yōu)于其他融合算法;三種特征集在MSV算法融合后識別率相比5種基分類器中最大識別率平均提高1.34個百分點(diǎn),最高的識別率是融合特征所達(dá)到的97.78%;綜合上述分析,可以得出MSV算法具有優(yōu)異的多分類器融合性能。
5 結(jié)語
本文將單個步態(tài)周期數(shù)據(jù)利用極大值和極小值劃分成5個運(yùn)動區(qū)域;分別提取運(yùn)動區(qū)域內(nèi)的相對勻加速度的速度變化量,以及單位時間內(nèi)加速度變化量作為兩類新特征;將新特征結(jié)合傳統(tǒng)的時域和頻域特征組成新的特征集,用于訓(xùn)練篩選出來的5個基分類器;再將各個分類器的預(yù)測結(jié)果經(jīng)過MSV多分類器融合算法得到最終的預(yù)測結(jié)果。實(shí)驗(yàn)結(jié)果表明:新特征利用測試集在5個基分類器上具有不錯的識別效果,最高的準(zhǔn)確率達(dá)到89.40%,并且新特征的ReliefF值也要高于傳統(tǒng)特征值,體現(xiàn)新特征具有良好的可分性;新特征和傳統(tǒng)特征融合同樣在測試集上取得很高識別率,相對于單一傳統(tǒng)特征識別率有較大提升,最高識別率達(dá)到95.47%;經(jīng)過MSV算法融合后識別率相對于5種基分類器中最大識別率平均提高1.34個百分點(diǎn),最高的識別率是融合特征所達(dá)到的97.78%;在新特征和傳統(tǒng)特征相融合的特征集上,MSV融合算法相比其他多分類器融合算法識別率平均提高3.75個百分點(diǎn),體現(xiàn)出MSV算法具有優(yōu)異的多分類器融合性能。
參考文獻(xiàn) (References)
[1] LIU R, ZHOU J, LIU M, et al. A wearable acceleration sensor system for gait recognition [C]// Proceedings of the 2007 2nd IEEE Conference on Industrial Electronics and Applications. Piscataway, NJ: IEEE, 2007: 2654-2659.
[2] MUAAZ M, MAYRHOFER R. Accelerometer based gait recognition using adapted Gaussian mixture models [C]// Proceedings of the 14th International Conference on Advances in Mobile Computing and Multi Media. New York: ACM, 2016: 288-291.
[3] 萬彩艷. 基于智能手機(jī)加速度傳感器的步態(tài)身份識別[D].常州:常州大學(xué),2018: 21-35.(WAN C Y. Gait identification based on mobile-phone acceleration sensor [D]. Changzhou: Changzhou University, 2018: 21-35.)
[4] SUN B, WANG Y, BANDA J. Gait characteristic analysis and identification based on the iPhone's accelerometer and gyrometer [J]. Sensors, 2014, 14(9): 17037-17054.
[5] 張麗娜.基于加速度傳感器的步態(tài)特征身份認(rèn)證[D].沈陽:沈陽工業(yè)大學(xué),2014: 40-65. (ZHANG L N. Gait feature authentication based on acceleration sensor [D]. Shenyang: Shenyang University of Technology, 2014: 40-65.)
[6] MUAAZ M, MAYRHOFER R. An analysis of different approaches to gait recognition using cell phone based accelerometers [C]// Proceedings of the 11th International Conference on Advances in Mobile Computing and Multimedia. New York: ACM, 2013: 293-300.
[7] 王忠民,王科,賀炎.高可信度加權(quán)的多分類器融合行為識別模型[J].計(jì)算機(jī)應(yīng)用,2016,36(12):3353-3357.(WANG Z M, WANG K, HE Y. Multiple classifier fusion model for activity recognition based on high reliability weighted [J]. Journal of Computer Applications, 2016,36(12):3353-3357.)
[8] YUAN Y, WANG C, ZHANG J, et al. An ensemble approach for activity recognition with accelerometer in mobile-phone [C]// Proceedings of the 11th International Conference on Computational Science and Engineering. Washington, DC: IEEE Computer Society, 2014: 1469-1474.
[9] BAYAT A, POMPLUN M, TRAN D A. A study on human activity recognition using accelerometer data from smartphones [J]. Procedia Computer Science, 2014, 34: 450-457.
[10] SPRAGER S, JURIC M B. An efficient HOS-based gait authentication of accelerometer data [J]. IEEE Transactions on Information Forensics and Security, 2015, 10(7): 1486-1498.
[11] LU H, HUANG J, SAHA T, et al. Unobtrusive gait verification for mobile phones [C]// Proceedings of the 2014 ACM International Symposium on Wearable Computers. New York: ACM, 2014: 91-98.
[12] DERAWI M, BOURS P. Gait and activity recognition using commercial phones[J]. Computers and Security, 2013, 39: 137-144.
[13] WATANABE Y. Influence of holding smart phone for acceleration-based gait authentication [C]// Proceedings of the 2014 5th International Conference on Emerging Security Technologies. Washington, DC: IEEE Computer Society, 2014: 30-33.
[14] HOANG T, CHOI D. Secure and privacy enhanced gait authentication on smart phone [J]. The Scientific World Journal, 2014, 2014: Article ID 438254.
[15] PRIMO A, PHOHA V V, KUMAR R, et al. Context-aware active authentication using smartphone accelerometer measurements [C]// Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition Workshops. Washington, DC: IEEE Computer Society, 2014: 98-105.
[16] 錢競光,宋雅偉,葉強(qiáng),等.步行動作的生物力學(xué)原理及其步態(tài)分析[J].南京體育學(xué)院學(xué)報(自然科學(xué)版),2006,5(4):1-7.(QIAN J G, SONG Y W, YE Q, et al. The biomechanics principle of walking and analysis on gaits[J]. Journal of Nanjing Institute of Physical Education (Natural Science), 2006, 5(4):1-7.)
[17] 王科.多分類器融合算法在行為識別中的應(yīng)用研究[D].西安:西安郵電大學(xué),2017: 40-61. (WANG K. Application and research of multiple classifier fusion algorithm in activity recognition [D]. Xi'an: Xi'an University of Posts and Telecommunications, 2017: 40-61.)
[18] 黃莉莉,湯進(jìn),孫登第,等.基于多標(biāo)簽ReliefF的特征選擇算法[J].計(jì)算機(jī)應(yīng)用,2012,32(10):2888-2890.(HUANG L L, TANG J, SUN D D, et al. Feature selection algorithm based on multi-label ReliefF [J]. Journal of Computer Applications, 2012,32(10):2888-2890.)
[19] QU J, ZHANG Z, GONG T. A novel intelligent method for mechanical fault diagnosis based on dual-tree complex wavelet packet transform and multiple classifier fusion [J]. Neurocomputing, 2016, 171(C): 837-853.