閔玉寒,張國興,張磊
(1.山東省濟寧市微山縣第一中學,微山277600;2.中國礦業(yè)大學計算機學院,徐州221116)
人體活動識別是近年來的研究熱點[1]?;顒幼R別的目的是識別用戶不顯眼的活動或者行為,并對這些行動采取必要的響應[2]。目前,人體活動主要有三種方法:基于視頻的方法[3]、基于環(huán)境傳感器的方法[4]、可攜帶傳感系統(tǒng)方法[5]。基于加速器的活動活動識別方法雖然能夠提供更高的識別率,然而對長期的活動監(jiān)控是不可行的[6]。相比之下,安裝在腰部、胸骨或者背部的加速計能夠較好地識別基礎活動(如站立、走路、跑步),但在基礎活動的過渡過程和動態(tài)活動中(如上樓、下樓)識別較差。從頻率或者時間域提取的特征具有不同的準確率。頻率域特征需要大量的排列組合來識別活動,因此其時間復雜度太高。時間領(lǐng)域的特征可以從時間序列中很容易的提取出來且計算復雜度較小。然而,用這些特征進行識別時準確率不高。
針對以上問題,本文將樣本熵[7]引入到人體活動識別領(lǐng)域,因為樣本熵作為時間序列穩(wěn)定性的度量能夠檢測出時間序列發(fā)生異常的時間點,從而實現(xiàn)長期的人體活動識別,并且通過觀察排列熵,樣本熵對測試準確率的影響來判斷其有效性。
樣本熵是一種非線性的度量序列的復雜度和統(tǒng)計量化的動力學參數(shù),用一個非負數(shù)來衡量一個時間序列的復雜度,反應時間序列中的新信息率。樣本熵對時間序列的長度要求不高,可以用于長度較短的時間序列的檢測。
采用樣本上從活動序列數(shù)據(jù)抽取樣本熵特征,算法如下:
(1)設原始時間序列為{Y(i),i=1,2,…,n},共 n 個點。將時間序列進行重構(gòu),得到重構(gòu)矩陣X(i)。
其中,j=1,2,3…,K,m為嵌入的維數(shù),τ為延遲時間,K=n-(m-1)τ。
(2)定義重構(gòu)矩陣的兩個向量X(i)與X(j)之間的距離d[X(i),X(j)]為兩個向量對應元素中差值最大的一個。即:
(3)對于給定閾值r,對于每個值統(tǒng)計d[X(i),X(j)]小于r的數(shù)目及此數(shù)目與距離總數(shù)n-m的比值,記為,即:
其中 i=1~n-m+1,i≠j。
(5)則此序列的樣本熵為:
將其表示成:
極限學習機(ELM)是一種新的前反饋神經(jīng)網(wǎng)絡方法。該方法通過隱藏層輸出矩陣的廣義逆操作進行分析確定,用最快的速度提供最大的泛化能力[8]。本文采用EML作為活動識別分類器。
對于N個不同的樣本(xi,ti)∈Rn×Rm有L個隱藏節(jié)點的輸出函數(shù)G(ai,bi,x)的SLFNs可以用下面的公式來建模:
其中(ai,bi)是隱藏節(jié)點的參數(shù),βi是第i個隱藏節(jié)點和輸出節(jié)點的權(quán)重向量。
H是神經(jīng)網(wǎng)絡隱藏層的輸出矩陣,H矩陣的第i列是和x1,x2,…,xN關(guān)聯(lián)的第i個隱藏節(jié)點的輸出。
實驗采用UCI HAR Dataset數(shù)據(jù)集,該數(shù)據(jù)集包含30名志愿者的活動數(shù)據(jù)。他們攜帶著智能手機完成了六個動作。通過嵌入在手機上的加速度計和螺旋儀,獲取三軸向線性加速度和三軸角速度,通過視頻標識給活動類別加標簽。將實驗數(shù)據(jù)隨機分為兩組,70%的數(shù)據(jù)作為訓練集數(shù)據(jù),其余30%的數(shù)據(jù)作為測試數(shù)據(jù)。
為了驗證本文方法,將ELM和SVM(支持向量機)相比較。首先用其原始數(shù)據(jù)進行實驗,將原始數(shù)據(jù)直接輸入到SVM、ELM。將原始數(shù)據(jù)進行了預處理,形成了長度為256的時間序列,實驗樣本有5159個。實驗結(jié)果如表1:
表1 原始數(shù)據(jù)訓練結(jié)果
從表1可以看出,用原始數(shù)據(jù)進行訓練,準確率很低,最好情況不會超過30%。
對原始數(shù)據(jù)進行提取,計算其樣本熵(SE)。將時間序列的長度擴大到512,樣本數(shù)目有2579個,其SE如表2。
表2 長度為512時計算結(jié)果表
其中,維數(shù)取值為5,SE中的維數(shù)取值為2,r取值為0.2std。從表2中的數(shù)據(jù)我們可以看出,Walking、Upstairs、Downstairs的熵值較小,說明其時間序列的復雜度較小,而 Standing、Sitting、Laying的熵值較大,說明其時間序列的復雜度較高。
對SE進行學習,其結(jié)果在表3中顯示。
表3 長度為512時機器學習的結(jié)果表
從上表中看出,對比原始數(shù)據(jù),SE能明顯的提高測試準確率。且ELM準確率高于SVM。
通過實驗不難看出,樣本熵作為人體活動識別過程中的一個重要處理過程,可以顯著的提高人體活動識別的準確率。
本文將樣本熵引入到人體活動識別的領(lǐng)域,通過計算活動序列數(shù)據(jù)的樣本熵作為序列特征,采用ELM作為分類器,提出了基于樣本熵和ELM的人體活動識別方法。在UCR數(shù)據(jù)集上的測試結(jié)果表明:本文方法較好地提高了人體活動識別的準確率。
[1]Reyes-Ortiz J L,Oneto L,Samà A,et al.Transition-Aware Human Activity Recognition Using Smartphones[J].Neurocomputing,2016,171(C):754-767.
[2]馮輔周,饒國強,司愛威,孫野.排列熵算法的應用和發(fā)展.裝甲兵工程學院學報,2012,26(2).
[3]凱澤斯.視頻監(jiān)控系統(tǒng)的活動識別和檢測的概念及設計[J].數(shù)碼世界,2015(10):33-34.
[4]王金甲,孔德明,劉建波,等.基于傳感器數(shù)據(jù)的人類活動識別研究[J].高技術(shù)通訊,2016,26(2):207-214.
[5]劉斌,劉宏建,金笑天,等.基于智能手機傳感器的人體活動識別[J].計算機工程與應用,2016,52(4):188-193.
[6]Chen C,Jafari R,Kehtarnavaz N.A Survey of Depth and Inertial Sensor Fusion for Human Action Recognition[J].Multimedia Tools&Applications,2016:1-21.
[7]Ahmad R F,Malik A S,Amin H U,et al.Nonlinear Features Based Classification of Active and Resting States of Human Brain Using EEG[C].IEEE International Conference on Signal and Image Processing Applications.IEEE,2016:264-268.
[8]Guang-Bin Huang,Qin-Yu Zhu,Chee-Kheong Siew.Extreme Learning Machine:Theory and applications,ScienceDirect Neurocomputing 70 2006:489-501.