融合關(guān)聯(lián)性的多任務(wù)壓縮感知行為識(shí)別方法*
段夢(mèng)琴,李仁發(fā),黃晶
(湖南大學(xué)嵌入式與網(wǎng)絡(luò)計(jì)算湖南省重點(diǎn)實(shí)驗(yàn)室,湖南 長(zhǎng)沙 410082)
摘要:基于傳感器的人體行為識(shí)別是一個(gè)新興研究領(lǐng)域,作為物聯(lián)網(wǎng)的一項(xiàng)重要應(yīng)用,在醫(yī)療監(jiān)護(hù)、助老助殘、智能辦公/家居等方面有著廣闊的應(yīng)用前景。識(shí)別率是行為識(shí)別的一個(gè)重要衡量指標(biāo),而特征和分類算法又是影響識(shí)別率的兩個(gè)重要因素。提取了基于多傳感器行為識(shí)別架構(gòu)的關(guān)聯(lián)特征,并引入壓縮感知和稀疏表示理論,提出一種多任務(wù)壓縮感知行為識(shí)別方法。最后,在基準(zhǔn)數(shù)據(jù)庫(kù)上采用個(gè)體無關(guān)的留一驗(yàn)證方法進(jìn)行了大量實(shí)驗(yàn),結(jié)果表明所提出的融合關(guān)聯(lián)性的多任務(wù)壓縮感知行為識(shí)別方法能有效提升行為識(shí)別率,與對(duì)應(yīng)的單任務(wù)行為識(shí)別方法相比,識(shí)別速度提高約56% 。
關(guān)鍵詞:機(jī)器學(xué)習(xí); 物聯(lián)網(wǎng);體域網(wǎng);行為識(shí)別;特征提取
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)志碼:A
doi:10.3969/j.issn.1007-130X.2015.06.007
收稿日期:*2014-02-25;修回日期:2014-05-22
基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目(61173036,61272061);湖南省科技計(jì)劃資助項(xiàng)目( 2014GK3009)
作者簡(jiǎn)介:
通信地址:410082 湖南省長(zhǎng)沙市湖南大學(xué)嵌入式網(wǎng)絡(luò)計(jì)算實(shí)驗(yàn)室
Address:Laboratory of Embedded Systems & Networking,Hunan University,Changsha 410082,Hunan,P.R.China
Fusingcorrelationbasedmulti-taskcompressivesensingforactivityrecognition
DUANMeng-qin,LIRen-fa,HUANGJing
(LaboratoryofEmbeddedSystems&Networking,HunanUniversity,Changsha410082,China)
Abstract:Sensor-based human activity recognition is an emerging research field. It is an important application of Internet of Things (IoT), and has very promising application prospects in health care/recovery, elder/invalid people assistant, smart home/office, etc. Accuracy is one of the most important evaluation standards of activity recognition, and appropriate features and classifiers are important accuracy factors. We first extract a novel feature called correlation feature. By combining the theory of compressive sensing and sparse representation, we propose a multi-task compressive sensing method and use it as the classifier to resolve the problem of activity recognition. Finally, we conduct a large amount of experiments on a set of benchmarks with Leave-One-Subject-Out cross validation. Experimental results show that the extracted feature and the proposed method are effective in improving the accuracy of sensor-based activity recognition. Moreover, compared to the corresponding single task method, the proposed classifier can reduce the execution time by nearly 56%.
Keywords:machinelearning;InternetofThings;bodyareanetwork;activityrecognition;featureextraction
1引言
近年,人體行為識(shí)別(ActivityRecognition)受到了社會(huì)各界的關(guān)注,成為機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn),并且在智能家居、醫(yī)療保健、老人/病人監(jiān)護(hù)等方面具有廣泛的應(yīng)用前景。隨著電子、通信技術(shù)的發(fā)展,傳感器在日常生活中得到了廣泛應(yīng)用。基于傳感器的行為識(shí)別作為物聯(lián)網(wǎng)的一項(xiàng)重要應(yīng)用,成為一個(gè)備受關(guān)注的新興研究領(lǐng)域。與基于視覺的行為識(shí)別相比,它具有分布范圍廣、不具侵?jǐn)_性等特點(diǎn),因而獲得了學(xué)術(shù)和工業(yè)界更深度的認(rèn)可。通過捆綁在身體上一個(gè)或多個(gè)傳感器節(jié)點(diǎn)構(gòu)成的無線體域網(wǎng)(WirelessBodySensorNetwork)[1]來獲取人體運(yùn)動(dòng)信號(hào),進(jìn)而通過信號(hào)識(shí)別出運(yùn)動(dòng)者行為。2013年9月,Intel發(fā)布了一款名叫Quark的芯片,該款芯片專門用于物聯(lián)網(wǎng)技術(shù)和可穿戴計(jì)算[2],它將進(jìn)一步推進(jìn)基于傳感器行為識(shí)別研究發(fā)展。
基于傳感器行為識(shí)別工作主要包括以下幾個(gè)方面:(1)構(gòu)建實(shí)時(shí)行為識(shí)別系統(tǒng)[3,4];(2)建立行為識(shí)別數(shù)據(jù)庫(kù)[5,6];(3)改進(jìn)模式識(shí)別或機(jī)器學(xué)習(xí)的分類方法[7,8];(4)提取新的有效的傳感器數(shù)據(jù)特征[9.10]和提出解決傳感器功耗問題的方法[11,12]。目前,絕大多數(shù)基于傳感器行為識(shí)別研究圍繞其中的一個(gè)或者多個(gè)問題進(jìn)行研究?;趥鞲衅餍袨樽R(shí)別跟基于計(jì)算機(jī)視覺的行為識(shí)別有著相似的地方,都是主要采用模式識(shí)別或機(jī)器學(xué)習(xí)的分類方法,如決策樹DT(DecisionTree)、人工神經(jīng)網(wǎng)絡(luò)ANN(ArtificialNeuralNetwork)、支持向量機(jī)SVM(SupportVectorMachines)、近鄰算法NN(NearestNeighbor)等。常見基于傳感器行為識(shí)別采用的主要是時(shí)頻域特征,包括均值、方差、頻譜等[13,14],很少專門針對(duì)傳感器行為識(shí)別的特征,與圖像特征相比略顯單一。此外,基于傳感器的行為識(shí)別需要考慮整個(gè)識(shí)別系統(tǒng)功耗及系統(tǒng)使用壽命問題。
目前,基于傳感器的行為識(shí)別工作已有些突出性的成果投入市場(chǎng)。2011年,著名的藍(lán)牙耳機(jī)和揚(yáng)聲器廠商Jawbone發(fā)布了腕帶設(shè)備Jawboneup(如圖1a所示),該設(shè)備可以跟蹤用戶日常活動(dòng)、睡眠情況、飲食習(xí)慣等數(shù)據(jù)。2013年3月,谷歌在美國(guó)SXSW互動(dòng)大會(huì)上展示了一款“會(huì)說話的鞋子”(如圖1b所示),這是谷歌推出的第二款可穿戴設(shè)備,“鞋子”通過實(shí)時(shí)感知用戶運(yùn)動(dòng)狀態(tài),識(shí)別用戶運(yùn)動(dòng)情況,連接智能手機(jī)做出相應(yīng)的反應(yīng)[15],2014年3月,該大會(huì)中依舊展出了幾款可穿戴設(shè)備。2013年11月,日本電器股份有限公司NEC發(fā)布了一種通過弱無線電波來準(zhǔn)確偵測(cè)目標(biāo)形狀、人或物體運(yùn)動(dòng)軌跡的檢測(cè)裝置,如圖1c所示。這種裝置應(yīng)用于NEC公司專門開發(fā)的可鋪設(shè)于地面的片狀傳感器,通過該片狀傳感器可以檢測(cè)目標(biāo)物體或人群的一大情況??梢缘谝粫r(shí)間發(fā)現(xiàn)無人處摔倒的老人或患者,并且可以很好地保護(hù)大眾隱私安全問題[16]。
Figure 1 Applications of sensor-based activity recognition 圖1 基于傳感器行為識(shí)別應(yīng)用
雖然,基于傳感器行為識(shí)別已經(jīng)開始投入使用,其中仍存在若干亟待解決的問題。本文主要針對(duì)基于傳感器行為識(shí)別研究中,絕大多數(shù)特征為傳統(tǒng)的信號(hào)處理通用特征,缺乏專門針對(duì)基于傳感器行為識(shí)別的特征和分類方法局限于模式識(shí)別或機(jī)器學(xué)習(xí)算法兩個(gè)方面展開研究,以達(dá)到提升行為識(shí)別系統(tǒng)性能的目的。
論文接下來組織如下:第2節(jié)詳細(xì)介紹了所提出關(guān)聯(lián)特征和多任務(wù)壓縮感知方法,并引出了一種針對(duì)多任務(wù)的特征選擇方式。第3節(jié)在公開數(shù)據(jù)集上驗(yàn)證了所提取特征和分類方法的有效性。第4節(jié)對(duì)整篇論文進(jìn)行總結(jié),并給出了將來的研究方向。
2解決方案
目前,基于傳感器行為識(shí)別的研究已經(jīng)取得一些進(jìn)展和成果,但依然存在很多問題需要研究解決。針對(duì)當(dāng)前用于傳感器行為識(shí)別特征主要為傳統(tǒng)數(shù)字信號(hào)的時(shí)頻域特征問題,論文提出了一種基于多傳感器信息的關(guān)聯(lián)特征。傳感器網(wǎng)絡(luò)能耗集中在信息的接收、發(fā)送和監(jiān)聽方面,而本文中關(guān)聯(lián)特征是從已有傳感器信息中獲取,不需要系統(tǒng)傳輸額外數(shù)據(jù),這也就避免了信息傳輸過程中額外功耗問題。此外,目前絕大多數(shù)基于傳感器行為分類方法為機(jī)器學(xué)習(xí)算法,論文引入信號(hào)處理方法中的壓縮感知理論,結(jié)合稀疏表示,提出了一種基于多任務(wù)的壓縮感知MTCS(Multi-TaskCompressiveSensing)行為識(shí)別方法,該算法能充分利用傳感器數(shù)據(jù)的稀疏性。
2.1基于多傳感器信息的關(guān)聯(lián)特征提取
特征提取是通過對(duì)數(shù)據(jù)進(jìn)行處理來獲取更多有用信息的過程。而這些有用的信息對(duì)行為識(shí)別至關(guān)重要。在基于傳感器行為識(shí)別研究中,大多數(shù)研究人員使用時(shí)域特征和頻域特征,如均值、方差、標(biāo)準(zhǔn)差、頻譜等。很少有人考慮不同位置傳感器數(shù)據(jù)之間的關(guān)系性。文獻(xiàn)[17]指出在信號(hào)處理過程中不僅僅可以利用信號(hào)的稀疏性,而且還可以利用信號(hào)間的相關(guān)性。關(guān)聯(lián)特征是對(duì)多個(gè)傳感器數(shù)據(jù)進(jìn)行融合獲取的。當(dāng)行為發(fā)生時(shí),位于身體不同位置的傳感器數(shù)據(jù)之間存在差異,而且對(duì)于不同動(dòng)作而言,這種差異也是不一樣的,即相同傳感器節(jié)點(diǎn)之間對(duì)應(yīng)不同動(dòng)作時(shí)其相關(guān)性不一樣。例如,人在行走跟站立不動(dòng)兩種狀態(tài)下,位于手腕與腳腕傳感器數(shù)據(jù)的差異是不一樣的。關(guān)聯(lián)特征是從已有數(shù)據(jù)中提取的,不需要額外傳輸數(shù)據(jù),避免了額外數(shù)據(jù)傳輸能耗問題。
兩個(gè)運(yùn)動(dòng)向量之間相關(guān)性如式(1)所示:
(1)
Figure 2 Scatter plot in 2D feature space 圖2 二維特征空間中行為區(qū)分
不可否認(rèn),單一特征無法區(qū)分所有行為。如圖2所示,橫軸表示關(guān)聯(lián)特征空間,縱軸表示常見的特征空間,如均值、偏度、峰度等。從圖2a中可以看出,給定的兩種特征都無法區(qū)分所有行為。行為站與坐屬于靜態(tài)動(dòng)作,易混淆。從圖2b中可以看出,關(guān)聯(lián)特征對(duì)站與坐這兩種動(dòng)作區(qū)分性較好。而均值特征對(duì)這兩種行為區(qū)分性很差,幾乎無法區(qū)分這兩類動(dòng)作。同樣,在應(yīng)對(duì)三類或四類動(dòng)作時(shí),關(guān)聯(lián)特征依舊具有較好區(qū)分性,如圖2c和圖2d所示,驗(yàn)證了關(guān)聯(lián)特征的有效性。為了簡(jiǎn)化計(jì)算,本文采用兩個(gè)不同位置傳感器數(shù)據(jù)之差作為關(guān)聯(lián)特征添加到已有數(shù)據(jù)集中,組成新的特征向量進(jìn)行行為識(shí)別。兩個(gè)傳感器數(shù)據(jù)的差值能充分反映不同行為兩傳感器數(shù)據(jù)之間差異的變化。如圖3所示, x軸為每個(gè)傳感器節(jié)點(diǎn)在一個(gè)時(shí)刻點(diǎn)采集的五個(gè)值, y軸為采集數(shù)據(jù)值的大小,圖3中13條線條代表13種不同的動(dòng)作。其中,圖3a為傳感器節(jié)點(diǎn)5的數(shù)據(jù)表示;圖3b為傳感器節(jié)點(diǎn)1的數(shù)據(jù)表示;圖3c為傳感器節(jié)點(diǎn)1和5的數(shù)據(jù)之差,可以明顯看出圖3c中的13條曲線的稀疏性大于圖3a和圖3b。13條曲線的稀疏性在一定程度上反映的是數(shù)據(jù)對(duì)行為的區(qū)分性,主要原因?yàn)橐话闱闆r,若某個(gè)特征值對(duì)所有的行為而言都是一樣,那就意味著該特征對(duì)于行為的區(qū)分沒有意義;反之,若特征值對(duì)若干行為而言,值不一樣,而且,差異越大越有利于行為區(qū)分。
Figure 3 Comparison of correlation data 圖3 關(guān)聯(lián)數(shù)據(jù)對(duì)比
2.2基于多任務(wù)的壓縮感知方法(MTCS)
行為動(dòng)作可以由捆綁在身體上的傳感器節(jié)點(diǎn)獲取的數(shù)據(jù)表示。一個(gè)傳感器數(shù)據(jù)的子集代表一個(gè)行為動(dòng)作,則L個(gè)傳感器節(jié)點(diǎn)數(shù)據(jù)構(gòu)成一個(gè)動(dòng)作空間。
假定共有L個(gè)傳感器節(jié)點(diǎn)用于測(cè)量m種日常行為動(dòng)作,傳感器節(jié)點(diǎn)i在t時(shí)刻所采集到的K個(gè)數(shù)據(jù)值構(gòu)成的一維動(dòng)作觀測(cè)向量記為:
(2)
每個(gè)動(dòng)作序列由節(jié)點(diǎn)i在時(shí)長(zhǎng)h內(nèi)獲取的數(shù)據(jù)表示為:
(3)
由傳感器節(jié)點(diǎn)i獲取的第j類動(dòng)作對(duì)應(yīng)訓(xùn)練集中所有一維運(yùn)動(dòng)向量構(gòu)成的字典集表示為:
(4)
將整個(gè)訓(xùn)練集中m類動(dòng)作向量串聯(lián)起來,得到傳感器節(jié)點(diǎn)i對(duì)應(yīng)的字典集vi。
(5)
結(jié)合L個(gè)傳感器節(jié)點(diǎn)數(shù)據(jù),得到整體行為數(shù)據(jù)集v。
(6)
文獻(xiàn)[18]驗(yàn)證了傳感器所獲取的運(yùn)動(dòng)數(shù)據(jù)是稀疏的,且行為數(shù)據(jù)的獲取是通過多個(gè)傳感器節(jié)點(diǎn)實(shí)現(xiàn)的。因此,引入多任務(wù)壓縮感知(MTCS)方法作為行為識(shí)別分類器。
分別將所有傳感器節(jié)點(diǎn)運(yùn)動(dòng)向量看成是單個(gè)任務(wù),另外,將2.1節(jié)中獲取的關(guān)聯(lián)特征數(shù)據(jù)也看成獨(dú)立任務(wù),得到如表達(dá)式(7)所示的多任務(wù)數(shù)據(jù)模型。
(7)
在沒有提取關(guān)聯(lián)特征情況下,公式(7)中的N=L;當(dāng)提取關(guān)聯(lián)特征,并將提取的關(guān)聯(lián)特征加入到原有數(shù)據(jù)集時(shí),N>L。
假定用于測(cè)試的行為屬于第k類,則有近似的線性方程組表示如下:
(8)
在求解一個(gè)待識(shí)別的動(dòng)作的時(shí)候,利用稀疏表達(dá)分類方法可以將待求解問題轉(zhuǎn)換成多元線性回歸模型??紤]到實(shí)際測(cè)量過程中存在不可避免的誤差,可表示如下:
(9)
其中,εi(i=1,2,3,…)為噪聲值。
行為識(shí)別架構(gòu)如圖4所示。該架構(gòu)具有便于并行處理的優(yōu)勢(shì)。
Figure 4 Framework of multi-task activity recognition 圖4 多任務(wù)行為識(shí)別框架
根據(jù)壓縮感知理論可知,只要數(shù)據(jù)夠稀疏,可以將問題轉(zhuǎn)換成二次約束條件下最優(yōu)l1范數(shù)進(jìn)行求解。
αi=argmin‖αi‖1
(10)
(11)
其中,ri為任務(wù)i的殘差值向量。
共有m類動(dòng)作,在行為識(shí)別過程中,每個(gè)行為解析殘差向量將對(duì)應(yīng)m個(gè)殘差值,最終,將待求解行為分類到殘差值最小的類別。在處理多任務(wù)識(shí)別結(jié)果時(shí),很多研究人員傾向使用MajorityVoting[19]方法,在眾多識(shí)別結(jié)果中找出得票最高的類別作為最終識(shí)別結(jié)果。但是,實(shí)驗(yàn)結(jié)果顯示該方法存在一定局限,例如:不同的任務(wù)具有不同的行為識(shí)別能力,如表1所示,當(dāng)傳感器數(shù)目L=5,行為數(shù)目m=13,傳感器節(jié)點(diǎn)數(shù)據(jù)數(shù)目K=5時(shí),在特征向量大小一致情況下,傳感器節(jié)點(diǎn)1~5的行為識(shí)別率是不同的,驗(yàn)證了不同任務(wù)對(duì)行為識(shí)別能力存在差異。圖5給出的是傳感器節(jié)點(diǎn)1~5的數(shù)據(jù)對(duì)13種行為的識(shí)別率??梢悦黠@看出,不同傳感器節(jié)點(diǎn)數(shù)據(jù)對(duì)不同行為區(qū)分差異明顯,差別可以從99%到30%不等。采用MajorityVoting方法的缺點(diǎn)是存在強(qiáng)制性,多數(shù)派可以把意愿強(qiáng)加于少數(shù)派。例如:任務(wù)i對(duì)行為j的識(shí)別率為99%,而其他任務(wù)對(duì)該行為的識(shí)別率偏低,這勢(shì)必導(dǎo)致最終結(jié)果偏差。此外,實(shí)驗(yàn)結(jié)果顯示,采用MajorityVoting方法、得到的識(shí)別率為88.77%,而采用多個(gè)任務(wù)殘差之和求解多任務(wù)識(shí)別率可以達(dá)到91.77%,因此本文在多任務(wù)結(jié)果融合過程中采用多個(gè)任務(wù)殘差之和的方法。
Table 1 Activity recognition accuracy of sensor node 1~5
Figure 5 Recognition accuracy of sensor node 1~5 for 13 actions 圖5 1~5號(hào)傳感器節(jié)點(diǎn)數(shù)據(jù)對(duì)應(yīng)13種行為的識(shí)別率
所提出的方法中包括四個(gè)通用變量:傳感器數(shù)L、行為數(shù)目m、傳感器節(jié)點(diǎn)包含數(shù)據(jù)數(shù)目K和采樣時(shí)長(zhǎng)h。整個(gè)行為識(shí)別實(shí)現(xiàn)詳細(xì)過程如下:
步驟4通過求解最小化l1范數(shù)下的優(yōu)化問題得到稀疏系數(shù)。
步驟5計(jì)算殘差,融合多個(gè)任務(wù)殘差結(jié)果,選擇多個(gè)任務(wù)殘差和最小的類別作為最終識(shí)別結(jié)果。
2.3基于多任務(wù)的特征選擇
在行為識(shí)別過程中,并不是所有的特征都對(duì)行為識(shí)別有效,特征選擇不僅僅可以找出更有用的特征,而且可以降低數(shù)據(jù)維度,解決大數(shù)據(jù)帶來的維度災(zāi)難,簡(jiǎn)化計(jì)算模型。
Relief算法是一種特征權(quán)重算法,最先由Kira K和Rendell L A[20]在1992年提出,根據(jù)各個(gè)特征和類別的相關(guān)性賦予特征不同的權(quán)重,權(quán)重小于某個(gè)閾值的特征將被移除。該算法局限于兩類數(shù)據(jù)的分類問題。1994年Kononenko I[21]改進(jìn)了Relief算法,提出Relief-F算法。Relief-F算法突破Relief算法的缺陷,能解決多類分類問題。由于該算法具有較低時(shí)間開銷,并且在很多模式識(shí)別和機(jī)器學(xué)習(xí)問題中效果良好,受到眾多學(xué)者喜歡。因此,論文采用Relief-F作為特征選擇算法。
一般情況下,研究人員更傾向于對(duì)所有數(shù)據(jù)進(jìn)行一次性特征選擇,即將所有用于識(shí)別的數(shù)據(jù)存儲(chǔ)在一個(gè)特征向量中,然后用特征選擇方法對(duì)特征進(jìn)行選擇。每個(gè)特征具有一個(gè)特征權(quán)值,通過選擇權(quán)值較大的n個(gè)特征組成新的特征向量,最后轉(zhuǎn)換成多任務(wù)模型對(duì)數(shù)據(jù)進(jìn)行分類或識(shí)別。然而,該種方法沒有充分考慮不同位置傳感器數(shù)據(jù)對(duì)行為區(qū)分度的差異性,即處于不同位置的傳感器節(jié)點(diǎn)對(duì)行為特征的權(quán)值不一樣??紤]傳感器節(jié)點(diǎn)分布異構(gòu)性,本文將多任務(wù)對(duì)應(yīng)多個(gè)特征向量,對(duì)每個(gè)特征向量進(jìn)行特征選擇,每個(gè)特征向量選擇權(quán)值較大的n個(gè)特征,最后對(duì)多任務(wù)進(jìn)行分類或識(shí)別。圖6給出的是20組測(cè)試數(shù)據(jù)采用兩種不同的特征選擇方法得到的行為識(shí)別情況。采用多任務(wù)壓縮感知分類方法(MTCS),每個(gè)任務(wù)具有40個(gè)特征??梢悦黠@看出,對(duì)于不同位置傳感器數(shù)據(jù)按照不同權(quán)值向量進(jìn)行特征選擇得到的結(jié)果優(yōu)于按照相同權(quán)值向量進(jìn)行特征選擇的結(jié)果。另外,第二組測(cè)試數(shù)據(jù)識(shí)別效果明顯差于其他幾組,主要原因是20個(gè)志愿者中除了第二名志愿者年齡為75,其余19位志愿者年齡皆位于19~36。
Figure 6 Error recognition rate of 20 groups of individual data in different feature selection ways 圖 6 不同特征選擇方式下20組個(gè)體數(shù)據(jù)誤識(shí)率
3實(shí)驗(yàn)結(jié)果
所有實(shí)驗(yàn)運(yùn)行在奔騰雙核E6700,CPU主頻為3.2 GHz、內(nèi)存為2 GB的PC機(jī)上,采用Matlab 2013作為仿真工具。
本文采用加州伯克利大學(xué)Yang A等人[22]提供的可穿戴行為識(shí)別數(shù)據(jù)庫(kù)WARD(Wearable Action Recognition Database) 。它是一個(gè)公開的相對(duì)穩(wěn)定的基于傳感器的行為識(shí)別數(shù)據(jù)庫(kù),便于對(duì)已經(jīng)存在的算法進(jìn)行定量分析比較。
通過捆綁在身體上的L=5個(gè)傳感器節(jié)點(diǎn)組成的體域網(wǎng)獲取人體運(yùn)動(dòng)行為數(shù)據(jù)。五個(gè)傳感器節(jié)點(diǎn)分別捆綁于腰部、左右手腕和左右腳腕。每個(gè)傳感器節(jié)點(diǎn)包含了一個(gè)三軸加速度計(jì)和一個(gè)二軸陀螺儀,即傳感器節(jié)點(diǎn)測(cè)量值數(shù)目。采樣頻率為30 Hz。數(shù)據(jù)庫(kù)包含了m=13種日常行為動(dòng)作,由20名志愿者采集完成(其中13名男性,7名女性),每名志愿者重復(fù)每個(gè)動(dòng)作五遍,共計(jì)13×20×5=1300個(gè)動(dòng)作序列。13種行為動(dòng)作分別為:(1)站(ST);(2)坐(SI);(3)躺(LI);(4)向前走(WF);(5)逆時(shí)針走(WL);(6)順時(shí)針走(WR);(7)向左轉(zhuǎn)(TL);(8)向右轉(zhuǎn)(TR);(9)上樓(UP);(10)下樓(DO);(11)慢跑(JO);(12)跳 (JU);(13)推輪椅(PU)。以h=40采樣時(shí)長(zhǎng)為大小的固定窗口選取數(shù)據(jù)組成訓(xùn)練集。每個(gè)傳感器節(jié)點(diǎn)對(duì)應(yīng)的動(dòng)作向量看成單個(gè)任務(wù),得到單個(gè)任務(wù)數(shù)據(jù)維數(shù)為5×40=200。然后采用MTCS方法對(duì)多任務(wù)數(shù)據(jù)進(jìn)行分類。應(yīng)用MTCS方法求解過程中使用了Matlab工具包[23]。所有用到的特征都被歸一化到區(qū)間[-1,1]。為了保證數(shù)據(jù)個(gè)體獨(dú)立性,實(shí)驗(yàn)采用留一驗(yàn)證方法,即每次采用一個(gè)志愿者數(shù)據(jù)作為測(cè)試數(shù)據(jù),另外19個(gè)志愿者數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。共計(jì)20組測(cè)試數(shù)據(jù),最后將20組結(jié)果取平均值作為最終行為識(shí)別結(jié)果。
3.1基于多任務(wù)壓縮感知方法效果
為了評(píng)估所提出的多任務(wù)壓縮感知算法的性能,我們以識(shí)別率作為衡量指標(biāo),與Weka工具中的六種常見分類算法(J48算法,隨機(jī)森林(RF)、近鄰(NN)、樸素貝葉斯(NB)、貝葉斯網(wǎng)絡(luò)(BN)和支持向量機(jī)(SVM))進(jìn)行比較,所有方法參數(shù)采用默認(rèn)值。結(jié)果如圖7所示,在參數(shù)默認(rèn)情況下,其中BN算法是Weka中六種分類方法效果最好的,它的行為識(shí)別率為87.08%,比MTCS方法的識(shí)別率低了近5%。
Figure 7 Accuracy of 7 classifiers 圖7 七種不同分類器識(shí)別效果對(duì)比
圖8給出的是單任務(wù)壓縮感知方法(特殊的多任務(wù)壓縮感知方法,其任務(wù)數(shù)N=1)與多任務(wù)壓縮感知方法行為識(shí)別效果對(duì)比。采用Relief-F算法進(jìn)行特征選擇,隨著所采用的特征數(shù)增加,多任務(wù)壓縮感知方法優(yōu)勢(shì)明顯。在識(shí)別率上,最優(yōu)情況下,多任務(wù)壓縮感知方法能高出單任務(wù)壓縮感知方法約6%。而且, 在總的特征維數(shù)為1 000時(shí),單任務(wù)壓縮感知方法整體識(shí)別效果只能達(dá)到87.92%,比多任務(wù)壓縮感知方法識(shí)別率低了近4%。另外,單任務(wù)方式識(shí)別65組測(cè)試數(shù)據(jù)所需時(shí)間開銷約為18 s,多任務(wù)方式采用并行方式所需時(shí)間開銷約為8 s,速度提升一倍多。由此可見,所提出的多任務(wù)壓縮感知方法不但能提升行為識(shí)別率,而且便于采用并行方式進(jìn)行求解,有效提高行為識(shí)別速度。
Figure 8 Single task compressive sensing VS MTCS 圖 8 單任務(wù)與多任務(wù)壓縮感知行為識(shí)別效果對(duì)比
3.2引入關(guān)聯(lián)特征行為識(shí)別效果
為了評(píng)估關(guān)聯(lián)特征對(duì)基于傳感器行為識(shí)別的影響,采用MTCS算法進(jìn)行行為分類,Relief-F算法進(jìn)行特征選擇。如圖9所示,隨著特征數(shù)目增加,使用了關(guān)聯(lián)特征的識(shí)別結(jié)果總是優(yōu)于沒有使用關(guān)聯(lián)特征數(shù)據(jù)的識(shí)別結(jié)果,而且平均高出2%。從圖9中可以看出,當(dāng)特征數(shù)達(dá)到40之后,行為識(shí)別率變化不大,這也就說明了所提出的方法對(duì)于降低數(shù)據(jù)維數(shù)具有一定效果。當(dāng)總的特征維數(shù)為700時(shí),行為識(shí)別率可以達(dá)到93.77%,對(duì)應(yīng)混淆矩陣如表2所示,混淆矩陣給出了所有測(cè)試數(shù)據(jù)中每種行為被正確識(shí)別的數(shù)目,以及誤識(shí)數(shù)目及類別。
Table 2 Confusion matrix for recognition of 13 actions
與使用相同數(shù)據(jù)庫(kù)的已有方法進(jìn)行比較,結(jié)果如表3所示。
Table 3 Comparison with other methods using WARD
文獻(xiàn)[22]中,作者使用分布式稀疏分類器,采用滑動(dòng)窗口策略選取數(shù)據(jù),窗口大小為45個(gè)采樣點(diǎn),另外,其獲取的動(dòng)作序列為13 000,高出本文所采用的1300十倍,與之相比,論文方法具有更簡(jiǎn)單的計(jì)算模型。文獻(xiàn)[18]中,作者所采用的采樣點(diǎn)數(shù)目和動(dòng)作序列數(shù)目與本文相同,但是多任務(wù)方法使其具有更好的識(shí)別效果,包括識(shí)別率和識(shí)別速度的提升。文獻(xiàn)[24]雖然在識(shí)別率上優(yōu)于本文,但是其采用的驗(yàn)證方法為3倍交叉驗(yàn)證的方法,這存在的巨大問題是無法保證個(gè)體獨(dú)立性。另外,如文獻(xiàn)[25]中所示,同樣的數(shù)據(jù),采用不同的驗(yàn)證方式結(jié)果相差巨大。
Figure 9 Effect of correlation features on activity recognition 圖 9 關(guān)聯(lián)特征對(duì)行為識(shí)別率影響
4結(jié)束語
本文通過分析已有基于傳感器行為識(shí)別研究點(diǎn),針對(duì)其中的行為識(shí)別方法和特征提取展開研究。提出了一種基于多任務(wù)的壓縮感知方法用于行為分類;同時(shí),針對(duì)已有行為識(shí)別方法中單一時(shí)頻域特征問題,提出了新的關(guān)聯(lián)特征。另外,引出與多任務(wù)相對(duì)應(yīng)的基于任務(wù)的特征選擇方式。大量實(shí)驗(yàn)結(jié)果表明了所提出的特征和分類方法有助于提升基于傳感器行為識(shí)別的性能。下一步工作是在現(xiàn)有的基礎(chǔ)上,應(yīng)對(duì)大數(shù)據(jù)時(shí)代,提升數(shù)據(jù)規(guī)模,加大行為識(shí)別過程中并行力度,構(gòu)建基于云平臺(tái)的實(shí)時(shí)行為識(shí)別系統(tǒng)。
參考文獻(xiàn):
[1]Thapa A,Shin S.QoS provisioning in wireless body area networks:A review on MAC aspects[J].KSII Transactions on Internet & Information Systems, 2012, 6(5):1267-1285.
[2]Intel’s new Quark chips target wearable computing [EB/OL]. [2013-09-11]. http://www.infoworld.com/d/computer-hardware/intels-new-quark-chips-target-wearable-computing-226529.
[3]Zhu C,Sheng W.Realtime recognition of complex human daily activities using human motion and location data[J]. IEEE Transactions on Biomedical Engineering,2012,59(9):2422-2430.
[4]Maekawa T, Kishino Y,Sakurai Y, et al.Activity recognition with hand-worn magnetic sensors[J].Personal and Ubiquitous Computing,2013, 17(6):1085-1094.
[5]Chavarriaga R, Sagha H, Calatroni A, et al. The opportunity challenge:A benchmark database for on-body sensor-based activity recognition[J]. Pattern Recognition Letters, 2013, 34(15):2033-2042.
[6]Anguita D, Ghio A, Oneto L, et al. A public domain dataset for human activity recognition using smartphones[C]//Proc of European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning, 2013:437-442.
[7]Chavarriaga R, Bayati H, Millán J R. Unsupervised adaptation for acceleration-based activity recognition:Robustness to sensor displacement and rotation[J]. Personal and Ubiquitous Computing, 2013, 17(3):479-490.
[8]Banos O, Damas M, Pomares H, et al. Human activity recognition based on a sensor weighting hierarchical classifier[J]. Soft Computing, 2013, 17(2):333-343.
[9]Chen C, Shen H. A feature evaluation method for template matching in daily activity recognition[C]//Proc of 2013 IEEE International Conference on Signal Processing, Communication and Computing (ICSPCC), 2013:1-4.
[10]Zhang M, Sawchuk A A. A feature selection-based framework for human activity recognition using wearable multimodal sensors[C]//Proc of the 6th International Conference on Body Area Networks, 2011:92-98.
[11]Wu C H, Tseng Y C. Data compression by temporal and spatial correlations in a body-area sensor network:A case study in pilates motion recognition[J]. IEEE Transactions on Mobile Computing, 2011, 10(10):1459-1472.
[12]Qi Juan,Chen Yi-qiang,Liu Jun-fa,et al. Power-efficient activity recognition based on multi-modal information sensing and fusion[J].Journal of Software, 2010,21(12):39-50.(in Chinese)
[13]Barshan B,Yüksek M C.Recognizing daily and sports activities in two open source machine learning environments using body-worn sensor units[J].The Computer Journal,2013,56(11):1-19.
[14]Casale P, Pujol O, Radeva P.Human activity recognition from accelerometer data using a wearable device[C]//Proc of the Iberian Conference on Pattern Recognition and Image Analysis, 2011:289-296.
[15]The talking trainers:Hi-tech shoes that nag you to get off the sofa and work out[EB/OL].[2013-03-10]. http://www.dailymail.co.uk/sciencetech/article-2291275/SXSW-2013-Googles-Hi-tech-shoes-nag-sofa-work-out.html.
[16]NEC develops cameraless monitoring system [EB/OL]. [2013-11-14]. http://www.ubergizmo.com/2013/11/ nec-develops-cameraless-monitoring-system/.
[17]Zhang Hai-chao, Zhang Yan-ning, Nasrabadi N M, et al.Joint-structured-sparsity-based classification for multiple-measurement transient acoustic signals[J].IEEE Transactions on Systems,Man, and Cybernetics Part-B:CYBERNETICS, 2012,42(6):1586-1598.
[18]Xiao Ling,Li Ren-fa,Luo Juan.Recognition of human activity based on compressed sensing in body sensor networks[J].Journal of Electronics & Information Technology, 2013,35(1):119-125.(in Chinese)
[19]Hajdu A, Hajdu L, Jonas A, et al. Generalizing the majority voting scheme to spatially constrained voting[J]. IEEE Transactions on Image Processing, 2013,22(11):4182-4194.
[20]Kira K, Rendell L A.The feature selection problem:Traditional methods and a new algorithm[C]//Proc of AAAI, 1992:129-134.
[21]Kononenko I.Estimating attributes:Analysis and extensions of RELIEF[C]//Proc of Machine Learning:ECML-94, 1994:171-182.
[22]Yang A Y, Jafari R, Sastry S S,et al.Distributed recognition of human actions using wearable motion sensor networks[J].Journal of Ambient Intelligence and Smart Environments,2009,1(2):103-115.
[23]Berg E V,Friedlander M P.SPGL1:A solver for large-scale sparse reconstruction [EB/OL]. [2013-05-10].http://www.cs.ubc.ca/labs/scl/spgl1.
[24]Guo Y C, He W H, Gao C.Human activity recognition by fusing multiple sensor nodes in the wearable sensor systems[J].Journal of Mechanics in Medicine and Biology,2012,12(5):1-15.
[25]Altun K, Barshan B, Tun?el O.Comparative study on classifying human activities with miniature inertial and magnetic sensors[J].Pattern Recognition,2010, 43(10):3605-3620.
參考文獻(xiàn):附中文
[12]齊娟,陳益強(qiáng),劉軍發(fā),等.融合多模信息感知的低功耗行為識(shí)別[J].軟件學(xué)報(bào),2010,21(12):39-50.
[18]肖玲,李仁發(fā),羅娟.體域網(wǎng)中一種基于壓縮感知的人體動(dòng)作識(shí)別方法[J].電子與信息學(xué)報(bào),2013,35(1):119-125.
段夢(mèng)琴(1989-),女,湖南洪江人,碩士生,CCF會(huì)員(E200029841G),研究方向?yàn)闄C(jī)器學(xué)習(xí)和傳感器網(wǎng)絡(luò)。E-mail:mengqinduan@126.com
DUAN Meng-qin,born in 1989,MS candidate,CCF member(E200029841G),her research interests include machine learning, and senor network.
李仁發(fā)(1956-),男,湖南郴州人,博士,教授,博士生導(dǎo)師,研究方向?yàn)榍度胧较到y(tǒng)、CPS和傳感器網(wǎng)絡(luò)。E-mail:lirenfa@vip.sina.com
LI Ren-fa,born in 1956,PhD,professor,PhD supervisor,his research interests include embedded system, CPS, and sensor network.