張嘉璐 牟勇
(1.大連海事大學(xué),遼寧大連 116026;2.中體彩科技發(fā)展有限公司,北京 100021)
隨著人們生活水平的提高和環(huán)境輔助的廣泛應(yīng)用,在移動(dòng)物聯(lián)網(wǎng)的高速發(fā)展下,行為識(shí)別領(lǐng)域得到了長足的發(fā)展[1]。但是在智能家居中泛在傳感器的行為識(shí)別仍然呈現(xiàn)出許多挑戰(zhàn):例如通過傳感器觸發(fā)的異常行為數(shù)據(jù)點(diǎn)來分析居民日常行為[2],以便于有效地保護(hù)老年人和生活不能自理的人。根據(jù)上述原因,泛在傳感器下的智能家居環(huán)境中行為識(shí)別技術(shù)研究具有重要的學(xué)術(shù)意義。
在行為識(shí)別領(lǐng)域中,根據(jù)傳感器與人體的交互模式,可以將行為識(shí)別中應(yīng)用的傳感器分為兩大類:非侵入式和入侵式傳感器。本文實(shí)驗(yàn)的行為識(shí)別數(shù)據(jù)集均來自于華盛頓州立大學(xué)CASAS實(shí)驗(yàn)室。
基于泛在傳感器的日常行為識(shí)別無法獲取用戶日常生活圖像、聲音等信息,只能通過傳感器傳輸?shù)男袨閿?shù)據(jù)來對(duì)異常行為進(jìn)行分析。通過對(duì)用戶觸發(fā)的傳感器進(jìn)行分析,得到居民日常行為規(guī)律,從而將同一行為中與行為習(xí)慣規(guī)律相左的行為識(shí)別異常行為,本文主要研究兩種情況下的泛在傳感器智能家居異常行為:
(1)第一類為行為開始和結(jié)束時(shí)間異常。例如:在單用戶行為識(shí)別中,某一個(gè)用戶每天吃藥的開始時(shí)間通常在中午12點(diǎn)左右,但是突然有一天吃藥的開始時(shí)間發(fā)生在了下午或者其余時(shí)間,在這種情況下,發(fā)生的行為就屬于吃藥行為開始時(shí)間異常。
(2)第二類為行為持續(xù)時(shí)間異常。例如:在單用戶行為識(shí)別中,某一個(gè)用戶每天去衛(wèi)生間的持續(xù)時(shí)間為30min左右,但是突然有一天去衛(wèi)生間的時(shí)間持續(xù)了兩個(gè)小時(shí),那么該行為就屬于行為持續(xù)時(shí)間異常,可能原因是用戶身體出現(xiàn)異?;蛘呤怯脩艏依锏脑O(shè)備壞了,可能需要維修等。
在日常行為識(shí)別中,異常行為識(shí)別[3-4]的方法主要是先將人工標(biāo)注的正常行為進(jìn)行建模,再將待測試行為與建模后的模型進(jìn)行對(duì)比來判別是否為異常行為。本文根據(jù)不同行為的不同異常表現(xiàn)形式,首先對(duì)行為進(jìn)行余弦相似度計(jì)算,將余弦相似度計(jì)算出的向量作為特征值。之后,采用DBSCAN聚類算法以正常行為為參照來對(duì)該類行為的特征進(jìn)行聚類來進(jìn)行異常行為識(shí)別。
余弦相似度是通過計(jì)算特征之間的距離來計(jì)算行為之間的相似度,公式1給出了余弦相似度在異常行為識(shí)別中的應(yīng)用。本文將計(jì)算余弦相似度后的特征作為DBSCAN算法的輸入:
基于密度的聚類算法中最常用的算法之一為DBSCAN算法,其具有良好的抗噪性并且對(duì)異常數(shù)據(jù)敏感的特點(diǎn)。不但適用于凸樣本數(shù)據(jù)集,同樣適用于非凸樣本數(shù)據(jù)集。
本文首先,對(duì)第一種異常行為采用統(tǒng)計(jì)方法某一行為的開始和結(jié)束時(shí)間作為特征,然后用余弦相似度進(jìn)行特征計(jì)算,計(jì)算后的距離值作為新的特征向量。采用DBSCAN算法來對(duì)這些特征向量進(jìn)行聚類,從而進(jìn)行異常行為識(shí)別。然后針對(duì)第二種異常行為統(tǒng)計(jì)觸發(fā)該行為的持續(xù)時(shí)間和傳感器作為特征向量,同樣余弦距離與DBSCAN算法來識(shí)別其中的異常行為。最后,通過對(duì)比實(shí)驗(yàn)驗(yàn)證了本文提出的異常行為識(shí)別方法可以有效識(shí)別異常行為。
為了驗(yàn)證異常行為識(shí)別的有效性,本文采用hh103數(shù)據(jù)集分別展示了兩類異常行為識(shí)別的實(shí)驗(yàn)結(jié)果。
如圖1所示,橫軸表示Cook_Lunch行為的開始時(shí)間,縱軸表示Cook_Lunch行為的結(jié)束時(shí)間(為了將特征描述更加清晰,將24h制的時(shí)間轉(zhuǎn)換秒值,例如:01:20轉(zhuǎn)換為相應(yīng)的小數(shù)值為4800)。
從圖2中可以看出hh103數(shù)據(jù)集“Cook_Lunch”行為的發(fā)生時(shí)間和結(jié)束時(shí)間的特征向量利用余弦距離和DBSCAN算法相結(jié)合后,進(jìn)行聚類之后獲得了該用戶有六個(gè)異常行為數(shù)據(jù)點(diǎn),可能是用戶行為發(fā)生了異常行為。其中“Cook_Lunch”行為的開始與結(jié)束時(shí)間均異常的數(shù)據(jù)點(diǎn)有四個(gè),行為開始時(shí)間異常的數(shù)據(jù)點(diǎn)有一個(gè)。從圖1中還可以看出,用戶的做飯開始時(shí)間在43000s結(jié)束時(shí)間在46000s,而異常點(diǎn)則不在此范圍內(nèi)。
為了驗(yàn)證第二類異常行為實(shí)驗(yàn)的有效性,本章采用余弦相似度與DBSCAN算法對(duì)某個(gè)行為的持續(xù)時(shí)間和傳感器觸發(fā)頻次進(jìn)行聚類。
圖2展示了hh103數(shù)據(jù)集的“Cook_Lunch”行為的持續(xù)時(shí)間的異常點(diǎn)情況。其中,這個(gè)圖的橫軸表示行為觸發(fā)的傳感器頻次,縱軸表示行為持續(xù)的時(shí)間。從圖2中看出,被檢測出的異常點(diǎn)有5個(gè)。其中,用戶觸發(fā)正常行為的持續(xù)時(shí)間在400s之內(nèi),而異常行為的持續(xù)時(shí)間則超過了400s,并且從圖2中也可以直觀的看出這5個(gè)行為偏離了其正常行為的范圍,因此可以考慮這5個(gè)行為為用戶“Cook_Lunch”的異常行為。
從本文監(jiān)測的行為的開始/結(jié)束時(shí)間異常和持續(xù)時(shí)間異常的兩種異常行為識(shí)別可以看出不同用戶有自己特定的日常生活習(xí)慣在做相同的行為時(shí),行為發(fā)生時(shí)間、結(jié)束時(shí)間以及持續(xù)時(shí)間都不相同。因此采用余弦相似度與DBSCAN結(jié)合對(duì)每個(gè)用戶的行為模式來檢測用戶行為的異常情況。