張昱彤,翟旭平,汪 靜
一種基于低分辨紅外傳感器的動(dòng)作識(shí)別方法
張昱彤,翟旭平,汪 靜
(上海大學(xué) 特種光纖與光接入網(wǎng)重點(diǎn)實(shí)驗(yàn)室,上海 200444)
如今,世界各國(guó)人口老齡化問(wèn)題日益嚴(yán)重,為了避免獨(dú)居老人發(fā)生意外,老人日常動(dòng)作監(jiān)測(cè)和識(shí)別算法成為了研究熱點(diǎn)。本文設(shè)計(jì)了一種基于低分辨紅外傳感器的動(dòng)作識(shí)別方法,通過(guò)紅外傳感器采集探測(cè)區(qū)的溫度分布數(shù)據(jù),對(duì)溫度分布數(shù)據(jù)進(jìn)行處理,從時(shí)間、溫度、形變和軌跡4個(gè)方面提取多個(gè)特征,最后通過(guò)K近鄰算法對(duì)“行走”、“彎腰”、“坐下”、“站起”和“摔倒”5種動(dòng)作進(jìn)行分類。實(shí)驗(yàn)結(jié)果表明平均識(shí)別準(zhǔn)確率可達(dá)到97%,其中摔倒動(dòng)作的識(shí)別準(zhǔn)確率為100%。
動(dòng)作識(shí)別;特征提?。坏头直媛始t外傳感器;K近鄰算法
根據(jù)國(guó)際劃分標(biāo)準(zhǔn),一個(gè)國(guó)家或地區(qū)65歲及以上人口占比達(dá)到7%,就意味著進(jìn)入了老齡化社會(huì)[1]。研究表明,獨(dú)居尤其高齡老人成為意外傷害的高危人群,跌倒是導(dǎo)致老年人殘疾,甚至死亡的主要原因[2]。因此研究室內(nèi)安全監(jiān)測(cè)算法顯得十分重要。
目前,國(guó)內(nèi)外已有很多針對(duì)室內(nèi)跌倒檢測(cè)算法的研究,使用的設(shè)備可以分為攝像裝置和傳感裝置?;跀z像裝置的檢測(cè)算法通過(guò)對(duì)采集到的視頻幀逐幀分析,完成動(dòng)作識(shí)別[3]。但是攝像裝置不僅會(huì)暴露使用者的隱私,還極易受到光照的影響,在黑暗環(huán)境中性能會(huì)大大降低。傳感裝置可分為需穿戴傳感器和無(wú)需穿戴傳感器。需穿戴傳感器檢測(cè)算法通過(guò)穿戴加速度傳感器[4]等設(shè)備采集源數(shù)據(jù),研究摔倒時(shí)突然的加速檢測(cè)摔倒,但是需要老人時(shí)刻穿戴著傳感器裝置,十分不便。無(wú)需穿戴的傳感器主要有壓力傳感器、聲學(xué)傳感器、二值傳感器和紅外傳感器。基于壓力傳感器[5]和聲學(xué)傳感器[6]的檢測(cè)算法是將傳感器放置于地面,提取不同動(dòng)作聲音或者對(duì)地板產(chǎn)生的壓力信號(hào)檢測(cè)摔倒,但在日常生活中,其他外物時(shí)常產(chǎn)生聲音干擾,對(duì)地板也可能產(chǎn)生壓力從而造成干擾,檢測(cè)準(zhǔn)確率較低。基于二值傳感器的檢測(cè)算法[7]通過(guò)多個(gè)二值傳感器同時(shí)采集數(shù)據(jù),研究數(shù)據(jù)波形的時(shí)域相關(guān)性,檢測(cè)跌倒,但是需要先采集固定地點(diǎn)和時(shí)間段的日常動(dòng)作數(shù)據(jù)作為參照,否則需要再次采取源數(shù)據(jù),魯棒性極低。
為了解決上述問(wèn)題,有人提出使用被動(dòng)紅外傳感器。被動(dòng)紅外傳感器通過(guò)接收外界發(fā)出的紅外輻射進(jìn)行工作,采集到的數(shù)據(jù)為探測(cè)區(qū)域的溫度數(shù)據(jù)。此類傳感器不受光強(qiáng)弱變化的影響,無(wú)需人為穿戴,同時(shí)保護(hù)了用戶的隱私。日本的Shota Mashiyama團(tuán)隊(duì)[8]采用分辨率為8×8的Grid-eye紅外傳感,對(duì)日常動(dòng)作和靜止等5個(gè)動(dòng)作進(jìn)行分類,摔倒、行走和靜止這3種能明顯區(qū)分的動(dòng)作識(shí)別率很高,但是行走和站立這兩種相似度較高的動(dòng)作識(shí)別率相對(duì)較低。Akira Hayashida團(tuán)隊(duì)[9]則考慮將紅外傳感器裝置應(yīng)用在不同的家庭場(chǎng)景中檢測(cè)摔倒。該團(tuán)隊(duì)對(duì)比了不同室溫、家庭環(huán)境和光照條件下的摔倒檢測(cè)正確率,驗(yàn)證魯棒性。但該算法需設(shè)定較多的閾值,閾值的選取很大程度上決定了算法的性能表現(xiàn),同時(shí)大量的閾值選取算法也增加了算法的計(jì)算量。楊任兵等人[10]將8×8的紅外傳感器置于天花板設(shè)計(jì)分類算法,將溫度和特征進(jìn)行了結(jié)合,提高了摔倒的檢測(cè)率,但是所提取的特征存在在不同動(dòng)作的反映上有著相似性,所以一些坐下的動(dòng)作會(huì)被錯(cuò)判為摔倒,虛警率較大,且8×8傳感器的廣角較小,探測(cè)區(qū)無(wú)法完全覆蓋面積較大的家庭場(chǎng)景。王召軍等人[11]采用HTPA 32×32紅外傳感器,提取5種特征對(duì)3種動(dòng)作進(jìn)行分類,且根據(jù)傳感器的安裝角度對(duì)特征數(shù)據(jù)進(jìn)行校準(zhǔn),最終識(shí)別率較高,但是實(shí)際生活中無(wú)法精準(zhǔn)得到夾角的準(zhǔn)確值,對(duì)結(jié)果會(huì)有一定的影響。
本文采用HEIMANN型號(hào)為HTPA80x64dR 1L5.0/1.0的紅外陣列傳感器提出一種識(shí)別彎腰、坐下、站起、行走和摔倒5種日常動(dòng)作的方法。該方法不僅對(duì)活動(dòng)人體進(jìn)行了檢測(cè),也進(jìn)行了前景提取,通過(guò)背景減除法提取前景,根據(jù)奈曼-皮爾遜準(zhǔn)則確定初始最佳判決閾值,完成了人體區(qū)域提取。之后從時(shí)間、溫度、形變和軌跡4個(gè)方面提取6個(gè)特征,最后對(duì)比了不同分類器的識(shí)別結(jié)果,也將本文方法與其他方法的結(jié)果進(jìn)行了對(duì)比。
本文人體動(dòng)作識(shí)別方法流程如圖1所示,分為活動(dòng)人體檢測(cè)、前景提取、特征提取和分類4個(gè)部分。計(jì)算每幀數(shù)據(jù)的最大溫度方差,若該方差大于閾值,則在探測(cè)區(qū)存在人體活動(dòng)。在接收到溫度分布數(shù)據(jù)之后,為了方便進(jìn)行特征提取,先通過(guò)前景提取算法提取人體輪廓?;顒?dòng)人體檢測(cè)和前景提取完成后,提取特征,利用K近鄰(K-Nearest Neighbor,KNN)分類器,與數(shù)據(jù)庫(kù)的訓(xùn)練集數(shù)據(jù)進(jìn)行對(duì)比,判斷接收到的數(shù)據(jù)的動(dòng)作類別。
圖1 動(dòng)作識(shí)別方法流程圖
紅外探測(cè)區(qū)無(wú)人活動(dòng)時(shí),每個(gè)像素點(diǎn)的溫度值在時(shí)域上波動(dòng)較小,而當(dāng)人在探測(cè)區(qū)中活動(dòng)時(shí),時(shí)域溫度波動(dòng)較大。根據(jù)這一特點(diǎn),可以通過(guò)提取每幀的最大溫度方差來(lái)判斷探測(cè)區(qū)是否有人體活動(dòng),以便進(jìn)行后續(xù)操作。
由于制作工藝和測(cè)試環(huán)境等原因,噪聲嚴(yán)重影響到溫度數(shù)據(jù)的準(zhǔn)確性。A. A. Trfimova等人在文獻(xiàn)[8]的基礎(chǔ)上采用卡爾曼濾波[12]的方式對(duì)數(shù)據(jù)先進(jìn)行預(yù)處理,但是卡爾曼濾波需要大量環(huán)境數(shù)據(jù),計(jì)算量較大,無(wú)法實(shí)現(xiàn)實(shí)時(shí)的去噪。經(jīng)過(guò)分析,測(cè)試數(shù)據(jù)的噪聲近似服從高斯分布,因此采用大小為3×3的高斯濾波模板對(duì)測(cè)試數(shù)據(jù)預(yù)處理。
a為第幀的第(,)個(gè)像素點(diǎn)的溫度值。第幀每個(gè)像素點(diǎn)的方差計(jì)算公式為:
經(jīng)過(guò)公式(1),可以得到每一幀的溫度方差分布矩陣:
根據(jù)之前的分析,當(dāng)有人體在探測(cè)區(qū)活動(dòng)時(shí),探測(cè)區(qū)的溫度會(huì)發(fā)生較大波動(dòng),于是通過(guò)公式(4)提取每幀的最大溫度方差:
若vmax大于閾值th則說(shuō)明探測(cè)區(qū)有人體活動(dòng)。閾值th的選取決定著活動(dòng)人體檢測(cè)的準(zhǔn)確率和特征提取的正確性。由于采集數(shù)據(jù)的時(shí)間很長(zhǎng),環(huán)境溫度和器件自身的溫度都會(huì)有微小改變,所以本文確定閾值th的方法為在探測(cè)區(qū)無(wú)人的環(huán)境下,實(shí)驗(yàn)前、實(shí)驗(yàn)中和實(shí)驗(yàn)后3個(gè)時(shí)間段中,運(yùn)行實(shí)驗(yàn)裝置直至最大幀數(shù),各重復(fù)3次,共9組數(shù)據(jù),分別計(jì)算9組數(shù)據(jù)的最大溫度方差,選取最大值作為閾值th。為了研究環(huán)境溫度和傳感器安裝空間對(duì)閾值的影響,分別在校內(nèi)實(shí)驗(yàn)室和家里客廳的不同環(huán)境溫度下采集數(shù)據(jù),進(jìn)行對(duì)比實(shí)驗(yàn),結(jié)果如表1所示。
表1 不同環(huán)境溫度、安裝空間下的閾值對(duì)比
由表1可以看出,相比較而言,傳感器安裝空間對(duì)閾值變化影響很小,環(huán)境溫度變化對(duì)它的影響更大一些,所以根據(jù)實(shí)驗(yàn)時(shí)的環(huán)境溫度,本文將最終閾值設(shè)為1.7。
在提取出的前景基礎(chǔ)上進(jìn)一步進(jìn)行特征提取,可以極大提高識(shí)別準(zhǔn)確率。常見(jiàn)的前景提取算法有背景減除法[13],幀間差分法[14],單高斯模型法[15]和混合高斯模型法等,這些算法往往采用經(jīng)驗(yàn)值[16]設(shè)置閾值提取前景,本文則采用奈曼-皮爾遜準(zhǔn)則設(shè)置閾值。
像素點(diǎn)為背景點(diǎn)的狀態(tài)設(shè)為0,為前景點(diǎn)的狀態(tài)設(shè)為1。奈曼-皮爾遜準(zhǔn)則無(wú)需已知信源先驗(yàn)概率與代價(jià)因子,該準(zhǔn)則是在(1/0)=的約束條件下,檢測(cè)概率達(dá)到最大。
利用拉格朗日乘子構(gòu)建目標(biāo)函數(shù):
=(0/1)+[(1/0)-] (5)
根據(jù)要求,需求目標(biāo)函數(shù)的最小值,將公式(5)轉(zhuǎn)化為積分運(yùn)算,且由于:
式中:0和1分別為判決區(qū)域,公式(5)可寫為以下形式:
由公式(7)可知,若要使達(dá)到最小,被積函數(shù)部分應(yīng)該取負(fù)值,可得以下關(guān)系:
其中,判決門限可由約束條件得到:
通過(guò)每幀數(shù)據(jù)得到的判決門限即為每幀的最佳判決閾值xth。本文采用虛警率為0.01約束下獲得每幀的最佳判決閾值xth,前景提取公式如下:
若第k幀的第(i, j)像素點(diǎn)的溫度值xk(i, j)大于閾值xkth,則溫度值不變,否則置為0。該算法結(jié)果如圖2(a)所示,該方法極干凈地濾除了背景點(diǎn),只剩下少數(shù)背景游離點(diǎn),經(jīng)過(guò)形態(tài)學(xué)處理后,如圖2(b)所示,前景圖像只剩下了完整的人體輪廓。
本文從時(shí)間、溫度、形變和軌跡4個(gè)方向考慮,提取每個(gè)數(shù)據(jù)集的運(yùn)動(dòng)時(shí)間act、最大溫度方差max、運(yùn)動(dòng)前后寬高比比值A(chǔ)R、運(yùn)動(dòng)前后重心到腳距離比值gravity、運(yùn)動(dòng)速度的最大值velmax和運(yùn)動(dòng)前后垂直角度差值diff這6種特征。具體方法如下:
1)運(yùn)動(dòng)幀數(shù)act:每幀最大溫度分布方差vmax大于等于閾值th時(shí),則表明運(yùn)動(dòng)開(kāi)始,該幀計(jì)為start,否則視為運(yùn)動(dòng)結(jié)束,計(jì)為end。運(yùn)動(dòng)幀數(shù)的定義如下:
act=end-start+1 (11)
行走動(dòng)作耗費(fèi)的時(shí)間最長(zhǎng),摔倒是一種突發(fā)情況,運(yùn)動(dòng)幀數(shù)最短,如圖3所示。
2)每個(gè)數(shù)據(jù)集的最大溫度方差max:該特征指的是在幀內(nèi),每幀最大溫度分布方差vmax中的最大值,即:
max=max(1max,2max, …,vmax),>act(12)
不同動(dòng)作發(fā)生時(shí)探測(cè)區(qū)溫度變化的劇烈程度也不同。摔倒動(dòng)作瞬時(shí)發(fā)生,在溫度數(shù)據(jù)上則表現(xiàn)在其max相比于其他動(dòng)作較高,不同動(dòng)作的vmax和max對(duì)比如圖3所示。
圖3 各動(dòng)作的最大溫度方差和運(yùn)動(dòng)持續(xù)幀
3)運(yùn)動(dòng)前后寬高比比值A(chǔ)R:該特征為人體外接矩形寬高比在start和end時(shí)的比率,表現(xiàn)了人體在運(yùn)動(dòng)前后的形變特征,其公式如下:
式中:rend和rstart分別為運(yùn)動(dòng)結(jié)束幀和運(yùn)動(dòng)開(kāi)始幀的寬高比。人體外接矩形如圖4所示。
圖中的人體外接矩形左上點(diǎn)al=(il,jl),人體外接矩形右下點(diǎn)ar=(ir,jr),l和r分別代表著第幀外接矩形的左邊界和右邊界,于是人體外接矩形的寬高比可表示為:
摔倒發(fā)生后人體的外接矩陣寬高比明顯要遠(yuǎn)大于運(yùn)動(dòng)前的寬高比,因此摔倒動(dòng)作的AR是遠(yuǎn)大于1。彎腰動(dòng)作后人體的寬度增加,高度降低,所以其AR次之。
4)運(yùn)動(dòng)前后重心到腳距離比值gravity:表示運(yùn)動(dòng)前后人體重心到腳的距離的比率,與AR一樣表現(xiàn)了人體在運(yùn)動(dòng)前后的形變特征。人體區(qū)域的重心表示為x=(i,j),其中:
式中:、、、和分別為人體外接矩形的上下左右邊界的坐標(biāo)值,Q(,)的定義如下:
那么重心到人腳的距離h為:
h=i-ib(18)
式中:ib為人體外接矩陣下邊界的坐標(biāo)值,運(yùn)動(dòng)前后重心到腳距離比值gravity的定義為:
gravity=hend/hstart(19)
摔倒動(dòng)作的hend遠(yuǎn)小于hstart,所以摔倒動(dòng)作的gravity遠(yuǎn)小于1,而行走運(yùn)動(dòng)前后人外接矩形并沒(méi)有發(fā)生太大的變化,所以行走動(dòng)作的gravity是在1上下波動(dòng)。
5)運(yùn)動(dòng)速度的最大值velmax:將重心點(diǎn)x=(i, j)作為追蹤點(diǎn),時(shí)間窗口等于傳感器本身的幀率,計(jì)算重心點(diǎn)幀的歐氏距離,從而得到運(yùn)動(dòng)的速度,其公式如下:
式中:i和j分別為第幀重心點(diǎn)的坐標(biāo)。通過(guò)公式(20)這樣就可以得到動(dòng)作的速度波動(dòng)情況,將最大值作為特征:
摔倒動(dòng)作是瞬時(shí)發(fā)生的,相比于其他動(dòng)作有著極高的velmax,而行走動(dòng)作相比于其他動(dòng)作較為穩(wěn)定,且速度稍高,所以行走動(dòng)作的velmax僅次于摔倒動(dòng)作。
6)運(yùn)動(dòng)前后垂直角度差值diff:該特征從不同動(dòng)作的軌跡變化出發(fā),將人體區(qū)域的重心點(diǎn)x=(i, j)作為追蹤點(diǎn),由于傳感器放置在墻壁之上,若將探測(cè)場(chǎng)的畫面作為平面,在三維空間中,傳感器則位于畫面的下邊界上。若人體在下邊界重心點(diǎn)所在的垂直線上進(jìn)行站立坐下動(dòng)作,則垂直角度的變化均為0,無(wú)法判別動(dòng)作,所以將整張圖像左下角點(diǎn),即坐標(biāo)為(63,0)的點(diǎn)作為頂點(diǎn),與重心點(diǎn)形成角度,觀察運(yùn)動(dòng)前后垂直角度的變化,如圖5所示。
圖5 垂直角度示意圖
由圖5可得垂直角度的定義如下:
則運(yùn)動(dòng)前后的垂直角度差值定義為:
在摔倒動(dòng)作發(fā)生前后,人的重心點(diǎn)會(huì)更加貼近于畫面下邊界,所以垂直角度會(huì)有極大的降低,摔倒動(dòng)作的diff較大且為負(fù)。
本文將KNN算法、支持向量機(jī)(Support Vector Machine, SVM)算法、隨機(jī)森林(Random Forest, RF)算法、決策樹(shù)(Decision Tree, DT)算法和神經(jīng)網(wǎng)絡(luò)(Neural Network, NN)算法的結(jié)果進(jìn)行對(duì)比。KNN算法是給定測(cè)試樣本,基于距離度量找出特征空間中距離最靠近該樣本的個(gè)訓(xùn)練樣本,選擇這個(gè)樣本中出現(xiàn)最多的類別作為預(yù)測(cè)結(jié)果。距離度量和值的選擇均會(huì)影響到分類的準(zhǔn)確性,距離度量會(huì)影響到“鄰居”的選擇,而值如果過(guò)小容易產(chǎn)生過(guò)擬合的現(xiàn)象,如果過(guò)大則會(huì)大大增加算法的計(jì)算時(shí)間。因此本文采用交叉驗(yàn)證法[17]來(lái)確定值和距離度量。
本實(shí)驗(yàn)使用德國(guó)HEIMANN型號(hào)為HTPA80x64 dR1L5.0的熱電堆陣列傳感器,實(shí)驗(yàn)環(huán)境選擇室內(nèi)普通實(shí)驗(yàn)室,背景較為單一,室溫為26℃,將傳感器置于墻壁,距離地面2.6m。測(cè)試人員共10名(7男3女),被測(cè)人員在探測(cè)區(qū)依次完成彎腰、站起、坐下、摔倒和行走5種動(dòng)作,每種動(dòng)作重復(fù)30次,最終每個(gè)動(dòng)作獲得300組數(shù)據(jù),數(shù)據(jù)集一共1500組,按照動(dòng)作將數(shù)據(jù)集等比例劃分為訓(xùn)練集和測(cè)試集進(jìn)行實(shí)驗(yàn)。
本文采用交叉驗(yàn)證的方法確定KNN算法最優(yōu)的值和距離度量函數(shù)。首先將數(shù)據(jù)集參考動(dòng)作類別按照一定比例劃分為訓(xùn)練集和測(cè)試集。距離度量也在歐氏距離和曼哈頓距離兩者中進(jìn)行選擇。值以3為起始值,2為步長(zhǎng),分別在距離度量為歐氏距離和曼哈頓距離的條件下,依次選取不同的值進(jìn)行分類計(jì)算相對(duì)應(yīng)的準(zhǔn)確率。交叉驗(yàn)證結(jié)果如表2、表3所示,選擇曼哈頓距離作為距離度量,取3進(jìn)行實(shí)驗(yàn)。
表2 歐氏距離交叉驗(yàn)證結(jié)果
表3 曼哈頓距離交叉驗(yàn)證結(jié)果
同樣采用交叉驗(yàn)證對(duì)余下分類器的實(shí)驗(yàn)參數(shù)進(jìn)行設(shè)定。經(jīng)過(guò)驗(yàn)證,SVM分類器懲罰參數(shù)最終選擇為2,徑向基函數(shù)的自帶參數(shù)gamma,實(shí)驗(yàn)對(duì)比后取0.08,訓(xùn)練集780組,測(cè)試集720組。DT分類器采用信息增益作為分裂節(jié)點(diǎn)的評(píng)價(jià)指標(biāo),最優(yōu)分裂作為拆分策略,剪枝時(shí)樹(shù)的深度設(shè)為4,葉節(jié)點(diǎn)處所需最少樣本數(shù)設(shè)為1,拆分最小樣本數(shù)為3,樣本權(quán)重相同,訓(xùn)練集900組,測(cè)試集600組。RF分類器中,最優(yōu)結(jié)果下隨機(jī)森林建立10棵決策樹(shù),深度為10,余下參數(shù)為默認(rèn)參數(shù),訓(xùn)練集975組,測(cè)試集525組。為了進(jìn)行下一階段研究,本文選擇簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)建分類器與以上幾種分類器進(jìn)行結(jié)果對(duì)比。NN分類器的結(jié)構(gòu)為輸入層,中間層以及輸出層,輸入為提取的特征,輸出為動(dòng)作類別,中間層為8層全連接層,使用sigmoid函數(shù)作為激活函數(shù),網(wǎng)絡(luò)訓(xùn)練總次數(shù)設(shè)定為500輪,依次改變學(xué)習(xí)率,最終最優(yōu)學(xué)習(xí)率為0.01,訓(xùn)練集1125組,測(cè)試集375組。
將KNN算法、SVM算法、RF算法、DT算法和NN算法的識(shí)別準(zhǔn)確率進(jìn)行對(duì)比,結(jié)果如表4所示。
表4 5種分類算法結(jié)果對(duì)比
由表4可得KNN算法平均識(shí)別準(zhǔn)確率高于其他算法,摔倒動(dòng)作的識(shí)別準(zhǔn)確率達(dá)到了100%,其他動(dòng)作的識(shí)別準(zhǔn)確率也在97%以上,最終選擇KNN算法。KNN算法識(shí)別準(zhǔn)確率的混淆矩陣圖如圖6所示。
由圖6可以發(fā)現(xiàn),坐下和彎腰這兩種有著下降趨勢(shì)的動(dòng)作易被誤判,與其他動(dòng)作相比,坐下僅在運(yùn)動(dòng)前后寬高比比值這一特征上與彎腰表現(xiàn)差異較大,所以坐下動(dòng)作有8%的測(cè)試集數(shù)據(jù)錯(cuò)判為彎腰,彎腰動(dòng)作有3%的測(cè)試集數(shù)據(jù)錯(cuò)判為坐下,誤判率較高。為了進(jìn)一步驗(yàn)證本文方法性能,將本文方法與文獻(xiàn)[10]和文獻(xiàn)[11]的方法的結(jié)果進(jìn)行了對(duì)比,結(jié)果如表5所示。
由表5可以看出,本文方法準(zhǔn)確率有了很大的提高,并且很好地區(qū)分了站起和坐下動(dòng)作,這說(shuō)明本文提取到的特征確實(shí)與人體動(dòng)作相關(guān)聯(lián),能以較高的準(zhǔn)確率區(qū)分日常的生活動(dòng)作。
圖6 準(zhǔn)確率混淆矩陣圖
表5 3種方法結(jié)果對(duì)比
本文提出了一種基于低分辨率紅外傳感器的人體動(dòng)作識(shí)別方法。本文方法對(duì)活動(dòng)人體進(jìn)行了檢測(cè),也對(duì)前景提取進(jìn)行了研究,根據(jù)得到的數(shù)據(jù),采用背景減除法提取前景,基于奈曼-皮爾遜準(zhǔn)則確定初始最佳判決閾值,使背景錯(cuò)判為前景的出錯(cuò)的概率達(dá)到最小。在以上工作基礎(chǔ)上,從時(shí)間、溫度、形變和軌跡4個(gè)方面提取6個(gè)相關(guān)特征,比較了不同分類器的結(jié)果,最終選用KNN分類器對(duì)彎腰、站起、坐下、摔倒和行走這5個(gè)日常動(dòng)作進(jìn)行分類,平均準(zhǔn)確率達(dá)到97%。本文方法對(duì)摔倒動(dòng)作有著100%的識(shí)別準(zhǔn)確率,相比于其他方法,站起和坐下這兩種易錯(cuò)分的動(dòng)作的識(shí)別準(zhǔn)確率也有提升,達(dá)到了初期構(gòu)想的要求。未來(lái),可采用多個(gè)紅外傳感器搭建系統(tǒng),以提高細(xì)小差別動(dòng)作的識(shí)別率。本文提出的方法有著較繁瑣的計(jì)算機(jī)視覺(jué)方面的數(shù)據(jù)處理,避免不了閾值的設(shè)計(jì),且計(jì)算量較大,今后可結(jié)合深度學(xué)習(xí),搭建神經(jīng)網(wǎng)絡(luò)以進(jìn)行更深入的研究。
[1] 陳泰昌, 尤帥. 新時(shí)代我國(guó)人口老齡化的發(fā)展態(tài)勢(shì)和戰(zhàn)略研究[J]. 老齡科學(xué)研究, 2019, 7(4): 11-20.
CHEN Taichang, YOU Shuai. Research on the development trends and strategies of China’s population ageing in the new Era[J]., 2019, 7(4): 11-20.
[2] 張艷梅, 馬曉霞, 赫繼梅, 等. 失能老人跌倒的影響因素及長(zhǎng)期照護(hù)服務(wù)需求[J]. 中國(guó)老年學(xué)雜志, 2019, 39(17): 4355-4357.
ZHANG Yanmei, MA Xiaoxia, HE Jimei, et al. Influencing factors of falls and demand for long-term care services in the disabled elderly[J]., 2019, 39(17): 4355-4357.
[3] 鄭瀟, 彭曉東, 王嘉璇. 基于姿態(tài)時(shí)空特征的人體行為識(shí)別方法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào), 2018, 30(9): 1615-1624.
ZHENG Xiao, PENG Xiaodong, WANG Jiaxuan. Human action recognition based on pose pose spatio-temporal features[J], 2018, 30(9): 1615-1624.
[4] 王玉坤, 高煒欣, 王征, 等. 基于加速度傳感器的人體姿態(tài)實(shí)時(shí)識(shí)別[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2016, 37(11): 3092-3096.
WANG Yukun, GAO Weixin, WANG Zheng, et al. Real-time human activity pattern recognition based on acceleration[J]., 2016, 37(11): 3092-3096.
[5] 杜英魁, 姚俊豪, 劉鑫, 等. 基于電阻式薄膜壓力傳感器組的人體坐姿感知終端[J]. 傳感器與微系統(tǒng), 2020, 39(1): 78-81.
DU Yingkui, YAO Junhao, LIU Xin, et al. Human body sitting posture sensing terminal based on resistive thin film pressure sensor groups[J]., 2020, 39(1): 78-81.
[6] 李仲華, 臧春華, 楊剛. 基于噪聲嵌入的跌倒檢測(cè)系統(tǒng)的設(shè)計(jì)[J]. 微機(jī)處理, 2017(2): 74-76.
LI Zhonghua, ZANG Chunhua, YANG Gang. Design of fall detection system based on embedded noise[J]., 2017(2): 74-76.
[7] Kobiyama Yuta,ZHAO Qiangfu,Omomo Kazuk, et al. Analyzing correlation of resident activities based on infrared sensors[C]//, 2015: 1-6.
[8] Mashiyama S, HONG J, Ohtsuki T. Activity Recognition Using Low Resolution Infrared Array Sensor[C]//, 2015: 495-500.
[9] Akira Hayashida, Vasily Moshnyaga, Koji Hashimoto, The Use of Thermal IR Array Sensor for Indoor Fall Detection[C]//,,(SMC), 2017: 594-599.
[10] 楊任兵, 程文播, 錢慶, 等. 紅外圖像中基于多特征提取的跌倒檢測(cè)算法研究[J]. 紅外技術(shù),2017, 39(12): 1131-1138.
YANG Renbin, CHEN Wenbo, QIAN Qing, et al. Fall detection algorithm based on multi feature extraction in infrared image[J]., 2017, 39(12): 1131-1138.
[11] 王召軍, 許志猛, 陳良琴. 基于紅外陣列傳感器的人體行為識(shí)別系統(tǒng)研究[J]. 紅外技術(shù), 2020, 42(3): 231-237.
WANG Zhaojun, XU Zhimeng, CHEN Liangqin. Human behavior recognition system based on infrared array sensors[J]., 2020, 42(3): 231-237.
[12] Tro?mova A A, Masciadri A, Veronese F, et al. Indoor Human Detection Based on Thermal Array Sensor Data and Adaptive Background Estimation[J]., 2017, 5(4): 16-28.
[13] 李亞, 王穎. 基于一維最大熵的視頻圖像運(yùn)動(dòng)背景減除[J]. 計(jì)算機(jī)與現(xiàn)代化, 2018(3): 44-47, 53.
LI Ya, WANG Ying. Moving background subtraction of video image based on 1-D Maximum Entropy[J]., 2018(3): 44-47, 53.
[14] 薛麗霞, 羅艷麗, 王佐成. 基于幀間差分的自適應(yīng)運(yùn)動(dòng)目標(biāo)檢測(cè)方法[J]. 計(jì)算機(jī)應(yīng)用研究, 2011, 28(4): 1551-1552.
XUE Lixia, LUO Yanli, WANG Zuocheng, et al. Detection algorithm of adaptive moving objects based on frame difference method[J]., 2011, 28(4): 1551-1552.
[15] 黃大衛(wèi), 胡文翔, 吳小培, 等. 改進(jìn)單高斯模型的視頻前景提取與破碎目標(biāo)合并算法[J]. 信號(hào)處理, 2015(3): 299-307.
HUANG Dawei, HU Wenxiang, WU Xiaopei, et al. The algorithm of video foreground extraction via improved single gauss model and merge of broken targets[J]., 2015(3): 299-307.
[16] WEI Hanchen, Hsi PinMa. A Fall Detection System Based on Infrared Array Sensors with Tracking Capability for the Elderly at Home[C]//(Health Com), 2015: 428-434.
[17] 任家東, 劉新倩, 王倩, 等. 基于KNN離群點(diǎn)檢測(cè)和隨機(jī)森林的多層入侵檢測(cè)方法[J].計(jì)算機(jī)研究與發(fā)展, 2019, 56(3): 566-575.
REN Jiadong, LIU Xinqian, WANG Qian, et al. An multi-Level intrusion detection method based on KNN outlier detection and random forests[J]., 2019, 56(3): 566-575.
Activity Recognition Approach Using a Low-Resolution Infrared Sensor
ZHANG Yutong,ZHAI Xuping,WANG Jing
(Key Laboratory of Specialty Fiber Optics and Optical Access Networks, Shanghai University, Shanghai 200444, China)
The worldwideproblem of population aging is becoming increasingly critical. To avoid accidents involving the elderly living alone, the study of the daily activities of the elderly using recognition and monitoring algorithms has become a research hotspot. This paper proposes an action recognition approach using a low-resolution infrared sensor. The proposed approach uses an infrared sensor to collect temperature distribution data in the detection area, and then processes the temperature distribution data, extracting multiple features in the four dimensions of time, temperature, deformation, and trajectory. Finally, the K-nearest neighbors algorithm is used to identify the five poses of “walking,” “bending,” “sitting,” “standing,” and “falling.” Experimental results demonstrate that the average accuracy can reach 97% and that the accuracy for falling is 100%.
activity recognition, feature extraction, low resolution infrared sensor, KNN algorithm
TP319.4
A
1001-8891(2022)01-0047-07
2020-11-24;
2021-02-01.
張昱彤(1996-),男,江蘇鹽城人,碩士研究生,主要從事基于紅外圖像的人體動(dòng)作識(shí)別算法研究工作,E-mail:zyt164819285@163.com。