趙中堂,馬 倩,陳益強(qiáng)
(1.鄭州航空工業(yè)管理學(xué)院 a.計(jì)算機(jī)科學(xué)與應(yīng)用系;b.管理科學(xué)與工程學(xué)院,鄭州 450015;2.中國(guó)科學(xué)院計(jì)算技術(shù)研究所,北京 100190)
據(jù)2007年的統(tǒng)計(jì)數(shù)據(jù),大約 30%的美國(guó)人患有肥胖癥。肥胖癥導(dǎo)致的冠心病、高血壓、糖尿病、膽石癥、痛風(fēng)、脂肪肝等并發(fā)病,每年大約消耗1 000億美元的醫(yī)療費(fèi)用。而這一年,中國(guó)的超重比例為28.9%。并非只有美國(guó)和中國(guó)有此現(xiàn)象,肥胖癥已成為一個(gè)世界性的難題。大量的研究證明,運(yùn)動(dòng)是保持健康的重要方法,只要長(zhǎng)期有規(guī)律地堅(jiān)持運(yùn)動(dòng),人們就能保持健康。對(duì)于減肥也是如此,適量的運(yùn)動(dòng)有助于燃燒脂肪,減輕體重,從而強(qiáng)身健體。然而,目前沒(méi)有合適的工具能檢測(cè)用戶每天的運(yùn)動(dòng)量,也就無(wú)法給予用戶科學(xué)的指導(dǎo)。
普適計(jì)算技術(shù)倡導(dǎo)“以人為中心”的計(jì)算,使得計(jì)算設(shè)備能夠在無(wú)形中為用戶提供智能的、透明的服務(wù)。為了提供適時(shí)適地的服務(wù),計(jì)算設(shè)備必須具有感知用戶上下文信息的能力[1-3]。動(dòng)作行為識(shí)別 (Motion Activity Recognition, MAR)技術(shù)[4]是感知計(jì)算的一個(gè)重要分支,基于加速度傳感器數(shù)據(jù)識(shí)別人的MAR是目前研究的熱點(diǎn)之一。
文獻(xiàn)[5]較為全面地研究了基于加速度傳感器的行為識(shí)別。該方法先在用戶身上5個(gè)不同部位綁上加速度傳感器,當(dāng)用戶做出不同動(dòng)作時(shí),系統(tǒng)記錄加速度值,并使用多種分類器識(shí)別用戶行為。實(shí)驗(yàn)結(jié)果表明,決策樹(shù)(Decision Tree, DT)算法在所采用的分類器中表現(xiàn)最好,準(zhǔn)確率大約為 84%。但這種在用戶身上綁置多個(gè)特定裝置的方法操作不便,因此,不符合實(shí)際需求。
文獻(xiàn)[6]僅使用一個(gè)固定在骨盆處的三軸加速度傳感器來(lái)采集行為數(shù)據(jù),采用不同的分類器,在4種情況下進(jìn)行實(shí)驗(yàn),對(duì)某人混在一起的不同時(shí)間的行為數(shù)據(jù)進(jìn)行分類,分類精度可達(dá) 99.57%。對(duì)多個(gè)人多個(gè)時(shí)間的行為數(shù)據(jù)混在一起進(jìn)行分類,分類精度可達(dá)99.82%。對(duì)于一個(gè)人在不同時(shí)間的行為數(shù)據(jù),以一天的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),另一天的數(shù)據(jù)作為測(cè)試數(shù)據(jù),分類精度能夠達(dá)到90.61%。對(duì)于2個(gè)人的不同數(shù)據(jù),以一個(gè)人的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),另一個(gè)人的數(shù)據(jù)作為測(cè)試數(shù)據(jù),分類精度僅可以達(dá)到73.33%。
文獻(xiàn)[7]提出了一種與加速度傳感器朝向無(wú)關(guān)的算法,將Nokia N95手機(jī)內(nèi)置三軸加速度傳感器的信號(hào)值投影到豎直和水平方向,使用戶無(wú)需關(guān)心手機(jī)的朝向問(wèn)題,拓寬了行為識(shí)別算法的使用范圍。
由于采集加速度傳感器數(shù)據(jù)并進(jìn)行標(biāo)定是代價(jià)較高的工作,因此為了簡(jiǎn)化甚至省去該過(guò)程,現(xiàn)有的工作集中在如何找到一個(gè)通用的識(shí)別模型,只需對(duì)少數(shù)人標(biāo)定一次數(shù)據(jù),便可以應(yīng)用在任何人的行為數(shù)據(jù)上。這樣做的結(jié)果必定是以犧牲個(gè)人精度為代價(jià)的,導(dǎo)致每個(gè)人的行為識(shí)別精度都不能達(dá)到較高的水平。本文提出一種基于通用模型遷移的自適應(yīng)行為識(shí)別方法 AdaMAR(Adaptive Motion Activity Recognition),該方法首先采集少數(shù)幾個(gè)人的行為數(shù)據(jù)并進(jìn)行標(biāo)定,在此基礎(chǔ)上訓(xùn)練一個(gè)通用行為識(shí)別模型。當(dāng)新用戶使用該模型時(shí),模型可以根據(jù)用戶的數(shù)據(jù)和通用模型的識(shí)別結(jié)果自適應(yīng)地調(diào)整,逐步形成一個(gè)識(shí) 別精度高的個(gè)性化模型。
報(bào)告顯示,如果長(zhǎng)期堅(jiān)持有規(guī)律的運(yùn)動(dòng),即使運(yùn)動(dòng)量較小,對(duì)人們的身體健康也是大有裨益。對(duì)于老年人來(lái)說(shuō)尤為如此,適量運(yùn)動(dòng)可以有效地預(yù)防和控制疾病。為了協(xié)助人們管理自己的運(yùn)動(dòng),本文設(shè)計(jì)實(shí)現(xiàn)了個(gè)人運(yùn)動(dòng)管理系統(tǒng),該系統(tǒng)能夠運(yùn)行于移動(dòng)終端之上。
圖1為個(gè)人運(yùn)動(dòng)管理系統(tǒng)的應(yīng)用場(chǎng)景。白天,用戶打開(kāi)個(gè)人運(yùn)動(dòng)管理系統(tǒng),將移動(dòng)終端攜帶在身上。系統(tǒng)自動(dòng)地采集加速度數(shù)據(jù),提取特征,用行為識(shí)別模型識(shí)別用戶的行為。這樣,用戶的行為被翻譯為行為序列,包括靜止、散步、跑步、上下樓梯等。由于每個(gè)行為樣本的持續(xù)時(shí)間可由加速度計(jì)的采樣頻率得到,因此可以統(tǒng)計(jì)用戶每天的行為信息,包括有哪些行為、每種行為總的累積時(shí)間是多少、每種行為最長(zhǎng)的持續(xù)時(shí)間是多少。根據(jù)這些信息,結(jié)合運(yùn)動(dòng)常識(shí),用戶就可以很好地自我指導(dǎo)鍛煉,保持健康的體魄。晚上,在用戶上床睡覺(jué)之前,系統(tǒng)可以通過(guò)短信的方式將用戶一天的運(yùn)動(dòng)信息上傳到用戶的微博。這樣,用戶可以和他的好友共享運(yùn)動(dòng)信息,朋友也可以對(duì)他的運(yùn)動(dòng)進(jìn)行監(jiān)督和指導(dǎo)。
圖1 個(gè)人運(yùn)動(dòng)管理系統(tǒng)應(yīng)用場(chǎng)景
由此可知,系統(tǒng)的核心在于如何通過(guò)加速度數(shù)據(jù)獲取用戶的行為類別,且識(shí)別模型應(yīng)具有自我調(diào)整的能力,逐漸成為一個(gè)適合用戶的個(gè)性化模型。為此,本文提出了一個(gè)基于通用模型遷移的自適應(yīng)行為識(shí)別方法AdaMAR。
AdaMAR方法的框架結(jié)構(gòu)如圖2所示。
圖2 AdaMAR方法框架結(jié)構(gòu)
該方法分為2個(gè)階段:離線訓(xùn)練階段和在線自適應(yīng)調(diào)整階段,前者的數(shù)據(jù)流用虛線表示,后者的數(shù)據(jù)流用實(shí)線表示。
(1)離線訓(xùn)練階段
采集多個(gè)人的行為數(shù)據(jù),標(biāo)定且提取特征后訓(xùn)練通用的行為識(shí)別模型。
(2)在線自適應(yīng)調(diào)整階段
根據(jù)新用戶逐漸積累的數(shù)據(jù),將通用行為識(shí)別模型調(diào)整為個(gè)性化行為識(shí)別模型,并用其進(jìn)行分類。
可以用多種機(jī)器學(xué)習(xí)方法建立分類模型,比如決策樹(shù)、樸素貝葉斯(Na?ve Bayesian, NB)、支持向量機(jī)(Support Vector Machine, SVM)。通過(guò)性能比較,本文選擇決策樹(shù)作為行為識(shí)別模型。
如果用戶的行為數(shù)據(jù)出現(xiàn)在通用模型的訓(xùn)練集中,則模型對(duì)該用戶具有較強(qiáng)的識(shí)別能力。然而新用戶的數(shù)據(jù)往往是未經(jīng)標(biāo)定、未在訓(xùn)練集中出現(xiàn)的,因此,模型對(duì)新用戶的分類能力不能達(dá)到用戶的要求。通過(guò)分析發(fā)現(xiàn),在采用通用行為識(shí)別模型分類新用戶數(shù)據(jù)時(shí),已經(jīng)隱含地將共性知識(shí)遷移到了分類結(jié)果中,如果能對(duì)分類結(jié)果做進(jìn)一步調(diào)整,就能得到較高的分類精度。
在樣本空間中,設(shè)樣本的特征集合為F={f1, f2,…,fn}。當(dāng)樣本空間中有多個(gè)人的數(shù)據(jù)時(shí),特征 fi(1≤i≤n)的取值范圍設(shè)為[Pi, Qi];當(dāng)樣本空間中僅有某一個(gè)人的數(shù)據(jù)時(shí),特征fi的取值范圍設(shè)為[pi, qi]。一般情況下會(huì)有Pi≤pi 假設(shè)新用戶的樣本空間為D,經(jīng)通用行為識(shí)別模型分類后,被劃分為n個(gè)子空間D1,D2,…, Dn,每個(gè)子空間由特征向量及其類標(biāo)號(hào)組成,即: Di={ 前期實(shí)驗(yàn)表明,對(duì)于未參與訓(xùn)練的樣本集合,用決策樹(shù)分類器對(duì)其分類,會(huì)達(dá)到較好的分類精度,分類正確的樣本數(shù)平均超過(guò)了60%。本文認(rèn)為,各類樣本已被較好地聚集到一起,各類樣本的中心 mi已經(jīng)接近真實(shí)的類中心,在此基礎(chǔ)上進(jìn)一步做自適應(yīng)調(diào)整,就能更加逼近真實(shí)的類中心。 令子空間 Di的樣本數(shù)量為 ni,則其中心 mi的計(jì)算公式為: 樣本誤差平方和Je的計(jì)算公式為: 通用模型遷移和自適應(yīng)調(diào)整過(guò)程如圖3所示。 圖3 通用模型遷移及自適應(yīng)調(diào)整過(guò)程 從通用行為識(shí)別模型確定的類中心開(kāi)始,不斷進(jìn)行迭代調(diào)整,直到樣本誤差平方和達(dá)到最小為止。這樣,經(jīng)過(guò)調(diào)整的子空間 Di就是被重新標(biāo)定過(guò)的精度較高的訓(xùn)練集,用此訓(xùn)練集來(lái)調(diào)整原決策樹(shù)各個(gè)節(jié)點(diǎn)的閾值,就可以得到分類精度較高的個(gè)性化行為識(shí)別模型。 本文使用Nokia N95手機(jī)來(lái)采集加速度傳感器數(shù)據(jù)。每2個(gè)參與人員為一組,A在腰部佩戴N95手機(jī)采集加速度數(shù)據(jù),B在旁邊記錄,N95的時(shí)鐘要和B的計(jì)時(shí)用時(shí)鐘一致。開(kāi)啟程序后,A將N95手機(jī)放入手機(jī)袋內(nèi),掛在身體右側(cè)的腰帶上。B指揮A按順序做站立、靜坐、站立、散步、站立、慢跑、站立、上樓梯、站立、下樓梯、站立、上電梯(電梯向上運(yùn)行)、站立、下電梯(電梯向下運(yùn)行)、站立等動(dòng)作,并記錄每個(gè)動(dòng)作的開(kāi)始時(shí)間、結(jié)束時(shí)間。為了得到充足的樣本,每個(gè)動(dòng)作的持續(xù)時(shí)間不低于5 min。所有動(dòng)作完成后將數(shù)據(jù)保存在N95手機(jī)的文件中,然后上傳到服務(wù)器進(jìn)行標(biāo)定處理。目前共采集了4人的行為數(shù)據(jù)。 數(shù)據(jù)標(biāo)定是一項(xiàng)費(fèi)時(shí)費(fèi)力的工作,它的準(zhǔn)確與否直接決定了分類器的精度。根據(jù)B記錄的時(shí)間區(qū)間和動(dòng)作名稱,將A的動(dòng)作區(qū)分開(kāi)并分別存入不同的文件中。對(duì)每一個(gè)動(dòng)作文件中的數(shù)據(jù)做窗口大小為5的中值濾波,進(jìn)一步去除噪聲、平滑數(shù)據(jù)。 至此建立了一個(gè)小型的行為數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)包含4個(gè)人的數(shù)據(jù),每個(gè)人都分別做了靜坐、站立、散步、慢跑、上樓梯、下樓梯、上電梯、下電梯等日常動(dòng)作。通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),靜坐、站立、上電梯、下電梯等動(dòng)作由于幾乎不涉及加速度變化,它們之間很難區(qū)分,因此可以歸為靜止類。這樣,動(dòng)作行為就分為靜止、下樓梯、散步、慢跑、上樓梯5類。各類樣本數(shù)量如表1所示。 表1 動(dòng)作行為樣本信息 本文采用滑動(dòng)窗口的方法來(lái)提取特征。觀察發(fā)現(xiàn),加速度傳感器各個(gè)軸上的的信號(hào)波形呈周期變化。對(duì)于走路的動(dòng)作來(lái)說(shuō),大概每秒對(duì)應(yīng)一個(gè)動(dòng)作周期,對(duì)于其他動(dòng)作,周期會(huì)更短。由于N95的采樣頻率為32 Hz,因此設(shè)窗口的大小為64個(gè)數(shù)據(jù),這樣可以包含2個(gè)周期的信號(hào)?;瑒?dòng)的步長(zhǎng)設(shè)為窗口的一半,即32。這種數(shù)據(jù)處理方法的優(yōu)點(diǎn)可以見(jiàn)文獻(xiàn)[5]。 對(duì)每個(gè)窗口中的數(shù)據(jù),分別取x、y、z軸數(shù)據(jù)的均值、方差、離散傅里葉變換后的能量,再提取各個(gè)軸之間的相關(guān)系數(shù)。這樣每一個(gè)樣本可以得到 12個(gè)特征。其中,均值能夠反映某類動(dòng)作的劇烈程度,例如某人的散步和慢跑在垂直方向的加速度數(shù)據(jù)波形圖明顯不同,它們的波形中心相距甚遠(yuǎn)。方差能夠反映數(shù)據(jù)偏離中心的幅度,例如散步和下樓梯的加速度大小在均值上相似,而下樓梯的加速度值的變化范圍明顯大于散步。離散傅里葉變換將數(shù)據(jù)從時(shí)域轉(zhuǎn)換到頻域,因此,能量特征能夠區(qū)分運(yùn)動(dòng)周期不同的動(dòng)作,如散步和慢跑。相關(guān)系數(shù)能將多個(gè)方向都有運(yùn)動(dòng)的動(dòng)作和僅在某一個(gè)方向有運(yùn)動(dòng)的動(dòng)作區(qū)分開(kāi)來(lái),如散步和上樓梯[8-10]。 下面分別用當(dāng)前比較流行的決策樹(shù)、支持向量機(jī)和樸素貝葉斯網(wǎng)絡(luò)建立分類器,并比較它們的分類精度。使用SVM訓(xùn)練分類器時(shí),采取十折交叉驗(yàn)證的方法來(lái)選擇最優(yōu)的參數(shù) c和 g。選取行為數(shù)據(jù)庫(kù)中3個(gè)人的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),另外一個(gè)人的數(shù)據(jù)作為測(cè)試數(shù)據(jù),得到的實(shí)驗(yàn)結(jié)果如表2所示。 表2 不同分類器分類精度比較 (%) 從表 2可以看出,決策樹(shù)在平均性能上稍高于SVM和NB網(wǎng)絡(luò),同時(shí)由于采用決策樹(shù)作為分類器計(jì)算代價(jià)較低,適合在智能終端等對(duì)功耗要求較高的設(shè)備上使用,因此本文采用決策樹(shù)作為分類器模型。 對(duì)4個(gè)人的行為數(shù)據(jù)進(jìn)行交叉實(shí)驗(yàn)驗(yàn)證。選取其中3人的行為數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),訓(xùn)練通用模型,剩余一人的行為數(shù)據(jù)作為測(cè)試數(shù)據(jù),測(cè)試識(shí)別精度。表3給出了通用模型對(duì)未參與訓(xùn)練人的行為數(shù)據(jù)的分類結(jié)果和自適應(yīng)模型得到的分類精度。 表3 2種模型對(duì)新用戶數(shù)據(jù)的分類精確度比較 (%) 從表 3可以看出,在實(shí)施 AdaMAR方法之前,系統(tǒng)的平均識(shí)別精度為67.31%,實(shí)施AdaMAR方法后,平均識(shí)別精度可達(dá)到 83.54%,識(shí)別精度平均提高了16%左右。 本文針對(duì)個(gè)人運(yùn)動(dòng)管理系統(tǒng)中行為識(shí)別模型的需求,提出一種基于遷移學(xué)習(xí)的自適應(yīng)行為識(shí)別方法,能夠?qū)⑷后w行為的共性特征知識(shí)遷移到新個(gè)體行為上,不需要對(duì)新個(gè)體的數(shù)據(jù)進(jìn)行標(biāo)定,并可以隨著個(gè)體行為樣本的增多,自適應(yīng)地調(diào)整共性知識(shí),形成特定個(gè)體的行為識(shí)別模型。 在研究過(guò)程中還發(fā)現(xiàn),對(duì)于某些人的某些動(dòng)作,比如散步和上樓梯,僅用加速度傳感器還較難區(qū)分。下一步將研究融合多傳感器(比如加速度傳感器和陀螺儀)的行為識(shí)別算法,以進(jìn)一步提高本文模型的精度。 [1]徐光佑, 史元春, 謝偉凱.普適計(jì)算[J].計(jì)算機(jī)學(xué)報(bào),2003, 26(9): 1042-1050. [2]李 蕊, 李仁發(fā).上下文感知計(jì)算及系統(tǒng)框架綜述[J].計(jì)算機(jī)研究與發(fā)展, 2007, 44(2): 269-276. [3]Weiser M.The Computer for the Twenty-first Century[J].Scientific American, 1991, 265(3): 94-100. [4]徐光佑, 曹媛媛.動(dòng)作識(shí)別與行為理解綜述[J].中國(guó)圖象圖形學(xué)報(bào), 2009, 14(2): 189-195. [5]Bao L, Intille S S.Activity Recognition from User Annotated Acceleration Data[D]//Proc.of the 2nd International Conference on Pervasive Computing.Vienna,Austria: [s.n.], 2004. [6]Ravi N, Dandekar N, Mysore P, et al.Activity Recognition from Accelerometer Data[C]//Proc.of the 19th National Conference on Artificial Intelligence.Pittsburgh, USA:[s.n.], 2005. [7]Yin Jie, Chai Xiaoyong, Yang Qiang.High-level Goal Recognition in a Wireless LAN[C]//Proc.of the 19th National Conference on Artificial Intelligence.San Jose,USA: [s.n.], 2004. [8]Yang Jun.Toward Physical Activity Diary: Motion Recognition Using Simple Acceleration Features with Mobile Phones[C]//Proc.of the 1st International Workshop on Interactive Multimedia for Consumer Electronics.Beijing, China: [s.n.], 2009. [9]Lee Seon-Woo, Mase K.Recognition of Walking Behaviors for Pedestrian Navigation[C]//Proc.of IEEE International Conference on Control Applications.Mexico City, Mexico: IEEE Press, 2001. [10]Chen Yiqiang, Zhao Zhongtang, Wang Shuangquan, et al.Extreme Learning Machine Based Device Displacement Free Activity Recognition Model[J].Soft Computing,2012, 16(9): 1617-1625.4 實(shí)驗(yàn)與結(jié)果分析
4.1 數(shù)據(jù)采集和標(biāo)定
4.2 特征提取
4.3 通用識(shí)別模型的建立
4.4 AdaMAR方法的性能分析
5 結(jié)束語(yǔ)