亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于隨機(jī)森林算法的多維情境特征活動(dòng)識(shí)別

        2017-08-11 10:42:50劉克強(qiáng)汪云甲陳銳志褚天行
        測(cè)繪通報(bào) 2017年7期
        關(guān)鍵詞:貝葉斯森林分類

        劉克強(qiáng),汪云甲,陳銳志,褚天行

        (1. 中國(guó)礦業(yè)大學(xué)環(huán)境與測(cè)繪學(xué)院,江蘇 徐州 221116; 2. 武漢大學(xué)測(cè)繪遙感信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430079; 3. 德州農(nóng)工大學(xué)科普斯分校地理空間計(jì)算實(shí)驗(yàn)室,美國(guó) 德州 科普斯 TX78412)

        ?

        基于隨機(jī)森林算法的多維情境特征活動(dòng)識(shí)別

        劉克強(qiáng)1,2,汪云甲1,陳銳志2,褚天行3

        (1. 中國(guó)礦業(yè)大學(xué)環(huán)境與測(cè)繪學(xué)院,江蘇 徐州 221116; 2. 武漢大學(xué)測(cè)繪遙感信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430079; 3. 德州農(nóng)工大學(xué)科普斯分校地理空間計(jì)算實(shí)驗(yàn)室,美國(guó) 德州 科普斯 TX78412)

        利用智能手機(jī)傳感器可感知時(shí)間、空間、時(shí)空和用戶等多維情境的特征,可識(shí)別用戶活動(dòng),但原框架模型中僅利用了單一分類器中的樸素貝葉斯算法,存在分類精度效果受限的問題。本文利用集成分類器中的隨機(jī)森林算法對(duì)原有框架中的單一分類器進(jìn)行了改進(jìn)。在獲取的3個(gè)數(shù)據(jù)集上的十倍交叉驗(yàn)證結(jié)果表明,加權(quán)平均F1量測(cè)值均有較大提高,表明利用隨機(jī)森林算法在分類精度效果上有所提升;但由于集成算法結(jié)構(gòu)相對(duì)復(fù)雜,其學(xué)習(xí)效率相對(duì)較低。此外,隨機(jī)森林算法的分類混淆矩陣表明,導(dǎo)致識(shí)別誤差的因素主要為活動(dòng)的定義與室內(nèi)定位精度。

        活動(dòng)識(shí)別;情境感知;機(jī)器學(xué)習(xí);隨機(jī)森林;手機(jī)傳感器

        智能手機(jī)以其出色的用戶體驗(yàn)、低廉的價(jià)格、日益豐富的傳感器系統(tǒng)(如GNSS接收機(jī)、加速度計(jì)、陀螺儀、磁力計(jì)、氣壓計(jì)等),以及持續(xù)增強(qiáng)的運(yùn)算和續(xù)航能力,已經(jīng)成為無縫運(yùn)算和智能服務(wù)的理想平臺(tái),而基于智能手機(jī)平臺(tái)的活動(dòng)識(shí)別[1-2],則是提供智能服務(wù)的重要研究?jī)?nèi)容。一般情況下,該研究的處理過程主要包括傳感器原始數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、特征提取、模型訓(xùn)練和學(xué)習(xí)、模型測(cè)試或活動(dòng)識(shí)別等步驟[3]。其中,特征提取是對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行特征計(jì)算,主要是提取統(tǒng)計(jì)特征或結(jié)構(gòu)特征。由于智能手機(jī)用戶的情境特征信息與用戶的時(shí)間、空間及環(huán)境特征高度相關(guān),陳銳志等將用戶所處在的情境環(huán)境信息歸納為時(shí)間情境、空間情境、時(shí)空情境和用戶情境等多維情境特征,提出了一種新的特征提取框架,并基于上述框架,利用樸素貝葉斯分類器,對(duì)復(fù)雜的人類活動(dòng)進(jìn)行識(shí)別[4]。

        近年來,在一般的特征提取方式下,很多學(xué)者利用集成分類器中的隨機(jī)森林算法進(jìn)行活動(dòng)識(shí)別研究[5-8]。如Coskun等基于不同放置位置的智能手機(jī)加速度計(jì)傳感器數(shù)據(jù),并利用隨機(jī)森林算法識(shí)別人類活動(dòng),同時(shí)利用識(shí)別結(jié)果識(shí)別手機(jī)放置位置和姿態(tài);Dash等在對(duì)比多個(gè)分類算法后選擇隨機(jī)森林算法進(jìn)行基于智能手機(jī)加速度傳感器的活動(dòng)識(shí)別;Guo等提出了一種自學(xué)習(xí)的方法并將智能手機(jī)傳感器應(yīng)用在醫(yī)療檢測(cè)領(lǐng)域中,對(duì)病人的活動(dòng)進(jìn)行識(shí)別,其中已標(biāo)記活動(dòng)的分類算法為隨機(jī)森林算法。周博翔等提出了一種蜜蜂交配優(yōu)化的隨機(jī)森林算法,并將該算法應(yīng)用于基于加速度傳感器的人體姿態(tài)識(shí)別。然而,在多維情境特征框架下,文獻(xiàn)[4]僅利用了單一的樸素貝葉斯分類器,其分類精度效果存在局限。為了提升多維情境特征框架下的分類效果,本文擬利用集成分類器中的隨機(jī)森林算法對(duì)提升活動(dòng)識(shí)別精度效果進(jìn)行研究。

        1 多維情境特征框架

        活動(dòng)識(shí)別技術(shù)的系統(tǒng)輸入數(shù)據(jù)是傳感器的原始感知數(shù)據(jù),系統(tǒng)輸出是根據(jù)數(shù)據(jù)識(shí)別或識(shí)別的相關(guān)人類活動(dòng)。根據(jù)對(duì)基于智能手機(jī)平臺(tái)人類活動(dòng)識(shí)別的總結(jié),一般的數(shù)據(jù)處理過程主要包括傳感器原始數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、特征提取、模型訓(xùn)練和學(xué)習(xí)、模型測(cè)試或活動(dòng)識(shí)別5個(gè)步驟,其數(shù)據(jù)處理步驟如圖1所示。其中,數(shù)據(jù)收集過程主要是記錄不同傳感器的離散時(shí)間數(shù)據(jù);數(shù)據(jù)預(yù)處理主要是去噪和數(shù)據(jù)分割;特征提取是對(duì)已分割的數(shù)據(jù)進(jìn)行特征計(jì)算,即提取統(tǒng)計(jì)特征或結(jié)構(gòu)特征,如提取分割時(shí)間段內(nèi)傳感器數(shù)據(jù)的數(shù)字特征(如加速度均值、方差)或頻域特征(如頻譜特征)等,另外,對(duì)冗余特征進(jìn)行維度約減也是特征提取的一部分,如利用主成分分析、線性判別分析算法進(jìn)行的降維運(yùn)算;特征提取后,選擇相關(guān)數(shù)據(jù)集,以及相應(yīng)的機(jī)器學(xué)習(xí)算法并設(shè)置參數(shù),進(jìn)行相應(yīng)的模型訓(xùn)練和活動(dòng)識(shí)別。

        如前文所述,一般特征提取方式是對(duì)已分割的數(shù)據(jù)計(jì)算統(tǒng)計(jì)特征或結(jié)構(gòu)特征,與此不同,文獻(xiàn)[4]提出了一種新的特征提取框架,即提取用戶的多維情境特征,并基于該框架來識(shí)別人類活動(dòng)。在該框架中,用戶所處在的情境環(huán)境信息被歸納為時(shí)間情境、空間情境、時(shí)空情境和用戶情境。圖2為多維情境特征人類活動(dòng)識(shí)別框架,其中用戶情境用于用戶相關(guān)的情境信息定義,如用戶的移動(dòng)特征(如靜止、走動(dòng)及開車等)、用戶的環(huán)境特征(如光照條件、噪聲水平及氣象條件等)、用戶的心理特征(如疲勞程度、激動(dòng)程度及緊張程度等)和用戶的社交特征(如是否正在打電話、發(fā)短信等)。為了驗(yàn)證框架的有效性,文獻(xiàn)[4]根據(jù)校園生活,選擇了包括“工作”“開會(huì)”“吃飯”“喝咖啡”“等公交”及“上課”的6種活動(dòng)進(jìn)行識(shí)別,并將未能歸類到上述活動(dòng)的活動(dòng)歸類為“未定義的活動(dòng)”。

        圖1 基于智能手機(jī)平臺(tái)的人類活動(dòng)識(shí)別數(shù)據(jù)處理過程

        圖2 多維情境特征人類活動(dòng)識(shí)別框架

        表1為文獻(xiàn)[4]中各類情境特征的具體描述和量化操作,需要指出的是,時(shí)空情境反映了用戶在某個(gè)位置的停留時(shí)長(zhǎng),該特征反映了所在位置的停留時(shí)長(zhǎng)對(duì)活動(dòng)識(shí)別的影響,表中的量化指標(biāo)是根據(jù)經(jīng)驗(yàn)設(shè)定的,同時(shí),用戶情境僅參考于用戶的運(yùn)動(dòng)特征,其量化規(guī)則也是根據(jù)一般的活動(dòng)經(jīng)驗(yàn)來給定。

        表1 各類情境特征具體定義方式

        在智能手機(jī)平臺(tái)中,上述情境特征以時(shí)間序列方式產(chǎn)生,即在每個(gè)采樣點(diǎn)可獲得一個(gè)情境數(shù)組,定義為:[時(shí)間情境,空間情境,時(shí)空情境,用戶情境]。獲得上述情境特征時(shí)間序列后,再利用機(jī)器學(xué)習(xí)算法學(xué)習(xí)特征與活動(dòng)之間的關(guān)系模型,在新數(shù)據(jù)到達(dá)時(shí),即可利用所習(xí)得的模型進(jìn)行活動(dòng)識(shí)別。文獻(xiàn)[4]中利用的是機(jī)器學(xué)習(xí)中的樸素貝葉斯算法,即條件概率p(活動(dòng)|給定情境數(shù)組)可由如下公式獲得

        (1)

        (2)

        (3)

        式中,a為識(shí)別結(jié)果;ak為任一定義的活動(dòng);na為定義的活動(dòng)集中的活動(dòng)數(shù);c為情境特征數(shù)組;d為情境特征數(shù)組的維度。

        文獻(xiàn)[4]在樸素貝葉斯算法下對(duì)比了多維情境與單維空間情境分類結(jié)果,以及經(jīng)驗(yàn)?zāi)P团c學(xué)習(xí)后模型的分類結(jié)果,結(jié)果表明多維情境特征分類效果優(yōu)于單維空間情境,學(xué)習(xí)后模型分類效果也優(yōu)于僅憑經(jīng)驗(yàn)設(shè)定參數(shù)的模型。

        2 隨機(jī)森林算法

        監(jiān)督學(xué)習(xí)中的分類算法較多,常用的包括貝葉斯、決策樹、支持向量機(jī)、對(duì)數(shù)幾率回歸、人工神經(jīng)網(wǎng)絡(luò)等。為了增強(qiáng)單一分類器的性能,集成多個(gè)分類算法的思想被提出,主要思路是利用多個(gè)基分類算法進(jìn)行分類,并綜合所有分類結(jié)果形成一個(gè)最終的結(jié)果,這種方式可以提高分類算法的泛化能力,改善分類效果。集成分類算法也包含多種,如裝袋(bagging)、提升(boosting)和隨機(jī)森林。隨機(jī)決策森林概念于1995年被Tin Kam Ho提出[9],隨后他又提出隨機(jī)子空間的集成方法;而最終的隨機(jī)森林算法被Leo Breiman在2001年進(jìn)行了系統(tǒng)的闡述[10],從而正式成為分類算法的重要組成部分,由于其出色的分類性能,已經(jīng)得到廣泛應(yīng)用,如遙感影像分類[11]。

        隨機(jī)森林算法的計(jì)算過程為:先通過bootstrap重采樣技術(shù),從原始訓(xùn)練樣本集N中有放回地重復(fù)隨機(jī)抽取k個(gè)樣本構(gòu)造新的訓(xùn)練樣本集合;然后根據(jù)樣本集生成k個(gè)決策樹,由這些決策樹組成隨機(jī)森林,而新輸入數(shù)據(jù)的分類結(jié)果按這些決策樹的投票結(jié)果而定。其中,在決策樹訓(xùn)練過程中進(jìn)一步引入隨機(jī)屬性選擇,傳統(tǒng)決策樹在選擇劃分屬性時(shí)是在當(dāng)前節(jié)點(diǎn)的d個(gè)屬性中選擇一個(gè)最優(yōu)屬性;而隨機(jī)森林中對(duì)每個(gè)基決策樹屬性先從d個(gè)屬性選擇一個(gè)包含d′個(gè)屬性的子集,再?gòu)脑撟蛹羞x擇一個(gè)最優(yōu)屬性,通常d′取值為log2d。隨機(jī)森林算法通過構(gòu)造不同的訓(xùn)練集來增加分類模型間的差異,從而提高組合分類模型的外推預(yù)測(cè)能力,通過k輪訓(xùn)練,算法得到一個(gè)分類模型序列

        {f1(x),f2(x),…,fk(x)}

        (4)

        由式(4)序列組成一個(gè)分類模型系統(tǒng),該系統(tǒng)最終的分類結(jié)果采用簡(jiǎn)單多數(shù)投票法,即

        (5)

        式中,F(xiàn)(x)表示組合分類模型;fi(x)是單個(gè)決策樹分類模型;y表示輸出變量;I(x)為示性函數(shù)。

        隨機(jī)森林中每一棵樹的建立依賴于一個(gè)獨(dú)立樣本,每一棵樹都具有相同的分布,分類誤差取決于每一棵樹的分類能力和它們之間的相關(guān)性。單棵樹的分類能力可能很小,但在隨機(jī)產(chǎn)生大量的決策樹后,測(cè)試樣本可以統(tǒng)計(jì)每一棵樹的分類結(jié)果,然后投票選擇最可能的分類,從而提升整體的分類能力。

        3 試驗(yàn)與結(jié)果

        本文通過獨(dú)立開發(fā)的Android平臺(tái)應(yīng)用程序收集數(shù)據(jù),該程序可獲取傳感器源數(shù)據(jù),并提取情境特征數(shù)據(jù)保存至手機(jī)本地,最后將數(shù)據(jù)導(dǎo)入PC計(jì)算機(jī)進(jìn)行處理、分析及評(píng)價(jià)。

        圖3為Android應(yīng)用程序界面截圖與該應(yīng)用程序中各類情境特征的具體獲取過程:①時(shí)間情境由系統(tǒng)時(shí)鐘提供的本地時(shí)刻標(biāo)簽標(biāo)記;②由于空間情境由用戶當(dāng)前位置及一些與活動(dòng)相關(guān)的位置區(qū)域關(guān)系構(gòu)成,因此需要獲取用戶當(dāng)前位置并進(jìn)行判定,其中用戶當(dāng)前位置由基于智能手機(jī)多傳感器(包括GPS接收機(jī)、加速度計(jì)、陀螺儀、磁場(chǎng)傳感器及WiFi模塊)數(shù)據(jù)和無味卡爾曼濾波(unscented kalman filter,UKF)數(shù)據(jù)融合算法的實(shí)時(shí)無縫室內(nèi)外定位引擎獲得,而位置區(qū)域包括與用戶相關(guān)的辦公室、會(huì)議室或教室等符號(hào)位置,它們由地理空間柵欄定義,可以是一個(gè)由地理空間位置為圓心的圓或多邊形組成的感興趣區(qū)域(region of interest,ROI),如圖3中的線框;③時(shí)空情境是在上述未知區(qū)域中的停留時(shí)長(zhǎng),實(shí)際操作中由系統(tǒng)時(shí)鐘針對(duì)每一個(gè)用戶定義的位置區(qū)域提供一定長(zhǎng)度的時(shí)長(zhǎng)緩沖區(qū),通過對(duì)每個(gè)緩沖區(qū)計(jì)數(shù)從而產(chǎn)生各個(gè)位置的時(shí)空情境數(shù)據(jù);④用戶情境在本文中僅考慮用戶的運(yùn)動(dòng)狀態(tài)。

        圖3 數(shù)據(jù)獲取Android應(yīng)用程序截圖與多維情境特征獲取過程

        上述應(yīng)用程序中,數(shù)據(jù)更新周期為1 s,即每1 s可獲取一組多維情境特征,而活動(dòng)的真實(shí)標(biāo)記由測(cè)試者在應(yīng)用程序上人為進(jìn)行標(biāo)記。試驗(yàn)選取美國(guó)德州農(nóng)工大學(xué)科普斯分校校園為試驗(yàn)區(qū)域,試驗(yàn)場(chǎng)景為校園生活活動(dòng)識(shí)別,參照文獻(xiàn)[4]對(duì)活動(dòng)的選擇,對(duì)工作、開會(huì)、吃飯、喝咖啡、等公交、上課、未定義7類活動(dòng)展開識(shí)別,分別標(biāo)記為0~6。3位測(cè)試者持不同型號(hào)的手機(jī)參加測(cè)試并標(biāo)記活動(dòng),通過一周5個(gè)工作日的情境特征數(shù)據(jù)記錄與活動(dòng)標(biāo)記,最終獲得的數(shù)據(jù)見表2。

        表2 數(shù)據(jù)收集說明及總數(shù)據(jù)量

        試驗(yàn)采用新西蘭懷卡托大學(xué)發(fā)布的開源數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)測(cè)試平臺(tái)Weka[12]進(jìn)行分析,對(duì)比測(cè)試了樸素貝葉斯算法和隨機(jī)森林算法的分類性能,其中隨機(jī)森林算法中隨機(jī)生成決策樹個(gè)數(shù)k=100,原始屬性個(gè)數(shù)d=4,屬性子集選擇取值為log2d+1=3。在機(jī)器學(xué)習(xí)分析中,若無獨(dú)立測(cè)試集,則需要將數(shù)據(jù)集按比例分割成訓(xùn)練集與測(cè)試集,但由于分割的隨機(jī)性,可能會(huì)產(chǎn)生過擬合與欠擬合問題,為了避免這些問題并充分利用試驗(yàn)數(shù)據(jù),本試驗(yàn)采用十倍交叉驗(yàn)證方法對(duì)數(shù)據(jù)進(jìn)行分析。十倍交叉驗(yàn)證即將數(shù)據(jù)集隨機(jī)分割成10個(gè)子集,并利用9個(gè)子集訓(xùn)練和1個(gè)子集測(cè)試的方式,分別對(duì)10個(gè)子集進(jìn)行10次測(cè)試,最終對(duì)獲得的10個(gè)測(cè)試結(jié)果取平均值作為最終的結(jié)果??紤]到分類結(jié)果的查準(zhǔn)率(precision)與查全率(recall),本文選取二者的調(diào)和平均數(shù)F1量測(cè)(F1 measure)作為分類精度效果評(píng)價(jià)指標(biāo),而由于各類別間的實(shí)例數(shù)量不均衡,試驗(yàn)最終選取按各類別實(shí)例數(shù)加權(quán)后的F1量測(cè)為最終評(píng)價(jià)指標(biāo)。除此之外,試驗(yàn)還同時(shí)統(tǒng)計(jì)了兩種分類算法在各子集上的訓(xùn)練時(shí)長(zhǎng)和測(cè)試時(shí)長(zhǎng)。

        圖4反映了十倍交叉驗(yàn)證后樸素貝葉斯算法和隨機(jī)森林算法在3個(gè)數(shù)據(jù)集上的加權(quán)平均F1量測(cè)的結(jié)果。由圖可知,在各數(shù)據(jù)集上利用隨機(jī)森林算法的加權(quán)平均F1量測(cè)值均大于利用樸素貝葉斯算法的值,其中3個(gè)數(shù)據(jù)集加權(quán)F1量測(cè)的均值在利用隨機(jī)森林算法時(shí)的結(jié)果(0.93)優(yōu)于在利用樸素貝葉斯算法時(shí)的結(jié)果(0.87)。表3展示了兩種算法的訓(xùn)練時(shí)長(zhǎng)和測(cè)試時(shí)長(zhǎng),可以看出在訓(xùn)練時(shí)間方面,3個(gè)測(cè)試集利用隨機(jī)森林算法的平均時(shí)間消耗(58.88 s)遠(yuǎn)大于樸素貝葉斯算法(0.07 s),而在測(cè)試時(shí)間方面,隨機(jī)森林算法結(jié)果(0.74 s)與樸素貝葉斯算法結(jié)果(0.15 s)差距并不是很明顯。

        圖4 樸素貝葉斯和隨機(jī)森林在3個(gè)數(shù)據(jù)集上的加權(quán)平均F1量測(cè)值

        表3 樸素貝葉斯和隨機(jī)森林在3個(gè)數(shù)據(jù)集上的訓(xùn)練時(shí)長(zhǎng)和測(cè)試時(shí)長(zhǎng) s

        圖5反映了在利用隨機(jī)森林算法條件下,3個(gè)測(cè)試集歸一化后的分類混淆矩陣。從3幅圖中同時(shí)可以看出,主要的分類誤差集中在第7行和第7列,即明確定義的活動(dòng)類別與未定義的活動(dòng)類別之間。而從測(cè)試者2和測(cè)試3的混淆矩陣結(jié)果可以發(fā)現(xiàn)標(biāo)記為1的活動(dòng)(開會(huì))與被識(shí)別為標(biāo)記為0的活動(dòng)(工作)的誤差較大。

        圖5 隨機(jī)森林算法在3個(gè)數(shù)據(jù)集上歸一化后的分類混淆矩陣

        從上述分類精度效果和分類效率來看,隨機(jī)森林算法相對(duì)于原有樸素貝葉斯算法在分類精度效果上有較大改善,但算法的訓(xùn)練效率和測(cè)試效率不如后者。算法效率是由算法結(jié)構(gòu)決定的,樸素貝葉斯算法在學(xué)習(xí)時(shí)僅做一些類別的統(tǒng)計(jì)工作,以給出分類時(shí)所需的先驗(yàn)概率和條件概率,在分類時(shí)根據(jù)輸入的數(shù)據(jù)給出概率估計(jì)即可判定類別;而隨機(jī)森林算法在學(xué)習(xí)時(shí)則需要生成多個(gè)不同的樹,在進(jìn)行分類時(shí)需要進(jìn)行投票統(tǒng)計(jì)以獲得最優(yōu),尤其是學(xué)習(xí)階段,需要消耗較長(zhǎng)時(shí)間。

        從基于隨機(jī)森林算法分類的混淆矩陣來看,分類誤差主要發(fā)生在類別明確的活動(dòng)(如工作、開會(huì))和未定義的活動(dòng)之間,此類誤差主要是由活動(dòng)定義造成的,如在本文的活動(dòng)定義下,辦公室內(nèi)有可能進(jìn)行的是工作和未定義活動(dòng)。測(cè)試者2和測(cè)試者3在標(biāo)記為0的活動(dòng)(工作)和1的活動(dòng)(開會(huì))之間的誤差,主要是由室內(nèi)定位引擎的定位誤差導(dǎo)致的,測(cè)試者2和測(cè)試者3的辦公室和會(huì)議室均只有一墻之隔,室內(nèi)定位的誤差導(dǎo)致位置判定錯(cuò)誤,直接影響活動(dòng)識(shí)別的效果,而測(cè)試者1的定位效果較好,因此各類均得到了較高的分類精度。

        4 結(jié) 語

        將用戶所處在的情境環(huán)境信息歸納為時(shí)間情境、空間情境、時(shí)空情境和用戶情境等多維情境特征,綜合利用多維情境特征并利用機(jī)器學(xué)習(xí)的方法識(shí)別人類活動(dòng),有利于推動(dòng)從基于位置的服務(wù)邁向基于情境的服務(wù)。原有的多維情境特征框架中利用的是單一分類器樸素貝葉斯算法,該算法簡(jiǎn)單有效,但分類精度效果存在局限性,本文利用組合分類算法中的隨機(jī)森林算法對(duì)其進(jìn)行改進(jìn),十倍交叉驗(yàn)證結(jié)果表明分類精度效果有較大提升,但同時(shí)也發(fā)現(xiàn)由于隨機(jī)森林算法結(jié)構(gòu)相對(duì)復(fù)雜導(dǎo)致其訓(xùn)練效率相對(duì)較低的問題。此外,通過對(duì)隨機(jī)森林分類效果的混淆矩陣分析,可見分類誤差主要是由明確定義的活動(dòng)和未明確定義的活動(dòng)造成的,而定位引擎的定位精度也會(huì)對(duì)最終的活動(dòng)分類產(chǎn)生較大影響。

        [1] LARA O D, LABRADOR M A. A Survey on Human Activity Recognition Using Wearable Sensors[J]. IEEE Communications Surveys & Tutorials, 2013, 15(3):1192-1209.

        [2] INCEL O D, KOSE M, ERSOY C. A Review and Taxonomy of Activity Recognition on Mobile Phones[J]. BioNanoScience, 2013, 3(2): 145-171.

        [3] SU X, TONG H, JI P. Activity Recognition with Smartphone Sensors[J]. Tsinghua Science and Technology, 2014, 19(3): 235-249.

        [4] CHEN R, CHU T, LIU K, et al. Inferring Human Activity in Mobile Devices by Computing Multiple Contexts [J]. Sensors, 2015, 15(9): 21219-21238.

        [5] COSKUN D, INCEL O D, OZGOVDE A. Phone Position/Placement Detection Using Accelerometer: Impact on Activity Recognition[C]∥IEEE Tenth International Conference on Intelligent Sensors, Sensor Networks and Information Processing. [S.l.]:IEEE, 2015:1-6.

        [6] DASH Y, KUMAR S, PATLE V K. A Novel Data Mining Scheme for Smartphone Activity Recognition by Accelerometer Sensor [C]∥Proceedings of the 4th International Conference on Frontiers in Intelligent Computing: Theory and Applications (FICTA) 2015.[S.l.]:Springer India, 2016.

        [7] GUO J, ZHOU X, SUN Y, et al. Smartphone-based Patients’ Activity Recognition by Using a Self-learning Scheme for Medical Monitoring [J]. Journal of medical systems, 2016, 40(6):1-14.

        [8] 周博翔,李平,李蓮.改進(jìn)隨機(jī)森林及其在人體姿態(tài)識(shí)別中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2015, 51(16): 86-92.

        [9] HO T K. Random Decision Forests [C]∥International Conference on Document Analysis and Recognition. [S.l.]:IEEE, 1995:278-282.

        [10] BREIMAN L. Random Forests [J]. Machine learning, 2001, 45(1): 5-32.

        [11] 郭玉寶, 池天河, 彭玲,等. 利用隨機(jī)森林的高分一號(hào)遙感數(shù)據(jù)進(jìn)行城市用地分類[J]. 測(cè)繪通報(bào), 2016(5):73-76.

        [12] HALL M, FRANK E, HOLMES G, et al. The Weka Data Mining Software: An Update [J]. ACM SIGKDD Explorations Newsletter, 2009, 11(1): 10-18.

        Research on Human Activity Recognition with Multiple Contexts by Using Random Forest

        LIU Keqiang1,2,WANG Yunjia1,CHEN Ruizhi2,CHU Tianxing3

        (1. School of Environment Science and Spatial Informatics, China University of Mining and Technology, Xuzhou 221116, China; 2. State Key Labortatory of Information Engnineering in Surveying, Mapping,and Remote Sensing, Wuhan University, Wuhan 430079, China; 3. Conrad Blucher Institute for Surveying & Science, Texas A&M University Corpus Christi, Corpus Christi, TX 78412 USA)

        Previous research has verified the effectiveness of a method which utilizes multiple contexts including temporal, spatial, spatiotemporal and user from smartphone sensors to recognize human activities. But it has limitation in classification accuracy performance when recognizing human activity on smartphones by using na?ve Bayes. This paper presents an improving research work on recognizing activity by utilizing a random forest algorithm in ensemble learning instead of original na?ve Bayes under the same framework. The result of a ten-fold cross-validation experiment on three subjects’ datasets shows that the weighted average F1 measures are improved by using random forest. However, the training time efficiency measures are worse than naive Bayes because of the complex structure of random forest. Meanwhile, the confusion matrix shows that the main factors for classification error are activity definition and indoor positioning error.

        activity recognition; context awareness; machine learning; random forest; smartphone sensors

        劉克強(qiáng),汪云甲,陳銳志,等.基于隨機(jī)森林算法的多維情境特征活動(dòng)識(shí)別[J].測(cè)繪通報(bào),2017(7):29-33.

        10.13474/j.cnki.11-2246.2017.0218.

        2016-11-28

        國(guó)家重點(diǎn)研發(fā)計(jì)劃(2016YFB0502102);國(guó)家高技術(shù)研究發(fā)展計(jì)劃(863 計(jì)劃)(2013AA12A201);現(xiàn)代工程測(cè)量國(guó)家測(cè)繪地理信息局重點(diǎn)實(shí)驗(yàn)室經(jīng)費(fèi)資助(TJES1302);2014江蘇省普通高校研究生科研創(chuàng)新計(jì)劃(KYLX_1394)

        劉克強(qiáng)(1988—),男,博士生,主要研究方向?yàn)闊o縫定位與人類活動(dòng)識(shí)別。E-mail:cumtlkq@163.com

        P237

        A

        0494-0911(2017)07-0029-05

        猜你喜歡
        貝葉斯森林分類
        分類算一算
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        貝葉斯公式及其應(yīng)用
        哈Q森林
        哈Q森林
        哈Q森林
        基于貝葉斯估計(jì)的軌道占用識(shí)別方法
        哈Q森林
        美女免费视频观看网址| 大奶白浆视频在线观看| 国产自拍91精品视频| 青青草手机免费播放视频| 国产精品激情自拍视频| 少妇无码太爽了在线播放 | 国产女人高潮叫床视频| 肥臀熟女一区二区三区| a人片在线观看苍苍影院| 久久se精品一区精品二区国产| 毛片一级精油按摩无码| 日本视频精品一区二区| 久久国产精品国语对白| av手机免费在线观看高潮| 日本人视频国产一区二区三区| 久久人妻av无码中文专区| 精品久久久久久无码中文野结衣| 无码视频在线观看| 国产精品 人妻互换| 国产无遮挡裸体免费视频| 日本a在线免费观看| 亚洲第一女人天堂av| 中文字幕人妻一区二区二区| 国产美女高潮流白浆免费视频| 亚洲欧美日韩国产精品一区二区| 老外和中国女人毛片免费视频 | 国产亚洲精品aaaa片app| 精品久久久亚洲中文字幕| 久久99精品综合国产女同| 国产精品亚洲片在线观看不卡| 亚洲男人第一无码av网站| 俺来也俺去啦久久综合网| 欧美国产伦久久久久久久| 少妇被粗大的猛进69视频| 精品久久久久久无码中文野结衣 | 日韩av中文字幕亚洲天| 成人在线观看视频免费播放| 按摩师玩弄少妇到高潮av| 性按摩xxxx在线观看| 国产操逼视频| 五月婷婷影视|