亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        老年人跌倒檢測算法的研究現(xiàn)狀

        2022-04-09 07:02:18趙珍珍董彥如
        關(guān)鍵詞:特征檢測

        趙珍珍,董彥如,曹 慧,曹 斌

        1.山東中醫(yī)藥大學(xué) 智能與信息工程學(xué)院,濟(jì)南 250355

        2.山東中醫(yī)藥大學(xué)附屬醫(yī)院 心病科,濟(jì)南 250000

        全球人口預(yù)期壽命的增加與生育率的下降導(dǎo)致全球面臨人口老齡化的危機(jī),聯(lián)合國出版的《2020年世界人口老齡化-老年人的生活安排》[1]中預(yù)估2050年的老年人口將達(dá)到15億以上,65歲及以上的老年人口總數(shù)將由2020年的9.3%增長至16.0%左右,特別是人口眾多的國家,如中國,預(yù)測到2022年左右,超過65歲的人口將占總?cè)丝诘?4%;并且到2030年,中國將會(huì)進(jìn)入老年人口占比25.26%的深度老齡化社會(huì)。在這快速老齡化的社會(huì),老年人的健康問題日益凸顯,失能、半失能老人數(shù)量急劇增加,空巢獨(dú)居老人健康社會(huì)風(fēng)險(xiǎn)加大[2],老年人健康問題成為全球關(guān)注的焦點(diǎn)。而跌倒在全世界范圍內(nèi)成為影響老年人健康的主要原因,其會(huì)導(dǎo)致老年人在生理與心理上產(chǎn)生不同程度的損傷,甚至?xí)?dǎo)致死亡[3]。因此,各式各樣的跌倒檢測算法應(yīng)運(yùn)而生。

        跌倒檢測與識(shí)別的主要步驟包括目標(biāo)檢測、特征提取和定性分類,其中目標(biāo)檢測主要表現(xiàn)于檢測跌倒的視覺傳感器設(shè)備中,通過背景差分、幀間差分等方法定位圖像或視頻中的被測目標(biāo),而對(duì)于便攜式的傳感器則可以忽略,這一類傳感器是通過慣性測量單元收集人體運(yùn)動(dòng)學(xué)數(shù)據(jù),其本身代表被測者的具體狀態(tài),不屬于目標(biāo)檢測的范疇,本文不過多贅敘。特征提取是根據(jù)算法結(jié)構(gòu)和處理方式采取不同的方法獲取特征,至于定性分類是指根據(jù)采集的不同屬性判定數(shù)據(jù)的具體類別。其中,本文圍繞著特征提取這一重要步驟將跌倒檢測算法分為閾值分析法、基于機(jī)器學(xué)習(xí)的檢測算法和基于深度學(xué)習(xí)的檢測算法三類。閾值分析法是將實(shí)時(shí)的加速度或二次處理后的均方值等數(shù)據(jù)作為特征值,并與通過大量跌倒實(shí)驗(yàn)得出的閾值作比較,當(dāng)數(shù)據(jù)值超過或低于閾值時(shí)判定為異常情況。基于機(jī)器學(xué)習(xí)的檢測算法則是通過人工設(shè)計(jì)的特征算子來處理并描述底層視覺數(shù)據(jù),比如HOG[4]特征、ORB[5]特征和LBP[6]特征等,該類算法含有多種功能的分類器,具有顯著的分類優(yōu)勢。但是該類算法過度依賴于人工提取動(dòng)作特征,一旦特征樣本發(fā)現(xiàn)偏差,跌倒檢測的性能便會(huì)極度下降,并且上述的特征算子難以獲取復(fù)雜圖像中的語義信息,而基于深度學(xué)習(xí)的檢測算法能較好地彌補(bǔ)的該缺點(diǎn),可以自動(dòng)獲取樣本數(shù)據(jù)中的特征值,形成一種學(xué)習(xí)策略,擁有很好的特征表示能力。

        現(xiàn)階段,閾值算法、機(jī)器學(xué)習(xí)算法、深度學(xué)習(xí)算法及其變體已被廣泛應(yīng)用于跌倒檢測領(lǐng)域中,本文著眼于跌倒檢測的算法,首先介紹了單一算法中基于閾值分析的跌倒檢測算法、基于機(jī)器學(xué)習(xí)的跌倒檢測算法和基于深度學(xué)習(xí)的跌倒檢測算法,概述了單一算法的優(yōu)勢與不足之處。其次根據(jù)混合算法的雜糅的特點(diǎn),詳細(xì)說明了多種算法結(jié)合后取得的檢測成果。同時(shí),梳理了跌倒檢測算法中采用的公共數(shù)據(jù)集,最后總結(jié)了跌倒檢測算法的發(fā)展趨勢。通過以上分析,理清了跌倒檢測算法自身的意義與重要性,為后續(xù)的改進(jìn)提供創(chuàng)新思路,為跌倒檢測系統(tǒng)的落實(shí)提供理論基礎(chǔ)。

        1 相關(guān)工作

        研究者們從不同的方面綜述了跌倒檢測算法,涉及跌倒背后的生理原因、人體運(yùn)動(dòng)學(xué)、各種傳感器設(shè)備、分類技術(shù)和特征提取方法,為跌倒檢測的整體發(fā)展提供了有利的幫助。本章將從軟硬件角度概述主要的跌倒檢測文獻(xiàn)。從硬件方面,Mubashir等[7]從可穿戴式傳感器、環(huán)境式傳感器及視覺傳感器三方面綜述了跌倒檢測系統(tǒng)及算法,回顧了使用加速度值、姿勢分析和時(shí)空分析等相關(guān)文獻(xiàn),得出前兩種傳感器硬件成本較低且便于安裝,而視覺傳感器則擁有良好檢測效果的結(jié)論。Bet等[8]綜述了可穿戴式傳感器在檢測跌倒中的最新技術(shù)及研究中使用的特征,他們發(fā)現(xiàn)腰部是最常用的佩戴位置,且從加速度值中提取特征占比較多,另外還觀察到利用機(jī)器學(xué)習(xí)提取特征的研究正在增多。但此類研究存在一些問題,如研究人群的類型、跌倒風(fēng)險(xiǎn)評(píng)估缺少統(tǒng)一標(biāo)準(zhǔn)等。Zhang等[9]基于視覺傳感器的角度分別概述了單個(gè)或多個(gè)RGB攝像機(jī)、深度相機(jī)、紅外相機(jī)與3D攝像機(jī)陣列的跌倒檢測方法,且是首次歸納了關(guān)于視覺類跌倒檢測的公共數(shù)據(jù)集。Cai等[10]則是回顧了Kinect傳感器及類似相機(jī)獲取的46個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集,目前有20多個(gè)正在被高頻度地使用,文中強(qiáng)調(diào)了各數(shù)據(jù)集的特點(diǎn),為跌倒檢測提供客觀依據(jù)。此外,自Kinect相機(jī)出現(xiàn),其價(jià)格公道、易于安裝的優(yōu)點(diǎn)使得基于視覺的跌倒檢測得到了更深一步的研究。Gutiérrez等[11]回顧了近五年的基于人工視覺的81個(gè)跌倒檢測系統(tǒng),從表征(如光流)到分類技術(shù)(如支持向量機(jī)SVM)進(jìn)行概括,發(fā)現(xiàn)基于人工視覺的系統(tǒng)實(shí)現(xiàn)了傳統(tǒng)意義上的環(huán)境領(lǐng)域的檢測。然而現(xiàn)有公共數(shù)據(jù)集相互獨(dú)立,缺少系統(tǒng)性能評(píng)估的共同參考框架,這使得系統(tǒng)之間的性能難以比較。

        隨著電子元器件的發(fā)展,更小型的設(shè)備被研究出來,在過去幾年,智能手機(jī)輕便、易攜帶的特點(diǎn)使得基于智能手機(jī)的跌倒檢測成為熱門研究主題之一,Luque等[12]提到智能手機(jī)中使用固定閾值或機(jī)器學(xué)習(xí)算法較多,但在手機(jī)上設(shè)定加速度閾值難以掌握,手機(jī)自身的硬件不足以維持復(fù)雜的跌倒檢測算法。Lima等[13]回顧了基于智能手機(jī)進(jìn)行人類活動(dòng)識(shí)別,整理了機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法的應(yīng)用與研究,為基于智能手機(jī)的跌倒檢測提供良好的理論依據(jù)。另有González-Caete等[14]研究智能手表在跌倒檢測中的可行性,其成本低、便攜帶的優(yōu)點(diǎn)得到廣泛認(rèn)可,為跌倒檢測的實(shí)現(xiàn)提供了其他可能性。但該類研究中個(gè)人隱私問題受到較高關(guān)注度,并且缺乏真實(shí)跌倒的基準(zhǔn)數(shù)據(jù)集作為參照。

        從軟件方面,Perry等[15]回顧了加速度在跌倒檢測中的作用,對(duì)比了使用加速度和不使用加速度的實(shí)時(shí)檢測跌倒,他們發(fā)現(xiàn)加速度發(fā)揮了重要的作用,并且提到加速度數(shù)據(jù)的好壞會(huì)影響檢測結(jié)果。Delahoz等[16]整理了跌倒檢測系統(tǒng)中的技術(shù)手段,對(duì)各種研究進(jìn)行定性比較,指出定義閾值的重要性,詳細(xì)介紹了機(jī)器學(xué)習(xí)在跌倒系統(tǒng)中的特征提取、選擇和構(gòu)建的過程,同時(shí)他們還總結(jié)了SVM、決策樹(DT)和K-近鄰(K-NN)等分類算法,比較了各算法的時(shí)間復(fù)雜度,探究了各模型的評(píng)估策略。Ramachandran等[17]則基于閾值、基于機(jī)器學(xué)習(xí)總結(jié)了跌倒檢測,介紹了影響跌倒的生理因素,并重點(diǎn)介紹機(jī)器學(xué)習(xí)在跌倒檢測中的應(yīng)用,總結(jié)出該類算法能有效檢測跌倒行為。但檢測設(shè)備中有部分可穿戴式設(shè)備(如腕帶)不滿足檢測系統(tǒng)要求,存在假陽性的問題,難以辨別類跌倒動(dòng)作,另外收集的跌倒數(shù)據(jù)需要考慮真實(shí)跌倒時(shí)產(chǎn)生的生理變化,便于提高跌倒檢測的真實(shí)性。Usmani等[18]重點(diǎn)從機(jī)器學(xué)習(xí)算法的角度介紹跌倒檢測及預(yù)防系統(tǒng)的發(fā)展趨勢,他們發(fā)現(xiàn)跌倒檢測的相關(guān)文獻(xiàn)中使用單一或多種機(jī)器學(xué)習(xí)融合的算法較為常見,其中SVM內(nèi)存效率高使得其在近幾年使用率最高,但在跌倒檢測領(lǐng)域中機(jī)器學(xué)習(xí)難以在短時(shí)間內(nèi)分析肌肉因刺激產(chǎn)生的變化并做出響應(yīng),因而它應(yīng)用于預(yù)防跌倒的算法較少。Islam等[19]則是從深度學(xué)習(xí)的角度綜述了跌倒檢測算法,從工作原理、深度學(xué)習(xí)的方法、使用數(shù)據(jù)集及性能指標(biāo)系統(tǒng)地進(jìn)行比較,重點(diǎn)強(qiáng)調(diào)了LSTM(long short-term memory)、CNN(convolutional neural network)、AE(auto encoder)算法在跌倒檢測中的應(yīng)用,這些算法表現(xiàn)出強(qiáng)大的功能,但深度學(xué)習(xí)同樣存在一些問題,比如LSTM的訓(xùn)練時(shí)間長,涉及大量的參數(shù),對(duì)硬件設(shè)備要求較高,基于CNN系統(tǒng)易受到攻擊等。周燕等[20]在深度學(xué)習(xí)的基礎(chǔ)上概述了二維人體骨架姿態(tài)在跌倒中應(yīng)用,詳細(xì)討論了單人與多人骨架的研究方法,總結(jié)了近幾年相關(guān)的先進(jìn)的算法,同時(shí)介紹了公開標(biāo)準(zhǔn)數(shù)據(jù)集與評(píng)價(jià)指標(biāo)。該類算法能更充分地汲取圖像信息,擁有良好的魯棒性,運(yùn)用該算法的研究正逐年增加。Wang等[21]從數(shù)據(jù)收集、傳輸、傳感器融合及物聯(lián)網(wǎng)平臺(tái)等方面進(jìn)行文獻(xiàn)整理,介紹了單個(gè)傳感器與多個(gè)傳感器在信息處理過程中主要是基于閾值、基于機(jī)器學(xué)習(xí)和基于深度學(xué)習(xí)的方法,闡述了數(shù)據(jù)融合、特征融合及決策融合的方法,他們指出機(jī)器學(xué)習(xí)優(yōu)于基于閾值的跌倒檢測,深度學(xué)習(xí)在計(jì)算機(jī)視覺上的跌倒檢測做出巨大貢獻(xiàn),而強(qiáng)化學(xué)習(xí)可能是未來跌倒檢測的發(fā)展趨勢。不同于Wang等對(duì)單個(gè)傳感器和多個(gè)傳感器的跌倒過程(包含傳輸、信息處理、算法、存儲(chǔ)、數(shù)據(jù)集)進(jìn)行清晰的介紹,本文在現(xiàn)有綜述的基礎(chǔ)上發(fā)現(xiàn)很少有文獻(xiàn)對(duì)跌倒檢測使用的算法進(jìn)行總結(jié),因而本文綜述了跌倒檢測使用的算法,分析了單一算法和多算法融合的異同,主要做出以下貢獻(xiàn):

        (1)從算法的角度梳理跌倒檢測算法的發(fā)展現(xiàn)狀,詳細(xì)地介紹了基于閾值、基于機(jī)器學(xué)習(xí)、基于深度學(xué)習(xí)的跌倒檢測算法。

        (2)對(duì)比跌倒檢測中單一算法與混合算法的優(yōu)劣。

        (3)探究不同算法的性能及實(shí)際意義并總結(jié)常用的跌倒數(shù)據(jù)集。

        (4)總結(jié)跌倒檢測已有成果及其面臨的挑戰(zhàn)。

        此外,本文在表1中對(duì)比了三類算法的優(yōu)劣并展示了跌倒檢測算法的整體流程(如圖1)。

        圖1 跌倒檢測流程Fig.1 Fall detection process

        表1 三類跌倒檢測算法Table 1 Three kinds of fall detection algorithms

        2 單一算法

        2.1 基于閾值的跌倒檢測算法

        基于閾值的跌倒檢測算法是通過人體體態(tài)轉(zhuǎn)變時(shí)的特征值來判斷跌倒動(dòng)作是否產(chǎn)生,常用于便攜式設(shè)備中,如Sun等[22]利用足底傾斜角傳感器系統(tǒng)來識(shí)別人體狀態(tài)(圖2(a)),通過X軸與Y軸分析雙足移動(dòng)時(shí)的傾斜角變化,但傳感器測得的數(shù)據(jù)波動(dòng)幅度呈現(xiàn)兩極分化,為此在足底傾斜角特征中設(shè)定閾值提取可用數(shù)據(jù),結(jié)果表明該算法達(dá)到了92%的準(zhǔn)確率,但該算法因硬件限制,難以實(shí)現(xiàn)對(duì)振動(dòng)做出快速動(dòng)態(tài)響應(yīng)。Nasiya等[23]則提出了可穿戴式跌倒檢測系統(tǒng)(圖2(b)),該系統(tǒng)通過3D加速度計(jì)實(shí)時(shí)采集使用者的動(dòng)態(tài)加速度來檢測人體狀態(tài),從X、Y、Z軸計(jì)算人體移動(dòng)的方向,并設(shè)定角度閾值作為跌倒判定標(biāo)準(zhǔn),結(jié)果表明檢測成功率最高可達(dá)95%,然而,個(gè)體生活的差異使得穿戴式傳感器呈現(xiàn)明顯的不便。Weng等[24]選擇利用智能手機(jī)傳感器來探究跌倒檢測(圖2(c)),該研究在智能手機(jī)上增加了加速度計(jì)與陀螺儀,根據(jù)手機(jī)存放的位置設(shè)定加速度閾值,最終經(jīng)過實(shí)驗(yàn)測試發(fā)現(xiàn)手機(jī)置于腰部位置時(shí),靈敏度最高達(dá)到96.43%。現(xiàn)如今,市場上已推出輕量級(jí)、低功耗的便攜式設(shè)備,大幅度降低了使用者發(fā)生跌倒的幾率,增加了安全保障。但便攜式設(shè)備尚未完全普及,產(chǎn)品質(zhì)量、功能設(shè)計(jì)和實(shí)際操作是否真實(shí)滿足老年人的需求有待進(jìn)一步檢驗(yàn)。于是,環(huán)境式的傳感器為老年人提供了第二層保障,環(huán)境式傳感器中最常見的是視覺傳感器,其主要通過監(jiān)測的視頻流或單個(gè)幀圖像中人體活動(dòng)并識(shí)別動(dòng)作來確認(rèn)使用者的當(dāng)前狀態(tài),Yuan等[25]采用Kinect傳感器進(jìn)行跌倒檢測,首先利用傳感器收集深度圖像序列,而后提取圖像序列中的人體輪廓(圖2(d))、計(jì)算人體長寬比等相關(guān)參數(shù),最后將參數(shù)與閾值相互比較,獲得目標(biāo)的行為狀態(tài),但該算法存在混淆彎腰與跌倒的問題,需要進(jìn)一步的改善閾值的設(shè)置。馬宗方等[26]同樣使用Kinect傳感器檢測人體發(fā)生的異常情況,但該算法選擇結(jié)合雙閾值來改進(jìn)算法結(jié)構(gòu),達(dá)到93.13%的準(zhǔn)確率,具體內(nèi)容將在混合算法中詳細(xì)敘述。除此之外,還有其他基于環(huán)境式的算法如利用壓力傳感器[27]、無線網(wǎng)[28]等來監(jiān)測老年人的日常生活,該類算法同樣是基于閾值分析判定,在一定的范圍內(nèi)進(jìn)行目標(biāo)識(shí)別,實(shí)時(shí)計(jì)算出人體活動(dòng)姿態(tài)。

        圖2 基于閾值的跌倒檢測算法的各類傳感器Fig.2 Various types of sensors for threshold-based fall detection algorithms

        通過設(shè)定閾值分析人體動(dòng)作是最為常見的一種算法,該算法雖然存在虛報(bào)率高、誤差大的弊端,且閾值的設(shè)定需要根據(jù)使用的傳感器和跌倒數(shù)據(jù)進(jìn)行合理選定,不同情景下會(huì)產(chǎn)生不同效果,跌倒檢測系統(tǒng)的性能不穩(wěn)定。但其有計(jì)算簡單、速度快的優(yōu)點(diǎn),同時(shí)隨著硬件的精進(jìn),檢測誤差率已大幅度降低,在處理慣性數(shù)據(jù)與圖像數(shù)據(jù)時(shí)能夠快速檢測出異常數(shù)據(jù)、定位圖像中的目標(biāo)區(qū)域,分割前景等等,存在一定的使用價(jià)值。

        2.2 基于機(jī)器學(xué)習(xí)的跌倒檢測算法

        機(jī)器學(xué)習(xí)算法擁有強(qiáng)大的識(shí)別分類功能,能自動(dòng)學(xué)習(xí)數(shù)據(jù)屬性并建立分類模型,其中包含有多種分類器,可根據(jù)特征選擇合適的分類器,在跌倒檢測算法中主要采用有監(jiān)督的機(jī)器學(xué)習(xí)算法。Ozdemir等[29]研究了六種不同的機(jī)器學(xué)習(xí)算法來檢測跌倒,他們選取了原始數(shù)據(jù)峰值周圍4S時(shí)間窗口的數(shù)據(jù),通過分類器進(jìn)行特征提取與縮減,實(shí)現(xiàn)了準(zhǔn)確率、特異性及靈敏度都能達(dá)到95%以上。但參與的實(shí)驗(yàn)對(duì)象數(shù)量偏少,當(dāng)增加新對(duì)象或擴(kuò)大活動(dòng)范圍時(shí)將無法維持測試準(zhǔn)確率。為此,Mrozek等[30]提出了一種新型可擴(kuò)展架構(gòu)的系統(tǒng)用于遠(yuǎn)程監(jiān)測,他們提出隨機(jī)森林(RF)、SVM、人工神經(jīng)網(wǎng)絡(luò)(ANN)和增強(qiáng)決策樹(BDT)分類器,通過五倍交叉驗(yàn)證及最佳參數(shù)設(shè)置,BDT展現(xiàn)了最優(yōu)分類,在SisFall數(shù)據(jù)集中達(dá)到了99%的平均準(zhǔn)確率。但從實(shí)驗(yàn)對(duì)象獲得的監(jiān)測數(shù)據(jù)與老年人存在一定的差距,真實(shí)數(shù)據(jù)源仍是跌倒檢測算法面臨的難題。為避免該問題,Dhole等[31]采用智能頭盔和慣性傳感器分別提取被測者的腦電圖及行為數(shù)據(jù),選擇小波能量從時(shí)域和頻域提取通道特征,再利用RF分類器學(xué)習(xí),以熵作為標(biāo)準(zhǔn)篩選出跌倒情況,最終分析結(jié)果表明該算法的精確度可達(dá)98%。而Ramirez等[32]選擇采用攝像機(jī)video-camera拍攝真實(shí)照片,將照片中的人體骨架作為特征,他們選擇了KNN、SVM、RF、MLP(multi-layer perceptron)、Adaboost(adaptive boosting)、XGBoost(extreme gradient boosting)作為分類器,且同時(shí)在兩種數(shù)據(jù)集上進(jìn)行測試??梢园l(fā)現(xiàn),同一特征、同一分類方法在不同的數(shù)據(jù)集上獲得不同的檢測結(jié)果,數(shù)據(jù)源對(duì)跌倒檢測屬于重要影響因素。此外,基于機(jī)器學(xué)習(xí)的跌倒檢測分類器大部分是二分類,相較于人體活動(dòng)時(shí)的姿態(tài)的變化,這些分類器在運(yùn)用到現(xiàn)實(shí)生活中便存在不可忽視的不足,而多標(biāo)簽分類算法為解決該問題提供可能。Thakur等[33]提出了多標(biāo)簽的K-NN算法,并且在數(shù)據(jù)集上進(jìn)行跌倒動(dòng)作與類跌倒動(dòng)作檢測,該算法表現(xiàn)出優(yōu)良的性能,降低了假陽性的概率。還有其他有監(jiān)督機(jī)器學(xué)習(xí)的跌倒檢測算法[34-39]。

        Kim等[40]研究的跌倒檢測模型同樣使用了多種有監(jiān)督分類器,但該模型中提出了無限特征選擇算法以及活動(dòng)自動(dòng)標(biāo)注,且在離散和連續(xù)時(shí)間序列的數(shù)據(jù)上都達(dá)到了99%的平均分類準(zhǔn)確率。若利用無監(jiān)督的分類器,根據(jù)數(shù)據(jù)本身的屬性,自主選取特征,進(jìn)而完成樣本數(shù)據(jù)的種類劃分,相較于需要手工標(biāo)注樣本集特征的有監(jiān)督分類器能夠極大地減少工作量。于是,Diraco等[41]提出一種k-means無監(jiān)督算法,基于開普勒效應(yīng)在不同細(xì)節(jié)水平上描述人體姿勢,獲得身體骨架與描述姿勢的直方圖信息,經(jīng)過觀察組與測試組的實(shí)驗(yàn),測試顯示出良好的檢測性能,但該實(shí)驗(yàn)存在前期校準(zhǔn)長達(dá)95 min的不足,實(shí)驗(yàn)收集的數(shù)據(jù)不具備代表性,無法驗(yàn)證真實(shí)情況下的校準(zhǔn)時(shí)長,在現(xiàn)實(shí)中可能需要更長時(shí)間。

        機(jī)器學(xué)習(xí)算法中含有多種有監(jiān)督與無監(jiān)督的分類器,在跌倒檢測中更傾向于有監(jiān)督的分類器,其根據(jù)選定的特征值完成跌倒與日?;顒?dòng)的區(qū)分,其中特征選定是機(jī)器學(xué)習(xí)算法的成敗關(guān)鍵,一旦手工提取的特征不理想便會(huì)對(duì)跌倒檢測造成極大的影響,反之,能夠?qū)崿F(xiàn)優(yōu)異的檢測率;無監(jiān)督的機(jī)器學(xué)習(xí)算法則能自動(dòng)提取數(shù)據(jù)特征進(jìn)而完成分類,大幅度避免人工提取特征的劣勢,未來該方向?qū)?huì)是跌倒識(shí)別領(lǐng)域的研究熱點(diǎn)。此外,真實(shí)跌倒的數(shù)據(jù)集量較少,并且機(jī)器學(xué)習(xí)算法在輕量級(jí)的數(shù)據(jù)集中達(dá)到的性能要遠(yuǎn)勝于重量級(jí)數(shù)據(jù)集,因此現(xiàn)階段基于機(jī)器學(xué)習(xí)的跌倒檢測算法仍在進(jìn)一步研究中。

        2.3 基于深度學(xué)習(xí)的跌倒檢測算法

        深度學(xué)習(xí)是當(dāng)前最為熱門的一項(xiàng)技術(shù),廣泛應(yīng)用于多個(gè)領(lǐng)域,尤其在圖像識(shí)別方向獲得顯著成就,其中CNN在人體動(dòng)作識(shí)別領(lǐng)域發(fā)揮重要的作用,2014年Girshick等[42]提出R-CNN(region-CNN)算法進(jìn)行目標(biāo)檢測,該算法在PASCAL VOC檢測數(shù)據(jù)集上完勝傳統(tǒng)的DPM(deformable parts model)檢測算法,而后便不斷出現(xiàn)各種基于CNN架構(gòu)的跌倒檢測識(shí)別算法,CNN在跌倒檢測領(lǐng)域已占據(jù)絕對(duì)的領(lǐng)導(dǎo)地位。基于深度學(xué)習(xí)的跌倒檢測算法與基于機(jī)器學(xué)習(xí)的跌倒檢測算法類似,唯一的區(qū)別是自主選取特征,并且擁有強(qiáng)大的學(xué)習(xí)能力。以下從CNN、RNN(recurrent convolutional neural network)及AE(auto encode)三個(gè)方面介紹跌倒檢測算法。

        2.3.1 基于CNN的跌倒檢測算法

        現(xiàn)階段已有大量研究文獻(xiàn)表明CNN算法在檢測跌倒領(lǐng)域取得了顯著的性能,具體可分為CNN、1D CNN(one-dimensional convolutional neural network)、OF CNN(optical flow convolutional neural network)及3D CNN(three-dimensional convolutional neural network)[19]。

        (1)CNN

        Yu等[43]提出了基于CNN的跌倒檢測算法,該算法將碼本背景減除法提取出人體輪廓作為特征輸入到CNN中,通過標(biāo)識(shí)分類不同的人體活動(dòng)(如站立、躺下)來區(qū)分人類正常活動(dòng)與跌倒等異常行為,可達(dá)到96.88%的跌倒檢測率。然而跌倒與躺下動(dòng)作的輪廓剪影相似度較高,測試結(jié)果中含有誤判的實(shí)例。而Silva等[44]設(shè)計(jì)出基于CNN的跌倒檢測算法的多流學(xué)習(xí)模型,該模型采用可分離的并行網(wǎng)絡(luò)架構(gòu)便于將多種高級(jí)手工特征分別輸入對(duì)應(yīng)的VGG-16網(wǎng)絡(luò)中訓(xùn)練,當(dāng)其中一條特征流出現(xiàn)異常時(shí)利用其他特征流進(jìn)行糾正,最后將學(xué)習(xí)的最優(yōu)秀的網(wǎng)絡(luò)與輸出相關(guān)聯(lián),該模型測試后能夠達(dá)到98.77%的準(zhǔn)確率,但其選擇的光流、人體姿態(tài)和RGB特征都屬于圖像的范疇,算法的一般適用性有待考量。

        但是,基于慣性傳感器采集加速度或信號(hào)等數(shù)據(jù)的CNN跌倒檢測算法在后期可進(jìn)行降維處理或映射成圖像格式來檢測跌倒。Yhdego等[45]提出將加速度數(shù)據(jù)提供給CNN學(xué)習(xí)跌倒信息,他們利用小波變換將加速度值轉(zhuǎn)換成圖像,再采用遷移學(xué)習(xí)在圖像上訓(xùn)練深度CNN模型。為了提高準(zhǔn)確率,還在譜系圖像中進(jìn)行數(shù)據(jù)增強(qiáng),補(bǔ)充了有限的標(biāo)記的跌倒數(shù)據(jù),最終該方法的跌倒準(zhǔn)確率達(dá)到了96.43%。Abdulaziz等[46]提出降維處理特征數(shù)據(jù)的跌倒檢測算法,其采用多線性原理成分分析對(duì)采集的數(shù)據(jù)進(jìn)行特征降維,再基于殺手啟發(fā)式優(yōu)化的AlexNet卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)特征,其中應(yīng)用了5層卷積層來優(yōu)化分類器,激活過程與高計(jì)算量有助于提高檢測的準(zhǔn)確性,最后經(jīng)過仿真實(shí)驗(yàn)發(fā)現(xiàn)該算法精確率達(dá)到了99.45%。然而,跌倒動(dòng)作與類跌倒動(dòng)作易產(chǎn)生混淆,在跌倒過程中,所選擇的特征起到?jīng)Q定性的作用,優(yōu)化的學(xué)習(xí)分類器和特征選擇過程能提高算法的性能。

        CNN以一張圖像作為輸入,在跌倒檢測中可用于處理視覺傳感器的圖像和慣性傳感器轉(zhuǎn)換的圖像,為了提高檢測性能,研究員們根據(jù)數(shù)據(jù)自身屬性采取不同的計(jì)算方法(如均值、求熵)選擇優(yōu)質(zhì)的特征[47-48],在CNN的基本結(jié)構(gòu)上進(jìn)行改進(jìn)[49],來提升檢測算法的實(shí)用性。

        (2)1D CNN

        在處理由慣性、角度等傳感器采集的一維信號(hào)數(shù)據(jù)時(shí),除了將一維數(shù)據(jù)映射成二維圖像外,還設(shè)計(jì)出能夠處理一維數(shù)據(jù)的1D CNN。Zhang等[50]提出多視角深度學(xué)習(xí)框架的檢測跌倒系統(tǒng),他們將多個(gè)時(shí)間序列流作為多視圖的一維圖像輸入CNN中,其能了解隱藏的非線性模式,并利用完全連接的神經(jīng)網(wǎng)絡(luò)融合所有學(xué)習(xí)模式,在包含跌倒及日?;顒?dòng)的數(shù)據(jù)集測試后發(fā)現(xiàn)該系統(tǒng)檢測率達(dá)到了91.5%。然而該算法基于智能手機(jī)采集數(shù)據(jù),算法的計(jì)算復(fù)雜度越高對(duì)硬件設(shè)備的要求越佳,個(gè)人隱私和系統(tǒng)安全性的問題并未解決,它們?nèi)允艿捷^高的關(guān)注。Bolic等[51]則基于雷達(dá)傳感器輔助檢測跌倒來避免上述問題。他們提出學(xué)習(xí)多層次特征,將二次處理后的慢時(shí)間序列輸入到1D CNN中訓(xùn)練目標(biāo)模型,并采用全局最大池技術(shù)提高模型的可分辨性,獲得了92.72%的準(zhǔn)確率。Xia等[52]提出新型自動(dòng)霧檢測系統(tǒng),對(duì)比霧步態(tài)與正常步態(tài)區(qū)分異常,其中一維加速度數(shù)據(jù)在網(wǎng)絡(luò)模型中以流線型的方式自動(dòng)學(xué)習(xí)特征,消除了手工特征的需要和特征選擇,達(dá)到了99.85%的靈敏度。但基于霧的數(shù)據(jù)集內(nèi)容不夠豐富,對(duì)實(shí)驗(yàn)對(duì)象的測時(shí)間較短且需要在特定的環(huán)境進(jìn)行測試。此外,不同年齡段的被測者的步態(tài)等行為存在差異,實(shí)驗(yàn)應(yīng)當(dāng)按照年齡分組測試,確保實(shí)驗(yàn)嚴(yán)謹(jǐn),獲得精確的檢測系統(tǒng)。

        1D CNN的維度低,類似于滑動(dòng)窗口,在行為識(shí)別中一般處理序列信號(hào)數(shù)據(jù),建立序列模型??芍苯犹幚響T性傳感器(如加速度計(jì))采集的時(shí)序信息,學(xué)習(xí)不同動(dòng)作特征和自動(dòng)選擇特征,在跌倒檢測實(shí)驗(yàn)中同樣實(shí)現(xiàn)了良好的性能。

        (3)OF CNN

        OF CNN算法的特點(diǎn)是由光流作為二維圖像數(shù)據(jù)特征,從而追蹤目標(biāo)的動(dòng)作,解決因遮擋物而造成前景難以分割的問題。Wang等[53]提出PCANet網(wǎng)絡(luò)來檢測跌倒,采用光流法提取RGB圖像中的特征,但花費(fèi)時(shí)間過長,于是Nú?ez-Marcos等[54]采用VGGNet-16網(wǎng)絡(luò)改進(jìn)圖像處理的光流和卷積網(wǎng)絡(luò)結(jié)構(gòu),由于視頻是由連續(xù)的單幀堆疊呈現(xiàn),跌倒識(shí)別只需檢測出幾個(gè)相鄰的幀即可,為描述兩幀之間的位移矢量,他們使用了tvl-1光流算法[55]處理數(shù)據(jù),光流公式如下:

        其中,I0和I1是圖像對(duì),x表示為x軸上的像素點(diǎn),u=(u1(x),u2(x))T是二維位移場,λ表示為相對(duì)權(quán)重,E代表能量函數(shù)。在數(shù)據(jù)處理過程中,RGB圖像會(huì)轉(zhuǎn)為光流圖像并輸入神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),最后的結(jié)果表明其精確度為83.02%,且在各個(gè)公開數(shù)據(jù)集中獲得最優(yōu)性能,但該算法極易產(chǎn)生位移場,使得檢測精度降低,另外tvl-1算法雖能去除靜態(tài)背景,但會(huì)造成各種背景噪聲,無法獲取完美的前景。針對(duì)以上問題,Chhetri等[56]提出了增強(qiáng)動(dòng)態(tài)光流的跌倒檢測算法,通過公式(2)進(jìn)行修正能量,增強(qiáng)光流,并且在公式(1)中添加了排序函數(shù),如公式(3):

        其中,d是一個(gè)參數(shù)的向量,S(q| d)+S(t|d)是每個(gè)時(shí)間和以后時(shí)間q的排名函數(shù)的得分,主要目的是在動(dòng)態(tài)光照下提高分類精度,降低數(shù)據(jù)處理時(shí)間。該算法同樣是先計(jì)算RGB視頻中的光流信息進(jìn)而轉(zhuǎn)變成光流圖像,通過秩池方法將光流圖像變?yōu)閯?dòng)態(tài)光流圖像,并將單個(gè)動(dòng)態(tài)光流圖像融合為一幅圖像,減少處理時(shí)間的消耗,最后輸入CNN算法中。結(jié)果表明該算法的特異性及敏感度達(dá)到93.04%,精確度達(dá)到91.4%左右。但是,該算法未考慮到長期動(dòng)作演變的局限,基于OF CNN的跌倒檢測算法仍需進(jìn)一步研究探索。

        光流能夠在連續(xù)的圖像中檢測到細(xì)微的變化,將光流作為特征運(yùn)用到CNN中不僅能削弱視頻中光線變化影響目標(biāo)檢測的問題,而且動(dòng)態(tài)光流技術(shù)能將視頻匯總為單個(gè)圖像的機(jī)制,有助于提高圖像預(yù)處理步驟的性能。一些空間序列跌倒檢測算法如表2所示。

        表2 空間序列的跌倒檢測算法Table 2 Fall detection algorithms for spatial sequences

        (4)3D CNN

        3D CNN能夠同時(shí)處理時(shí)間序列與空間序列數(shù)據(jù),具備超強(qiáng)的學(xué)習(xí)人類行為的能力,Ahn等[60]基于3D CNN的跌倒檢測算法處理連續(xù)運(yùn)動(dòng)視頻,該算法提高了以視頻圖像作為輸入的跌倒檢測系統(tǒng)的準(zhǔn)確率,與基于3D人體骨骼信息[61]的算法相比,避免了骨骼結(jié)構(gòu)扭曲的形變,能檢測出慢速跌落,通過TST數(shù)據(jù)集實(shí)驗(yàn)獲得準(zhǔn)確率96.9%的實(shí)驗(yàn)結(jié)果。Li等[62]同樣提出基于3D CNN的跌倒檢測算法,該算法首先通過Kinect收集的數(shù)據(jù)來訓(xùn)練3D CNN,然后再將新收集的數(shù)據(jù)輸入到3D CNN中來微調(diào)網(wǎng)絡(luò),利用時(shí)空模式區(qū)分正常行為與跌倒?fàn)顟B(tài),最后輸入視頻流測試三維CNN。該模型獲得更精準(zhǔn)的檢測效果、緩解了泛化問題,并在自定義數(shù)據(jù)集中進(jìn)行驗(yàn)證,結(jié)果發(fā)現(xiàn)該方法在跌落的0.5 s內(nèi)檢測跌倒能夠達(dá)到100%準(zhǔn)確率。但該實(shí)驗(yàn)樣本集較少,在處理大型數(shù)據(jù)集時(shí)性能存在不確定性,因此可以采用數(shù)據(jù)增強(qiáng)手段增加數(shù)據(jù)量,避免產(chǎn)生模型過擬合的問題。Kasturi等[63]基于kinect深度相機(jī)采集的視頻數(shù)據(jù)輸入3D CNN中進(jìn)行跌倒檢測,該算法將視頻幀堆疊成立方體結(jié)構(gòu)輸入3D CNN,觀察不同幀數(shù)對(duì)三維內(nèi)核的影響,進(jìn)而獲得良好的模型,通過數(shù)據(jù)集URFD進(jìn)行跌倒檢測實(shí)驗(yàn)后發(fā)現(xiàn)在訓(xùn)練與測試集上都達(dá)到了100%準(zhǔn)確率。若有大量的真實(shí)跌倒數(shù)據(jù)將能探究層次更深、魯棒更強(qiáng)的網(wǎng)絡(luò)結(jié)構(gòu),進(jìn)而實(shí)現(xiàn)泛化應(yīng)用。

        此外,自然光照會(huì)大幅度影響數(shù)據(jù)質(zhì)量,造成檢測與分類精度下降,Kim等[64]針對(duì)該問題采用熱攝像機(jī)采集熱數(shù)據(jù)集,再輸入3D CNN中學(xué)習(xí)人體在時(shí)空維度的特征,進(jìn)而實(shí)現(xiàn)日夜監(jiān)控,全天檢測,最終達(dá)到了90.2%的平均精確度。

        類似地,雙流卷積神經(jīng)網(wǎng)絡(luò)(Two-Stream CNN)[65]具有時(shí)間網(wǎng)絡(luò)和空間網(wǎng)絡(luò),能夠在時(shí)空領(lǐng)域融合抽象特征,進(jìn)一步提高網(wǎng)絡(luò)性能。在跌倒檢測算法中,從給定的數(shù)據(jù)集中提取單個(gè)特征(如光流、輪廓)被稱為單流體結(jié)構(gòu),雙流或多流結(jié)構(gòu)會(huì)提取多個(gè)特征表示。Simonyan等[66]將RGB圖像與光流位移結(jié)合作為運(yùn)動(dòng)特征,由CNN算法識(shí)別活動(dòng)。Zhi等[67]提出基于Two-Stream的跌倒檢測算法,以3D CNN和VGGNet-16作為輸入,同時(shí)去除背景干擾及增添光流信息,再將兩個(gè)網(wǎng)絡(luò)中softmax融合作為Two-Stream CNN的輸出,實(shí)驗(yàn)結(jié)果顯示Two-Stream CNN能夠達(dá)到96%的檢測率。Khraief等[68]則根據(jù)視頻運(yùn)動(dòng)之間的特征提出了多流卷積神經(jīng)網(wǎng)絡(luò),以RGB、深度、運(yùn)動(dòng)及形狀四種特征提取四種模式,并且根據(jù)特征的關(guān)聯(lián)度附加權(quán)重,使得多流網(wǎng)絡(luò)互補(bǔ)信息,完善整體性能。其中,為了提取深度特征,作者放棄了手工特征,而選擇提取光流的大小和方向,其中光流幅OFmag與方向OFphase的相位信息如公式(4)、(5):

        該算法的四種特征經(jīng)過融合后,利用遷移學(xué)習(xí)與數(shù)據(jù)增強(qiáng)技術(shù)擴(kuò)大數(shù)據(jù)量,而后輸入VGGNet-16網(wǎng)絡(luò)訓(xùn)練模型,最后在標(biāo)準(zhǔn)公開數(shù)據(jù)集中最高可獲得99.72%的準(zhǔn)確率。由此發(fā)現(xiàn)多模態(tài)特征訓(xùn)練的深度網(wǎng)絡(luò)模型能避免當(dāng)前存在的環(huán)境問題(如無法覆蓋區(qū)域),可同時(shí)用于在室內(nèi)外場景的跌倒檢測。

        3D CNN比二維卷積多出的時(shí)間維度使得其能直接處理視頻數(shù)據(jù),而不用逐幀分析,能夠更有效地捕捉各幀之間的運(yùn)動(dòng)信息,進(jìn)而建立更為精確的模型,察覺出人體運(yùn)動(dòng)的微小變化。一些時(shí)空數(shù)據(jù)的跌倒檢測算法如表3所示。

        表3 時(shí)空數(shù)據(jù)的跌倒檢測算法Table 3 Fall detection algorithms for spatio-temporal data

        2.3.2 基于RNN的跌倒檢測算法

        RNN擁有“記憶”信息的功能,可將前一個(gè)神經(jīng)元的輸出直接作用于下一時(shí)間戳的自身,長時(shí)間留有歷史信息,適于處理長時(shí)相關(guān)性任務(wù)。Mauldin等[70]利用含有GRU(門控遞歸單元)的RNN來檢測跌倒,其中,GRU能夠解決RNN在反向傳播中的梯度問題,GRU與LSTM網(wǎng)絡(luò)擁有相同的收斂性,但訓(xùn)練參數(shù)少,計(jì)算量小,屬于輕量級(jí)深度學(xué)習(xí)體系,因而在智能手機(jī)等小型終端設(shè)備的行為檢測中較受歡迎。LSTM[71]算法因其特殊的遞歸神經(jīng)網(wǎng)絡(luò),能解決長序列過程中梯度爆炸與梯度消失的問題,主要的運(yùn)算公式如下,→和←分別代表前向和后向傳播,xt為當(dāng)前的時(shí)間信息,ht-1為以前的隱藏輸出,ht為當(dāng)前的隱藏輸出:

        最后的向量hT是前向和后向過程的輸出的連接向量,如下所示:

        它可以利用門單元來控制網(wǎng)絡(luò)中的長期依存關(guān)系達(dá)到保存長期記憶的功能,因而更進(jìn)一步提高了跌倒檢測的效率。Ge等[72]提出基于共顯增強(qiáng)的RCN(recurrent convolutional network)的跌倒檢測算法,RCN由分段的RNN、CNN和LSTM組成處理視頻相關(guān)幀,共顯增強(qiáng)方法能突出視頻中的人類活動(dòng)區(qū)域,用于增強(qiáng)RCN對(duì)視頻各幀的特征學(xué)習(xí),RCN在開放的數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),準(zhǔn)確率高達(dá)98.96%。另外,根據(jù)RNN繼承歷史信息及收集未來信息的特性,雙向RNN、雙向LSTM(Bi-LSTM)算法相繼被提出。其中Bi-LSTM能夠同時(shí)處理過去與未來的元素,相對(duì)于LSTM擁有更高的預(yù)測準(zhǔn)確率。Taramasco等[73]針對(duì)跌倒檢測算法,采用了LSTM、GRU和Bi-LSTM三類循環(huán)神經(jīng)網(wǎng)絡(luò)算法,Bi-LSTM用于處理臨時(shí)數(shù)據(jù)序列,同時(shí)考慮過去與未來的信息,與LSTM傳遞信息方式相同(圖3)。

        圖3 Bi-LSTM原理圖Fig.3 Bi-LSTM principle diagram

        運(yùn)算過程如下列公式:

        表4 基于時(shí)間序列的跌倒檢測算法Table 4 Time series based fall detection algorithms

        跌倒檢測的評(píng)價(jià)指標(biāo)為準(zhǔn)確率、靈敏度及特異性,具體計(jì)算公式如下:

        其中,T P為真陽性,F(xiàn)P為假陽性,TN為真負(fù)值,F(xiàn)N為假負(fù)值。

        2.3.3 基于AE的跌倒檢測算法

        特征的選擇和融合能產(chǎn)生更高級(jí)的特征集,PCA、LDA和其他非線性特性融合機(jī)制推動(dòng)基于深度學(xué)習(xí)算法的研究,而近年來AE[82]算法代替了非線性特征融合的方法。

        2016年Jokanovic等[83]提出基于DCNN的跌倒檢測算法,由堆疊的AE和softmax構(gòu)成深度網(wǎng)絡(luò)模型,通過AE自動(dòng)學(xué)習(xí),捕捉時(shí)頻特征的復(fù)雜性,并且能夠?qū)⒌讓犹卣鞣答伣o分類器。與78%的傳統(tǒng)算法(如PCA)相比,該算法的準(zhǔn)確率達(dá)到了87%。2017年Droghini等[84]提出了基于深度卷積的自動(dòng)編碼器的跌倒檢測算法,該算法采用了端到端的策略利用聲音傳感器采集音頻,(由于日常動(dòng)作在生活中占據(jù)絕大部分)將日常動(dòng)作事件的音頻訓(xùn)練成識(shí)別模型,其中,實(shí)驗(yàn)分別在安靜與嘈雜的環(huán)境中測試,結(jié)果表明在聲音清晰的環(huán)境中跌倒檢測算法的準(zhǔn)確率達(dá)到94.61%,在噪聲環(huán)境下跌倒檢測算法的準(zhǔn)確率為95.02%。雖然該算法在噪聲環(huán)境中檢測并達(dá)到較高的準(zhǔn)確率,但音頻數(shù)據(jù)中與目標(biāo)聲音不同時(shí)都能判定為噪聲,而跌倒的數(shù)據(jù)與其他噪聲的區(qū)分標(biāo)準(zhǔn)并未指明,并且噪聲應(yīng)當(dāng)具體分類(如物品噪聲、人聲),便于提高檢測性能。2019年Zhou等[85]基于三維卷積殘差塊提出AE跌倒檢測算法,該算法以高精度的區(qū)域提取技術(shù)提取圖像中的特征區(qū)域,并通過重構(gòu)誤差技術(shù)檢測跌倒與日?;顒?dòng),但在經(jīng)過兩種跌倒數(shù)據(jù)集的訓(xùn)練與測試實(shí)現(xiàn)了88.7%的檢測精度。2020年Cai等[86]提出了多任務(wù)的沙漏卷積自編碼器的跌倒檢測算法,該算法通過沙漏卷積層擴(kuò)展神經(jīng)元的感受野來提取多尺度特征,采用多任務(wù)機(jī)制并行完成跌倒動(dòng)作的檢測和幀重建任務(wù)(增強(qiáng)特征代表性),以便于下一步的分類,且該淺層網(wǎng)絡(luò)取得了92%的準(zhǔn)確率。

        本小節(jié)主要介紹了RNN、CNN和AE的跌倒檢測算法以及其性能。根據(jù)神經(jīng)網(wǎng)絡(luò)的特點(diǎn),發(fā)現(xiàn)RNN與時(shí)間維度關(guān)聯(lián)度高,常用于一維時(shí)序的深度挖掘,CNN可分為一維、二維和三維網(wǎng)絡(luò),其中三維卷積神經(jīng)網(wǎng)絡(luò)的算法可以同時(shí)獲取時(shí)間信息和空間信息,實(shí)現(xiàn)有效檢測,但三維算法在研究上存在著技術(shù)困難,目前尚未完全解決。AE不僅可以數(shù)據(jù)降維,而且能對(duì)數(shù)據(jù)去噪,能夠完成無監(jiān)督的自動(dòng)動(dòng)作特征提取,提高動(dòng)作分類的精度,降低誤差。在跌倒檢測中,各類算法分別含有不同的優(yōu)勢,在現(xiàn)實(shí)應(yīng)用中可根據(jù)具體要求選擇對(duì)應(yīng)的算法。

        3 混合算法

        為了完善跌倒檢測算法,優(yōu)異算法的步驟被融合,閾值分析法、基于機(jī)器學(xué)習(xí)的跌倒檢測算法及基于深度學(xué)習(xí)的跌倒檢測算法相互結(jié)合,進(jìn)而更好地應(yīng)用于跌倒檢測系統(tǒng)中。

        3.1 結(jié)合閾值

        馬宗方等[26]使用Kinect傳感器檢測人體發(fā)生的異常情況,通過計(jì)算深度圖像中的關(guān)節(jié)點(diǎn)相對(duì)位置與速度,設(shè)置關(guān)節(jié)點(diǎn)熵閾值與人體中心點(diǎn)速度閾值,當(dāng)同時(shí)超過兩個(gè)閾值則判定發(fā)生跌倒。李文陽等[87]使用Kinect傳感器檢測人體發(fā)生的異常情況,通過處理RGB-D圖像得到人體骨骼及位置信息,并實(shí)時(shí)計(jì)算人體中心點(diǎn)的空間位置、運(yùn)動(dòng)速度和離地高度等參數(shù),設(shè)定了速度閾值與高度閾值判定異常,實(shí)驗(yàn)達(dá)到了92.7%的準(zhǔn)確率,但Kinect傳感器無法覆蓋區(qū)域進(jìn)行全方位檢測,同時(shí)被測者身體易產(chǎn)生遮擋的問題,檢測精度還可進(jìn)一步提高。

        Chi等[88]研究了裝有三軸加速度計(jì)的可穿戴式跌倒檢測系統(tǒng),由于在發(fā)生跌倒的幾秒內(nèi)人體加速度會(huì)經(jīng)過多次變化,該系統(tǒng)通過檢測加速度閾值和時(shí)間閾值判定是否有失重、撞擊、靜止三個(gè)連續(xù)的動(dòng)作發(fā)生,一旦檢測到連續(xù)動(dòng)作則判定發(fā)生了跌倒,經(jīng)實(shí)驗(yàn)研究表明該系統(tǒng)的檢測準(zhǔn)確率達(dá)到97%。同樣地,Wang等[89]采用佩戴在胸部的可穿戴式傳感器系統(tǒng),他們將加速度三次積和角速度三次積作為新的慣性參數(shù),該算法能夠準(zhǔn)確區(qū)分跌倒動(dòng)作與日?;顒?dòng),經(jīng)過交叉驗(yàn)證后完成了99%的檢測率,但該方法在不同的數(shù)據(jù)集中測試時(shí)都出現(xiàn)動(dòng)作誤判的現(xiàn)象,特別是一種姿勢過渡到另一種時(shí)出現(xiàn)明顯的加速度變化。

        基于閾值的跌倒檢測算法不受體重、性別等其他因素影響,主要取決于姿勢的變化,相較于其他算法更容易設(shè)置,但易出現(xiàn)動(dòng)作誤判的錯(cuò)誤,為了提高跌倒檢測的準(zhǔn)確率,人們又將該算法結(jié)合了基于機(jī)器學(xué)習(xí)的跌倒檢測算法進(jìn)行跌倒檢測。

        Shahzad等[90]基于閾值的跌倒檢測算法結(jié)合多核學(xué)習(xí)SVM算法檢測跌倒事件,該算法先根據(jù)提前設(shè)定的閾值選出異常的數(shù)據(jù),再通過多核學(xué)習(xí)SVM算法分類事件。該算法經(jīng)測試發(fā)現(xiàn)在腰部與大腿周圍有較高準(zhǔn)確率,分別為97.8%和91.7%。同時(shí)該系統(tǒng)采用的算法有效降低了誤報(bào)率,唯一的不足之處是計(jì)算量較高。Tsinganos等[91]研究了基于閾值的跌倒檢測算法結(jié)合KNN分類算法來檢測跌倒,增加的KNN模塊提高了總體精度,在MobiAct數(shù)據(jù)集測試獲得了97.53%的敏感性與94.89%特異性,但無法明確在真實(shí)環(huán)境中該系統(tǒng)的準(zhǔn)確率。Ning等[92]基于離線閾值與梯度增強(qiáng)樹(GBDT)的算法研究人體行為與姿態(tài),該算法可在活動(dòng)期間有效檢測跌倒等異常行為且能達(dá)到96%的靈敏度與準(zhǔn)確度,相較于單一的DT,改進(jìn)的算法獲得了更高的精度。除了以上的混合算法,跌倒檢測還結(jié)合人ANN[93-94]、隱馬爾可夫模型(HMM)[95]、RF[96]等算法。

        Alo等[97]則是將閾值與自動(dòng)編碼器結(jié)合來檢測跌倒,該算法提出融合加速度值的幅值向量、pitch和roll的特征,避免與手機(jī)的位置移動(dòng)或固有方向不一致帶來的影響,同時(shí)采用深度累加的自編碼器算法提取特征進(jìn)行學(xué)習(xí),其能夠識(shí)別復(fù)雜的活動(dòng)細(xì)節(jié),并獲得97.13%的準(zhǔn)確率。但在不同的訓(xùn)練樣本或網(wǎng)絡(luò)參數(shù)中表現(xiàn)出不同的性能,且訓(xùn)練過程耗時(shí)較多,選擇合適的深度自編碼器的參數(shù)對(duì)系統(tǒng)的性能將有很大的幫助。結(jié)合閾值的跌倒檢測算法如表5所示,綜上,經(jīng)由閾值計(jì)算的檢測算法使用慣性傳感器居多,實(shí)驗(yàn)數(shù)據(jù)為實(shí)時(shí)采集,根據(jù)精確度等評(píng)價(jià)指標(biāo),該類算法在實(shí)驗(yàn)室階段已達(dá)到了較高水平。然而由年輕人攜帶便攜式傳感器模仿老年人跌倒而收集的數(shù)據(jù)效果并不理想,老人的姿態(tài)與身體狀況相對(duì)于年輕人有很大差別,因此需要加深該算法在實(shí)際中的研究。

        表5 結(jié)合閾值的跌倒檢測算法Table 5 Fall detection algorithms combining thresholds

        3.2 結(jié)合機(jī)器學(xué)習(xí)

        Kong等[102]考慮到視頻圖像易受光照影響,選取人體骨骼特征訓(xùn)練網(wǎng)絡(luò)。在最大似然法訓(xùn)練出模型的基礎(chǔ)上,采用KNN或SVM分別對(duì)站立和跌倒兩類動(dòng)作進(jìn)行判別分類,同時(shí)通過快速傅里葉變換對(duì)輸出圖像進(jìn)行加密和檢測。實(shí)驗(yàn)測試獲得良好的檢測效果并有效保護(hù)了測試者的隱私。但二分類的跌倒檢測自身含有局限性,類跌倒動(dòng)作(如躺著、趴著)并不能直接歸類為跌倒。于是,Thakur等[33]提出一種多分類的K-NN跌倒檢測算法,通過結(jié)合AdaBoost算法來增強(qiáng)分類性能,增強(qiáng)分類器可表示為公式(15)、(16):

        其中,bn x中x為輸入,h(xm)為輸出假設(shè),n為迭代變量,Dt為訓(xùn)練誤差之和,Bn-1(xm)為應(yīng)用AdaBoost的增強(qiáng)分類器,a(n)h(xm)為正在增強(qiáng)的機(jī)器學(xué)習(xí)分類器,同時(shí)該算法采用k-folds交叉驗(yàn)證來消除數(shù)據(jù)過擬合并減小誤報(bào)率。經(jīng)過實(shí)驗(yàn)分析,跌倒、躺下、四肢著地及其他日?;顒?dòng)等七類跌倒與類跌倒的分類檢測準(zhǔn)確率都達(dá)到了99%。

        蔡文郁等[103]則是通過多次分類降低誤報(bào)率。他們以視頻幀數(shù)據(jù)中的人體特征點(diǎn)作為輸入,利用SVM做首次分類,再將判定為跌倒的數(shù)據(jù)輸入到SVM-MultiCNN模型進(jìn)行二次分類,該算法不僅在檢測準(zhǔn)確率達(dá)到96.8%,并且測量單幀耗時(shí)縮短近一倍,提高了跌倒檢測的效率。劉峰等[104]提出將YOLO目標(biāo)檢測與深度森林相結(jié)合的跌倒檢測算法,通過YOLO定位運(yùn)動(dòng)目標(biāo),降低背景物體的影響,同時(shí)他們提取了RGB-D圖像中頭部的時(shí)序運(yùn)動(dòng)特征,并估算地平面方程,進(jìn)而利用深度森林算法進(jìn)行特征分類,該算法能有效檢測覆蓋范圍的跌倒事件,達(dá)到97.2%的準(zhǔn)確率。隨著YOLO的系列發(fā)展,YOLO-v3改進(jìn)了backbone網(wǎng)絡(luò),從原先的darknet-19升級(jí)為darknet-53,相較于之前的版本提高了檢測精度。趙心馳等[105]基于XGBoost與YOLO-v3的跌倒檢測算法,采用YOLO-v3網(wǎng)絡(luò)選定檢測區(qū)域,再利用姿態(tài)估計(jì)網(wǎng)絡(luò)提取人體關(guān)節(jié)點(diǎn)特征,最后輸入XGBoost中訓(xùn)練,該算法能達(dá)到98.3%的跌倒檢測率。

        綜上,結(jié)合機(jī)器學(xué)習(xí)的跌倒檢測算法根據(jù)各類標(biāo)準(zhǔn)數(shù)據(jù)集的屬性設(shè)計(jì)了最適用的分類器,進(jìn)而達(dá)到接近完美的檢測率,其次針對(duì)自然光、遮擋和假陽性等問題提出合理的解決方案。特別是YOLO目標(biāo)檢測模型,現(xiàn)階段已設(shè)計(jì)出YOLO-v4,平均精度比YOLO-v3高出10%,同時(shí)減小了計(jì)算量,大大提高了YOLO模型在目標(biāo)檢測中的實(shí)用性[106]。因而YOLO系列算法應(yīng)用于跌倒檢測中成為未來的重要研究方向。

        3.3 結(jié)合深度學(xué)習(xí)

        根據(jù)深度學(xué)習(xí)各算法的優(yōu)點(diǎn),將多種算法相結(jié)合逐漸成為主流趨勢,比如利用CNN與LSTM分別處理空間特征和時(shí)序特征已是較為普遍的跌倒檢測算法。Lie等[107]基于LSTM與CNN提出跌倒檢測算法,分別利用CNN和LSTM狀態(tài)單元的遞歸神經(jīng)網(wǎng)絡(luò)來提取輸入幀的二維人體骨架和處理時(shí)間骨架序列,根據(jù)結(jié)合空間特征與時(shí)間信息進(jìn)行站立、行走、躺下和升降動(dòng)作分類,最后該算法在經(jīng)過自定義數(shù)據(jù)集訓(xùn)練和測試后達(dá)到了90%的準(zhǔn)確率。但二維骨架是人體相連的關(guān)節(jié)點(diǎn)在平面上的投影,相較于三維少了深度信息,對(duì)人體信息的描述不夠精確。Tao等[108]利用LSTM與RNN的研究三維骨骼數(shù)據(jù)中的人體特征姿態(tài),并利用混合網(wǎng)絡(luò)算法學(xué)習(xí)不平衡人體姿勢用以檢測跌倒,可達(dá)到91.7%的跌倒檢測率。同樣利用三維骨骼數(shù)據(jù)進(jìn)行跌倒檢測,Tasi等[109]采用了1D CNN與DNN算法,通過剪枝技術(shù)對(duì)骨骼提取的結(jié)果進(jìn)行細(xì)化,突出特征點(diǎn),減少了模型參數(shù)與計(jì)算次數(shù),獲得95%的精確度。

        曹建榮等[110]研究出運(yùn)動(dòng)特征融合CNN的跌倒檢測算法,他們利用改進(jìn)的目標(biāo)檢測網(wǎng)絡(luò)YOLO-v3標(biāo)記目標(biāo)并分離前景,而結(jié)合運(yùn)動(dòng)特征與CNN模型提取的特征,實(shí)現(xiàn)人體跌倒分類與檢測,結(jié)果達(dá)到了98.3%的準(zhǔn)確率,并且該算法能較好地抗噪抗光照干擾。但Lu等[111]認(rèn)為低維CNN難以充分獲取運(yùn)動(dòng)信息,并且跌倒數(shù)據(jù)集視頻類居多,因而提出基于3D CNN與LSTM的跌倒檢測算法,通過3D CNN獲取視頻人體運(yùn)動(dòng)特征,并采用LSTM形成空間注意方案定位每一幀中的感興趣區(qū)域,經(jīng)過測試在實(shí)驗(yàn)環(huán)境下取得了100%精度。Hsieh等[112]考慮了算法在現(xiàn)實(shí)生活中的實(shí)用性,提出了3D CNN與反饋光流卷積神經(jīng)網(wǎng)絡(luò)的跌倒檢測算法,該算法在光流進(jìn)入卷積層前采用基于規(guī)則的濾波器來監(jiān)控變化的光流,可檢測到人體行為框架,當(dāng)檢測到跌倒的行為順序時(shí)判定為跌倒。研究結(jié)果表明該算法能區(qū)分跌倒與正常的躺姿,且在模擬真實(shí)家庭環(huán)境的正確率達(dá)到98%。

        綜上,結(jié)合深度學(xué)習(xí)的跌倒檢測算法從維度、特征、數(shù)據(jù)格式等方面探究人體運(yùn)動(dòng),利用各算法優(yōu)勢不斷改進(jìn),進(jìn)而解決跌倒檢測中呈現(xiàn)的各類問題,并且取得了顯著的檢測成果。然而老人的跌倒數(shù)據(jù)集較少,研究員們普遍采用相關(guān)的公開數(shù)據(jù)集進(jìn)行跌倒研究,造成訓(xùn)練與測試脫離真實(shí)場景,偏離真正的研究對(duì)象,該類算法同樣需要整理收集老年人的跌倒數(shù)據(jù),由實(shí)驗(yàn)室測試階段過渡到現(xiàn)實(shí)世界的實(shí)際應(yīng)用。

        4 討論

        跌倒檢測算法在跌倒檢測和跌倒預(yù)防中發(fā)揮重要的作用,包括基于閾值、基于機(jī)器學(xué)習(xí)和基于深度學(xué)習(xí)的跌倒檢測算法根據(jù)自身的優(yōu)勢進(jìn)行跌倒檢測,各跌倒檢測算法都能夠達(dá)到極高的精確度,如深度卷積與LSTM已能成功地從慣性傳感器數(shù)據(jù)中識(shí)別使用者的活動(dòng)和步態(tài),提取的特征也能以多模態(tài)的形式呈現(xiàn),削弱或避免了光線、遮擋、噪音等問題,為此將跌倒算法運(yùn)用到實(shí)際生活中是當(dāng)前急需考慮的問題,本文基于上述的研究對(duì)跌倒檢測的未來發(fā)展大膽地提出自身見解:

        (1)隨著研究的深入,單一的算法表現(xiàn)出一定的局限性,難以囊括多種場景下的跌倒行為。但混合算法表現(xiàn)出較強(qiáng)的優(yōu)越性,通過結(jié)合算法的優(yōu)點(diǎn)處理多環(huán)境、多姿態(tài)的跌倒分類。比如機(jī)器學(xué)習(xí)算法中的支持向量機(jī)(SVM)能夠根據(jù)提取的特征實(shí)現(xiàn)優(yōu)秀的分類效果,因而常與閾值分析法結(jié)合來處理跌倒檢測問題;深度學(xué)習(xí)算法中的卷積神經(jīng)網(wǎng)絡(luò)(CNN)可以自動(dòng)學(xué)習(xí)數(shù)據(jù)的空間特征,能夠根據(jù)輸入數(shù)據(jù)的屬性準(zhǔn)確地預(yù)測和分析,所以常與長短期記憶網(wǎng)絡(luò)(LSTM)相結(jié)合,用于分析含有時(shí)空信息的視頻流數(shù)據(jù)。表6對(duì)比了本文所提及文獻(xiàn)中相同數(shù)據(jù)集的各類算法及精確度,在UMA FALL與multiple cameras fall detection dataset數(shù)據(jù)集上混合算法優(yōu)于單一算法,而在URFD數(shù)據(jù)集上單一算法的性能并不弱于混合算法,因而單一算法的價(jià)值仍在探究中,但混合算法在各標(biāo)準(zhǔn)數(shù)據(jù)集上更具有穩(wěn)定性。而在FDD、MobiAct dataset和Le2i數(shù)據(jù)集上對(duì)比不同的混合算法,可以發(fā)現(xiàn)算法結(jié)構(gòu)學(xué)習(xí)的人體信息越充實(shí),算法達(dá)到的精確度越趨于完美,因此設(shè)計(jì)跌倒檢測混合網(wǎng)絡(luò)時(shí),應(yīng)盡可能地獲取多維度、多特征或多模態(tài)信息,進(jìn)而提高跌倒檢測算法的高效性與實(shí)用性。

        表6 跌落檢測方法的比較Table 6 Comparison of fall detection methods

        (2)近期熱門的“注意力機(jī)制”被廣泛運(yùn)用于自然語言處理,通過編碼與解碼的框架提取文本上下文信息,而根據(jù)人體運(yùn)動(dòng)學(xué)的研究表明跌倒動(dòng)作屬于一系列連續(xù)的肢體行為,檢測傳感器得到的加速度或生理信號(hào)呈連續(xù)性波形,因而可將注意力機(jī)制運(yùn)用于處理時(shí)間序列的1D CNN、RNN或LSTM中,增強(qiáng)數(shù)據(jù)處理能力。

        (3)CNN在圖像處理領(lǐng)域獲得矚目的成就,但其只能處理歐式空間規(guī)則的二維結(jié)構(gòu)圖。而現(xiàn)實(shí)生活中含有大量不規(guī)則的拓?fù)浣Y(jié)構(gòu),早前有研究發(fā)現(xiàn)圖卷積神經(jīng)網(wǎng)絡(luò)(GCN)可用于處理該類數(shù)據(jù),GCN也逐漸被用于各交叉領(lǐng)域中。其中,人體關(guān)節(jié)點(diǎn)相互連接形成類似的無規(guī)則圖結(jié)構(gòu)為跌倒檢測提供良好的研究條件,現(xiàn)已有用于跌倒檢測中[113]。為此可將GCN與CNN結(jié)合使用,采取多模態(tài)的數(shù)據(jù)或多任務(wù)機(jī)制提高跌倒檢測性能與落實(shí)的幾率。

        (4)在現(xiàn)實(shí)中跌倒應(yīng)用在受到“攻擊”時(shí)需要跌倒檢測算法具有良好的健壯性與穩(wěn)定性,而算法的這一方面極少被考慮到。因而如何加強(qiáng)算法的魯棒性是跌倒檢測聯(lián)系實(shí)際應(yīng)用的重點(diǎn)。

        (5)人流量較多車站或商場是老年人跌倒的高發(fā)地點(diǎn),而單人跌倒檢測算法在該場景中能否保持并不適用,多目標(biāo)的跌倒檢測算法、多模態(tài)傳感器的應(yīng)用(如視覺傳感器和紅外傳感器)同樣是今后的研究方向之一。

        5 結(jié)語

        跌倒已成為世界老年人高死亡率的原因之一,跌倒檢測與預(yù)防的研究熱度一直居高不下,各式各樣的監(jiān)測系統(tǒng)層出不窮,檢測識(shí)別算法更是經(jīng)歷多期更新?lián)Q代。本文綜述了跌倒檢測算法的研究進(jìn)展,分別從單一算法與混合算法的角度闡述跌倒檢測的發(fā)展與改進(jìn),詳細(xì)介紹了閾值、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)在該領(lǐng)域中發(fā)揮的重要作用,其中深度學(xué)習(xí)模型是該領(lǐng)域的前沿算法,并且總結(jié)了所使用的標(biāo)準(zhǔn)數(shù)據(jù)集。在未來,可穿戴式設(shè)備與視頻監(jiān)控仍是跌倒檢測方向的發(fā)展主力,而輕量級(jí)CNN不僅能識(shí)別人體特征,而且能有效降低計(jì)算時(shí)間,在移動(dòng)設(shè)備的目標(biāo)檢測上具有廣闊的前景,另外圖卷積神經(jīng)網(wǎng)絡(luò)作為提出的新框架,不僅能學(xué)習(xí)動(dòng)態(tài)的圖數(shù)據(jù)的結(jié)構(gòu)、屬性和動(dòng)態(tài)信息,而且能處理不規(guī)則的空間結(jié)構(gòu)的圖數(shù)據(jù),因而實(shí)現(xiàn)動(dòng)態(tài)圖數(shù)據(jù)中異常行為的檢測。因此,可以預(yù)估今后跌倒檢測的發(fā)展趨勢將更傾向落實(shí)于生活實(shí)際的應(yīng)用及多元化的結(jié)合CNN及其拓展算法。

        猜你喜歡
        特征檢測
        抓住特征巧觀察
        “不等式”檢測題
        “一元一次不等式”檢測題
        “一元一次不等式組”檢測題
        “幾何圖形”檢測題
        “角”檢測題
        新型冠狀病毒及其流行病學(xué)特征認(rèn)識(shí)
        如何表達(dá)“特征”
        不忠誠的四個(gè)特征
        抓住特征巧觀察
        久久亚洲午夜牛牛影视| 免费观看羞羞视频网站| 青草视频在线播放| 亚洲天堂免费视频| 一区二区日本影院在线观看| 宅男亚洲伊人久久大香线蕉| 成人精品视频一区二区| 国产女精品视频网站免费| 色婷婷狠狠97成为人免费| 久久av一区二区三区黑人| 边添小泬边狠狠躁视频| 特级婬片国产高清视频| 国产福利片无码区在线观看| 午夜婷婷国产麻豆精品| 日本不卡高字幕在线2019| 性色av无码久久一区二区三区| 无码精品一区二区三区超碰| 日本久久黄色高清视频| 中文字幕一区二区人妻秘书 | 亚洲视频在线看| 在线观看国产精品自拍| 亚洲一区二区日韩专区| 国内精品视频在线播放不卡| 日本一本久道| 国产最新一区二区三区| 国产精品人成在线观看免费| 无码人妻精品丰满熟妇区| 久久精品性无码一区二区爱爱| 亚洲精品视频一区二区三区四区| 精品无码人妻夜人多侵犯18| 国产精品白浆在线观看无码专区| 国产h视频在线观看网站免费| 蜜臀av一区二区三区| 乱码av麻豆丝袜熟女系列| 无码AV高潮喷水无码专区线| 青青草原亚洲在线视频| 白白白在线视频免费播放| 开心五月激情综合婷婷| 精品人妻丰满久久久a| 国产亚洲中文字幕一区| 亚洲熟妇少妇任你躁在线观看无码|