王鵬宇 邵卓雅 馬傳輝 王志恒 湯佳杰
(1.南通大學(xué)體育科學(xué)學(xué)院;2.南通大學(xué)信息科學(xué)技術(shù)學(xué)院 江蘇南通 226019)
據(jù)中國社會科學(xué)院預(yù)測,2050年我國60歲及以上老年人口數(shù)量將達到4.83億人,80歲及以上老人人口將達到1.08 億人[1]。隨著老人空巢化等問題日益突出,老人因摔倒而導(dǎo)致的住院率和死亡率不斷攀升,60歲以上的老年人每年跌倒的概率達33%,70 歲及以上的老人每年跌倒的概率則更高[2]。老人智能健康技術(shù)的研發(fā)受到密切關(guān)注并成為趨勢[3],而跌倒檢測是老人智能健康技術(shù)中較為常見并十分重要的領(lǐng)域。
目前已有多種基于人工智能的跌倒檢測方案被提出。依據(jù)跌倒檢測方法可主要分為基于圖像識別的傳統(tǒng)檢測方法、基于環(huán)境監(jiān)測的方法及穿戴式設(shè)備檢測方法三類?;趫D像識別的傳統(tǒng)檢測方法通過部署攝像頭獲取人體運動圖像信息并分析特征判斷是否發(fā)生跌倒。此檢測方法應(yīng)用較為廣泛,但會侵犯老人生活隱私,算法準(zhǔn)確性易受環(huán)境和光照的影響,且攝像頭只能固定在特定位置[4]。基于環(huán)境變量的方法通過在地面布設(shè)震動傳感器或紅外線傳感器等,通過分析震動波形信號或電信號識別跌倒行為,該方法應(yīng)用場景局限,且布設(shè)成本高,通常作為輔助判斷方案[5-6]。穿戴式設(shè)備檢測方法通過實時檢測運動參數(shù)判斷是否發(fā)生跌倒,檢測設(shè)備與移動終端進行集成,目前常見應(yīng)用為使用加速度傳感器進行姿態(tài)識別[7-8]。
該文提出了一種基于MLP 神經(jīng)網(wǎng)絡(luò)的跌倒檢測模型。該模型融合深度學(xué)習(xí)和置于腰間的姿態(tài)傳感器進行跌倒檢測,以MLP 神經(jīng)網(wǎng)絡(luò)模型為基礎(chǔ),優(yōu)化學(xué)習(xí)率迭代方案;訓(xùn)練跌倒檢測多層感知器模型并通過量化縮小體積(Fall Detection Multilayer Perceptron,F(xiàn)DMLP)。實驗結(jié)果顯示,該文提出的FDMLP 神經(jīng)網(wǎng)絡(luò)跌倒檢測模型在使用特征數(shù)據(jù)集時候的準(zhǔn)確率達99.99%,優(yōu)于其他同類模型,且結(jié)構(gòu)簡單,適合部署在邊緣設(shè)備上。
首先選擇Sis Fall[9]數(shù)據(jù)集,此數(shù)據(jù)集由線性加速度數(shù)據(jù)和陀螺儀數(shù)據(jù)組成。然后基于原始數(shù)據(jù)集提取數(shù)據(jù)特征。在一個測量周期內(nèi)選取一段包含A={N1,…,Ni,…,NA}個數(shù)據(jù)點的姿態(tài)數(shù)據(jù)流,其中Ni={Axi,Ayi,Azi,Rxi,Ryi,Rzi},Axi、Ayi、Azi分別表示x、y、z軸加速度數(shù)據(jù),Rxi、Ryi、Rzi分別表示x、y、z軸陀螺儀數(shù)據(jù)。對A個數(shù)據(jù)點的姿態(tài)數(shù)據(jù)流求最大值、平均值、方差,以及Axi與Azi的弧度值、Rxi與Rzi的弧度值。
MLP 模型接收特征值數(shù)據(jù)集作為輸入值,MLP 由全接連層構(gòu)成,全接連層將輸入值投射到隱藏層中進行權(quán)重學(xué)習(xí)。每一層的輸入分布都會隨著前一層參數(shù)的變化而變化[10]。該文改進MLP 模型并將Sigmoid 函數(shù)作為激活函數(shù)以支持網(wǎng)絡(luò)的非線性建模能力,將特征值數(shù)據(jù)集用以訓(xùn)練的維度數(shù)量除以批處理尺寸計算得到訓(xùn)練周期長度[10],訓(xùn)練周期長度計算如下。
式(1)中,epoch表示訓(xùn)練周期長度;X_train.shape表示用以訓(xùn)練的維度數(shù)量;batch_size表示批處理尺寸。
“學(xué)習(xí)率范圍測試”可以估計初始學(xué)習(xí)率的上下邊界值[11]。首先運行短期迭代來調(diào)整架構(gòu)和超參數(shù)。平均損失函數(shù)(Avg Loss)隨學(xué)習(xí)率的變化如圖1 所示。圖像左區(qū)平均損失函數(shù)收斂趨勢穩(wěn)定;右區(qū)學(xué)習(xí)率過大,模型無法收斂。模型學(xué)習(xí)以最小化損失函數(shù)為目標(biāo),因此設(shè)置初始學(xué)習(xí)率的范圍在區(qū)間[1e-4,1e-3]。
圖1 學(xué)習(xí)率范圍測試
為解決模型訓(xùn)練過程中陷入局部極小點問題,學(xué)習(xí)過程中以最小化損失函數(shù)為目標(biāo),采用自適應(yīng)學(xué)習(xí)率的方法優(yōu)化學(xué)習(xí)率和權(quán)重衰減。首先使用較大學(xué)習(xí)率加速訓(xùn)練[12],快速得到較優(yōu)解,然后隨迭代次數(shù)指數(shù)衰減學(xué)習(xí)率,使模型在訓(xùn)練后期損失函數(shù)穩(wěn)定收斂。
訓(xùn)練集與驗證集的準(zhǔn)確率與損失值具體見圖2,F(xiàn)DMLP模型的準(zhǔn)確率達99.99%,損失為0.0004%。
圖2 訓(xùn)練集與驗證集的準(zhǔn)確率與損失值
通過使用原始姿態(tài)數(shù)據(jù)集和自建的特征值數(shù)據(jù)集,將FDMLP 神經(jīng)網(wǎng)絡(luò)模型與多種模型進行性能對比。對比神經(jīng)網(wǎng)絡(luò)模型及評估性能如表1及圖3所示。
表1 使用原始姿態(tài)數(shù)據(jù)集訓(xùn)練的神經(jīng)網(wǎng)絡(luò)性能評估表
首先評估使用原始姿態(tài)數(shù)據(jù)集訓(xùn)練的九種模型進行性能,混淆矩陣如圖3 所示,訓(xùn)練結(jié)果如表1 所示。在使用原始姿態(tài)數(shù)據(jù)集的情況下,與準(zhǔn)確率達到89%的KNN相比,F(xiàn)DMLP模型的準(zhǔn)確率只有81%。而在同等條件下,DT 的準(zhǔn)確率也達到了84%,優(yōu)于提出的FDMLP。但是FDMLP的準(zhǔn)確率相比于LR、LSVC、SGD和GB這幾種經(jīng)典模型仍然有很大的性能提升。
對原始數(shù)據(jù)集進行處理并建立特征值數(shù)據(jù)集。使用特征數(shù)據(jù)集進行訓(xùn)練,混淆矩陣具體見圖4,使用特征值數(shù)據(jù)集訓(xùn)練的神經(jīng)網(wǎng)絡(luò)性能見表2。
表2 使用特征值數(shù)據(jù)集訓(xùn)練的神經(jīng)網(wǎng)絡(luò)性能評估表
圖4 使用特征值數(shù)據(jù)集訓(xùn)練的神經(jīng)網(wǎng)絡(luò)混淆矩陣
使用自建的特征值數(shù)據(jù)集,每種神經(jīng)網(wǎng)絡(luò)的性能都得到了顯著提升。除了在使用原始數(shù)據(jù)集時性能最差的SGD外,都達到了90%以上。FDMLP使用SGD后準(zhǔn)確率提升了15%,達到了85%。LR的準(zhǔn)確率則提升了23%,達到了95%。由此可見特征值數(shù)據(jù)集在增強數(shù)據(jù)特征并提高網(wǎng)絡(luò)性能方面具有良好貢獻。
與其余算法相比,F(xiàn)DMLP在各項性能指標(biāo)中都具有更好的表現(xiàn)。其中FDMLP的準(zhǔn)確率提升了18%,達到了99%,優(yōu)于其他模型。此外,F(xiàn)DMLP 的查準(zhǔn)率提升了49%,查全率提升了46%,F(xiàn)1值提升0.48,混淆矩陣在各個類別上的表現(xiàn)提升顯著。
該文提出了一種基于MLP,神經(jīng)網(wǎng)絡(luò)的FDMLP模型。該模型基于開源姿態(tài)數(shù)據(jù)集進行特征強化和標(biāo)簽分類;提出了全整數(shù)量化的優(yōu)化策略,優(yōu)化學(xué)習(xí)過程中的學(xué)習(xí)率,實現(xiàn)模型量化,并成功部署量化后的FDMLP 到嵌入式設(shè)備上,聯(lián)合完善的跌倒檢測系統(tǒng),實現(xiàn)安全、低功耗、高準(zhǔn)確率的邊緣計算。通過對比同類模型,驗證了FDMLP算法的有效性和準(zhǔn)確性。在未來,該系統(tǒng)可通過完善硬件性能以提升信噪比;提升FDMLP神經(jīng)網(wǎng)絡(luò)的泛化能力。