亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于CNN-LSTM網(wǎng)絡(luò)模型的散打動作辨識方法

        2022-10-18 06:36:40何磊趙柏山周凱
        微處理機 2022年5期
        關(guān)鍵詞:神經(jīng)元卷積神經(jīng)網(wǎng)絡(luò)

        何磊,趙柏山,周凱

        (沈陽工業(yè)大學(xué)信息科學(xué)與工程學(xué)院,沈陽 110870)

        1 引言

        近年來體育運動可穿戴設(shè)備發(fā)展迅速,體育項目中的人體運動狀態(tài)識別成為研究熱點之一。通過佩戴在運動員身上的微傳感器,收集運動時的人體不同節(jié)點慣性信息,如加速度、角速度等,再結(jié)合運動項目特征,使用合理的算法辨識技術(shù)動作[1],可在輔助運動員訓(xùn)練的同時,還能評估運動員的表現(xiàn)。目前國內(nèi)外研究面向不同體育運動及識別方法展開研究并取得了豐富的成果。張學(xué)鋒等人使用集成學(xué)習分類器對乒乓球揮拍動作進行辨識,平均識別準確率為94.5%[2],但特征篩選需要專業(yè)背景知識。雷玉超等建立了隱馬爾可夫模型,通過分析固定在羽毛球拍上的加速度信息,對常見的八種擊球動作辨識度到達了94%[3],但對一些非擊球動作存在誤判。郝振東等通過皮劃艇運動員佩戴加速度等傳感器,使用支持向量機來對皮劃艇動作進行技術(shù)分析,區(qū)分劃水相位[4],識別率可達94.5%,但信息為離線采集,無法實時分析。

        針對上述研究中的問題,在此以散打運動的招式動作為實例,采用多傳感器數(shù)據(jù)融合的方式,利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)和長短期記憶網(wǎng)絡(luò)(LSTM)進行時序特征的提取,由慣性傳感器節(jié)點傳回的慣性數(shù)據(jù)進行建模,實現(xiàn)散打運動的實時識別。

        2 散打動作數(shù)據(jù)采集與預(yù)處理

        2.1 數(shù)據(jù)采集

        數(shù)據(jù)采集平臺以慣性傳感器為基礎(chǔ),面向散打運動動作捕捉系統(tǒng),主要由一系列無線數(shù)據(jù)采集節(jié)點和一個無線收發(fā)主機組成,上位機軟件通過USB線纜與主機實時通信。動作捕捉系統(tǒng)如圖1所示。

        各傳感節(jié)點佩戴在軀干、左臂、右臂等關(guān)鍵部位,如圖2所示。采集運動員在一段時間內(nèi)做出左右勾拳、左右擺拳、左右直拳動作,共6種運動模式,傳感器以100Hz的采樣頻率采集x、y、z軸的數(shù)據(jù),并實時傳輸?shù)絇C機進行保存、識別。

        圖2 傳感器佩戴示意圖

        2.2 數(shù)據(jù)預(yù)處理

        2.2.1 小波去噪

        使用小波去噪對原始數(shù)據(jù)進行去噪處理。小波變換是一種空間和頻率的局部變換,將信號分解為低頻信號(主要特征)和高頻信號(噪聲和干擾)[5-6]。小波濾波過程如圖3所示。

        圖3 多尺度小波分解

        對原始信號S進行分解,得到低頻信號A、高頻信號D。以同樣步驟可繼續(xù)對低頻信號進行多尺度細分分解得到要求效果。最終信號S可以表示為S=An+D1+D2+K+Dn。其中n表示分解層數(shù)。

        2.2.2 數(shù)據(jù)標準化

        數(shù)據(jù)標準化是為了限定數(shù)據(jù)的幅值范圍,便于不同單位或量級指標之間進行比較,能起到提升模型收斂速度和識別精度的作用。以下三式分別為x、y、z軸加速度數(shù)據(jù)的標準化表達式:

        式中,下標“norm”表示相應(yīng)坐標軸值已標準化;μ表示平均值;σ為方差。

        3 CNN-LSTM神經(jīng)網(wǎng)絡(luò)架構(gòu)

        3.1 卷積層

        傳感器時序序列首先要經(jīng)過CNN處理,再接入LSTM層。CNN為輸入信號的不同分類器采用不同的特征學(xué)習方法,相當于消除異常值、清洗數(shù)據(jù)的過濾器[7],這樣便可以有效地實現(xiàn)對傳感器數(shù)據(jù)的特征提取。每個卷積層輸出為一組特征映射,對其結(jié)果加上偏差使用ReLU函數(shù)激活,如下式所示:

        在本模型中,采用一維卷積核對傳感器的一維原始數(shù)據(jù)進行卷積運算[8],輸入數(shù)據(jù)連續(xù)接入兩個卷積層,卷積核尺寸大小為3,對卷積輸出的特征向量進行池化處理。

        3.2 LSTM層

        LSTM主要的作用是針對網(wǎng)絡(luò)隱藏層對其前向及后向傳播進行網(wǎng)絡(luò)計算,通過門控制信息避免梯度爆炸問題[9]。LSTM神經(jīng)元內(nèi)部結(jié)構(gòu)如圖4所示。

        圖4 LSTM神經(jīng)元內(nèi)部結(jié)構(gòu)圖

        LSTM神經(jīng)元由細胞狀態(tài)和“門”機制(遺忘門it、輸入門ft、輸出門ot)組成。圖中ct表示細胞狀態(tài),代表長期記憶,通過門結(jié)構(gòu)在t上增加或刪除狀態(tài)信息,控制將修改后的狀態(tài)信息傳遞給下一時刻[10],各個LSTM單元激活情況由以下各式計算:

        其中,Wx是輸入向量xt的連接權(quán)重矩陣;Wh是與短期狀態(tài)ht-1的連接權(quán)重;b為偏置項矩陣;σ表示sigmoid激活函數(shù);σh表示為tanh激活函數(shù)。本文構(gòu)建的模型中,CNN處理后的數(shù)據(jù)經(jīng)過Dropout層后連接到有100個神經(jīng)元的LSTM層。

        3.3 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計

        本設(shè)計的CNN-LSTM模型內(nèi)部結(jié)構(gòu)如圖5所示。它包含輸入層、隱藏層、2個1D CNN層、1個LSTM層、Dropout層,此外還有池化層、全連接層和輸出層。各層詳情如下:

        圖5 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖

        輸入層:經(jīng)過預(yù)處理后的數(shù)據(jù),以128個時間步長為子序列供CNN模型處理,輸入的是每個9軸慣性傳感器x、y、z軸的所有數(shù)據(jù),特征個數(shù)是27。CNN輸入數(shù)據(jù)格式為[樣本數(shù),時間步數(shù),輸入特征個數(shù)],此處具體為[4296,128,27]。

        第一層CNN層:對數(shù)據(jù)進行特征提取,其核心參數(shù)特征圖(filters)是對事物的描述次數(shù),卷積核(kernel)大小則為每次處理的時間長度。

        第二層CNN層:來自第一層CNN的結(jié)果將被饋送到第二CNN層,在第一層卷積的特征圖上執(zhí)行相同的操作,繼續(xù)進行特征提取。

        池化層:保持有效特征不變,減小數(shù)據(jù)大小、參數(shù)數(shù)量,以此達到降低計算量的目的。

        LSTM層:對傳入的信息選擇性忘記,LSTM內(nèi)部神經(jīng)元數(shù)為100。分類任務(wù)無需每個時間步長都輸出,將最后一個步長的輸出作為全連接層的輸入。

        Dropout層:每個批次的訓(xùn)練隨機丟棄一些神經(jīng)網(wǎng)絡(luò)層的輸入,避免過擬合,最后得到融合的模型預(yù)測平均概率[11]。

        全連接層:神經(jīng)元數(shù)量100,選擇Relu激活函數(shù)。

        輸出層:采用softmax分類器,輸出為判斷六類散打動作的概率值。如下式:

        式中:i為散打動作類別,yt、yi為散打動作的概率集合,選擇概率最大的類別作為輸出。

        3.4 模型的訓(xùn)練

        將9軸慣性傳感器x軸、y軸、z軸的全部數(shù)據(jù)作為散打動作的特征輸入到CNN-LSTM神經(jīng)網(wǎng)絡(luò)中,將左右勾拳、左右擺拳、左右直拳6個散打類別作為輸出,以損失函數(shù)來估量預(yù)測值對真實值的偏差,選擇最小化損失函數(shù),如下式:

        4 實驗和結(jié)果分析

        實驗環(huán)境為Windows10系統(tǒng),CPU型號為Intel Core i5-8500H,8GB內(nèi)存。GPU為NVIDIA MX150圖形處理器。數(shù)據(jù)采集軟件基于Qt開發(fā),算法基于TensorFlow后端的Keras框架實現(xiàn),使用Pycharm集成開發(fā)環(huán)境。

        4.1 數(shù)據(jù)樣本集

        首先對數(shù)據(jù)進行降噪和標準化處理,經(jīng)過反復(fù)比對,最終選擇Coif5小波基函數(shù)對數(shù)據(jù)進行5層多尺度分解。x軸加速度數(shù)據(jù)小波去噪比對曲線如圖6所示。

        圖6 傳感器x軸加速度去噪

        標準化數(shù)據(jù)如圖7所示,可以看出處理后的數(shù)據(jù)保持了原有的特征,同時減小了幅度。

        圖7 標準化數(shù)據(jù)與原始數(shù)據(jù)曲線對比

        滑動窗口將數(shù)據(jù)分割成固定長度,加上標簽后成為一個樣本。根據(jù)散打運動的技法特點和傳感器采樣頻率,經(jīng)對照實驗,最終選取窗口寬度為128,每64個樣本點滑動一次,即50%重疊率,如圖8所示。其中S代表滑動步長64。

        圖8 滑動窗口對數(shù)據(jù)切片處理

        經(jīng)過數(shù)據(jù)處理和滑動窗口分割,最終得到樣本集如表1。使用80%數(shù)量用做訓(xùn)練,20%用做測試。

        表1 6種散打動作樣本數(shù)

        4.2 實驗及結(jié)果分析

        為了減小隨機性,對模型驗證進行15次實驗后取平均值。對模型的超參選擇,通過對CNN-LSTM模型進行不同參數(shù)的對比分析,記錄測試數(shù)據(jù)和訓(xùn)練數(shù)據(jù)的準確率和損失值,然后選出最佳參數(shù)。

        4.2.1 窗口分割長度對模型性能的影響

        根據(jù)散打運動的擊打節(jié)奏,選取了3種滑動窗口分割方法的分類識別結(jié)果進行對比,具體方法為:

        ①窗口長度為64個采樣點,相鄰窗口無重疊。

        ②窗口長度為128個采樣點,相鄰窗口無重疊。

        ③窗口長度為128個采樣點,相鄰窗口有50%的重疊數(shù)據(jù)。

        采用上述三種窗口分割方法,后續(xù)進行相同的處理和參數(shù)配置,識別結(jié)果如圖9所示。

        圖9 不同窗口分割方法識別結(jié)果對比

        可以看出,由于64窗口長度由于無法包含完整的散打動作數(shù)據(jù)區(qū)間,識別率最低,而128窗長度無重疊時,對動作信息包含不全面,識別率低于重疊窗口分割方法。所以選取長度為128,相鄰窗口數(shù)據(jù)有50%重疊的分割窗口。

        4.2.2 神經(jīng)元參數(shù)對模型性能的影響

        神經(jīng)元參數(shù)直接影響神經(jīng)網(wǎng)絡(luò)模型的精度,對比了filter分別為8、16、32、64、128時的模型準確率,結(jié)果如圖10所示??梢钥闯?,filters=64時,分類精度最佳。此外隨著參數(shù)的增長,模型的訓(xùn)練參數(shù)和訓(xùn)練時間激增。綜合考慮識別率和訓(xùn)練時間,選擇神經(jīng)元的個數(shù)為64。

        圖10 不同filters參數(shù)分類精度

        Kernel的大小是神經(jīng)網(wǎng)絡(luò)另一個的重要參數(shù)。使用相同的實驗設(shè)置并測試一組不同的kernels值:[2,3,5,7,11],進行訓(xùn)練。最終的訓(xùn)練結(jié)果如圖11所示。結(jié)果表明,當kernel大小為3時,擁有較好的性能和穩(wěn)定性,故選擇kernel大小為3作為模型的kernel參數(shù)。

        圖11 不同kernel大小分類精度

        4.2.3 模型評估

        在確定好模型的相關(guān)參數(shù)后(時間步長n=128,Dropout參數(shù) 為0.4,filters個數(shù)為64,kernel大小為3),進行訓(xùn)練,得到訓(xùn)練過程曲線如圖12所示??梢钥闯?,隨著迭代不斷進行,模型識別準確率不斷提升,模型收斂快速;迭代第10次時趨于穩(wěn)定,每次epoch的平均訓(xùn)練時間為1.49s,對于測試集的識別時間為0.0056s,準確率達到98.5%。

        圖12 模型訓(xùn)練過程曲線

        混淆矩陣是評價分類效果的可視化方法,它提供了模型總體分類率[13]。在方差范圍內(nèi),此處選取與平均值最接近的一次實驗結(jié)果繪制的混淆矩陣,如圖13所示,以此可觀察模型對不同類別的散打動作分類的準確性。圖中對角線中表示判斷正確的樣本數(shù),可以看出模型對6類散打動作均能很好識別,但對左擺拳和左勾拳這兩個動作模式存在辨識錯誤,二者的錯誤分類主要是因為運動員做出了個別慣性信息相似性較高的動作,導(dǎo)致識別錯誤。

        圖13 模型的混淆矩陣

        5 結(jié)束語

        研究面向散打運動,研制了一套散打動作捕捉系統(tǒng),構(gòu)建了一個用于驗證算法的散打上肢技法動作數(shù)據(jù)庫,設(shè)計了一種基于CNN神經(jīng)網(wǎng)絡(luò)和LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的散打技法識別方法,實驗結(jié)果獲得98.5%的準確率。在下一步工作中,將繼續(xù)研究基于慣性信息的散打運動技法的分析方法,用于幫助散打運動的輔助訓(xùn)練和數(shù)據(jù)分析,最終目的是設(shè)計一套完善的散打運動輔助訓(xùn)練系統(tǒng),不但可以準確識別散打的技術(shù)動作、用于運動員訓(xùn)練輔助還可評估運動表現(xiàn)和預(yù)防運動損傷,具備較好的應(yīng)用前景。

        猜你喜歡
        神經(jīng)元卷積神經(jīng)網(wǎng)絡(luò)
        《從光子到神經(jīng)元》書評
        自然雜志(2021年6期)2021-12-23 08:24:46
        基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
        神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
        電子制作(2019年19期)2019-11-23 08:42:00
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        躍動的神經(jīng)元——波蘭Brain Embassy聯(lián)合辦公
        基于傅里葉域卷積表示的目標跟蹤算法
        基于神經(jīng)網(wǎng)絡(luò)的拉矯機控制模型建立
        重型機械(2016年1期)2016-03-01 03:42:04
        復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
        基于二次型單神經(jīng)元PID的MPPT控制
        毫米波導(dǎo)引頭預(yù)定回路改進單神經(jīng)元控制
        日韩人妻无码免费视频一区二区三区 | 中文字幕久区久久中文字幕| 中文字幕久久精品波多野结百度| 亚洲a∨好看av高清在线观看| 精品熟女av中文字幕| 亚洲av无码一区东京热久久| 18黑白丝水手服自慰喷水网站| 国产乱妇乱子在线播视频播放网站 | 亚洲av成人噜噜无码网站| 国产午夜影视大全免费观看| 久久精品国产亚洲AV成人公司| 啪啪网站免费观看| 久久黄色精品内射胖女人| 东北少妇不戴套对白第一次| 成人区人妻精品一区二区不卡网站| 亚洲色欲在线播放一区| 亚洲中文字幕有综合久久| 国产伦一区二区三区色一情| 中文字幕在线精品视频入口一区 | 天堂影院久久精品国产午夜18禁| 毛片在线播放亚洲免费中文网| 亚洲欧美牲交| 日本一区二区三区高清千人斩| 少妇一级aa一区二区三区片| 久久中文字幕av一区二区不卡| 亚洲综合欧美色五月俺也去| 欧美与黑人午夜性猛交久久久| 精品免费久久久久国产一区| 青青青视频手机在线观看| 日本最新视频一区二区| 大地资源中文第3页| 亚洲视频天堂| 看中文字幕一区二区三区| 精品无码一区二区三区爱欲| 亚洲人成人77777网站| 久久免费观看国产精品| 日韩精品一区二区三区在线观看的| 国产精品对白一区二区三区| 小宝极品内射国产在线| 久久免费国产精品一区二区| 亚洲一区二区三区熟妇|