劉志鵬
(漳州職業(yè)技術學院,福建 漳州 363000)
在體育教學過程中,學生初次學習到動作之后,由于運動主體的神經與肌肉之間的聯系尚不精確,所以運動過程中常伴著錯誤動作出現,因此在體育教學過程中如何糾正與預防錯誤動作,是體育教師提升運動技術教學質量的基本要求。據相關調查研究可知,以往對體育教學訓練動作的糾正過程中,無法準確地檢測出錯誤動作,因此不能夠及時改正錯誤動作[1-3]。在國際體育大趨勢的推動下,各類體育活動不斷進入人們的視野,人們開始注重對各類體育活動的訓練[4-5]。在實際訓練過程中,運動人員的訓練需要以各類體育活動的標準動作為基準,但不同人員對各類體育運動的了解水平程度不同[6],有一些運動人員的運動神經不太發(fā)達,在進行體育訓練時常出現動作錯誤[7],很難實現對正確動作的快速把握,這種情況下就要求在體育教學訓練過程中教導人員能夠有效指出并糾正運動人員的錯誤動作[8]。以實現體育教學訓練錯誤動作檢測為目標,蔣留兵等人與許志猛等人分別利用二維小波包技術與空間聚類技術進行人體行為動作的分析,通過解析體育教學訓練圖像以提升對錯誤動作檢測的準確程度,但二維小波包技術所提取的特征不夠全面,以至于后續(xù)檢測結果與實際的偏差較大;而空間聚類技術過于廣泛,忽略了圖像邊緣的細節(jié)特征,檢測結果容易出現錯誤[9-10]。
隨著相關領域研究的進一步發(fā)展,深度卷積神經網絡已經被廣泛用于人體動作識別[11]與目標檢測[12]過程中,但是由于其所構建的深度卷積神經網絡層次性不佳,且未能實現動作樣本的進一步處理,導致將這種方法應用至體育教學訓練錯誤動作檢測的適用性較差。
所以為彌補上述體育教學訓練錯誤動作檢測過程中的不足,本文以卷積神經網絡為基礎,并通過深度學習對其進行改進,在卷積層與池化層的中間添加批量歸一層,通過批量歸一化處理體育教學訓練的錯誤動作樣本,以此為基礎提取錯誤動作特征,快速準確地檢測出體育教學訓練的錯誤動作,令運動人員的運動水準得到進一步提升。
深度卷積神經網絡主要是一種利用深度學習改進卷積神經網絡的一種神經網絡,呈現出多變的層次以及向后的傳播方向,從而實現錯誤動作檢測。深度卷積神經網絡權值是共享的且訓練時的計算較為簡單,可廣泛應用于時間序列數據分析過程中,并且其可通過網絡結構深度和廣度更改體育教學訓練錯誤動作檢測模型的容量。
1.1.1 深度卷積神經網絡的結構
深度卷積神經網絡主要由輸入層、隱含層以及輸出層構成。隱含層是由重復交替的多層次卷積層和池化層構成,深度卷積神經網絡的結構如圖1所示。
將未經過特征提取的初始數據輸入至輸入層,在卷積層(C1)中通過卷積核卷積處理所輸入的數據,獲取相應的卷積特征圖;通過池化層(S2)池化處理卷積層所得到的特征圖,獲取相應的池化特征圖;在隱含層(C3、S4)中仿照 C1、S2 進行重復操作[13]。通過設置該網絡的卷積和池化可有效實現錯誤動作數據特征的提取,提升體育教學訓練錯誤動作檢測過程中對扭曲不變性特征圖像的包容程度,同時令圖像分辨率提升,以此獲取大量的特征數據,最終通過全連接層輸出最后的檢測結果。
圖1 深度卷積神經網絡的結構
1.1.2 卷積層
以完成預處理的加速傳感器x、y、z數據(深度為3)為輸入數據,為了保證輸入與輸出的尺寸一致,需要填充數據。卷積操作過程中,同一卷積核的變換不影響其權值,并且該權值共享于x軸數據[14]。通過這種特點可有效減少深度卷積神經網絡的參數量,加速網絡訓練速度。
深度卷積神經網絡中的所有卷積核均具有特征自動提取的功能,通過卷積核對加速傳感器x、y、z數據進行卷積處理,體育教學訓練圖像的各種細節(jié)信息均可通過各個卷積核提取得到。
令卷積核的高與寬分別為fh、fw,得到二維卷積:
采用ReLU函數作為神經網絡的激活函數,得到總卷積層的輸入輸出
1.1.3 最大池化層
池化層存在的意義主要是針對輸出進行挑選和降維。在體育教學訓練錯誤動作檢測過程中應用最大池化策略,池化核為2×2,令s為步長,池化核的高與寬分別為Ph、Pw,得到最大池化
通過池化層可以在最大程度上減少數據的維度和對應訓練參數,加快網絡訓練的速度。
1.1.4 全連接層與輸出層
為防止深度卷積神經網絡過程中,由于使用的數據集規(guī)模較小而出現的過擬合情況,常在全連接層引入正則化方法,該方法具有的隨機性會使得每一次所輸送的數據集所對應的網絡結構都不太一致,但所有網絡權值都是共享的,以此可以大大提升體育教學訓練的錯誤動作檢測模型的穩(wěn)定性,令各神經元彼此適應時不再那么復雜。
深度卷積神經網絡的卷積層應用了權值共享方法,同時減少了其結構的參數與困難程度,防止神經網絡在早期發(fā)生過擬合的情況,令其具有更好的泛化能力,通過池化保證了神經網絡的穩(wěn)定性,該網絡所具備的多種特點令其在發(fā)生變換時維持平移、縮放以及扭曲不變。深度卷積神經網絡具有極強的表達效果以及可拓展性,可良好應用于各類難易程度較高的問題之中。
體育訓練錯誤動作的檢測準確率的提高取決于神經網絡的深度,特征與表征能力呈正相關關系,深度神經網絡會對所有的錯誤動作數據特征進行計算,最終所得的輸出越深則意味著特征提取能力越強。在加深網絡深度過程中極易發(fā)生梯度消失的現象,引起網絡性能的下降。為解決這一問題,采用深度卷積神經網絡進行提取特征時所采用的基礎網絡為ResNet101,可以更快更好地提取體育教學訓練樣本數據的細微特征,在卷積層與池化層的中間通過ResNet批量添加歸一層和殘差塊,在加快網絡訓練速度的同時調整數據輸送的策略,推動網絡性能的進一步優(yōu)化。
批量歸一層中應用了批量歸一化(batch normalization)算法,它將對網絡層輸入的處理操作融入到體育教學訓練的錯誤動作檢測中,通過微批量歸一化處理體育教學訓練的錯誤動作樣本。
批量歸一化表示為:
其中,x表示深度卷積神經網絡內部輸入某一層的向量;X表示樣本集合,整體訓練集的一個輸入群可通過 X={x1,x2,…,xN}描述。
優(yōu)化網絡參數時采用反向傳播算法,得出輸入矢量與整體訓練樣本取值批量歸一化對應的雅克比矩陣,其公式是:
批量歸一化處理所有層的輸入的運算量較大,得出協方差矩陣的用時較長。對此提出以下兩種簡化的改進方法:
(1)用獨立批量歸一化處理取代每維數據的聯合歸一化處理,得到公式如下:
其中,輸入樣本的第 k 維用 x(k)表示,期望用 E(x(k))表示,方差用 var(x(k))表示。 通過獨立的批量歸一化處理能夠有效加快網絡訓練速度,但是卻不能保證網絡各層次的初始描述的穩(wěn)定性。為保持所添加批量歸一化處理的變化的恒定,在各輸入樣本的第維中添加參數λ(k)、β(k),得到以下公式:
其中,λ(k)與 var(x(k))相等,均為方差,主要是指經過尺度變換后的輸入樣本的第 k 維;β(k)與 E(x(k))相等,均為輸入的期望,主要是指經過平移變換后的輸入樣本的第維。利用該參數與模型中各參數一起進行網絡訓練可有效降低深度神經網絡的輸出誤差。
(2)通過微批量樣本進行深度卷積神經網絡的隨機梯度訓練,通過運算各樣本上的各層次預估均值與方差,利用上述操作可實現梯度的反方向傳播。
設微批量樣本集合為B,其樣本大小描述為m,對某一層次輸入的某維表示為x,逐維歸一化表示為:
以下是深度卷積神經網絡加入批量歸一化處理的整體流程:
輸入:深度卷積神經網絡的初始數據量為,訓練參數集為N,各層輸入集為
利用訓練好的深度卷積神經網絡進行體育教學訓練的錯誤動作檢測,得到精準的錯誤動作檢測結果。
為了證明基于深度卷積神經網絡的體育教學訓練錯誤動作檢測方法的有效性,以某體育教育學院某班學生為實驗對象。其中,深度卷積神經網絡的參數設置如表1所示。
表1 深度卷積神經網絡的參數設置
分別利用本文方法 (深度卷積神經網絡的檢測方法)和文獻[9]方法(二維小波包的動作檢測方法)、文獻[10]方法(空間聚類的動作檢測方法)檢測體育教學訓練過程中的錯誤動作,在實驗次數逐漸增加的情況下,比較三種方法檢測體育教學訓練錯誤動作的效果。
在實驗過程中,本文所使用的數據集為非公開數據集,利用機器視覺技術捕捉體育教學訓練動作,并對捕捉結果進行去噪以及增強處理,以此提升實驗結果的精準度。在此基礎上所有實驗數據平均分為兩組,一組用于深度卷積神經網絡的訓練,一組用于實驗測試。
由于在實驗過程中涉及到了多個體育訓練錯誤動作,不同方法對于其中一種體育教學訓練錯誤動作的檢測結果見圖2。
圖2 三種方法的檢測結果
分析圖2可知,圖2(a)是標準的體育教學訓練過程中發(fā)生的錯誤動作,包括塌腰、下背部過低、抬頭、臀部塌下。不同方法都可以檢測出運動人員的各個部位的錯誤動作,本文方法的檢測結果與圖2(a)高度吻合,而文獻[9]的方法與文獻[10]的方法在對體育教學訓練錯誤動作進行檢測時,誤檢率較高,說明利用本文方法對體育教學訓練中的錯誤動作檢測效果要優(yōu)于利用文獻[9]與文獻[10]方法的檢測效果。
在此基礎上,采用三種方法對實驗樣本進行體育運動錯誤動作檢測,比較不同方法的體育運動錯誤動作檢測的誤差率,利用對比的結果衡量三種不同方法檢測體育教學訓練錯誤動作的綜合有效性,對比結果如表2所示。
表2 不同方法的檢測誤差率對比
分析表2可知,隨著實驗次數的不斷增加,本文方法對于體育教學訓練錯誤動作的檢測誤差率一直保持在一個較低的水平。本文方法的體育教學訓練錯誤動作的檢測平均誤差率約為0.034%,而文獻[9]方法的平均誤差率約為0.103%,文獻[10]方法的平均誤差率約為0.168%,說明了本文方法的檢測精度更高。利用本文方法進行體育教學訓練的錯誤動作檢測時,能夠把誤差控制在合理區(qū)域內。
為了驗證本文方法在體育訓練錯誤動作檢測中的有效性和魯棒性,采取ACC(準確率)、TPR (靈敏度)、FPR (特異度)、PPV(陽性預測率)4個測試指標進行定量的比較,具體計算公式描述如下:
其中:TP表示被判定為正樣本,事實上也是正樣本的數量;FP表示被判定為正樣本,但事實上是負樣本的數量;TN表示被判定為負樣本,事實上也是負樣本的數量;FN表示被判定為負樣本,但事實上是正樣本的數量。ACC與TPR越高,FPR、PPV越低,檢測性能越好。
表3是體育教學訓練錯誤動作檢測的測試實驗結果。
表3 體育教學訓練錯誤動作的檢測結果
由表3可得,在三種方法的體育教學訓練錯誤動作檢測中,本文方法的ACC、FPR、PPV、TPR四項參數指標均優(yōu)于其他兩種方法,其中本文方法的檢測精度達到了98%以上,驗證了深度卷積神經網絡的優(yōu)越性能。
由于傳統方法無法準確獲取體育教學訓練的錯誤動作特征,導致檢測精準度下降,因此本文提出了一種基于深度卷積神經網絡的體育教學訓練錯誤動作檢測方法,通過實驗證明利用該方法可以有效檢測出運動人員在體育教學訓練過程中出現的錯誤動作,檢測精度較高,還可以有效控制檢測誤差,及時、準確判斷錯誤動作。在本文方法的未來應用過程中,需要著重注意訓練樣本數據的分析,并采用其他方法提升檢測速度,為體育教學訓練錯誤動作的檢測給予強有力的技術支撐。