謝小雨,劉喆頡
(太原理工大學 物理與光電工程學院,太原 030024)(*通信作者電子郵箱liuzhejie@tyut.edu.cn)
基于肌電信號和加速度信號的動態(tài)手勢識別方法
謝小雨,劉喆頡*
(太原理工大學 物理與光電工程學院,太原 030024)(*通信作者電子郵箱liuzhejie@tyut.edu.cn)
為了增強手勢識別的多樣性和簡便性,提出了一種基于肌電信號(EMG)和加速度(ACC)信息融合的方法來識別動態(tài)手勢。首先,利用MYO傳感器采集EMG和ACC的手勢動作信息;然后分別對ACC和EMG信號作特征降維和預處理;最后,為減少訓練樣本數(shù),提出用協(xié)作稀疏表示分類器來識別基于ACC信號的姿態(tài)手勢,用動態(tài)時間規(guī)整(DTW)算法和K-最鄰近分類器(KNN)來分類EMG信號的手形手勢。其中在利用協(xié)作稀疏表示分類器識別ACC姿態(tài)信號時,通過對創(chuàng)建字典最佳樣本個數(shù)以及特征降維的維數(shù)進行研究來降低手勢識別的復雜度。實驗結(jié)果表明,手形手勢的平均識別率達到了99.17%,對于向上向下、向左向右4種姿態(tài)手勢平均識別率達到 96.88%,而且計算速度快;對于總體的12個動態(tài)手勢,其平均識別率達到96.11%。該方法對動態(tài)手勢的識別率較高,計算速度快。
手勢識別;協(xié)作稀疏表示;肌電信號;動態(tài)時間規(guī)整算法;加速度
隨著科技的不斷發(fā)展,人機交互已成為人工智能領域的新興發(fā)展方向,在人們生活中扮演著越來越重要的角色。在人機交互技術(shù)中,手勢識別技術(shù)是重要的部分之一,在醫(yī)療、游戲、體育運動及智能等方面運用越來越廣泛。手勢識別主要包括基于視覺和基于傳感器的手勢識別。2014年,Thalmic實驗室發(fā)布了MYO手環(huán)[1],該手環(huán)內(nèi)置加速度計、陀螺儀、磁力計以及生物肌電傳感器,可以測量姿態(tài)加速度和生物肌電信號?;趥鞲衅鞯氖謩葑R別是指利用穿戴的傳感器能夠獲得手的動作信息,并且這些數(shù)據(jù)信息可以用來對手勢進行分析與識別,這類傳感器可以測肌電信號、骨骼信息、加速度信號等,可以用來進行簡單的手寫識別[2-3]及手語手勢識別[4-5]等。目前,基于傳感器的手勢識別的方法有基于慣性測量單元(Inertial Measurement Unit, IMU)[6-7]和基于肌電信號(ElectroMyoGraphy, EMG)等。
對基于肌電信號的手勢識別算法已有學者進行了大量研究,Boyali等[8]提出用循環(huán)矩陣建立訓練字典,并用基于稀疏表示的分類器對8維的肌電信號分類識別,準確率達97%;Linderman等[9]使用附著在手臂上的貼片電極來測得寫字時的肌電信號,用動態(tài)時間規(guī)整(Dynamic Time Warping, DTW)算法匹配算法完成寫字識別;在肌電信號的手勢識別中,雖然許多研究表明隱馬爾可夫模型(Hidden Markov Model, HMM)[10]以及人工神經(jīng)網(wǎng)絡方法[11]能夠提高手勢識別率,但是HMM方法和神經(jīng)網(wǎng)絡分類器訓練樣本量大,算法復雜,不適合快速手勢辨識的應用。對基于加速度(ACCeleration, ACC)信號的手勢識別:Wang等[12]使用DTW算法匹配最小距離模板,然后通過稀疏表示重構(gòu)信號,實現(xiàn)不同的手勢的識別;Gupta等[13]使用加速度和陀螺儀信號實現(xiàn)了連續(xù)手勢的識別。為了增加手勢識別的多樣性,許多研究者將ACC和EMG信號[14]結(jié)合來實現(xiàn)手勢的識別,如Li等[15]在多個傳感器的基礎上使用不同識別算法實現(xiàn)大量手語手勢的識別;Georgi等[16]融合EMG和IMU信息采用隱馬爾可夫模型的方法對可穿戴手勢識別系統(tǒng)進行了簡要評估,證明了該方法的有效性。雖然基于EMG和基于ACC的手勢識別,都已經(jīng)達到了較高的識別率,但是卻很少研究將二者信息融合后,用簡單快速的方法來實現(xiàn)人機交互中手勢識別的實時性和多樣性。
本文使用Thalmic實驗室的MYO手勢臂帶采集12組包含肌電信號和加速度信號的動態(tài)手勢信息。對于肌電信號,用DTW算法結(jié)合K最近鄰(K-Nearest Neighbor,KNN)分類器進行分類識別,其中使用特征提取的方法簡化計算過程。在對ACC姿態(tài)信號進行識別的過程中,用主成分分析(Principal Component Analysis, PCA)特征降維的方法來構(gòu)建完備字典,在基于加速度的稀疏表示識別算法上[12]8648-8651,提出協(xié)作稀疏表示(Collaborative Sparse Representation, CSR)算法來識別加速度信號,并融合肌電信號識別動態(tài)手勢。實驗表明,與文獻[12]的稀疏表示算法相比,協(xié)作稀疏表示算法在訓練樣本數(shù)減少的情況下,也可以達到較高的識別率,而且相對于DTW算法不僅有較好的識別率,而且計算速度快;在融合加速度和肌電信號后,手勢識別率較高。
融合EMG和ACC的手勢識別系統(tǒng),是指對姿態(tài)手勢和手形手勢進行識別后融合為動態(tài)手勢。手勢識別系統(tǒng)主要包括了兩大部分,訓練樣本以及未知手勢(測試樣本)。圖1為手勢識別系統(tǒng)的流程框架。對于ACC信號,也就是姿態(tài)上的手勢識別,采用了協(xié)作表示分類器來識別手勢,其過程包括:創(chuàng)建字典,將輸入信號壓縮,稀疏表示出信號的主要信息,然后將信息重構(gòu)出來,利用最小殘差的標號表示手勢類別;對于手形手勢的識別,通過計算測試樣本與訓練樣本的DTW匹配距離后,用KNN分類器對手形手勢進行識別。
圖1 手勢識別系統(tǒng)框圖
由圖1可知,在動態(tài)手勢識別中,對手形手勢識別和姿態(tài)方向上的手勢識別使用了不同的識別方法。
2.1 ACC信號的手勢識別
MYO傳感器輸出的是3維的加速度信號,對加速度信號進行簡單去重,然后用PCA降維,將所有加速度的高維數(shù)據(jù)投影到低維空間,然后用降維后的加速度信號構(gòu)建完備字典,得出測試樣本的稀疏表示系數(shù),最后對重構(gòu)信號與原始信號做殘差,得出姿態(tài)手勢。
2.1.1 創(chuàng)建訓練字典
使用協(xié)作稀疏表示分類器識別基于ACC信號的手勢時,需要創(chuàng)建訓練字典。創(chuàng)建字典首先需要將所有樣本的3維加速度信號截取相同的長度,然后將每個訓練樣本的3維信號放入一個一維向量,接下來使用PCA降維來減少輸入信號的維數(shù),保留主要信號信息。假設每一個樣本長度為l,所有的樣本可以組成一個矩陣D1∈Ri*j,經(jīng)過PCA降維之后映射為維度為n的空間,即通過式(1)實現(xiàn):
Y=VD1
(1)
V表示矩陣D1經(jīng)過分解后的特征向量,Y是降維后的數(shù)據(jù)矩陣。
使用PCA降維的過程是用奇異值分解得到協(xié)方差矩陣的過程。實驗中對訓練字典降維一方面可以降低計算時間復雜度,另一方面可以提取加速度信號中的主要特征;而且還可以滿足稀疏表示中過完備字典的要求。在用PCA降維時,所降維數(shù)對計算速度和準確率都有影響:維數(shù)太大沒有起到提取主要信息的作用,使計算量增大;維數(shù)太小,不能夠?qū)⑿盘柕闹饕畔⒈磉_出來。
2.1.2 協(xié)作稀疏表示分類器
協(xié)作稀疏表示分類器是在稀疏表示的基礎上完成的,稀疏表示來源于壓縮感知的發(fā)展,其主要作用是將信號壓縮,保存信號中的主要信息,濾出噪聲和雜質(zhì)信號。稀疏表示在人臉識別中運用非常廣泛[17]。隨著對稀疏表示的深入研究,文獻[18]中就表明在信號表示中真正起作用的不僅是稀疏表示,而且還包括協(xié)作表示。稀疏表示理論要求:每一個動作的訓練樣本數(shù)量要足夠大,以滿足訓練字典為過完備字典。但是在實際識別中,為了提高計算速度,樣本數(shù)量一般較少,即為欠完備字典,因此使用所有的訓練樣本構(gòu)成訓練字典來協(xié)作表示測試樣本。協(xié)作稀疏表示的原理就是利用訓練字典盡可能地與輸入信號逼近,在訓練字典中找到一個最佳線性組合的樣本來表示這個輸入信號。
在本實驗研究中,為了對手勢進行簡單快速的識別,使用較少的訓練樣本來實現(xiàn)較高的識別率,因此采用協(xié)作稀疏表示,即用所有的訓練樣本協(xié)作表示字典。設Xi表示一個訓練樣本,則訓練字典可以表示為X=[X1,X2,…,Xi],設y為一個測試樣本,將每個測試樣本用所有的訓練樣本表示,即y=Xμ,μ=[μ1,μ2, …,μi],其中μi是第i個樣本對應的稀疏表示向量。如果測試樣本y與訓練字典中的某個元素最為類似,則該元素就不會全為0,與測試樣本不相似的元素則應全為0。但是在實際應用中,只需滿足y≈Xμ。
通過協(xié)作稀疏表示對手勢進行分類,首先需要將信號進行稀疏表示,然后根據(jù)稀疏表示向量重構(gòu)出原始信號。求解稀疏向量問題可以通過最小化的目標函數(shù)來求解,即最優(yōu)化問題如式(2):
(μ)=arg min‖μ‖0s.t. ‖y-Xμ‖<ε
(2)
其中:y是測試樣本信號,X是訓練字典,μ是輸入信號所對應的稀疏向量,ε是一個無窮小量。 對于式(2)的求解過程,實際上是在一定約束條件下,求L0范數(shù)最小化的問題,因為無法直接求解L0范數(shù),一般將L0范數(shù)問題等效為L1范數(shù)問題,又由于L2范數(shù)代替L1范數(shù)對識別率不會帶來較大的影響,卻可以大幅降低計算的復雜度,因此將求解轉(zhuǎn)換為L2范數(shù)最優(yōu)化的問題。在L2范數(shù)的前提下,結(jié)合Zhang等[18]使用最小二乘法的規(guī)則化函數(shù)來表示,如式(3),則有:
(3)
其中:第一項是最小二乘法項,第二項是正則化項,μ是稀疏度,y是輸入的測試樣本,X是訓練字典,λ稱為L2規(guī)則化參數(shù)。圖2是L2范數(shù)正則化參數(shù)對識別率的影響圖,識別率隨參數(shù)λ的增大而增大,當λ≥1后,手勢識別率隨λ的增加波動較為平緩,不顯著。因此將取λ=1。
圖2 正則化參數(shù)對識別率的影響
式(3)經(jīng)過化簡計算可得:
μ=(XTX+λE)-1XT*y
(4)
由式(4)即可求出稀疏表示向量,然后利用所求向量就可以得出測試樣本與重構(gòu)信號的殘差ri,見式(5),通過最小殘差得出手勢類別,見式(6):
(5)
Z=arg min{ri}
(6)
通過實驗得到的測試樣本手勢類別標號,與真實手勢類別標號進行比對,即可判斷測試樣本的手勢類型。
2.2 手形手勢識別
在手形手勢識別中,對MYO傳感器輸出的8維肌電信號進行處理與分析,用基于DTW模板匹配算法和KNN分類器分類5種簡單的手形手勢。
2.2.1 預處理及特征提取
在傳感器輸出信號中,包含有噪聲或者其他環(huán)境因素的影響,直接對信號進行分析就會造成許多的錯誤,降低手形手勢的識別率。同時肌電信號序列大,需要采用滑動平均能量的方法分割數(shù)據(jù)段,實驗中設滑動窗口大小為160 ms,窗口增量為40 ms;接下來對每個劃分窗口的信號值求均方根,提取EMG信號的主要特征。
2.2.2 DTW算法
動態(tài)時間規(guī)整(DTW)算法,是一種距離匹配算法,主要用于匹配不同長度的序列間的距離,其始于語音識別中[19]。該算法簡單,訓練開銷小,并且已經(jīng)廣泛用于手勢識別算法中。
假設有兩個時間序列,X={x1,x2,…,xN},Y={y1,y2,…,yM},X為測試樣本數(shù)據(jù),Y為參考模板數(shù)據(jù),M、N代表兩序列的長度,兩值不一定相同。如圖3所示,用X-Y直角坐標系表示,橫縱坐標分別表示兩序列,坐標中網(wǎng)格交錯點就表示第M和第N個序列點之間的距離,計算出任意兩個點的距離后,找出最小距離。為減少計算過程中的計算量,將路徑傾斜度限制在0.5~2[20],這樣到達(n,m)就只有3條路徑,分別為(n-1,m)、(n-1,m-2)、(n,m-1),減少了計算量。要得到兩序列之間的DTW距離,首先要計算各個序列點之間的距離,即幀匹配距離:
(6)
兩序列從坐標點(1,1)到(N,M)的最小累積距離則為:
D=d(xN,yM)+min(D(xN-1,yM),D(xN,yM-1),D(xN-1,yM-1))
(7)
圖3 DTW算法
2.2.3 KNN分類器
對于手形手勢的識別,在采用DTW算法計算測試樣本與所有訓練樣本的匹配距離后,使用最鄰近分類器(KNN算法)對測試樣本進行分類。KNN算法是將一個樣本在特征空間中的k個最相鄰的樣本中的大多數(shù)歸屬為某一個類別,則該樣本也屬于這個類別,并具有這個類別上樣本的特性。該方法簡單,魯棒性強。KNN方法在類別決策時,只與極少量的相鄰樣本有關,分類識別率與K值的選取有關,在實驗中,K=5較為合適。
3.1 實驗
實驗設備為Thalmic實驗室開發(fā)出來的MYO手勢控制臂帶,其不僅可以捕捉到用戶手臂肌肉運動時產(chǎn)生的生物電變化,而且可以采集在姿態(tài)上的運動數(shù)據(jù)。MYO由8個肌電傳感器和IMU組件組成,EMG可以捕獲受試者胳膊臂上的肌電信號,IMU可以測量手勢運動的加速度。實驗中,執(zhí)行的手勢是12個動態(tài)手勢,如圖4的(a)~(l),由手形手勢和姿態(tài)手勢組成,其中手形手勢是由MYO的5個易識別的基本動作,分別為握拳(fist)、張手(spreadfinger)、向內(nèi)擺(wave in)、向外擺(wave out)、剪刀手,姿態(tài)手勢分為:向上、向下、向右、向左。采用無線藍牙將傳感器采集的肌電信號數(shù)據(jù)顯示到電腦上。在動作采集的過程中,為了使識別結(jié)果更加準確,將12個動作分開采集;為了避免佩戴位置及其他條件的影響,戴上MYO采集完所有的數(shù)據(jù)之后再摘下。8維的EMG信號的采樣頻率為200 Hz,ACC信號的采樣頻率為50 Hz。
實驗對象為23~28歲的健康人共5人,每人每個動作執(zhí)行45次,則每個動作共執(zhí)行225次,12個動作總共執(zhí)行2 700次,全部作為測試樣本,另外,單獨采集向上、向下、向左、向右4個姿態(tài)動作40次。由于動態(tài)動作是由姿態(tài)動作和手形動作組成,因此訓練樣本單獨采集。采集某一個人的向上、向下、向左、向右4個動作分別20次。采集4個手形動作分別20次。
3.2 結(jié)果與分析
3.2.1 維數(shù)及訓練樣本個數(shù)對姿態(tài)手勢識別率的影響
在姿態(tài)手勢的識別過程中,對訓練字典進行降維來提取動作的主要特征時,所降維數(shù)對識別準確率和識別復雜度具有一定的影響,對于復雜度不同的動作,最佳特征維數(shù)可能不同。因此實驗中對姿態(tài)動作特征降維的維數(shù)進行了探究,便于后續(xù)動態(tài)手勢識別達到最佳效果,主要是考慮了握拳向上、握拳向下、握拳向右、握拳向左這4個動作,因為這4個動作包含了4個姿態(tài)動作,可以大致確定對于4個姿態(tài)動作的最佳特征降維維數(shù)。
由表1可知,當所降維數(shù)低于4維時,識別率在較低的水平上波動,當維數(shù)上升為5時,識別率有明顯的提高,特別是姿態(tài)向左這個動作。當維數(shù)上升為6及更大時,其對識別率的影響較小。從這4個姿態(tài)動作中,可以發(fā)現(xiàn)所降維數(shù)對向下和向右這兩個動作的影響較小。這說明這兩個動作有非常明顯的特征,更容易被識別出來。對于向左這個動作,其動作特征不是特別明顯,需要較多的特征值來描述這個動作。通過對維數(shù)的分析可以得出,對于4個姿態(tài)動作,在維數(shù)為6時,不僅不會影響識別率,而且不會因為維數(shù)過大影響計算速度。在利用協(xié)作稀疏表示分類器識別動態(tài)手勢過程中,對訓練樣本個數(shù)進行研究時,我們將維數(shù)設置為6維。
圖4 12組手勢動作
表1 維數(shù)對姿態(tài)手勢識別率的影響 %
表2是在對ACC信號識別姿態(tài)手勢的過程中,對訓練字典中每個動作的樣本個數(shù)進行研究的結(jié)果。由表2可知,當訓練樣本數(shù)少于7時,訓練樣本數(shù)的變化沒有引起識別率的顯著變化。當訓練樣本數(shù)增加至9時,總體識別率有明顯提高,達到98.33%,其中,向上動作的識別準確率相較于其他幾個動作要差一些。在訓練樣本數(shù)增至10時,總體識別率可以達到最佳效果,其中訓練樣本數(shù)對向上這個動作的影響最大。
表2 樣本個數(shù)對姿態(tài)手勢識別率的影響 %
為了驗證協(xié)作稀疏表示分類器識別姿態(tài)手勢的識別效果,分別針對向上、向下、向左、向右四個單獨的姿態(tài)動作,將所提的方法與經(jīng)典的DTW算法進行了識別效果比較,如圖5所示。圖中A、B、C、D分別表示向上、向下、向左、向右這4個動作。協(xié)作稀疏表示分類器對4個姿態(tài)動作的識別效果到達96.88%,計算時間為0.121 4 s;而DTW算法的平均識別率為94.375%,計算時間為132.365 9 s。相對于DTW算法,所提方法識別率高,計算時間短,速度快,因此協(xié)作稀疏表示算法對姿態(tài)信號的手勢識別具有一定優(yōu)勢。
圖5 姿態(tài)動作的識別方法對比
3.2.2 手勢識別結(jié)果
對于動態(tài)手勢的識別率,通過分析姿態(tài)手勢和手形手勢識別的準確率,來找出影響動態(tài)手勢識別的因素。圖6中橫坐標A~L分別表示12組動態(tài)手勢,柱狀圖分別表示了12組動作在手形、姿態(tài)上的平均識別率。由圖6可知,手形手勢的識別結(jié)果較好,除了剪刀手動作外,其他手形識別率都達到了100%,手形手勢的平均識別率為99.17%,與之前工作研究中所用的模板匹配法相比,手形手勢識別率提高了3.11%;在ACC信號分類的姿態(tài)手勢中,握拳向下、握拳向左以及張手向右的識別結(jié)果相對較差,但是該組手勢識別中,姿態(tài)手勢平均識別率達到96.67%,與文獻[12]的稀疏表示算法相比,協(xié)作稀疏表示算法訓練樣本數(shù)減少,但識別率并未降低,簡化了手勢識別方法。
圖6 手勢識別準確率
表3是動態(tài)手勢識別的混淆矩陣,該混淆矩陣中的A~L表述了12組動態(tài)手勢的識別結(jié)果。融合加速度和肌電信號的12組動態(tài)手勢的平均識別率達到96.11%。由表可知,握拳向上、握拳向左、張手向下等動作的識別效果較好,但是也有部分動作如握拳向下等識別效果較差,在后續(xù)工作將進一步探究其原因。
本文提出了一種新的融合多傳感器信息的手勢識別方法,用12個動態(tài)手勢對該方法進行了識別與驗證,兩種不同類型的信號分別用兩種不同的識別方法來分類。對于姿態(tài)信號的識別,在稀疏表示的基礎上,提出協(xié)作稀疏表示算法識別姿態(tài)信號,相比于前者,該方法可以在較少訓練樣本的情況下,實現(xiàn)較高的識別率,而且計算速度快,實驗中姿態(tài)信號的平均識別率達到96.67%。對于手形手勢的識別,其中使用滑動平均能量的方法分割手勢活動段,并用平均絕對值提取特征,用優(yōu)化的DTW算法計算測試樣本與訓練樣本的匹配距離,最后用KNN分類器分類手形手勢;對于12組動態(tài)手勢的手形,識別率能夠達到99.17%。融合后的12個動態(tài)手勢的平均識別率為96.11%,達到了較好的識別效果;而且該識別方法簡單方便,可以將該方法用于實際生活中。在今后的工作中,我們將繼續(xù)對動態(tài)手勢進行研究與探討,會通過增加陀螺儀來識別旋轉(zhuǎn)類手勢。
表3 動態(tài)手勢識別的混淆矩陣
References)
[1] THALMIC LABS. Myo user guide [EB/OL]. [2015- 12- 26]. https://developer.thalmic.com/downloads.
[2] WANG J S, HSU Y L, LIU J N. An inertial-measurement-unit-based pen with a trajectory reconstruction algorithm and its applications [J]. IEEE Transactions on Industrial Electronics, 2010, 57(10): 3508-3521.
[3] HUANG G, ZHANG D, ZHENG X, et al. An EMG-based handwriting recognition through dynamic time warping [C]// Proceedings of the 2010 Annual International Conference of the IEEE Engineering in Medicine and Biology. Piscataway, NJ: IEEE, 2010: 4902-4905.
[4] WU J, TIAN Z, SUN L, et al. Real-time American sign language recognition using wrist-worn motion and surface EMG sensors [C]// Proceedings of the 2015 IEEE 12th International Conference on Wearable and Implantable Body Sensor Networks. Piscataway, NJ: IEEE, 2015: 1-6.
[5] WEI S, CHEN X, YANG X, et al. A component-based vocabulary-extensible sign language gesture recognition framework [J]. Sensors, 2016, 16(4): 556.
[6] HSU Y L, CHU C L, TSAI Y J, et al. An inertial pen with dynamic time warping recognizer for handwriting and gesture recognition [J]. IEEE Sensors Journal, 2014, 15(1): 154-163.
[7] AKL A, CHEN F, VALAEE S. A novel accelerometer-based gesture recognition system [J]. IEEE Transactions on Signal Processing, 2011, 59(12): 6197-6205.
[8] BOYALI A, HASHIMOTO N. Spectral collaborative representation based classification for hand gestures recognition on electromyography signals [J]. Biomedical Signal Processing and Control, 2016, 24: 11-18.
[9] LINDERMAN M, LEBEDEV M A, ERLICHMAN J S. Recognition of handwriting from electromyography [J]. PLOS One, 2009, 4(8): e6791.
[10] KIM S, PARK G, YIM S, et al. Gesture-recognizing hand-held interface with vibrotactile feedback for 3D interaction [J]. IEEE Transactions on Consumer Electronics, 2009, 55(3): 1169-1177.
[11] WANG J S. CHUANG F C. An accelerometer-based digital pen with a trajectory recognition algorithm for handwritten digit and gesture recognition [J]. IEEE Transactions on Industrial Electronics, 2012, 59(7): 2998-3007.
[12] WANG H, LI Z. Accelerometer-based gesture recognition using dynamic time warping and sparse representation [J]. Multimedia Tools and Applications, 2016, 75(14): 8637-8655.
[13] GUPTA H P, CHUDGAR H S, MUKHERJEE S, et al. A continuous hand gestures recognition technique for human-machine interaction using accelerometer and gyroscope sensor [J]. IEEE Sensors Journal, 2016, 16(16): 6425-6432.
[14] CHANG W, DAI L, SHENG S, et al. A hierarchical hand motions recognition method based on IMU and sEMG sensors [C]// Proceedings of the 2015 IEEE International Conference on Robotics and Biomimetics. Piscataway, NJ: IEEE, 2015: 1024-1029.
[15] LI Y, CHEN X, ZHANG X, et al. A sign-component-based framework for Chinese sign language recognition using accelerometer and sEMG data [J]. IEEE Transactions on Biomedical Engineering, 2012, 59(10) : 2695-2704.
[16] GEORGI M ,AMMA C, SCHULTZ T. Fusion and comparison of IMU and EMG signals for wearable gesture recognition [C]// Biomedical Engineering System and Technology, CCIS 574. Berlin: Springer, 2015: 308-323.
[17] WRIGHT J, YANG A Y, GANESH A, et al. Robust face recognition via sparse representation [J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2009, 31(2): 210-227.
[18] ZHANG L, YANG M, FENG X, et al. Collaborative representation based classification for face recognition [EB/OL]. [2016- 11- 20]. https://www.researchgate.net/publication/223466657_Collaborative_Representation_based_Classification_for_Face_Recognition.
[19] 劉敬偉,徐美芝,鄭忠國,等.基于DTW的語音識別和說話人識別特征選擇[J].模式識別與人工智能,2005,18(1):4-8.(LIU J W, XU M Z, ZHENG Z G, et al. DTW-based feature selection for speech recognition and speaker recognition [J]. Pattern Recognition and Artificial Intelligence, 2005, 18(1): 50-54.
[20] LOU Y, AO H, DONG Y. Improvement of Dynamic Time Warping (DTW) algorithm [C]// Proceedings of the 2015 14th International Symposium on Distributed Computing and Applications for Business Engineering and Science. Washington, DC: IEEE Computer Society, 2015: 384-387.
DynamicgesturerecognitionmethodbasedonEMGandACCsignal
XIE Xiaoyu, LIU Zhejie*
(CollegeofPhysicsandOptoelectronics,TaiyuanUniversityofTechnology,TaiyuanShanxi030024,China)
To enhance the diversity and simplicity of hand gesture recognition, an approach based on ElectroMyoGraphy (EMG) and ACCeleration(ACC) signals was proposed to recognize dynamic gestures. Firstly, the gesture related information was collected by MYO sensors. Then, the dimensionality of ACC signal was reduced and the preprocessing of EMG was done. Finally, to reduce the number of training samples,the posture based on ACC signal was recognized by using Collaborative Sparse Representation (CSR) and the gesture based on EMG signal was classified by using Dynamic Time Warping (DTW) algorithm and theK-Nearest Neighbor (KNN) Classifier. When the ACC signal was identified by using CSR, the optimal number of samples and the dimensions of the dimensionality reduction were studied to reduce the complexity of gesture recognition. The experimental results show that the average recognition accuracy of the EMG for the hand gesture tested reaches 99.17%; the ACC signal for four postures achieve 96.88%. The recognition accuracy for the 12 dynamic gestures reaches 96.11%. This method has high recognition accuracy and fast calculation speed for dynamic gestures.
gesture recognition; Collaborative Sparse Representation (CSR); ElectroMyoGraphy (EMG); Dynamic Time Warping (DTW) algorithm; ACCeleration(ACC)
2017- 03- 29;
2017- 05- 24。
國家自然科學基金資助項目(61274089);山西省國際合作項目(2014081029-2)。
謝小雨(1992—),女,湖北荊州人,碩士研究生,主要研究方向:手勢識別、模式識別、機器學習、微磁傳感器; 劉喆頡(1959—),男,江蘇南京人,教授,博士,主要研究方向:磁存儲、數(shù)據(jù)挖掘。
1001- 9081(2017)09- 2700- 05
10.11772/j.issn.1001- 9081.2017.09.2700
TP391.4
A
This work is partially supported by National Natural Science Foundation of China (61274089),the International Cooperation Projects in Shanxi Province (2014081029-2).
XIEXiaoyu, born in 1992, M. S. candidate. Her research interests include gesture recognition,pattern recognition,machine learning, micro-magnetic sensor.
LIUZhejie, born in 1959, Ph. D., professor. His research interests include magnetic storage, data mining.