薛亞許 楊 光 杜豪杰 王雪晴
(平頂山學(xué)院電氣與機(jī)械工程學(xué)院 河南 平頂山 467000)
SEMG是通過(guò)電極采集淺層肌肉和神經(jīng)干活動(dòng)在皮膚表面的生物電信號(hào),并將其記錄、濾波、放大、傳輸和反饋,從而實(shí)現(xiàn)肌肉功能的評(píng)定和模擬[1]。由于人手在進(jìn)行物體操作過(guò)程中的SEMG信號(hào)較微弱,易受干擾(噪聲、電磁干擾等),測(cè)量難度大,如何有效地對(duì)其進(jìn)行信號(hào)采集、特征提取和不同人手動(dòng)作的分類已成為實(shí)現(xiàn)手勢(shì)識(shí)別的關(guān)鍵。
目前常用的SEMG信號(hào)采集裝置,大多采用導(dǎo)線傳輸?shù)姆绞綄⒉杉降腟EMG信號(hào)存儲(chǔ)到數(shù)據(jù)采集卡或特定的醫(yī)療器械中進(jìn)行分析處理,電極片貼附于目標(biāo)肌肉的表面,并采用市電作為電極供電電源[2]。因此,這些采集裝置在SEMG信號(hào)采集過(guò)程中不可避免地存在著電極移位、工頻干擾和電磁干擾等顯著缺點(diǎn)。
人手對(duì)物體的操作是通過(guò)手指、手掌之間協(xié)調(diào)完成,多通道SEMG信號(hào)采集可保證整體人手運(yùn)動(dòng)狀態(tài)中肌電活動(dòng)的信息復(fù)雜性。Xue等[3]采用6種典型的時(shí)域特征提取多模態(tài)感知信號(hào),結(jié)合ADAG算法實(shí)現(xiàn)對(duì)十種人手動(dòng)作的識(shí)別,平均識(shí)別率達(dá)到了94.57%。Wang等[4]提取加速度信號(hào)中的頻域特征,通過(guò)概率神經(jīng)網(wǎng)絡(luò)對(duì)十種手勢(shì)動(dòng)作進(jìn)行識(shí)別,識(shí)別率達(dá)到了98.75%。Chen等[5]結(jié)合三種特征類型的六種特征,對(duì)八種常見的康復(fù)訓(xùn)練手勢(shì)通過(guò)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別,其中,DAMV+IAV+AR的特征組合獲得的識(shí)別率最高,為97.71%。
為了能夠精確地實(shí)現(xiàn)對(duì)人手手內(nèi)動(dòng)作的識(shí)別,各種各樣的分類器比如神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和隱馬爾可夫模型等被應(yīng)用于SEMG信號(hào)的處理。實(shí)驗(yàn)結(jié)果表明了這些分類器都能夠獲得較高的動(dòng)作分類精度,但較為復(fù)雜的結(jié)構(gòu)可能會(huì)增加訓(xùn)練和測(cè)試時(shí)的時(shí)間和空間復(fù)雜度[6-9]。此外,它們大多針對(duì)無(wú)操作物情況下的單個(gè)肌肉收縮引起的動(dòng)作分類,而多肌肉收縮結(jié)合的人手手內(nèi)物體操作動(dòng)作識(shí)別以及SEMG信號(hào)的不確定性比如肌肉疲勞、不同實(shí)驗(yàn)人員等尚未考慮在內(nèi)。
SEMG信號(hào)由于具有高度非線性和非平穩(wěn)特性,因此有必要采用非線性動(dòng)態(tài)方法來(lái)表征SEMG信號(hào)。經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)算法是一種新型自適應(yīng)信號(hào)時(shí)頻處理方法,特別適用于非線性非平穩(wěn)信號(hào)的分析處理。Lyapunov指數(shù)(LE)分析方法具有描述非平穩(wěn)信號(hào)的非線性特性能力,被廣泛應(yīng)用于混沌系統(tǒng)的信號(hào)檢測(cè),比如腦電信號(hào)、SEMG信號(hào)和電弧電壓信號(hào)等。文獻(xiàn)[10-11]已經(jīng)證實(shí)了LE分析方法可以檢測(cè)肌肉疲勞等不確定性因素下引起的SEMG變化。隨機(jī)森林(RF)作為一種非線性分類器,其結(jié)構(gòu)模型較簡(jiǎn)單、參數(shù)少和訓(xùn)練速度快等特點(diǎn),對(duì)于非線性SEMG 數(shù)據(jù)集進(jìn)行回歸和分類,能夠取得較好的效果。通過(guò)對(duì)國(guó)內(nèi)外相關(guān)文獻(xiàn)的查閱發(fā)現(xiàn),很少有研究人員采用EMD+MLE+RF方法來(lái)分析復(fù)雜人手手內(nèi)動(dòng)作。基于此,本文提出一種基于SEMG的人手手內(nèi)動(dòng)作識(shí)別系統(tǒng),通過(guò)EMD+MLE+RF的非線性時(shí)序分析方法實(shí)現(xiàn)對(duì)十種自定義的復(fù)雜人手動(dòng)作的識(shí)別。
本文提出一種基于SEMG的人手手內(nèi)動(dòng)作識(shí)別系統(tǒng)用于假肢手控制,如圖1所示,其中Ch1-Ch6為采集通道,通過(guò)這六個(gè)通道來(lái)采集肌電信號(hào)。該系統(tǒng)主要分為五個(gè)部分:人體上肢、數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、特征提取、識(shí)別算法。
圖1 人手手內(nèi)動(dòng)作識(shí)別系統(tǒng)框圖
首先,SEMG采集裝置獲取十種定義的復(fù)雜人手動(dòng)作信號(hào);然后對(duì)采集的原始SEMG信號(hào)進(jìn)行預(yù)處理和特征提??;最后通過(guò)識(shí)別算法對(duì)提取的特征進(jìn)行動(dòng)作分類,并驗(yàn)證其識(shí)別性能。
(1) 人體上肢:考慮到不同的操作任務(wù)涉及不同的抓取點(diǎn)、手指數(shù)、操作習(xí)慣等要素,為了更好地具有普適性,本文統(tǒng)一采用受試人員的右手作為測(cè)試手。受試人員的測(cè)試手沒(méi)有過(guò)往神經(jīng)病史,以保證信號(hào)采集的真實(shí)有效性。
(2) 數(shù)據(jù)采集及處理:SEMG采集裝置用于獲取十種典型的復(fù)雜人手動(dòng)作信號(hào),EMD算法首先對(duì)原始信號(hào)進(jìn)行降噪處理,然后MLE算法對(duì)降噪后信號(hào)進(jìn)行特征提取,從而獲得用于人手動(dòng)作分類的特征集。
(3) 動(dòng)作識(shí)別:采用隨機(jī)森林算法對(duì)特征集進(jìn)行動(dòng)作分類,并同其他機(jī)器學(xué)習(xí)算法比較,驗(yàn)證其效果。
為了有效地采集包括轉(zhuǎn)移、平移、旋轉(zhuǎn)等經(jīng)典手部特征動(dòng)作,并結(jié)合常用的動(dòng)作,本文設(shè)計(jì)了十種人手手內(nèi)動(dòng)作,如圖2所示。本實(shí)驗(yàn)選取了十名健康的受試人員來(lái)參與數(shù)據(jù)的采集,其中8名為男性,2名為女性,平均年齡為25±3.6歲,身高為168±13 cm,體重為63±15.4 kg。每位受試人員對(duì)每種動(dòng)作執(zhí)行十次,在完成一種動(dòng)作后,將有兩分鐘的休息時(shí)間,以避免肌肉疲勞對(duì)采集正確信號(hào)的干擾。
圖2 十種自定義人手手內(nèi)動(dòng)作
本實(shí)驗(yàn)采用的ELONXI SEMG采集系統(tǒng)將采集到的SEMG信號(hào)通過(guò)無(wú)線傳輸?shù)缴衔粰C(jī)進(jìn)行分析處理。該系統(tǒng)主要包括肌電儀主設(shè)備、電極袖套、通用電極接口轉(zhuǎn)換器、藍(lán)牙適配器和電極連線。采樣電極通過(guò)電極袖套固定,避免了電極移位。采用通用電極接口轉(zhuǎn)換器實(shí)現(xiàn)電極供電,避免了工頻干擾。十種自定義人手手內(nèi)動(dòng)作的采集過(guò)程為:首先,電極袖套正確套在右前臂,通過(guò)電極連接接口與肌電儀主設(shè)備;然后由藍(lán)牙模塊將6通道的肌電信號(hào)上傳至上位機(jī)。該系統(tǒng)的分辨率為16位,采樣頻率位1 024 Hz。
經(jīng)驗(yàn)?zāi)B(tài)分解算法最早是由Huang等[12]提出的一種用于分析非線性、非平穩(wěn)信號(hào)的自適應(yīng)信號(hào)分解數(shù)據(jù)處理方法。該算法具有良好的時(shí)頻分辨率和自適應(yīng)性,通過(guò)對(duì)原始信號(hào)的分解,將噪聲和有效信號(hào)在不同的固有模態(tài)函數(shù)(IMF)中分離,選擇合理的IMF重構(gòu)信號(hào),不但可以完美重構(gòu)原始信號(hào),而且還能有效地去除噪聲。因此,結(jié)合SEMG信號(hào)的特性,采用EMD算法進(jìn)行信號(hào)去噪是一種理想的選擇[13]。假設(shè)SEMG信號(hào)的原始數(shù)據(jù)序列為X(t),t=1,2,…,6,該算法的具體實(shí)現(xiàn)過(guò)程如算法1所示。
算法1SEMG信號(hào)去噪的EMD算法
1. 求取X(t)的所有極值點(diǎn)P(t)={Pmin(t),Pmax(t)}
2. 用插值法對(duì)極小值點(diǎn)擬合為下包絡(luò),即Pmin(t)→Emin(t);對(duì)極大值點(diǎn)擬合為上包絡(luò),即Pmax(t)→Emax(t)
3. 計(jì)算包絡(luò)均值A(chǔ)(t)=(Emin(t)+Emax(t))/2
4. 獲取平穩(wěn)數(shù)據(jù)序列S(t)=X(t)-A(t)
5. 對(duì)殘余的A(t)重復(fù)步驟1-步驟4,得到第一個(gè)IMF分量CIMF(1)
6. 產(chǎn)生新數(shù)據(jù)序列D(1)=X(t)-CIMF(1),對(duì)D(1)重復(fù)步驟1-步驟5,得到第二個(gè)IMF分量CIMF(2)
7. 重復(fù)步驟1-步驟6,直到最后一個(gè)數(shù)據(jù)序列D(n)不可分解,得到IMF集{CIMF(1),CIMF(2),…,CIMF(n)}
如算法1所示,在每個(gè)通道信號(hào)中執(zhí)行EMD后,得到一組固有模態(tài)函數(shù)集為:
(1)
式中:δn為原始EMG信號(hào)提取n個(gè)CIMF后的殘差。經(jīng)過(guò)EMD算法去噪處理后得到的數(shù)據(jù)信號(hào)很好地保證了對(duì)真實(shí)動(dòng)作信號(hào)的特征提取。
Lyapunov指數(shù)表示相空間中無(wú)限接近的相鄰軌跡的平均指數(shù)變化速率,是用于識(shí)別動(dòng)態(tài)混沌系統(tǒng)中的數(shù)值特征,可有效表征變量隨時(shí)間演化時(shí)系統(tǒng)對(duì)初值的敏感性[15]。N維系統(tǒng)具有N個(gè)Lyapunov指數(shù),從而形成指數(shù)譜。當(dāng)系統(tǒng)維度L較大時(shí),為了減少計(jì)算量,通過(guò)計(jì)算最大的Lyapunov指數(shù)(MLE)來(lái)決定動(dòng)態(tài)系統(tǒng)的可預(yù)測(cè)性。MLE不僅是區(qū)分混沌吸引子的重要指標(biāo),也是初值敏感性的定量描述,因此其被廣泛應(yīng)用于機(jī)器故障診斷、肌肉收縮和肌肉活動(dòng)檢測(cè)等,它的定義為:
(2)
式中:L(tk)表示tk時(shí)刻最鄰近零點(diǎn)之間的距離;M為總步長(zhǎng);Δt表示獲取MLE 的采樣時(shí)間。相鄰軌道的距離通常乘以對(duì)數(shù)尺度上的預(yù)測(cè)誤差,以獲得整組固有模態(tài)函數(shù)集上的Lyapunov指數(shù),其定義為:
(3)
式中:N為總的相位點(diǎn);Δn為相位點(diǎn)Xn和Xn+1之間的距離(Xn+1是最接近Xn的點(diǎn));b1表示第一個(gè)Lyapunov指數(shù);Γn(k)是經(jīng)過(guò)k次卷積步長(zhǎng)后Xn與Xn+1之間的距離。在p(k)-k圖線中,直線的斜率即為MLE。在本實(shí)驗(yàn)中,重疊窗口的長(zhǎng)度為500 ms,窗口之間的遞增量為125 ms。SEMG信號(hào)中比較典型的特征比如延遲時(shí)間和嵌入維數(shù)是計(jì)算Lyapunov指數(shù)非常重要的兩個(gè)參數(shù)。延遲時(shí)間和嵌入維數(shù)非常適合表示SEMG手勢(shì)時(shí)間序列數(shù)據(jù)的動(dòng)態(tài)行為,因此選擇這兩種特征參數(shù)以表征SEMG信號(hào)的運(yùn)動(dòng)特性。
延遲時(shí)間采用互信息方法來(lái)確定,其定義為:
(4)
式中:p(Yn)、p(Yn+τ)和p(Yn,Yn+τ)均為概率值。在H(τ)-τ圖線中,τ對(duì)應(yīng)出現(xiàn)的第一個(gè)局部最小值。
嵌入維數(shù)的計(jì)算采用偽鄰居法來(lái)確定,其定義為:
(5)
式中:E(m)和E(m+1)分別是重建m維空間和m+1維空間中所有兩個(gè)最近鄰居的距離的平均閾值。在E1(m)-m圖線中,當(dāng)E1(m)的值隨著m的增加而沒(méi)有顯著變化時(shí),最小的嵌入維數(shù)值則為所要選取的E1(m)。通過(guò)式(2)和式(3)得到的MLE特征向量將由隨機(jī)森林分類器進(jìn)行動(dòng)作識(shí)別。
隨機(jī)森林作為一種有監(jiān)督學(xué)習(xí)算法,是基于Bagging框架下的決策樹模型。隨機(jī)森林算法由于實(shí)現(xiàn)簡(jiǎn)單、精度高、抗過(guò)擬合能力強(qiáng)和具有一定的抗噪聲能力等優(yōu)點(diǎn),被廣泛應(yīng)用于生物醫(yī)學(xué)、電子商務(wù)、人機(jī)交互等領(lǐng)域的分類和回歸任務(wù)[16]。隨機(jī)森林分類器由一組樹分類器組成,其中每個(gè)樹分類器由獨(dú)立于輸入向量采樣的隨機(jī)向量生成,并且以投票的方式?jīng)Q定最優(yōu)分類,其原理如圖3所示。
圖3 隨機(jī)森林算法原理圖
對(duì)于一個(gè)有K類的訓(xùn)練集M,隨機(jī)選擇一個(gè)特征并投票屬于第k類的概率為:
(6)
(7)
式中:f(ki,M)/|M|表示選擇的特征屬于第k類的概率,對(duì)式(6)進(jìn)行簡(jiǎn)化處理后為:
(8)
需要注意的是,每棵樹的訓(xùn)練集雖然不同,但包含重復(fù)的訓(xùn)練樣本。每棵樹都最大限度地生長(zhǎng),并且沒(méi)有剪枝過(guò)程。每個(gè)節(jié)點(diǎn)用于生成樹的特征數(shù)量和要生長(zhǎng)的樹的數(shù)量是生成隨機(jī)森林分類器所需的兩個(gè)用戶自定義參數(shù)。
考慮到SEMG信號(hào)的非線性動(dòng)態(tài)信號(hào),SEMG原始信號(hào)經(jīng)過(guò)降噪預(yù)處理,被分解為一組IMFs,如圖4所示??梢钥闯鲈夹盘?hào)X(t)被分解為CIMF(j),j=1,2,…,6和偏差δn。CIMF(j)是具有不同振幅和頻率的振蕩函數(shù)。δn是一條單調(diào)信號(hào),表明原始信號(hào)X(t)減去所有CIMF(j)后得到的漂移分量已經(jīng)不滿足分解條件。
圖4 SEMG信號(hào)的EMD分解
延遲時(shí)間和嵌入維數(shù)是計(jì)算Lyapunov指數(shù)非常重要的兩個(gè)參數(shù)。所選擇的延遲時(shí)間過(guò)大或過(guò)小,都不利于SEMG信號(hào)的優(yōu)化。采用互信息方法獲得的延遲時(shí)間τ如圖5所示??梢钥闯靓?5時(shí)對(duì)應(yīng)出現(xiàn)的第一個(gè)局部最小值用于空間重建。
圖5 SEMG信號(hào)的延遲時(shí)間
圖6表示采用偽鄰居法獲取的嵌入維數(shù)值??梢钥闯?,從m=9開始,E1(m)隨著m的增加沒(méi)有發(fā)生顯著變化,并逐漸趨近于1。因此,本實(shí)驗(yàn)中選取的最小嵌入維數(shù)值為9用于拓?fù)渲亟ā?/p>
圖6 SEMG信號(hào)的嵌入維數(shù)
為了驗(yàn)證人手動(dòng)作識(shí)別系統(tǒng)的識(shí)別性能,圖7為采用RF分類器得到的十種動(dòng)作的識(shí)別率。所有動(dòng)作的整體平均識(shí)別率為91.67%。黑色部分為每一種動(dòng)作的平均識(shí)別率,其余的為兩種不同動(dòng)作之間的誤差率。整體來(lái)看,所有動(dòng)作的識(shí)別率均超過(guò)了90%,反映了該系統(tǒng)的良好分類性能。其中:動(dòng)作8和動(dòng)作10的識(shí)別率最低只有90%;而動(dòng)作4和動(dòng)作5的識(shí)別率最高達(dá)到了94%。此外,動(dòng)作2和動(dòng)作6的識(shí)別率雖然都達(dá)到了91%,但它們之間的誤差率,以及動(dòng)作6和動(dòng)作8之間的誤差率最高,均為6%。相比較而言,其他動(dòng)作之間的誤差率分布在1%到5%之間。
圖7 十種人手動(dòng)作的識(shí)別率混合矩陣
不同的受試人員,由于其物體操作習(xí)慣和抓取方式不同,使得對(duì)于相同的動(dòng)作,可以采取多種操作方法來(lái)實(shí)現(xiàn)穩(wěn)定抓取。雖然受試人員在進(jìn)行實(shí)驗(yàn)前,對(duì)動(dòng)作要求包括抓取方式、抓取點(diǎn)和參與手指數(shù)等經(jīng)過(guò)嚴(yán)格的培訓(xùn),但其人手運(yùn)動(dòng)狀態(tài)中的肌電活動(dòng)信息仍存在個(gè)體差異。因此,有必要研究不同受試人員因個(gè)體差異對(duì)相同動(dòng)作的識(shí)別結(jié)果的影響。如圖8所示,不同受試人員的識(shí)別率為十種人手動(dòng)作的平均識(shí)別率,不同條形柱上面的方差棒,側(cè)面反映了不同受試人員對(duì)不同動(dòng)作識(shí)別率的差異性。其中:受試人員5的識(shí)別率最低,僅有89.12%;受試人員6的平均識(shí)別率最高,為94.23%。此外,受試人員2和人員8的識(shí)別率波動(dòng)范圍較大,其最大誤差率分別達(dá)到了12.67%和20.45%??傮w而言,絕大部分受試人員的識(shí)別率均在90%以上。研究結(jié)果表明,個(gè)體差異對(duì)SEMG信號(hào)的分析會(huì)產(chǎn)生一定的影響。
圖8 不同受試人員的動(dòng)作識(shí)別率
為了驗(yàn)證基于隨機(jī)森林算法的人手動(dòng)作識(shí)別效果,本實(shí)驗(yàn)選擇與支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)兩種傳統(tǒng)的機(jī)器學(xué)習(xí)算法進(jìn)行比較。支持向量機(jī)是一種采用監(jiān)督學(xué)習(xí)方式,通過(guò)對(duì)數(shù)據(jù)樣本尋找超平面獲得最大間隔以實(shí)現(xiàn)二元分類的機(jī)器學(xué)習(xí)算法。神經(jīng)網(wǎng)絡(luò)是一種模擬人腦神經(jīng)網(wǎng)絡(luò)行為特征,通過(guò)調(diào)整隱藏層節(jié)點(diǎn)之間相互連接的權(quán)重,實(shí)現(xiàn)對(duì)數(shù)據(jù)樣本進(jìn)行分類的機(jī)器學(xué)習(xí)算法。這兩種算法已經(jīng)被廣泛應(yīng)用于信息處理和模式識(shí)別等領(lǐng)域。在進(jìn)行實(shí)驗(yàn)之前,需要對(duì)支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)兩種分類器選擇相應(yīng)的核函數(shù)和參數(shù),以保證其分類性能。支持向量機(jī)采用高斯核函數(shù)作為本次實(shí)驗(yàn)的核函數(shù),懲罰參數(shù)C和核半徑γ的值為(C,γ)=(1,0.021 6)。神經(jīng)網(wǎng)絡(luò)采用恒等激活函數(shù),輸入層節(jié)點(diǎn)數(shù)I、隱藏層節(jié)點(diǎn)數(shù)H和輸出層節(jié)點(diǎn)數(shù)O的值為(I,H,O)=(2,7,10)。
圖9為基于三種機(jī)器學(xué)習(xí)算法得到的人手動(dòng)作識(shí)別結(jié)果的比較?;赟VM和NN的平均識(shí)別率分別為90.89%和89.1%,均低于基于RF分類器91.67%的平均識(shí)別率。三種算法對(duì)動(dòng)作1的識(shí)別率較為接近,SVM算法對(duì)動(dòng)作7和動(dòng)作8的識(shí)別率最高,NN算法對(duì)所有動(dòng)作的識(shí)別率最低。標(biāo)準(zhǔn)差反映了不同算法對(duì)相同人手動(dòng)作識(shí)別率的波動(dòng)情況,其中基于SVM的波動(dòng)幅度較為明顯,其余兩種的較為平緩。就整體而言,本文所采取的基于RF的人手動(dòng)作識(shí)別率最高,優(yōu)于其余兩種,具有良好的分類性能。
圖9 基于不同算法的識(shí)別率比較
本文采用非線性時(shí)序分析方法,提出一種基于SEMG的人手手內(nèi)動(dòng)作識(shí)別系統(tǒng)。該系統(tǒng)包括人體上肢、數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、特征提取、識(shí)別算法五個(gè)部分,并從人體上肢、數(shù)據(jù)采集及處理和動(dòng)作識(shí)別三個(gè)方面進(jìn)行了詳細(xì)的介紹。在數(shù)據(jù)采集及處理方面,采用非線性時(shí)序分析方法包括EMD法和MLE法對(duì)SEMG信號(hào)進(jìn)行信號(hào)處理,獲得真實(shí)有效的動(dòng)作特征。在動(dòng)作識(shí)別方面,采用RF算法進(jìn)行人手手內(nèi)動(dòng)作識(shí)別,分析了不同受試人員對(duì)識(shí)別率的影響,并與SVM和NN算法進(jìn)行比較,驗(yàn)證了RF算法的優(yōu)越性,識(shí)別率達(dá)到了91.67%。未來(lái)的研究將基于所提出的方案開發(fā)實(shí)時(shí)人手手內(nèi)動(dòng)作識(shí)別系統(tǒng),并將人手操作技巧轉(zhuǎn)移到假肢手上。