周鈞鍇 王 念 崔 莉
1(中國(guó)科學(xué)院計(jì)算技術(shù)研究所 北京 100190)
2(中國(guó)科學(xué)院大學(xué) 北京 100190)
(zjk934865517@163.com)
隨著科技的發(fā)展,物聯(lián)網(wǎng)對(duì)于社會(huì)的重要性日益增加,物聯(lián)網(wǎng)的應(yīng)用和技術(shù)挑戰(zhàn)也不斷拓展.其中基于含噪一維物聯(lián)網(wǎng)時(shí)序信號(hào)的有效活動(dòng)區(qū)間起止點(diǎn)識(shí)別問(wèn)題受到了關(guān)注,例如基于加速度信號(hào)的運(yùn)動(dòng)區(qū)間識(shí)別、基于聲音信號(hào)的語(yǔ)音識(shí)別和基于肌電等生理信號(hào)的臨床運(yùn)動(dòng)信息采集等.但是在物聯(lián)網(wǎng)實(shí)際應(yīng)用中,原始采集信號(hào)數(shù)據(jù)中多含有大量的噪聲,特別是在運(yùn)動(dòng)相關(guān)場(chǎng)景里,大量噪聲的存在會(huì)干擾信號(hào)活動(dòng)區(qū)間起止點(diǎn)的識(shí)別準(zhǔn)確性.傳統(tǒng)的人工標(biāo)記方法[1]成本高且操作繁瑣.為降低標(biāo)記成本,有研究者提出了能夠自動(dòng)標(biāo)記信號(hào)活動(dòng)起止時(shí)間點(diǎn)的雙閾值法[2],但是雙閾值法對(duì)于信號(hào)中的噪聲十分敏感,難以滿(mǎn)足對(duì)多樣化的數(shù)據(jù)集和數(shù)據(jù)段的差異化信號(hào)進(jìn)行標(biāo)記的需求.于是一些研究者提出了基于機(jī)器學(xué)習(xí)[3]或者深度學(xué)習(xí)[4]的活動(dòng)區(qū)間識(shí)別方法.該類(lèi)方法對(duì)原始信號(hào)進(jìn)行特征提取并據(jù)此訓(xùn)練分類(lèi)器來(lái)識(shí)別信號(hào)活動(dòng)區(qū)間.但此類(lèi)方法需要大量的訓(xùn)練樣本數(shù)據(jù),不適用于樣本量較小的場(chǎng)景.因此,研究一種抗噪聲干擾能力強(qiáng)且適合小樣本的高效準(zhǔn)確的信號(hào)活動(dòng)區(qū)間識(shí)別方法具有重要意義,本工作擬針對(duì)此問(wèn)題開(kāi)展.
基于一維時(shí)序信號(hào)的數(shù)據(jù)分析是物聯(lián)網(wǎng)場(chǎng)景中最為常見(jiàn)的應(yīng)用之一,例如基于表面肌電信號(hào)的手勢(shì)識(shí)別[5]和基于肌電信號(hào)的步態(tài)識(shí)別[6]等.基于一維時(shí)序信號(hào)的物聯(lián)網(wǎng)數(shù)據(jù)分析通常需要算法首先進(jìn)行信號(hào)活動(dòng)區(qū)間識(shí)別,之后方可基于區(qū)間的識(shí)別結(jié)果進(jìn)行后續(xù)的算法研究[7].如果活動(dòng)區(qū)間識(shí)別不精準(zhǔn),會(huì)導(dǎo)致后續(xù)分析無(wú)效等問(wèn)題.例如在基于肌電信號(hào)的臨床研究中[8],錯(cuò)誤的運(yùn)動(dòng)識(shí)別區(qū)間會(huì)導(dǎo)致待分析數(shù)據(jù)中引入無(wú)關(guān)信號(hào)和噪聲數(shù)據(jù)段的問(wèn)題,從而影響數(shù)據(jù)的可用性以及分析特征的有效性.因此,面向一維時(shí)序信號(hào)的活動(dòng)區(qū)間識(shí)別具有十分重要的研究意義.
目前已有的基于一維時(shí)序信號(hào)的信號(hào)活動(dòng)區(qū)間識(shí)別研究有3種類(lèi)型:
1) 人工標(biāo)記法.在該方法中,研究者根據(jù)原始信號(hào)對(duì)信號(hào)中的各個(gè)信號(hào)活動(dòng)區(qū)間的開(kāi)始時(shí)間點(diǎn)和結(jié)束時(shí)間點(diǎn)進(jìn)行手工標(biāo)記.但手工標(biāo)記方法會(huì)花費(fèi)大量的人力和時(shí)間成本,而且標(biāo)記結(jié)果會(huì)根據(jù)研究者的經(jīng)驗(yàn)呈現(xiàn)出不同程度的主觀(guān)誤差.此類(lèi)方法的人力和時(shí)間成本需要降低,同時(shí)信號(hào)活動(dòng)區(qū)間的識(shí)別精度也需要進(jìn)一步提升.
2) 雙閾值法.為實(shí)現(xiàn)信號(hào)活動(dòng)區(qū)間的自動(dòng)標(biāo)記從而達(dá)到降低人工和時(shí)間成本的目的,Wang等人[2]提出了DeepLap方法,該方法提出使用基于雙閾值的信號(hào)活動(dòng)區(qū)間識(shí)別方法進(jìn)行活動(dòng)區(qū)間識(shí)別.DeepLap利用高低2個(gè)閾值捕捉信號(hào)活動(dòng)區(qū)間的開(kāi)始時(shí)間點(diǎn)和結(jié)束時(shí)間點(diǎn),低閾值對(duì)于信號(hào)的微小擾動(dòng)十分敏感,因此可以用于捕捉細(xì)微的信號(hào)變化,達(dá)到提升信號(hào)活動(dòng)區(qū)間起止點(diǎn)識(shí)別靈敏度和精度的目的.該方法還設(shè)置了信號(hào)高閾值,該高閾值用于再次確定信號(hào)活動(dòng)區(qū)間的產(chǎn)生,從而有效減少短時(shí)噪聲尖峰的誤識(shí)別問(wèn)題.該方法的具體過(guò)程為:設(shè)置1個(gè)低閾值和1個(gè)高閾值,并將信號(hào)與低閾值和高閾值做比較.低閾值和高閾值確定方法是基于整體輸入信號(hào)的均值和方差進(jìn)行計(jì)算的,低閾值和高閾值的計(jì)算分別為
(1)
(2)
其中,Nall為整體區(qū)間信號(hào)的采樣點(diǎn)個(gè)數(shù),xi為第i個(gè)采樣點(diǎn)的信號(hào)值,k1,k2,k3,k4分別為不同的閾值確定系數(shù).
Fig. 1 Recognition method of signal activity interval based on double threshold圖1 基于雙閾值的信號(hào)活動(dòng)區(qū)間識(shí)別方法
當(dāng)信號(hào)值高于低閾值時(shí),將此時(shí)間點(diǎn)記錄為時(shí)間點(diǎn)1.當(dāng)信號(hào)值在始終不小于低閾值的情況下超越了高閾值時(shí),算法將時(shí)間點(diǎn)1作為信號(hào)活動(dòng)區(qū)間的開(kāi)始時(shí)間點(diǎn).當(dāng)信號(hào)值低于低閾值時(shí),算法將此時(shí)間點(diǎn)作為信號(hào)活動(dòng)區(qū)間的結(jié)束時(shí)間點(diǎn).DeepLap方法實(shí)現(xiàn)了信號(hào)活動(dòng)區(qū)間的自動(dòng)標(biāo)記,降低了人工和時(shí)間成本.但DeepLap是基于固定閾值的,對(duì)于物聯(lián)網(wǎng)數(shù)據(jù)集來(lái)說(shuō),不同運(yùn)動(dòng)時(shí)間段、不同運(yùn)動(dòng)屬性的信號(hào)之間固定閾值的最佳取值差異較大,難以適用于不同的數(shù)據(jù)集和數(shù)據(jù)段,這降低了信號(hào)活動(dòng)區(qū)間的識(shí)別精度.比如在含有大量噪聲的信號(hào)中,算法需要使用較高的方差和均值乘數(shù),否則會(huì)造成非噪聲的誤識(shí)別;而在含有少量噪聲的信號(hào)中,算法需要用到較低的方差和均值乘數(shù),否則會(huì)造成運(yùn)動(dòng)區(qū)間的忽略捕捉問(wèn)題.如圖1所示,由于信號(hào)中含有的噪聲較多,噪聲信號(hào)會(huì)提升整體信號(hào)的均值和方差.因此在雙閾值法中,基于全局信號(hào)均值和信號(hào)方差所計(jì)算出的低閾值和高閾值均會(huì)大于最優(yōu)低閾值和最優(yōu)高閾值.因此無(wú)法準(zhǔn)確識(shí)別出包含噪聲和多種運(yùn)動(dòng)的一維時(shí)序信號(hào)中的起始點(diǎn)和終止點(diǎn),造成了信號(hào)活動(dòng)區(qū)間遺漏識(shí)別的問(wèn)題.
3) 基于機(jī)器學(xué)習(xí)[3]或者深度學(xué)習(xí)[4]的活動(dòng)區(qū)間識(shí)別方法.該類(lèi)方法對(duì)原始信號(hào)進(jìn)行特征提取并據(jù)此訓(xùn)練分類(lèi)器來(lái)識(shí)別信號(hào)活動(dòng)區(qū)間.比如Yamaba等人[9]使用支持向量機(jī)模型實(shí)現(xiàn)運(yùn)動(dòng)分類(lèi);Korpela等人[10]提出了一種結(jié)合Dynamic Time Warping和k-NN的運(yùn)動(dòng)識(shí)別分類(lèi)模型;Nguyen等人[11]使用k-NN實(shí)現(xiàn)對(duì)不同行走類(lèi)型的分類(lèi)識(shí)別.基于傳統(tǒng)機(jī)器學(xué)習(xí)的活動(dòng)區(qū)間識(shí)別算法依賴(lài)于人工特征的提取,可能會(huì)造成原始信號(hào)的浪費(fèi).于是一些工作提出使用深度學(xué)習(xí)網(wǎng)絡(luò)直接利用原始一維時(shí)序信號(hào)識(shí)別運(yùn)動(dòng)區(qū)間,比如Quivira等人[12]使用LSTM利用肌電信號(hào)識(shí)別手指運(yùn)動(dòng);Lee等人[13]通過(guò)構(gòu)建一維的CNN實(shí)現(xiàn)了運(yùn)動(dòng)的分類(lèi)識(shí)別.基于深度學(xué)習(xí)的方法雖然提升了識(shí)別的精度,但它們需要大量的訓(xùn)練樣本數(shù)據(jù),而某些物聯(lián)網(wǎng)場(chǎng)景數(shù)據(jù)量較小,使用該類(lèi)方法通常會(huì)導(dǎo)致模型欠擬合,從而降低模型的泛化能力.
為了解決上述問(wèn)題,本研究提出了EasiLTOM:一種基于局部動(dòng)態(tài)閾值的信號(hào)活動(dòng)區(qū)間識(shí)別方法.該方法的特點(diǎn)是通過(guò)利用局部一維信號(hào)的均值和方差對(duì)不同段信號(hào)區(qū)域的動(dòng)態(tài)雙閾值進(jìn)行計(jì)算,并使用最短信號(hào)長(zhǎng)度對(duì)噪聲尖峰進(jìn)行過(guò)濾,從而使算法能夠適用于不同的信號(hào)環(huán)境,并且避免了局部噪聲信號(hào)對(duì)識(shí)別閾值的影響,減少了信號(hào)特點(diǎn)在不同運(yùn)動(dòng)和不同噪聲中存在差異所導(dǎo)致的信號(hào)活動(dòng)區(qū)間誤識(shí)別問(wèn)題.此外,EasiLTOM方法可適用于數(shù)據(jù)量較小的物聯(lián)網(wǎng)場(chǎng)景.
在物聯(lián)網(wǎng)場(chǎng)景中,傳感器可根據(jù)自身傳感特征對(duì)環(huán)境數(shù)據(jù)進(jìn)行感知.所感知的數(shù)據(jù)可描述為S=Ssignal+Snoise,其中Ssignal為目標(biāo)信號(hào),Snoise為噪聲.在不同的物聯(lián)網(wǎng)數(shù)據(jù)場(chǎng)景中,噪聲的種類(lèi)和幅值會(huì)有所差異.算法需要基于原始信號(hào)識(shí)別出信號(hào)中的活動(dòng)區(qū)間的起始點(diǎn)和終止點(diǎn).
雖然不同場(chǎng)景中的信號(hào)屬性存在較大差異,但是活動(dòng)信號(hào)區(qū)間的起始點(diǎn)和終止點(diǎn)都具有一些共同的特點(diǎn),算法可以基于此進(jìn)行高精度的信號(hào)活動(dòng)區(qū)間的識(shí)別.在一維信號(hào)的活動(dòng)區(qū)間識(shí)別場(chǎng)景中,活動(dòng)信號(hào)區(qū)間起始點(diǎn)的特點(diǎn)是,自該時(shí)間點(diǎn)起,信號(hào)開(kāi)始持續(xù)活躍,并在較高的幅值維持一段時(shí)間.活動(dòng)信號(hào)區(qū)間終止點(diǎn)的特點(diǎn)是,自該時(shí)間點(diǎn)起,信號(hào)開(kāi)始靜息,信號(hào)的幅值較小.
Fig. 2 Recognition method of signal activity interval based on local dynamic threshold EasiLTOM圖2 基于局部動(dòng)態(tài)閾值的信號(hào)活動(dòng)區(qū)間識(shí)別方法EasiLTOM示意圖
考慮到活動(dòng)信號(hào)區(qū)間起止點(diǎn)的特點(diǎn),本文提出了EasiLTOM方法,其中局部是指長(zhǎng)度為時(shí)間窗口T的信號(hào)區(qū)間.EasiLTOM方法通過(guò)設(shè)置基于時(shí)間窗口T計(jì)算出的低閾值和高閾值對(duì)信號(hào)進(jìn)行狀態(tài)劃分,再通過(guò)對(duì)信號(hào)狀態(tài)的判斷確定信號(hào)活動(dòng)區(qū)間的起止點(diǎn).其中低閾值和高閾值是基于時(shí)間窗口T內(nèi)的信號(hào)值的平均值和方差計(jì)算的,當(dāng)時(shí)間窗口T過(guò)小時(shí),算法難以利用信號(hào)中全部的有效信息,從而導(dǎo)致部分有效信號(hào)信息被浪費(fèi);當(dāng)時(shí)間窗口過(guò)大時(shí),算法會(huì)引入更多的信號(hào)噪聲,導(dǎo)致識(shí)別閾值的適用性降低.所以EasiLTOM方法需要根據(jù)不同的信號(hào)類(lèi)型設(shè)置合適的時(shí)間窗口T.此外,EasiLTOM方法加入了最短信號(hào)長(zhǎng)度tmin對(duì)噪聲尖峰進(jìn)行過(guò)濾.由于EasiLTOM方法中的低閾值和高閾值是使用時(shí)間窗口為T(mén)的局部區(qū)域信號(hào)平均值和方差進(jìn)行確定的,從而能夠避免噪聲信號(hào)對(duì)識(shí)別閾值的影響,并提升信號(hào)活動(dòng)區(qū)間的識(shí)別精度,EasiLTOM方法示意圖如圖2所示.在圖2中,EasiLTOM使用第1個(gè)局部信號(hào)區(qū)間的信號(hào)平均值和方差計(jì)算出低閾值1和高閾值1用于第1個(gè)信號(hào)區(qū)間的起止點(diǎn)(在圖2中即為開(kāi)始點(diǎn)1和結(jié)束點(diǎn)1)識(shí)別;EasiLTOM再使用第2個(gè)局部信號(hào)區(qū)間的信號(hào)平均值和方差計(jì)算出低閾值2和高閾值2用于第2個(gè)信號(hào)區(qū)間的起止點(diǎn)(在圖2中即為開(kāi)始點(diǎn)2和結(jié)束點(diǎn)2)識(shí)別.下面本文將對(duì)信號(hào)活動(dòng)區(qū)間的起始點(diǎn)和終止點(diǎn)的識(shí)別方法進(jìn)行介紹.
為識(shí)別信號(hào)活動(dòng)區(qū)間的起止點(diǎn),本方法提出使用信號(hào)低閾值和信號(hào)高閾值共同用于信號(hào)活動(dòng)區(qū)間的起始點(diǎn)和終止點(diǎn)識(shí)別.當(dāng)信號(hào)值高于信號(hào)低閾值,視為信號(hào)開(kāi)始波動(dòng),方法進(jìn)入狀態(tài)1,并將此時(shí)間點(diǎn)記錄為t1.當(dāng)信號(hào)在始終不低于低閾值的情況下高于信號(hào)高閾值時(shí),方法進(jìn)入狀態(tài)2,當(dāng)信號(hào)值低于低閾值時(shí),方法將此時(shí)間點(diǎn)記錄為t2,此時(shí)方法判斷t2與t1的差值Δt是否大于最短信號(hào)長(zhǎng)度tmin.如果Δt≥tmin,方法此時(shí)可以確認(rèn)t1為信號(hào)活動(dòng)區(qū)間的起始點(diǎn),t2為信號(hào)活動(dòng)區(qū)間的終止點(diǎn);如果Δt 為充分利用當(dāng)前信號(hào)區(qū)間的信號(hào)特點(diǎn),并避免噪聲的影響,基于局部動(dòng)態(tài)閾值的信號(hào)活動(dòng)區(qū)間識(shí)別方法使用局部信號(hào)的均值和方差對(duì)低閾值和高閾值進(jìn)行計(jì)算.由于信號(hào)時(shí)域特征中的均值和方差能夠較好地反映出不同運(yùn)動(dòng)信號(hào)的特點(diǎn),所以基于局部信號(hào)的均值和方差對(duì)用于運(yùn)動(dòng)識(shí)別的低閾值和高閾值進(jìn)行計(jì)算.方法根據(jù)此窗口中的信號(hào)均值及方差分別對(duì)低閾值和高閾值進(jìn)行計(jì)算,低閾值的計(jì)算為 (3) 其中,Nlocal為局部區(qū)間信號(hào)的采樣點(diǎn)個(gè)數(shù),xi為第i個(gè)采樣點(diǎn)的信號(hào)值,k5和k6分別為不同的低閾值確定系數(shù). 高閾值的計(jì)算為 (4) 其中,Nlocal為局部區(qū)間信號(hào)的采樣點(diǎn)個(gè)數(shù),xi為第i個(gè)采樣點(diǎn)的信號(hào)值,k7和k8分別為不同的高閾值確定系數(shù). 本文設(shè)計(jì)了EasiLTOM的算法流程,如算法1所示: 算法1.EasiLTOM算法. 輸入:signal,T,tmin; 輸出:開(kāi)始時(shí)間點(diǎn)、結(jié)束時(shí)間點(diǎn). ① 算法初始化為狀態(tài)0; ② 基于時(shí)間窗口T使用局部平均信號(hào)值和局部信號(hào)方差值計(jì)算低閾值和高閾值; ③ if信號(hào)值高于低閾值 ④ 算法進(jìn)入狀態(tài)1,記錄時(shí)間點(diǎn)t1; ⑤ if信號(hào)值在不低于低閾值的情況下高于高閾值 ⑥ 算法進(jìn)入狀態(tài)2; ⑦ if信號(hào)值低于低閾值 ⑧ 算法記錄時(shí)間點(diǎn)t2; ⑨ end if ⑩ end if 算法1可以對(duì)信號(hào)活動(dòng)區(qū)間的起始時(shí)間點(diǎn)和終止時(shí)間點(diǎn)進(jìn)行識(shí)別,其流程如圖3所示.下面結(jié)合流程圖對(duì)算法1進(jìn)行闡述.算法首先初始化為0狀態(tài),然后算法基于時(shí)間窗口T使用局部信號(hào)區(qū)間的平均值和方差計(jì)算低閾值和高閾值.之后算法判斷信號(hào)值高于低閾值的時(shí)間點(diǎn),當(dāng)信號(hào)值高于低閾值時(shí),算法進(jìn)入狀態(tài)1,并將此時(shí)間點(diǎn)標(biāo)記為t1.如果信號(hào)值在始終不低于低閾值的情況下高于高閾值,算法進(jìn)入狀態(tài)2,當(dāng)信號(hào)值低于低閾值時(shí),算法將此時(shí)間點(diǎn)記錄為t2,此時(shí)算法判斷時(shí)間點(diǎn)t2與時(shí)間點(diǎn)t1的差值Δt是否大于最短信號(hào)長(zhǎng)度tmin,如果Δt≥tmin,算法分別將t1和t2作為信號(hào)活動(dòng)區(qū)間的起始點(diǎn)和終止點(diǎn)進(jìn)行輸出,最后算法恢復(fù)0狀態(tài). Fig. 3 Flow of signal interval recognition algorithm based on local dynamic threshold圖3 基于局部動(dòng)態(tài)閾值的信號(hào)區(qū)間識(shí)別算法流程圖 為驗(yàn)證本文提出的EasiLTOM方法的準(zhǔn)確性,本節(jié)將EasiLTOM方法與DeepLap方法,以及基于機(jī)器學(xué)習(xí)的信號(hào)活動(dòng)區(qū)間識(shí)別方法進(jìn)行對(duì)比實(shí)驗(yàn).實(shí)驗(yàn)內(nèi)容包括方法的識(shí)別準(zhǔn)確性驗(yàn)證,方法在小數(shù)據(jù)量場(chǎng)景中的識(shí)別精度對(duì)比.實(shí)驗(yàn)數(shù)據(jù)包括本研究實(shí)際部署采集的肌電數(shù)據(jù)集EasiEMG及2個(gè)UCI公開(kāi)數(shù)據(jù)集中的部分?jǐn)?shù)據(jù). 為驗(yàn)證本方法的有效性,本節(jié)首先對(duì)本文所選用的實(shí)際數(shù)據(jù)集的采集情況(3.1.1節(jié))以及選擇的公開(kāi)數(shù)據(jù)集(3.1.2節(jié))的情況進(jìn)行介紹.之后本節(jié)總結(jié)和對(duì)比EasiLTOM方法、DeepLap方法以及基于機(jī)器學(xué)習(xí)的信號(hào)活動(dòng)區(qū)間識(shí)別方法在多個(gè)場(chǎng)景中的識(shí)別精度. 3.1.1 肌電數(shù)據(jù)集采集情況 Fig. 4 Schematic diagram of EMG test exercise圖4 肌電測(cè)試運(yùn)動(dòng)示意圖 肌電信號(hào)是一種人體生理信號(hào),它記錄了肌肉細(xì)胞產(chǎn)生的收縮力[14].表面肌電信號(hào)是淺層肌肉肌電信號(hào)和神經(jīng)干上電活動(dòng)在皮膚表面的綜合效應(yīng),能在一定程度上反映神經(jīng)肌肉的活動(dòng);表面肌電信號(hào)在測(cè)量上具有無(wú)創(chuàng)傷等優(yōu)點(diǎn),并且可以作為肌肉疼痛疾病診斷的有效依據(jù)[15],所以廣泛應(yīng)用于康復(fù)醫(yī)學(xué)等領(lǐng)域.但肌肉疼痛疾病的診斷依賴(lài)于表面肌電信號(hào)的運(yùn)動(dòng)區(qū)間識(shí)別.為驗(yàn)證EasiLTOM方法的有效性,本研究組在2017-09—2017-11期間于中國(guó)中醫(yī)科學(xué)院西苑醫(yī)院實(shí)際部署了一套肌電信號(hào)采集裝置,對(duì)非特異性腰痛患者和正常人的肌電信號(hào)進(jìn)行采集.在采集期間,該系統(tǒng)共采集到14位受試者的肌電信號(hào),構(gòu)成肌電信號(hào)數(shù)據(jù)集EasiEMG.每次采集時(shí),受試者執(zhí)行3次屈曲放松運(yùn)動(dòng)(如圖4(a)所示)、1次左足橋式運(yùn)動(dòng)(如圖4(b)所示)、1次右足橋式運(yùn)動(dòng)(如圖4(c)所示)、1次雙足橋式運(yùn)動(dòng)(如圖4(d)所示)和1次Biering Sorensen等長(zhǎng)運(yùn)動(dòng)(如圖4(e)所示).在肌電信號(hào)的采集過(guò)程中,各種運(yùn)動(dòng)的肌電信號(hào)按時(shí)間順序串行拼接,每2種運(yùn)動(dòng)之間存在無(wú)序運(yùn)動(dòng),無(wú)序運(yùn)動(dòng)的肌電信號(hào)會(huì)作為噪聲存在于整體肌電信號(hào)中. 3.1.2 公開(kāi)數(shù)據(jù)集情況 本文選擇了UCI公開(kāi)數(shù)據(jù)集中的2個(gè)手部動(dòng)作肌電信號(hào)測(cè)試數(shù)據(jù)集手部動(dòng)作集1(sEMG for basic hand movements data set database 1, Hand move-ments 1)[16]和手部動(dòng)作集2(sEMG for basic hand movements data set database 2, Hand movements 2)[17],每個(gè)測(cè)試數(shù)據(jù)集中含有6個(gè)手部動(dòng)作的多次肌電信號(hào)測(cè)試.分別選擇手部動(dòng)作集1中的1名男性受試者的180次肌電測(cè)試信號(hào)和手部動(dòng)作集2中的1名男性受試者的600次肌電測(cè)試信號(hào)進(jìn)行信號(hào)活動(dòng)區(qū)間的識(shí)別,肌電信號(hào)中存在無(wú)序手部運(yùn)動(dòng)的肌電信號(hào)作為噪聲. 3.2.1 識(shí)別精度驗(yàn)證 Fig. 5 Recognition accuracy of EasiLTOM, DeepLap and machine learning methods圖5 EasiLTOM,DeepLap及機(jī)器學(xué)習(xí)方法的識(shí)別精度 為驗(yàn)證EasiLTOM方法的有效性及識(shí)別精度,本節(jié)分別使用EasiLTOM,DeepLap以及機(jī)器學(xué)習(xí)方法對(duì)數(shù)據(jù)集EasiEMG和2個(gè)UCI公開(kāi)數(shù)據(jù)集中數(shù)據(jù)進(jìn)行了信號(hào)活動(dòng)區(qū)間的識(shí)別,其中識(shí)別精度與誤檢率和漏檢率的關(guān)系為 Pacc=1-Pfalse-Pmissed, (5) 其中,Pacc為識(shí)別精度,Pfalse為誤檢率,Pmissed為漏檢率.由于隨機(jī)森林模型[18]對(duì)于噪聲的穩(wěn)定性好,分類(lèi)精度高,且具有較強(qiáng)的泛化能力,適用于信號(hào)活動(dòng)區(qū)間的起止點(diǎn)識(shí)別問(wèn)題,所以本文選擇隨機(jī)森林模型作為機(jī)器學(xué)習(xí)方法以識(shí)別信號(hào)活動(dòng)區(qū)間的起止點(diǎn),EasiLTOM,DeepLap及機(jī)器學(xué)習(xí)方法對(duì)于各數(shù)據(jù)集的識(shí)別精度結(jié)果如表1所示: Table 1 EasiLTOM, DeepLap and Machine Learning Recognition Accuracy Results for Each Data Set 實(shí)驗(yàn)結(jié)果表明:EasiLTOM方法對(duì)于信號(hào)活動(dòng)區(qū)間的識(shí)別精度超過(guò)了DeepLap方法以及基于機(jī)器學(xué)習(xí)的信號(hào)活動(dòng)區(qū)間識(shí)別方法,達(dá)到了平均93.17%的識(shí)別精度,EasiLTOM方法的識(shí)別精度比雙閾值法的識(shí)別精度高15.03%,比基于機(jī)器學(xué)習(xí)的信號(hào)活動(dòng)區(qū)間識(shí)別方法的識(shí)別精度高4.70%. 3.2.2 小數(shù)據(jù)量場(chǎng)景中的識(shí)別精度對(duì)比 許多物聯(lián)網(wǎng)場(chǎng)景中的數(shù)據(jù)量稀少,因此需要一種適用于小數(shù)量場(chǎng)景的信號(hào)活動(dòng)區(qū)間識(shí)別方法.為驗(yàn)證EasiLTOM,DeepLap及機(jī)器學(xué)習(xí)方法在小數(shù)據(jù)量場(chǎng)景中的識(shí)別精度,本文使用EasiLTOM,DeepLap及機(jī)器學(xué)習(xí)方法對(duì)各個(gè)數(shù)據(jù)集分別在數(shù)據(jù)量為12條和18條的場(chǎng)景下進(jìn)行了信號(hào)活動(dòng)區(qū)間的識(shí)別,識(shí)別精度結(jié)果如圖5所示. 通過(guò)實(shí)驗(yàn)結(jié)果可以得到,當(dāng)數(shù)據(jù)量為12條和18條時(shí),機(jī)器學(xué)習(xí)方法對(duì)于各個(gè)數(shù)據(jù)的平均識(shí)別精度分別為79.44%和83.12%,EasiLTOM方法對(duì)于各個(gè)數(shù)據(jù)的平均識(shí)別精度分別為97.22%和96.29%,EasiLTOM方法的識(shí)別精度分別比機(jī)器學(xué)習(xí)方法高17.78%和13.17%. 通過(guò)實(shí)驗(yàn)在小數(shù)據(jù)量場(chǎng)景中的識(shí)別精度結(jié)果對(duì)比可得,在數(shù)據(jù)量稀少的物聯(lián)網(wǎng)場(chǎng)景中,機(jī)器學(xué)習(xí)方法因?yàn)槟P颓窋M合,導(dǎo)致模型的泛化能力變差,從而使識(shí)別精度下降.而EasiLTOM方法因?yàn)樽R(shí)別閾值的適用性在數(shù)據(jù)量稀少的場(chǎng)景中相較于在數(shù)據(jù)量大的場(chǎng)景中更好,從而提升了信號(hào)活動(dòng)區(qū)間的識(shí)別精度.所以,EasiLTOM方法僅需使用少量數(shù)據(jù)即可對(duì)信號(hào)活動(dòng)區(qū)間進(jìn)行準(zhǔn)確地識(shí)別,十分適用于數(shù)據(jù)量稀少的物聯(lián)網(wǎng)數(shù)據(jù)場(chǎng)景. 本文提出了基于局部動(dòng)態(tài)閾值信號(hào)活動(dòng)區(qū)間識(shí)別方法EasiLTOM,EasiLTOM方法的特點(diǎn)是:可以有效地克服將噪聲信號(hào)誤檢為信號(hào)活動(dòng)區(qū)間或信號(hào)活動(dòng)區(qū)間漏檢的現(xiàn)象,而且避免了信號(hào)中的隨機(jī)噪聲對(duì)于信號(hào)屬性不同的區(qū)間識(shí)別所帶來(lái)的影響,從而提升了信號(hào)活動(dòng)區(qū)間的識(shí)別準(zhǔn)確率.此外,EasiLTOM方法僅需使用少量數(shù)據(jù)即可對(duì)信號(hào)活動(dòng)區(qū)間進(jìn)行準(zhǔn)確的識(shí)別,十分適用于數(shù)據(jù)量較小的物聯(lián)網(wǎng)數(shù)據(jù)場(chǎng)景. 相對(duì)于現(xiàn)有的信號(hào)活動(dòng)區(qū)間識(shí)別方法DeepLap來(lái)說(shuō),EasiLTOM由于使用了局部動(dòng)態(tài)閾值機(jī)制,所以方法對(duì)噪聲的容忍度高,能夠適用于更廣泛的信號(hào)活動(dòng)區(qū)間識(shí)別的物聯(lián)網(wǎng)場(chǎng)景.例如在3.2節(jié)中,EasiLTOM方法對(duì)于信號(hào)活動(dòng)區(qū)間的識(shí)別精度超過(guò)了其他方法,達(dá)到了平均93.17%的識(shí)別精度,比雙閾值法的識(shí)別精度高15.03%,比基于機(jī)器學(xué)習(xí)的信號(hào)活動(dòng)區(qū)間識(shí)別方法的識(shí)別精度高4.70%. EasiLTOM適用于含有噪聲的一維物聯(lián)網(wǎng)場(chǎng)景,因?yàn)樵诖_定識(shí)別低閾值和高閾值時(shí),方法綜合使用了信號(hào)的局部區(qū)間的信號(hào)均值和信號(hào)方差,充分利用了當(dāng)前信號(hào)區(qū)間的信號(hào)特點(diǎn),避免了信號(hào)中其他段信號(hào)的噪聲影響,并且加入了最短信號(hào)長(zhǎng)度對(duì)噪聲尖峰進(jìn)行過(guò)濾,從而使得信號(hào)中的噪聲不會(huì)對(duì)方法的適用性產(chǎn)生影響.例如在EasiEMG數(shù)據(jù)集中,肌電信號(hào)數(shù)據(jù)中含有因無(wú)序運(yùn)動(dòng)造成的噪聲.針對(duì)此類(lèi)信號(hào),在本文3.2節(jié)的結(jié)果中可以看到本方法的信號(hào)活動(dòng)區(qū)間識(shí)別精度最優(yōu).針對(duì)UCI公開(kāi)數(shù)據(jù)集中的噪聲,在本文3.2節(jié)中可以看到本方法的信號(hào)活動(dòng)區(qū)間識(shí)別精度最優(yōu). EasiLTOM方法適用于數(shù)據(jù)量稀少的物聯(lián)網(wǎng)數(shù)據(jù)集中,對(duì)于小數(shù)量場(chǎng)景,EasiLTOM方法因?yàn)樽R(shí)別閾值的適用性在數(shù)據(jù)量稀少的場(chǎng)景中相較于在數(shù)據(jù)量大的場(chǎng)景中更好,所以提升了信號(hào)活動(dòng)區(qū)間的識(shí)別精度,而機(jī)器學(xué)習(xí)方法因?yàn)樵谛?shù)據(jù)量場(chǎng)景中模型欠擬合導(dǎo)致識(shí)別精度下降.比如在3.2節(jié)中,數(shù)據(jù)量為12條和18條時(shí),EasiLTOM方法的平均識(shí)別精度分別比機(jī)器學(xué)習(xí)方法高17.78%和13.17%. 本文針對(duì)含有大量噪聲的一維時(shí)序信號(hào)難以確定活動(dòng)區(qū)間的開(kāi)始和結(jié)束時(shí)間點(diǎn)的問(wèn)題,提出了一種基于局部動(dòng)態(tài)閾值的信號(hào)活動(dòng)區(qū)間識(shí)別方法EasiLTOM.相對(duì)于單閾值和雙閾值的信號(hào)活動(dòng)區(qū)間識(shí)別方法,EasiLTOM有效地避免了信號(hào)中的隨機(jī)噪聲對(duì)于信號(hào)屬性不同的區(qū)間識(shí)別所帶來(lái)的影響,解決了信號(hào)活動(dòng)區(qū)間的漏檢和誤檢問(wèn)題,從而提高了信號(hào)活動(dòng)區(qū)間的識(shí)別精度.相對(duì)于機(jī)器學(xué)習(xí)方法,EasiLTOM方法具有識(shí)別精確度高、所需數(shù)據(jù)量少等優(yōu)點(diǎn),使其更加適用于數(shù)據(jù)量稀少的物聯(lián)網(wǎng)場(chǎng)景.通過(guò)對(duì)比實(shí)驗(yàn)證明,EasiLTOM方法達(dá)到了平均93.17%的識(shí)別精度,EasiLTOM方法的識(shí)別精度比雙閾值法的識(shí)別精度高15.03%,比基于機(jī)器學(xué)習(xí)的信號(hào)活動(dòng)區(qū)間識(shí)別方法的識(shí)別精度高4.70%,達(dá)到了目前最佳的運(yùn)動(dòng)區(qū)間識(shí)別精度.EasiLTOM方法適用于含有大量噪聲的一維時(shí)序信號(hào)活動(dòng)區(qū)間識(shí)別場(chǎng)景. 作者貢獻(xiàn)聲明:周鈞鍇負(fù)責(zé)論文的寫(xiě)作及實(shí)驗(yàn);王念負(fù)責(zé)論文的修改及實(shí)驗(yàn);崔莉負(fù)責(zé)整體指導(dǎo)及論文的修改.2.2 EasiLTOM流程及描述
3 實(shí)驗(yàn)分析
3.1 實(shí)驗(yàn)設(shè)計(jì)
3.2 實(shí)驗(yàn)結(jié)果
4 討 論
5 結(jié) 論