吳建寧 伍 濱
(福建師范大學(xué)數(shù)學(xué)與計算機(jī)科學(xué)學(xué)院,福州 350007)
當(dāng)前,老年人跌倒的發(fā)生率高,已成為老年人致傷、致殘、甚至死亡的主要原因之一。如何有效預(yù)防老年人跌倒,已成為眾多學(xué)者探討和關(guān)注的熱點問題[1]。相關(guān)研究表明,人體步態(tài)(人體行走時的方式或姿態(tài))與人體解剖結(jié)構(gòu)、神經(jīng)生理功能、運(yùn)動控制能力等因素密切相關(guān),在某種程度上反映人體行走功能的狀況。特別在衰老期間,老年人受下肢骨骼肌肉功能下降、下肢關(guān)節(jié)柔韌性降低、前庭功能和平衡能力下降等生理因素的影響,其行走時步態(tài)功能下降,產(chǎn)生不穩(wěn)定等危險步態(tài),增大了他們跌倒風(fēng)險。及早、準(zhǔn)確地量化評價老年人步態(tài),可有效降低老年人跌倒的風(fēng)險[2-3]。
量化評價老年人步態(tài)變化的相關(guān)研究在生物力學(xué)等相關(guān)領(lǐng)域較早開展,并得到高度重視和廣泛關(guān)注[4]。早期,相關(guān)學(xué)者運(yùn)用步態(tài)分析方法,評價青年人和老年人在步速、步頻、下肢關(guān)節(jié)角度變化范圍及足-地反作用力等步態(tài)特征參數(shù)的差異,量化評價人體步態(tài)是否轉(zhuǎn)入老年人步態(tài)[4-5]。隨著步態(tài)分析系統(tǒng)技術(shù)和數(shù)據(jù)處理技術(shù)的快速發(fā)展,眾多學(xué)者嘗試將先進(jìn)的數(shù)據(jù)處理技術(shù)用于各類步態(tài)數(shù)據(jù)分析中,有效鑒別青年人步態(tài)和老年人步態(tài)的差異,獲取有效量化評價老年人的步態(tài)變化的技術(shù)手段,諸如基于人工神經(jīng)網(wǎng)絡(luò)構(gòu)建步態(tài)分類模型被用來評價老年人的步態(tài)變化[6]。近年來,基于構(gòu)建泛化性能優(yōu)越的步態(tài)分類模型鑒別老年人步態(tài)模式來評價老年人的步態(tài)變化,已成為眾多學(xué)者探討的熱點問題。從近年的文獻(xiàn)報道來看,基于先進(jìn)機(jī)器學(xué)習(xí)理論構(gòu)建步態(tài)分類模型在步態(tài)分析中得到廣泛應(yīng)用。特別是基于有監(jiān)督學(xué)習(xí)算法的支持向量機(jī)二分類模型,在量化評價老年人步態(tài)及其變化研究中持續(xù)受到關(guān)注和重視[7-11]。Begg等首次采用支持向量機(jī)二分類模型,通過鑒別12名健康青年和12名健康老年受試者的步態(tài)模式(由時空步態(tài)參數(shù)、運(yùn)動學(xué)步態(tài)參數(shù)、動力學(xué)步態(tài)特征參數(shù)組成),量化評價了老年人的步態(tài),并驗證了小樣本步態(tài)數(shù)據(jù)在支持向量機(jī)分類算法中的適應(yīng)性[10]。Reginaldo等采用支持向量機(jī)分類算法,分析了17名健康青年和17名老年人的運(yùn)動學(xué)步態(tài)數(shù)據(jù),探討了與年齡相關(guān)的老年人步態(tài)變化[11]。當(dāng)前,基于有監(jiān)督學(xué)習(xí)的支持向量機(jī)二分類算法來評價老年人步態(tài)的相關(guān)研究取得了積極的進(jìn)展,但研究中僅考慮有標(biāo)注步態(tài)數(shù)據(jù)類別間的差異信息,而忽略步態(tài)數(shù)據(jù)類內(nèi)有價值的“內(nèi)在信息”。另外,目前的研究僅局限于有標(biāo)注的小樣本步態(tài)數(shù)據(jù),而忽略大量無標(biāo)注步態(tài)數(shù)據(jù)在步態(tài)分類算法中的有效利用,特別是在大量無標(biāo)注的老年人步態(tài)數(shù)據(jù)中,包含“有價值”的危險步態(tài)變異信息未得到有效利用,必將影響其泛化能力,降低學(xué)習(xí)算法的精度,難以準(zhǔn)確評價老年人行走時的步態(tài)狀況。事實上,在醫(yī)療環(huán)境中,獲取大量有標(biāo)注的人體步態(tài)數(shù)據(jù)比較費時費力,而獲取大量的無標(biāo)注的人體步態(tài)數(shù)據(jù)比較容易。如何尋找一種能有效利用大量無標(biāo)注的人體步態(tài)數(shù)據(jù),構(gòu)建泛化性能優(yōu)越的步態(tài)分類模型,準(zhǔn)確量化評價老年人步態(tài),是筆者研究的興趣所在。
據(jù)近年的相關(guān)文獻(xiàn)報道,基于半監(jiān)督學(xué)習(xí)的支持向量機(jī)分類算法能夠有效地利用大量無標(biāo)注數(shù)據(jù),較好地改善分類性能,并已在腦電、心電等生物醫(yī)學(xué)信息處理中得到成功的應(yīng)用[12-13],但在量化評價人體步態(tài)變化的相關(guān)研究中仍未得到應(yīng)用。在研究中,筆者嘗試應(yīng)用半監(jiān)督支持向量機(jī)分類算法來分析大量無標(biāo)注的人體步態(tài)數(shù)據(jù),旨在充分考慮利用步態(tài)數(shù)據(jù)類別間和步態(tài)數(shù)據(jù)內(nèi)在“有價值”的步態(tài)變異信息,改善支持向量機(jī)步態(tài)分類算法的性能,準(zhǔn)確評價老年人行走時的步態(tài)狀況。近年來,自訓(xùn)練半監(jiān)督支持向量機(jī)分類算法在生物醫(yī)學(xué)信息處理中得到普遍重視[12-13]。在算法設(shè)計研究中,首要考慮的問題就是在自訓(xùn)練過程中如何從無標(biāo)注生理數(shù)據(jù)中獲取有標(biāo)注數(shù)據(jù),并且每次添加到樣本訓(xùn)練集中標(biāo)注的樣本對于當(dāng)前分類模型而言必須最具信息量,否則將嚴(yán)重影響分類器的學(xué)習(xí)能力[14]。為此,如何尋找一個能有效衡量步態(tài)數(shù)據(jù)樣本信息量大小的有效參量,是設(shè)計步態(tài)分類算法非常重要的環(huán)節(jié)。基于人體步態(tài)數(shù)據(jù)的非平穩(wěn)性、復(fù)雜性等特性以及前期的研究工作發(fā)現(xiàn),小波熵能夠有效表征人體步態(tài)系統(tǒng)內(nèi)在的紊亂變化程度,能夠獲取更多表達(dá)人體步態(tài)變異的信息量[15]。基于上述思路,筆者提出了一種基于小波熵的自訓(xùn)練半監(jiān)督支持向量機(jī)步態(tài)分類算法,旨在嘗試采用基于小波熵從未標(biāo)注步態(tài)數(shù)據(jù)中來挑選那些在當(dāng)前分類器下最具信息量的樣本,以提高自訓(xùn)練半監(jiān)督支持向量機(jī)分類器的泛化能力,準(zhǔn)確量化評價行走時的老年人步態(tài)。在研究中,采集了120名不同年齡組的未標(biāo)注足-地反作用力步態(tài)數(shù)據(jù),采用本研究提出的分類算法對其進(jìn)行分析,并與基于有監(jiān)督學(xué)習(xí)的支持向量機(jī)分類模型比較,以驗證所提出的分類模型評價老年人步態(tài)的有效性和優(yōu)越性。
半監(jiān)督學(xué)習(xí)是一種近年來應(yīng)用于模式識別等領(lǐng)域較先進(jìn)的機(jī)器學(xué)習(xí)算法,其核心思想是依據(jù)光滑性假設(shè),充分綜合考慮利用數(shù)據(jù)類別間概率分布信息和數(shù)據(jù)類別內(nèi)在結(jié)構(gòu)分布信息,以改善傳統(tǒng)監(jiān)督學(xué)習(xí)算法中忽略數(shù)據(jù)所具有某種內(nèi)在結(jié)構(gòu)分布信息的不足,提高學(xué)習(xí)器的泛化性能[14]。通過對來自某種未知分布的一個有標(biāo)注示例集X1={(xi,yi)(xi表示i個數(shù)據(jù),yi是xi的類別標(biāo)號),與一個無標(biāo)注示例集X2={xi}進(jìn)行學(xué)習(xí),期望得到一個決策函數(shù)f:X→Y(X=(X1,X2),Y={yi}),能夠?qū)κ纠?xi準(zhǔn)確預(yù)測其標(biāo)記 yi。本研究采用yi∈{-1,+1},其中-1表示青年人步態(tài)模式,+1表示老年人步態(tài)模式。為了找到函數(shù),通過任取一個滿足Mercer定理的核函數(shù)K:X×X→R,對數(shù)據(jù)X=(X1,X2)映射,在產(chǎn)生與之對應(yīng)的重構(gòu)核Hibert空間(RKHS)中進(jìn)行優(yōu)化學(xué)習(xí),使其具有最小值,即
通過引入松弛變量ξ,可將式(1)表示為
為此,利用支持向量機(jī)算法(SVM),即可得到一個決策函數(shù)f:X→Y。
考慮到步態(tài)數(shù)據(jù)與腦電、心電數(shù)據(jù)具有相同的高維性、非平穩(wěn)性、復(fù)雜性等特性[6],采用自訓(xùn)練半監(jiān)督學(xué)習(xí)算法在RSHK中尋找最優(yōu)的決策函數(shù)?;舅悸肪褪鞘紫壤蒙倭康挠袠?biāo)注樣本步態(tài)數(shù)據(jù)訓(xùn)練構(gòu)建支持向量機(jī)分類模型,然后對無標(biāo)注步態(tài)數(shù)據(jù)分類預(yù)測,選取新的有標(biāo)注的步態(tài)數(shù)據(jù)添加樣本訓(xùn)練集,構(gòu)建新的樣本訓(xùn)練集(由訓(xùn)練數(shù)據(jù)、無標(biāo)注數(shù)據(jù)、新添加的標(biāo)注數(shù)據(jù)組成),訓(xùn)練學(xué)習(xí)新的支持向量機(jī)分類模型,循環(huán)上述過程,不斷更新樣本訓(xùn)練集,直到得到最終的支持向量機(jī)模型,也就是直到獲得泛化性能最優(yōu)的步態(tài)分類模型為止。在自訓(xùn)練過程中,添加到樣本訓(xùn)練集的樣本標(biāo)號與所選樣本的真實類別標(biāo)號是否一致至關(guān)重要。若不一致,可能產(chǎn)生的誤差就會在迭代過程中不斷積累,必將影響學(xué)習(xí)性能。為此,要求選取的樣本數(shù)據(jù)對當(dāng)前分類模型最具信息量,盡量減少在自訓(xùn)練迭代過程中可能產(chǎn)生的誤差。在研究中,考慮到人體步態(tài)功能變異與人體步態(tài)系統(tǒng)內(nèi)在紊亂變化程度密切相關(guān)的特性[15],嘗試采用小波熵作為衡量從未標(biāo)注步態(tài)數(shù)據(jù)中來挑選那些在當(dāng)前分類器中最具信息量樣本的有效參量。
首先計算小波熵值[15],也就是對步態(tài)數(shù)據(jù)進(jìn)行多尺度小波分解,得到各分解層的小波系數(shù){Dj(k),其中 m 為每個分解層小波系數(shù)的個數(shù)。根據(jù)所得小波系數(shù),計算各分解層的能量分布及所有小波系數(shù)的能量之和,有
然后根據(jù)各分解層的能量計算相對小波能量,即
然后根據(jù)相對小波能量計算小波熵,有
然后依據(jù)前期研究工作[15],根據(jù)計算得到的健康青年和老年受試者步態(tài)數(shù)據(jù)小波熵值的統(tǒng)計差異,定義從未標(biāo)注數(shù)據(jù)、挑選標(biāo)注樣本數(shù)據(jù)的閾值。青年和老年人的小波熵值變化范圍分別定義為M±SD,其中M為平均值、SD為標(biāo)準(zhǔn)差,若有相沖突的數(shù)據(jù)則剔除。
綜上所述,本研究提出基于小波熵的自訓(xùn)練半監(jiān)督支持向量機(jī)步態(tài)分類算法,其流程框架如圖1所示。
圖1 基于小波熵的自訓(xùn)練半監(jiān)督支持向量機(jī)分類算法流程框架Fig.1 The framework of the classification algorithm of the self-training semi-supervised support vector machine based on wavelet entropy
具體的算法主要包括4個步驟。
步驟1:用少量有標(biāo)注的步態(tài)數(shù)據(jù)構(gòu)建樣本訓(xùn)練集,學(xué)習(xí)訓(xùn)練得到支持向量機(jī)分類模型,然后對無標(biāo)注的步態(tài)數(shù)據(jù)分類,得到預(yù)測標(biāo)注樣本,并計算其相應(yīng)的小波熵值,并依據(jù)小波熵閾值挑選一些新的標(biāo)注步態(tài)數(shù)據(jù)。
步驟2:用訓(xùn)練樣本數(shù)據(jù)、剩余的無標(biāo)注步態(tài)數(shù)據(jù)、上一步得到的新的標(biāo)注步態(tài)數(shù)據(jù),構(gòu)建一個新的樣本訓(xùn)練集,再進(jìn)行訓(xùn)練學(xué)習(xí),得到一個新的支持向量機(jī)分類模型。同樣,對剩余的無標(biāo)注步態(tài)數(shù)據(jù)進(jìn)行預(yù)測,計算預(yù)測樣本的小波熵值,并依據(jù)小波熵閾值挑選一些新的標(biāo)注步態(tài)數(shù)據(jù)。
步驟3:計算新的支持向量機(jī)相應(yīng)的目標(biāo)函數(shù)值,有
步驟4:k次迭代步驟2和步驟3。假定一個正常數(shù)δ0,計算第k次和k-1次的支持向量機(jī)相應(yīng)的目標(biāo)函數(shù)值,判斷兩者的絕對值是否小于δ0,若不小于δ0則繼續(xù)k+1次迭代,若小于δ0則停止循環(huán),從而得到測試樣本的最終分類標(biāo)注,即最后的分類結(jié)果。
由于研究中要采集大量未標(biāo)注老年人步態(tài)數(shù)據(jù),考慮到老年人受試者行走狀況,所以設(shè)計受試者步態(tài)數(shù)據(jù)采集過程不僅要簡單易行,并且采集的步態(tài)數(shù)據(jù)要能夠包含更多與人體步態(tài)變異密切相關(guān)的本質(zhì)信息。目前,在生物力學(xué)中有關(guān)的步態(tài)假說研究表明,足-地反作用力等動力學(xué)步態(tài)參數(shù)能體現(xiàn)人體步態(tài)的內(nèi)在“動力鏈”,可較好地反映人體行走時下肢力量及步態(tài)變異狀況[2,16]。為此,筆者采集了120名不同年齡組受試者的足-地反作用力步態(tài)數(shù)據(jù),其相關(guān)生理參數(shù)如表1所示。在采集過程中,為避免各種干擾因素,要求受試者赤足按本人習(xí)慣或自然的步速在一個內(nèi)嵌測力平臺的實驗水平步道上行走;為確保測力平臺準(zhǔn)確記錄受試者步行時的足-地反作用力步態(tài)數(shù)據(jù),要求每個受試者在步行時一只足盡可能地踏在測力平臺的中間位置。采樣頻率為400 Hz,每個受試者記錄3~5次滿足條件的步態(tài)數(shù)據(jù)。在采集前,讓受試者在實驗水平步道上行走數(shù)次,以便熟悉數(shù)據(jù)采集試驗環(huán)境和要求;同時,要求所有受試者熟悉和同意步態(tài)數(shù)據(jù)采集方案及相關(guān)事項[15]。
表1 不同年齡組受試者的生理參數(shù)(均值±標(biāo)準(zhǔn)差)Tab.1 The physiological parameters from the subjects groups with different ages(M±SD)
為消除受試者之間的個體差異,便于步態(tài)數(shù)據(jù)量化分析,對足-地反作用力步態(tài)數(shù)據(jù)進(jìn)行歸一化處理。將每個受試者足-地間反作用力除以其自身體重,即將每個受試者足-地反作用力歸一化為其自身體重的百分比,以消除受試者自身體重所造成的差異;將每個受試者的足與地面的接觸時間長度歸一化為步態(tài)周期中支撐期的百分比,以消除受試者之間因不同步速所產(chǎn)生的差異。一名受試者的步態(tài)數(shù)據(jù)如圖2所示,其中Fz為垂直方向力(vertical force),F(xiàn)y為前后方向力(anterior-posterior force),F(xiàn)x為左右方向力(medio-lateral forces))
圖2 一名受試者在3個不同方向的足-地反作用力在支撐期的變化狀況Fig.2 The change of the three different ground reaction force(GRF)during stance phase
在實驗中,為便于小波變換計算,將一個支撐期數(shù)據(jù)長度處理為256個數(shù)據(jù)點,采用Daubechies6小波基函數(shù)對步態(tài)數(shù)據(jù)進(jìn)行7尺度小波分解,計算相應(yīng)的小波熵值。依據(jù)筆者在前期研究建立的健康青年和老年人數(shù)據(jù)庫,由于垂直和前后方向的足-地反作用力步態(tài)數(shù)據(jù)蘊(yùn)含較多的人體步態(tài)變異信息[2,5,16],所以選取 12 名健康青年受試者和 12 名健康老年受試者垂直和前后方向足-地反作用力步態(tài)數(shù)據(jù)計算小波熵值,并用t-檢驗法統(tǒng)計分析兩組小波熵值差異(檢驗顯著性水平值P<0.05,小波熵具有顯著差異)。由于在上述兩個不同方向足-地反作用力步態(tài)數(shù)據(jù)上,青年受試者比老年受試者在不同尺度上的相對小波能量分布較均勻(詳見文獻(xiàn)[15]),為了得到較好的標(biāo)注數(shù)據(jù),所以確定標(biāo)注健康青年數(shù)據(jù)的小波熵閾值應(yīng)大于統(tǒng)計分析的平均值,而標(biāo)注老年數(shù)據(jù)的小波熵閾值應(yīng)小于統(tǒng)計分析的平均值,其結(jié)果如表2所示。
表2 健康青年和老年受試組在垂直方向和前后方向反作用力步態(tài)數(shù)據(jù)分析結(jié)果Tab.2 The analyzed results obtained the vertical and anterior-posterior GRF from health young and elderly subjects
由于支持向量機(jī)分類算法的泛化性能與表達(dá)數(shù)據(jù)的特征向量的維數(shù)大小密切相關(guān),實驗中為了較好地表達(dá)步態(tài)數(shù)據(jù),分別從垂直方向和前后方向的足-地反作用力步態(tài)數(shù)據(jù)中,選取步態(tài)分析中常用的10個含有大量與人體步態(tài)變化密切相關(guān)特征信息的步態(tài)參數(shù),構(gòu)建步態(tài)模式特征向量[2,16](見圖3),也就是將一個步態(tài)模式表示為10維的特征向量。其中,(a)為垂直方向力,主要有足跟著地時的最大承受力Fz1、與Fz1相應(yīng)的時刻Tz1、全足著地時的最小承受力Fz2,與Fz2相應(yīng)的時刻Tz2、足尖離地時的最大承受力Fz3、與Fz3相應(yīng)的時刻Tz3;(b)為前后方向力,主要有足停止時最大承受力Fy1與相應(yīng)的時刻Ty1、足離地時最大承受力Fy2與相應(yīng)的時刻Ty2)。
圖3 從垂直方向(a)和前后方向(b)力中選取的步態(tài)特征參數(shù)Fig.3 The gait features selected from vertical(a)and anterior–posterior(b)directional GRF during stance phase respectively
首先選取20名(10名健康青年和10名健康老年)受試者的步態(tài)數(shù)據(jù)構(gòu)建樣本訓(xùn)練集,建立支持向量機(jī)分類模型,然后采用自訓(xùn)練算法對120名未標(biāo)注受試者的數(shù)據(jù)進(jìn)行預(yù)測和訓(xùn)練,另選取24名健康青年和24名健康老年受試者的步態(tài)數(shù)據(jù)作為測試數(shù)據(jù),評估自訓(xùn)練過程中每次迭代的支持向量機(jī)分類性能。由于數(shù)據(jù)有限,每次迭代添加的標(biāo)注樣本數(shù)據(jù)數(shù)根據(jù)預(yù)測樣本量大小及相應(yīng)小波熵值而定,添加的標(biāo)注樣本數(shù)量可變。在實驗中,起始添加的標(biāo)注樣本數(shù)量為6,設(shè)置調(diào)節(jié)參數(shù)C1=0.85,C2=0.2,利用 LIBSVM 實現(xiàn) SVM 算法[17],采用線性核K(xi,xj)=xixj。為了比較,沒有依據(jù)小波熵閾值選取添加的樣本,而是根據(jù)每次的預(yù)測樣本隨機(jī)選取添加的樣本,兩種不同的添加樣本方法(在每次迭代過程的添加的樣本數(shù)相同)的分類性能如圖4所示。可以看到,支持向量機(jī)分類性能隨著添加的標(biāo)注樣本數(shù)增加逐步得到改善,迭代初期兩種樣本選取方法的分類性能相當(dāng),這可能由于此時樣本訓(xùn)練集中的樣本數(shù)較少,分類泛化性能差。隨著迭代次數(shù)增加,基于預(yù)測樣本隨機(jī)選取添加的標(biāo)注樣本方法的泛化性能不穩(wěn)定;而基于小波熵選取的標(biāo)注樣本方法的泛化性能明顯優(yōu)于前者,當(dāng)?shù)螖?shù)為12時,分類性能最優(yōu)。上述結(jié)果表明,小波熵能夠有效地從未標(biāo)注步態(tài)數(shù)據(jù)中來挑選那些在當(dāng)前分類器里最具信息量的樣本,可有效提高自訓(xùn)練半監(jiān)督支持向量機(jī)的泛化性能。
圖4 兩種不同的添加樣本方法對分類性能影響的比較Fig.4 The comparison of the effect of classification performance on the two methods for samples added in training sample set
此外,為了比較步態(tài)數(shù)據(jù)對分類性能的影響,筆者采用文獻(xiàn)[10]中的有監(jiān)督學(xué)習(xí)支持向量機(jī)方法來評價不同方向反作用力步態(tài)數(shù)據(jù),兩種方法在不同方向的足-地反作用力步態(tài)數(shù)據(jù)的最優(yōu)分類泛化性能如表3所示??梢钥吹剑罁?jù)筆者提出的半監(jiān)督步態(tài)分類算法,垂直方向和前后方向的足-地反作用力數(shù)據(jù)的分類正確率分別為85%和81%,基于兩種不同方向的足-地反作用力相結(jié)合的步態(tài)數(shù)據(jù)的最大分類正確率為90%;相比之下,依據(jù)文獻(xiàn)[10]的有監(jiān)督步態(tài)分類模型,垂直方向和前后方向的足-地反作用力數(shù)據(jù)的最大分類正確率僅分別為83%和75%,基于兩種不同方向的足-地反作用力相結(jié)合的步態(tài)數(shù)據(jù)的最大分類正確率為85%。結(jié)果表明,半監(jiān)督支持向量機(jī)分類算法能夠有效綜合利用步態(tài)數(shù)據(jù)類別間和步態(tài)數(shù)據(jù)內(nèi)在的“有價值”的步態(tài)變異信息,改善支持向量機(jī)步態(tài)分類算法性能,準(zhǔn)確鑒別青年和老年人步態(tài)模式,為有效評價人體步態(tài)轉(zhuǎn)為老年人步態(tài)狀況提供依據(jù)。
表3 兩種步態(tài)分類算法在不同方向力步態(tài)數(shù)據(jù)上的分類正確率Tab.3 The accuracy obtained by two gait classification algorithm based on two directional GRF gait data
實驗結(jié)果表明,筆者提出的基于小波熵的自訓(xùn)練半監(jiān)督支持向量機(jī)步態(tài)分類算法能夠充分利用大量未標(biāo)注步態(tài)數(shù)據(jù),有效提高步態(tài)分類性能。在研究中,首先挑選了一些健康的青年和老年人受試者步態(tài)數(shù)據(jù)來定義小波熵閾值,從表2的統(tǒng)計分析結(jié)果來看,青年和老年的步態(tài)模式存在較大差異。為了有效評價小波熵從未標(biāo)注步態(tài)數(shù)據(jù)中獲取保持真實的標(biāo)注樣本數(shù)據(jù),在未標(biāo)注數(shù)據(jù)中添加了中年年齡段(45~55歲)的步態(tài)數(shù)據(jù),主要考慮到該年齡段處于老年前期,受人體神經(jīng)生理功能、運(yùn)動控制能力下降等因素對步態(tài)功能的影響,步態(tài)功能易發(fā)生變異,其步態(tài)數(shù)據(jù)可能含有與老年人步態(tài)變化密切相關(guān)的特征信息,有助于準(zhǔn)確評價老年人步態(tài)。目前,在應(yīng)用半監(jiān)督學(xué)習(xí)算法進(jìn)行生物醫(yī)學(xué)信息處理的研究中,眾多學(xué)者針對不同的生物醫(yī)學(xué)數(shù)據(jù)特性,探討了如何從未標(biāo)注數(shù)據(jù)中進(jìn)行有效標(biāo)注數(shù)據(jù),以提高半監(jiān)督學(xué)習(xí)分類算法的性能[12-13]。在研究中,針對步態(tài)數(shù)據(jù)的非平穩(wěn)性、復(fù)雜性以及有效表達(dá)步態(tài)數(shù)據(jù)分布的特性,采用小波熵作為衡量從未標(biāo)注步態(tài)數(shù)據(jù)中來挑選那些在當(dāng)前分類器中最具信息量樣本的有效參量。從圖4的結(jié)果來看,隨著基于小波熵閾值選取的添加標(biāo)注樣本數(shù)增加,基于半監(jiān)督學(xué)習(xí)的分類算法性能不斷增強(qiáng),經(jīng)過12次迭代以后,步態(tài)分類器的最終分類正確率逐步平穩(wěn),表明基于小波熵獲取的添加樣本能夠較好地代表樣本在特征空間的分布,12次迭代以后添加的樣本對分類性能影響較小。然而,依據(jù)每次預(yù)測樣本隨機(jī)選取添加樣本,構(gòu)建自訓(xùn)練支持向量機(jī)步態(tài)分類器,其分類性能不穩(wěn)定,這可能是由于在自訓(xùn)練過程中,添加到樣本訓(xùn)練集的樣本標(biāo)號與所選樣本真實類別標(biāo)號不一致,產(chǎn)生的誤差在迭代過程中不斷積累,從而影響學(xué)習(xí)的性能。上述結(jié)果表明,小波熵能夠有效地衡量從未標(biāo)注步態(tài)數(shù)據(jù)中挑選那些在當(dāng)前分類器中最具信息量的樣本,改善半監(jiān)督步態(tài)分類的泛化性能。
在研究中,僅考慮采用足-地反作用力的步態(tài)數(shù)據(jù)進(jìn)行分析來評價人體步態(tài)變化。從表3的結(jié)果來看,基于筆者的算法和大量未標(biāo)注的足-地反作用力數(shù)據(jù),能夠獲得與文獻(xiàn)[10](基于有監(jiān)督學(xué)習(xí)支持向量機(jī)分類算法,同時采用時空步態(tài)數(shù)據(jù)、足-地反作用力步態(tài)數(shù)據(jù)、下肢關(guān)節(jié)角度步態(tài)數(shù)據(jù))相近的最大分類正確率。僅從足-地反作用力的步態(tài)數(shù)據(jù)來看,采用筆者提出的分類算法得到的最終分類正確率高于文獻(xiàn)[10]中的分類正確率5%,表明大量未標(biāo)注的步態(tài)數(shù)據(jù)蘊(yùn)含大量與人體步態(tài)功能變化密切相關(guān)的變異信息,對于改善步態(tài)分類算法性能和評價老年人步態(tài)極其重要。此外,分別對垂直和前后方向足-地反作用力數(shù)據(jù)進(jìn)行分析。從表3中的結(jié)果看到,基于垂直方向的足-地反作用力步態(tài)數(shù)據(jù)的最終分類正確率明顯優(yōu)于基于水平方向足-地反作用力步態(tài)數(shù)據(jù)的最終分類正確率,說明垂直方向足-地反作用力中的步態(tài)特征參數(shù)(如足跟著地時的最大承受力Fz1、全足著地時的最小承受力Fz2等)能夠提供更多的表達(dá)轉(zhuǎn)化為老年人步態(tài)的變異信息,這個結(jié)果與文獻(xiàn)[2,5,16]的研究結(jié)果一致。
本研究提出的基于小波熵的自訓(xùn)練半監(jiān)督支持向量機(jī)步態(tài)分類算法,能夠充分利用大量未標(biāo)注的足-地反作用力步態(tài)數(shù)據(jù),獲取步態(tài)數(shù)據(jù)內(nèi)在與人體步態(tài)功能變異密切相關(guān)的有價值信息,改善步態(tài)分類算法性能,準(zhǔn)確鑒別青年和老年的步態(tài)模式,可有效評價人體步態(tài)變化,為量化評價老年人步態(tài)提供了新思路和新方法。今后的工作嘗試是將本研究提出的算法應(yīng)用于時空步態(tài)數(shù)據(jù)、運(yùn)動學(xué)等不同類型步態(tài)數(shù)據(jù)的分析,進(jìn)一步探討老年人步態(tài)變異機(jī)制的相關(guān)研究內(nèi)容。
[1]中華人民共和國衛(wèi)生部疾病預(yù)防控制局.老年人跌倒干預(yù)技術(shù)指南[EB/OL].http://www.moh.gov.cn,2011-09-06/2012-11-20.
[2]Giannini S,Catani F,Benedetti MG,et al.Gait analysis:Methodologies and clinical applications[M] //Benedetti MG,eds.Terminology,Parameterization and Normalization in Gait Analysis.Amsterdam:IOS Press,1994:65 -88.
[3]Brach JS,Perera S,Studenski S,et al.Meaningful change in measures of gait variability in older adults[J].Gait and Posture,2010,31(2):175-179.
[4]Nigg BM,Skleryk BN.Gait characteristics of the elderly[J].Clinical Biomechanics,1988,3(2):79-87.
[5]Fran?ois P,Hélène C,Réjean H.Gait in the elderly[J].Gait and Posture,1997,5(2):128-135.
[6]Chau T.A review of analytical techniques for gait data.Part 2:Neural network and wavelet methods[J].Gait and Posture,2001,13:102-120.
[7]Wu Jianning,Wang Jue,Liu Li.Feature extraction via KPCA for classification of gait patterns[J].Human Movement Science,2007,26(3):393-411.
[8]Begg RK,Palaniswami M,Owen B.Support vector machines for automated gait classification[J].IEEE Trans on Biomedical Engineering,2005,52(9):828-838.
[9]Khandoker AH,Lai DT,Begg RK,et al.Wavelet-based feature extraction for support vector machines for screening balance impairments in the elderly[J].IEEE Trans on Neural Systems and Rehabilitation Engineering,2007,15(4):587-97.
[10]Begg RK,Kamruzzaman J.A machine learning approach for automated recognition of movement patterns using basic,kinetic and kinematic gait data [J].Journal of Biomechanics,2005,38:401-408.
[11]Reginaldo K,F(xiàn)ukuchi B,Bjoern M,et al.Support vector machines for detecting age-related changes in running kinematics[J].Journal of Biomechanics,2011,44(3):540 -542.
[12]堯德中,劉鐵軍,雷 旭,等.基于腦電的腦-機(jī)接口:關(guān)鍵技術(shù)和應(yīng)用前景 [J].電 子 科 技 大 學(xué) 學(xué) 報,2009,38(5):550-553.
[13]王金甲,賈敏.標(biāo)簽均值的自訓(xùn)練半監(jiān)督支持向量機(jī)用于EEG分類[J].中國生物醫(yī)學(xué)工程學(xué)報,2011,30(5):666-672.
[14]Chapelle O,Scholkopf B,Zien A.Semi-supervised Learning[M]//JoachimsT,eds. Transductive SupportVector Machines.Cambridge:MIT Press,2006:101 -112.
[15]吳建寧,伍濱,王玨.用小波熵評價人體步態(tài)變化[J].航天醫(yī)學(xué)與醫(yī)學(xué)工程,2009,22(6):437-442.
[16]Begg RK,Rahman SM.A method for the reconstruction of ground reaction force-time characteristics during gait from force platform recordings of simultaneous foot falls[J].IEEE Trans on Biomedical Engineering,2000,47:547-551.
[17]Chang CC,Lin CJ.LIBSVM:a library for support vector machine[EB/CP].http://www.csie.ntu.edu.tw/~ cjlin/libsvm,2009-05-01/2012-11-20.