陳慶果,彭 彪,楊世軍,廖方萍
●博士(生)論壇 Doctor Forum
基于神經(jīng)網(wǎng)絡(luò)模型的加速度計(jì)活動(dòng)強(qiáng)度算法研究
陳慶果,彭 彪,楊世軍,廖方萍
旨在引入神經(jīng)網(wǎng)絡(luò)算法以提高加速度計(jì)活動(dòng)強(qiáng)度的預(yù)測(cè)準(zhǔn)確性,以44名大學(xué)生(男女各22名)為樣本,讓其同時(shí)佩戴氣體代謝分析儀Cosmed K4B2和加速度計(jì)(Actigraph-GT3X)進(jìn)行3類(lèi)11項(xiàng)體力活動(dòng)(每項(xiàng)活動(dòng)5min),使用Matlab7.0軟件運(yùn)用留一法交叉驗(yàn)證BP神經(jīng)網(wǎng)絡(luò)模型,通過(guò)其與Hendleman模型和Crouter模型在RMSE、Bias和B-A圖上的橫向比較評(píng)估其效度。結(jié)果顯示3-18-1的三層神經(jīng)網(wǎng)絡(luò)模型(參數(shù):誤差率0.001、初始學(xué)習(xí)率0.02、動(dòng)量常量0.7)的RMSE為1.08,在B-A圖上一致性區(qū)間之外的點(diǎn)占總數(shù)的4.3%、一致性界限差值的絕對(duì)值為2.7,每分鐘活動(dòng)強(qiáng)度(除騎行外)的分類(lèi)準(zhǔn)確性分別為84.3%(小強(qiáng)度)、83.2%(中等強(qiáng)度)和89.8%(大強(qiáng)度),神經(jīng)網(wǎng)絡(luò)模型在整體強(qiáng)度和各個(gè)活動(dòng)項(xiàng)目強(qiáng)度的預(yù)測(cè)上的準(zhǔn)確性均好于Hendleman和Crouter模型,并且在活動(dòng)強(qiáng)度分類(lèi)準(zhǔn)確性上更優(yōu)。未來(lái)應(yīng)進(jìn)一步探究機(jī)器學(xué)習(xí)中其它算法在該領(lǐng)域的應(yīng)用,優(yōu)化整合指標(biāo)體系和各類(lèi)模型之間的關(guān)系。
神經(jīng)網(wǎng)絡(luò)模型;加速度計(jì);活動(dòng)強(qiáng)度;預(yù)測(cè)
加速度計(jì)原始數(shù)據(jù)轉(zhuǎn)換為活動(dòng)強(qiáng)度(METs)的算法問(wèn)題一直是體力活動(dòng)測(cè)量領(lǐng)域的核心和難點(diǎn)。早期的方法是在試驗(yàn)室情景下同時(shí)獲取加速度和運(yùn)動(dòng)能耗數(shù)據(jù),將加速度原始數(shù)據(jù)轉(zhuǎn)換為count數(shù)值后建立與METs的回歸方程,如Freedson方程[1]、Hendleman方程[2]、Swartz方程[3]和Yngve方程[4]均是此類(lèi)方程。此類(lèi)方法最主要的局限在于單個(gè)回歸方程難以擬合各種類(lèi)型的體力活動(dòng),基于走跑運(yùn)動(dòng)建立的方程預(yù)測(cè)生活方式活動(dòng)強(qiáng)度的誤差較大,反之亦然[5];并且整體上存在著低團(tuán)體誤差、高個(gè)體誤差的問(wèn)題,在個(gè)體運(yùn)動(dòng)健身指導(dǎo)中的實(shí)用性不強(qiáng)[6]。針對(duì)上述問(wèn)題,CROUTER等[7]利用count值的變異系數(shù)將活動(dòng)分為靜息狀態(tài)、走跑運(yùn)動(dòng)和生活活動(dòng),并分別建立相應(yīng)的回歸方程。目前在國(guó)內(nèi)外廣泛使用的Actigraph加速計(jì)配套軟件Actlife6.11的METs方程中,12個(gè)預(yù)測(cè)方程均是以線性回歸為內(nèi)核來(lái)建構(gòu)的,其預(yù)測(cè)的效度有待提高。王歡等[8]的研究表明加速度計(jì)數(shù)與METs之間有著一定的相關(guān)關(guān)系,但經(jīng)過(guò)公式轉(zhuǎn)換預(yù)測(cè)能耗值后,相關(guān)關(guān)系明顯減弱,預(yù)測(cè)能耗的算法一定程度上影響著加速度計(jì)測(cè)量的準(zhǔn)確性。已有研究摒棄線性模型,應(yīng)用支鏈方程[9]或時(shí)間序列模型[10]來(lái)預(yù)測(cè)能耗以提高其準(zhǔn)確性,但這些方法均使用原始數(shù)據(jù)積分求得周期內(nèi)的count值,舍棄了原始加速度信號(hào)中蘊(yùn)含的豐富信息[11],所以該領(lǐng)域主要的問(wèn)題在于:(1)線性回歸方程很難有效的整合眾多的特征指標(biāo);(2)指標(biāo)的數(shù)量和信息含量之間的優(yōu)化是一個(gè)難題。因此,原始信號(hào)特征指標(biāo)的選擇和預(yù)測(cè)活動(dòng)強(qiáng)度模型的應(yīng)用是一個(gè)核心問(wèn)題。
機(jī)器學(xué)習(xí)方法的興起,為學(xué)者們解決上述問(wèn)題提供了一個(gè)新的思路,已有研究試圖充分挖掘和整合原始信號(hào)的信息,SABATINI團(tuán)隊(duì)[12]利用馬爾科夫模型來(lái)確定體力活動(dòng)的類(lèi)型,此外還有研究者利用決策樹(shù)模型[13],向量機(jī)分類(lèi)模型[14]等模型來(lái)對(duì)活動(dòng)進(jìn)行分類(lèi),上述的研究則將重心放置在活動(dòng)類(lèi)型的識(shí)別上面,而在活動(dòng)強(qiáng)度的預(yù)測(cè)方面則還很少見(jiàn)報(bào)告。
在眾多的機(jī)器學(xué)習(xí)算法中,人工神經(jīng)網(wǎng)絡(luò)模型因其具有較強(qiáng)的非線性映射能力和良好的自學(xué)習(xí)、自適應(yīng)和容錯(cuò)能力,而被廣泛使用,該算法是在模擬人腦神經(jīng)組織的基礎(chǔ)上而發(fā)展起來(lái)的計(jì)算系統(tǒng),特別適宜在包括大量干擾信息的復(fù)雜的情況下使用,提供準(zhǔn)確的預(yù)測(cè)。
綜上所述,有必要豐富以線性回歸為基礎(chǔ)的能耗預(yù)測(cè)算法,將機(jī)器學(xué)習(xí)算法引入到能耗預(yù)測(cè)的研究中來(lái)。因此,本研究旨在將機(jī)器學(xué)習(xí)中廣泛使用的神經(jīng)網(wǎng)絡(luò)模型引入到能耗預(yù)測(cè)中,并將其預(yù)測(cè)的準(zhǔn)確性與傳統(tǒng)經(jīng)典的算法的進(jìn)行橫向?qū)Ρ?,力圖減少因算法帶來(lái)的預(yù)測(cè)誤差。
1.1 研究對(duì)象
受試者為44名在校非體育專(zhuān)業(yè)大學(xué)生(男女各22名),所有人員身體健康,無(wú)運(yùn)動(dòng)禁忌癥,測(cè)試前簽署知情同意書(shū)(見(jiàn)表1)。
表1 本研究受試者基本特征一覽表Table1 The Anthropometry Characteristics of Participant
1.2 測(cè)量?jī)x器
采用恒康家業(yè)HK-600身高體重儀測(cè)量受試者身高和體重,使用韓國(guó)VIVENTE-GOLD體成分儀測(cè)量體脂率。使用美國(guó)產(chǎn)Actigraph-GT3X(以下簡(jiǎn)稱(chēng)GT3X)加速度計(jì)同步監(jiān)測(cè)受試者體力活動(dòng)情況,GT3X是目前應(yīng)用最為廣泛的三軸加速度計(jì),測(cè)試中統(tǒng)一將Actigraph用彈性腰帶固定在受試者右側(cè)髖部、肚臍水平的高度。GT3X的時(shí)間校對(duì)及受試者信息的錄入工作在配套的Actilife6.11軟件中進(jìn)行,后期在該軟件上導(dǎo)出每秒三軸合成的count數(shù)值。
以間接測(cè)熱法實(shí)時(shí)記錄受試者的體力活動(dòng)能耗并作為參考校標(biāo),使用的儀器設(shè)備為意大利產(chǎn)的Cosmed K4b2(簡(jiǎn)稱(chēng)K4b2)。為保障測(cè)量精度,每天測(cè)試前均對(duì)儀器進(jìn)行預(yù)熱和定標(biāo)。測(cè)試中,測(cè)試人員在每分鐘第1秒按壓儀器主機(jī)上的Enter鍵開(kāi)始正式記錄數(shù)據(jù),確保GT3X和K4b2在每分鐘內(nèi)監(jiān)測(cè)的數(shù)據(jù)同步。
1.3 測(cè)試方案
正式測(cè)試前受試者完成身高、體重和體成分的測(cè)量后佩戴上K4B2安靜坐立10m in,以適應(yīng)該儀器。測(cè)試時(shí)需依次完成3類(lèi)11項(xiàng)活動(dòng)(見(jiàn)表2),每項(xiàng)活動(dòng)時(shí)間為5min,各項(xiàng)活動(dòng)之間的間隔時(shí)間依據(jù)心率恢復(fù)情況而定(1~5m in),每項(xiàng)活動(dòng)取其中第2~4分鐘的數(shù)據(jù)進(jìn)行分析。躺、靜坐和站立時(shí),受試者自我選擇舒適的躺姿、坐姿和站姿,身體放松。打字時(shí),受試者按照平時(shí)打字速度將紙質(zhì)文檔上的內(nèi)容轉(zhuǎn)換為電子文檔。掃地時(shí)要求受試者模擬平時(shí)掃地的狀態(tài)把工作人員事先撒在地面上的紙屑進(jìn)行清掃。整理書(shū)桌時(shí),工作人員把70本編號(hào)的書(shū)籍完全打亂后鋪在2.4m×1.0m的條桌上,受試者需按照編號(hào)重新將書(shū)歸置好。功率車(chē)使用Ergometer900,功率為男性受試者體重× 0.980,女性受試者體重×0.784[15],速度分別為70 r/m in和100 r/ m in。走跑類(lèi)活動(dòng)在德國(guó)產(chǎn)h/p/cosmos公司(生產(chǎn))的Pular跑臺(tái)上進(jìn)行,跑速分別為2 km/h、6 km/h和8 km/h,分別模擬漫步、快走和慢跑的狀態(tài)。
表2 體力活動(dòng)項(xiàng)目一覽表Table2 Listo f Physica lActivies
所有測(cè)試均在室內(nèi)完成,測(cè)試時(shí)間為每日08:30—11:30,14:30—17:30和18:30—21:30。室內(nèi)溫度為18~25℃,相對(duì)濕度為50%~60%。
1.4 數(shù)據(jù)統(tǒng)計(jì)
數(shù)據(jù)處理時(shí),首先在加速度計(jì)的配套軟件上導(dǎo)出每秒三軸合成的count值后計(jì)算提取每分鐘的特征指標(biāo)(見(jiàn)研究結(jié)果部分),并導(dǎo)出每分鐘的count數(shù)值,按照Hendleman公式和Courter公式使用SPSS17.0軟件分別計(jì)算出2個(gè)模型中每分鐘的METs,然后與K4B2配套軟件中提取的每分鐘METs值一一對(duì)應(yīng)。
利用matlab7.0軟件,采用留一法交叉驗(yàn)證建立神經(jīng)網(wǎng)絡(luò)模型并評(píng)估其測(cè)量的準(zhǔn)確性,具體方法為將每1個(gè)受試者作為測(cè)試樣本,其它n-1個(gè)受試者作為訓(xùn)練樣本,得到n個(gè)測(cè)試結(jié)果、用n個(gè)結(jié)果的平均值來(lái)衡量模型的性能(模型具體建構(gòu)過(guò)程在研究結(jié)果部分呈現(xiàn))。采用SPSS17.0軟件計(jì)算神經(jīng)網(wǎng)絡(luò)模型,Hendleman模型和Crouter模型的均方根誤差(root-mean-square error,RMSE)、平均絕對(duì)百分誤差(mean absolute percentage error,MAPE)和平均百分誤差(Bias)比較各模型測(cè)量的準(zhǔn)確性,使用Medacle12.0軟件繪制Bland-altman圖比較各模型預(yù)測(cè)值和實(shí)測(cè)值之間的一致性。
因考慮向劍鋒[16]、HARRELL[17]和PUYAU[18]等的研究均已經(jīng)表明METs與性別因素?zé)o顯著性相關(guān),性別不是影響METs的因素,故本研究不將性別變量引入到預(yù)測(cè)方程中,在后續(xù)的模型驗(yàn)證中也不按照性別因素進(jìn)行分類(lèi)驗(yàn)證與統(tǒng)計(jì)。
2.1 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的構(gòu)建
神經(jīng)網(wǎng)絡(luò)是一種非線性統(tǒng)計(jì)性數(shù)據(jù)建模工具,能夠依據(jù)計(jì)算誤差反向傳播來(lái)進(jìn)行自主學(xué)習(xí),基本模型一般有3層結(jié)構(gòu)(輸入層、隱層和輸出層),該模型通過(guò)處理大量的輸入變量和輸出變量擬合出貼近的映射關(guān)系,得出非線性模型。與傳統(tǒng)算法最主要的區(qū)別是不需輸入變量權(quán)值、映射關(guān)系等就能自主完成運(yùn)算,是一個(gè)“黑箱”模型,適用于預(yù)測(cè)研究,已在多個(gè)領(lǐng)域廣泛應(yīng)用[19]。
2.1.1 活動(dòng)強(qiáng)度預(yù)測(cè)模型的輸入端變量的確定 所有Actigrph中的METs預(yù)測(cè)模型的輸入指標(biāo)均為單位時(shí)間內(nèi)(通常為1 min)加速度原始數(shù)據(jù)的積分值,也就是俗稱(chēng)的count值,其主要優(yōu)點(diǎn)為單一指標(biāo)的信息含量大,適宜進(jìn)入線性方程進(jìn)行分析,但缺點(diǎn)是犧牲了大量原始數(shù)據(jù)里蘊(yùn)含的豐富信息。
鑒于此,本研究認(rèn)為輸入指標(biāo)應(yīng)滿(mǎn)足以下原則:(1)充分發(fā)揮神經(jīng)網(wǎng)絡(luò)模型的優(yōu)勢(shì),盡量統(tǒng)合好信息的挖掘和指標(biāo)的集約;(2)以Actigraph軟件中的指標(biāo)為基礎(chǔ)以避免二次開(kāi)發(fā),便于普及。因此,在查閱文獻(xiàn)考察眾多指標(biāo)后,決定將每分鐘內(nèi)每秒鐘的count值的10th、25th、50th、75th、90th以及滯后一階自相關(guān)作為輸入指標(biāo)。該指標(biāo)群信息含量豐富,在各百分位數(shù)中,中間3個(gè)百分位數(shù)通常被箱體圖用來(lái)表征數(shù)據(jù)分布,10th和90th常在信號(hào)處理中用來(lái)反映穩(wěn)定狀態(tài)下單位時(shí)間內(nèi)的低值和高值,同時(shí)標(biāo)準(zhǔn)差、變異系數(shù)等信息也部分暗含在指標(biāo)群中。自相關(guān)系數(shù)則能夠考察count數(shù)值的動(dòng)態(tài)變化特征。神經(jīng)網(wǎng)絡(luò)模型具有較強(qiáng)的自適應(yīng)性,能夠挖掘上述指標(biāo)中蘊(yùn)含的豐富信息。本研究中各體力活動(dòng)矢量計(jì)數(shù)的百分位數(shù)描述見(jiàn)表3。
表3 各活動(dòng)矢量計(jì)數(shù)的百分位數(shù)均值(n=132)Table3 The Mean o f the Percentiles for Countof PhysicalActivities(n=132)
2.1.2 輸入數(shù)據(jù)的歸一化處理 為預(yù)防網(wǎng)絡(luò)出現(xiàn)麻痹,對(duì)輸入數(shù)據(jù)進(jìn)行了適當(dāng)轉(zhuǎn)換,使用公式Y(jié)=(X-Xmin)/(Xmax-Xmin),將所有數(shù)據(jù)進(jìn)行歸一化處理,使其取值位于0~1之間。
2.1.3 模型參數(shù)的設(shè)定 傳統(tǒng)的BP神經(jīng)網(wǎng)路容易出現(xiàn)下述問(wèn)題:(1)局部極小值;(2)收斂速度慢[20]。為克服上述問(wèn)題,本研究采用動(dòng)量—學(xué)習(xí)率自適應(yīng)調(diào)整算法來(lái)優(yōu)化BP神經(jīng)網(wǎng)絡(luò),初始學(xué)習(xí)率范圍選取在0.01~0.2之間;動(dòng)量取值在0.5~0.9之間;調(diào)用Matlab神經(jīng)網(wǎng)絡(luò)工具箱中的Trainbpx函數(shù)進(jìn)行學(xué)習(xí)和訓(xùn)練。
此外,為保證測(cè)量的精確性,將測(cè)量誤差設(shè)定為0.001。在模型訓(xùn)練的上機(jī)試驗(yàn)表明,當(dāng)網(wǎng)絡(luò)迭代次數(shù)在2 000次以上時(shí),測(cè)試樣本誤差不再增加,故本研究應(yīng)用“強(qiáng)制停止”的方法將2 000次作為停止訓(xùn)練的標(biāo)準(zhǔn),以防止出現(xiàn)過(guò)度訓(xùn)練的現(xiàn)象。
2.1.4 隱層節(jié)點(diǎn)數(shù)的確定 在BP神經(jīng)網(wǎng)絡(luò)中,隱含層節(jié)點(diǎn)數(shù)的確定往往是網(wǎng)絡(luò)成敗的關(guān)鍵,節(jié)點(diǎn)數(shù)太少,網(wǎng)絡(luò)獲取樣本信息的能力差,預(yù)測(cè)精度受影響;若隱層節(jié)點(diǎn)數(shù)過(guò)多,則容易產(chǎn)生過(guò)度擬合問(wèn)題,降低泛化能力[21]。本研究采用試湊法確定隱層節(jié)點(diǎn)數(shù),采用m=log2n(m:隱層節(jié)點(diǎn)數(shù);n:輸入層節(jié)點(diǎn)數(shù))確定初始隱層節(jié)點(diǎn)數(shù)四舍五入后為3,然后逐級(jí)增加節(jié)點(diǎn)數(shù),從而確定留一交叉驗(yàn)證中RMSE最小時(shí)的節(jié)點(diǎn)數(shù)。由圖1可見(jiàn)當(dāng)隱層節(jié)點(diǎn)數(shù)大于或等于18后,RMSE幾乎保持在一個(gè)水平線上窄幅波動(dòng),因此,本研究將模型隱層節(jié)點(diǎn)數(shù)設(shè)置為18。
圖1 各隱層節(jié)點(diǎn)數(shù)神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)誤差圖Figure1 Predictive ErrorofNeuralModel for the NumberofNodes in Each Hidden Layer
2.1.5 模型的確定 通過(guò)對(duì)網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)的多次調(diào)整和比較,最終選擇3-18-1三層結(jié)構(gòu)的學(xué)習(xí)率—?jiǎng)恿孔赃m應(yīng)算法,誤差率設(shè)為0.001,初始學(xué)習(xí)率為0.02,動(dòng)量常量設(shè)為0.7,用[0,1]區(qū)間對(duì)輸入數(shù)據(jù)進(jìn)行歸一化處理,進(jìn)行上限為2 000次迭代的運(yùn)算以得到神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)構(gòu)。
2.2 模型測(cè)量準(zhǔn)確性評(píng)估
本研究選取2種具有典型算法意義的模型與神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測(cè)準(zhǔn)確性的比較,一個(gè)為Hendleman回歸模型,該模型不對(duì)活動(dòng)類(lèi)型進(jìn)行識(shí)別,采用單個(gè)回歸方程預(yù)測(cè)各種類(lèi)型的活動(dòng),并且以生活方式體力活動(dòng)為主要構(gòu)建模型;另外一個(gè)為Crouter兩段回歸模型,該模型首先利用矢量計(jì)數(shù)的CV對(duì)活動(dòng)進(jìn)行分類(lèi),將活動(dòng)分為周期性活動(dòng)和生活方式類(lèi)活動(dòng),然后分別采用不同的回歸方程進(jìn)行能耗預(yù)測(cè),2個(gè)模型的公式見(jiàn)表4。2.2.1 神經(jīng)網(wǎng)絡(luò)模型總體預(yù)測(cè)準(zhǔn)確性的比較 由表5可見(jiàn)無(wú)論包不包含騎行類(lèi)活動(dòng),在MAPE和RMSE 2個(gè)指標(biāo)上均是神經(jīng)網(wǎng)絡(luò)<Crouter<Hendleman;而在Bias指標(biāo)上,則是Crouter最低,結(jié)合MAPE指標(biāo),表明Crouter預(yù)測(cè)的正負(fù)偏差存在較大的抵消。不含有騎行類(lèi)項(xiàng)目后,3個(gè)模型在3個(gè)指標(biāo)上的數(shù)值都大幅度下降,表明3個(gè)模型對(duì)騎行類(lèi)項(xiàng)目的預(yù)測(cè)均有較大的誤差,這與HEKLER等[22]的研究結(jié)果一致。
表4 Henlem an模型和Crouter模型Table4 Formu la ofHendleman Modeland CrouterMode l
表5 各模型整體測(cè)量誤差Table5 The OverallMeasurementError of each Model
注:Bias=∑(X預(yù)測(cè)-X實(shí)測(cè))/X實(shí)測(cè)/n;MAPE=(∑| X預(yù)測(cè)-X實(shí)測(cè)|/ X實(shí)測(cè))/n;RMSE=;n1=44個(gè)(受試者)×3m in(每項(xiàng)活動(dòng)統(tǒng)計(jì)時(shí)間)×9項(xiàng)活動(dòng)=1 188m in;n2=44個(gè)(受試者)×3m in(每項(xiàng)活動(dòng)統(tǒng)計(jì)時(shí)間)×11項(xiàng)活動(dòng)=1 452m in(下同)。
以每個(gè)受試者的每1項(xiàng)活動(dòng)(去除自行車(chē)項(xiàng)目)為檢驗(yàn)單元,使用B-A圖對(duì)3個(gè)算法方程與間接測(cè)熱法的一致性進(jìn)行進(jìn)一步的分析,圖2到圖4中x軸為算法預(yù)測(cè)值和實(shí)測(cè)值的均值,y軸為預(yù)測(cè)值和實(shí)測(cè)值的差值,兩條虛線為一致性界限表示差值95%的置信區(qū)間,中間的實(shí)線為差值的均值。神經(jīng)網(wǎng)絡(luò)模型、Crouter模型和Hendleman模型的差值的均線分別為-0.1、0.0和-0.3,一致性界限差值的絕對(duì)值分別為2.7、5.7和5.8,在一致性區(qū)間之外的點(diǎn)分別為17個(gè)、21個(gè)和27個(gè)。分別占總數(shù)量的4.3%、5.3%和6.8%。從以上數(shù)據(jù)綜合判斷,神經(jīng)網(wǎng)絡(luò)模型和間接測(cè)熱法的一致性水平最好。
圖2 神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)活動(dòng)強(qiáng)度的B-A圖Figure2 The B-A Plotof Activity Intensity Predicted by Neural Network Model
以3METs、6METs為界值,利用實(shí)測(cè)值將每分鐘活動(dòng)分為小強(qiáng)度體力活動(dòng)、中等強(qiáng)度體力活動(dòng)和大強(qiáng)度體力活動(dòng)。由表6可知,神經(jīng)網(wǎng)絡(luò)模型在包含或不包含騎行項(xiàng)目的情況下,在各個(gè)強(qiáng)度上歸類(lèi)的準(zhǔn)確性均優(yōu)于其他2個(gè)模型。騎行項(xiàng)目整體上大幅度降低了各模型歸類(lèi)的準(zhǔn)確性。
2.2.2 神經(jīng)網(wǎng)絡(luò)模型在各活動(dòng)項(xiàng)目預(yù)測(cè)準(zhǔn)確性 表7顯示的是3個(gè)模型在各類(lèi)體力活動(dòng)上的預(yù)測(cè)誤差,在各活動(dòng)的RMSE指標(biāo)上,神經(jīng)網(wǎng)絡(luò)模型的數(shù)值最低,表明該模型對(duì)各類(lèi)活動(dòng)的預(yù)測(cè)誤差最小。圖5的矩形分別顯示神經(jīng)網(wǎng)絡(luò)模型在各個(gè)活動(dòng)項(xiàng)目上實(shí)測(cè)值和預(yù)測(cè)值的個(gè)體間變異,在除騎行和慢走外的其他項(xiàng)目上,神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)值的個(gè)體間變異均小于實(shí)測(cè)值上的變異。
圖3 Crouter模型預(yù)測(cè)活動(dòng)強(qiáng)度的B-A圖Figure3 The B-A Plotof Activity Intensity Predicted by Crouter Model
圖4 Hend lem an模型預(yù)測(cè)活動(dòng)強(qiáng)度的B-A圖Figure4 The B-A Ploto f Activity Intensity Predicted by Hend lem anModel
表6 各模型活動(dòng)強(qiáng)度分類(lèi)準(zhǔn)確性/%Table6 Classification AccuracyofEachModelon Activity Intensity/%
從預(yù)測(cè)值-實(shí)測(cè)值的散點(diǎn)圖上看(見(jiàn)圖6),神經(jīng)網(wǎng)絡(luò)模型的散點(diǎn)整體上最為靠近參考線(y=x),結(jié)合表7的Bias指標(biāo),在總共11個(gè)活動(dòng)中,除騎行和慢跑活動(dòng)外,其他活動(dòng)能耗均被低估,但數(shù)值均小于Courter模型和Hendleman模型,其中7個(gè)活動(dòng)的預(yù)測(cè)誤差在±10%以?xún)?nèi),2個(gè)活動(dòng)在±(10%~20%),2個(gè)活動(dòng)在20%以上。
3.1 試驗(yàn)設(shè)計(jì)方案的分析
本研究使用的Actigraph-GT3X為三軸加速度傳感器,是目前在國(guó)內(nèi)外科研領(lǐng)域最廣為應(yīng)用的運(yùn)動(dòng)能耗監(jiān)測(cè)儀,除了原始數(shù)據(jù)獲取的可靠性外,能耗方程的預(yù)測(cè)精度至關(guān)重要。Actigraph應(yīng)用軟件中Actilife6.0中預(yù)測(cè)METs的12個(gè)方程中9個(gè)方程均是建立在跑臺(tái)試驗(yàn)的基礎(chǔ)上。然而,朱琳等[23]和HENDLE-MAN等[24]認(rèn)為要提高方程預(yù)測(cè)日常體力活動(dòng)的準(zhǔn)確性有必要采用走/跑與日常體力活動(dòng)相組合的試驗(yàn)方案。因此本研究用于比較的Hendleman模型是建立在步行及其他10余類(lèi)非走/跑類(lèi)活動(dòng)的基礎(chǔ)上的,而Crouter公式建立所依據(jù)的運(yùn)動(dòng)方案囊括了45項(xiàng)活動(dòng)。已有研究證實(shí)上述方程預(yù)測(cè)長(zhǎng)時(shí)間體力活動(dòng)總能耗相比其他的方程具有優(yōu)勢(shì)[25],但BASSET的研究[26]表示Hendleman公式預(yù)測(cè)具體不同種類(lèi)體力活動(dòng)的預(yù)測(cè)誤差波動(dòng)較大,這可能與試驗(yàn)方案中上肢相關(guān)運(yùn)動(dòng)過(guò)多有關(guān)系。
表7 各模型在各個(gè)項(xiàng)目上的預(yù)測(cè)誤差(n=132)Table 7 The Prediction Error ofEach Mode lin Each Activity(n=132)
圖5 各項(xiàng)活動(dòng)實(shí)測(cè)值和預(yù)測(cè)值METs的組內(nèi)變異Figure5 Measured and Eatim ated METs for Each Activity w ith SDs
圖6 各模型預(yù)測(cè)值和實(shí)測(cè)值之間的散點(diǎn)圖Figure6 Scatter PlotBetween Measured and Estim ated METs for Each Model
由上述分析可以看出,在構(gòu)建加速度能耗算法時(shí),在選擇適宜數(shù)量的體力活動(dòng)的同時(shí)還要兼顧體力活動(dòng)的類(lèi)型。因此,本研究選擇了3種靜息類(lèi)、3種生活方式類(lèi)和5種周期類(lèi)的活動(dòng)混合組成運(yùn)動(dòng)方案。本研究活動(dòng)方案的設(shè)計(jì)既考慮肢體運(yùn)動(dòng)特征,又結(jié)合了不同的活動(dòng)強(qiáng)度。其中躺、靜坐和站立是上下肢均保持靜止的休息類(lèi)活動(dòng),打字是有少量上肢參與的坐姿體力活動(dòng),整理書(shū)桌是以上肢為主的站姿活動(dòng),而掃地則是上、下肢均參與的不規(guī)律移動(dòng)的活動(dòng)。
3.2 原始信號(hào)特征指標(biāo)的提取和選擇
本研究以count.sec-1為單位,計(jì)算每分鐘count的10th、25th、50th、75th、90th,該模型輸入指標(biāo)的選擇具有一定的經(jīng)驗(yàn)主義的色彩,但從實(shí)踐效果上看達(dá)到了預(yù)期,本研究嘗試去除5個(gè)百分位數(shù)中的任何一個(gè),結(jié)果表明預(yù)測(cè)成績(jī)都會(huì)大幅度下降。同時(shí)本研究還用不同百分位數(shù)組合進(jìn)行了嘗試,由表8可見(jiàn)本研究使用的組合預(yù)測(cè)效果最佳,但也不排除有更優(yōu)排列組合的可能。但應(yīng)該認(rèn)識(shí)到所利用的count.sec-1就是每秒原始數(shù)據(jù)的積分值(原始數(shù)據(jù)與x軸圍成的面積),其它指標(biāo)例如某些頻域類(lèi)指標(biāo)可能更能反映原始數(shù)據(jù)中的時(shí)間動(dòng)態(tài)信息,例如ROTHNEY等[27]就將中位數(shù)、四分位差、峰度系數(shù)、偏度系數(shù)等12個(gè)指標(biāo)作為輸入層,該研究指標(biāo)豐富,但并沒(méi)有介紹上述指標(biāo)選入的依據(jù),可能存在著指標(biāo)間提供信息重合的現(xiàn)象。因此,未來(lái)需進(jìn)一步加強(qiáng)指標(biāo)體系組合的探究,以及指標(biāo)與模型整合優(yōu)化的探討。
表8 神經(jīng)網(wǎng)絡(luò)模型中各輸入指標(biāo)組合的預(yù)測(cè)誤差(含騎行,n=1 452)Table 8 Predictive Errors of Combination of Input Indices in Neura lNetwork
3.3 方程對(duì)不同類(lèi)型體力活動(dòng)的強(qiáng)度預(yù)測(cè)效度
由本研究的試驗(yàn)數(shù)據(jù)可知,Hendleman方程對(duì)生活方式類(lèi)的體力活動(dòng)評(píng)估較為準(zhǔn)確,會(huì)嚴(yán)重高估靜息類(lèi)的活動(dòng)是因其方程的截距為2.922METs,在打字、站立、躺和靜坐等count較低的體力活動(dòng)中,該方程推算出來(lái)的活動(dòng)強(qiáng)度至少為2.922 METs,但實(shí)際的強(qiáng)度約為1.2~1.5METs,由此可見(jiàn)該方程嚴(yán)重高估了靜息類(lèi)活動(dòng)的能量消耗,類(lèi)似Hendleman這樣的單一回歸模型如Freedson模型和Swarts模型也存在該問(wèn)題,而這些模型均屬于單一的能耗回歸模型,該方法利用加速度計(jì)count值和實(shí)測(cè)能量值建立回歸方程,學(xué)者們力圖通過(guò)更為豐富的試驗(yàn)活動(dòng)方案來(lái)優(yōu)化回歸方程,但發(fā)現(xiàn)很難用單一模型去預(yù)測(cè)各種類(lèi)型的體力活動(dòng)。
而在本研究中的Courter模型屬于分段式模型。把count. m in-1≤8的活動(dòng)定義為靜息類(lèi)活動(dòng),賦值為METs,雖然說(shuō)會(huì)低估靜息類(lèi)活動(dòng)強(qiáng)度,但預(yù)測(cè)的誤差相比Hendleman模型已經(jīng)大幅度下降。在Count值的基礎(chǔ)上再根據(jù)CV,把活動(dòng)區(qū)分為生活方式類(lèi)體力活動(dòng)和走跑類(lèi)體力活動(dòng),并分別使用不同的回歸方程,這種方程在本研究的優(yōu)勢(shì)已體現(xiàn):該方程在生活方式活動(dòng)和走跑活動(dòng)預(yù)測(cè)的準(zhǔn)確性比較一致,波動(dòng)較少。
但Hendleman方程和Freeson方程均是以回歸的方法來(lái)建立,要求輸入的自變量之間要相對(duì)獨(dú)立,避免多重共線性,這使得模型同時(shí)輸入多個(gè)特征指標(biāo)受限,不能充分的利用原始數(shù)據(jù)中蘊(yùn)含的信息,因此影響預(yù)測(cè)精度的提高空間。近年來(lái)機(jī)器學(xué)習(xí)算法的興起為算法的優(yōu)化提供了一個(gè)全新的視角,該類(lèi)方法在加速度特征指標(biāo)與能耗之間沒(méi)有事先預(yù)設(shè)模型,而是通過(guò)從數(shù)據(jù)里提取規(guī)則或創(chuàng)建模型來(lái)把數(shù)據(jù)轉(zhuǎn)換成信息,與傳統(tǒng)的回歸模型相比,具有更大的靈活性,能夠更充分的利用加速度信號(hào)中的信息,并且輸入的指標(biāo)不受參數(shù)的限制,這是神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)精度高于回歸模型的主要原因。機(jī)器學(xué)習(xí)的算法有多種,已逐步應(yīng)用到該領(lǐng)域中,ELLIS等[28]率先引入了隨機(jī)森林算法(random forest),輸入的變量分為時(shí)域和頻域指標(biāo)2大類(lèi)共計(jì)45個(gè),LIU等[29]則使用支持向量機(jī)模型(support vectormachine,SVM)取得了較為理想的預(yù)測(cè)精度。不同研究采用不同的機(jī)器學(xué)習(xí)算法和不同的指標(biāo)體系,算法之間并不具備可比性,指標(biāo)體系和算法之間存在是否相互匹配和適應(yīng)的問(wèn)題,未來(lái)的研究應(yīng)該重視該問(wèn)題。
3.4 本研究的不足
在本研究中,44個(gè)受試者分別進(jìn)行11項(xiàng)活動(dòng),雖然說(shuō)活動(dòng)方案的設(shè)計(jì)上各種類(lèi)型的活動(dòng)兼而有之,但畢竟活動(dòng)項(xiàng)目的數(shù)量有限,活動(dòng)方案并不能夠充分反映人群日常體力活動(dòng)的特征,未來(lái)試驗(yàn)室情景下的研究中活動(dòng)的項(xiàng)目應(yīng)進(jìn)一步的豐富,并且在條件允許的情況下,探討自由生活情景下的預(yù)測(cè)模型,進(jìn)一步提高方程預(yù)測(cè)的準(zhǔn)確性。此外,本研究模型建立的時(shí)間窗口為分鐘,并且過(guò)度階段的數(shù)據(jù)未納入模型統(tǒng)計(jì)中,這些均與現(xiàn)實(shí)情景有所區(qū)別,未來(lái)解決上述問(wèn)題時(shí)是應(yīng)該細(xì)化時(shí)間窗口還是優(yōu)化模型設(shè)計(jì)值得深究。
本研究利用人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)體力活動(dòng)強(qiáng)度的預(yù)測(cè),輸入的指標(biāo)為每分鐘中count.sec-1的10th、25th、50th、75th、90th以及滯后一相關(guān)系數(shù),網(wǎng)絡(luò)結(jié)構(gòu)3-18-1,各參數(shù)分別為誤差率0.001,初始學(xué)習(xí)率0.02,動(dòng)量常量0.7,迭代上限2 000次。設(shè)計(jì)的模型在整體強(qiáng)度和各個(gè)活動(dòng)項(xiàng)目強(qiáng)度的預(yù)測(cè)上的預(yù)測(cè)準(zhǔn)確性均好于Hendleman和Crouter模型,并且在活動(dòng)強(qiáng)度分類(lèi)準(zhǔn)確性上更優(yōu)。未來(lái)應(yīng)進(jìn)一步探究機(jī)器學(xué)習(xí)中其他算法在該領(lǐng)域的應(yīng)用,整合優(yōu)化指標(biāo)體系和各類(lèi)模型之間的關(guān)系。
[1]FREEDSONPS,MELANSONE,SIRARD J.Calibration of the Comput?er Science and Applications,Inc.accelerometer[J].Medicine and sci?ence in sportsand exercise,1998,30(5):777-781.
[2]HENDELMAN D,MILLER K,BAGGETT C,et al.Validity of acceler?ometry for the assessment ofmoderate intensity physical activity in the field[J].Medicine and science in sports and exercise,2000,32(9):S442-9.
[3]SWARTZAM,STRATH SJ,BASSETTDR,etal.Estimation ofenergy expenditure using CSA accelerometers at hip and wrist sites[J].Medi?cineand science in sportsand exercise,2000,32(9):S450-S456.
[4]YNGVE A,NILSSON A,SJOSTROM M,et al.Effect ofmonitor place?ment and of activity setting on the MTI accelerometer output[J].Medi?cineand science in sportsand exercise,2003,35(2):320-326.
[5]TAPIA EM,INTILLE SS,HASKELLW,et al.Real-time recognition of physical activities and their intensities using wireless accelerometers and a heart rate monitor[C]//2007 11th IEEE international symposium onwearable computers.IEEE,2007:37-40.
[6]CAIN K L,SALLIS JF,CONWAY T L,et al.Using accelerometers in youth physicalactivity studies:a review ofmethods[J].Journalof Physi?cal Activity and Health,2013,10(3):437-450.
[7]CROUTER SE,BASSETTDR.A new 2-regressionmodel for the Acti?cal accelerometer[J].British journal of sportsmedicine,2008,42(3):217-224.
[8]王歡,王馨塘,佟海青,等.三種加速度計(jì)測(cè)量多種身體活動(dòng)的效度比較[J].體育科學(xué),2014,34(5):45-50.
[9]BRAGE S,BRAGE N,F(xiàn)RANKSPW,et al.Branched equationmodel?ingofsimultaneousaccelerometry and heart ratemonitoring improveses?timate of directlymeasured physicalactivity energy expenditure[J].Jour?nalof Applied Physiology,2004,96(1):343-351.
[10]ZAKERI I,ADOLPH A L,PUYAU M R,et al.Application of crosssectional time seriesmodeling for the prediction ofenergy expenditure from heart rate and accelerometry[J].Journal of Applied Physiology,2008,104(6):1665-1673.
[11]POBER D M,STAUDENMAYER J,RAPHAEL C.Development of novel techniques to classify physical activitymode using accelerome?ters[J].Med SciSports Exerc,2013,38:1626–1634.
[12]SABATINIAM.Machine learningmethods for classifyinghuman phys?ical activity from on-body accelerometers[J].Sensors,2010,10(2):1154-1175.
[13]LESTER J,CHOUDHURY T,BORRIELLOG.A practical approach to recognizing physical activities[C]//International Conference on Perva?sive Computing.Springer Berlin Heidelberg,2006:1-16.
[14]INTILLE SS,ROSENBERGER M,et al.Activity recognition using a single accelerometer placed at thewristor ankle[J].Medicine and sci?ence in sportsand exercise,2013,45(11):2193.
[15]SCHNELLER M B,PEDERSEN M T,GUPTA N,et al.Validation of fiveminimally obstructivemethods to estimate physical activity energy expenditure in young adults in semi-standardized settings[J].Sensors,2015,15(3):6133-6151.
[16]向劍鋒.大學(xué)生體力活動(dòng)監(jiān)測(cè)中運(yùn)動(dòng)傳感器能耗預(yù)測(cè)方程的建立與應(yīng)用[D].上海:上海體育學(xué)院,2011.
[17]HARRELL JS,MCMURRAY R G,BAGGETT C D,et al.Energy costs of physical activities in children and adolescents[J].Med Sci SportsExerc,2005,37(2):329-36
[18]PUYAUM R,ADOLPH A L,VOHRA FA,etal.Prediction of activity energy expenditure using accelerometers in children[J].Medicine and science in sportsand exercise,2004,36(9):1625-1631.
[19]樊振宇.BP神經(jīng)網(wǎng)絡(luò)模型與學(xué)習(xí)算法[J].軟件導(dǎo)刊,2011,10(7):66-68.
[20]羅四維,肖曄.學(xué)習(xí)率自調(diào)整的BP算法[J].北京交通大學(xué)學(xué)報(bào),1993(2):173-177.
[21]吳昌友.神經(jīng)網(wǎng)絡(luò)的研究及應(yīng)用[D].哈爾濱:東北農(nóng)業(yè)大學(xué),2007.
[22]HEKLER E B,BUMANM P,GRIECO L,et al.Validation of physical activity tracking via android smartphones compared to ActiGraph ac?celerometer:laboratory-based and free-living validation studies[J]. JMIRmHealth and uHealth,2015,3(2):e36.
[23]朱琳,陳佩杰.應(yīng)用ROC曲線確定活動(dòng)計(jì)數(shù)在青春期少年運(yùn)動(dòng)強(qiáng)度診斷中的最佳臨界值[J].體育科學(xué),2012,32(11):70-75.
[24]BASSETT D R,TROIANO R P,MCCLAIN JJ,et al.Accelerometerbased physical activity:total volume per day and standardized mea?sures[J].Med SciSports Exerc,2015,47(4):833-8.
[25]LEENDERSN Y,SHERMANW M,NAGARAJA H N.Energy expen?diture estimated by accelerometry and doubly labeled water:do they agree?[J].Medicine and science in sports and exercise,2006,38(12):2165-2172.
[26]BASSETT D R,AINSWORTH B E,SWARTZ A M,et al.Validity of fourmotion sensors in measuringmoderate intensity physical activity ships among attention networks and physiological responding to threat [J].Brain and Cognition,2017,111:63-72.
[24]戚瑋,單銘明,崔麗娟.時(shí)間壓力、焦慮與工作滿(mǎn)意度:時(shí)間控制感的中介作用[J].心理研究,2014,7(4):74-79.
[25]BISHOP S J,JENKINSR,LAWRENCE A D.Neural processing of fearful faces:Effectsofanxiety are gated by perceptual capacity limita?tions[J].CerebralCortex,2007,17:1595-1603.
[26]BISHOPSJ.Traitanxiety and impoverished prefrontal controlofatten?tion[J].Nature Neuroscience,2009,12:92-98.
[27]BUSHG,LUUP,POSNERM I.Cognitive and emotional influences in the anterior cingulate cortex[J].Trends in Cognitive Sciences,2000,4(6):215-222.
[28]SHACKMAN A J,SARINOPOULOS I,MAXWELL JS,et al.Anxiety selectively disrupts visuospatialworkingmemory[J].Emotion,2006,6(1):40-61. [J].Medicineand science in sportsand exercise,2000,32(9;SUPP/1):S471-S480.
[27]ROTHNEY M P,APKER G A,SONG Y,et al.Comparing the perfor?mance of three generations of ActiGraph accelerometers[J].Journal of Applied Physiology,2008,105(4):1091-1097.
[28]ELLISK,KERR J,GODBOLE S,et al.A random forest classifier for the prediction of energy expenditure and type of physical activity from wrist and hip accelerometers[J].Physiologicalmeasurement,2014,35(11):2191.
[29]LIU S,GAO R X,JOHN D,et al.SVM-based multi-sensor fusion for free-living physical activity assessment[C]//2011.International Confer?ence of the IEEEEngineering in Medicine and Biology Society.IEEE,2011:3188-3191.
Research on Algorithm on Activity Intensity of Accelerometer Based on NeuralNetwork M odel
CHENQinguo,PENGBiao,YANGShijun,LIAOFangping
(Schoolof PE,Sichuan Normal University,Chengdu 610101,China)
In order to introduce the neural networkmodel into the prediction of accelerometer on activity intensity to improve the accuracy of prediction,this research enrolled 44 undergraduates(22malesand 22 females)assubjectswho carried out11 itemsof physicalactivitieswith Cosmed K4B2 and Actigraph-GT3X,and evaluate validity of the BP neural network model by leave-one-out cross-validation comparing to Hendleman model and Croutermodel on the RMSE,BIASand B-A graphs using Matlab7.0 software.The results showed that 3-18-1 three-layer neural networkmodel(The error rate:0.001,the initial learning rate:0.02,and themomentum constant:0.7)is 1.08 on RMSE,4.3%on the points percentile outside the consistency interval from B-A graphs,2.7 on absolute values from B-A plot.the accuracy of the classification(exceptcycling)is84.3%(light intensity),83.2%(moderate intensity)and 89.8%(vigorous intensity).The accuracy of the neural networkmodelwas better than the hendleman and Croutermodels in the prediction of the intensity of thewhole activity and the intensity ofeach activity,and the accuracy of the activity intensity classificationwasbetter.In the future,theother algorithmsbased onmachine learn?ing should be further explored and relationship between the index system and the variousmodelsshould be integrated.
neuralnetworkmodel;accelerometer;intensity ofphysicalactivity;prediction
G 846
:A
:1005-0000(2017)01-045-06
10.13297/j.cnki.issn1005-0000.2017.01.008
2016-11-24;
2017-01-03;錄用日期:2017-01-04
四川師范大學(xué)實(shí)驗(yàn)技術(shù)與管理重點(diǎn)項(xiàng)目(項(xiàng)目編號(hào):SYJS2015-09)
陳慶果(1981-),男,四川瀘州人,博士,副教授,研究方向?yàn)轶w力活動(dòng)測(cè)量與評(píng)價(jià)。
四川師范大學(xué)體育學(xué)院,四川成都610101。
天津體育學(xué)院學(xué)報(bào)2017年1期