孫忠偉,馬永平,馬慧敏,張 冰
基于BP人工神經(jīng)網(wǎng)絡(luò)的大學生最大攝氧量估測模型研究
孫忠偉1,馬永平1,馬慧敏1,張 冰2
國內(nèi)大學生關(guān)于心肺耐力室外估測還有待于進一步研究,采用文獻資料研究、實驗、數(shù)理統(tǒng)計和計算機編程等方法,隨機選擇80名大學生(男、女各40人,年齡19~23歲),以實驗室跑臺心肺代謝儀直接測試作為研究標準,參考國外經(jīng)典1 mi跑測試方程,利用Neuroph Studio構(gòu)建BP人工神經(jīng)網(wǎng)絡(luò)最大攝氧量估測模型。研究結(jié)果顯示,BP人工神經(jīng)網(wǎng)絡(luò)輸入變量確定為年齡、性別、體重、1 600 m跑時間和跑后即刻心率,三層網(wǎng)絡(luò)層級結(jié)構(gòu)具體為5-9-1,通過2.198萬次反復(fù)訓(xùn)練及驗證,將模型輸出的錯誤率控制在0.001,進一步統(tǒng)計分析模型估測與實驗室測試值的相關(guān)系數(shù)r為0.923,P<0.01,對兩個樣本進行t檢驗,t=0.06,P>0.05,顯示沒有顯著性差異。可見,采用BP人工神經(jīng)網(wǎng)絡(luò)進行最大攝氧量估測具有快速、有效、精確等特點。
估測模型;最大攝氧量;人工神經(jīng)網(wǎng)絡(luò);大學生
2.1 測試對象
80名某高校本科學生,其中,男、女各40名。
2.2 研究方法
2.2.1 文獻資料研究
通過中國知網(wǎng)、萬方數(shù)據(jù)、維普、Web of Science、EBSCO Sport及谷歌學術(shù)等數(shù)據(jù)庫及檢索引擎進行了本研究的文獻檢索,充分了解國內(nèi)、外相關(guān)研究現(xiàn)狀。
2.2.2 實驗法
2.2.3 統(tǒng)計分析
通過SPSS 11.0、MedCalc 11.4和Excel 2003對實驗數(shù)據(jù)與人工神經(jīng)網(wǎng)絡(luò)模型估測數(shù)據(jù)進行統(tǒng)計分析。
2.2.4 計算機編程
本研究采用NeurophStudio進行BP神經(jīng)網(wǎng)絡(luò)開發(fā)。NeurophStudio是一個輕量級的模擬常見的神經(jīng)網(wǎng)絡(luò)架構(gòu)Java框架,由塞爾維亞的貝爾格萊德大學工商管理學院的助理教授Zoran Sevarac以及Ivana Jovicic、Marko Ivanovic、Vladimir Kolarevic、Damir Kocic等聯(lián)合開發(fā)出來的一個開源項目,屬于通用的Java Swing應(yīng)用程序框架,它還能夠提供一組GUI組件和一個模塊系統(tǒng),用于開發(fā)自定義桌面應(yīng)用程序。將本研究實驗測試的相關(guān)數(shù)據(jù)輸入NeurophStudio人工神經(jīng)網(wǎng)絡(luò)系統(tǒng)進行建模,然后反復(fù)實驗、訓(xùn)練與驗證,最終模型在預(yù)期精度實現(xiàn)收斂,并形成模型的JAVA代碼。
BP人工神經(jīng)網(wǎng)絡(luò),是指含有隱藏層的多層前饋網(wǎng)絡(luò),能夠大大提高網(wǎng)絡(luò)的分類能力,由于多層前饋網(wǎng)絡(luò)的訓(xùn)練常采用誤差反向傳播算法,人們常將其稱為多層前饋神經(jīng)網(wǎng)絡(luò)。其主要建模思想是,學習過程由信號的正向傳播與誤差的反向傳播兩個過程組成,首先,正向傳播時,輸入樣本從輸入層傳入,經(jīng)各隱藏層處理后,傳向輸出層,若輸出層的實際輸出與期望的輸出不符,則轉(zhuǎn)入誤差的反向傳播階段;其次,誤差的反向傳播是將輸出誤差以某種形式通過隱藏層向輸入層逐層反傳,并將誤差分攤給各層的所有單元,從而獲得各層單元的誤差信號,此誤差信號即作為修正各單元權(quán)值的依據(jù),這種信號正向傳播與誤差反向傳播的各層權(quán)值調(diào)整過程,是周而復(fù)始的進行,權(quán)值的不斷調(diào)整的過程,也就是網(wǎng)絡(luò)的訓(xùn)練學習過程,此過程將一直持續(xù)直到網(wǎng)絡(luò)的輸出誤差降低到預(yù)期可接受的范圍或預(yù)先設(shè)定的學習次數(shù)才會停止[10]。
數(shù)據(jù)標準化轉(zhuǎn)換完成之后,就可以利用NeurophStudio工具進行創(chuàng)建網(wǎng)絡(luò)。也是采用三層網(wǎng)絡(luò)結(jié)構(gòu),考慮到本次人工神經(jīng)網(wǎng)絡(luò)的預(yù)測精確度要求較高,初次確定隱藏神經(jīng)元的嘗試方法為2n+1,其中,n為輸入層神經(jīng)元個數(shù),因為本次輸入層有年齡、性別、體重、1 600 m跑時間和跑后即刻心率5個變量,所以,隱藏層初步嘗試為11個(圖1)。
表 1 標準化轉(zhuǎn)換后的數(shù)據(jù)統(tǒng)計一覽表
Table 1 Statistics Standardization after Conversion (n=80)
XSD年齡0.900.03身高0.420.07體重0.650.101600m跑時間0.660.09跑完后即刻心率0.250.0VO2max0.540.11
第1次測試時采用全部樣本(80人)訓(xùn)練網(wǎng)絡(luò),測試選定的神經(jīng)網(wǎng)絡(luò)是否能夠?qū)崿F(xiàn)收斂,考慮到樣本人數(shù)比較少,擬采用80%訓(xùn)練及20%驗證和90%訓(xùn)練及10%驗證。設(shè)置訓(xùn)練的總體均方誤差和驗證的總體均方誤差都在0.001位。因為設(shè)置的精確率較高,結(jié)果顯示,整個曲線已經(jīng)開始逼近邊線和底線,模型的收斂速度較快,訓(xùn)練效率比較理想。
通過測試發(fā)現(xiàn),選擇不同的學習率會對網(wǎng)絡(luò)訓(xùn)練迭代次數(shù)產(chǎn)生較大影響,也就是學習率越高,網(wǎng)絡(luò)的迭代次數(shù)就越少。學習率的范圍是[0,1],越接近于0需要的訓(xùn)練周期也越長,迭代次數(shù)也就越多,也就導(dǎo)致網(wǎng)絡(luò)的訓(xùn)練過程比較緩慢。相反,越接近1學習率也越高,容易導(dǎo)致權(quán)重系數(shù)偏離,目標函數(shù)的糾錯功能幅度偏大,導(dǎo)致網(wǎng)絡(luò)訓(xùn)練準確率偏低。如圖2所示,采用0.02需要的迭代次數(shù)為175 241次,而0.9需要90 121次,相比約高一倍的迭代次數(shù),但考慮到本次構(gòu)建網(wǎng)絡(luò)需要較高的精確性,而網(wǎng)絡(luò)的運行輸出效率僅作為次級指標考慮,由此確定采用0.02學習率進行網(wǎng)絡(luò)學習訓(xùn)練。
圖 2 三層人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練迭代次數(shù)與學習率關(guān)系示意圖Figure 2. Three Artificial Neural Network Training Iterations with Learning Rate Relations
網(wǎng)絡(luò)動量對訓(xùn)練過程的影響是一個比較關(guān)鍵的因素,動量過低導(dǎo)致學習過程緩慢,也會不容易辨別系統(tǒng)的局部最小值。適當?shù)膭恿磕軒椭黾酉到y(tǒng)的收斂速度。如果網(wǎng)絡(luò)的動量參數(shù)設(shè)置過高,也可以促使網(wǎng)絡(luò)對最小值容錯幅度過大,導(dǎo)致訓(xùn)練后的網(wǎng)絡(luò)產(chǎn)生不穩(wěn)定現(xiàn)象??紤]到本網(wǎng)絡(luò)估測精度較高,訓(xùn)練后要求要保證網(wǎng)絡(luò)的穩(wěn)定性,通過圖3的測試發(fā)現(xiàn),從0.1~0.9,網(wǎng)絡(luò)的迭代次數(shù)由59 847次迅速下降到了9 016次,學習效率逐漸提高,而在0.7位置就降到了9 215次,之后都在9 016次以上并沒有顯著的降低,由此確定采用0.7比較合適。
圖 3 三層人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練迭代次數(shù)與記憶率關(guān)系示意圖Figure 3. Three Artificial Neural Network Training Iterations and Memory Rate Relations
通過對網(wǎng)絡(luò)隱藏層的不同的神經(jīng)元數(shù)量進行訓(xùn)練,可以發(fā)現(xiàn),隨著神經(jīng)元數(shù)量的增多網(wǎng)絡(luò)的訓(xùn)練過程在縮短,
通過圖4可以發(fā)現(xiàn),當選3~7個神經(jīng)元作為隱藏層進行計算,迭代次數(shù)都在6.5萬次以上,效率偏低,選擇9個和11個神經(jīng)元時,迭代次數(shù)比較接近,而選擇11個神經(jīng)元的迭代次數(shù)同9個神經(jīng)元相比沒有明顯的下降,進一步的樣本測試發(fā)現(xiàn),采取2n+1的9個隱藏神經(jīng)元比較適合本網(wǎng)絡(luò)建模。
圖 4 三層人工神經(jīng)網(wǎng)絡(luò)隱藏層不同神經(jīng)元數(shù)量與訓(xùn)練過程示意圖Figure 4. Three Different Artificial Neural Network Hidden Neuron Number and Training Process Layer
訓(xùn)練嘗試網(wǎng)絡(luò)輸入隱藏層隱藏層神經(jīng)元訓(xùn)練比例(%)最大誤差學習率記憶率迭代次數(shù)總均方誤差驗證總均方誤差16113800.0010.020.7242190.000910.0012626113900.0010.020.7219810.000930.00139
圖 5 訓(xùn)練完成后的網(wǎng)絡(luò)權(quán)重系數(shù)示意圖Figure 5. Network Weighting Factor after Training
通過多次建模訓(xùn)練嘗試發(fā)現(xiàn),要保證后期誤差率能夠達到0.001的情況,需要采用0.02的學習率,0.7的記憶率進行訓(xùn)練。第1次采用最大錯誤率為0.001,學習率0.02,記憶率0.7,訓(xùn)練次數(shù)約2.4萬次,總均方差達到了目前最低的0.009 1,并且迭代次數(shù)也僅為242 19次,比較理想;而第2次訓(xùn)練雖然采用了90%的訓(xùn)練樣本進行學習,但網(wǎng)絡(luò)的精度并沒有顯著提高,且總體方差驗證為0.001 39,高于第1次的0.001 26,由此認為,第2次的訓(xùn)練得出得結(jié)果符合預(yù)期目標(表2)。
最后確定本次構(gòu)建的神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)為6個輸入神經(jīng)元,隱藏層9個神經(jīng)元,輸出為1個神經(jīng)元,通過圖5可以看出,訓(xùn)練后網(wǎng)絡(luò)中的權(quán)重系數(shù)在[-1,4]的范圍間保持了穩(wěn)定的狀態(tài),尤其輸出層3(layer3)最后也保持在了一個平面,呈現(xiàn)出比較平穩(wěn)的輸出模式,達到了預(yù)期的精度。
網(wǎng)絡(luò)訓(xùn)練完成后,通過網(wǎng)絡(luò)輸入全部數(shù)據(jù)進行計算,將系統(tǒng)估測的結(jié)果利用SPSS軟件進行統(tǒng)計分析,如表3所示,與實驗室運動心肺儀測試相比,其均值非常接近,其中,ANN為人工神經(jīng)網(wǎng)絡(luò),為本網(wǎng)絡(luò)的縮寫。
表 3 實驗室測試和人工神經(jīng)網(wǎng)絡(luò)模型(ANN)的估算結(jié)果一覽表
Table 3 Laboratory Testing and Artificial Neural Network (ANN) Estimation Results
X±SD(n=80)實驗室測試49.61±10.32ANNtest49.75±10.44
表 4 實驗室測試和人工神經(jīng)網(wǎng)絡(luò)(ANN)的相關(guān)分析一覽表
Table 4 Correlation Analysis Laboratory Testing and Artificial Neural Network(ANN)
公式實驗室Pearson相關(guān)(n=80)實驗室獨立t檢驗(n=80)R值顯著性t95%CIP值A(chǔ)NN0.9250.0000.006-4.7~4.70.995
圖 6 實驗室測試和人工神經(jīng)網(wǎng)絡(luò)(ANN)的Bland-Altman散點圖Figure 6. Laboratory Tests and ANN(artificial neural network) Bland-Altman Scatter Plot
[1]韓立群.神經(jīng)網(wǎng)絡(luò)和遺傳算法在催化劑配方及建模與優(yōu)化中的應(yīng)用研究[J].化學工程學報,1994,5(4):500-504.
[2]施彥,韓力群,廉小親.神經(jīng)網(wǎng)絡(luò)設(shè)計方法與實例分析[M].北京:北京郵電大學出版社,2009:23-24.
[3]ADAMO D E,TALLEY S A,GOLDBERG A.Age and task differences in functional fitness in older women:Comparisons with senior fitness test normative and criterion-referenced data[J].J Aging Phys Activ,2015,23(1):47-54.
[5]American College of Sports Medicine.Resource Manual for Guidelines for Exercise Testing and Prescription[M].9th ed.Phila-delphia:Lippincott William & Wilkins,2013.
[8]HAGAN M T,MENHAJ M B.Training feedforward networks with the Marquardt algorithm[J].IEEE T Neural Networks,IEEE Transactions on,1994,5(6):989-993.
[9]HAURET K G,GREENE S,ROSSI S,etal.Combined effect of body mass index and aerobic fitness on stress fracture risk among women[J].J Exe Sci:Conference Proceedings,2015,9(3):39.
[10]HAYKIN S.Neural Networks:A Comprehensive Foundation[M].MacMillan College Publishing,New York,1994:166.
[13]LARSEN C M,BALL C A,HEBL V B,etal.Echocardiographic predictors of cardiopulmonary exercise test performance in hypertrophic cardiomyopathy[J].Circulation,2014,130(Suppl 2):A17268-A17268.
[14]MAUD P J,F(xiàn)OSTER C.Physiological assessment of human fitness[M].Champaign,IL:Human Kinetics,2006.
[15]NIEMAN D C.The exercise test as a component of the total fitness evaluation[J].Prim Care,2001,28:49.
[16]PRZEDNOWEK K,ISKRA J,PRZEDNOWEK K H.Predictive modeling in 400-metres hurdles races[J].Life Sci J,2014,11(11):794-797.
[17]SCOTT A L,BROZIC A,MYERS J,etal.Exercise stress testing:An overview of current guidelines[J].Sports Med,1999(27):285-312.
Construction of Students BP Artificial Neural Network Model based on Maximal Oxygen Uptake Estimation
SUN Zhong-wei1,MA Yong-ping1,MA Hui-min1,ZHANG Bing2
Domestic Students cardiorespiratory endurance outdoor estimation method needs further study,this paper,using the literature review,experiment,mathematical statistics and computer programming method,randomly selected 80 college students (40 male and 40 female,aged 19~23 years old) ,taking laboratory testing as a research standard,with reference to foreign classical equation 1 mile run test,use NeurophStudio builds BP artificial neural network model to estimate maximal oxygen uptake.The results showed that BP artificial neural network input variable to be age,gender,weight,1600-meter run time and heart rate,the three-tier network hierarchy 5-9-1 specifically by 21980 times repeated training and validation the error rate in the output of the model control thousandth correlation coefficient r further statistical model to estimate the value of laboratory testing and is 0.923,P<0.01,two sample T-test,t=0.06,P>0.05,There were no significant differences in the display,showing the use of BP artificial neural network to estimate maximal oxygen uptake is fast,efficient,accurate.
estimationmethod;maximaloxygenuptake;artificialneuralnetwork;collegestudent
1002-9826(2016)03-0056-05
10.16470/j.csst.201603008
2014-12-02;
2016-03-08
國家體育總局體育哲學社會科學基金資助項目 (217SS15062)。
孫忠偉(1980-),男,黑龍江甘南人,講師,博士,主要研究方向為運動與健康,Tel:(0991)8586850,E-mail:sunzhongwei@coopering.cn;馬永平(1982-),女,新疆伊犁人,講師,碩士,主要研究方向為學校體育,Tel(0991)8586850;馬慧敏(1957-),女,新疆烏魯木齊人,教授,碩士,主要研究方向為學校體育,Tel(0991)8586850,E-mail:shasha9596@163.com;張冰(1960-),男,甘肅蘭州人,教授,博士,主要研究方向為運動與健康,Tel(010)62796932,E-mail:bzhang@mail.tsinghua.edu.cn。
1.新疆大學 體育教學研究部,新疆 烏魯木齊 830046;2.清華大學 體育與健康科學研究中心,北京 100084 1.Xinjiang University,Urumqi 830046,China;2.Tsinghua University,Beijing 100084,China.
G804.49
A