王慧
摘 要: 目前對于運動員損傷康復(fù)的研究是通過對影響運動員損傷康復(fù)的因素采用多元方差重復(fù)測量方法進行分析,但是并沒有對這些因素的影響效果做精準的分析和有效預(yù)測,影響康復(fù)和機能恢復(fù)。故提出一種基于大數(shù)據(jù)分析的運動員損傷康復(fù)建模方法,模型從統(tǒng)計學(xué)角度對損傷康復(fù)因素進行多層線性分析,得到影響因素與損傷康復(fù)的關(guān)系來描述運動損傷的發(fā)生規(guī)律,對損傷康復(fù)因素進行主成分分析得到運動損傷產(chǎn)生的直接影響因素,可對損傷康復(fù)影響因素進行有效預(yù)測,由此完成運動員損傷康復(fù)研究。實驗結(jié)果表明,預(yù)測結(jié)果與真實結(jié)果符合度較高,證明該方法對運動員損傷康復(fù)數(shù)據(jù)分析結(jié)果有效。
關(guān)鍵詞: 大數(shù)據(jù)分析; 主成分分析; 多層線性分析; 損傷康復(fù); 多元方差; 有效預(yù)測
中圖分類號: TN911.1?34; G804.53 文獻標識碼: A 文章編號: 1004?373X(2018)11?0149?04
Research on athletes′ injury rehabilitation modeling based on big data analysis
WANG Hui
(Shanghai Jian Qiao University, Shanghai 201306, China)
Abstract: For the current study on athletes′ injury rehabilitation, the multivariate variance repeatedly?measured method is used to analyze the factors influencing the athletes′ injury rehabilitation, but the impact effects of these factors (rehabilitation and functional recovery) aren′t analyzed and predicted accurately. Therefore, an athletes′ injury rehabilitation modeling method based on big data analysis is presented. In the model, the multilayer linear analysis is performed for the injury rehabilitation factors from the perspective of statistics to get the relation between the influence factors and injury rehabilitation for the description of the occurrence regularity of sports injury. The principal component analysis is carried out for the injury rehabilitation factors to obtain the direct influence factors produced by sports injury, which can effectively predict the influence factors of injury rehabilitation, so as to complete the research on athletes′ injury rehabilitation. The experimental results show that the prediction results are in good agreement with the actual results, and this method has effective data analysis results for athletes′ injury rehabilitation.
Keywords: big data analysis; principal component analysis; multilayer linear analysis; injury rehabilitation; multivariate variance; effective prediction
隨著體育事業(yè)的快速發(fā)展和人們對體育事業(yè)的熱愛,運動員為取得更好的成績經(jīng)常會進行超過身體的負荷訓(xùn)練[1],競技運動項目訓(xùn)練強度較大,高頻率的比賽極為常見,許多高水平的運動員因訓(xùn)練計劃、各訓(xùn)練階段側(cè)重點的不同,會有各種性質(zhì)的損傷[2]。損傷后的運動員不能及時返回損傷前狀態(tài),使以往的訓(xùn)練結(jié)果被破壞,影響運動員專業(yè)水平的提升。因此,運動員的損傷康復(fù)研究工作是目前體育學(xué)界研究的重點對象[3]。目前對影響運動員損傷康復(fù)因素的分析采用多元方差重復(fù)測量方法,但是并沒有對這些因素的影響效果做精準的分析和有效預(yù)測,影響康復(fù)效果[4?5]。本文提出一種基于大數(shù)據(jù)分析的運動員損傷康復(fù)研究方法,從統(tǒng)計學(xué)角度對損傷康復(fù)因素進行多層線性分析,得到影響因素與損傷康復(fù)的關(guān)系來描述運動損傷的發(fā)生規(guī)律,對損傷康復(fù)因素進行主成分分析得到運動損傷產(chǎn)生的直接影響因素,可對損傷康復(fù)影響因素進行有效預(yù)測,由此完成運動員損傷康復(fù)研究。實現(xiàn)對運動員損傷康復(fù)研究進行大數(shù)據(jù)分析的目的。
從統(tǒng)計學(xué)角度分析,將影響運動員損傷康復(fù)的因素劃分為外在因素和運動員個體內(nèi)部因素兩種,將其輸入至多層線性模型中進行分析。多層線性模型處理運動員損傷康復(fù)因素數(shù)據(jù)時,先以外部因素的特征變量數(shù)據(jù)建立回歸方程,再把因變量用該方程中的斜率與截距表示,進行二次回歸把個體內(nèi)在因素的特征變量作為自變量得到分析模型。
如果影響運動員損傷康復(fù)的內(nèi)在因素上有[s]個自變量[x1,x2,…,xs,]影響運動員損傷康復(fù)的外在因素上有[t]個自變量[w1,w2,…,wt,]可由此建立兩個運動員損傷康復(fù)水平模型。
水平1:
[ymn=β0n+β1nx1mn+β2nx2mn+…+βsnxsmn+emn] (1)
水平2:
[β0j=γ00+γ01w1n+…+γ0twtn+μ0n ?βtn=γt0+γt1w1n+…+γstwtn+μtn] (2)
式中:
[emn?N0,σ2e,μ?0,τ00] (3)
[μ0n?μsn?N0,Σ,Σ=varμ0n?μsn=τ00 …τ0s???τs0…τss] (4)
[covemn,μ0n=emn,μ1ncovμmn1,μmn2=0,n1≠n2] (5)
式中:[β0n]表示第[n]個影響因素自變量康復(fù)截距系數(shù);[β1n…βsn]分別表示第[n]個影響因素自變量對損傷康復(fù)回歸的斜率。
式(5)表明個體間的隨機誤差在組內(nèi)相互獨立。隨機誤差服從[P]維正態(tài)分布,外在影響因素與個體內(nèi)在因素的誤差項是相互獨立的。因為[γst]的個體內(nèi)在因素不是隨機變異的,所以叫個體內(nèi)在因素的固定參數(shù)。[xmn,][wn]分別稱為外在影響因素與個體內(nèi)在因素上的預(yù)測變量。[emn,] [μ0n,…,μsn]分別為外在影響因素與個體內(nèi)在因素上的隨機效應(yīng),表明各影響因素水平上單位測量誤差,[σ2e,Σ]分別稱為外在影響因素與個體內(nèi)在因素上的隨機效應(yīng)方差。
由1.1節(jié)可知運動損傷的發(fā)生規(guī)律,采用主成分分析方法對個體內(nèi)在影響因素數(shù)據(jù)進行標準化處理得到對應(yīng)矩陣,計算矩陣特征值以及各個特征值對應(yīng)的特征向量,算出各個主成分由高到低的方差貢獻率,得到影響損傷康復(fù)的主要個體內(nèi)在影響因素。計算出個體內(nèi)在因素的主成分值,即可分析出該康復(fù)影響因素占總影響因素的比重,預(yù)測出該影響因素對損傷康復(fù)的重要性。
在個體內(nèi)在影響因素中有5個指標,為[x1,x2,…,x5,][n]個運動員的個人內(nèi)在影響因素數(shù)據(jù)矩陣表示為:
[X=x11x12…x15x21x22…x25????xn1xn2…xn5=X1 X2 … Xp] (6)
將5個原有的個體內(nèi)在影響因素變量經(jīng)線性變換組合為5個新的變量:
[F1=a11X1+a12X2+…+a15X5F2=a21X1+a22X2+…+a25X5 ?F5=a51X1+a52X2+…+a55X5] (7)
式中:[F1]表示第一主成分;[ast]表示第二主成分;[t]表示第[t]個運動員。所有主成分的系數(shù)平方和是1,則:[a2s1+a2s2+…+a2s5=1] (8)
每個內(nèi)在影響因素相互獨立:
[CovFs,F(xiàn)t=0,s≠t,s,t=1,2,…,5] (9)
每個個體內(nèi)在影響因素的方差依次遞減,則:
[VarF1≥VarF2≥…≥VarF5] (10)
求出式(6)的系數(shù)矩陣[ast]。對數(shù)據(jù)樣本標準化:
[x*st=xst-XtSt] (11)
計算出康復(fù)影響因素系數(shù)矩陣:
[R=1n-1X*X*T] (12)
求出[R]值,求解損傷康復(fù)特征方程[λI-R=0,]得到5個非負特征值[λs,]并按其大小順序排列,即[λ1≥][λ2≥…≥λ5≥0]。定義[λt]為第[t]個個體內(nèi)在因素[Ft]的方差貢獻,[λjs=15×100%]為第[t]個個體內(nèi)在因素[Ft]的方差貢獻率,前[z]個個體內(nèi)在因素的方差貢獻率之和[s=1zλst=1mλt×][100%]為前[z]個個體內(nèi)在因素的累計貢獻率。個體內(nèi)在因素個數(shù)為[z]。取多少要根據(jù)具體情況確定,通常是以貢獻率之和大于85%為標準。計算個體內(nèi)在因素的主成分值。主成分值的大小表明對損傷康復(fù)的影響程度。確定個體內(nèi)在因素的主成分個數(shù)之后,只要求出各個特征值所對應(yīng)的特征向量就可以根據(jù)式(6)求出各個體內(nèi)在因素的主成分值。即可分析出該康復(fù)影響因素占總影響因素的比重,預(yù)測出該影響因素對損傷康復(fù)的重要性。
研究對象來自于全國各個地區(qū)的職業(yè)運動員學(xué)生,包含有63%國家二級運動員,分別來自遼寧、河南、山西、江蘇、浙江、山東省體育運動職業(yè)技術(shù)學(xué)院中的田徑運動項目的學(xué)生,根據(jù)年級和成績分成5組進行測試。調(diào)查總?cè)藬?shù)為1 236人,其中男性618名,女性618名,參與測試的運動員年齡在16~25歲之間。實驗平臺為統(tǒng)計軟件,使用HLM軟件進行數(shù)據(jù)處理。
用調(diào)查問卷的方法對運動員的基本信息、損傷情況、康復(fù)情況、訓(xùn)練強度4個部分進行統(tǒng)計。給不同地區(qū)、不同性別、不同年齡段的運動員給出1 238份測試調(diào)查問卷,反饋1 226份,反饋率99%,其中有效問卷數(shù)量為1 115份,有效反饋率為90%;每個運動員測試5次,每次測試間隔不同時間。實驗要求運動員以回答選擇題方式填寫損傷康復(fù)情況。
測試運動員的康復(fù)影響因素變量主要有內(nèi)在因素個體特征,包括運動員年齡、性別、等級、性格和焦慮狀況;外在因素有運動員損傷康復(fù)所需時間、運動員康復(fù)鍛煉量、非康復(fù)鍛煉量。焦慮是康復(fù)過程的壓力程度同樣使用0~6級表示??祻?fù)鍛煉量是指運動員為了保持先前的體能而進行的康復(fù)期運動量的多少。非康復(fù)鍛煉量是運動員做其他與專業(yè)運動無關(guān)的活動量,在時間上體現(xiàn)為不確定性。運動員等級是指平時平均成績劃分的級別。性格是指運動員的樂觀與悲觀程度,用7個等級表示。焦慮狀況是指運動員自身的壓力情況。性別男性是1,女性是0。
通過統(tǒng)計調(diào)查問卷上運動員的康復(fù)情況來判斷其是否因時間和運動員個體差異不同而有所差異,分析結(jié)果如表1所示。Coefficient是康復(fù)系數(shù),standard error是標準誤差,是數(shù)據(jù)統(tǒng)計量的標準差。t?ratio統(tǒng)計系數(shù)與標準誤差比率[6],P?value結(jié)果的統(tǒng)計學(xué)意義是結(jié)果真實程度(能夠代表總體)的一種估計方法[7],P?value值為結(jié)果可信程度的一個遞減指標[8]。Variance為方差[9],df為小樣本統(tǒng)計量,[χ2]為顯著性檢驗指標[10]。
康復(fù)時間斜率的方差和運動員個體均值截距說明每個運動員的斜率是不同的,不同運動員的康復(fù)時間是不固定的,斜率的方差也可以說明每個運動員的康復(fù)程度隨時間變化不是同步的。但都有一個規(guī)律,康復(fù)時間越長則康復(fù)程度越高。
康復(fù)活動與非康復(fù)活動分析結(jié)果見表2。
由表2可知,康復(fù)情況除了與康復(fù)時間有關(guān)以外,還與運動員在康復(fù)期內(nèi)做的非康復(fù)鍛煉量有關(guān)。研究結(jié)果說明,康復(fù)?非康復(fù)鍛煉和康復(fù)?鍛煉之間的關(guān)系隨運動員個體不同而有顯著變化。由計算可知,運動員個人內(nèi)在效應(yīng)方差相對于上一個實驗方差降低了,表明新加入的影響因素使分析的性能加強,證明可以用康復(fù)鍛煉量、非康復(fù)鍛煉量來說明對損傷康復(fù)的影響。運動員所做的非康復(fù)鍛煉活動多則康復(fù)進度變緩。運動員所做的康復(fù)鍛煉活動多則康復(fù)進度加快。
個體內(nèi)部因素對損傷康復(fù)的影響見表3。從表3可以看出,年齡是康復(fù)截距的重要自變量,年齡大的運動員,相對康復(fù)程度較低;性別方面,說明男性運動員比女性運動員的康復(fù)程度低。男性運動員在康復(fù)狀況較差的時間段做的康復(fù)鍛煉較多;對于女性運動員,在康復(fù)程度越高的日子做的康復(fù)鍛煉就越多。在年齡方面,歲數(shù)大的運動員的非康復(fù)鍛煉量與康復(fù)程度呈負相關(guān);歲數(shù)小的運動員的非康復(fù)鍛煉量與康復(fù)程度呈正相關(guān)。實驗結(jié)果證明:歲數(shù)大的運動員在康復(fù)程度較高的情況下完成的康復(fù)鍛煉量較歲數(shù)小的運動員要多,而且康復(fù)鍛煉數(shù)量越多,康復(fù)程度越高。
對調(diào)查的1 115個運動員的5個內(nèi)在影響因素數(shù)據(jù)建立數(shù)據(jù)集矩陣。使用統(tǒng)計軟件對調(diào)查問卷中的個體內(nèi)在康復(fù)影響因素數(shù)據(jù)集矩陣做主成分分析,個體內(nèi)在康復(fù)損傷影響因素的積累方差貢獻率見圖1,年齡占55%,性別占35%,它們2個主成分的積累方差貢獻率已經(jīng)達到90%。由于積累貢獻率大于85%即可認為前2個主成分年齡和性別已經(jīng)可以表示之前5個影響因素數(shù)據(jù)主要部分信息,直接影響因素的提取。
將上面分析的1 115組數(shù)據(jù)中后10組數(shù)據(jù)與運動員實際康復(fù)程度進行對比,用于對比檢驗主成分預(yù)測符合程度。從圖2可以看出,預(yù)測結(jié)果的最大符合度為99%,最小符合度為93%。經(jīng)過對多次分析預(yù)測結(jié)果顯示,只要預(yù)測的符合度與真實結(jié)果之間相差小于8%,即可以認為是準確有效的預(yù)測。本文方法預(yù)測的主要影響因素結(jié)果的誤差都小于8%,證明預(yù)測的結(jié)果完全符合要求。
現(xiàn)階段對運動員損傷康復(fù)研究中通過對影響運動員損傷康復(fù)的因素采用多元方差重復(fù)測量方法進行分析,但是并沒有對這些因素的影響效果做精準的分析和有效預(yù)測,影響康復(fù)和機能恢復(fù)。使用基于大數(shù)據(jù)的分層線性模型方法對損傷康復(fù)數(shù)據(jù)進行分析,可得到影響因素與損傷康復(fù)的關(guān)系,用于描述運動損傷的發(fā)生規(guī)律,對個體內(nèi)在影響因素進行主成分分析,得到個體內(nèi)在主要影響因素,運動損傷產(chǎn)生的主要影響因素可對損傷康復(fù)影響因素進行有效預(yù)測,由此完成運動員損傷康復(fù)研究。
但本文提出的基于大數(shù)據(jù)分析的運動員損傷康復(fù)研究方法,由于問卷調(diào)查的問題有限,沒有對過多外在因素進行調(diào)查,僅對個體內(nèi)在影響因素做了主成分分析,沒有對外在影響因素進行主成分分析。對其他外在因素也進行主成分分析,使損傷康復(fù)影響因素更加明確,做出全面有效預(yù)測是以后對運動員損傷康復(fù)研究的一個重點方向。
參考文獻
[1] 吳凱峰, 劉萬濤, 李彥虎,等.基于云計算的電力大數(shù)據(jù)分析技術(shù)與應(yīng)用[J].中國電力,2015,48(2):111?116.
WU Kaifeng, LIU Wantao, LI Yanhu, et al. Cloud?computing based power big data analysis technology and its application [J]. Electric power, 2015, 48(2): 111?116.
[2] 李倩偉,唐丙寅.基于大數(shù)據(jù)分析的移動對象軌跡預(yù)測方法[J].計算機測量與控制,2016,24(10):198?201.
LI Qianwei, TANG Bingyin. Moving object trajectory prediction method based on large data analysis [J]. Computer measurement & control, 2016, 24(10): 198?201.
[3] 王德文,孫志偉.電力用戶側(cè)大數(shù)據(jù)分析與并行負荷預(yù)測[J].中國電機工程學(xué)報,2015,35(3):527?537.
WANG Dewen, SUN Zhiwei. Big data analysis and parallel load forecasting of electric power user side [J]. Proceedings of the CSEE, 2015, 35(3): 527?537.
[4] 陳世敏.大數(shù)據(jù)分析與高速數(shù)據(jù)更新[J].計算機研究與發(fā)展,2015,52(2):333?342.
CHEN Shimin. Big data analysis and data velocity [J]. Journal of computer research and development, 2015, 52(2): 333?342.
[5] 郭平,王可,羅阿理,等.大數(shù)據(jù)分析中的計算智能研究現(xiàn)狀與展望[J].軟件學(xué)報,2015,26(11):3010?3025.
GUO Ping, WANG Ke, LUO Ali, et al. Computational intelligence for big data analysis: current status and future prospect [J]. Journal of software, 2015, 26(11): 3010?3025.
[6] 張濱,樂嘉錦,孫莉,等.基于列存儲的大數(shù)據(jù)分析系統(tǒng)物化策略研究[J].計算機研究與發(fā)展,2015,52(5):1061?1070.
ZHANG Bin, LE Jiajin, SUN Li, et al. Materialization strategies in big data analysis system based on column?store [J]. Journal of computer research and development, 2015, 52(5): 1061?1070.
[7] NAM J S, LEE K E, JUN A Y, et al. Dilemmas of Korean athletes with a spinal cord injury to participate in sports: a survey based on the ICF core set for spinal cord injury [J]. Annals of rehabilitation medicine, 2016, 40(5): 893?901.
[8] 張孟利,周天天,劉朝暉.太極拳在脊髓損傷康復(fù)中應(yīng)用的進展[J].中國康復(fù)理論與實踐,2016,22(11):1301?1303.
ZHANG Mengli, ZHOU Tiantian, LIU Chaohui. Advance in Taiji Quan in rehabilitation for spinal cord injury (review) [J]. Chinese journal of rehabilitation theory and practice, 2016, 22(11): 1301?1303.
[9] BEJAR M P, FISHER L A, NAM B H, et al. High?level south Korean athletes′ experiences of injury and rehabilitation [J]. Sport psychologist, 2016, 31(1): 16?29.
[10] 徐辰華,李智,李成縣,等.鑄鋁電解槽電壓過程控制仿真研究[J].計算機仿真,2016,33(5):358?362.
XU Chenhua, LI Zhi, LI Chengxian, et al. Simulation of cell voltage at the aluminum electrolysis process [J]. Computer simulation, 2016, 33(5): 358?362.