付文婧
目前很多高校會利用體育健康測試成績得出學生體質健康及格率,并且該成績會直接納入學生全面素質教育發(fā)展體系。但是傳統(tǒng)大學生體育健康標準測試所得成績仍存在一定的人為因素的影響。如何改善人為因素影響,并通過利用統(tǒng)計方法和模型更新大學生體育健康標準測試是本研究需要解決的問題。
1 具體分析過程
1.1 研究對象及指標
以中北大學材料科學與工程學院380名女生為總樣本量,評價指標為體育測試的6項指標:肺活量X1,立定跳遠X2,坐位體前屈X3,50mX4,800mX5,1min仰臥起坐X6。
1.2 數(shù)據預處理及描述性分析
將380個總體單元編碼,進行簡單隨機抽樣(總體N中任意抽取n個個體為樣本,各樣本被抽中的概率相等),最后抽取樣本量為30個(Excel隨機生成編號),重新編號后即為本次的研究對象。由于X5,X6為逆向指標,令X5=100/S800,X4=1/S50(S為800m和50m用時,單位:秒),便于分析。
通過描述性統(tǒng)計分析得出,肺活量(X1)方差最大(為2142),說明該指標在各樣本之間差距最大;而50m的方差(0.098)小于1,說明樣本50m成績之間相差不大。肺活量X1和立定跳遠X2(130.0)方差排在第一第二,是學生體測成績之間較好的區(qū)分指標。
1.3 因子分析的適用性
因子分析是指研究從變量群中提取共性因子的統(tǒng)計技術。利用KMO系數(shù)檢驗和Bartlett的球形度檢(KMO系數(shù)需大于0.5,球形檢驗顯著性需小于0.05)可判定是否適合使用因子分析模型。進行因子旋轉,利用旋轉后的因子載荷按照所含信息的百分比提取公因子(所含信息量稱為信息貢獻率一般需要大于70%,否則不適合用此方法進行因子提?。?,選取旋轉載荷碎石圖特征值大于1的公因子即為樣本最后分類數(shù)。
利用SPSS進行數(shù)據分析,結果顯示KMO(0.732)>0.7,球形檢驗顯著性(<0.000)<0.05,通過相關系數(shù)矩陣檢驗。因子間相關系數(shù)基本都>0.3,說明30個樣本間存在較強的相關關系,適合做因子分析。通過因子分析旋轉提取出的兩個因子F1和F2(碎石圖特征值分別為2.683和1.167,圖一所示)用來代替原來6個指標解釋學生體育測試水平,提取的信息總量(累計貢獻率)為77.168%,含有較大的信息量。
通過旋轉后的成分矩陣,得出因子對初始6項指標的解釋程度,F(xiàn)1對指標立定跳遠X2、50mX4、800mX5和1min仰臥起坐X6解釋程度較大,F(xiàn)2對指標肺活量X1和坐位體前屈X3的解釋程度較大。命名第一因子為運動型因子(F1),第二因子為素質型因子(F2)。利用得分方程函數(shù)公式:
(i為提取公因子個數(shù),j為原有因子個數(shù),a為旋轉矩陣系數(shù)),利用旋轉后成分矩陣得到系數(shù),最終得分方程如下:
F1=0.228X1+0.606X2+03606X3+0.855X4+0.832X5+0.864X6
F2=0.789X1-0.1X2-0.688X3+0.221X4-0.1X5-0.029X6
根據共因子得分,以特征值所占比例為權數(shù)(權重分別為0.697,0.303),計算綜合因子得分。計算公式為:
將原始數(shù)據進行標準化后,因子得分的平均值為0,故離0越遠因子得分越突出。綜合得分后得到優(yōu)、良、中、差四個等級,得分由差到優(yōu)分別為:(-∞,-1),(-1,0),(0,1)和(1,∞)。對比初始測試標準的成績,得出5個差異較大的異常值如表二所示。主要原因為,25號樣本由于在運動型因子方面得分較低,所以在新的標準中該因子得分較低;而10號、12號、18號由于在運動型因子上得分較高,故綜合得分較高??梢钥闯?,運動型因子是第一因子,因子貢獻率為54.723%,遠高于素質型因子,所以在統(tǒng)計標準測試中占主導地位。
1.4 結果驗證
1.4.1 K均值聚類法檢驗
由于事先定好分組為四組,故采用K均值聚類法(提前設定分類個數(shù)利用程序進行自動分類),可以做到把體育素質水平相當?shù)膶W生分到一組,通過各組成員的強弱勢進行不同的訓練,使得學生的身體素質進一步提高。
結果如表三所示,第一類是兩種因子中得分都不高的人,平均得分不超過-1.7分,說明在目前的體育測試中沒有該個體的優(yōu)勢項,因此她們需要加強體育鍛煉;第二類素質型因子得分相對較低的人,(F2平均得分不超過1)說明她們的體育測試的得分低的原因是由于肺活量X1和坐位體前屈X3成績不夠好。建議需要運動后進行適當?shù)厥嬲购屠?,也可以通過適當增加有氧運動時間提高成績;第三類是以運動型因子的六項指標得分較低群體,(F1平均得分不超過-1)她們在該類型測試中成績較差,可以適當?shù)赜柧氉约旱谋l(fā)力,例如進行規(guī)律的有氧運動訓練等等;第四類是兩項因子得分都不錯的人,平均得分超過2.29分,她們主要要做的是適當?shù)腻憻?,穩(wěn)定水平即可。
1.4.2 貝葉斯判別
貝葉斯判別的思想就是判斷給定的X屬于i類還是j類,即判別X進入上述兩類的概率大小。根據貝葉斯判別,得出后驗概率P(Gi|Xk)和P(Gj|Xk)進行比較,在X相等條件下發(fā)生Gi時的P值大,則歸為Gi類,反之,歸為Gj類。進行誤判的平均損失利用公式:
30個樣本的聚類正確率為93.33%,判別結果誤差較低,僅有個別樣本在聚類的過程中判斷失誤。誤判的是16號(L12)、26號(L21)??赡苁怯捎诜位盍糠讲钐?,而在這樣的情況下,得分情況受到其他指標影響占比較小;并且在兩類因子中存在相關關系,可能存在兩類測試成績得分都不高的樣本的綜合得分不會很差,同理,某類因子下測試得分高但綜合起來得分低也是有可能的。
2 結語
本文通過對中北大學材料科學與工程學院30名女生的體測成績進行試分析,發(fā)現(xiàn)體測的6項指標可以分為兩類因子:運動型因子和素質型因子。并且發(fā)現(xiàn)運動型因子的成績會在更大程度上影響樣本的總體體測成績。
運用多元統(tǒng)計分析大學生體育標準測試成績減少了人為地賦予權重的因素影響,它可以突出每個學生在某幾個因子下的得分情況,有助于更好地提高體測成績。但因子分析較為繁瑣,測評時間較長,對測評人的專業(yè)要求也比較嚴格。但可以通過編程進行數(shù)據錄入和計算簡化程序。由于這六項指標的量綱差距過大,導致大家很容易誤解將某一項作為決定性因素。并且,身高體重指標是一個適中指標,很難把它放進因子分析中,最好的方法是人為賦予權重,這也是筆者認為目前統(tǒng)計因子分析對體育測試綜合評價最不足的地方。由于不可抗因素,很多個體沒有參加體測或者沒有被抽出作為測試樣本,數(shù)據存在一定誤差,不排除因子個數(shù)會增加或者權重改變。
(作者單位:拉夫堡大學體育管理專業(yè))