引言
學(xué)生體質(zhì)測試的數(shù)據(jù)對每個國家來說都是十分重要的資料,既要妥善保管又要充分地分析利用,所以目前建立一種新型的青少年體質(zhì)健康數(shù)據(jù)分析處理系統(tǒng)或平臺對國家具有重要的意義。通過青少年體質(zhì)健康數(shù)據(jù)處理系統(tǒng)進(jìn)行科學(xué)合理地配置數(shù)據(jù)處理功能,便于實現(xiàn)體質(zhì)測試后各類各項指標(biāo)的統(tǒng)計分析,快速方便地給出體質(zhì)數(shù)據(jù)以及數(shù)據(jù)分析的可視化的結(jié)果。便于學(xué)生及教師對學(xué)生體質(zhì)狀況的直觀了解,通過該系統(tǒng)改善青少年學(xué)生體質(zhì)干預(yù)的措施,優(yōu)化目前體質(zhì)數(shù)據(jù)分析處理系統(tǒng)的不足。本研究運用目前系統(tǒng)開發(fā)、數(shù)據(jù)庫搭建以及結(jié)果可視化的最新技術(shù)來進(jìn)行系統(tǒng)的開發(fā),以一個新的視角對大數(shù)據(jù)視域下青少年體質(zhì)測試的數(shù)據(jù)進(jìn)行處理分析,能夠從客觀上更好地了解學(xué)生的健康狀況,對研究青少年的真實健康狀態(tài)具有實際的應(yīng)用價值。同時豐富了這一領(lǐng)域的研究成果,為促進(jìn)青少年體質(zhì)發(fā)展提供理論支持和實踐經(jīng)驗。
1無監(jiān)督聚類分析
1.1大數(shù)據(jù)分析采用聚類算法
欲分析體質(zhì)健康各項因素對樣本體質(zhì)健康的影響,應(yīng)學(xué)習(xí)樣本集的概率分布。常用的參數(shù)估計方法往往需要假定樣本集符合某一概率分布,隨后根據(jù)樣本集擬合該分布中的參數(shù)。但該概率分布的選取需要主觀的先驗,往往難以擬合出與真實分布近似的模型。而非參數(shù)估計的方法不加入任何先驗知識,根據(jù)數(shù)據(jù)本身的特點與性質(zhì),擬合數(shù)據(jù)分布。在此我們使用無監(jiān)督聚類算法——K均值聚類對體質(zhì)健康測試數(shù)據(jù)進(jìn)行分析。K均值聚類是一種典型的無監(jiān)督機(jī)器學(xué)習(xí)聚類算法,通過預(yù)先設(shè)定聚類個數(shù),隨機(jī)初始化中心點,將各個數(shù)據(jù)劃分至特征空間內(nèi)歐式距離最近的類別中心;隨后根據(jù)各個類的數(shù)據(jù)分布,重新計算類中心點的坐標(biāo);根據(jù)更新后的類中心點的坐標(biāo),重新更新各數(shù)據(jù)點的類簇歸屬,不斷反復(fù)直至類中心點的坐標(biāo)不再移動,達(dá)到收斂。在對體質(zhì)健康數(shù)據(jù)應(yīng)用K均值聚類算法前,我們對數(shù)據(jù)進(jìn)行了篩選與清理,去除了“城鄉(xiāng)”、“性別”等不能直接反映體質(zhì)健康的數(shù)據(jù),只保留了體質(zhì)健康指標(biāo)相關(guān)的數(shù)據(jù),并對少量缺失數(shù)據(jù)以樣本群體均值進(jìn)行填充。隨后對數(shù)據(jù)進(jìn)行了歸一化處理,對體質(zhì)健康數(shù)據(jù)中的特征,應(yīng)用變換將其標(biāo)準(zhǔn)化,以消除數(shù)值對整體分布帶來的影響。聚類算法收斂后,通過核密度估計,分析各群體各屬性的概率密度分布,以探究各體質(zhì)健康因素對人群的影響。
1.2無監(jiān)督聚類結(jié)果實現(xiàn)路徑
無監(jiān)督聚類結(jié)果頁面
2.學(xué)生體質(zhì)健康數(shù)據(jù)無監(jiān)督分類結(jié)果
本研究數(shù)據(jù)來源為陜西省2014年全國學(xué)生體質(zhì)測試數(shù)據(jù)。2.1各年齡階段人群分類示意圖隨機(jī)把研究對象分為四類:男性健康群體、男性不健康群體、女性健康群體、女性不健康群體。通過數(shù)據(jù)分析結(jié)果如下圖:
從上圖中可以看出,7—14歲群體男女生身體素質(zhì)和健康水平差異不顯著,身體素質(zhì)的優(yōu)劣區(qū)分度不大,但是從15—16歲開始,男女生身體素質(zhì)差異程度逐漸拉大,從17歲以后,男女差別更大。身體素質(zhì)優(yōu)劣區(qū)分隨著年齡的增加區(qū)分度逐漸增加。
2.2 7歲群體聚類分析結(jié)果
從表中可以看出,一共有四類0,1,2,3.對于群體1與群體2,其握力均為正值,顯著高于群體均值,故判斷群體1和群體2為男性群體。同理判斷群體0和群體3為女性群體。針對群體1與群體2,群體1的BMI為負(fù)值,故該群體為男性健康群體,群體2為男性不健康群體,同理3為女性健康群體,0為女性不健康群體。
通過對四個群體聚類分析,7歲學(xué)生男性健康群體和男性不健康群體在體重、BMI、胸圍、50米、立定跳遠(yuǎn)、耐力跑、皮脂厚度等指標(biāo)兩群體差異顯著,視力、身高、坐高、肺活量、脈搏、握力、血壓、坐位體前屈、斜身引體等指標(biāo)兩群體差異不明顯。7歲學(xué)生女性健康群體和女性不健康群體在身高、坐高、體重、BMI、胸圍等指標(biāo)兩群體差異顯著,視力、肺活量、脈搏、50米、立定跳遠(yuǎn)、耐力跑、握力、血壓、坐位體前屈、斜身引體、皮脂厚度等指標(biāo)兩群體差異不明顯。
2.3 15歲群體聚類分析結(jié)果
從表中可以看出,一共有四類0,1,2,3.對于群體2與群體3,其身高、立定跳遠(yuǎn)和50米成績綜合分析其為男性群體,其中群體3為男性健康群體,群體2為男性不健康群體。同理判斷群體0和群體1為女性群體。根據(jù)50米成績和BMI數(shù)據(jù),確定群體0為女性健康群體,群體1為女性不健康群體。
通過對四個群體聚類分析,15歲學(xué)生男性健康群體和男性不健康群體在體重、BMI、胸圍、立定跳遠(yuǎn)、耐力跑、皮脂厚度等指標(biāo)兩群體差異顯著,視力、身高、坐高、肺活量、脈搏、50米、握力、血壓、坐位體前屈、引體向上等指標(biāo)兩群體差異不明顯。15歲學(xué)生女性健康群體和女性不健康群體在BMI、50米、立定跳遠(yuǎn)、仰臥起坐、皮脂厚度等指標(biāo)兩群體差異顯著,視力、身高、坐高、體重、胸圍、肺活量、脈搏、耐力跑、握力、血壓、坐位體前屈等指標(biāo)兩群體差異不明顯。
2.4 22歲群體聚類分析結(jié)果
從表中可以看出,一共有四類0,1,2,3.對于群體0與群體2,其身高、立定跳遠(yuǎn)和50米成績綜合分析其為男性群體,其中群體0為男性健康群體,群體2為男性不健康群體。同理判斷群體1和群體3為女性群體。根據(jù)50米成績和BMI數(shù)據(jù),確定群體1為女性健康群體,群體3為女性不健康群體。
通過對四個群體聚類分析,22歲學(xué)生男性健康群體和男性不健康群體在體重、BMI、胸圍、耐力跑、皮脂厚度等指標(biāo)兩群體差異顯著,視力、身高、坐高、肺活量、50米、脈搏、立定跳遠(yuǎn)、握力、血壓、坐位體前屈、引體向上等指標(biāo)兩群體差異不明顯。22歲學(xué)生女性健康群體和女性不健康群體在BMI、脈搏、耐力跑、皮脂厚度等指標(biāo)兩群體差異顯著,視力、身高、坐高、體重、胸圍、肺活量、握力、血壓、坐位體前屈、50米、立定跳遠(yuǎn)、仰臥起坐等指標(biāo)兩群體差異不明顯。
3結(jié)論
3.1 K均值聚類是一種典型的無監(jiān)督機(jī)器學(xué)習(xí)聚類算法,能有效地對體質(zhì)健康測試數(shù)據(jù)進(jìn)行分析。
3.2從分類圖中可看出,7-14歲男女生身體素質(zhì)和健康水平差異不顯著,身體素質(zhì)的優(yōu)劣區(qū)分度不大,但是從15-16歲開始,男女生身體素質(zhì)差異程度逐漸拉大,從17歲以后,男女差別更大。身體素質(zhì)優(yōu)劣區(qū)分隨著年齡的增加區(qū)分度逐漸增加。
3.3通過對四個群體聚類分析,7歲學(xué)生男性健康群體和男性不健康群體對比結(jié)果,體重、BMI、胸圍、50米、立定跳遠(yuǎn)、耐力跑、皮脂厚度等指標(biāo)差異顯著,視力、身高、坐高、肺活量、脈搏、握力、血壓、坐位體前屈、斜身引體等指標(biāo)差異不明顯。7歲學(xué)生女性健康群體和女性不健康群體對比結(jié)果,身高、坐高、體重、BMI、胸圍等指標(biāo)差異顯著,視力、肺活量、脈搏、50米、立定跳遠(yuǎn)、耐力跑、握力、血壓、坐位體前屈、斜身引體、皮脂厚度等指標(biāo)差異不明顯。
3.4通過對四個群體聚類分析,15歲學(xué)生男性健康群體和男性不健康群體對比結(jié)果,體重、BMI、胸圍、立定跳遠(yuǎn)、耐力跑、皮脂厚度等指標(biāo)差異顯著,視力、身高、坐高、肺活量、脈搏、50米、握力、血壓、坐位體前屈、引體向上等指標(biāo)差異不明顯。15歲學(xué)生女性健康群體和女性不健康群體對比結(jié)果,BMI、50米、立定跳遠(yuǎn)、仰臥起坐、皮脂厚度等指標(biāo)差異顯著,視力、身高、坐高、體重、胸圍、肺活量、脈搏、耐力跑、握力、血壓、坐位體前屈等指標(biāo)差異不明顯。
3.5通過對四個群體聚類分析,22歲學(xué)生男性健康群體和男性不健康群體對比結(jié)果,體重、BMI、胸圍、耐力跑、皮脂厚度等指標(biāo)差異顯著,視力、身高、坐高、肺活量、50米、脈搏、立定跳遠(yuǎn)、握力、血壓、坐位體前屈、引體向上等指標(biāo)兩群體差異不明顯。22歲學(xué)生女性健康群體和女性不健康群體對比結(jié)果,BMI、脈搏、耐力跑、皮脂厚度等指標(biāo)差異顯著,視力、身高、坐高、體重、胸圍、肺活量、握力、血壓、坐位體前屈、50米、立定跳遠(yuǎn)、仰臥起坐等指標(biāo)差異不明顯。
參考文獻(xiàn):
[1]邢文華.中國青少年體質(zhì)的現(xiàn)狀及加強(qiáng)青少年體育的緊迫性[J].青少年體育,2012(01):5-6.
[2]李琳等.俄羅斯年前青少年體育發(fā)展戰(zhàn)略及其啟示武漢體育學(xué)院學(xué)報,2012(5):10-13.
[3]燕凌,李京誠,韓桂鳳等.19世紀(jì)以來美國中小學(xué)體育發(fā)展歷程及其啟示[J].體刊,2015,(5):87-91.DOI:10.3969/j.issn.1006-7116.2015.05.017.
[4]王樂,張業(yè)安,王磊.近10年屏幕時間影響青少年體質(zhì)健康的國外研究進(jìn)展[J].體育學(xué)刊,2016,23(02):138-144.
[5]高剛,季瀏.試述美國青少年體質(zhì)健康測試發(fā)展及對我國的啟示[J].成都體育學(xué)院學(xué)報,2013,39(6):22-26.DOI:10.3969/j.issn.1001-9154.2013.06.004.
[6]王永恒.數(shù)據(jù)分析系統(tǒng)發(fā)展的現(xiàn)狀探討[J].科技創(chuàng)新與應(yīng)用,2015,(29):95.
[7]王元卓,靳小龍,程學(xué)旗等.網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J].計算機(jī)學(xué)報,2013,36(6):1125-1138.DOI:10.3724/SP.J.1016.2013.01125.
[8]李國杰,程學(xué)旗.大數(shù)據(jù)研究:未來科技及經(jīng)濟(jì)社會發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究狀學(xué)思考[J].中國科學(xué)院院刊,2012,27(6):647-657.DOI:10.3969/j.issn.1000-3045.2012.06.001.
作者簡介:武洛生(1969.04-)男,漢族,籍貫:河北邯鄲,畢業(yè)院校:西安體育學(xué)院,畢業(yè)專業(yè):體育教育,學(xué)歷:本科,工作單位:西安體育學(xué)院,職稱:教授,研究方向:體育教學(xué)與訓(xùn)練。
陜西省軟科學(xué)項目,大數(shù)據(jù)視域下提高學(xué)生體質(zhì)健康水平的研究。2019KM170。