鄭 忠
基于自組織特征映射網(wǎng)絡(luò)方法的學(xué)生體質(zhì)健康數(shù)據(jù)聚類分析
鄭 忠
成都理工大學(xué)地球物理學(xué)院,四川 成都,610059。
目的:尋找體質(zhì)健康測試各指標間復(fù)雜的、非線性的關(guān)系,為體育教學(xué)工作提供科學(xué)的技術(shù)支持。方法:將成都市某高校近3萬名在校大學(xué)生體質(zhì)健康數(shù)據(jù)分為男生組與女生組,運用自組織特征映射網(wǎng)絡(luò)(Self-organizing feature Map,SOM)方法,對兩組數(shù)據(jù)進行聚類分析。并以各類學(xué)生相同變量的均值作為權(quán)重,對不同變量值間變化趨勢進行可視化表達。結(jié)果:分別將男女生測試數(shù)據(jù)聚為A、B、C、D四類。男生組中各類不同變量變化有跡可循,女生組中各類“各有所長”且變化趨勢較為復(fù)雜。結(jié)論:(1)上肢和腰腹力量素質(zhì)與柔韌素質(zhì)間存在“此消彼長”現(xiàn)象。針對此現(xiàn)象,在體育教學(xué)中應(yīng)在端正學(xué)生訓(xùn)練態(tài)度的同時,加強力量素質(zhì)與柔韌素質(zhì)的交叉性訓(xùn)練。(2)男學(xué)生群體中,力量素質(zhì)對身體素質(zhì)的影響最大。建議在訓(xùn)練中,注重以力量訓(xùn)練為起點,再輔以跑動能力的鍛煉。(3)男女學(xué)生各項測試指標間變化情況存在較大差異。針對此情況,應(yīng)注意男女學(xué)生之間采取差異化的訓(xùn)練方法。
體質(zhì)健康;自組織特征映射網(wǎng)絡(luò);積累分析
學(xué)生的體質(zhì)健康問題一直是國家非常重視的社會問題。長期以來,各級教育部門與機構(gòu)積極開展了學(xué)生體質(zhì)健康的評測工作,獲得并分析了大量的數(shù)據(jù)。然而,據(jù)調(diào)研,絕大多數(shù)基層教育機構(gòu)在分析數(shù)據(jù)時僅采用了過于簡單的統(tǒng)計分析方法,如權(quán)重分析等,以至于對數(shù)據(jù)的挖掘程度嚴重不足,在很大程度上限制了分析的深度和相關(guān)研究,基本上不可能對體育教學(xué)過程中出現(xiàn)的諸多現(xiàn)實問題給予解決和提出建設(shè)性的意見。
為了解決上述問題,近年來許多學(xué)者對學(xué)生體質(zhì)健康結(jié)果評價方法和模型進行了深入的研究。其中,大多數(shù)體育學(xué)者及工作者利用一些基礎(chǔ)性的數(shù)理統(tǒng)計學(xué)方法建立評價與分析模型[1-3]。但是,此類模型所關(guān)注的目標參數(shù)僅僅局限于期望、方差等基本的統(tǒng)計學(xué)參數(shù)。此類模型最主要的弊端在于:對數(shù)據(jù)的挖掘深度過淺,數(shù)據(jù)中蘊含的信息被嚴重埋沒,能夠解決的現(xiàn)實問題非常有限。鑒于上述情況,又有較少數(shù)的學(xué)者開始嘗試通過多元統(tǒng)計學(xué)方法建立評價與分析模型[4-6]。該類模型以回歸分析為最主要的分析方法,還包括簡單的聚類分析。此外,還有極少數(shù)的國內(nèi)學(xué)者采用了灰度相關(guān)等方法嘗試建立評價與分析模型[7-8]。此舉在一定程度上改善了對數(shù)據(jù)的利用效率。雖然這些評價與分析模型在數(shù)據(jù)挖掘深度和模型本身的功能方面有所提升,但始終未能得到廣泛的應(yīng)用。因此,立足于實現(xiàn)數(shù)據(jù)的挖掘程度的顯著提升,進而探索更深層次的規(guī)律,為體育教學(xué)改革與學(xué)生身體素質(zhì)的提升提供更加科學(xué)的參考依據(jù)的目標,本研究運用自組織特征映射網(wǎng)絡(luò)(SOM)方法,對來自成都某高校近3萬名在校大學(xué)生體質(zhì)健康測試數(shù)據(jù)進行了聚類分析。
為了獲得更加合理的訓(xùn)練結(jié)果,選取成都理工大學(xué)2012級~2014級本科生于2015年體質(zhì)健康測試所得26461條數(shù)據(jù),測試對象年齡普遍為18歲~22歲,其中男生實測數(shù)據(jù)14 323條,女生實測數(shù)據(jù)12 138條。男生數(shù)據(jù)集包含身高、體重、肺活量、50m跑、立定跳遠、坐位體前屈、1000m跑和引體向上8個指標;女生數(shù)據(jù)集中每條數(shù)據(jù)包含身高、體重、肺活量、50m跑、立定跳遠、坐位體前屈、800m跑和仰臥起坐8個指標。由于身高和體重與其他身體指標之間的相關(guān)性無法評價,所以在此文中不選用身高、體重兩個指標作為聚類依據(jù)。同時,為了避免各變量值量綱差距、異常值以及極端值對聚類結(jié)果帶來的影響,使用將矩陣映射到均值為0且標準差為1的方法進行歸一化處理,得到無量綱變量值。如圖1所示,原始數(shù)據(jù)中男生50m跑和引體向上數(shù)據(jù)分布呈偏態(tài)分布,其余變量基本呈正態(tài)分布。
圖1 男女學(xué)生數(shù)據(jù)不同變量值分布情況
自組織特征映射網(wǎng)絡(luò)(self-organizing feature maps , SOM)是Kohonen教授于1982年提出的一種無監(jiān)督競爭學(xué)習(xí)型的網(wǎng)絡(luò),網(wǎng)絡(luò)結(jié)構(gòu)簡圖如圖2所示。網(wǎng)絡(luò)通過自組織方式,用大量訓(xùn)練樣本調(diào)整網(wǎng)絡(luò)的權(quán)值,最后使輸出層各節(jié)點成為對特定模式類敏感的神經(jīng)元。并且當兩個模式類的特征接近時,代表這兩類的節(jié)點在位置上也接近。從而在輸出層形成能反應(yīng)樣本模式類分布情況的有序特征圖。
相較于統(tǒng)計學(xué)聚類方法,神經(jīng)網(wǎng)絡(luò)方法能增加對數(shù)據(jù)的挖掘深度,更有機會發(fā)現(xiàn)數(shù)據(jù)之間存在的復(fù)雜的、非線性的關(guān)系。相較于其他神經(jīng)網(wǎng)絡(luò)方法,SOM有著易于理解、更適用于聚類問題、能可視化的表達特征圖的質(zhì)量以及對象間的相似度、可操作性強等優(yōu)點。常被用于分類聚類、組合優(yōu)化、數(shù)據(jù)分析和預(yù)測、模式識別等領(lǐng)域。
圖2 SOM網(wǎng)絡(luò)結(jié)構(gòu)簡圖
SOM網(wǎng)絡(luò)中權(quán)值調(diào)整采用的算法,稱為Kohonen 算法,其調(diào)整權(quán)向量與側(cè)抑制的方式為:獲勝神經(jīng)元對其臨近神經(jīng)元的影響是由近及遠,由興奮逐漸變?yōu)橐种啤?/p>
SOM網(wǎng)絡(luò)的學(xué)習(xí)算法[10-12],按如下步驟進行:
(1)初始化網(wǎng)絡(luò)權(quán)重。在訓(xùn)練之前,將每個節(jié)點的權(quán)重設(shè)定為小的歸一化的隨機值。
(2)在網(wǎng)絡(luò)中輸入預(yù)處理后數(shù)據(jù)。
(3)尋找最佳匹配單元(best matching unit,BMUs):遍歷所有節(jié)點,求輸出層權(quán)值向量和輸入向量的最近距離(歐式距離)。最接近節(jié)點即為最佳匹配單元。
(4)更新BMU及其鄰域權(quán)值。
(5)回到步驟2,重新執(zhí)行。直到臨近兩次迭代中權(quán)值的變化低于設(shè)定閾值,或達到最大迭代次數(shù)。
采用Matlab 2016b軟件Neural Clustering(nctool)工具箱,以輸出層結(jié)構(gòu)為1×4、訓(xùn)練步長分別為50、100、200、500、1000的SOM 網(wǎng)絡(luò)對數(shù)據(jù)進行聚類,發(fā)現(xiàn)步長超過100后,聚類結(jié)果無明顯變化,所以在本文中采用輸出層結(jié)構(gòu)為1×4、訓(xùn)練步長為100對歸一化處理后數(shù)據(jù)進行聚類。
將聚類后結(jié)果分為A、B、C、D四類(總占比為1.0000),對此四類數(shù)據(jù)中相同變量值以均值作為其權(quán)重,值越大說明在此指標中該類同學(xué)運動表現(xiàn)越好,并利用此值對四類數(shù)據(jù)相同變量進行比較并分析。
表1匯總了聚類后A、B、C、D四類男生各單項身體素質(zhì)的占比情況。如表1及圖3所示,A類男生各變量值均為四類男生中最小的;在1000m、50m、立定跳遠以及引體向上項目中,均是C類學(xué)生表現(xiàn)最好、A類學(xué)生表現(xiàn)最差;坐位體前屈測試以肺活量項目中,D類學(xué)生表現(xiàn)最好,A類學(xué)生表現(xiàn)最差。C類學(xué)生在1000m、50m測試項目中有著優(yōu)秀的表現(xiàn),而A類、D類學(xué)生在此兩項中表現(xiàn)較差。對比A、C、D這三類學(xué)生的引體向上項目,同樣存在C類學(xué)生表現(xiàn)優(yōu)秀,而A類、D類學(xué)生表現(xiàn)較差情況。對比A、B、C三類學(xué)生的坐位體前屈與1000m、50m項目測試情況,均是C類學(xué)生表現(xiàn)最好,B類學(xué)生次之,A類學(xué)生表現(xiàn)最差。對比A、B、C、D四類學(xué)生的引體向上項目與坐位體前屈測試項目測試情況,發(fā)現(xiàn)呈現(xiàn)出負相關(guān)情況;坐位體前屈項目以及肺活量項目測試情況,發(fā)現(xiàn)四類學(xué)生在這兩個項目中的表現(xiàn)均為D類學(xué)生表現(xiàn)最好、C類學(xué)生表現(xiàn)次之、A類學(xué)生表現(xiàn)最差。
表1 男生各單項身體素質(zhì)占比情況
圖3 男生聚類后各變量值變化趨勢圖
表2匯總了A、B、C、D四類女生各單項身體素質(zhì)的占比情況。如表2及圖4所示,相較于男生聚類結(jié)果,女生聚類結(jié)果中不同類別各變量值分布情況更加復(fù)雜。在50m、800m測試項目中,均是A類學(xué)生表現(xiàn)最好,C類學(xué)生表現(xiàn)最差;坐位體前屈測試項目中表現(xiàn)較好的A、B兩類學(xué)生,在仰臥起坐項目表現(xiàn)中相較于C、D兩類學(xué)生,出現(xiàn)了明顯下滑情況,而C、D兩類學(xué)生則呈上升態(tài)勢;在立定跳遠項目中,測試情況與仰臥起坐項目類似,D類學(xué)生表現(xiàn)最好,而A類學(xué)生表現(xiàn)最差。整體而言,在女生群體中,坐位體前屈測試項目中表現(xiàn)良好的學(xué)生,800m項目表現(xiàn)也良好。與男生情況相似,四類女生坐位體前屈與仰臥起坐兩項目,變量占比呈負相關(guān)。
表2 女生各單項身體素質(zhì)占比情況
圖4 女生聚類后各變量值變化趨勢圖
從通過應(yīng)用SOM方法得到的結(jié)果來看,各類學(xué)生均出現(xiàn)同一問題,即柔韌素質(zhì)(坐位體前屈)與上肢和腰腹力量素質(zhì)(引體向上/仰臥起坐)二者之間普遍存在“此消彼長”的情況。在男生聚類后表現(xiàn)中,上肢力量表現(xiàn)較好的B和C兩類學(xué)生,在柔韌素質(zhì)測試項目中,表現(xiàn)均呈現(xiàn)下滑情況,而在上肢力量素質(zhì)測試項目中表現(xiàn)較差的A類和D類學(xué)生,柔韌素質(zhì)均呈現(xiàn)出上升情況。在女生聚類后表現(xiàn)中,四類女生均在腰腹力量素質(zhì)和柔韌素質(zhì)兩項測試中呈現(xiàn)出負相關(guān)情況。對于上肢與腰腹力量素質(zhì)與柔韌素質(zhì)呈負相關(guān)這一問題,其原因可能是學(xué)生對待體育訓(xùn)練存在畏難心理以及肌肉伸展性與收縮性之間存在先天制約。在當前體育教學(xué)大環(huán)境下,在面對力量與柔韌性訓(xùn)練的選擇時,學(xué)生往往避開自己的不熟練項目。力量較好的學(xué)生,更傾向于力量訓(xùn)練,從而使得肌肉收縮能力變得更強,即力量越大,導(dǎo)致肌肉像“非常緊的彈簧”無法輕易拉伸,這樣就使得柔韌性下降。柔韌性較好的學(xué)生更愿意選擇柔韌性訓(xùn)練,經(jīng)過柔韌性訓(xùn)練,使肌肉、韌帶等軟組織的伸展能力更強,再加之不輔以力量訓(xùn)練,從而導(dǎo)致肌肉收縮能力下降,即力量下降。針對此問題,在體育教學(xué)中,應(yīng)在端正學(xué)生訓(xùn)練態(tài)度的同時,引導(dǎo)學(xué)生進行力量與身體柔韌性的交叉訓(xùn)練,以達到在力量上升的同時,盡可能保持身體柔韌性不下降的目的。
同時,我們發(fā)現(xiàn)A類男生在各項測試指標表現(xiàn)中均為四類男生中最差的,尤其是在上肢力量方面與其他三類男生相差巨大。另一方面,單獨分析D類男生各項指標變化特征,發(fā)現(xiàn) D 類男生柔韌素質(zhì)為四類男生中最好的,但力量在四類男生中表現(xiàn)較差。同時,D類男生在耐力跑(1000m)以及速度跑(50m)兩項目中表現(xiàn)較差。對比其他三類男生在耐力跑以及速度跑項目中的表現(xiàn)情況,我們發(fā)現(xiàn)在男生群體中,力量素質(zhì)相較于柔韌素質(zhì)對跑動能力有著更加積極的影響。在競技體育的初級階段,高水平的舉重運動員即是短跑運動員,這一現(xiàn)象說明了力量與跑動能力有著緊密的聯(lián)系。同時,跑動能力是對身體素質(zhì)最直觀的體現(xiàn),這從側(cè)面說明了力量是身體素質(zhì)的基礎(chǔ),是良好身體素質(zhì)的保證。再加之男生群體中出現(xiàn)的力量素質(zhì)相較于柔韌素質(zhì)對跑動能力有著更積極的影響情況,所以認為可能是力量過弱導(dǎo)致 A類男生出現(xiàn)各項指標表現(xiàn)均不理想的情況。為了避免A類情況出現(xiàn),在訓(xùn)練教學(xué)中,應(yīng)注重從力量訓(xùn)練開始,再輔以跑動能力的鍛煉,這樣能夠達到有效提高身體素質(zhì)的目的。
整體而言,四類男生在1000m、坐位體前屈及引體向上項目中表現(xiàn)有明顯差異,而在50m、立定跳遠以及肺活量測試項目中差異并不是很明顯。而四類女生則不同,在各項測試指標中“各有所長”,差異并不是特別明顯。此現(xiàn)象的出現(xiàn)可能是在體育教學(xué)中,忽視了男女學(xué)生先天條件的差異,從而采用同一套訓(xùn)練模式,導(dǎo)致此現(xiàn)象的出現(xiàn)。針對此現(xiàn)象,在體育教學(xué)中,應(yīng)注意男女學(xué)生之間采取差異化的訓(xùn)練方法。
本文選用聚類方法中的SOM網(wǎng)絡(luò)方法對大學(xué)生體質(zhì)健康測試數(shù)據(jù)進行聚類分析,并利用各類學(xué)生不同變量值的均值作為權(quán)重,對不同類別學(xué)生各變量值變化趨勢進行可視化表達,其思想為利用SOM網(wǎng)絡(luò)發(fā)現(xiàn)不同變量值之間的內(nèi)在聯(lián)系。分別對不同類別的男女學(xué)生進行研究可得到以下結(jié)論:
(1)力量素質(zhì)與柔韌素質(zhì)間存在“此消彼長”現(xiàn)象。針對此現(xiàn)象,在體育教學(xué)中應(yīng)在端正學(xué)生訓(xùn)練態(tài)度的同時,加強力量與柔韌性的交叉性訓(xùn)練。
(2)男生群體中,力量素質(zhì)對身體素質(zhì)的影響最大,且相較于柔韌素質(zhì)對跑動能力的積極影響更大。建議在訓(xùn)練中,注重以力量訓(xùn)練為起點,再輔以跑動能力的鍛煉,以達到有效提高身體素質(zhì)的目的。
(3)男女學(xué)生群體各項測試指標間變化情況存在較大差異。針對此情況,在體育教學(xué)中,應(yīng)注意男女學(xué)生之間采取差異化的訓(xùn)練方法。
[1] 崔巴特爾,胡曉彥,崔 磊.大學(xué)生體質(zhì)健康評價體系與運動處方的研究開發(fā)[J].北京體育大學(xué)學(xué)報,2004(07):927~929.
[2] 王明俊,吳 亮.基于回歸和相關(guān)分析的大學(xué)生體質(zhì)健康評價指標關(guān)系的研究[J].成都體育學(xué)院學(xué)報,2008(05):79~81.
[3] 王明俊,王 玲,王 萍.大學(xué)生體質(zhì)健康評價指標權(quán)值與貢獻率關(guān)系的思考[J].山東體育學(xué)院學(xué)報,2007(02):78~79+94.
[4] 張曉丹,楊倩倩.基于聚類分析的天津市大學(xué)生體質(zhì)健康評價分級模型研究[J].天津科技,2014,41(08):76~79.
[5] 李昌鋒,張 星,林增榮,李 珍,林佳蕙.基于Foxtable的大學(xué)生體質(zhì)健康評價系統(tǒng)構(gòu)建研究[J].當代體育科技,2017,30(07):228~229+231.
[6] 宋愛玲. 大學(xué)生體質(zhì)健康評價及運動處方系統(tǒng)[A]. Intelligent Information Technology Application Association.Proceedings of the 2011 International Conference on Future Computer Science and Application(FCSA 2011 V4)[C].Intelligent Information Technology Application Association:智能信息技術(shù)應(yīng)用學(xué)會,2011:3.
[7] 杜 晶.基于灰關(guān)聯(lián)層次分析法的大學(xué)生體質(zhì)健康評價[J].科技視界,2014(13):212~213.
[8] 朱志宏.基于VLOOKUP函數(shù)的大學(xué)生體質(zhì)健康評價手工測試方案研究[J].當代體育科技,2017,25(07):198~199.
[9] 朱大奇史慧. 人工神經(jīng)網(wǎng)絡(luò)原理及應(yīng)用[M]. 科學(xué)出版社,2006.
[10] Dragomir OE, Dragomir F, Radulescu M. Matlab Application of Kohonen Self-organizing Map to Classify Consumers’ Load Profiles. Procedia Computer Science. 2014; 31: 474~479. doi:10.1016/ j.procs. 2014.05.292.
[11] Amin M N M , Nohuddin P N E , Zainol Z . Trend cluster analysis using self organizing maps[C]// Information and Communication Technologies(WICT), 2014 Fourth World Congress on. IEEE, 2014.
[12] Liu Y, Lee S H , Chon T S . Analysis of behavioral changes of zebrafish (Danio rerio) in response to formaldehyde using Self-organizing map and a hidden Markov model[J]. Ecological Modelling, 2011, 222(14): 2191~2201.
[13] 孫 銘.基于SOM神經(jīng)網(wǎng)絡(luò)聚類的用氣客戶全生命周期管理[J].天然氣工業(yè),2018,38(12):146~152.
[14] 劉 暢,唐建軍,高 凱.高水平男子網(wǎng)球運動員功能性動作能力與專項身體素質(zhì)的相關(guān)性研究[J].成都體育學(xué)院學(xué)報,2018,44(02):86~91.
Cluster Analysis of Students' Physique Health Data Based on Self-Organizing Feature Mapping Network Method
ZHENG Zhong
College of Geophysics, Chengdu University of Technology, Chengdu Sichuan, 610059, China.
Objective: To find the complex and non-linear relationships between the indicators of physique fitness test, and provide scientific technical support for physical education. Methods: The physique health data of nearly 30,000 college students in a university in Chengdu were divided into male and female groups. The Self-Organizing Feature Map(SOM)method was used to cluster the two groups of data. The mean value of the same variable of various students is used as the weight to visually express the change trend between different variable values. Results: The test data of boys and girls were clustered four categories: A, B, C and D. There are traces of changes in various variables in the boys’ group. The various groups in the girls group have their own strengths, and the trend is more complicated. Conclusions:(1)The presence of the upper limbs and the waist and abdomen strength quality and flexibility quality trade-off phenomenon. In view of this phenomenon, in the physical education teaching, we should strengthen the cross-training of strength and flexibility while correcting the attitude of students training.(2)Among the male student groups, the quality of strength has the greatest impact on physical fitness. It is recommended to focus on strength training as a starting point in training, supplemented by exercise with running ability.(3)There is a big difference in the changes between the test indicators of male and female students. In view of this, attention should be paid to the adoption of differentiated training methods between male and female students.
Physique health; Self-Organizing Feature Map; Accumulation analysis
1007―6891(2020)03―0053―04
10.13932/j.cnki.sctykx.2020.03.13
G804.22
A
2019-08-06
2019-08-29
成都理工大學(xué)大學(xué)生課外科技立項重點項目(2018KJZ0390)。