, ,
(1.廣州城建職業(yè)學(xué)院數(shù)學(xué)建模實(shí)驗(yàn)室,廣東 廣州 510925 ; 2.廣州中醫(yī)藥大學(xué)經(jīng)濟(jì)與管理學(xué)院,廣東 廣州510006 )
大學(xué)生體質(zhì)健康關(guān)系到民族未來(lái)的發(fā)展,教育部要求每年以學(xué)校為單位組織展開(kāi)大學(xué)生體能測(cè)試,并將統(tǒng)計(jì)數(shù)據(jù)整理上報(bào),以便全面了解大學(xué)生體質(zhì)發(fā)展?fàn)顩r。
以跟蹤采集某學(xué)院4年來(lái)近2萬(wàn)名學(xué)生的體測(cè)樣本為基礎(chǔ),采用拉以達(dá)法則剔除異常數(shù)據(jù),減小了模型的隨機(jī)誤差,結(jié)合相關(guān)系數(shù)、回歸樹(shù)等數(shù)學(xué)模型,較為全面地計(jì)量了身體質(zhì)量指數(shù)-BMI(Bodymass Index)對(duì)運(yùn)動(dòng)指標(biāo)的影響,引入均值灰色預(yù)測(cè)模型對(duì)未來(lái)3年大學(xué)生體質(zhì)變化趨勢(shì)進(jìn)行了預(yù)測(cè)。
以年為單位預(yù)測(cè)大學(xué)生體質(zhì)發(fā)展趨勢(shì),但僅有2014-2017年數(shù)據(jù),小樣本、貧數(shù)據(jù)是其鮮明特點(diǎn),因此灰色預(yù)測(cè)較為合適,但以男生肺活量序列(3332.922,3810.932,3592.433,3846.573)、50m跑序列(6.961,7.074,7.245,6.858)為例,有顯著的振蕩情形,而相較原始差分、離散GM(1,1)而言,均值GM(1,1)(或EGM)精度更高,因此引入EGM模型[1]。
以某學(xué)院2014-2017年體測(cè)數(shù)據(jù)為基礎(chǔ),總樣本20092個(gè),構(gòu)建體測(cè)指標(biāo)體系:身高、體重、BMI、肺活量、立定跳遠(yuǎn)、坐位體前屈、50m跑,另外男生包含1000m跑、引體向上,女生包含800m跑、仰臥起坐等指標(biāo)。
如下以男生為例建立模型,采用拉以達(dá)法則剔除2014-2017各年指標(biāo)下數(shù)據(jù)的異常值。
依此原則,落在上述區(qū)間外的樣本可認(rèn)為它與均值誤差過(guò)大,作為異常值加以剔除,對(duì)剔除后的數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析。如表1所示,可發(fā)現(xiàn)各指標(biāo)變化趨勢(shì):身高、引體向上、1000m跑逐漸變大;體重、BMI逐漸變小;引體向上、立定跳遠(yuǎn)、肺活量、50m跑振蕩變化,趨勢(shì)不定。
表1 2014-2017年各體測(cè)指標(biāo)數(shù)據(jù)平均值(男生)
為探知BMI,即體質(zhì)指數(shù)對(duì)各個(gè)運(yùn)動(dòng)指標(biāo),如引體向上、1000m跑等影響大小的問(wèn)題,文中領(lǐng)域文獻(xiàn)未能建立起合適的函數(shù)計(jì)量模型,主要存在擬合優(yōu)度偏低或未通過(guò)顯著性檢驗(yàn)等問(wèn)題,例如多元線性回歸、Logistic回歸模型等(偽)擬合優(yōu)度均不超過(guò)15%等,從關(guān)聯(lián)度角度來(lái)探索他們之間的數(shù)量關(guān)系。
因探討的所有指標(biāo)都是連續(xù)性變量,所以可通過(guò)計(jì)算各指標(biāo)間余弦關(guān)聯(lián)度,即Pearson相關(guān)系數(shù)R描述各指標(biāo)關(guān)聯(lián)程度[3]。
式中樣本(Xi,Yi),i=1,2,…n為(X,Y)的一組隨機(jī)取樣,運(yùn)用Matlab軟件求出相關(guān)系數(shù)R,如表2所示。
表2 各體測(cè)指標(biāo)相較于BMI的相關(guān)系數(shù)(男生)
通過(guò)表2可以看出,BMI除了與肺活量正相關(guān)外,與其它指標(biāo)均負(fù)相關(guān)。BMI與各指標(biāo)關(guān)聯(lián)度排序依次為引體向上、肺活量、立定跳遠(yuǎn)、坐位體前屈、1000m跑、50m跑,雖然各相關(guān)系數(shù)都通過(guò)了顯著性檢驗(yàn),但普遍偏低,且相互之間差距較小,為消除上述模型存在取樣和統(tǒng)計(jì)推斷所帶來(lái)的偏差,進(jìn)一步引入回歸樹(shù)模型(CART)檢驗(yàn)與修正各體測(cè)指標(biāo)與BMI之間的關(guān)聯(lián)度。
利用回歸樹(shù)模型探索各指標(biāo)關(guān)于BMI的重要性主要是以Gini指數(shù)表征回歸樹(shù)節(jié)點(diǎn)的純度,Gini指數(shù)越大則純度越低,而在數(shù)據(jù)打亂的前提下,以Gini指數(shù)變化的均值看作自變量相對(duì)于因變量的重要程度度量。在運(yùn)用SPSS軟件做回歸樹(shù)分析的過(guò)程中可計(jì)算其它體測(cè)指標(biāo)關(guān)于BMI的重要性,結(jié)果如表3所示。
表3 各體測(cè)指標(biāo)相較于BMI的重要性(男生)
表2與表3呈現(xiàn)的偏差既有模型選取不同帶來(lái)的系統(tǒng)偏差,又有樣本選取造成的隨機(jī)誤差,為更客觀地描述BMI與各指標(biāo)間的關(guān)聯(lián)度,結(jié)合上述兩模型計(jì)量結(jié)果,修正BMI與體測(cè)指標(biāo)的關(guān)聯(lián)度。修正結(jié)果如下:BMI與引體向上關(guān)聯(lián)度最高;BMI與立定跳遠(yuǎn)、肺活量關(guān)聯(lián)度次之,另外,BMI與該兩項(xiàng)指標(biāo)關(guān)聯(lián)度大體相當(dāng);BMI與1000m跑、坐位體前屈、50m跑關(guān)聯(lián)度最低,其次,BMI與該三項(xiàng)指標(biāo)關(guān)聯(lián)度大體相當(dāng)。
依此類推,可以得到女生BMI與仰臥起坐關(guān)聯(lián)度最高,與立定跳遠(yuǎn)關(guān)聯(lián)度次之,而B(niǎo)MI與肺活量、800m跑、坐位體前屈、50m跑等關(guān)聯(lián)度都偏低。
基于2014-2017年表1所示數(shù)據(jù),為預(yù)測(cè)大學(xué)生體質(zhì)發(fā)展趨勢(shì),以BMI為例,其變化未呈現(xiàn)出明顯的指數(shù)趨勢(shì),因此采用均值GM(1,1)模型進(jìn)行計(jì)量。
借助Matlab軟件計(jì)算得:原始序列為X(0)=(21.139,21.034,20.482,19.908),累加得1-AGO序列
X(1)=(21.139,42.173,62.655,82.563)
計(jì)算得到參數(shù)估計(jì)值為
則對(duì)應(yīng)時(shí)間的響應(yīng)式為
-775.513e-0.0275i+796.742
帶入上述式子可得到模擬序列
殘差序列為
ε(0)=(0,-0.004,0.013,-0.005)
進(jìn)而得到平均相對(duì)誤差
通過(guò)上述時(shí)間響應(yīng)式,即預(yù)測(cè)函數(shù),得到2018、2019、2020級(jí)BMI預(yù)測(cè)值分別為21.038、20.468、19.913。
重復(fù)上述方法可得到其它指標(biāo)的預(yù)測(cè)值及相對(duì)應(yīng)的平均相對(duì)誤差,如表4、表5所示:
表4 2018-2020年各體測(cè)指標(biāo)預(yù)測(cè)值(男生)
從表4可以得到,身高呈現(xiàn)緩慢增長(zhǎng)趨勢(shì),但幅度變化較??;體重相對(duì)下降;BMI呈現(xiàn)極速下滑趨勢(shì);引體向上、立定跳遠(yuǎn)、肺活量、坐位體前屈均呈現(xiàn)平緩上漲趨勢(shì);50m跑用時(shí)在縮短;但1000米跑用時(shí)卻在逐漸變長(zhǎng),且變化幅度較大。
表5 2018-2020年各體測(cè)指標(biāo)預(yù)測(cè)平均相對(duì)誤差(男生)
從表5可以看到預(yù)測(cè)的平均相對(duì)誤差中,除去坐位體前屈、立定跳遠(yuǎn)、肺活量誤差稍大,精度稍低,剩余指標(biāo)預(yù)測(cè)的平均相對(duì)誤差較小,總體說(shuō)明EGM模型是較為理想的預(yù)測(cè)體能素質(zhì)發(fā)展趨勢(shì)的模型。
依次類推,也可得到女生各項(xiàng)指標(biāo)在未來(lái)三年的預(yù)測(cè)值及平均相對(duì)誤差。
基于相關(guān)分析、回歸樹(shù)、均值GM(1,1)等數(shù)學(xué)模型,有效地解決了體能測(cè)試指標(biāo)間關(guān)聯(lián)度和預(yù)測(cè)問(wèn)題,并給出了關(guān)聯(lián)系數(shù)與預(yù)測(cè)方程。而且,模型呈現(xiàn)出誤差小、精度高的特點(diǎn),說(shuō)明使用適當(dāng)?shù)臄?shù)學(xué)模型可解決類似于體能測(cè)試等諸多實(shí)際問(wèn)題。
通過(guò)實(shí)證分析可以得出:男生BMI與引體向上指標(biāo)關(guān)聯(lián)度最高,與50m跑關(guān)聯(lián)度最低,未來(lái)三年男生平均身高增加趨緩,但平均體重卻急劇減小,平均BMI下降明顯,平均肺活量增大,但1000m跑卻呈現(xiàn)明顯下滑趨勢(shì);女生BMI與仰臥起坐關(guān)聯(lián)度最高,未來(lái)三年女生平均身高平緩增加,平均體重也急劇減小,平均BMI略有下降,平均肺活量明顯增大,800m跑成績(jī)下滑顯著。但BMI關(guān)于運(yùn)動(dòng)指標(biāo)的函數(shù)計(jì)量模型仍有待于進(jìn)一步研究。