陳波
(北京化工大學(xué)體育部 北京 100029)
2001-2019年世界100m項目室外年終排名第1名、第2名、第3名和第8名的成績。成績來自國際田聯(lián)官網(wǎng)成績統(tǒng)計 (結(jié)束于2019月12月)(國際田聯(lián)網(wǎng),2019),不包括超風(fēng)速成績和被取消的成績。
(1)文獻資料法。
通過查閱與時間序列分析、灰色模型相關(guān)的著作,為2022年的成績預(yù)測提供理論支撐和方法參考。
(2)預(yù)測方法。
灰色預(yù)測的核心體系是灰色模型 (GM),GM系列模型是灰色預(yù)測理論的基本模型,GM(1,1)模型(EGM)為均值模型、由于EGM通過對一次累加數(shù)據(jù)進行均值變換,大大提高信息不確定性系統(tǒng)模擬精度。而且100m跑成績序列為非指數(shù)增長序列,又是非近似齊次指數(shù)序列,故將采用EGM模型對2022年100m跑成績進行預(yù)測,可以提高其預(yù)測精度。根據(jù)100m成績的周期性態(tài)勢,同時采用按周期間隔分解的EGM模型進行預(yù)測,即改進的按周期間隔分解的灰色均值GM(1,1)預(yù)測模型。
通過分析2001-2019年世界男子女子100m項目的發(fā)展態(tài)勢。并在數(shù)據(jù)態(tài)勢分析的基礎(chǔ)上采用灰色均值GM(1,1)預(yù)測法、改進的按周期間隔分解的灰色均值GM(1,1)預(yù)測模型預(yù)測法對2022年世界男女100m成績進行預(yù)測。
對原始序列 x(0)=(x(0)(1),x(0)(2),...,x(0)(n)),我們稱為序列的級比,當(dāng)級比都落在可容覆蓋內(nèi),EGM模型可以用于預(yù)測。一般地,設(shè)發(fā)展系數(shù)為α,當(dāng),GM(1,1)模型有意義。為預(yù)測世界男子女子100m前3名和第8名成績,需要先對原始(2001-2018年)序列進行檢驗。檢驗結(jié)果如表1所:
表1 原始序列可行條件檢驗(2001-2018年序列)
根據(jù)EGM模型理論,將確定的模型系數(shù)和2019年預(yù)測結(jié)果列于下表:
表2 2019年EGM灰色預(yù)測結(jié)果(基于2001-2018年成績序列)
另對2001-2019年序列進行分析 (序列級比均在可容范圍內(nèi)),預(yù)測2022年成績,見表3:
表3 2022年EGM灰色預(yù)測結(jié)果(基于2001-2019年成績序列)
通常,預(yù)測值的相對誤差時ε(k)<0.2,可以認為模型達到一般要求;若ε(k)<0.1,則認為模型達到較高的要求。顯然對預(yù)測值進行相對誤差檢驗都能滿足ε(k)<0.1的條件,且發(fā)展系數(shù)都滿足的條件,但對100m成績預(yù)測來說ε(k)=0.1時預(yù)測誤差約1s,即便模型通過相對誤差檢驗,也不一定得到理想的模型。通常1%的相對誤差意味著約0.1s的預(yù)測誤差,短跑成績預(yù)測問題對模型有更高的精度要求,就表2中2019年的預(yù)測結(jié)果來看,5個序列的預(yù)測結(jié)果相對誤差大于1%,即雖然EGM模型擬合出了2001-2018年成績的趨勢增長,但預(yù)測準(zhǔn)確度并不高。
灰色均值GM(1,1)預(yù)測模型雖然對不具有典型的分布規(guī)律數(shù)據(jù)的預(yù)測有較高精度。但用來預(yù)測100m成績時,也較好地擬合出一系列平穩(wěn)增長的序列,但由于100m成績數(shù)據(jù)總體上呈波動上升趨勢,模型擬合序列與真實的成績波動情況相差較大,平均相對誤差較大,預(yù)測效果也不一定理想,或許不宜直接使用EGM模型直接進行100m跑長期預(yù)測。
由態(tài)勢分析可知世界100m跑成績序列具有奧運周期性的特點,100m項目成績在奧運年一般可以達到或接近周期內(nèi)的峰值。結(jié)合灰色系列模型適合短序列預(yù)測的特點,將數(shù)據(jù)劃分成5個周期,取各個周期的第一/二/三/四年份的數(shù)據(jù)點成一序列,得到男、女子各個名次4個對應(yīng)年共32條序列,再對短時序進行EGM建模。改進后,構(gòu)造的新時序各數(shù)據(jù)點之間間隔4年,EGM模型可以分別地對各周期第一/二/三/四年成績序列的變化趨勢進行描述,擬合出奧運年和非奧運年各自的增長趨勢并進行預(yù)測。
圖1為世界男子按周期分解的100m成績的折線統(tǒng)計圖,各周期第二年成績有比較平緩,各周期第三年成績序列的增長趨勢更為明顯。奧運年(見圖1(d))及奧運年后一年(圖1(a))的成績波動較其他兩年更為明顯,2016年和2017年成績相比前一個周期明顯下降。
圖1 世界男子100m各周期對應(yīng)年成績
記劃分所得的各對應(yīng)年份男子成績序列為 p(M)、q(M)、r(M)、t(M),與原始序列相比,新序列變化規(guī)律更為明顯,對每一個序列都建立EGM模型進行預(yù)測,結(jié)果如下表所示。
表4 世界男子100m成績周期間隔分解序列的EGM預(yù)測結(jié)果
其中,序列p(M),q(M)的預(yù)測模型使用 2001-2013年和 2002-2014年的序列對2017年和2018年成績進行預(yù)測。
通過EGM模型預(yù)測2019年男子成績第1、2、3、8名的平均相對誤差分別為 0.612%、0.603%、0.542%、0.455%(見表2)。 對 p(M)、q(M)、r(M)、t(M)中相應(yīng)名次的平均相對誤差做均值計算,得到該方法下模型擬合出的第1、2、3、8成績序列平均相對誤差,依次為0.38%、0.26%、0.23%、0.21%,顯然EGM模型對按周期間隔分解后短序列的擬合效果更貼近實際。
按周期間隔分解的灰色預(yù)測方法對第2、3、8名成績的平均相對誤差(依次為 0.26%、0.23%、0.21%)均明顯小于第1 名的(0.38%),這是因為第1名序列數(shù)值變化幅度更大,故而擬合出來的預(yù)測值偏差更大。對比 p(M)、q(M)、r(M)、t(M)四類序列的預(yù)測結(jié)果,各周期第二、第三年對應(yīng)的八條序列EGM模型擬合效果更好,平均相對誤差大多小于0.1%,可以認為各周期第二年、第三年在5個周期內(nèi)呈平穩(wěn)增長趨勢;p(M)序列的預(yù)測平均相對誤差最大,主要是因為2009年總體競賽水平達到頂峰,使得周期第一年的序列p(M)呈現(xiàn)先升后降的趨勢并且與前后4年對應(yīng)成績差幅較大,故而EGM的擬合效果相對較差。
按照同樣的方法對世界女子成績同做周期間隔分解處理,劃分所得的序列依次記為 p(w)、q(w)、r(w)、t(w),預(yù)測結(jié)果列于表5。
表5 世界女子100m成績周期間隔分解序列的EGM預(yù)測結(jié)果
從圖2的a、b、c、d中可以看出,女子成績在奧運年平穩(wěn)增長。序列因2009年成績的影響有一個幅度較大的波動。女子各周期第2、3年的序列也呈現(xiàn)出較對平穩(wěn)的增長趨勢,結(jié)果如下表所示。
圖2 世界女子100m各周期對應(yīng)年成績
對奧運年和非奧運年4類序列的4個名次的平均相對誤差進行均值統(tǒng)計,與男子成績預(yù)測結(jié)果特征相似,該方法各名次的預(yù)測平均相對誤差(依次為 0.33%、0.24%、0.23%、0.12%)均小于對各名次原始序列進行建模預(yù)測的平均相對誤差 (0.463%、0.447%、0.391%、0.329%)。該模型下,第1名序列平均相對誤差相比第2、3、8名的更大,并且對比4類序列,p(w)序列的預(yù)測相對誤差也更大。
男子、女子項目100m成績在周期內(nèi)4年各自的特點都比較相似,第1名成績序列波動幅度更大,平均相對誤差大于第2、3、8名序列的平均相對誤差,奧運年后第一年的序列(p(M)、p(W))因男女項目均在2009年達到最好水平,序列存在一個大幅波動,擬合模型平均相對誤差大。
由圖1、圖2中可以看出男子成績在奧運年總體呈上升趨勢,而女子奧運年成績明顯持續(xù)增長;奧運年后一年男女項目因2009年異常值的存在,波動較大;與奧運年后一年相比,男女成績均在奧運年后第二年、第三年表現(xiàn)出較為平穩(wěn)的增長。對比表4、表5,男子項目各周期第二年q(M)序列和女子項目各周期第四年t(M)的穩(wěn)定增長趨勢明顯,對4個名次的平均相對誤差求均值,作為q(M)、t(W)的平均相對誤差,結(jié)果為0.05%、0.07%,EGM模型有效描述了成績序列的增長趨勢。
總體來看,基于按周期間隔分解后對應(yīng)年成績序列呈現(xiàn)出更為平穩(wěn)的增長趨勢這一分析結(jié)果和灰色系列模型更適合中短期預(yù)測這一特點,構(gòu)造短時序再進行EGM建模的方法顯著減小了平均相對誤差,擬合模型更符合實際。
將對2022年100m成績的預(yù)測結(jié)果預(yù)列于表6。
表6 2022年預(yù)測結(jié)果
EGM模型和按周期間隔分解的EGM模型的預(yù)測區(qū)間是通過在預(yù)測值上加上偏差均值的95%雙側(cè)置信區(qū)間得到的結(jié)果。各組偏差均通過Shapiro-Wilk檢驗 (當(dāng)樣本容量大于5000時,以Kolmog orov-Smirnov檢驗p值為準(zhǔn)),檢驗p值大于0.05即認為服從正態(tài)分布,偏差的方差未知,偏差均值的區(qū)間估計應(yīng)選用雙側(cè)置信區(qū)間,使預(yù)測偏差以95%的置信水平落入?yún)^(qū)間內(nèi),并基于預(yù)測值給出最終預(yù)測區(qū)間?,F(xiàn)將預(yù)測值的置信區(qū)間列于表7。
表7 2022年預(yù)測結(jié)果區(qū)間
(1)EGM模型因田徑成績波動多不適合對較長100m成績序列進行預(yù)測;按周期間隔分解的EGM預(yù)測模型因序列短、各對應(yīng)年特征明顯增長平穩(wěn),預(yù)測效果相對好,能有效減少平均相對誤差;
(2)EGM模型描述的是長期增長趨勢,EGM給出的預(yù)測結(jié)果還是一個值得參考的結(jié)果。按周期間隔分解的EGM模型中t(W)序列平均相對誤差?。?.07%),女子項目奧運年成績具有近似指數(shù)增長特點,可以期待女子項目第1名在2022奧運年達到10.65s的水平;
(3)根據(jù)預(yù)測結(jié)果,男子項目2022年為弱下降年、女子項目2022年為弱上升年。
(1)根據(jù)態(tài)勢分析中上升趨勢會接連2-3年出現(xiàn)且女子接連上升的年份與男子的相同或僅提前或滯后一年的特點,因男子項目在2017-2019年接連上升且女子項目在2018-2019年呈上升趨勢,女子項目可能將在2022年繼續(xù)上升達到周期內(nèi)的峰值;
(2)女子項目在奧運年呈現(xiàn)比較穩(wěn)定的增長趨勢,由按周期間隔分解的EGM模型預(yù)測結(jié)果,可以推斷女子第1、2、3、8名的成績在2022年中有望達到10.65s、10.68s、10.69s和10.74s的水平;
(3)根據(jù)預(yù)測結(jié)果,男子項目EGM模型預(yù)測成績最快,男子第1、2、3、8 年的成績有望達到 9.74s、9.79s、9.81s 和 9.85s。 但2022年的男子100m成績更可能呈弱下降趨勢,除EGM模型外的幾個模型中,按整個奧運周期的趨勢,周期間隔分解的EGM模型比較合理,根據(jù)其預(yù)測結(jié)果可推斷第1、2、3、8名的成績更可能在9.82、9.84、9.88、9.90的水平。 此外,若男子成績在 2019-2022年繼續(xù)上升,則EGM模型預(yù)測結(jié)果更具參考意義。