祝子涵
摘 要 本文使用線性回歸等數(shù)學模型,對獎牌榜排名從歷史戰(zhàn)績、經(jīng)濟實力以及東道主效應等方面進行分析,并預測2020年奧運獎牌榜。
【關鍵詞】線性回歸 獎牌榜預測 期望值
1 前言
本文首先介紹奧運會獎牌榜預測數(shù)據(jù)來源和提取方法,然后采用多種數(shù)學模型分析奧運獎牌關聯(lián)性、綜合國力對奧運成績的影響以及可能影響奧運會的影響的其他因素,最后給出分析預測結論。
2 數(shù)據(jù)來源與提取方法
本文采用的世界各國在歷屆奧運會獲得的總獎牌數(shù)及各項獎牌數(shù)由新浪體育提供,各國經(jīng)濟實力狀況由世界銀行(world bank)官網(wǎng)提供,提取方法采用八爪魚采集器采用網(wǎng)頁的自動動提取。
3 數(shù)學模型
回歸分析(regression analysis)是確定兩種或兩種以上變量間定量關系的一種統(tǒng)計分析方法。按照涉及的變量的多少,分為一元回歸和多元回歸分析;按照自變量和因變量之間的關系類型,可分為線性回歸分析和非線性回歸分析。公式為:
(1)
3.1 因變量與自變量設定
以所得分數(shù)x為自變量,該國家在本屆奧運會中所得獎牌總數(shù)占據(jù)本屆奧運會總數(shù)百分比Y為因變量,進行回歸分析。
3.2 擬合程度分析
擬合優(yōu)度(Goodness of Fit)是指回歸直線對觀測值的擬合程度。度量擬合優(yōu)度的統(tǒng)計量是可決系數(shù)(亦稱確定系數(shù))R2。R2的取值范圍是[0,1]。R2的值越接近1,說明回歸直線對觀測值的擬合程度越好;反之越接近0,說明擬合程度越差。
4 奧運獎牌榜關聯(lián)性分析
4.1 縱向討論歷史戰(zhàn)績對獎牌榜的影響
4.1.1 概要
歷史戰(zhàn)績對新一屆奧運獎牌榜走勢有著至關重要的影響,主要利用求期望以及加權求和的方法求期望值,為該國新一屆奧運會只考慮歷史戰(zhàn)績的獎牌榜,通過一元線性回歸求出期望獎牌榜與實際獎牌榜的相關度。
4.1.2 數(shù)據(jù)預處理
我們提取2004、2008、2012以及2016這四屆奧運會中20個獎牌數(shù)最多的項目作為分析對象。
4.1.3 縱向討論方法
(1) 選取2004、2008、2012三屆奧運會的數(shù)據(jù)求出期望值。分別求出各國各項目三屆比賽排名的平均值。
(2)將20個大項的期望值按權重相加。
權重 = 該項目三屆平均獎牌數(shù)/20個大項目總獎牌三屆的平均數(shù)。隨后我們對各國家各項目的期望值進行加權求和,得出新一屆奧運會期望的獎牌榜排名。
(3)線性回歸求期望排名和實際排名的關聯(lián)度。
因變量與自變量設定。
以實際成績x為自變量,預測成績Y為因變量,進行回歸分析。我們采用歷史戰(zhàn)績因數(shù)計算對下一屆奧運會獎牌榜的影響程度。
5 綜合國力對奧運成績影響
5.1 概要
在綜合國力方面主要考慮各國的經(jīng)濟因素、人口因素、國土面積。
(1)經(jīng)濟因素【economic】:用各國家GDP占近十年世界總GDP的份額來衡量經(jīng)濟實力。
(2)人口因素【population】:人口數(shù)量越多的國家將更有可能挖掘出更多高素質的運動員,進一步提高該國的奧運成績,
(3)國土面積【Land】:鑒于國家國土面積限制,資源的分配不均勻,這里認為以國土大小判定資源情況。
為統(tǒng)一衡量標準,實行給分制,各個要素所占世界百分比n%*100即該國家在該項所得分數(shù)。
5.2 線性回歸
5.2.1 因變量與自變量設定
以所得分數(shù)x為自變量,該國家在本屆奧運會中所得獎牌總數(shù)占據(jù)本屆奧運會總數(shù)百分比Y為因變量,進行回歸分析。結果有如下幾種情況:
(1)直線關系:Y=0.006X+0.0288,R2=0.6296。
(2)冪函數(shù)關系:Y=0.036^0.2842,R2=0.4055。
(3)對數(shù)函數(shù): Y= 0.0152ln(x) + 0.0406,R2 = 0.4501。
通過以上三種函數(shù)分析,Y與X之間最可能存在線性直線關系。
5.3 問題回顧
我們將綜合國力分成3個對體育比較關鍵部分,來代表綜合國力,利用給分制,以世界整體水平為統(tǒng)一標準,進行回歸擬合分析,得出綜合國力對奧運成績的影響;并通過擬合程度檢驗準確性。但該模型尚存在以下缺陷:代表綜合國力因素過少,使綜合國力對獎牌影響力說服性降級;迫于時間壓力,選取國家過少,僅選取了2012屆前十名為代表的;R?偏低,說明在數(shù)據(jù)預處理階段做的不夠好。
6 其他因素對奧運會的影響
東道主效應,是指體育比賽中主辦地隊伍會因為東道主的各方面優(yōu)勢取得出乎平常的好成績的一種現(xiàn)象。歷屆比賽表明,東道主效應讓主隊獲利甚多。奧運會的主辦城市所在國家能取得比此前一屆奧運會更好的成績。
7 結論--預測2020年獎牌榜前十名
首先得出只考慮歷史戰(zhàn)績影響因素的預期排名;其次得出只考慮經(jīng)濟實力影響因素的預期排名;再乘以各自的影響程度進行加和,最終得出的總排名如表1所示。
參考文獻
[1]線性回歸定義http://baike.baidu.com/link?url=doJ1Ds9HEIZ54F_W0jZYwaAEKoGDtQ1_1NLyqush774uG19wfsJHnNTm5mdNHC-C-w7Pz70XeVF9SZXsbPY1L8O0zt56zk9cM7R35M0suwEwxpAXHwhf9lDQ6XblUG3R,2017年2月2日.
[2]新浪網(wǎng):歷屆奧運會獎牌榜數(shù)據(jù),http://match.2016.sina.com.cn/medals/歷屆奧運會獎牌榜,2017(01).
作者單位
石家莊市第二中學 河北省石家莊市 050000