何牧
(揚(yáng)州市職業(yè)大學(xué)體育學(xué)院 江蘇 揚(yáng)州 225000)
我國(guó)在過(guò)去10年里,通過(guò)引進(jìn)和自主創(chuàng)新等方式,走出了一條適合中國(guó)國(guó)情的全民健身路線,推動(dòng)了全民健身運(yùn)動(dòng)的蓬勃開(kāi)展。與此同時(shí),伴隨著“互聯(lián)網(wǎng)+”和電子商務(wù)興起并不斷發(fā)展壯大,我國(guó)體育事業(yè)也取得了長(zhǎng)足發(fā)展。在國(guó)家對(duì)社會(huì)辦體育的政策支持下,近年來(lái)我國(guó)運(yùn)動(dòng)員通過(guò)參加職業(yè)賽事以及借助互聯(lián)網(wǎng)手段等方式積累了大量寶貴經(jīng)驗(yàn)。
我國(guó)的競(jìng)技體育和社會(huì)運(yùn)動(dòng)項(xiàng)目經(jīng)過(guò)多年快速發(fā)展,在運(yùn)動(dòng)成績(jī)、運(yùn)動(dòng)競(jìng)賽管理、比賽組織管理和運(yùn)動(dòng)員培訓(xùn)等方面積累了豐富經(jīng)驗(yàn)。但由于缺乏科學(xué)的統(tǒng)計(jì)分析方法,這些領(lǐng)域在很大程度上還停留在經(jīng)驗(yàn)時(shí)代,這就造成了體育科研成果產(chǎn)出效率低下并不能滿足當(dāng)前對(duì)新技術(shù)手段的需求。隨著大數(shù)據(jù)分析能力提高以及信息通訊技術(shù)發(fā)展,體育科研人員可以更好地把握相關(guān)領(lǐng)域的發(fā)展趨勢(shì),并為未來(lái)進(jìn)一步研究提供科學(xué)依據(jù)。因此,本文主要對(duì)運(yùn)動(dòng)員競(jìng)技比賽質(zhì)量、運(yùn)動(dòng)訓(xùn)練效果和運(yùn)動(dòng)競(jìng)賽管理等領(lǐng)域進(jìn)行數(shù)據(jù)分析,進(jìn)而為提高我國(guó)競(jìng)技比賽質(zhì)量提供有益借鑒和啟示。
大數(shù)據(jù)是一種能夠全面記錄和管理信息的技術(shù)手段。大數(shù)據(jù)通過(guò)大量數(shù)據(jù)采集、挖掘和處理,可以從多種角度幫助人們了解某一領(lǐng)域或行業(yè)的發(fā)展情況。隨著計(jì)算機(jī)技術(shù)、數(shù)據(jù)科學(xué)與人工智能學(xué)科的發(fā)展和應(yīng)用日益深入,在一定程度上改變了體育科研工作者的工作方式。近年來(lái),隨著大數(shù)據(jù)分析技術(shù)的不斷發(fā)展,基于不同學(xué)科領(lǐng)域內(nèi)大數(shù)據(jù)研究方法的結(jié)合,可以對(duì)運(yùn)動(dòng)項(xiàng)目開(kāi)展深入細(xì)致地科學(xué)分析。體育科研人員利用大數(shù)據(jù)分析技術(shù)從各個(gè)方面提高運(yùn)動(dòng)項(xiàng)目競(jìng)技比賽質(zhì)量水平,包括運(yùn)動(dòng)員的身體狀態(tài)、訓(xùn)練效果以及運(yùn)動(dòng)成績(jī)等等。目前體育科研工作者已經(jīng)將大數(shù)據(jù)分析方法應(yīng)用到了眾多領(lǐng)域中。比如,利用大數(shù)據(jù)技術(shù)進(jìn)行對(duì)運(yùn)動(dòng)員心理狀態(tài)、身體素質(zhì)和訓(xùn)練效果情況等方面研究;針對(duì)籃球運(yùn)動(dòng)員身體和心理狀態(tài)進(jìn)行相關(guān)數(shù)據(jù)統(tǒng)計(jì);結(jié)合籃球教練員實(shí)際經(jīng)驗(yàn)進(jìn)行數(shù)據(jù)對(duì)比與分析等?;谶@些研究方法對(duì)于運(yùn)動(dòng)員、教練員以及決策者都具有重要意義。
我國(guó)體育科研人員在利用大數(shù)據(jù)分析技術(shù)提高比賽質(zhì)量方面也已經(jīng)取得了很多成績(jī)。比如,利用大數(shù)據(jù)對(duì)籃球比賽過(guò)程中各項(xiàng)數(shù)據(jù)進(jìn)行實(shí)時(shí)記錄并進(jìn)行相關(guān)研究;結(jié)合運(yùn)動(dòng)員身體狀態(tài)、訓(xùn)練效果以及比賽結(jié)果等方面進(jìn)行比賽訓(xùn)練效果評(píng)估;同時(shí)針對(duì)運(yùn)動(dòng)員心理波動(dòng)以及傷病風(fēng)險(xiǎn)問(wèn)題進(jìn)行分析研究等。通過(guò)對(duì)大數(shù)據(jù)的全面分析,我們可以對(duì)體育運(yùn)動(dòng)項(xiàng)目的競(jìng)技能力提升做出科學(xué)決策并有效改善競(jìng)賽管理效率等方面作出貢獻(xiàn),進(jìn)而為國(guó)家培養(yǎng)更多高素質(zhì)人才打下良好基礎(chǔ)。但是隨著大數(shù)據(jù)在體育領(lǐng)域中應(yīng)用程度越來(lái)越深,也出現(xiàn)了一些亟待解決的問(wèn)題。比如,數(shù)據(jù)收集困難、數(shù)據(jù)挖掘技術(shù)缺乏以及統(tǒng)計(jì)方法存在缺陷等等;此外也有很多其他因素影響了運(yùn)動(dòng)競(jìng)賽管理、運(yùn)動(dòng)訓(xùn)練和運(yùn)動(dòng)技術(shù)的有效應(yīng)用等問(wèn)題?;谝陨媳尘埃疚膶?duì)國(guó)內(nèi)外在利用大數(shù)據(jù)分析技術(shù)方面做出研究和探索提出了一些建議:首先要對(duì)體育大數(shù)據(jù)有一個(gè)全面深刻地了解;其次要利用大數(shù)據(jù)技術(shù)提高體育競(jìng)技比賽質(zhì)量;最后通過(guò)數(shù)據(jù)驅(qū)動(dòng)提高運(yùn)動(dòng)員訓(xùn)練水平并幫助運(yùn)動(dòng)員在比賽中取得優(yōu)異成績(jī);此外對(duì)于運(yùn)動(dòng)競(jìng)賽管理、運(yùn)動(dòng)訓(xùn)練及競(jìng)賽方面的研究也有很多值得借鑒之處。
當(dāng)前,隨著大數(shù)據(jù)時(shí)代的到來(lái),體育領(lǐng)域?qū)τ诖髷?shù)據(jù)分析也有了更加深刻的理解。首先,通過(guò)研究發(fā)現(xiàn)運(yùn)動(dòng)員訓(xùn)練水平與訓(xùn)練效率之間存在顯著的正相關(guān)關(guān)系,這也從側(cè)面說(shuō)明了提升運(yùn)動(dòng)員競(jìng)技水平和競(jìng)技比賽質(zhì)量的重要性;其次,從競(jìng)技體育領(lǐng)域來(lái)看,基于大數(shù)據(jù)分析的比賽質(zhì)量提升方法可以為體育賽事組織提供借鑒;再次,在過(guò)去10年中,我國(guó)大眾體育消費(fèi)市場(chǎng)快速發(fā)展;伴隨著“互聯(lián)網(wǎng)+”運(yùn)動(dòng)健康理念和電子商務(wù)迅速發(fā)展以及電子商務(wù)平臺(tái)迅速普及,電子商務(wù)已經(jīng)成為人們購(gòu)買(mǎi)商品或服務(wù)的主要方式之一;最后,隨著我國(guó)網(wǎng)絡(luò)基礎(chǔ)設(shè)施日益完善,大數(shù)據(jù)分析方法也被廣泛運(yùn)用于體育領(lǐng)域中;與此同時(shí),“互聯(lián)網(wǎng)+”運(yùn)動(dòng)健康產(chǎn)業(yè)也取得了較大進(jìn)步。
但在對(duì)相關(guān)研究文獻(xiàn)進(jìn)行統(tǒng)計(jì)時(shí)可以發(fā)現(xiàn):當(dāng)前國(guó)內(nèi)數(shù)據(jù)分析相關(guān)研究并不多見(jiàn);同時(shí)對(duì)于該領(lǐng)域相關(guān)概念的定義和分類(lèi)尚未形成統(tǒng)一且具有代表性的分類(lèi)標(biāo)準(zhǔn);這一點(diǎn)與當(dāng)前國(guó)外大數(shù)據(jù)分析研究現(xiàn)狀有著較大差距;通過(guò)對(duì)體育大數(shù)據(jù)領(lǐng)域近10年來(lái)國(guó)內(nèi)文獻(xiàn)、國(guó)外文獻(xiàn)以及相關(guān)論文進(jìn)行分析可以發(fā)現(xiàn):國(guó)內(nèi)對(duì)于如何利用大數(shù)據(jù)分析方法來(lái)提升運(yùn)動(dòng)水平等問(wèn)題并沒(méi)有一個(gè)統(tǒng)一的認(rèn)識(shí)。因此目前國(guó)內(nèi)對(duì)于“大數(shù)據(jù)”和“數(shù)據(jù)分析”這兩個(gè)概念存在較大的模糊認(rèn)識(shí);同時(shí)也有部分體育行業(yè)人士對(duì)大數(shù)據(jù)分析并不太了解。此外,雖然大數(shù)據(jù)分析已經(jīng)被廣泛應(yīng)用于各個(gè)領(lǐng)域中。但其目前依然沒(méi)有形成一個(gè)統(tǒng)一的分類(lèi)標(biāo)準(zhǔn)。因此在未來(lái)需要加強(qiáng)對(duì)該領(lǐng)域相關(guān)概念的進(jìn)一步普及和培訓(xùn)。
體育數(shù)據(jù)通常包含訓(xùn)練、比賽和賽事三個(gè)方面。訓(xùn)練(training)是指運(yùn)動(dòng)過(guò)程中發(fā)生的一系列生理或生化反應(yīng)。比賽(training),是指在一個(gè)體育比賽過(guò)程中運(yùn)動(dòng)員和其伙伴所進(jìn)行的運(yùn)動(dòng)活動(dòng),通常包括各種競(jìng)賽活動(dòng)和非競(jìng)賽活動(dòng),也稱為非賽或競(jìng)技賽(fight-training)。例如,在足球比賽中,根據(jù)一場(chǎng)足球比賽的時(shí)間長(zhǎng)短和勝負(fù)判定結(jié)果,可分為世界杯足球賽、歐洲聯(lián)賽、亞洲聯(lián)賽以及其他聯(lián)賽。賽事(tournament)是指比賽結(jié)束后所進(jìn)行的一系列活動(dòng)。包括各種類(lèi)型的賽事,如世界錦標(biāo)賽、奧運(yùn)會(huì)比賽等。
賽事通??梢苑譃橐韵氯?lèi):一類(lèi)是傳統(tǒng)的運(yùn)動(dòng)項(xiàng)目賽事,包括奧運(yùn)會(huì)、世界錦標(biāo)賽、世界杯足球賽等;一類(lèi)是新興的運(yùn)動(dòng)項(xiàng)目如:馬拉松、高爾夫等;一類(lèi)是其他體育運(yùn)動(dòng)形式,比如馬拉松和自行車(chē)。運(yùn)動(dòng)員通過(guò)競(jìng)賽的方式實(shí)現(xiàn)體育價(jià)值并獲得經(jīng)濟(jì)利益的同時(shí),也伴隨著風(fēng)險(xiǎn)與挑戰(zhàn)——成績(jī)不穩(wěn)定導(dǎo)致的風(fēng)險(xiǎn)與回報(bào)不對(duì)稱現(xiàn)象也在一定程度上影響著競(jìng)技體育的健康發(fā)展與運(yùn)動(dòng)員自身經(jīng)濟(jì)利益之間存在著微妙平衡。因此,通過(guò)建立一個(gè)有效模型來(lái)實(shí)現(xiàn)上述目標(biāo)顯得尤為重要。本文基于體育大數(shù)據(jù)平臺(tái)和研究領(lǐng)域中相關(guān)文獻(xiàn)進(jìn)行了梳理和分析,主要分為兩大部分:一是分類(lèi)模型研究;二是體育大數(shù)據(jù)分析方法研究。
研究發(fā)現(xiàn),分類(lèi)模型可分為兩類(lèi):一類(lèi)是基于概率論,另一類(lèi)是基于機(jī)器學(xué)習(xí)的。其中,基于概率論的分類(lèi)模型主要有Logistic、Logarithmic和Loginoidal三種,其在數(shù)據(jù)特征上都需要處理訓(xùn)練數(shù)據(jù)集。但無(wú)論是Logistic模型還是Logarithmic模型,都存在不足。在此基礎(chǔ)上提出了兩種改進(jìn)的分類(lèi)方法:基于機(jī)器學(xué)習(xí)的分類(lèi)方法和基于深度學(xué)習(xí)的分類(lèi)方法。
然而,對(duì)于實(shí)際應(yīng)用中存在的復(fù)雜因素影響,其分類(lèi)效果往往會(huì)大打折扣。由于訓(xùn)練樣本數(shù)據(jù)分布不均,導(dǎo)致訓(xùn)練出的模型精度不高。另外,由于不同人、不同機(jī)構(gòu)對(duì)同一賽事有不同的理解,因此對(duì)比賽結(jié)果會(huì)有很大差別。由于在傳統(tǒng)體育賽事中數(shù)據(jù)樣本不夠充足,因此本文提出了一個(gè)基于數(shù)據(jù)預(yù)處理和機(jī)器學(xué)習(xí)分類(lèi)的方法來(lái)對(duì)比賽結(jié)果進(jìn)行預(yù)測(cè)和判斷。此外還引入了兩種基于機(jī)器學(xué)習(xí)方法來(lái)識(shí)別異常值:Fisher and Bonferroni et al和Kaggle數(shù)據(jù)集上的一項(xiàng)研究。
本文主要研究的體育大數(shù)據(jù)分析方法主要包括基于文本挖掘的文本分類(lèi)方法、基于聚類(lèi)的統(tǒng)計(jì)分析方法、基于時(shí)間序列特征的數(shù)據(jù)挖掘方法以及基于機(jī)器學(xué)習(xí)算法的統(tǒng)計(jì)分析方法。本文主要研究了兩種算法:(1)基于特征的文本分類(lèi):通過(guò)特征選擇和分類(lèi)器設(shè)計(jì)來(lái)提取樣本集中能夠表征文本信息的特征,并將其應(yīng)用于訓(xùn)練樣本集中;(2)基于聚類(lèi)算法:利用聚類(lèi)算法對(duì)訓(xùn)練和測(cè)試樣本進(jìn)行聚類(lèi),并根據(jù)聚類(lèi)結(jié)果將訓(xùn)練和測(cè)試樣本劃分為若干類(lèi)別,然后對(duì)這些類(lèi)別進(jìn)行數(shù)據(jù)描述,以便于進(jìn)一步研究這些類(lèi)別之間存在的相關(guān)性。通過(guò)機(jī)器學(xué)習(xí)算法和傳統(tǒng)方法結(jié)合使用,實(shí)現(xiàn)了對(duì)大量非結(jié)構(gòu)化體育數(shù)據(jù)(如文字、圖片、視頻、音頻等)的挖掘工作,從而發(fā)現(xiàn)了大量具有潛在價(jià)值的信息。此外,本文還針對(duì)體育比賽數(shù)據(jù)進(jìn)行了分析和總結(jié)。研究發(fā)現(xiàn):運(yùn)動(dòng)員成績(jī)具有不確定性,且與成績(jī)相關(guān)的變量在不同比賽階段和比賽環(huán)境下是不同的(如競(jìng)技能力、心理素質(zhì)、體能能力等)。
本研究通過(guò)國(guó)家體育總局、中國(guó)體科所以及中國(guó)奧委會(huì)和各省市體育局官方網(wǎng)站獲取了大量數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行了分類(lèi)與統(tǒng)計(jì)。(1)競(jìng)技項(xiàng)目基本信息:通過(guò)國(guó)家體育總局官方網(wǎng)站獲取的相關(guān)競(jìng)技體育數(shù)據(jù),如比賽項(xiàng)目、成績(jī)(名次),以及相關(guān)運(yùn)動(dòng)員的年齡、性別以及個(gè)人基本信息等;(2)訓(xùn)練信息:通過(guò)國(guó)家體育總局及各省市體育局官方網(wǎng)站獲得訓(xùn)練信息;(3)成績(jī)分析:將在競(jìng)技比賽中取得優(yōu)異成績(jī)的運(yùn)動(dòng)員與其他運(yùn)動(dòng)員進(jìn)行比較分析,如參加世界比賽的情況和參加國(guó)內(nèi)比賽的情況;(4)教練員信息:通過(guò)中國(guó)體科所和各省市體育局官網(wǎng)獲取教練員信息,包括教練員姓名、年齡、性別、執(zhí)教項(xiàng)目、所屬單位以及執(zhí)教年份等,為后續(xù)分析提供依據(jù);(5)媒體信息:主要為媒體網(wǎng)站獲得的相關(guān)媒體信息;(6)社交媒體:網(wǎng)絡(luò)社交網(wǎng)站包括新浪微博和騰訊微博兩個(gè)主要社交媒體平臺(tái);(7)觀眾參與數(shù)據(jù)收集自中國(guó)國(guó)家體育總局官方網(wǎng)站,包括參與數(shù)據(jù);(8)電視轉(zhuǎn)播數(shù)據(jù);體育總局官方視頻平臺(tái)的視頻資源;各省市體育局官方體育頻道等。通過(guò)對(duì)這些數(shù)據(jù)進(jìn)行分類(lèi)與統(tǒng)計(jì),可以更加清晰地把握我國(guó)競(jìng)技體育和社會(huì)運(yùn)動(dòng)項(xiàng)目在過(guò)去10年中所取得的發(fā)展趨勢(shì),以及在未來(lái)十年中所面臨的挑戰(zhàn)與機(jī)遇。同時(shí)結(jié)合近年來(lái)國(guó)內(nèi)外大數(shù)據(jù)領(lǐng)域?qū)W者在不同層面上對(duì)相關(guān)問(wèn)題進(jìn)行的討論等,也為我國(guó)競(jìng)技體育和社會(huì)運(yùn)動(dòng)項(xiàng)目的發(fā)展提供了有益參考。
當(dāng)前,隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)和電子商務(wù)等新興技術(shù)在國(guó)內(nèi)的廣泛應(yīng)用和快速發(fā)展,大數(shù)據(jù)已成為一個(gè)炙手可熱的領(lǐng)域。本文所采用到的來(lái)自于國(guó)家體育總局和中國(guó)奧委會(huì)兩個(gè)官方網(wǎng)站收集到的數(shù)據(jù)來(lái)自以下幾個(gè)方面:一是國(guó)家體育總局官方網(wǎng)站;二是中國(guó)奧委會(huì)官網(wǎng);三是國(guó)際奧委會(huì)官網(wǎng);四是中國(guó)足球協(xié)會(huì)官網(wǎng);五是各省市體育局官方網(wǎng)站;六為社會(huì)力量辦體育、企業(yè)辦比賽等。
在很大程度上,運(yùn)動(dòng)員競(jìng)技比賽質(zhì)量提高有賴于以下幾個(gè)方面:(1)科學(xué)訓(xùn)練和科學(xué)化訓(xùn)練。科學(xué)訓(xùn)練是提高運(yùn)動(dòng)成績(jī)的關(guān)鍵環(huán)節(jié),尤其是當(dāng)運(yùn)動(dòng)員處于特定狀態(tài)時(shí),只有在具備較高身體素質(zhì)基礎(chǔ)上合理使用訓(xùn)練方法、制定科學(xué)計(jì)劃才能取得理想效果??茖W(xué)訓(xùn)練要遵循“三個(gè)結(jié)合”、“四個(gè)階段”等原則,即:技術(shù)與思想相結(jié)合、技術(shù)與體能相結(jié)合、運(yùn)動(dòng)強(qiáng)度與負(fù)荷相結(jié)合、身體訓(xùn)練與心理素質(zhì)相結(jié)合(包括有氧運(yùn)動(dòng)的規(guī)律)。運(yùn)動(dòng)員在不同階段應(yīng)根據(jù)自己的能力、狀態(tài)來(lái)安排訓(xùn)練計(jì)劃,從而取得最佳成績(jī);(2)運(yùn)動(dòng)員個(gè)體之間存在著差異。不同項(xiàng)目間的發(fā)展水平和個(gè)人天賦有著很大差異,而同一項(xiàng)目的不同階段則會(huì)產(chǎn)生很強(qiáng)的可比性,這是保證運(yùn)動(dòng)員發(fā)揮出最佳競(jìng)技水平所必須具備的條件。因此為促進(jìn)運(yùn)動(dòng)員科學(xué)訓(xùn)練和科學(xué)化訓(xùn)練,可以從兩個(gè)方面入手:一方面是采用個(gè)體訓(xùn)練和群體研究相結(jié)合、個(gè)體差異研究和群體一致性研究等方法,找出每位隊(duì)員在不同階段和個(gè)人方面存在的具體問(wèn)題;另一方面則是采用大數(shù)據(jù)技術(shù)對(duì)每位運(yùn)動(dòng)員在身體能力、競(jìng)技能力等方面進(jìn)行全方位的分析與評(píng)價(jià);(3)運(yùn)動(dòng)員信息技術(shù)水平提升。隨著計(jì)算機(jī)硬件性能、數(shù)據(jù)存儲(chǔ)容量以及計(jì)算速度等方面不斷提高和完善,可以為運(yùn)動(dòng)員提供更加準(zhǔn)確、便捷和個(gè)性化的信息服務(wù);(4)充分發(fā)揮“互聯(lián)網(wǎng)+”優(yōu)勢(shì)。
本文主要采用了文獻(xiàn)資料法、專家訪談法以及比較分析的方法。從文獻(xiàn)資料方面來(lái)看,我們首先從數(shù)據(jù)入手,結(jié)合了“十三五”規(guī)劃的目標(biāo),通過(guò)對(duì)《關(guān)于實(shí)施促進(jìn)全民健身計(jì)劃(2016-2020年)的意見(jiàn)》等相關(guān)文件中提到的重點(diǎn)項(xiàng)目進(jìn)行分類(lèi),我們可以看到目前體育大數(shù)據(jù)研究領(lǐng)域主要關(guān)注的是體育大數(shù)據(jù)技術(shù)、數(shù)據(jù)應(yīng)用和分析等方面,通過(guò)對(duì)這幾個(gè)方面進(jìn)行綜合分析后能夠發(fā)現(xiàn)體育大數(shù)據(jù)在運(yùn)動(dòng)訓(xùn)練和比賽等相關(guān)領(lǐng)域中具有很大的潛力。
從專家訪談方面來(lái)看,專家們根據(jù)自身研究方向提出了許多具有指導(dǎo)性的意見(jiàn)和建議。通過(guò)比較分析方法來(lái)看,我們對(duì)專家們所提出建議進(jìn)行了梳理總結(jié),并且利用 SWOT方法對(duì)每一項(xiàng)內(nèi)容所具有的優(yōu)勢(shì)和劣勢(shì)進(jìn)行了分析。綜合考慮國(guó)內(nèi)外大數(shù)據(jù)研究領(lǐng)域存在的問(wèn)題以及對(duì)未來(lái)發(fā)展趨勢(shì)做出預(yù)測(cè)之后,結(jié)合大數(shù)據(jù)領(lǐng)域目前研究最活躍的領(lǐng)域和當(dāng)前重點(diǎn)項(xiàng)目展開(kāi)分析。
本文主要采用了統(tǒng)計(jì)分析、案例和數(shù)理模型四種方法。統(tǒng)計(jì)分析部分主要包括回歸建模、灰色預(yù)測(cè)、多元線性回歸以及聚類(lèi)模型等;案例研究部分涵蓋了美國(guó)奧運(yùn)代表團(tuán)訓(xùn)練模式分析、中國(guó)體育總局訓(xùn)練基地運(yùn)動(dòng)員訓(xùn)練模式變化特征與規(guī)律、美國(guó)運(yùn)動(dòng)員競(jìng)技能力差異及特點(diǎn)等方面;數(shù)理模型部分主要包括運(yùn)動(dòng)項(xiàng)目數(shù)據(jù)集結(jié)構(gòu)化特征與預(yù)測(cè)結(jié)果等。比較分析部分首先利用 SWOT方法,結(jié)合當(dāng)前運(yùn)動(dòng)項(xiàng)目數(shù)據(jù)集中的優(yōu)勢(shì)和劣勢(shì)以及國(guó)外相關(guān)案例進(jìn)行比較;接著將研究結(jié)果運(yùn)用到中國(guó)競(jìng)技體育實(shí)際,進(jìn)而預(yù)測(cè)未來(lái)中國(guó)競(jìng)技體育在未來(lái)幾年內(nèi)可能面臨的問(wèn)題。以上是本文主要采取的研究方法。接下來(lái)就文章內(nèi)容進(jìn)行了總結(jié)。文章從數(shù)據(jù)收集到最后處理呈現(xiàn)兩個(gè)階段:第一個(gè)階段主要是數(shù)據(jù)收集;第二個(gè)階段就是在對(duì)數(shù)據(jù)進(jìn)行歸類(lèi)整理并對(duì)其進(jìn)行預(yù)測(cè)分析;第三個(gè)階段為對(duì)預(yù)測(cè)結(jié)果進(jìn)行檢驗(yàn)評(píng)估并進(jìn)一步指導(dǎo)訓(xùn)練計(jì)劃。
在大數(shù)據(jù)時(shí)代,人們已經(jīng)習(xí)慣于利用技術(shù)手段來(lái)解決問(wèn)題。在此過(guò)程中,數(shù)據(jù)分析方法本身也得到了不斷改進(jìn)。但是,對(duì)于大數(shù)據(jù)時(shí)代的體育研究者而言,在對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行分析時(shí),仍然存在一些問(wèn)題。
第一是數(shù)據(jù)來(lái)源方面的問(wèn)題。目前,絕大多數(shù)學(xué)者都傾向于使用互聯(lián)網(wǎng)等非結(jié)構(gòu)化信息進(jìn)行研究,這會(huì)導(dǎo)致研究對(duì)象在統(tǒng)計(jì)上的不準(zhǔn)確或者說(shuō)缺失信息。從大數(shù)據(jù)角度看,體育大數(shù)據(jù)的來(lái)源并不少,但是由于沒(méi)有經(jīng)過(guò)訓(xùn)練或者數(shù)據(jù)處理水平較低等原因?qū)е陆y(tǒng)計(jì)誤差大。對(duì)于不同運(yùn)動(dòng)員個(gè)體而言,大數(shù)據(jù)分析的結(jié)果可能也存在差異;而對(duì)于不同國(guó)家或地區(qū)而言則可能會(huì)存在差異問(wèn)題;
第二是相關(guān)概念和術(shù)語(yǔ)方面的問(wèn)題。目前大數(shù)據(jù)領(lǐng)域出現(xiàn)了大量關(guān)于大數(shù)據(jù)技術(shù)、大數(shù)量概念、大數(shù)據(jù)技術(shù)等方面的相關(guān)理論或研究成果,但并沒(méi)有形成統(tǒng)一的標(biāo)準(zhǔn)體系和分類(lèi)體系;同時(shí)這些概念或者術(shù)語(yǔ)本身也具有一定的模糊性或不確定性;
第三是數(shù)據(jù)挖掘和分析方面存在的問(wèn)題。首先在數(shù)據(jù)挖掘?qū)用嫔?,目前還沒(méi)有形成統(tǒng)一標(biāo)準(zhǔn)和體系;其次是在數(shù)據(jù)挖掘和分析方法上還存在著一定的局限性;
第四是技術(shù)路線上存在誤區(qū)。從大數(shù)據(jù)技術(shù)和相關(guān)領(lǐng)域?qū)<覍W(xué)者研究提出了多種不同技術(shù)路線、不同層次概念和術(shù)語(yǔ)來(lái)對(duì)數(shù)據(jù)挖掘問(wèn)題進(jìn)行解釋;
第五是數(shù)據(jù)分析本身存在一些缺陷或不足之處。盡管目前相關(guān)領(lǐng)域已經(jīng)出現(xiàn)了一批專業(yè)人才,但大多數(shù)仍處于起步階段、經(jīng)驗(yàn)較少并不成熟;同時(shí)研究人員所采用的方法都是基于統(tǒng)計(jì)層面上進(jìn)行數(shù)據(jù)收集、整理和挖掘,而不是在理論研究基礎(chǔ)上進(jìn)行數(shù)據(jù)挖掘,這樣得出的結(jié)論往往有很大局限性明顯;
第六是大數(shù)據(jù)分析模型本身缺乏可擴(kuò)展性問(wèn)題。大數(shù)據(jù)分析模型主要有兩種:一種是基于數(shù)據(jù)驅(qū)動(dòng)、模型選擇、預(yù)測(cè)等傳統(tǒng)方法建立起來(lái)的機(jī)器學(xué)習(xí)模型;另一種則是采用傳統(tǒng)統(tǒng)計(jì)算法進(jìn)行數(shù)據(jù)處理建立起來(lái)的機(jī)器學(xué)習(xí)模型。前者雖然在某些方面具有一定優(yōu)勢(shì),但在某些方面存在很大局限性或限制而不能完全發(fā)揮作用;而后者則具有一些明顯優(yōu)勢(shì)或局限性;
第七是大數(shù)據(jù)分析本身不夠完善或存在局限性問(wèn)題,主要表現(xiàn)為如下幾個(gè)方面:(1)對(duì)大數(shù)據(jù)分析能力不足;(2)對(duì)相關(guān)概念及術(shù)語(yǔ)等理解不夠準(zhǔn)確;(3)沒(méi)有考慮到不同類(lèi)型體育比賽之間差異性問(wèn)題;(4)對(duì)數(shù)據(jù)處理水平較低所導(dǎo)致結(jié)果不夠準(zhǔn)確等;(5)缺乏大數(shù)據(jù)分析中所涉及到大量理論和方法知識(shí)方面的相關(guān)理論知識(shí)和研究經(jīng)驗(yàn);此外很多學(xué)者還缺乏運(yùn)用大數(shù)據(jù)分析方法所需的統(tǒng)計(jì)基礎(chǔ)知識(shí)、相關(guān)領(lǐng)域知識(shí)和數(shù)學(xué)分析方法知識(shí)等;
第八是數(shù)據(jù)本身所具有不確定性、偶然性問(wèn)題造成應(yīng)用局限問(wèn)題導(dǎo)致了對(duì)大數(shù)據(jù)分析能力不足或不夠強(qiáng)等問(wèn)題影響了大數(shù)據(jù)分析模型建立過(guò)程中可能出現(xiàn)的偏差問(wèn)題,進(jìn)而導(dǎo)致模型本身存在諸多局限性或誤差問(wèn)題、以及大數(shù)據(jù)研究方法本身不夠完善等問(wèn)題造成大數(shù)據(jù)分析模型應(yīng)用困難問(wèn)題,這些也會(huì)影響到人們對(duì)大數(shù)據(jù)庫(kù)模型建立過(guò)程中存在偏差或可能出現(xiàn)偏差等問(wèn)題所可能帶來(lái)?yè)p失時(shí)的補(bǔ)償與彌補(bǔ)方案及相應(yīng)措施設(shè)計(jì)的合理性提出質(zhì)疑等方面工作。
通過(guò)對(duì)過(guò)去10年我國(guó)運(yùn)動(dòng)員競(jìng)技比賽質(zhì)量的大數(shù)據(jù)分析,我們可以發(fā)現(xiàn)以下幾個(gè)方面。在國(guó)家對(duì)社會(huì)辦體育的支持下,部分運(yùn)動(dòng)員已經(jīng)開(kāi)始參加職業(yè)賽事,并取得了不俗成績(jī)。通過(guò)大數(shù)據(jù)對(duì)過(guò)去10年我國(guó)運(yùn)動(dòng)員競(jìng)技比賽質(zhì)量進(jìn)行分析,我們發(fā)現(xiàn)我國(guó)當(dāng)前的運(yùn)動(dòng)項(xiàng)目在“以賽促練”、“以賽帶訓(xùn)”等方面還存在諸多不足。通過(guò)分析近10年不同類(lèi)型項(xiàng)目成績(jī)變化發(fā)現(xiàn),我國(guó)競(jìng)技運(yùn)動(dòng)總體上發(fā)展良好,但仍存在著發(fā)展不均衡、不充分和結(jié)構(gòu)性矛盾突出的問(wèn)題。