付燁 覃靜薇 王蘭妹 劉袁
(廣西師范大學體育與健康學院 廣西 桂林 541006)
隨著信息時代的到來,體育科研人員必須順應時代的發(fā)展,主動適應時代的變化,轉(zhuǎn)變科學研究的思維模式。在處理調(diào)查對象時,應以總體觀念取代傳統(tǒng)的隨機抽樣觀念。在處理數(shù)據(jù)類型時,應從非結(jié)構(gòu)的角度來看待傳統(tǒng)的結(jié)構(gòu)數(shù)據(jù),并且能夠承受大量的無序和錯誤。此外,要善于從眾多的體育實務中發(fā)現(xiàn)新的、有價值的主題,并積極地尋找這些預測的成因。隨著“大數(shù)據(jù)戰(zhàn)略”被提上了國家戰(zhàn)略,體育科研和大數(shù)據(jù)的結(jié)合將會更加緊密地推動我國體育事業(yè)的發(fā)展。
自2012年以來,“大數(shù)據(jù)”一詞逐漸受到重視,其定義源自于信息時代的大量數(shù)據(jù)爆炸,以及與之相關的技術(shù)發(fā)展和革新。在大數(shù)據(jù)時代,數(shù)據(jù)已經(jīng)滲透到了社會的方方面面。從某些方面來說,體育就是一堆數(shù)據(jù)。從科研的角度來看,體育是最好的,也是最適合做大數(shù)據(jù)實驗的。IBM公司從1994年開始就把大數(shù)據(jù)應用與已與體育研究緊密聯(lián)系在一起?;跀?shù)據(jù)挖掘,利用人工智能技術(shù)從體育實踐中獲取海量的數(shù)據(jù),探索未知的體育模型和知識。盡管人們已經(jīng)認識到大數(shù)據(jù)的重要性,但中國科學院的李國杰表示,相對于大數(shù)據(jù)的經(jīng)濟價值,大數(shù)據(jù)的科學價值似乎并不被人們所關注。其實,隨著大數(shù)據(jù)的研究思路的改變,人們對大數(shù)據(jù)的認識也會逐漸增加,并且能夠更好地利用大數(shù)據(jù)進行科學研究。
(1)小數(shù)據(jù)時代下隨機抽樣是體育科學研究的歷史必然。
在小數(shù)據(jù)時代,由于資料的記錄、儲存和分析手段的限制,科研工作僅限于小規(guī)模的調(diào)查。為了使研究變得簡單可行,研究人員必須對數(shù)據(jù)的選擇進行權(quán)衡,因此,取樣就成了科研的必然選擇。同時,在多種取樣方法中,采用隨機取樣方法是最佳的。隨機取樣法是一種取樣方法,它使得所有的單元都具有一個已知的、非零的可能性。一般情況下,隨機取樣與取樣的隨機性密切相關,并不會隨著取樣量的增多而提高。這是因為,在樣本數(shù)目達到某個閾值之后,新的樣本所能提供的特性會逐步降低,就像經(jīng)濟上的邊際效應遞減效果一樣。比如,在全國范圍內(nèi)的體育人口普查中,采用預先設定的隨機抽樣計劃,僅針對整體中的一部分進行調(diào)查。隨機抽樣在國內(nèi)外已有很好的應用前景,但其存在的缺陷也是不可忽略的:在實踐中,很難做到完全隨機性的采樣。取樣必須做到公平,不得帶有任何的主觀色彩。反之,結(jié)果往往是錯誤的,而且當樣本的條件非常復雜時,最佳樣本就很難掌握。而想要用隨機抽樣來掌握被試的全部特性,就會成為一種奢侈。此外,隨機取樣方法不適用于研究不同類型的情形。由于取樣速率隨機錯誤的結(jié)果會隨著進一步的分解而大幅提高。此外,在體育社會科學的傳統(tǒng)研究中,通常采用問卷的形式進行數(shù)據(jù)搜集,但這些數(shù)據(jù)通常沒有時間上的連貫性。所以這些機構(gòu)的預測與推理往往具有局限性。
(2)“信息技術(shù)”和“大數(shù)據(jù)國家戰(zhàn)略”使體育科學研究中總體研究成為可能。
在信息技術(shù)革命的今天,我國的體育科學研究從“隨意性”向“全局性”轉(zhuǎn)變。在小資料年代,隨機抽樣是我國體育科學研究的重要組成部分。由于實驗手段的限制,科學實驗采用了小樣本、資料權(quán)衡、隨機取樣等方法。雖然隨機取樣是一種可行的方法,但是它也存在著一定的限制,難以達到完全的隨機性。且在條件較復雜的條件下,很難掌握最佳樣本。在大數(shù)據(jù)時代,以開放的數(shù)據(jù)獲得途徑為基礎,進行技術(shù)進步和實施大數(shù)據(jù)戰(zhàn)略,為體育科研提供了技術(shù)依據(jù)和體制保障。信息科技的發(fā)展,催生了許多新的科技工具的出現(xiàn),如,“可穿戴”裝置于2013年的興起,使人類行為、位置、生理指標的大量紀錄與分析成為可能。新技術(shù)的發(fā)展將為洞察社會輿情和社會心理提供更多的技術(shù)可能性。美國StatsLLC于2013年9月在NBA 2013-2014賽季的全部比賽中采用了體感跟蹤技術(shù)。該技術(shù)使用了Stats的SporsVU球員追蹤系統(tǒng),可以跟蹤速度、距離、球員之間的距離,最關鍵的是,所收集到的資料都是被試對象正常狀態(tài)的記錄,是一種多元的數(shù)據(jù),不會受到任何不相干的因素的干擾,盡管其中有“噪音”數(shù)據(jù),但研究不再需要考慮研究中和問卷調(diào)查中的偏頗(包括研究者在設計和問卷調(diào)查時的偏誤,以及由于自己的社會作用而導致的日常心理和行為)。同時,越來越多的信息獲取途徑也在推動著“大數(shù)據(jù)”的發(fā)展。美國白宮科學技術(shù)政策辦公室于2012年3月公布《大數(shù)據(jù)研究和發(fā)展計劃》,并成立了“大數(shù)據(jù)高級指導組”,這是美國將大數(shù)據(jù)提升至國家戰(zhàn)略水平的標志。2011年11月,歐盟就公開了數(shù)據(jù)開放策略??梢灶A見,隨著全球范圍內(nèi)大力推行大數(shù)據(jù)戰(zhàn)略,大數(shù)據(jù)也成為了我國信息化建設中的一個關鍵環(huán)節(jié)。
隨著大數(shù)據(jù)采集與挖掘技術(shù)的不斷發(fā)展,“大數(shù)據(jù)”國家戰(zhàn)略的實施將為體育科研應用提供技術(shù)依據(jù)和體制保證。而以整體研究為基礎的體育科學研究所,其成效是明顯的。以芝加哥大學的經(jīng)濟學家史蒂夫列維特為例,他在日本“相撲”中進行了一項關于非法操縱競賽結(jié)果的調(diào)查。他對過去64000次的相撲紀錄進行了分析。調(diào)查發(fā)現(xiàn):雖然偶爾也會有一些違法的行為,但都不會涉及到大眾最關注的賽事。冠軍聯(lián)賽也有被人操控的危險,但統(tǒng)計表明,負面的比賽更多地發(fā)生在一些不受重視的聯(lián)賽后面。這是因為相撲體育中的利益不對稱性。如果一場比賽的勝負對于一方來說是非常關鍵的,而對于另外一方來說,這是一種非法的操縱。如果是隨機抽取,那么這種結(jié)果很有可能是不存在的。
(1)小數(shù)據(jù)時代下體育科學研究結(jié)構(gòu)型數(shù)據(jù)的精確性。
在信息量缺乏的年代,科研工作最基本的要求就是確??蒲泄ぷ鞯馁|(zhì)量。但是,由于所收集到的數(shù)據(jù)量很少,所以在小數(shù)據(jù)時代,精確成為科學研究的最基本的需求。在許多的研究中,研究者們常常會把精力放在對測量工具的優(yōu)化上,以提高調(diào)查結(jié)果的準確性。此外,通過隨機取樣來減少科研費用,對精度的要求也越來越高。這是因為研究所能收集到的資料有限,所以對每一份資料的準確性都有很大的影響,如果有一份資料出錯,很可能會影響到最終的研究成果。但在實際應用中,由于數(shù)據(jù)的不正確性,研究人員往往會時時關注預防和避免差錯。為了降低采樣錯誤發(fā)生的可能性,研究人員采用了不同的方法來進行采樣。例如,為了檢驗研究結(jié)果的精確度,研究者們往往會進行反復的試驗,以檢驗和驗證樣品中可能出現(xiàn)的系統(tǒng)偏差。這無疑是一項耗時耗力的工作,而在實踐中,這種規(guī)避策略的執(zhí)行難度較大。
(2)大數(shù)據(jù)時代下體育科學研究非結(jié)構(gòu)型數(shù)據(jù)的混亂性與包容性。
在大數(shù)據(jù)時代,對數(shù)據(jù)準確性的需求已經(jīng)逐漸淡出人們的視野。由于放寬了容錯率,研究所可以獲得更多的數(shù)據(jù),各種數(shù)據(jù)的增多對于他們的研究來說,將會有更多的新的理論和知識。在這種情況下,大數(shù)據(jù)并不比小數(shù)據(jù)有更多優(yōu)點,但大數(shù)據(jù)能產(chǎn)生更好的效果。由于資料種類的增加,研究所獲取的資料會出現(xiàn)一片混亂的狀況,這主要是因為測量角度和測量工具的差異,從而導致資料的錯綜復雜。此外,不一致的格式,提取或處理數(shù)據(jù)也會造成混亂。而在大數(shù)據(jù)時代,為了獲取海量的數(shù)據(jù),研究人員往往會忽視個體數(shù)據(jù)的準確性,因為數(shù)據(jù)的完整性可以讓他們更好地掌握研究的細節(jié)。體育研究中的資料是雜亂無章地拼湊起來的,比如,把體育影像資料與生理學資料混雜在一起。而且,要想讓計算機辨認出它們,就必須給它們打上不同的標簽,而且它們都有一個統(tǒng)一的分類準則。但是它為我們的搜尋提供了一個更加深入和廣泛的方法。所以,在這種情況下,“混亂”是一種在大數(shù)據(jù)時代進行體育科學研究的常規(guī)方式。另外,傳統(tǒng)的數(shù)據(jù)庫都是事先設置好的,有序的格式庫。這是一個有組織的數(shù)據(jù)庫。但是,在大數(shù)據(jù)時代,這個數(shù)據(jù)庫不需要事先設置,它的數(shù)據(jù)結(jié)構(gòu)是多種多樣的。在大數(shù)據(jù)時代,非結(jié)構(gòu)數(shù)據(jù)庫打破了以往數(shù)據(jù)庫所要求的時間一致性,采用“無限近似于樣本等于全局”的方式進行數(shù)據(jù)處理。而且,這份材料的質(zhì)量也很重要。在大數(shù)據(jù)時代,對數(shù)據(jù)的處理技術(shù)進行研究,不僅能確保數(shù)據(jù)的完整性和可信度,而且還能確保數(shù)據(jù)的準確性。還可以通過多種途徑、多角度收集和挖掘被試的觀測資料,從而使研究者更加客觀、真實地了解體育的客觀規(guī)律。
在大數(shù)據(jù)時代,體育科研思維的轉(zhuǎn)變,反映在新的研究范式中,以新的主題發(fā)現(xiàn)為基礎。傳統(tǒng)的體育科學研究是從體育的實踐問題出發(fā),探索與研究對象的關系,以及總體的表現(xiàn)方式。由于資料有限,研究途徑有限,研究多采用理論方法,以理論為依據(jù),引導研究者選取相關對象,搜集相關資料,分析相關關系,論證相關問題,若不符合,就重復試驗,直至得出結(jié)論,這樣的范式會導致研究進展緩慢,受到偏見的影響,很容易出現(xiàn)錯誤。而在大數(shù)據(jù)時代,體育科學研究的新范式,則是基于已有的相關因果關系的研究。分析關聯(lián)是大數(shù)據(jù)的核心和對事件的發(fā)展的預測。從關聯(lián)中發(fā)現(xiàn)新的問題在大數(shù)據(jù)時代,由于不同領域之間的關聯(lián)關系不斷被發(fā)掘,這給我們的研究帶來了新的機遇與挑戰(zhàn)。一方面,許多關聯(lián)的發(fā)現(xiàn)為研究者們提供了新的研究方向;另一方面,不同領域知識之間的相互關聯(lián),需要有一個更為完整的知識系統(tǒng)。
在小數(shù)據(jù)時代,體育科研往往從體育實踐活動中所出現(xiàn)的問題入手,尋找與其相關的研究對象。這種以假定為起點的因果關系研究具有一定的歷史背景。在大數(shù)據(jù)時代以前,由于資料稀少,信息采集的渠道也不暢通。因此,一般的方法就是利用基于理論的假設來引導研究人員選擇合適的相關對象;其次,對關聯(lián)對象的相關資料進行相關分析,以確定該關聯(lián)對象的適用性。如果不行,那就再來一次實驗。研究人員對這些假設進行了反復的檢驗,最終得到了研究的假說的驗證。但是,這個模式對于研究的推進十分緩慢,而且研究成果也會受到個體和群體的偏頗的影響,從而使研究在建立假設、驗證假設、選取相關對象時出現(xiàn)失誤。
大數(shù)據(jù)的關鍵在于通過關聯(lián)關系的分析來預測未來的發(fā)展。從操作上來說,這是一種統(tǒng)計上的關系。對事物進行有效的關聯(lián),不能揭示其內(nèi)在的運作規(guī)律。此外,在實務上,僅有的體育現(xiàn)象已不再存在,比如,體育研究中存在社會學、心理學甚至環(huán)境氣象學等方面的問題。麻省理工學院對美國職棒聯(lián)盟11896次的投球得分圖進行了分析,結(jié)果顯示:在投球時,環(huán)境的影響要遠遠大于心理上的影響,因此,叫暫停并沒有什么意義,不如去了解一下氣候條件。通過對這些數(shù)據(jù)進行復雜的分析,可以發(fā)現(xiàn)它們之間的非線性關系,而且不是單純的線性關系,而是一種非常復雜的關系。在大數(shù)據(jù)時代,新的分析方法和思維方式為體育科學的研究開辟了新的視野和新的前景,同時也讓研究者們了解了許多過去沒有發(fā)現(xiàn)的體育規(guī)律,了解了以往所不能了解的體育現(xiàn)象和體育發(fā)展的規(guī)律。
體育科學受到大數(shù)據(jù)時代的影響,其學科的思維和激情得到了激發(fā),體育學科從單一片面的發(fā)展方式轉(zhuǎn)為全面的、多樣化發(fā)展,可以有效地克服目前我國體育事業(yè)中的一些問題。近年來,體育科學與行為科學、社會心理學、管理學、產(chǎn)業(yè)經(jīng)濟學、心理學等多學科的融合,對其發(fā)展起到了積極的促進作用。體育科學研究是體育領域的一個重大課題,包括體育研究課題、體育可持續(xù)發(fā)展研究課題、人才培養(yǎng)優(yōu)化、國家體育國力研究課題、體育管理經(jīng)營課題、體育產(chǎn)業(yè)研究課題等等,都要求體育科學研究按照高度綜合與高度分化的發(fā)展趨勢進行研究。因此,高層次的綜合性和差別性成為當前體育教學發(fā)展的重要方向。
在大數(shù)據(jù)背景下,體育科研思維的發(fā)展要求改革科研方式,加快發(fā)展的步伐。以邵偉德等學者為例,對體育科學的研究方法進行了統(tǒng)計,結(jié)果顯示,體育訓練是論文中的主要內(nèi)容,并將先進的生物化學分析儀、三維成像與三維數(shù)字成像技術(shù)與攝像技術(shù)、解析法、灰色關聯(lián)法、計算機仿真法等現(xiàn)代科學研究方法,以增強體育科學的科學性,同時也能有效地改善科學研究的質(zhì)量。當前,我國的體育科學研究正逐步向跨學科發(fā)展,各種科學的研究方法不斷地移植、滲透和融合,使得體育科學的研究手段在大數(shù)據(jù)的背景下不斷地變得復雜和多樣化。當前,傳統(tǒng)的單一研究手段難以有效地處理體育研究中的問題,需要采取綜合性的研究手段。比如,在體育科學研究中,利用數(shù)學運算對有關數(shù)據(jù)進行統(tǒng)計分析,從而提高科學研究的準確性和科學性。在大數(shù)據(jù)時代,科學的認識和方法學的邊界較為模糊,這就導致了不同學科的不同方法的融合,從而增強了體育科學的研究價值,并使其研究的方式更為多樣化和綜合性更強。
高校體育科研工作者要順應新的發(fā)展趨勢,充分利用大數(shù)據(jù)技術(shù),轉(zhuǎn)變傳統(tǒng)的體育學科研究模式,采用現(xiàn)代化、綜合的科學思想和方法,進行體育科學的創(chuàng)新和創(chuàng)新。體育科研作為一項全新的學科,必須突破傳統(tǒng)思維模式,為體育科研的變革奠定基礎。在信息化條件下,近幾年的研究表明,我國體育工作者的思維觀念由封閉性向全面開放性、創(chuàng)新性轉(zhuǎn)變,反映了我國體育工作者思維模式的轉(zhuǎn)變。其中,辯證思維、立體思維、系統(tǒng)思維等與想象思維、直覺思維等非邏輯思維模式和方法,在競技體育科學思維改革過程中得到了廣泛的應用,進而全面深刻地推動了競技體育科學思維的發(fā)展,使得它在體育科學問題的選擇上更加具有獨特性、科學性、創(chuàng)新性和價值性。
由于大數(shù)據(jù)在我國的發(fā)展尚處于探索的階段,其在體育中的運用更是一片空白,今后還有很長的一段路要走,并在實踐中逐步完善。當前,在大數(shù)據(jù)環(huán)境下,體育發(fā)展面臨著三大難題。第一:個人隱私面臨的挑戰(zhàn)。大數(shù)據(jù)是一柄雙刃劍,在為高校體育改革帶來科學、高效、創(chuàng)新的同時,也存在著對個人信息的泄漏和個人隱私的侵害。在大數(shù)據(jù)時代,個人信息、家庭背景已被視為“公共機密”,由此引發(fā)一系列的社會倫理問題。如何充分有效地挖掘數(shù)據(jù)背后的價值,同時又能保證數(shù)據(jù)的安全性和不侵犯個人隱私,是一個值得思考的問題;第二,技術(shù)人員面臨的挑戰(zhàn)。大數(shù)據(jù)意味著大量的、復雜的數(shù)據(jù),需要技術(shù)支撐,否則數(shù)據(jù)只是數(shù)據(jù),無法轉(zhuǎn)換成有意義的資料。數(shù)據(jù)存儲、數(shù)據(jù)挖掘、數(shù)據(jù)分析等都是需要解決的問題。但是,目前國內(nèi)對這些技術(shù)的掌握還不夠成熟,很多地區(qū)教育部門都缺少對大數(shù)據(jù)的支持,同時也沒有建立信息體系及學校的教學平臺。因此,從認知、學習到熟練運用大數(shù)據(jù),到運用到實踐中,仍然需要一段時間。而在我國,雖然作為一個“人才大國”,但在對大數(shù)據(jù)的認識與應用上,還存在著嚴重不足的問題。
在信息技術(shù)飛速發(fā)展的今天,我國的體育研究人員要積極地適應新的形勢,積極地改變自己的研究思路,實現(xiàn)自我發(fā)展。觀念轉(zhuǎn)換需要采取全樣本代替隨意取樣,以非結(jié)構(gòu)數(shù)據(jù)代替結(jié)構(gòu)數(shù)據(jù),并能從體育活動中挖掘出與之相關的、新穎的話題。要發(fā)展我國的體育科學研究之路,在信息技術(shù)的發(fā)展過程中,體育科學思維的發(fā)展需要通過綜合性的、思維創(chuàng)造性的全面性和方法的多樣性來完成。