何麗娟
(首都體育學(xué)院 北京 100191)
近些年,隨著社會科學(xué)的進(jìn)步,互聯(lián)網(wǎng)的快速發(fā)展,大數(shù)據(jù)信息時代隨之到來。人們可以方便、輕松、快捷地通過互聯(lián)網(wǎng)收集到大量數(shù)據(jù),并進(jìn)行數(shù)據(jù)的分析和計算,這為各個領(lǐng)域借助大數(shù)據(jù)分析問題提供了可能。所有科學(xué)領(lǐng)域都有可能借助統(tǒng)計學(xué)的思想和方法,獲取數(shù)據(jù)、分析數(shù)據(jù),從而得出統(tǒng)計結(jié)論,為其所研究的問題提供參考。統(tǒng)計學(xué)為科研人員提供了各種處理數(shù)據(jù)的方法,但這些處理數(shù)據(jù)的方法主要是根據(jù)從總體中抽取的已知樣本統(tǒng)計量去推斷未知總體參數(shù)。然而,隨著科技發(fā)展,使得收集海量數(shù)據(jù)成為可能。人們開始借助云計算的大數(shù)據(jù)平臺獲取并分析數(shù)據(jù)。近些年,在體育科學(xué)領(lǐng)域,有很多科研人員試圖使用大數(shù)據(jù)研究體育領(lǐng)域中的問題,如反興奮劑問題、如何選材、成績的提升、科學(xué)訓(xùn)練、比賽中的指標(biāo)測定等,這些都可以使用大數(shù)據(jù)的收集和處理方法進(jìn)行分析研究。大數(shù)據(jù)為科研人員帶來了深入探索問題的機(jī)遇,以往不能實(shí)現(xiàn)的假想和方法可以借助互聯(lián)網(wǎng)和科技手段得以實(shí)現(xiàn)。然而從目前統(tǒng)計學(xué)教學(xué)現(xiàn)狀分析,大數(shù)據(jù)時代的到來,對統(tǒng)計學(xué)教學(xué)提出了新的難題,許多科技的手段讓統(tǒng)計學(xué)的數(shù)據(jù)處理變得更加方便,但是學(xué)習(xí)這些科技方法需要時間和精力,因此統(tǒng)計學(xué)教學(xué)遇到了新的困境,面臨新的挑戰(zhàn)。該文試圖通過對大數(shù)據(jù)時代的特征分析,探討體育院校統(tǒng)計學(xué)教學(xué)的困境及面臨的挑戰(zhàn),為今后統(tǒng)計學(xué)教學(xué)創(chuàng)新發(fā)展提供參考。
當(dāng)前,認(rèn)為大數(shù)據(jù)有4個基本特征:數(shù)據(jù)規(guī)模大(Volume)、數(shù)據(jù)種類多(Variety)、數(shù)據(jù)要求處理速度快(Velocity)、數(shù)據(jù)價值密度低(Value),即所謂的四V特性。這些特性使得大數(shù)據(jù)區(qū)別于傳統(tǒng)的數(shù)據(jù)概念[1]。傳統(tǒng)的數(shù)據(jù)主要是結(jié)構(gòu)化數(shù)據(jù),即數(shù)據(jù)格式主要是數(shù)字和文字,可以使用單式機(jī)進(jìn)行數(shù)據(jù)處理。而大數(shù)據(jù)除了結(jié)構(gòu)化數(shù)據(jù)外,往往為非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù),如網(wǎng)站瀏覽記錄、視頻、音頻、導(dǎo)航記錄、圖片等,這些海量數(shù)據(jù)依靠單式機(jī)已經(jīng)不能完成數(shù)據(jù)處理。傳統(tǒng)的數(shù)據(jù)處理工具也不能滿足人們處理數(shù)據(jù)的需求,因此新的數(shù)據(jù)分析工具應(yīng)運(yùn)而生,如R語言、Rapid Miner、Mahout等。這些軟件為數(shù)據(jù)格式多樣化、避免傳統(tǒng)數(shù)據(jù)算法的失效、超大規(guī)模數(shù)據(jù)的可視化提供了可能。
第一,作為體育院校開設(shè)的體育統(tǒng)計學(xué)課程,是借助數(shù)理統(tǒng)計方法、概率論思想研究體育領(lǐng)域中的隨機(jī)現(xiàn)象,它是以應(yīng)用統(tǒng)計學(xué)為主,為體育院校的學(xué)生使用統(tǒng)計學(xué)方法進(jìn)行科研工作而開設(shè)的課程。統(tǒng)計學(xué)是根據(jù)研究者的研究目的確定研究總體,但因?yàn)闂l件的限制,研究者不可能得到總體中的每個個體,因此從總體中抽取樣本,對樣本進(jìn)行分析,然后再根據(jù)一定的統(tǒng)計方法推斷未知的總體。統(tǒng)計學(xué)方法既包括對已知樣本的分析,即描述統(tǒng)計,也包括對未知總體的推斷,即推斷統(tǒng)計。無論是描述統(tǒng)計,還是推斷統(tǒng)計,由于科技的發(fā)展,特別是專門的統(tǒng)計軟件的開發(fā),使得統(tǒng)計計算變得越來越快捷,處理大量數(shù)據(jù)也變得越來越容易。
為了讓學(xué)生更好地學(xué)習(xí)使用軟件,在多年的教學(xué)改革和教學(xué)實(shí)踐中,統(tǒng)計學(xué)課堂已經(jīng)轉(zhuǎn)入機(jī)房。根據(jù)統(tǒng)計學(xué)教學(xué)大綱,除了講授統(tǒng)計學(xué)的基本概念和基本理論,還為學(xué)生講授使用Excel、SPSS等軟件進(jìn)行數(shù)據(jù)分析和處理的技能。但是,目前的教學(xué)中還是使用以往的例題數(shù)據(jù)資料,這些數(shù)據(jù)資料雖然經(jīng)典,但是往往數(shù)據(jù)量比較少,數(shù)據(jù)的使用條件也非常理想化。而在現(xiàn)實(shí)的研究分析中,可能會面臨數(shù)據(jù)量大、數(shù)據(jù)環(huán)境復(fù)雜的情況,當(dāng)學(xué)生研究問題,使用數(shù)據(jù)進(jìn)行分析時,可能會產(chǎn)生很多困惑。造成這種狀況的原因之一是在教學(xué)中使用的例題比較單一,使用的數(shù)據(jù)都假定滿足條件,不能直接為學(xué)生演示和講解分析數(shù)據(jù)的復(fù)雜性,學(xué)生感受不到如何分析數(shù)據(jù)的背景。因此,當(dāng)面對大數(shù)據(jù),學(xué)生遇到更復(fù)雜的數(shù)據(jù)環(huán)境時,往往不知道如何入手進(jìn)行數(shù)據(jù)分析。
第二,統(tǒng)計學(xué)涵蓋內(nèi)容多且學(xué)習(xí)難度大,再加上統(tǒng)計軟件操作的學(xué)習(xí),目前的教學(xué)時數(shù)不能滿足教學(xué)內(nèi)容的學(xué)習(xí)。受到學(xué)校專業(yè)培養(yǎng)方案等教學(xué)環(huán)境和教學(xué)條件的限制,統(tǒng)計學(xué)教學(xué)學(xué)時一般為36學(xué)時左右。在大數(shù)據(jù)到來時,需要在掌握基礎(chǔ)知識的基礎(chǔ)上進(jìn)行拓展學(xué)習(xí),或開發(fā)新的教學(xué)方式,但受目前培養(yǎng)方案限制,若再增加新內(nèi)容,難度較大,且難以實(shí)現(xiàn)。
第三,教師原有知識結(jié)構(gòu)的局限性限制了教學(xué)內(nèi)容的更新,很難在教學(xué)上有新的突破。隨著體育科研研究問題的不斷深入,研究水平不斷提高,原有的統(tǒng)計學(xué)教學(xué)如果還局限在原有的教學(xué)內(nèi)容上,將不能滿足學(xué)生進(jìn)行科學(xué)研究的需要,不能滿足體育人才的培養(yǎng)要求。如多因素統(tǒng)計分析方法應(yīng)用的增多、獲取數(shù)據(jù)的增加、研究方法的擴(kuò)展等,目前體育研究中已經(jīng)廣泛使用數(shù)據(jù)挖掘、結(jié)構(gòu)方程模型、層次分析法、投入產(chǎn)出等。數(shù)據(jù)分析工具的增加,使得統(tǒng)計學(xué)教師不能只局限于某一個統(tǒng)計軟件的掌握上,其不但要學(xué)習(xí)新的統(tǒng)計分析方法,還要學(xué)習(xí)更多的統(tǒng)計分析工具,從而了解統(tǒng)計學(xué)新的發(fā)展方向和動態(tài),否則將難以提高統(tǒng)計學(xué)的教學(xué)水平,影響培養(yǎng)學(xué)生分析和使用大數(shù)據(jù)的能力。
第四,大數(shù)據(jù)背景下,體育院校借助統(tǒng)計學(xué)研究問題時不單單只是涉及統(tǒng)計學(xué)方法及使用專門的統(tǒng)計學(xué)軟件,還會涉及計算機(jī)科學(xué)和技術(shù),因此研究問題時非常需要掌握交叉學(xué)科技能的人才。要培養(yǎng)這種交叉型的人才,作為教師首先要掌握相關(guān)的知識和技能,才能在教學(xué)內(nèi)容、教學(xué)形式、教學(xué)方式上不斷進(jìn)行探索。但是目前既掌握統(tǒng)計學(xué)又掌握計算機(jī)科學(xué)的交叉型教師寥寥無幾,統(tǒng)計教學(xué)新模式的探索則會受到限制。
第一,大數(shù)據(jù)的特征使得在數(shù)據(jù)的收集、整理和分析上與傳統(tǒng)統(tǒng)計學(xué)中的數(shù)據(jù)概念、數(shù)據(jù)收集、數(shù)據(jù)整理和數(shù)據(jù)分析有一定的差別。教師可以固守原有的統(tǒng)計學(xué)內(nèi)容進(jìn)行教學(xué),不去理會大數(shù)據(jù)帶來的新的知識和觀念的更新,但是必須正視現(xiàn)實(shí),面對挑戰(zhàn),應(yīng)主動學(xué)習(xí)和了解大數(shù)據(jù)的定義、特征及其應(yīng)用。一方面,對于基礎(chǔ)統(tǒng)計學(xué)的內(nèi)容,由于計算機(jī)科學(xué)和技術(shù)的不斷發(fā)展,計算的操作性越來越簡單、直觀。對于調(diào)查數(shù)據(jù)的收集,由于互聯(lián)網(wǎng)的出現(xiàn),現(xiàn)在人們普遍使用問卷星等工具進(jìn)行問卷的收集,調(diào)查樣本遠(yuǎn)比以往更加容易獲取。另一方面,因?yàn)橛嬎銠C(jī)科學(xué)和技術(shù)的提高,互聯(lián)網(wǎng)的廣泛使用,為獲取更多的數(shù)據(jù)提供了可能,但是在獲取更多的數(shù)據(jù)時,有些數(shù)據(jù)不一定有用,部分?jǐn)?shù)據(jù)會為分析研究帶來干擾,因此這就需要研究者更加清楚研究方法的選擇和研究方法的條件是否滿足。如何將以往的統(tǒng)計學(xué)內(nèi)容和當(dāng)今對統(tǒng)計學(xué)新的需求結(jié)合起來,是今后統(tǒng)計學(xué)教學(xué)中需要考慮和研究的方向。
第二,當(dāng)前,盡管統(tǒng)計學(xué)的概率論思想和方法不會發(fā)生改變,體育領(lǐng)域研究的諸多問題仍是隨機(jī)現(xiàn)象,還需使用數(shù)理統(tǒng)計方法研究體育中的問題,但是大數(shù)據(jù)時代對統(tǒng)計學(xué)的思維還是提出了挑戰(zhàn)。以往,統(tǒng)計學(xué)更多地應(yīng)用于樣本推斷總體的方法,更多地討論差異性,進(jìn)行推斷統(tǒng)計和研究分析因果關(guān)系,建立統(tǒng)計模型。但是大數(shù)據(jù)時代,可能需要更多地關(guān)注相關(guān)關(guān)系,進(jìn)行聚類分析,更多地使用圖表分析,改變思維方式,這對統(tǒng)計學(xué)的固有研究范式和價值理念帶來一定的沖擊,而且促使統(tǒng)計學(xué)面臨在知識結(jié)構(gòu)、教育內(nèi)容、教育模式和人才培養(yǎng)模式等方面的諸多挑戰(zhàn)。統(tǒng)計學(xué)教師必須重建統(tǒng)計學(xué)教學(xué)的知識結(jié)構(gòu),學(xué)習(xí)最新和最常用的數(shù)據(jù)分析工具,充實(shí)和調(diào)整自己的知識庫。
第三,伴隨著大數(shù)據(jù)時代到來,體育院校的科學(xué)研究除了借用統(tǒng)計學(xué)方法外,人工智能和互聯(lián)網(wǎng)、物聯(lián)網(wǎng)的應(yīng)用,對統(tǒng)計學(xué)的教學(xué)也提出了新的挑戰(zhàn)。統(tǒng)計學(xué)教師需要了解和掌握相關(guān)學(xué)科知識。為了人才培養(yǎng)的需要,將更需要具備計算機(jī)知識、專業(yè)知識和統(tǒng)計學(xué)知識的復(fù)合型人才。大數(shù)據(jù)的熱潮,催生了一門新的學(xué)科,即數(shù)據(jù)科學(xué)。數(shù)據(jù)科學(xué)正處于發(fā)展初期,是一門不斷發(fā)展的學(xué)科。數(shù)據(jù)科學(xué)的核心涉及用自動化的方法來分析海量數(shù)據(jù),并從中提取知識。數(shù)據(jù)科學(xué)是一門橫跨信息科學(xué)、網(wǎng)絡(luò)科學(xué)、經(jīng)濟(jì)學(xué)等諸多領(lǐng)域的新興交叉學(xué)科,依然處于發(fā)展初期[2]。這就為統(tǒng)計學(xué)教師提供了新的機(jī)遇,也面臨了新的挑戰(zhàn)。
第四,大數(shù)據(jù)時代,計算機(jī)科學(xué)和技術(shù)的提高,各種相關(guān)的統(tǒng)計分析軟件使用越來越普及,版本升級也越來越快,研究中需要展示的統(tǒng)計表和統(tǒng)計圖制作得也越來越美觀,這就要求教學(xué)上要及時進(jìn)行內(nèi)容的補(bǔ)充。一方面,教師要堅守以統(tǒng)計學(xué)的基本理論進(jìn)行教學(xué);另一方面,要不斷更新自己的知識庫,除了掌握專門的統(tǒng)計學(xué)軟件,還要補(bǔ)充學(xué)習(xí)和了解其他的相關(guān)軟件,如現(xiàn)在市場上廣泛流行的Python語言,功能更強(qiáng)大,使用更廣泛,這為統(tǒng)計學(xué)教師的教學(xué)提出了新的拓展方向。
第一,為彌補(bǔ)教學(xué)時數(shù)的不足,鼓勵教師豐富多媒體教學(xué)課件,如錄制視頻課程,豐富教學(xué)資源。借助互聯(lián)網(wǎng)技術(shù),利用不同的學(xué)習(xí)平臺,讓學(xué)生通過多種途徑進(jìn)行統(tǒng)計學(xué)的學(xué)習(xí)和實(shí)踐,做到課上、課下學(xué)習(xí)相結(jié)合。
第二,進(jìn)行分層教學(xué),針對不同學(xué)生講授不同統(tǒng)計軟件的學(xué)習(xí)和使用。如在研究生的教學(xué)中,除了學(xué)習(xí)原有的SPSS統(tǒng)計學(xué)軟件,還可以引導(dǎo)他們學(xué)習(xí)R軟件,為學(xué)生介紹大數(shù)據(jù)的相關(guān)知識,豐富并擴(kuò)展統(tǒng)計學(xué)內(nèi)容。而對于本科學(xué)生,可以根據(jù)專業(yè)不同,選擇不同的統(tǒng)計軟件進(jìn)行教學(xué)。如運(yùn)動人體科學(xué)、運(yùn)動康復(fù)、公共事業(yè)管理、體育經(jīng)濟(jì)與管理、新聞專業(yè)的學(xué)生可以學(xué)習(xí)SPSS統(tǒng)計分析軟件。
第三,學(xué)科之間資源的組合,探索研究問題,在實(shí)踐中積累數(shù)據(jù)資料,為教學(xué)和科研積累資源。如統(tǒng)計學(xué)與人體測量學(xué)、計算機(jī)科學(xué)相結(jié)合,探討體質(zhì)測試中數(shù)據(jù)的分析和研究;統(tǒng)計學(xué)與運(yùn)動訓(xùn)練、生物力學(xué)、運(yùn)動體能相結(jié)合,進(jìn)行科學(xué)訓(xùn)練方法的研究與探索。在研究生培養(yǎng)方案中,也可以與其他學(xué)科相結(jié)合,開設(shè)數(shù)據(jù)分析研究方向,或許數(shù)據(jù)科學(xué)將成為今后的專業(yè)選擇。體育院校可以先設(shè)置數(shù)據(jù)分析研究方向,開設(shè)培養(yǎng)復(fù)合型的研究人才的相關(guān)課程,如統(tǒng)計分析與SPSS、數(shù)據(jù)庫、信息管理系統(tǒng)、R軟件,為體育領(lǐng)域培養(yǎng)數(shù)據(jù)科學(xué)的人才,組建復(fù)合型的教學(xué)團(tuán)隊。
統(tǒng)計學(xué)教學(xué)一直面臨教學(xué)時數(shù)少、教學(xué)難度大的情況。大數(shù)據(jù)時代,體育院校統(tǒng)計學(xué)教學(xué)面臨的困難更多。統(tǒng)計學(xué)教師應(yīng)轉(zhuǎn)變觀念,迎難而上,不斷儲備專業(yè)知識,學(xué)習(xí)和掌握新的數(shù)據(jù)分析工具。統(tǒng)計學(xué)教學(xué)需要不斷進(jìn)行創(chuàng)新與發(fā)展,不僅要在教學(xué)方法和教學(xué)手段上不斷進(jìn)行創(chuàng)新,還要與其他學(xué)科相融合,組建復(fù)合型的教學(xué)團(tuán)隊。建議在研究生培養(yǎng)上開設(shè)體育數(shù)據(jù)分析方向,為今后開設(shè)體育數(shù)據(jù)科學(xué)專業(yè)做準(zhǔn)備。體育院校的統(tǒng)計學(xué)教師需要不斷了解和研究統(tǒng)計學(xué)的應(yīng)用領(lǐng)域,學(xué)習(xí)大數(shù)據(jù)時代新的統(tǒng)計方法。機(jī)遇與挑戰(zhàn)并存,唯有不斷學(xué)習(xí)進(jìn)取。