何麗娟
(首都體育學院 北京 100191)
近些年,隨著社會科學的進步,互聯(lián)網(wǎng)的快速發(fā)展,大數(shù)據(jù)信息時代隨之到來。人們可以方便、輕松、快捷地通過互聯(lián)網(wǎng)收集到大量數(shù)據(jù),并進行數(shù)據(jù)的分析和計算,這為各個領域借助大數(shù)據(jù)分析問題提供了可能。所有科學領域都有可能借助統(tǒng)計學的思想和方法,獲取數(shù)據(jù)、分析數(shù)據(jù),從而得出統(tǒng)計結論,為其所研究的問題提供參考。統(tǒng)計學為科研人員提供了各種處理數(shù)據(jù)的方法,但這些處理數(shù)據(jù)的方法主要是根據(jù)從總體中抽取的已知樣本統(tǒng)計量去推斷未知總體參數(shù)。然而,隨著科技發(fā)展,使得收集海量數(shù)據(jù)成為可能。人們開始借助云計算的大數(shù)據(jù)平臺獲取并分析數(shù)據(jù)。近些年,在體育科學領域,有很多科研人員試圖使用大數(shù)據(jù)研究體育領域中的問題,如反興奮劑問題、如何選材、成績的提升、科學訓練、比賽中的指標測定等,這些都可以使用大數(shù)據(jù)的收集和處理方法進行分析研究。大數(shù)據(jù)為科研人員帶來了深入探索問題的機遇,以往不能實現(xiàn)的假想和方法可以借助互聯(lián)網(wǎng)和科技手段得以實現(xiàn)。然而從目前統(tǒng)計學教學現(xiàn)狀分析,大數(shù)據(jù)時代的到來,對統(tǒng)計學教學提出了新的難題,許多科技的手段讓統(tǒng)計學的數(shù)據(jù)處理變得更加方便,但是學習這些科技方法需要時間和精力,因此統(tǒng)計學教學遇到了新的困境,面臨新的挑戰(zhàn)。該文試圖通過對大數(shù)據(jù)時代的特征分析,探討體育院校統(tǒng)計學教學的困境及面臨的挑戰(zhàn),為今后統(tǒng)計學教學創(chuàng)新發(fā)展提供參考。
當前,認為大數(shù)據(jù)有4個基本特征:數(shù)據(jù)規(guī)模大(Volume)、數(shù)據(jù)種類多(Variety)、數(shù)據(jù)要求處理速度快(Velocity)、數(shù)據(jù)價值密度低(Value),即所謂的四V特性。這些特性使得大數(shù)據(jù)區(qū)別于傳統(tǒng)的數(shù)據(jù)概念[1]。傳統(tǒng)的數(shù)據(jù)主要是結構化數(shù)據(jù),即數(shù)據(jù)格式主要是數(shù)字和文字,可以使用單式機進行數(shù)據(jù)處理。而大數(shù)據(jù)除了結構化數(shù)據(jù)外,往往為非結構化或半結構化數(shù)據(jù),如網(wǎng)站瀏覽記錄、視頻、音頻、導航記錄、圖片等,這些海量數(shù)據(jù)依靠單式機已經(jīng)不能完成數(shù)據(jù)處理。傳統(tǒng)的數(shù)據(jù)處理工具也不能滿足人們處理數(shù)據(jù)的需求,因此新的數(shù)據(jù)分析工具應運而生,如R語言、Rapid Miner、Mahout等。這些軟件為數(shù)據(jù)格式多樣化、避免傳統(tǒng)數(shù)據(jù)算法的失效、超大規(guī)模數(shù)據(jù)的可視化提供了可能。
第一,作為體育院校開設的體育統(tǒng)計學課程,是借助數(shù)理統(tǒng)計方法、概率論思想研究體育領域中的隨機現(xiàn)象,它是以應用統(tǒng)計學為主,為體育院校的學生使用統(tǒng)計學方法進行科研工作而開設的課程。統(tǒng)計學是根據(jù)研究者的研究目的確定研究總體,但因為條件的限制,研究者不可能得到總體中的每個個體,因此從總體中抽取樣本,對樣本進行分析,然后再根據(jù)一定的統(tǒng)計方法推斷未知的總體。統(tǒng)計學方法既包括對已知樣本的分析,即描述統(tǒng)計,也包括對未知總體的推斷,即推斷統(tǒng)計。無論是描述統(tǒng)計,還是推斷統(tǒng)計,由于科技的發(fā)展,特別是專門的統(tǒng)計軟件的開發(fā),使得統(tǒng)計計算變得越來越快捷,處理大量數(shù)據(jù)也變得越來越容易。
為了讓學生更好地學習使用軟件,在多年的教學改革和教學實踐中,統(tǒng)計學課堂已經(jīng)轉入機房。根據(jù)統(tǒng)計學教學大綱,除了講授統(tǒng)計學的基本概念和基本理論,還為學生講授使用Excel、SPSS等軟件進行數(shù)據(jù)分析和處理的技能。但是,目前的教學中還是使用以往的例題數(shù)據(jù)資料,這些數(shù)據(jù)資料雖然經(jīng)典,但是往往數(shù)據(jù)量比較少,數(shù)據(jù)的使用條件也非常理想化。而在現(xiàn)實的研究分析中,可能會面臨數(shù)據(jù)量大、數(shù)據(jù)環(huán)境復雜的情況,當學生研究問題,使用數(shù)據(jù)進行分析時,可能會產(chǎn)生很多困惑。造成這種狀況的原因之一是在教學中使用的例題比較單一,使用的數(shù)據(jù)都假定滿足條件,不能直接為學生演示和講解分析數(shù)據(jù)的復雜性,學生感受不到如何分析數(shù)據(jù)的背景。因此,當面對大數(shù)據(jù),學生遇到更復雜的數(shù)據(jù)環(huán)境時,往往不知道如何入手進行數(shù)據(jù)分析。
第二,統(tǒng)計學涵蓋內(nèi)容多且學習難度大,再加上統(tǒng)計軟件操作的學習,目前的教學時數(shù)不能滿足教學內(nèi)容的學習。受到學校專業(yè)培養(yǎng)方案等教學環(huán)境和教學條件的限制,統(tǒng)計學教學學時一般為36學時左右。在大數(shù)據(jù)到來時,需要在掌握基礎知識的基礎上進行拓展學習,或開發(fā)新的教學方式,但受目前培養(yǎng)方案限制,若再增加新內(nèi)容,難度較大,且難以實現(xiàn)。
第三,教師原有知識結構的局限性限制了教學內(nèi)容的更新,很難在教學上有新的突破。隨著體育科研研究問題的不斷深入,研究水平不斷提高,原有的統(tǒng)計學教學如果還局限在原有的教學內(nèi)容上,將不能滿足學生進行科學研究的需要,不能滿足體育人才的培養(yǎng)要求。如多因素統(tǒng)計分析方法應用的增多、獲取數(shù)據(jù)的增加、研究方法的擴展等,目前體育研究中已經(jīng)廣泛使用數(shù)據(jù)挖掘、結構方程模型、層次分析法、投入產(chǎn)出等。數(shù)據(jù)分析工具的增加,使得統(tǒng)計學教師不能只局限于某一個統(tǒng)計軟件的掌握上,其不但要學習新的統(tǒng)計分析方法,還要學習更多的統(tǒng)計分析工具,從而了解統(tǒng)計學新的發(fā)展方向和動態(tài),否則將難以提高統(tǒng)計學的教學水平,影響培養(yǎng)學生分析和使用大數(shù)據(jù)的能力。
第四,大數(shù)據(jù)背景下,體育院校借助統(tǒng)計學研究問題時不單單只是涉及統(tǒng)計學方法及使用專門的統(tǒng)計學軟件,還會涉及計算機科學和技術,因此研究問題時非常需要掌握交叉學科技能的人才。要培養(yǎng)這種交叉型的人才,作為教師首先要掌握相關的知識和技能,才能在教學內(nèi)容、教學形式、教學方式上不斷進行探索。但是目前既掌握統(tǒng)計學又掌握計算機科學的交叉型教師寥寥無幾,統(tǒng)計教學新模式的探索則會受到限制。
第一,大數(shù)據(jù)的特征使得在數(shù)據(jù)的收集、整理和分析上與傳統(tǒng)統(tǒng)計學中的數(shù)據(jù)概念、數(shù)據(jù)收集、數(shù)據(jù)整理和數(shù)據(jù)分析有一定的差別。教師可以固守原有的統(tǒng)計學內(nèi)容進行教學,不去理會大數(shù)據(jù)帶來的新的知識和觀念的更新,但是必須正視現(xiàn)實,面對挑戰(zhàn),應主動學習和了解大數(shù)據(jù)的定義、特征及其應用。一方面,對于基礎統(tǒng)計學的內(nèi)容,由于計算機科學和技術的不斷發(fā)展,計算的操作性越來越簡單、直觀。對于調(diào)查數(shù)據(jù)的收集,由于互聯(lián)網(wǎng)的出現(xiàn),現(xiàn)在人們普遍使用問卷星等工具進行問卷的收集,調(diào)查樣本遠比以往更加容易獲取。另一方面,因為計算機科學和技術的提高,互聯(lián)網(wǎng)的廣泛使用,為獲取更多的數(shù)據(jù)提供了可能,但是在獲取更多的數(shù)據(jù)時,有些數(shù)據(jù)不一定有用,部分數(shù)據(jù)會為分析研究帶來干擾,因此這就需要研究者更加清楚研究方法的選擇和研究方法的條件是否滿足。如何將以往的統(tǒng)計學內(nèi)容和當今對統(tǒng)計學新的需求結合起來,是今后統(tǒng)計學教學中需要考慮和研究的方向。
第二,當前,盡管統(tǒng)計學的概率論思想和方法不會發(fā)生改變,體育領域研究的諸多問題仍是隨機現(xiàn)象,還需使用數(shù)理統(tǒng)計方法研究體育中的問題,但是大數(shù)據(jù)時代對統(tǒng)計學的思維還是提出了挑戰(zhàn)。以往,統(tǒng)計學更多地應用于樣本推斷總體的方法,更多地討論差異性,進行推斷統(tǒng)計和研究分析因果關系,建立統(tǒng)計模型。但是大數(shù)據(jù)時代,可能需要更多地關注相關關系,進行聚類分析,更多地使用圖表分析,改變思維方式,這對統(tǒng)計學的固有研究范式和價值理念帶來一定的沖擊,而且促使統(tǒng)計學面臨在知識結構、教育內(nèi)容、教育模式和人才培養(yǎng)模式等方面的諸多挑戰(zhàn)。統(tǒng)計學教師必須重建統(tǒng)計學教學的知識結構,學習最新和最常用的數(shù)據(jù)分析工具,充實和調(diào)整自己的知識庫。
第三,伴隨著大數(shù)據(jù)時代到來,體育院校的科學研究除了借用統(tǒng)計學方法外,人工智能和互聯(lián)網(wǎng)、物聯(lián)網(wǎng)的應用,對統(tǒng)計學的教學也提出了新的挑戰(zhàn)。統(tǒng)計學教師需要了解和掌握相關學科知識。為了人才培養(yǎng)的需要,將更需要具備計算機知識、專業(yè)知識和統(tǒng)計學知識的復合型人才。大數(shù)據(jù)的熱潮,催生了一門新的學科,即數(shù)據(jù)科學。數(shù)據(jù)科學正處于發(fā)展初期,是一門不斷發(fā)展的學科。數(shù)據(jù)科學的核心涉及用自動化的方法來分析海量數(shù)據(jù),并從中提取知識。數(shù)據(jù)科學是一門橫跨信息科學、網(wǎng)絡科學、經(jīng)濟學等諸多領域的新興交叉學科,依然處于發(fā)展初期[2]。這就為統(tǒng)計學教師提供了新的機遇,也面臨了新的挑戰(zhàn)。
第四,大數(shù)據(jù)時代,計算機科學和技術的提高,各種相關的統(tǒng)計分析軟件使用越來越普及,版本升級也越來越快,研究中需要展示的統(tǒng)計表和統(tǒng)計圖制作得也越來越美觀,這就要求教學上要及時進行內(nèi)容的補充。一方面,教師要堅守以統(tǒng)計學的基本理論進行教學;另一方面,要不斷更新自己的知識庫,除了掌握專門的統(tǒng)計學軟件,還要補充學習和了解其他的相關軟件,如現(xiàn)在市場上廣泛流行的Python語言,功能更強大,使用更廣泛,這為統(tǒng)計學教師的教學提出了新的拓展方向。
第一,為彌補教學時數(shù)的不足,鼓勵教師豐富多媒體教學課件,如錄制視頻課程,豐富教學資源。借助互聯(lián)網(wǎng)技術,利用不同的學習平臺,讓學生通過多種途徑進行統(tǒng)計學的學習和實踐,做到課上、課下學習相結合。
第二,進行分層教學,針對不同學生講授不同統(tǒng)計軟件的學習和使用。如在研究生的教學中,除了學習原有的SPSS統(tǒng)計學軟件,還可以引導他們學習R軟件,為學生介紹大數(shù)據(jù)的相關知識,豐富并擴展統(tǒng)計學內(nèi)容。而對于本科學生,可以根據(jù)專業(yè)不同,選擇不同的統(tǒng)計軟件進行教學。如運動人體科學、運動康復、公共事業(yè)管理、體育經(jīng)濟與管理、新聞專業(yè)的學生可以學習SPSS統(tǒng)計分析軟件。
第三,學科之間資源的組合,探索研究問題,在實踐中積累數(shù)據(jù)資料,為教學和科研積累資源。如統(tǒng)計學與人體測量學、計算機科學相結合,探討體質測試中數(shù)據(jù)的分析和研究;統(tǒng)計學與運動訓練、生物力學、運動體能相結合,進行科學訓練方法的研究與探索。在研究生培養(yǎng)方案中,也可以與其他學科相結合,開設數(shù)據(jù)分析研究方向,或許數(shù)據(jù)科學將成為今后的專業(yè)選擇。體育院??梢韵仍O置數(shù)據(jù)分析研究方向,開設培養(yǎng)復合型的研究人才的相關課程,如統(tǒng)計分析與SPSS、數(shù)據(jù)庫、信息管理系統(tǒng)、R軟件,為體育領域培養(yǎng)數(shù)據(jù)科學的人才,組建復合型的教學團隊。
統(tǒng)計學教學一直面臨教學時數(shù)少、教學難度大的情況。大數(shù)據(jù)時代,體育院校統(tǒng)計學教學面臨的困難更多。統(tǒng)計學教師應轉變觀念,迎難而上,不斷儲備專業(yè)知識,學習和掌握新的數(shù)據(jù)分析工具。統(tǒng)計學教學需要不斷進行創(chuàng)新與發(fā)展,不僅要在教學方法和教學手段上不斷進行創(chuàng)新,還要與其他學科相融合,組建復合型的教學團隊。建議在研究生培養(yǎng)上開設體育數(shù)據(jù)分析方向,為今后開設體育數(shù)據(jù)科學專業(yè)做準備。體育院校的統(tǒng)計學教師需要不斷了解和研究統(tǒng)計學的應用領域,學習大數(shù)據(jù)時代新的統(tǒng)計方法。機遇與挑戰(zhàn)并存,唯有不斷學習進取。