周曉東 王云娟
[摘 要]大數(shù)據(jù)背景下,統(tǒng)計(jì)軟件越發(fā)重要。統(tǒng)計(jì)軟件對(duì)統(tǒng)計(jì)學(xué)教學(xué)有著重要的支撐作用。統(tǒng)計(jì)軟件的適度應(yīng)用有利于增強(qiáng)學(xué)生對(duì)統(tǒng)計(jì)概念、理論和方法的理解和掌握,培養(yǎng)學(xué)生的編程思維,提升學(xué)生解決實(shí)際問題的能力,掌握學(xué)科交叉知識(shí)。
[關(guān)鍵詞]統(tǒng)計(jì)軟件;統(tǒng)計(jì)教學(xué);R語言
[中圖分類號(hào)] G642.0 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 2095-3437(2018)07-0045-04
統(tǒng)計(jì)學(xué)作于一種處理不確定性現(xiàn)象的重要定量分析工具,被廣泛應(yīng)用于社會(huì)、經(jīng)濟(jì)、工程等各個(gè)領(lǐng)域。會(huì)處理數(shù)據(jù),利用數(shù)據(jù)和統(tǒng)計(jì)方法進(jìn)行統(tǒng)計(jì)推斷已經(jīng)成為現(xiàn)代大學(xué)生的一種重要素養(yǎng)。鑒于此,統(tǒng)計(jì)學(xué)已成為眾多專業(yè)的必修課程。然而已有的教學(xué)經(jīng)歷和文獻(xiàn)研究發(fā)現(xiàn)由于學(xué)生專業(yè)背景、學(xué)習(xí)能力等不同,多數(shù)學(xué)生的統(tǒng)計(jì)學(xué)習(xí)都存在一定程度的困難。同時(shí)由于新的數(shù)據(jù)形式不斷出現(xiàn)[1]、新的數(shù)據(jù)分析技術(shù)以及互聯(lián)網(wǎng)技術(shù)的發(fā)展,在促進(jìn)統(tǒng)計(jì)學(xué)學(xué)科發(fā)展的同時(shí),也對(duì)統(tǒng)計(jì)學(xué)教學(xué)提出了挑戰(zhàn),使得統(tǒng)計(jì)教學(xué)的內(nèi)容、教學(xué)方法以及統(tǒng)計(jì)學(xué)習(xí)方法都產(chǎn)生了較大的變化[2]。文獻(xiàn)[2]~[7]分別對(duì)當(dāng)今統(tǒng)計(jì)教學(xué)中所面臨的問題、技術(shù)創(chuàng)新、教學(xué)改革等進(jìn)行了總結(jié)和有益的探討。盡管如此,由于我國統(tǒng)計(jì)學(xué)學(xué)科建立比較晚,長期以來統(tǒng)計(jì)教育工作者存在對(duì)統(tǒng)計(jì)軟件在統(tǒng)計(jì)教學(xué)應(yīng)用中的重視程度不夠,或者雖有應(yīng)用,但程度不深或方法不對(duì),或心有余而力不足[8]。本文我們對(duì)統(tǒng)計(jì)軟件對(duì)統(tǒng)計(jì)教學(xué)支撐做了初步的探討,同時(shí)給出一些應(yīng)用實(shí)例和應(yīng)用建議。
一、統(tǒng)計(jì)軟件的選擇
目前市場上有多種軟件能用于統(tǒng)計(jì)分析,如SPSS、Stata、SAS、Statistica、S-plus、Minitab、R語言。除此外Excel也常被用于統(tǒng)計(jì)學(xué)教學(xué)。 不同的軟件都有著自身的優(yōu)勢和劣勢。很多文獻(xiàn)都對(duì)此作了有關(guān)的探討。統(tǒng)計(jì)軟件的選擇往往需要根據(jù)具體的教學(xué)環(huán)境來定,如軟件的使用費(fèi)用、軟件獲取的便利度、學(xué)生的專業(yè)背景和學(xué)習(xí)能力、教學(xué)目的等。商業(yè)統(tǒng)計(jì)軟件如SAS、SPSS、S-plus等雖然普及度高,為大的企事業(yè)單位、科研機(jī)構(gòu)、商業(yè)領(lǐng)域人員所熟知,但使用成本高昂,非普通學(xué)生所能承受。因此從學(xué)生角度來考慮,希望軟件的選擇 (1)有利于學(xué)生在課后也能應(yīng)用,而不只是在學(xué)校實(shí)驗(yàn)室,(2)與企業(yè)應(yīng)用相匹配,學(xué)生掌握后,方便就業(yè),(3)確保學(xué)生學(xué)習(xí)軟件的時(shí)間不長,(4)易于獲得豐富的幫助文檔,(5)統(tǒng)計(jì)分析方法全面,(6)適用于各種操作系統(tǒng)。在前面我們羅列的統(tǒng)計(jì)軟件中,唯一滿足這些要求的就是R軟件。
R軟件由新西蘭奧克蘭大學(xué)Ross Ihaka和Robert Gentleman創(chuàng)建,目前由R語言開發(fā)核心團(tuán)隊(duì)開發(fā)。R統(tǒng)計(jì)軟件由于其開源、免 費(fèi)、高效的特點(diǎn)廣為數(shù)據(jù)分析者所推崇。R軟件的優(yōu)點(diǎn):(1)相對(duì)于商業(yè)軟件如SPSS、SAS等,R是免費(fèi)的;(2)適用于多種系統(tǒng),如Windows、MacOS、GNU/Linux 及Unix;(3)有著豐富的幫助文檔;(4)廣泛應(yīng)用于多個(gè)領(lǐng)域,如基礎(chǔ)統(tǒng)計(jì)學(xué)、社會(huì)學(xué)、經(jīng)濟(jì)管理、金融、空間統(tǒng)計(jì)、生物制藥;有不同領(lǐng)域的使用者同時(shí)也是開發(fā)者提供基于領(lǐng)域的數(shù)據(jù)和方法;(5)R是一種編程語言,允許使用者根據(jù)自身需求,按照統(tǒng)計(jì)方法編寫分析程序;(6)R使用者針對(duì)不同需求開發(fā)了不同的包,到2018年1月15日CRAN上收錄了12097個(gè)各種不同的統(tǒng)計(jì)分析包。選擇利用R軟件作為統(tǒng)計(jì)教學(xué)輔助統(tǒng)計(jì)軟件可以滿足前述的學(xué)生對(duì)統(tǒng)計(jì)軟件多種需求。 利用R軟件強(qiáng)大的數(shù)據(jù)可視化能力,豐富的統(tǒng)計(jì)軟件包以及強(qiáng)大的統(tǒng)計(jì)編程能力輔助非統(tǒng)計(jì)學(xué)專業(yè)統(tǒng)計(jì)學(xué)教學(xué)可以使得統(tǒng)計(jì)學(xué)教學(xué)易于從傳統(tǒng)的強(qiáng)調(diào)統(tǒng)計(jì)的數(shù)學(xué)因素(計(jì)算、公式、推導(dǎo))轉(zhuǎn)向注重培養(yǎng)學(xué)生的統(tǒng)計(jì)素養(yǎng)、統(tǒng)計(jì)推理以及對(duì)統(tǒng)計(jì)結(jié)果的解釋、評(píng)價(jià)等。 利用R軟件輔助統(tǒng)計(jì)專業(yè)課教學(xué),有利于做好不同專業(yè)課程之間的切割,如《統(tǒng)計(jì)軟件SAS》,增強(qiáng)教學(xué)的吸引力。同時(shí)拓展學(xué)生的知識(shí)面,達(dá)到一專多能。
盡管上述優(yōu)點(diǎn),但R是一門編程語言,對(duì)于部分學(xué)生來說,學(xué)習(xí)有困難,尤其是對(duì)非統(tǒng)計(jì)專業(yè)的學(xué)生。為解決上述問題,R包開發(fā)者開發(fā)了一些友好的交互界面,如R Commander,RStudio等。R Commander(Rcmdr包)是基于R的圖形化交互式界面。優(yōu)點(diǎn)是無需用戶記住各個(gè)命令的名字和函數(shù)的參數(shù)等。只需要通過對(duì)話框,采用鼠標(biāo)點(diǎn)擊按鈕進(jìn)行操作,這對(duì)于R初級(jí)使用者特別有吸引力,也有利于教師使用R進(jìn)行教學(xué)。RStudio是一種R語言的集成開發(fā)環(huán)境(IDE),其亮點(diǎn)是出色的界面設(shè)計(jì)及編程輔助工具。它可以在多種平臺(tái)上運(yùn)行,包括windows,Mac,以及網(wǎng)頁版。與R軟件一樣,其也是免費(fèi)和開源的。
二、利用統(tǒng)計(jì)軟件輔助統(tǒng)計(jì)教學(xué)
鑒于R統(tǒng)計(jì)軟件的優(yōu)點(diǎn),本節(jié)我們介紹統(tǒng)計(jì)軟件輔助統(tǒng)計(jì)教學(xué)的具體實(shí)踐。利用統(tǒng)計(jì)軟件(如R)輔助統(tǒng)計(jì)教學(xué)可以做到以下幾點(diǎn):
(一)減輕計(jì)算負(fù)擔(dān)
統(tǒng)計(jì)學(xué)基礎(chǔ)課程中往往涉及到基礎(chǔ)統(tǒng)計(jì)量的計(jì)算,如樣本數(shù)據(jù)的方差、估計(jì)區(qū)間、檢驗(yàn)統(tǒng)計(jì)量、回歸系數(shù)等,還有包括分位數(shù)的查找。教學(xué)過程中需要花一定時(shí)間解釋這些量的計(jì)算。統(tǒng)計(jì)軟件應(yīng)用可以幫助老師和學(xué)生從這些計(jì)算的煩惱中解脫出來,比如統(tǒng)計(jì)分布的分位數(shù)、累積概率的計(jì)算等R中有系列函數(shù)可以輕松完成這些工作,從而讓學(xué)生專注統(tǒng)計(jì)思想和方法的理解和應(yīng)用。
(二)提供豐富的數(shù)據(jù)探索分析工具
統(tǒng)計(jì)軟件的應(yīng)用,尤其是R統(tǒng)計(jì)軟件中的各種統(tǒng)計(jì)分析包,豐富了學(xué)生利用統(tǒng)計(jì)軟件對(duì)數(shù)據(jù)進(jìn)行探索性分析的工具,提升學(xué)生直觀認(rèn)識(shí)數(shù)據(jù)的能力。例1給出了美國黃石公園老實(shí)泉數(shù)據(jù)探索分析結(jié)果。通過滑動(dòng)圖中的滑動(dòng)按鈕,可以清楚看到不同分組數(shù)對(duì)直方圖的影響,另外通過點(diǎn)擊圖中下拉按鈕,可以選擇不同的擬合分布,選擇與直方圖最吻合的理論分布。
例1:直方圖及分布擬合
library(mosaic) if(require(manipulate)){ manipulate(histogram( ~waiting,data=faithful,n=n,fit=distribution,dlwd=4),n = slider(5,40),distribution= picker(‘normal,‘gamma,‘exponential,‘lognormal,label=“distribution”))}
通過鼓勵(lì)學(xué)生對(duì)數(shù)據(jù)進(jìn)行探索可以促使學(xué)生對(duì)數(shù)據(jù)做深層次的思考,了解數(shù)據(jù)背后的故事,為統(tǒng)計(jì)概念引出和進(jìn)一步統(tǒng)計(jì)分析奠定基礎(chǔ)。
(三)抽象概念直觀化
由于統(tǒng)計(jì)軟件在計(jì)算和數(shù)據(jù)可視化上功能強(qiáng)大,基本即時(shí)可以得到想要的分析結(jié)果。因此應(yīng)用統(tǒng)計(jì)軟件輔助統(tǒng)計(jì)教學(xué),我們很容易通過更改各種統(tǒng)計(jì)方法條件,考察條件對(duì)統(tǒng)計(jì)結(jié)果的影響,使得理論與直觀更好地結(jié)合起來。比如在回歸分析中講解異常點(diǎn)對(duì)回歸分析結(jié)果影響時(shí),我們可以通過針對(duì)有異常點(diǎn)的數(shù)據(jù)和不含異常點(diǎn)數(shù)據(jù)的統(tǒng)計(jì)分析結(jié)果和回歸分析結(jié)果的圖示,讓學(xué)生充分理解考慮異常點(diǎn)的重要性。作為統(tǒng)計(jì)教學(xué)和研究的一個(gè)重要手段——統(tǒng)計(jì)模擬常被用來解釋統(tǒng)計(jì)分析中一些比較抽象的概念,如抽樣分布和置信區(qū)間。與理論結(jié)果形成互補(bǔ),更好地讓學(xué)生領(lǐng)悟這些概念和方法的本質(zhì)。例2我們利用R軟件包TeachingDemos里的函數(shù)clt.examp解釋總體分布、樣本容量對(duì)樣本均值分布的影響,從而導(dǎo)出抽樣分布中重要的定理——中心極限定理。例3我們利用統(tǒng)計(jì)軟件R包animation 中的conf.int函數(shù),或者包TeachingDemos包中的函數(shù)ci.examp演示置信區(qū)間的構(gòu)造,說明置信水平與真實(shí)覆蓋率的關(guān)系。
例2:中心極限定理
library(TeachingDemos)
clt.examp(n=1)#圖2
clt.examp(n=5)#圖3
clt.examp(n=30)#圖4
例3:置信區(qū)間
library(animation)#文獻(xiàn)[9]
conf.int( )
# 或者
library(TeachingDemos)
ci.examp(method=“t”)#圖5
(四)培養(yǎng)學(xué)生的編程思維
編程思維是計(jì)算機(jī)科學(xué)解決問題的一種強(qiáng)有力的思維方式。統(tǒng)計(jì)學(xué)方法是以解決問題為導(dǎo)向。雖然在統(tǒng)計(jì)軟件中有很多的現(xiàn)成的程序,幫助學(xué)生解決問題,但實(shí)際上最好的教學(xué)方式是讓學(xué)生在理解好統(tǒng)計(jì)概念之后,自己編寫程序解決問題。學(xué)生通過自己編寫程序來深化和檢查自己對(duì)概念的理解。例如,編寫計(jì)算最小二乘擬 合、殘差和判定系數(shù)的函數(shù),編寫和測試這些代碼需要他們正確理解相關(guān)概念,消除各 種可能的誤解。R軟件作為一種編程語言,可以勝任學(xué)生在學(xué)好統(tǒng)計(jì)學(xué)的同時(shí),培養(yǎng)學(xué)生的編程能力。
(五)對(duì)案例教學(xué)、項(xiàng)目教學(xué)法等形成有效的支撐
案例教學(xué)、項(xiàng)目教學(xué)法的優(yōu)點(diǎn)[10],包含:(1)讓學(xué)生認(rèn)識(shí)到統(tǒng)計(jì)方法在解決現(xiàn)實(shí)問題中的適用性和重要性;(2)讓學(xué)生對(duì)來源于實(shí)際問題的案例統(tǒng)計(jì)分析會(huì)產(chǎn)生更為濃厚的興趣;(3)學(xué)生對(duì)案例中感興趣的問題參與度更強(qiáng)。統(tǒng)計(jì)軟件的應(yīng)用可利于達(dá)到案例教學(xué)法、項(xiàng)目教學(xué)法想要達(dá)到的效果。
三、應(yīng)用統(tǒng)計(jì)軟件輔助統(tǒng)計(jì)教學(xué)需要注意的幾個(gè)問題
(一)處理好統(tǒng)計(jì)軟件與統(tǒng)計(jì)學(xué)教學(xué)的關(guān)系
統(tǒng)計(jì)軟件在統(tǒng)計(jì)專業(yè)課程教學(xué)中只是起到輔助的作用,而不是替代統(tǒng)計(jì)思想和方法的教學(xué),因此課程教學(xué)中一定要明確統(tǒng)計(jì)課程的教學(xué)目標(biāo)。讓統(tǒng)計(jì)軟件的使用服務(wù)于統(tǒng)計(jì)課程教學(xué)的目標(biāo),切不可喧賓奪主。需要設(shè)計(jì)好統(tǒng)計(jì)軟件在統(tǒng)計(jì)課程的教學(xué)環(huán)境,以及統(tǒng)計(jì)軟件的使用程度。教學(xué)過程中不當(dāng)?shù)厥褂媒y(tǒng)計(jì)軟件或?qū)y(tǒng)計(jì)軟件的過度講解不但不能提升教學(xué)效果,反而會(huì)產(chǎn)生負(fù)作用,增加學(xué)生對(duì)統(tǒng)計(jì)學(xué)習(xí)的焦慮,產(chǎn)生厭學(xué)情緒。 在應(yīng)用統(tǒng)計(jì)軟件進(jìn)行統(tǒng)計(jì)學(xué)公共課教學(xué)時(shí),應(yīng)該充分考慮不同專業(yè)背景學(xué)生對(duì)統(tǒng)計(jì)軟件的接受度。對(duì)偏文的專業(yè),重在演示,讓學(xué)生理解統(tǒng)計(jì)思想,掌握統(tǒng)計(jì)方法;對(duì)偏理工的專業(yè),在注重統(tǒng)計(jì)思想的同時(shí),讓學(xué)生建立編程思維和編程實(shí)踐。
不同課程的教學(xué)目標(biāo)不同,因此在應(yīng)用統(tǒng)計(jì)軟件進(jìn)行教學(xué)的過程中,軟件的使用程度應(yīng)該有所差異。在統(tǒng)計(jì)基礎(chǔ)課程中 如統(tǒng)計(jì)學(xué)導(dǎo)論等注重統(tǒng)計(jì)思想的介紹。統(tǒng)計(jì)軟件使用的目的是為了更好地幫助學(xué)生理解和接受統(tǒng)計(jì)的思想。而在一些高級(jí)課程中,統(tǒng)計(jì)軟件的應(yīng)用重點(diǎn)在于讓學(xué)生掌握統(tǒng)計(jì)方法,應(yīng)用統(tǒng)計(jì)方法解決實(shí)際數(shù)據(jù)分析。
(二)避免對(duì)統(tǒng)計(jì)軟件的不當(dāng)應(yīng)用
使用統(tǒng)計(jì)軟件輔助統(tǒng)計(jì)教學(xué)的一個(gè)優(yōu)點(diǎn)是可以很容易完成許多復(fù)雜的統(tǒng)計(jì)分析,但也容易造成學(xué)生對(duì)統(tǒng)計(jì)軟件的過度依賴,同時(shí)減少了學(xué)生對(duì)相應(yīng)統(tǒng)計(jì)方法的理解,從而導(dǎo)致對(duì)統(tǒng)計(jì)方法的不當(dāng)使用。因此統(tǒng)計(jì)學(xué)教學(xué)中需要處理好統(tǒng)計(jì)軟件在統(tǒng)計(jì)教學(xué)中的使用深度和方式。重視學(xué)生對(duì)統(tǒng)計(jì)軟件分析結(jié)果的判斷和解釋,讓學(xué)生在對(duì)數(shù)據(jù)的探索和對(duì)統(tǒng)計(jì)分析結(jié)果的解釋中真正透徹地掌握所學(xué)統(tǒng)計(jì)方法。
(三)注重統(tǒng)計(jì)教學(xué)內(nèi)容、教育方法和統(tǒng)計(jì)教學(xué)軟件等教學(xué)輔助技術(shù)的有效融合
統(tǒng)計(jì)教學(xué)效果的提升是多種教學(xué)方法和教學(xué)技術(shù)共同作用后的結(jié)果。將統(tǒng)計(jì)軟件合理地與項(xiàng)目教學(xué)法、案例教學(xué)法、問題式教學(xué)方法、合作學(xué)習(xí)方法綜合使用,可以增強(qiáng)教學(xué)效果。反過來,這些教學(xué)方法和學(xué)習(xí)方法也能促使學(xué)生對(duì)統(tǒng)計(jì)軟件掌握的熟練程度,最終加深對(duì)統(tǒng)計(jì)方法的理解和應(yīng)用。
四、結(jié)語
統(tǒng)計(jì)學(xué)由于其學(xué)科特點(diǎn)及其獨(dú)特的思維使得學(xué)生在統(tǒng)計(jì)學(xué)習(xí)過程中存在各種困難,如何將統(tǒng)計(jì)的思想和方法傳輸給我們的學(xué)生需要統(tǒng)計(jì)教育工作者不斷地探索,任重而道遠(yuǎn)。國內(nèi)統(tǒng)計(jì)學(xué)教學(xué)雖取得了不俗的成績,但仍存在較大的提升空間,需要統(tǒng)計(jì)工作者不斷努力,需要做到統(tǒng)計(jì)科學(xué)研究和統(tǒng)計(jì)教育研究并舉。在做好基礎(chǔ)統(tǒng)計(jì)教育的同時(shí)不斷探索新的有效的教育方法。
文獻(xiàn)[11]在對(duì)已有統(tǒng)計(jì)教學(xué)研究的文獻(xiàn)進(jìn)行回顧的基礎(chǔ)上提出了統(tǒng)計(jì)學(xué)習(xí)的8條原則:(1)統(tǒng)計(jì)知識(shí)學(xué)習(xí)是一個(gè)知識(shí)建構(gòu)的過程;(2)有效的學(xué)習(xí)需要學(xué)生活動(dòng)的積極融入;(3)有效的學(xué)習(xí)需要不斷地實(shí)踐;(4)不能低估學(xué)生對(duì)概率和統(tǒng)計(jì)中基本概念理解上的困難程度;(5)不要高估學(xué)生對(duì)基本概念的掌握程度;(6)只有讓學(xué)生充分認(rèn)識(shí)其在推斷過程中理解上的錯(cuò)誤學(xué)習(xí)才能真正得到提高;(7)應(yīng)該充分利用各種工具幫助學(xué)生可視化數(shù)據(jù)以及探索性分析數(shù)據(jù);(8)學(xué)生在學(xué)習(xí)過程中如果能得到持續(xù)有效的反饋,學(xué)習(xí)效果將大幅提升。這8條原則對(duì)我們進(jìn)行統(tǒng)計(jì)教育教學(xué)研究和設(shè)計(jì)有著比較好的指導(dǎo)意義。兼顧統(tǒng)計(jì)軟件的特點(diǎn)和這些統(tǒng)計(jì)學(xué)習(xí)的原則,有助于我們更好地搞好統(tǒng)計(jì)教育教學(xué)工作。
[ 參 考 文 獻(xiàn) ]
[1] 徐國祥,李波. 大數(shù)據(jù)、云計(jì)算背景下的統(tǒng)計(jì)改革與創(chuàng)新[J]. 中國統(tǒng)計(jì),2016(6):4-7.
[2] Chance,Beth,Ben-Zvi,Dani,Garfield,Joan,Medina,Elsa. The Role of Technology in Improving Student Learning of Statistics[M]. Technology Innovations in Statistics Education. 2007.
[3] Tishkovskaya, Svetlana| Lancaster,Gillian A. Statistical Education in the 21st Century:A Review of Challenges,Teaching Innovations and Strategies for Reform.[J]. Journal of Statistics Education,2012,20(1):114-115.
[4] Larwin K,Larwin D. A Meta-Analysis Examining the Impact of Computer-Assisted Instruction on Postsecondary Statistics Education[J]. Journal of Research on Technology in Education,2011,43(3):253-278.
[5] 崔玉杰,劉喜波. R和Python軟件在《概率論與數(shù)理統(tǒng)計(jì)》教學(xué)中應(yīng)用初探[J]. 教育教學(xué)論壇,2017(12):192-193.
[6] 程勝. R統(tǒng)計(jì)軟件及其在《時(shí)間序列分析》實(shí)踐教學(xué)中的應(yīng)用[J]. 教育教學(xué)論壇,2014(41):173-175.
[7] DellOmodarme M,Valle G. Teaching statistics with Excel and R[J]. Physics,2006.
[8] 劉超,吳喜之. 統(tǒng)計(jì)教學(xué)面對(duì)的挑戰(zhàn)[J]. 統(tǒng)計(jì)研究,2012(2):105-108.
[9] Xie Y,Grün B,Pebesma E,et al. animation:An R Package for Creating Animations and Demonstrating Statistical Methods[J]. Journal of Statistical Software,2013,53(1):1-27.
[10] Lane D M,Scott D W. Simulations,case studies,and an online text:a web-based resource for teaching statistics[J]. Metrika,2000,51(1):67-90.
[11] Garfield J,Ben-Zvi D. How Students Learn Statistics Revisited:A Current Review of Research on Teaching and Learning Statistics[J]. International Statistical Review,2007,75(3):372–396.
[責(zé)任編輯:林志恒]