遼寧省盤(pán)錦實(shí)驗(yàn)中學(xué)遼東灣分校 趙盼盼
概率論與數(shù)理統(tǒng)計(jì)是研究和解釋隨機(jī)現(xiàn)象統(tǒng)計(jì)規(guī)律性的一門(mén)數(shù)學(xué)學(xué)科,作為理工科學(xué)生必修課程之一,它是一門(mén)將理論和實(shí)際聯(lián)系在一起的學(xué)科,有著很強(qiáng)的理論性和應(yīng)用性。在過(guò)去半個(gè)世紀(jì)中,概率論逐漸發(fā)展成為一個(gè)與數(shù)學(xué)很多其他分支相互影響的學(xué)科。概率統(tǒng)計(jì)廣泛應(yīng)用于社會(huì)、經(jīng)濟(jì)、管理等各個(gè)領(lǐng)域。隨著教學(xué)手段的日益更新,基于此門(mén)課程理論與實(shí)踐并重的特點(diǎn),我們可以利用更多的工具解決學(xué)習(xí)和教學(xué)中遇到的問(wèn)題。數(shù)學(xué)軟件能用來(lái)輔助教學(xué),展現(xiàn)數(shù)學(xué)的思想和方法,提高教學(xué)效率。目前應(yīng)用較多的軟件有Excel,Matlab, Mathematica,Maple,SAS等,雖然它們的運(yùn)算功能十分強(qiáng)大,但基本都是商業(yè)軟件,價(jià)格昂貴。而R語(yǔ)言是免費(fèi)軟件,且統(tǒng)計(jì)功能強(qiáng)大,十分適合輔助教學(xué)。
R軟件是一個(gè)開(kāi)放的統(tǒng)計(jì)編程環(huán)境,是S語(yǔ)言的一種實(shí)現(xiàn)。R軟件是由Auckland 大學(xué)的 Robert Gentleman 和 Ross Ihaka 及其他志愿人員開(kāi)發(fā)的,目前由R核心開(kāi)發(fā)小組維護(hù)。
R不僅是一個(gè)完全免費(fèi)的統(tǒng)計(jì)軟件,而且還具有強(qiáng)大的數(shù)據(jù)分析功能,能提供數(shù)據(jù)分處理、統(tǒng)計(jì)分析、圖形顯示工具。利用R軟件的內(nèi)嵌統(tǒng)計(jì)函數(shù),可以很容易地學(xué)習(xí)和掌握R軟件的語(yǔ)法,還可以編制自己的函數(shù)來(lái)擴(kuò)展現(xiàn)在的R語(yǔ)言。
目前R語(yǔ)言在國(guó)外生物統(tǒng)計(jì)、醫(yī)藥統(tǒng)計(jì)等統(tǒng)計(jì)領(lǐng)域和科研領(lǐng)域中得到了廣泛應(yīng)用,近年來(lái)在我國(guó),R語(yǔ)言已受到越來(lái)越多的學(xué)者的關(guān)注和學(xué)習(xí)。
例:設(shè)隨機(jī)變量的分布列如下所示:
求E(X),D(X)。
在R中輸入如下命令:
> X<-c(-2,0,2)
> p<-c(0.4,0.3,0.3)
> X<-c(-2,0,2)
> p<-c(0.4,0.3,0.3)
> mean<-sum(X*p) #計(jì)算期望
> Y<-X^2
> Z<-sum(Y*p)
> sd<-Z-mean^2;mean;sd #計(jì)算方差,輸出期望和方差的值
總體是由總體分布來(lái)刻畫(huà)的。在實(shí)際問(wèn)題中,我們根據(jù)問(wèn)題本身的專業(yè)知識(shí)或以往的經(jīng)驗(yàn)或用適當(dāng)?shù)慕y(tǒng)計(jì)方法,有時(shí)可以判斷總體分布的類型,但是總體分布的參數(shù)還是未知的,需要通過(guò)樣本來(lái)估計(jì)。
下面是用R語(yǔ)言估計(jì)參數(shù)的例子:有一大批糖果,現(xiàn)從中隨機(jī)取16袋,稱得重量(以g 計(jì))如下:
設(shè)袋裝糖果的重量近似服從正態(tài)分布,試求總體均值的置信水平為0.95的置信區(qū)間。
分析:這里 1-α=0.95,α/2=0.025,n-1=15,t0.025(15)=2.1315,由給出數(shù)據(jù)算得未知時(shí)的置信水平為的置信區(qū)間代入數(shù)據(jù)得的置信水平為的置信區(qū)間為
而利用R語(yǔ)言只需要輸入命令:
> x<-c(506,509,500,501,506,509,495,514,519,501,494,497,507,499,511,495)
> t.test(x)
回車(chē)得結(jié)果,如下:
在數(shù)理統(tǒng)計(jì)分析中,由估計(jì)量估計(jì)總體的參數(shù)可以獲得總體參數(shù)的無(wú)偏估計(jì),但總體參數(shù)始終是不可知的。我們?cè)诮y(tǒng)計(jì)推斷過(guò)程中,需要對(duì)參數(shù)提出一定的假設(shè),然后對(duì)提出的假設(shè)進(jìn)行假設(shè)檢驗(yàn),由統(tǒng)計(jì)量推斷總體的參數(shù)。
下面是一個(gè)t-檢驗(yàn)的例子:
下面列出的是某工廠隨機(jī)選取的20只部件的裝配時(shí)間(min):
分析:這是一個(gè)關(guān)于均值的檢驗(yàn)問(wèn)題??梢蕴岢鋈缦录僭O(shè):
因?yàn)榭傮w方差未知,故采用t-檢驗(yàn)方法。檢驗(yàn)統(tǒng)計(jì)量為:
利用R語(yǔ)言只需要輸入命令:
> X<-c(9.8,10.4,10.6,9.6,9.7,9.9,10.9,11.1,9.6,10.2,10.3,9.6,9.9,11.2,10.6,9.8,10.5,10.1,10.5,9.7)
> t.test(X,alternative="greater",mu=10)
運(yùn)行后結(jié)果如下:
R在檢驗(yàn)的同時(shí)還給出了區(qū)間估計(jì)。另外,在t-檢驗(yàn)的命令中,參數(shù)alternative 反映了備擇假設(shè)的情況,其取值可以是“two.sided”“l(fā)ess”“greater”。two.sided (默認(rèn)) 表示雙邊檢驗(yàn)less表示單邊檢驗(yàn)greater表示單邊檢驗(yàn)
通過(guò)本文的介紹,讀者對(duì)R語(yǔ)言在概率統(tǒng)計(jì)中的應(yīng)用有了初步的認(rèn)識(shí)和了解,同時(shí)也可以看到R的語(yǔ)法簡(jiǎn)單,程序可讀性強(qiáng)。本文敘述的只是R語(yǔ)言的一小部分內(nèi)容,讀者可以通過(guò)查看相關(guān)資料進(jìn)一步掌握R語(yǔ)言。由于R語(yǔ)言是一個(gè)自由、免費(fèi)的軟件,非常適用于教學(xué)、科研以及統(tǒng)計(jì)分析。目前,利用和掌握好R語(yǔ)言對(duì)我國(guó)統(tǒng)計(jì)事業(yè)的發(fā)展有著很大的推動(dòng)作用。
【參考文獻(xiàn)】
[1]盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社,2008.
[2]林正炎.概率統(tǒng)計(jì)課程改革的若干建議[J].高等教育研究,2001(1):6-7.
[3]林彤. EXCEL在概率論與數(shù)理統(tǒng)計(jì)中的應(yīng)用[J].東北電力大學(xué)學(xué)報(bào),2013,33(6):52-55.
[4]鄧安生.淺談MATLAB在概率統(tǒng)計(jì)教學(xué)中的應(yīng)用[J].新余高專學(xué)報(bào),2009, 14(2):87-89.
[5]薛毅,陳立萍.統(tǒng)計(jì)建模與R軟件[M].北京:清華大學(xué)出版社,2007.
[6]葉文春.淺談R語(yǔ)言在統(tǒng)計(jì)學(xué)中的應(yīng)用[J].中共貴州省委黨校學(xué)報(bào),2008(4):123-125.