鄧世容 石躍勇
摘 要 本文以概率論與數(shù)理統(tǒng)計課程中的兩個典型問題(復(fù)雜難求概率的估計、非正態(tài) 總體的假設(shè)檢驗)為例,給出了基于蒙特卡洛方法的解答過程。并用統(tǒng)計模擬驗證了提出的方法的可行性及有效性。
關(guān)鍵詞 蒙特卡洛方法 概率 統(tǒng)計
中圖分類號:G424 文獻(xiàn)標(biāo)識碼:A DOI:10.16400/j.cnki.kjdks.2018.01.050
Applications of Monte Carlo Method in Teaching of
Probability and Mathematical Statistics
DENG Shirong[1], SHI Yueyong[2]
([1] School of Mathematics and Statistics, Wuhan University, Wuhan, Hubei 430072;
[2]School of Economics and Management, China University of Geosciences, Wuhan, Hubei 430074)
Abstract In this paper, the Monte Carlo Method for the two classical problems (probability estimation and hypothesis testing for non-normal population) in Probability and Mathematical Statistics is described. Simulations are developed to verify the feasibility and effectiveness of the proposed method.
Keywords Monte Carlo Method; probability; statistics
概率論與數(shù)理統(tǒng)計是一門主要研究隨機(jī)現(xiàn)象的統(tǒng)計規(guī)律性的學(xué)科,廣泛應(yīng)用于社會生活的各個學(xué)科中。[1]在其教學(xué)過程中,理論知識的講述是根本,同時也應(yīng)該引導(dǎo)學(xué)生學(xué)習(xí)運用理論知識分析實際應(yīng)用問題。在實際問題分析的過程中,利用統(tǒng)計軟件得到的數(shù)據(jù)、圖表的等可以幫助學(xué)生對問題有更全面直觀的理解,同時也可以培養(yǎng)學(xué)生的學(xué)習(xí)興趣與實踐經(jīng)驗。因此,在課程引入統(tǒng)計軟件的簡單運用是必要的,并且會是對概率論與數(shù)理統(tǒng)計教學(xué)的一大改進(jìn)。
R軟件是一種完全免費共享的統(tǒng)計軟件(http://www.r-project.org),它提供了豐富的統(tǒng)計軟件包,可以非常方便靈活地分析數(shù)據(jù),深受統(tǒng)計學(xué)家們的喜愛。 [2]R在Windows、Mac、Linux系統(tǒng)下都可以安裝使用,并且掌握起來很容易,學(xué)生在概率統(tǒng)計課程中學(xué)習(xí)使用R軟件,有助于更好地理解理論問題,提高學(xué)習(xí)興趣。
蒙特卡洛方法,也稱為統(tǒng)計模擬方法,是二十世紀(jì)四十年代中期由于電子計算機(jī)的發(fā)明及科學(xué)技術(shù)的發(fā)展,而被提出的一種以概率統(tǒng)計理論為指導(dǎo)非常重要的數(shù)值計算方法。蒙特卡洛方法通過構(gòu)造符合一定規(guī)則的隨機(jī)數(shù)來解決數(shù)學(xué)上的各種問題。當(dāng)所求解問題是某種隨機(jī)事件出現(xiàn)的概率或者是某個隨機(jī)變量的期望值時,蒙特卡洛方法通過隨機(jī)模擬的方法用這個事件出現(xiàn)的頻率估計這一隨機(jī)事件的概率,或者得到這個隨機(jī)變量的某些數(shù)字特征,并將其作為問題的解。
在概率論與數(shù)理統(tǒng)計的傳統(tǒng)教學(xué)中,一般并未討論下面的兩類問題。一類是要計算的概率涉及到不能用初等函數(shù)表示出來的積分時,所求概率最終是求不出來的;另一類是非正態(tài)總體的假設(shè)檢驗問題,難點在于在非正態(tài)總體下檢驗統(tǒng)計量的分布不好確定。針對這兩類實際應(yīng)用中會存在的這兩類問題,我們提出了用蒙特卡洛方法來解答,并通過模擬驗證了我們提出方法的可行性及合理性。為這兩類問題給出了簡單直觀的解答方式,為概率論與數(shù)理統(tǒng)計的教學(xué)提供了更為豐富的資料。
1 概率的估計
例1 考慮(0,1)區(qū)間上均勻分布且獨立的隨機(jī)變量和,求概率。
解:本題的求解的常規(guī)方法就是求二重積分,但是無法用初等函數(shù)表示出來,[3] 因此寫不出具體的結(jié)果。下面我們給出蒙特卡洛方法的具體過程:
1)隨機(jī)生成個隨機(jī)點,即和是(0,1)上均勻分布的隨機(jī)數(shù);
2)計算個點中滿足條件的點的個數(shù),記為;
3)當(dāng),所求概率近似等于頻率。
將上述步驟編寫成R模擬程序(程序名:Calpro.R)如下:
Calpro<-function(n){
k<-0;x<-runif(n);y<-runif(n)
for(i in 1:n){
if (y[i]<=exp(-x[i]^2))
k<-k+1
}
k/n
}
調(diào)用Calpro.R函數(shù),取不同的,重復(fù)運行1000次,取平均值()作為最終結(jié)果,并且得到這1000次估計的樣本標(biāo)準(zhǔn)差(),結(jié)果見表1:
由表1可知,當(dāng)不斷增大并且趨于無窮時,所求概率逐漸穩(wěn)定在常數(shù)0.7468附近,且估計的標(biāo)準(zhǔn)差也越來越小,說明我們所要求的概率=0.7468。
2 非正態(tài)總體的假設(shè)檢驗
例2 假設(shè)樣本獨立同分布于非正態(tài)總體,其期望為 ,方差為 2。在實際應(yīng)用中,有時需檢驗如下的假設(shè):
。
解: 想要對上述假設(shè)做檢驗,首先要找到一個合適的統(tǒng)計量,對于非正態(tài)總體, 通常的分布形式很難寫出,因此無法得到基于這個統(tǒng)計量的檢驗拒絕域。
下面我們利用蒙特卡洛方法給出基于這個統(tǒng)計量的檢驗方法:
1)生成個服從的隨機(jī)數(shù),計算統(tǒng)計量的值,記為;
2)將步驟1)重復(fù)次,得到;
3)將從小到大順序排列,得到;
4)對于給定的顯著性水平 ,定義的上 分布點為,其中表示不超過的最大整數(shù);[4]
5)對于假設(shè)構(gòu)造拒絕域,再根據(jù)樣本觀測值判定檢驗結(jié)果。
我們以為例[5],取,用上述方法得到了其上 分位點。由中心極限定理知,依分布收斂于,則的近似上 分位點,其中為標(biāo)準(zhǔn)正態(tài)分布的上 分位點。按照上述過程編寫程序,并運行1000次,得到的平均值及樣本標(biāo)準(zhǔn)差(), 另外還得到了的平均值。表2中給出了 =0.025和0.05的模擬結(jié)果,其他值的結(jié)果也可得到(由于篇幅限制,這里并未給出)。
從表2可知,上述蒙特卡洛方法得到的統(tǒng)計量的上 分位點與由中心極限定理得到的上 分位點是可比的,并且當(dāng)樣本量增加,蒙特卡洛方法重復(fù)的次數(shù)增加時,這兩個分位點的差距變小,且標(biāo)準(zhǔn)差也變小,說明結(jié)果更穩(wěn)定。充分說明提出的蒙特卡洛方法可以得到合理的分位點,進(jìn)而得到準(zhǔn)確的假設(shè)檢驗的結(jié)論。
本文以概率論與數(shù)理統(tǒng)計中常規(guī)方法求解不出來的概率的估計以及非正態(tài)總體的假設(shè)檢驗問題,提出利用蒙特卡洛方法來求解,用R軟件編程模擬驗證所述方法是可行的。這些例子可作為教學(xué)示例演示給學(xué)生,會使得課程內(nèi)容更加豐富;同時也可以激發(fā)學(xué)生的學(xué)習(xí)熱情,自主學(xué)習(xí)用統(tǒng)計軟件分析理論知識,真正做到理論與實踐的完美結(jié)合。
*通訊作者:鄧世容
基金項目: 武漢大學(xué)教學(xué)改革研究項目(QYW201409);中央高校教改基金項目(G1320311745)
參考文獻(xiàn)
[1] 劉祿勤,王文祥,龔曉慶.概率論與數(shù)理統(tǒng)計(第二版).北京:高等教育出版社,2011.
[2] 薛毅,陳立萍.統(tǒng)計建模與R軟件.北京:清華大學(xué)出版社,2007.
[3] 華東師范大學(xué)數(shù)學(xué)系.數(shù)學(xué)分析(上冊),北京:高等教育出版社,2000.
[4] 楊自強(qiáng).你也需要蒙特卡羅方法——一個得心應(yīng)手的工具[J].數(shù)理統(tǒng)計與管理,2007.26(1):178-188.
[5] 張幗奮,丁寧.一種非對稱拉普拉斯分布[J].浙江大學(xué)學(xué)報(理學(xué)版),2014.41(6):650-653.