孔令才
概率論與數(shù)理統(tǒng)計是現(xiàn)代數(shù)學(xué)的重要分支。近年來,隨著計算機的迅速普及,概率統(tǒng)計在經(jīng)濟、管理、金融、保險、生物、醫(yī)學(xué)等方面的應(yīng)用得到長足發(fā)展。正是這種廣泛應(yīng)用性,使得概率統(tǒng)計成為今天各類各專業(yè)大學(xué)生最重要的數(shù)學(xué)必修課之一。然而,傳統(tǒng)的概率統(tǒng)計教學(xué)過于偏重理論的闡述、公式的推導(dǎo)、繁瑣的初等運算;同時,缺乏與計算機的結(jié)合,給學(xué)生的學(xué)習(xí)帶來很多困難。本文介紹概率統(tǒng)計中的主要問題在Matlab中的實現(xiàn),把學(xué)生從繁瑣的計算中解放出來,把更多的時間和精力用于基本概念和基本理論的思考和方法的創(chuàng)新,從而提高教師的教學(xué)效率和學(xué)生的學(xué)習(xí)效率。
一、常用概率密度的計算
Matlab中計算某種概率分布在指定點的概率密度的函數(shù),都以代表特定概率分布的字母開頭,以pdf(probability density function)結(jié)尾,例如:unidpdf(X, N):計算1到N上的離散均勻分布在X每一點處的概率密度;poisspdf(X, Lambda):計算參數(shù)為Lambda的泊松分布在X每一點處的概率密度;exppdf(X, mu):計算參數(shù)為mu的指數(shù)分布在X每一點處的概率密度;normpdf(X, mu, sigma):計算參數(shù)為mu, sigma的正態(tài)分布在X每一點處的概率密度。其他如連續(xù)均勻分布、二項分布、超幾何分布等也都有相應(yīng)的計算概率密度的函數(shù)。
除計算概率密度的函數(shù)外,Matlab中還有計算累積概率密度、逆概率分布函數(shù)及產(chǎn)生服從某分布的隨機數(shù)的函數(shù),分別以cdf,inv和rnd結(jié)尾。
二、隨機變量數(shù)字特征的計算
(一)數(shù)學(xué)期望與方差
對離散型隨機變量,可利用Matlab矩陣運算計算出其數(shù)學(xué)期望和方差;而對于連續(xù)型隨機變量,則可以利用Matlab符號運行計算。對常見分布,Matlab還有專用的函數(shù)計算其期望與方差,如binostat, expstat, normstat, poisstat可用于計算二項分布、指數(shù)分布、正態(tài)分布和泊松的期望和方差。另外,Matlab中提供了計算方差和標(biāo)準(zhǔn)差的函數(shù)var與std。
(二)協(xié)方差與協(xié)方差矩陣
Matlab中,函數(shù)cov(X)用于計算隨機變量的協(xié)方差或協(xié)方差矩陣。
三、樣本統(tǒng)計量及其分布
(一)樣本統(tǒng)計量及經(jīng)驗分布函數(shù)
Matlab中,函數(shù)[h, stats]=cdfplot(X)返回樣本經(jīng)驗分布函數(shù)圖像和樣本數(shù)據(jù)的幾個重要統(tǒng)計量,包括最小值、最大值、均值、中值和標(biāo)準(zhǔn)差。
(二)抽樣分布
數(shù)理統(tǒng)計中常用的X2分布、t分布、F分布,Matlab中也有相應(yīng)的函數(shù)計算其概率密度,分別為chi2pdf(X, V), tpdf(X, V), fpdf(X, V1, V2),其用法與前面介紹的計算其他常用分布的概率密度的函數(shù)相似。
四、參數(shù)估計
對服從正態(tài)分布N(u,б2)的觀測數(shù)據(jù)向量X, Matlab中用函數(shù)normfit或mel來估計其參數(shù)和置信區(qū)間,而函數(shù)mle也可以用來估計服從其他分布的樣本數(shù)據(jù)的參數(shù)和出置信區(qū)間。
例:命令R = exprnd(3,1,10)返回一組服從參數(shù)為3的指數(shù)分布的隨機數(shù),容量為10.
[p, pci] = mle('Exponential',R,0.05)則返回其均值的極大似然估計p = 4.3756及其置信水平為1-0.05=0.95的置信區(qū)間( 2.5611, 9.1247).
對于服從二項分布、指數(shù)分布、泊松分布和均勻分布等其它常見分布的數(shù)據(jù),Matlab也有相應(yīng)的計算極大似然估計和置信區(qū)間的函數(shù),分別為binofit, expfit, poissfit, unifit等,其用法與normfit相似。
五、假設(shè)檢驗
對于假設(shè)檢驗,在Matlab中可以利用逆累積分布函數(shù)(如逆正態(tài)累積分布函數(shù)norminv),結(jié)合簡單的計算給出檢驗結(jié)果。但Matlab中也有專門用于假設(shè)檢驗的函數(shù):對方差已知時的單個樣本均值檢驗可以用ztest,對單個樣本均值可以用ttest,對兩個樣本均值差可以用ttest2等。
總之,對于概率統(tǒng)計中絕大部分問題,Matlab統(tǒng)計工具箱都提供了相應(yīng)的函數(shù)。在學(xué)習(xí)概率統(tǒng)計時,結(jié)合這些函數(shù)將使學(xué)習(xí)變得更加簡單易學(xué)。
參考文獻(xiàn):
[1]周品,趙新芬. MATLAB數(shù)理統(tǒng)計分析[M]. 北京: 國防工業(yè)出版社,2009.
[2]王正林,劉明. 精通MATLAB7[M]. 北京: 電子工業(yè)出版社,2006.
(作者單位:華北電力大學(xué)數(shù)理系)