生志榮
負(fù)二項(xiàng)分布的兩種近似分布及其比較
生志榮
(南京師范大學(xué)泰州學(xué)院,江蘇泰州225300)
負(fù)二項(xiàng)分布是一個(gè)重要的離散型隨機(jī)變量的分布,可以用泊松分布和正態(tài)分布作為其近似分布,通過對(duì)兩種近似分布進(jìn)行比較分析,結(jié)果表明:在參數(shù)q很小時(shí),泊松近似的精度好于正態(tài)近似,而且在參數(shù)q很小時(shí),即便r不是很大,用泊松分布也能獲得負(fù)二項(xiàng)分布較好的近似;當(dāng)參數(shù)q較大時(shí),泊松近似效果不好,相比之下,正態(tài)近似的結(jié)果不錯(cuò)。
負(fù)二項(xiàng)分布;泊松分布;正態(tài)分布;近似計(jì)算
負(fù)二項(xiàng)分布是一個(gè)重要的離散型隨機(jī)變量的分布,具有比較優(yōu)良的統(tǒng)計(jì)特性,在風(fēng)險(xiǎn)管理、排隊(duì)論等問題中有著廣泛的應(yīng)用。近年來,很多文獻(xiàn)對(duì)負(fù)二項(xiàng)分布進(jìn)行了研究,內(nèi)容涉及負(fù)二項(xiàng)分布的統(tǒng)計(jì)性質(zhì)及其應(yīng)用[1-2]以及負(fù)二項(xiàng)分布的參數(shù)估計(jì)問題[3],對(duì)負(fù)二項(xiàng)分布的近似計(jì)算問題還未見討論。本文通過建立負(fù)二項(xiàng)分布與二項(xiàng)分布在概率值上的關(guān)系式,利用常用統(tǒng)計(jì)軟件中二項(xiàng)分布的計(jì)算功能來獲得負(fù)二項(xiàng)分布的概率精確值;給出并證明了負(fù)二項(xiàng)分布的泊松近似定理;利用負(fù)二項(xiàng)分布隨機(jī)變量的和式分解以及獨(dú)立同分布中心極限定理,給出了負(fù)二項(xiàng)分布的正態(tài)近似;最后對(duì)兩種近似分布進(jìn)行了比較分析。
負(fù)二項(xiàng)分布亦稱為帕斯卡(Pascal)分布,它可以由下列兩種模型來描述:
定義1 設(shè)p(0
定義2 設(shè)p(0
負(fù)二項(xiàng)分布的這兩種定義是一致的,由定義1中的變量Y與定義2中的變量X各自的含義可得
其中NB(r,p;k)表示參數(shù)為r,p的負(fù)二項(xiàng)分布在k處的概率值,B(k,p;r)表示參數(shù)為k,p的二項(xiàng)分布在r處的概率取值,利用這個(gè)關(guān)系式,可以通過常用統(tǒng)計(jì)軟件中二項(xiàng)分布的計(jì)算功能來獲得負(fù)二項(xiàng)分布的概率精確值。
定理1 設(shè)在貝努利試驗(yàn)中每次試驗(yàn)成功的概率為p(0
證明 由負(fù)二項(xiàng)分布的實(shí)際背景可知,Y為在一系列貝努利試驗(yàn)(每次試驗(yàn)成功的概率為p)成功r次時(shí)試驗(yàn)的次數(shù),設(shè)Y1為第一次試驗(yàn)成功的試驗(yàn)次數(shù),Y2為第二次試驗(yàn)成功的試驗(yàn)次數(shù)(從第一次試驗(yàn)成功之后算起),…,Yr為第r次試驗(yàn)成功的試驗(yàn)次數(shù)(從第r-1次試驗(yàn)成功之后算起),則Y1,Y2,…,Yr相互獨(dú)立,且Yi(i=1,2,…,r)服從幾何分布G(p),此時(shí)有Y=Y1+Y2+…+Yr,即Y可以分解為r個(gè)獨(dú)立同服從幾何分布的隨機(jī)變量之和,由幾何分布的期望和方差得到負(fù)二項(xiàng)分布的期望與方差分別為EY=r/p,DY=r(1-p)/p2,根據(jù)獨(dú)立同分布中心極限定理可得負(fù)二項(xiàng)分布的正態(tài)近似分布N(r/p,r(1-p)/p2),標(biāo)準(zhǔn)化之后得到式(5)。
注:因?yàn)樨?fù)二項(xiàng)分布是離散分布,而正態(tài)分布是連續(xù)分布,所以用正態(tài)分布作為負(fù)二項(xiàng)分布的近似計(jì)算時(shí),作些修正可以提高精度。若k1 定理2 設(shè)在貝努利試驗(yàn)中每次試驗(yàn)成功的概率為pr(與r有關(guān)),X表示試驗(yàn)進(jìn)行到第r次成功為止已經(jīng)失敗的試驗(yàn)次數(shù),令qr=1-pr。如果當(dāng)r→+∞時(shí),rqr→λ,則有 證明 記rqr=λr,即qr=λr/r,由式(2)可得: 對(duì)于固定的k有: 從而 下面對(duì)負(fù)二項(xiàng)分布的泊松近似與正態(tài)近似進(jìn)行比較,其中負(fù)二項(xiàng)分布的概率精確值根據(jù)式(4)轉(zhuǎn)化為二項(xiàng)分布概率值計(jì)算得到,負(fù)二項(xiàng)分布的泊松近似利用式(3)和式(6)得到: 負(fù)二項(xiàng)分布的正態(tài)近似為: 不同參數(shù)的負(fù)二項(xiàng)分布、泊松分布以及正態(tài)分布的概率值比較見表1~4。所有數(shù)值均由Minitab軟件算得。 由表1可知:對(duì)于負(fù)二項(xiàng)分布的概率取值,在成功概率p很大(接近于1時(shí)),隨著k-r的增大,概率值將很快趨向于0,這與負(fù)二項(xiàng)分布的實(shí)際背景是一致的,因?yàn)樵诔晒Ω怕蕄很大(接近于1)時(shí),成功r次所需的試驗(yàn)次數(shù)k一般不會(huì)比r大很多。同時(shí)也看到,在q(=1-p)很小,r很大時(shí),用泊松分布作為負(fù)二項(xiàng)分布的近似分布是合理的,q越小r越大時(shí),近似程度越高。 表1 負(fù)二項(xiàng)分布NB(100,0.99)、NB(200,0.995)與泊松分布P(1)的部分概率值比較表 表2 負(fù)二項(xiàng)分布NB(20,0.99)與泊松分布P(0.2)的部分概率值比較表 由表2可知:對(duì)于負(fù)二項(xiàng)分布的概率取值,在q很小時(shí),即便r不是很大,用泊松分布也能獲得負(fù)二項(xiàng)分布較好的近似。 表3 負(fù)二項(xiàng)分布NB(200,0.995)、正態(tài)分布N(201, 1/0.9952)與泊松分布P(1)的部分累積概率值比較表 由表3可知:當(dāng)負(fù)二項(xiàng)分布的參數(shù)q很小時(shí),泊松分布對(duì)負(fù)二項(xiàng)分布的近似要好于正態(tài)分布對(duì)負(fù)二項(xiàng)分布的近似。 表4 負(fù)二項(xiàng)分布N(200,0.8)、正態(tài)分布N(250,40/0.64)與泊松分布P(40)的部分累積概率值比較表 由表4可知:當(dāng)負(fù)二項(xiàng)分布q較大時(shí),用泊松分布去逼近負(fù)二項(xiàng)分布的效果不好,相比之下,用正態(tài)分布來近似計(jì)算負(fù)二項(xiàng)分布的值所得結(jié)果不錯(cuò)。 [1] 孫道德.關(guān)于負(fù)二項(xiàng)分布的性質(zhì)及其應(yīng)用[J].阜陽(yáng)師范學(xué)院學(xué)報(bào):自然科學(xué)版,2000,17(2). [2] 孟生旺.負(fù)二項(xiàng)分布的優(yōu)良特性及其在風(fēng)險(xiǎn)管理中的應(yīng)用[J].數(shù)理統(tǒng)計(jì)與管理,1998,17(2). [3] 程維虎,王莉麗.負(fù)二項(xiàng)分布兩種參數(shù)估計(jì)及其比較[J].數(shù)理統(tǒng)計(jì)與管理,2004,23(5). [4] 茆詩(shī)松,程依明,濮曉龍.概率論與數(shù)理統(tǒng)計(jì)教程[M].北京:高等教育出版社,2004. Two kind of Approximate Distributions of Negative Binomial Distribution and It’s Comparison SHENG Zhi2rong The negative binomial distribution is an important discrete random variable distribution and may use the poisson distribution and the normal distribution as its approximate distribution.The comparative analysis to two kind of approximate distributions has been carried on and the results indicated: When parameter q is very small,poisson approximation has better accuracy than normal approximation, moreover,even if r is not very big,good approximation can also been obtained with the poisson distribution.When parameter q is big,the poisson approximation is not good,the normal approximate result is comparatively good. negative binomial distribution;poisson distribution;normal distribution;approximate calculation O211 A 1007-3116(2011)01-0020-03 (責(zé)任編輯:馬 慧) 2010-09-06 生志榮,男,江蘇泰興人,講師,碩士,研究方向:概率統(tǒng)計(jì)。三、兩種近似分布的比較研究
(Taizhou College,Nanjing Normal University,Taizhou 225300,China)