王露
摘要:二項(xiàng)分布b(n,p)是一種應(yīng)用較為廣泛的離散型分布.在實(shí)際應(yīng)用中,常常需要對(duì)參數(shù)p進(jìn)行估計(jì);但當(dāng)總體參數(shù)p較小時(shí),樣本中目標(biāo)事件出現(xiàn)的頻率為0,此時(shí)對(duì)參數(shù)p采用傳統(tǒng)的矩估計(jì)具有一定的局限性,使其估計(jì)結(jié)果出現(xiàn)=0.針對(duì)這種局限性,本文提出一種基于二項(xiàng)分布的改進(jìn)模型,該模型及其估計(jì)方法在一定程度上能克服傳統(tǒng)矩估計(jì)方法在處理參數(shù)p較小時(shí)的不足.
關(guān)鍵詞:二項(xiàng)分布;改進(jìn)模型;參數(shù)估計(jì)
中圖分類號(hào):O212? 文獻(xiàn)標(biāo)識(shí)碼:A? 文章編號(hào):1673-260X(2019)06-0009-02
1 引言
對(duì)于二項(xiàng)分布b(n,p)中抽取的樣本,若p較小,樣本中目標(biāo)事件出現(xiàn)的頻率極低,甚至為0;此時(shí)該如何對(duì)總體參數(shù)p進(jìn)行估計(jì)?利用傳統(tǒng)的矩估計(jì)和極大似然估計(jì),得到的=0,該結(jié)果幾乎沒有意義,因?yàn)榭赡芨鶕?jù)對(duì)事件的認(rèn)知發(fā)現(xiàn)概率不可能為0;國內(nèi)外已有對(duì)二項(xiàng)分布中比例參數(shù)估計(jì)改進(jìn)的相關(guān)研究,張學(xué)新[1]針對(duì)p值接近于0或1的極端情形下對(duì)17種置信區(qū)間的選擇方法進(jìn)行比較.Alan Agresti[2]等人對(duì)分類數(shù)據(jù)分析中參數(shù)的最優(yōu)置信區(qū)間進(jìn)行了探討.徐鵬鵬[3]針對(duì)二項(xiàng)分布應(yīng)用的局限性,通過構(gòu)造矩方程和極大似然方程可求出估計(jì)參數(shù).
2 二項(xiàng)分布的簡介
隨機(jī)試驗(yàn)中僅有兩個(gè)結(jié)果A與A,且A發(fā)生的概率P(A)=p;對(duì)于該隨機(jī)試驗(yàn)獨(dú)立重復(fù)進(jìn)行n次,則稱為n重伯努利試驗(yàn).若以隨機(jī)變量X表示n重伯努利試驗(yàn)事件發(fā)生的次數(shù),則在n重伯努利試驗(yàn)中事件A發(fā)生k次的概率
P(X=k)=Cnkpk(1-p)n-k k=0,1…n
上式稱為二項(xiàng)分布[4],記為X~b(n,p).
對(duì)該模型中參數(shù)p進(jìn)行估計(jì),若采用傳統(tǒng)的矩估計(jì)和極大似然估計(jì)方法得出=(k表示樣本中目標(biāo)事件發(fā)生的次數(shù)).
由于二項(xiàng)分布中概率計(jì)算的復(fù)雜和煩瑣性,尤其當(dāng)參數(shù)n較大時(shí).針對(duì)二項(xiàng)分布在一些特殊情形下,有不同的近似計(jì)算方法.比如利用泊松定理、棣莫弗-拉普拉斯中心極限定理分別給出了二項(xiàng)分布的泊松近似、正態(tài)近似[1].
3 基于二項(xiàng)分布改進(jìn)的模型
3.1 模型的構(gòu)建
在實(shí)際實(shí)驗(yàn)中,由于試驗(yàn)場地、人員、設(shè)備等條件的影響,試驗(yàn)單元的個(gè)數(shù)受到了限制;假設(shè)一次試驗(yàn)中有n個(gè)試驗(yàn)單元;若這n個(gè)試驗(yàn)單元中目標(biāo)事件發(fā)生的次數(shù)獨(dú)立的服從b(n,p),上述試驗(yàn)可以看作一次n伯努利試驗(yàn).若研究的目標(biāo)事件發(fā)生概率極小,則在一次n重伯努利試驗(yàn)中該事件未發(fā)生,此時(shí)若對(duì)參數(shù)p進(jìn)行估計(jì)得到=0;根據(jù)對(duì)事件的認(rèn)知,該事件發(fā)生的概率肯定不為0,可以得出該估計(jì)顯然不合理;例如,國外有一項(xiàng)研究在車險(xiǎn)定價(jià)中需估計(jì)汽車保險(xiǎn)杠在一次碰撞中脫落的概率,該事件發(fā)生的概率較小;若采用重復(fù)試驗(yàn)的方式進(jìn)行研究,重復(fù)試驗(yàn)的次數(shù)會(huì)受到場地和設(shè)備的限制,會(huì)出現(xiàn)試驗(yàn)已全部進(jìn)行完目標(biāo)事件仍未發(fā)生.
針對(duì)上述問題,本文構(gòu)建如下模型:
第1次n重伯努利試驗(yàn),若事件A發(fā)生的頻率為0;則進(jìn)行第2次n重伯努利試驗(yàn),若事件A發(fā)生的為頻率0;則繼續(xù)進(jìn)行第3次n重伯努利試驗(yàn)……直到出現(xiàn)事件A發(fā)生的頻率不為0為止,記發(fā)生在第K次n重伯努利試驗(yàn).以隨機(jī)變量Y表示事件A在第K次n重伯努利試驗(yàn)中發(fā)生的次數(shù).
假設(shè)事件發(fā)生的概率為p,各試驗(yàn)單元之間是相關(guān)獨(dú)立的.離散型隨機(jī)變量Y的分布列可表示如下.
4 結(jié)語
二項(xiàng)分布是現(xiàn)實(shí)生活中常見的一種分布,應(yīng)用范圍較廣;實(shí)際應(yīng)用中涉及參數(shù)p的估計(jì)問題,傳統(tǒng)的矩估計(jì)和極大似然估計(jì)方法適用的范圍是參數(shù)p不宜過小.對(duì)于一些小概率事件傳統(tǒng)的矩估計(jì)和極大似然估計(jì)極易出現(xiàn)估計(jì)值為0,導(dǎo)致與現(xiàn)實(shí)不符.本文提出了一種基于二項(xiàng)分布的改進(jìn)模型,在一定程度能克服傳統(tǒng)估計(jì)方法的不足.
參考文獻(xiàn):
〔1〕張學(xué)新.極端頻率情形下二項(xiàng)分布比例置信區(qū)間的比較[J].重慶師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,33(3):91-97.
〔2〕Agresti A,Coull B. Approximate better than‘exact’for Cls for binomial parameters[J].American Statistician,2008,52:119-126.
〔3〕徐鵬鵬,蘇本躍.改進(jìn)二項(xiàng)分布的性質(zhì)及其應(yīng)用[J].安慶師范學(xué)院學(xué)報(bào)(自然科學(xué)版),2016,22(4):11-13.
〔4〕盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社,2009.
〔5〕張艷.談二項(xiàng)分布的近似計(jì)算及其在保險(xiǎn)問題中的應(yīng)用[J].雞西大學(xué)學(xué)報(bào),2012(1):45-46.
赤峰學(xué)院學(xué)報(bào)·自然科學(xué)版2019年6期