河南質(zhì)量工程職業(yè)學(xué)院基礎(chǔ)教學(xué)部 趙曉艷
在介紹泊松分布之前,我們先介紹二項(xiàng)分布。泊松分布符合二項(xiàng)分布前提條件,是在二項(xiàng)分布基礎(chǔ)上的一種特殊分布。
二項(xiàng)分布適合的類型:二項(xiàng)分布適用伯努利概型,即隨機(jī)事件A只有兩種結(jié)果,要么發(fā)生,要么不發(fā)生。如果我們假設(shè)事件A發(fā)生的概率為p,那么不發(fā)生的概率就是1-p。生活中比較典型的例子,比如投籃球、扔一枚硬幣、彩票中獎、射擊目標(biāo)等,這些例子都是比較典型的伯努利概型。比如射擊,對于一個人來說,在某段時間內(nèi)射擊水平穩(wěn)定,每射擊一次,命中的概率為p,未命中的概率就是1-p。又比如一個人在某段時間內(nèi)投籃球命中率也是固定的,假設(shè)命中率是百分之六十,那么未命中的概率就是百分之四十。下面我們給出伯努利概率的具體定義。
n重伯努利試驗(yàn):獨(dú)立重復(fù)進(jìn)行n次伯努利試驗(yàn),這一獨(dú)立重復(fù)試驗(yàn)序列為n重伯努利試驗(yàn)。
伯努利定理:假設(shè)獨(dú)立重復(fù)進(jìn)行n次試驗(yàn),在一次試驗(yàn)中,事件A發(fā)生的概率為p,在n重伯努利試驗(yàn)中,事件A發(fā)生K次概率為
下面介紹伯努利概型前提下的幾種分布。兩點(diǎn)分布:當(dāng)隨機(jī)變量X取值只有兩個,假設(shè)為對應(yīng)的概率為其中,如果則隨機(jī)變量X服從參數(shù)為p的兩點(diǎn)分布,記為用式子表示為則依此公式可列出隨機(jī)變量X的分布,也可以用表格,表格更加簡單明了,學(xué)生更容易理解運(yùn)用。有一種特殊情況,如果這時,隨機(jī)變量X的分布稱為0-1分布,容易看出,0-1分布是二項(xiàng)分布的一種特殊情況,它符合二項(xiàng)分布的所有特征,包括前提條件等?,F(xiàn)實(shí)生活中,比如投籃球、射擊等,就是非常典型的兩點(diǎn)分布,也是0-1分布。比如射擊,我們可以把命中記為未命中記為如果命中概率為百分之七十,那么未命中概率就是百分之三十,如果看作0-1分布的話,令即可。下面我們來介紹二項(xiàng)分布,此試驗(yàn)獨(dú)立重復(fù)進(jìn)行n次,假設(shè)事件A發(fā)生的概率為p,記隨機(jī)變量X為n次獨(dú)立重復(fù)試驗(yàn)中事件A發(fā)生的次數(shù),當(dāng)隨機(jī)變量X所有可能取值為0、1….n,則隨機(jī)變量X的分布用式子可以表示為:若隨機(jī)變量X分布列為此形式,則稱隨機(jī)變量X服從參數(shù)為np的二項(xiàng)分布,記為當(dāng)然,也可用表格形式表示。此分布稱為二項(xiàng)分布,因其表達(dá)式和中學(xué)里的二項(xiàng)式定理展開式非常類似,因此叫作二項(xiàng)分布。當(dāng)二項(xiàng)分布中隨機(jī)變量X取值只有兩個時,二項(xiàng)分布即為兩點(diǎn)分布。由此我們可得:兩點(diǎn)分布是二項(xiàng)分布的特例,而0-1分布又是兩點(diǎn)分布的特例。
二項(xiàng)分布中當(dāng)n非常大,但是同時事件A發(fā)生的概率p又非常小時,此時用二項(xiàng)分布中求概率公式已經(jīng)很難求出其值,例如,因?yàn)閚很大,p很小時,導(dǎo)致展開式非常難計算,有時候必須借助計算機(jī)才可以計算最終結(jié)果,這時候我們引入泊松分布,泊松分布在離散型分布中具有非常重要的意義,例如在一個醫(yī)院中,每個病人來看病都是隨機(jī)并獨(dú)立的概率,則該醫(yī)院一天(或者其他特定時間段,如一小時、一周等等)接納的病人總數(shù)可以看作是一個服從poisson分布的隨機(jī)變量。但是為什么可以這樣處理呢?最好的解釋方法是從poisson的兩種不同定義上著手。Poisson分布的第一個定義泊松分布:假設(shè)隨機(jī)變量X的分布為:,其中則稱隨機(jī)變量X服從參數(shù)為 的泊松分布,記為這個定義就是我們平時考試或者理論工作時用的poisson隨機(jī)變量的定義。
泊松定理:在n重伯努利試驗(yàn)中,事件A在一次試驗(yàn)中發(fā)生的概率為p,我們?nèi)t對任意確定非負(fù)整數(shù)k,有注意Poisson還有一個知名度比較小的第二個定義,或者說是Poisson Process定義:假定一個事件在一段時間內(nèi)隨機(jī)發(fā)生,且符合以下條件:(1)將該時間段無限分隔成若干個小的時間段,在這個接近于零的小時間段里,該事件發(fā)生一次的概率與這個極小時間段的長度成正比。 (2)在每一個極小時間段內(nèi),該事件發(fā)生兩次及以上的概率恒等于零。(3)該事件在不同的小時間段里,發(fā)生與否相互獨(dú)立。 則該事件稱為poisson process。這個第二定義就更加利于大家理解了,回到醫(yī)院的例子之中,如果我們把一天分成24個小時,或者24×60分鐘,或者24×3600秒。時間分得越短,這個時間段里來病人的概率就越小(比如醫(yī)院在正午12點(diǎn)到正午12點(diǎn)又一毫秒之間來病人的概率是不是很接近于零?)。條件一符合,如果我們把時間分得很細(xì)很細(xì),條件二也符合。條件三的要求比較苛刻,應(yīng)用到實(shí)際例子中就是說病人們來醫(yī)院的概率必須是相互獨(dú)立的,如果不是,則不能看作是poisson分布。問題是為什么現(xiàn)實(shí)生活中的情況(如醫(yī)院例子)會服從poisson分布的第一定義?現(xiàn)在有了第二定義作為橋梁,應(yīng)該就很容易理解了。現(xiàn)實(shí)生活中的例子中如果事件相互獨(dú)立,那么它就是符合poisson分布的第二定義的。而從poisson第二定義到poisson第一定義之間是有嚴(yán)格的數(shù)學(xué)證明的。因?yàn)椴此煞植荚趯?shí)際生活應(yīng)用中有廣泛的現(xiàn)實(shí)背景和意義,比較典型的例子有在某一個紅綠燈路口發(fā)生交通事故的件數(shù)、一個紗線廠紗線在某一段時間內(nèi)出現(xiàn)的斷頭數(shù)、某縣年齡在100歲以上居民人口數(shù)、火山在某時間段內(nèi)噴發(fā)次數(shù)等等,這些例子都有一個共同特征,那就是這些事件都是稀有事件,發(fā)生次數(shù)服從或者近似服從泊松分布。所謂稀有事件,即為每次試驗(yàn)中事件發(fā)生的概率非常小,如洪水、火山噴發(fā)、地震、工廠出現(xiàn)次品乃至銀行印鈔機(jī)印出錯鈔都屬于此事件,這種情況一般都是n很大,p很小,這時候雖然試驗(yàn)都符合伯努利概型,也可以用二項(xiàng)分布概率公式求出,但是出現(xiàn)一個很難解決的問題:大部分概率利用此公式計算起來都非常困難,這時候二項(xiàng)分布可以近似為泊松分布,利用泊松分布概率分布表,即可求出概率。
接下來我們看一個例子:設(shè)某保險公司的某人壽險種有2000人投保,每個人在一年內(nèi)死亡的概率為0.002,且每個人在一年內(nèi)是否死亡相互獨(dú)立,試求在未來一年這2000人中死亡人數(shù)不超過8人的概率。此問題屬于伯努利概型,符合二項(xiàng)分布,且從題中可以看出,n=2000,p=0.002,我們先用二項(xiàng)分布解決這個問題:如果利用二項(xiàng)分布公式計算,需要計算8個式子,況且每一個式子都需要計算機(jī)才能計算出結(jié)果,但同時我們發(fā)現(xiàn)此案例中,n很大,p很小,np=4,符合泊松分布,因此我們轉(zhuǎn)換思路,利用泊松分布計算。我們假設(shè)2000個投保人在一年內(nèi)死亡人數(shù)為X,則2000個投保人在一年內(nèi)死亡人數(shù)不超過8人的概率為:由此可得2000個投保人在一年內(nèi)死亡人數(shù)不超過8人概率為0.9781,非常接近百分之百,由此結(jié)果我們可以看出,雖然投保人達(dá)到2000人,但是因?yàn)楦怕史浅P?,最后得到一年?nèi)死亡人數(shù)不超過8人幾乎是絕對的,由此保險公司可制定出適宜的政策,從而獲得最大收益。
本文主要講了泊松分布的幾點(diǎn)重要的說明。首先介紹0-1分布和兩點(diǎn)分布,給出了具體形式和適用前提條件,然后引出二項(xiàng)分布,通過分析我們得出0-1分布是兩點(diǎn)分布的特例,兩點(diǎn)分布是二項(xiàng)分布的特例,進(jìn)而我們又通過二項(xiàng)分布引出泊松分布,給出了泊松分布的背景和研究意義,又得出二項(xiàng)分布可視為泊松分布的條件,并且給出在此條件下為何二項(xiàng)分布可視為泊松分布。同時我們又給出讀者典型案例,說明泊松分布在計算中的重要性,最后給出本文小結(jié)。
[1]盛驟 謝式千等.概率論與數(shù)理統(tǒng)計[M].北京:高等教育出版社,2008:P71.
[2]陳希孺.概率論與數(shù)理統(tǒng)計[M].北京:中國科學(xué)技術(shù)出版社,2017:P68.
[3]謝壽才.概率論與數(shù)理統(tǒng)計[M].北京:中國人民大學(xué)出版社,2014:P89.
[4]程依明等.概率論與數(shù)理統(tǒng)計教程[M].北京:高等教育出版社,2008:P56.
[5]張幗奮.概率論數(shù)理統(tǒng)計與隨機(jī)過程[M].浙江:浙江大學(xué)出版社,2005:P120.