翟明娟
(長治學院 數學系,山西 長治 046011)
如何準確理解與表述泊松定理
翟明娟
(長治學院 數學系,山西 長治 046011)
文章明確了對泊松定理條件中“事件A在一次試驗中發(fā)生的概率與試驗次數有關”的準確理解;指出產生誤解的原因,因而對泊松定理的重述很有必要。最后,給出泊松定理的準確表述,并進一步說明現有部分教材中的泊松定理是重述的泊松定理的一種特殊情形。
伯努利試驗的特征;泊松定理;特例
泊松定理是概率統計中的一個重要定理,在二項分布的近似計算中應用廣泛。但現有教材對該定理的敘述不準確,不利于學生對其正確理解。如茆詩松等編著的普通高等教育“十一五”國家級規(guī)劃教材[1]《概率論與數理統計教程(第二版)》中的泊松定理的表述為:在n重伯努利試驗中,記事件A在一次試驗中發(fā)生的概率為pn(與試驗次數n有關),如果當時n→∞,有npn→λ,則
該定理中“事件A在一次試驗中發(fā)生的概率為pn(與試驗次數n有關)”的這一敘述不僅不準確,而且很容易誤導學生,使學生對二項分布中的參數p產生錯誤理解:認為二項分布中事件A的概率p是變化的,即隨著試驗次數n的變化而變化。
教材[2]中的泊松定理的表述與教材[1]中的表述完全相同。另外,普通高等教育“十一五”規(guī)劃教材[3]-[5]中對泊松定理的表述與上述表述略有不同,雖然沒有明確說明事件A在一次試驗中發(fā)生的概率pn與試驗次數n有關,但仍隱含“事件A在一次試驗中發(fā)生的概率pn與n有關”。學生對這些教材中所表述的泊松定理不僅難以理解,而且容易與二項分布的正確理解發(fā)生沖突,形成學習過程中不應該有的一個障礙。
泊松定理講述的是二項分布與泊松分布具有如下關系:當二項分布中的兩個參數n較大同時p較小時二項分布的極限分布為泊松分布。泊松定理的這一結論完全正確,但學生對定理的條件中的部分表述難以理解:記事件A在一次試驗中發(fā)生的概率為pn,括號中特別注明事件A的概率與試驗次數n有關。學生在學完二項分布之后,認為在某個n重伯努利試驗下產生的二項分布的兩個參數n和p是不變的;即只要n重伯努利試驗做完,n和p就確定了,就是不變的兩個常數。尤其是事件A在一次試驗中發(fā)生的概率p是不變的,即不管做了幾重的伯努利試驗,也不管A事件在第幾次試驗中,其發(fā)生的概率都是同一個數p,是不變的,即p不會隨著試驗次數n的變化而變化。而從現有教材對泊松定理的表述中很自然地認為:事件A在一次試驗中發(fā)生的概率pn與試驗次數n有關,隨試驗次數n變化而變化,不再具有不變性。這樣不就矛盾了嗎?到底哪一種理解對?哪一種理解錯?如果錯,錯在什么地方?應如何糾正?
要正確回答以上幾個問題,需要從二項分布的定義和產生二項分布的伯努利試驗的特性等方面來入手。
教材[1]對二項分布的定義為:如果設X為n重伯努利試驗中A事件出現的次數,則X的分布列為:P(X=k)=Cnkpk(1-p)n-k,k=0,1,…,n;稱此分布為參數為n,p的二項分布,記作B(n,p)。從該定義可得二項分布的應用場合為:n重伯努利試驗中事件A出現的次數。既然二項分布的應用場合為n重伯努利試驗中事件A出現的次數,那對伯努利試驗的判別就很關鍵,因為只有在伯努利試驗中才能產生服從二項分布的變量。
2.1 n重伯努利試驗及其特征
如果n個試驗E1的任一結果、E2的任一結果、……、En的任一結果都是相互獨立的事件,則稱此n個試驗相互獨立。如果這n個獨立試驗還是相同的,則稱其為n重獨立重復試驗。如果在n重獨立重復試驗中,每次試驗的可能結果為兩個:A或Aˉ,則稱這種試驗為重伯努利試驗[1]。比如一個班級有N個同學,某次統計學期末考試有M個同學及格。從該班級中有放回觀測n個同學的成績,每次抽取一位同學并觀測其成績是否及格,共觀測n次,則該試驗就可以看作是一個n重伯努利試驗。因為對于每次抽中的學生,均觀測其成績是否及格,則此次試驗為重復獨立試驗;又因為每次試驗的可能結果為兩個:不是及格就是不及格;因此觀測每個同學的成績是否及格就是做一個n重伯努利試驗。
通過上例,伯努利試驗的特性可概括為:結果具有對立性、概率具有不變性、試驗具有獨立性[6]。對立性是指每次觀測結果僅有兩個A與Aˉ,如在上例中則為:每次抽中同學的成績要么及格(A),要么不及格(Aˉ)。不變性是指事件A在每一次試驗中出現的概率都是相等的,是指每次抽中的同學及格的概率都是若A表示“第i次抽中同學的成i績及格”,i=1,2,…,n,則有P(A1)=P(A2)=…=P(An)= P(A)=p。獨立性[2]是指各次觀測的結果互不影響,即n次觀測中的任意某一次或某幾次的觀測結果不影響其它任意某一次或某幾次的觀測結果,比如上例中不管第i次抽中的同學是否及格都不影響第j次抽中的同學是否及格;即有:等。
具體問題中可利用上述三個特性來判斷n次觀測是否是一個n重伯努利試驗。例如:某生產車間有n臺獨立工作的同類型機床(該類型機床的故障率為p),每臺機床均生產同樣的產品?,F對該車間進行檢修就是一個n重伯努利試驗。因為對每臺機床來說要么出故障,要么沒故障(對立性)、每臺機床出故障的概率都為p(不變性)、第i臺機床是否出故障不影響第j臺機床是否出故障(獨立性)。因為共檢查n次,所以此次檢修中該車間出故障的機床數服從參數為n,p的二項分布B(n,p)。
2.2 二項分布中參數的性質
由上所述可知事件A發(fā)生的概率p具有不變性,這個不變性具體體現在三方面:一是不管這個伯努利試驗做了多少重,是10重還是20重;二是不管在第幾次試驗中,在第1次試驗中還是在第5次試驗中;第三,不管A事件在某次試驗中是否發(fā)生,其概率p均是不變的。概率p的不變性正是伯努利試驗所具有的獨立重復特性的外在表現。教材中雖然沒有給出參數的這種性質的明確表述,但在給出重伯努利試驗的概念和二項分布的定義之后所舉的例子中均體現了這一點,學生的潛意識里均認為p是不變的。
3.1 對泊松定理的誤解及產生誤解的原因分析
再返回看泊松定理有關事件A的概率的敘述:記事件A在一次試驗中發(fā)生的概率為pn,與試驗次數n有關。表面看來,這與二項分布中事件A在一次試驗中發(fā)生的概率具有的不變性是相互矛盾的,學生也常常針對教材中這兩處“自相矛盾”的地方提出異議。究其原因,是由于學生對二項分布的應用場合不清楚,即對n重伯努利試驗的特征認識不清以及泊松定理本身的表述不準確而造成的,尤其是泊松定理本身對“事件A在一次試驗中發(fā)生的概率與試驗次數有關”這一表述不準確極易誤導學生造成的。
因為對泊松定理“在n重伯努利試驗中,事件A在一次試驗中發(fā)生的概率pn與試驗次數n有關”中的“n重伯努利試驗”存在如下三種理解:第一,n重伯努利試驗為相同重數的不同的伯努利試驗序列。此時,事件A不同,則事件A的概率也就不同。比如一次拋擲一枚骰子,共拋n次的第一個n重伯努利試驗中,設事件A表示“每次拋擲后出現的點數為1點”,則在一次拋擲一枚硬幣,共拋n次的第二個n重伯努利試驗中,設事件A表示“每次拋擲后正面朝上”這一隨機事件,則在這兩個相同重數的不同伯努利試驗中,由于事件A是不同的事件,導致了事件A在一次試驗中發(fā)生的概率是不同的,表面看來不再具有不變性,但這種情況下事件A在一次試驗中發(fā)生的概率的不同與二項分布中事件A在一次試驗中發(fā)生的概率的不變性并不矛盾。也就是說,按照這種理解,泊松定理中“事件A在一次試驗中發(fā)生的概率pn與試驗次數n有關”與二項分布中事件A在一次試驗中發(fā)生的概率的不變性本質上是不矛盾的;但此時導致p變化的原因并不是像教材[1、2]中所述的“與試驗次數有關”,導致變化的原因是由于伯努利試驗本身是不同的,與試驗次數n毫無關系。
第二,n重伯努利試驗為不同重數的不同的伯努利試驗序列。此時,同樣由于事件A本身不同,則事件A的概率p也就不同。比如一次拋擲一枚骰子,共拋n1次的第一個n1重伯努利試驗中,設事件A表示“每次拋擲后出現的點數為1點”這一隨機事件,則在一次拋擲一枚硬幣,共拋n次的
2第二個n1重伯努利試驗中,設事件A表示“每次拋擲后正面朝上”這一隨機事件,則在這兩個具有不同重數的不同伯努利試驗中,同樣由于不同的伯努利試驗中事件A是不同的事件導致了事件A在一次試驗中發(fā)生的概率是不同的,表面看來不再具有不變性。巧合的是,在這種情況下,事件A在一次試驗中發(fā)生的概率表面看來確實與試驗次數有關,即與伯努利試驗的重數有關。但實質上這和第一種情況下事件A在一次試驗中概率的不同是由于相同的原因造成的,都是由于伯努利試驗是不同的試驗才表現為事件A發(fā)生的概率不同。即在這種理解下,泊松定理中“事件A在一次試驗中發(fā)生的概率pn與試驗次數n有關”與二項分布中事件A在一次試驗中發(fā)生的概率的不變性本質上不矛盾,但教材中泊松定理對伯努利試驗的表述應該為一系列不同的伯努利試驗序列(該序列中每個試驗的重數可以相同,也可以不同),而不是一個伯努利試驗。
第三,n重伯努利試驗為不同重數的相同的伯努利試驗序列。事件A在一次試驗中發(fā)生的概率p是不變的,這與泊松定理中的“事件A在一次試驗中發(fā)生的概率pn與試驗次數n有關”就是一個矛盾。比如一次拋擲一枚骰子,共拋10次的第一個伯努利試驗中,設事件A仍表示“每次拋擲后出現的點數為1點”這一隨機事件,則在一次拋擲一枚骰子,共拋20次的第二個伯努利試驗中,則事件A的概率是不變的,與伯努利試驗的試驗次數n沒有一點關系。因此,在這個不同重數相同伯努利試驗所產生的不同的伯努利試驗序列中,由于事件A是同樣的事件,其在一次試驗中發(fā)生的概率具有不變性,在這種情形下,泊松定理中“事件A在一次試驗中發(fā)生的概率pn與試驗次數n有關”與二項分布中事件A在一次試驗中發(fā)生的概率的不變性就是矛盾的。
3.2 泊松定理的準確表述
由上所述,對泊松定理中“事件A在一次試驗中發(fā)生的概率與試驗次數有關”的三種理解中,只有第二種理解是完全正確的,第一種理解雖然避開了本質矛盾,但和第三種理解一樣都難以逾越“事件A在一次試驗中發(fā)生的概率與試驗次數有關”這一理解障礙。另外,從教材內容銜接角度上看,盡管教材中的“自相矛盾”只是表面現象,非本質問題,不能因此判定教材中泊松定理的表述是錯誤的,但至少是不準確的,容易產生像如上所述的第一和第三種情況的誤解,故對泊松定理的重述很有必要。那又應該怎樣重述?
對于泊松定理的準確表述應基于以下三點:一是為避免出現如上所述的第三種誤解,事件A應明確是不同伯努利試驗下的事件,事件不同其概率pn自然不同;二是為避免出現如上所述的第一種誤解,不同的伯努利試驗應該用不同重數表示,這樣學生對事件A在一次試驗中發(fā)生的概率pn的變化原因的理解就不會產生分歧:是由于伯努利試驗本身的不同造成的,與伯努利試驗的次數無關;三是考慮到泊松分布當參數λ充分大時其極限分布為正態(tài)分布這一結論,應強調λ不應太大,否則二項分布的極限分布為正態(tài)分布,而不是泊松分布了。
綜上所述,泊松定理應表述為:有一系列的伯努利試驗序列:在第i個n(ini為正整數)重的伯努利試驗中,每次試驗只有兩個結果Ai和表示事件Ai在一次試驗中發(fā)生的概率,Xi表示此ni重的伯努利試驗中事件出現Ai的次數,則Xi~B(ni,pi),i=1,2,……,n,……。當隨機變量序列{Xi}的參數列{(ni,pi)}(i=1,2,……,n,……)滿足
即泊松定理的實質是:當二項分布的兩個參數滿足:第一個參數ni充分大,且此時兩個參數的乘積nipi不太大時,其極限分布為參數為nipi的泊松分布。該定理的證明和現有教材中的證明類似,只需將現有教材證明過程中的n換成ni,pn換成pi即可,不再贅述。
3.3 教材中的泊松定理是重述的泊松定理的一個特例
在3.2中所述的泊松定理中,令ni=i,則此定理為教材[1]-[5]中所述的泊松定理。進一步,若理解了泊松定理的實質,記二項分布的兩個參數仍為n,p,則重述的泊松定理就是教材[7]中所述的泊松定理。因此,教材[1]-[6]中的泊松定理只是重述的泊松定理的一種特殊情形。
泊松定理給出特定類型的二項分布和泊松分布的關系,在二項分布的近似計算中應用廣泛。但多數教材對于泊松定理的相關表述不準確,學生對此不僅難以理解,而且容易與二項分布的正確理解發(fā)生沖突,形成學習和應用過程中不應該有的一個障礙。鑒于此,文章首先指出多數教材對該定理的相關表述不準確,容易產生誤解;其次借助于n重伯努利試驗的特征及對教材中泊松定理相關表述的三種理解基礎之上,明確了泊松定理的條件中“事件A在一次試驗中發(fā)生的概率與試驗次數有關”的準確理解;同時指出產生誤解是由于泊松定理的敘述不準確造成的,從而對泊松定理的重述很有必要。最后,給出泊松定理的準確表述,并進一步指出現有教材[1]-[6]中的泊松定理是文中重述的泊松定理的一種特殊情形。
[1]茆詩松,程依明,濮曉龍.概率論與數理統計教程(第二版)[M].北京:高等教育出版社,2011,93—99.
[2]魏宗舒.概率論與數理統計教程[M].北京:高等教育出版社,1983,65—66
[3]盛驟,謝式千,潘承毅.概率論與數理統計教程(第四版)[M].北京:高等教育出版社,37—38.
[4]韓旭里,謝永欽.概率論與數理統計[M].上海:復旦大學出版社,2006,38—39.
[5]楊振明.概率論(第二版)[M].北京:科學出版社,2004,66.
[6]翟明娟.概率統計中有關超幾何分布的一個誤解[J].統計與決策,2014(03):26—28.
[7]沈恒范.概率論與數理統計教程(第四版)[M].北京:高等教育出版社,2003,47—48.
(責任編輯 趙巨濤)
O212
A
1673-2015(2015)05-0061-04
2015—08—13
翟明娟(1976—)女,山西運城人,副教授,主要從事統計方法及其應用方向研究。