王炳章
(煙臺大學(xué) 數(shù)學(xué)與信息科學(xué)學(xué)院,山東 煙臺264005)
超幾何分布是概率論中的一種典型的離散型分布,文獻(xiàn)中有較多的討論[1-3].本文將要研究的是教材中極少涉及的負(fù)超幾何分布.在無放回抽樣模型中,設(shè)n為產(chǎn)品總數(shù)而m為其中的次品數(shù),則取到第r個次品時的抽取次數(shù)Xr的分布為
(1)
其中分布參數(shù)r;m,n都是正整數(shù)且滿足1≤r≤m 于是,在有放回抽樣中,取到第r個次品時的抽取次數(shù)即服從上述的帕斯卡分布(此時參數(shù)p=m/n). 文[6]中討論的分布是本文(1)式當(dāng)r=m時的特殊情況. 與帕斯卡分布類似,負(fù)超幾何隨機(jī)變量顯然有一種通常的逐段分解方法.文[7]中利用負(fù)超幾何隨機(jī)變量的一種特殊的伯努利變量(0-1變量)分解法,算出了負(fù)超幾何分布的期望與方差.但文[7]中給出的負(fù)超幾何分布的形式比較復(fù)雜,不便導(dǎo)出其多維聯(lián)合分布.本文首先討論多個負(fù)超幾何分布變量的聯(lián)合分布及若干推論,最后利用聯(lián)合分布的這些推論結(jié)合負(fù)超幾何隨機(jī)變量的通常的分解方法計算了負(fù)超幾何分布的期望和方差. 設(shè)X1,X2,…,Xr分別為第1次、第2次、…、第r次取到次品時的抽取次數(shù). 定理1設(shè)1≤i (2) 證利用文[8]中的不盡相異元素的排列模式,來確定m個次品的位置. 類似可以得到任意有限維的多維分布,從略. 推論1隨機(jī)向量(X1,X2,…,Xr)的聯(lián)合分布為 進(jìn)一步,令 Y1=X1,Y2=X2-X1,Y3=X3-X2,…,Yr=Xr-Xr-1, (3) 從而得到負(fù)超幾何變量Xr的通常的逐段分解式: Xr=Y1+Y2+…+Yr. (4) 每一段的變量Yi(1≤i≤r)是等待一個新的次品出現(xiàn)所需要進(jìn)行的抽取次數(shù),即是從第i-1個次品出現(xiàn)后到第i個次品出現(xiàn)所需要進(jìn)行的抽取次數(shù). 推論2隨機(jī)向量(Y1,Y2,…,Yr)的聯(lián)合分布為 證因為P(Y1=l1,Y2=l2,…,Yr=lr)=P(X1=l1,X2=l1+l2,…,Xr=l1+l2+…+lr), 由此根據(jù)推論1可看出欲證之式的正確性. 可以看出隨機(jī)向量(Y1,Y2,…,Yr)的多維分布形式上是對稱的. 推論3隨機(jī)向量(Y1,Y2,…,Yr)的每個分量Yi(1≤i≤r)的分布為 (5) 即Y1,Y2,…,Yr服從相同的負(fù)超幾何分布NH(1;m,n). 證利用引理1,根據(jù)求邊緣分布的公式得 類似地,取r=2可得如下推論4. 推論4隨機(jī)向量(Y1,Y2,…,Yr)的任何兩個分量Yi,Yj(1≤i,j≤r)的聯(lián)合分布為 (6) 定理2設(shè)隨機(jī)變量Y服從負(fù)超幾何分布NH(1;m,n), 則 證由Y~NH(1;m,n)得 有 故 進(jìn)而有 E[(n+1-Y)(n+2-Y)] 即 于是有 因此 上式化簡即可得到定理中D(Y)的表達(dá)式.定理2證畢. 結(jié)合推論3,對于i=1,2,…r, 有 (7) 定理3隨機(jī)向量(Y1,Y2,…,Yr)的任何兩個分量Yi,Yj(1≤i (8) 證利用推論4中Yi,Yj的聯(lián)合分布,有 將(7)中第一式E(Yj)=E(Y)=(n+1)/(m+1)代入得 于是有 進(jìn)而可求得 定理4對于(1)式中服從負(fù)超幾何分布NH(r,m,n)的隨機(jī)變量Xr,其數(shù)學(xué)期望和方差分別為 (9) 證利用負(fù)超幾何變量Xr的分解式(4),有 例1某工廠的7件產(chǎn)品中有4件廢品.作不放回抽樣,設(shè)X為抽到第3件廢品時的抽取次數(shù).求X的數(shù)學(xué)期望和方差. 解 法一由(1)式得X的概率分布如下 P(X=3)=8/70, P(X=4)=18/70, P(X=5)=24/70, P(X=6)=20/70, 故 EX=(3·8+4·18+5·24+6·20)/70=4.8, 法二由題意知X~NH(r,m,n), 取n=7,m=4,r=3,代入(9)式得EX=4.8,D(X)=0.96. 直接計算的結(jié)果與本文理論結(jié)果完全一致. 注1 在總數(shù)為n而廢品數(shù)為m的箱中作不放回抽樣.抽取次數(shù)為r時抽到的廢品數(shù)服從超幾何分布H(r,m,n); 而取得r個廢品時的抽取次數(shù)服從負(fù)超幾何分布NH(r,m,n). 負(fù)超幾何分布是不放回抽樣模型中的一種等待時間分布,對其性質(zhì)和數(shù)字特征的研究理論上具有重要意義,同時在統(tǒng)計推斷中也具有一定的應(yīng)用價值.本文首先給出了負(fù)超幾何變量的聯(lián)合分布,然后結(jié)合負(fù)超幾何變量的一種自然的分解法,計算得出了負(fù)超幾何分布的數(shù)學(xué)期望和方差.在教學(xué)過程中,適當(dāng)?shù)拇┎孱愃七@樣的素材,對提高學(xué)生的創(chuàng)新能力有著積極的作用. 致謝感謝相關(guān)文獻(xiàn)對本文的啟發(fā)以及審稿專家提出的寶貴意見.2 負(fù)超幾何變量的聯(lián)合分布及若干推論
3 負(fù)超幾何分布的期望與方差
DX=(32·8+42·18+52·24+62·20)/70-4.82=0.96.4 結(jié) 論
——國外課堂互動等待時間研究的現(xiàn)狀與啟示