李曉康
(陜西理工學院 數(shù)學與計算機科學學院, 陜西 漢中 723000)
兩點分布是一類最基本、最簡單的統(tǒng)計分布,它描述僅有兩種狀態(tài)(其中一個結果視為成功,另一個結果視為失敗)的隨機現(xiàn)象,許多隨機現(xiàn)象都可用它進行描述,如產(chǎn)品合格率問題、疾病發(fā)病率問題等。故對其參數(shù)(成功概率)的估計成為統(tǒng)計中的重要問題?;诓煌慕y(tǒng)計思想,可給出不同的估計,常用的有矩估計、極大似然估計等。按照Bayes統(tǒng)計學的觀點,參數(shù)估計問題可視為一個特殊的統(tǒng)計決策問題,可按照一定的標準進行評價,如均方誤差風險等,在不同的先驗信息下,會給出不同的估計,不同的估計即為不同的決策。故可在不同的先驗下,尋找風險最小的估計。對此問題,已取得了一些結果。[1-6]
本文在幾種不同先驗信息和平方損失下研究了0-1分布參數(shù)的Bayes估計,討論了其性質(zhì),并進行了數(shù)值仿真實驗,利用仿真實驗結果對其進行比較。
Bayes理論認為:未知參數(shù)θ可視為隨機變量,可用某種概率分布π(θ)去描述。至于具體用何種分布去描述,依賴于對總體參數(shù)過去的認識,是取得樣本前已有的,稱為先驗信息(亦稱先驗分布)。本文對0-1分布未知參數(shù)θ(成功概率)的先驗分布考慮如下兩種。
此種先驗分布無任何先驗信息可用,故先驗分布可取為參數(shù)空間Θ上的均勻分布。對0-1分布,其成功概率θ的無信息先驗分布可取為區(qū)間[0,1]上的均勻分布,即:
(1)
Jeffreys先驗分布為參數(shù)θ的Fisher信息陣的行列式的平方根[1],即:
π2(θ)=[I(θ)]1/2,
本文假設:總體X~b(1,θ),分布列P(X=x|θ)=θx(1-θ)1-x,x=0,1。
樣本聯(lián)合條件分布(似然函數(shù)):
對數(shù)似然函數(shù):
xlnθ+(n-x)ln(1-θ),
,
故
π2(θ)=[I(θ)]1/2∝θ-1/2(1-θ)-1/2。
(2)
Bayes理論認為:由先驗分布和樣本信息可計算后驗分布,即先驗分布+樣本信息?后驗分布:
π(θ)⊕p(x|θ)?π(θ|x),
此即Bayes公式:
(3)
下面按式(3)可計算后驗分布。
由式(1)給出的先驗分布及式(3)可得樣本與參數(shù)的聯(lián)合分布為
樣本邊際分布為
后驗分布為
(4)
由式(2)給出的先驗分布及式(3)可得樣本與參數(shù)的聯(lián)合分布為
樣本邊際分布為
故由Bayes公式,先驗分布π2(θ)的后驗分布為
(5)
參數(shù)的Bayes估計依賴于損失函數(shù),本文選取平方損失函數(shù),即:
在此損失函數(shù)下,參數(shù)的Bayes估計有以下結論:
由此結論,對本文給出的兩種先驗分布,有如下結果:
由式(4)給出的后驗分布,有:
由式(5)給出的后驗分布,有:
即:兩種估計都不是θ的無偏估計,但都是θ的漸近無偏估計。
均方誤差的定義為:
θ)2。
對如上給出的兩種參數(shù)估計,可計算其均方誤差:
Bayes估計的風險定義為后驗分布下的平均損失,即:
兩種估計的風險分別為:
由以上結果可以看出,兩種估計的均方誤差取決于樣本容量n和參數(shù)真值θ的大小,風險取決于樣本觀測值與樣本容量n的大小,可以證明:
,R1(n,x) 下面通過數(shù)值仿真來討論其性質(zhì)。 對如上給出的兩種參數(shù)估計,對不同的樣本容量n和參數(shù)真值θ,下面采用數(shù)值仿真計算結果進行比較。 對樣本容量n=30,50時的不同參數(shù)真值及不同樣本觀測值,經(jīng)隨機模擬仿真實驗,產(chǎn)生的隨機樣本,計算兩種估計的均方誤差及風險,部分結果如表1—表4、圖1—圖4所示。 表1 n=30時不同參數(shù)真值的均方誤差 表2 n=50時不同參數(shù)真值的均方誤差 表3 n=30時不同樣本觀測值的風險 表4 n=50時不同樣本觀測值的風險 圖1 n=30時不同參數(shù)真值的均方誤差 圖2 n=50時不同參數(shù)真值的均方誤差 圖3 n=30時不同樣本觀測值的風險 圖4 n=50時不同樣本觀測值的風險 由表1—表4及圖1—圖2可以看出,當n=30,50時,對不同參數(shù)真值,兩種估計的均方誤差都具有隨參數(shù)真值先增大、后減小的趨勢;對不同的樣本觀測值,兩種估計的風險也具有隨樣本觀測值先增大,后減小的趨勢;總體來講,無信息先驗分布下估計的均方誤差及風險要小于Jeffreys先驗分布下估計的均方誤差及風險。 [參考文獻] [1] 茆詩松,王靜龍,濮曉龍.高等數(shù)理統(tǒng)計[M].北京:高等教育出版社,1998. [2] 李曉康.不同損失函數(shù)下0-1分布參數(shù)的Bayes估計[J].廊坊師范學院學報:自然科學版,2013,13(2):8-10. [3] 王晶,劉福升.不同損失函數(shù)下不同無信息先驗的Bayes估計及比較[J].山東科技大學學報:自然科學版,2005,24(4):95-98. [4] 陳宜輝,姜禮平,吳樹和.無信息先驗下幾種不同Bayes估計的比較[J].海軍工程大學學報,2001,13(5):97-99. [5] BERGER O.統(tǒng)計決策及貝葉斯分析[M].賈乃光,譯.北京:中國統(tǒng)計出版社,1998.5 數(shù)值仿真及結論