李 陽,趙志文
在統(tǒng)計學(xué)研究中,部分缺失數(shù)據(jù)一直是統(tǒng)計學(xué)家值得研究的問題.文獻[1]研究了兩點分布的相關(guān)知識,得到了如何估計產(chǎn)品的合格率,種子的發(fā)芽率和兩種產(chǎn)品的某種指標(biāo)是否相等的問題.文獻[2]通過對產(chǎn)品壽命的研究,得到了具有部分缺失數(shù)據(jù)的兩個指數(shù)的總體參數(shù)估計以及假設(shè)檢驗問題.文獻[3]通過對混合指數(shù)分布總體的研究,得到了不同場合下的混合指數(shù)分布總體的參數(shù)估計.文獻[4]在定數(shù)截尾下,利用樣本獲得估計量,并計算其收斂速度.
假設(shè)混合兩點分布的密度函數(shù)為f(x,q,γ1,γ2)=
其中,取γi>0(i=1,2)為第一個總體的未知參數(shù),分別對兩個混合兩點分布進行n次獨立觀測,觀測時,每一個樣本以1-p的概率缺失.第一個總體觀測值為(Xi,δi),i=1,2,…,n,其中,Xi表示第一個混合兩點分布總體的第i個樣本觀測值,若第i個樣本值丟失時,記δi=0,否則記δi=1.
下面考慮用矩估計的方法對未知參數(shù)p1,p2進行估計.建立矩估計方程為
解此方程得
同理,θi>0(i=1,2)為第二個總體的未知參數(shù),第二個總體觀測值為(Zi,ηi),其中,Yi表示第二個混合兩點分布總體的第i個樣本觀測值,若第i個樣本值丟失時,記ηi=0,否則記ηi=1.得到另一組觀測值(Zi,ηi) 后,得到η1,η2的矩估計
對于如上參數(shù)γi(i=1,2) ,θi(i=1,2)的矩估計,有下面的相合性和漸近正態(tài)性.
證明 {Xiδi,1≤i≤n} 為獨立同分布隨機變量序列,由強大數(shù)定律知a.s.,其中,同理可得
定理2 在上述記號下,有
同理,令
在實際中獲得兩組樣本,那么這兩組樣本是否來自于一個總體一直是我們關(guān)心的問題.因此,可以把一問題理解為檢驗兩個總體參數(shù)是否相 等.研 究 的 假 設(shè) 檢 驗 為H0:γ1-θ1=0?H1:γ1-θ1≠0 ,G0:γ2-θ2=0?G1:γ2-θ2≠0.
表1 模擬結(jié)果
定理3(檢驗統(tǒng)計量)若為參數(shù)γ1的矩 估計,為參數(shù)θ1的矩估計,則
下面研究 Δ 的漸近置信區(qū)間,令 Δ1=γ1-θ1.對 于 0<α<1,令ξα滿足于是得α給定的置信區(qū)間,漸近置信區(qū)間Δ1為
同理,得Δ2=γ2-θ2的漸近置信區(qū)間.
置信水平取為α=0.95.n=100為樣本量,缺失概率為1-P=0.10時的模擬結(jié)果如表1所示.其中,參數(shù)差的絕對值為分別表示參數(shù)γ1,γ2以及參數(shù)θ1,θ2的估計的偏差,覆蓋率(C.P) 為 | Δ|置信區(qū)間以及的平均值為隨機模擬500次的結(jié)果,覆蓋率則為隨機模擬500次的覆蓋率.
本文首先給出混合兩點分布的密度函數(shù),并利用矩估計的方法證明估計的相合性以及漸近正態(tài)性;其次,討論混合兩點分布參數(shù)相等的假設(shè)檢驗,給出檢驗統(tǒng)計量及其分布,進而得到了兩個總體參數(shù)之差的置信區(qū)間;最后對模型進行隨機模擬,結(jié)果表明文中方法具有可行性.通過對該方法的研究,為今后研究數(shù)據(jù)缺失問題打下了基礎(chǔ).