代 瑩,王蓉華,徐曉嶺
(1.上海師范大學(xué) 數(shù)理學(xué)院,上海 200234;2.上海對(duì)外經(jīng)貿(mào)大學(xué) 統(tǒng)計(jì)與信息學(xué)院,上海 201620)
非負(fù)隨機(jī)變量X服從參數(shù)為θ的Lindley分布,則其概率密度函數(shù)f(x)和分布函數(shù)
Lindley分布是由Lindley[1,2]提出的一種分析壽命數(shù)據(jù)的新的分布。該分布在應(yīng)力-強(qiáng)度模型的可靠性研究中具有非常重要的作用,而且Ghitany等人在文獻(xiàn)[3]中指出,Lindley分布具有的很多數(shù)學(xué)性質(zhì)比指數(shù)分布的還要靈活,利用Lindley分布模型來(lái)擬合壽命數(shù)據(jù)在很多方面比用指數(shù)分布模型的效果還要好。Zakerzadeh和Dolai在文獻(xiàn)[4]中提出了廣義Lindley分布。文獻(xiàn)[5]和文獻(xiàn)[6]中也分別對(duì)Poisson-Lindley分布和zero-truncated Poisson-Lindley分布進(jìn)行了討論。杜偉娟等在文獻(xiàn)[7]中討論了獨(dú)立同分布樣本情形下Lindley分布參數(shù)的經(jīng)驗(yàn)Bayes(EB)單側(cè)檢驗(yàn)問(wèn)題,利用密度函數(shù)的遞歸核估計(jì)構(gòu)造了參數(shù)的EB檢驗(yàn)函數(shù),在適當(dāng)條件下證明了所提出的EB檢驗(yàn)函數(shù)的漸近最優(yōu)性,并獲得了其收斂速度。龍兵在文獻(xiàn)[8]中研究了Lindley分布參數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn)問(wèn)題,在全樣本場(chǎng)合下給出了參數(shù)的置信區(qū)間和假設(shè)檢驗(yàn)的拒絕域,并通過(guò)Monte-Carlo模擬說(shuō)明了所給方法的應(yīng)用。
Lindley分布有如下基本性質(zhì):
定理1[3]:設(shè)非隨機(jī)變量X服從參數(shù)為θ的Lindley分布,則:
(6)當(dāng)θ≥1時(shí),f(x)嚴(yán)格單調(diào)下降;當(dāng) 0<θ<1時(shí),f(x)呈“倒浴盆”形;
設(shè)產(chǎn)品壽命X服從參數(shù)為θ的Lindley分布,隨機(jī)從一批產(chǎn)品中抽取n個(gè)樣品進(jìn)行壽命試驗(yàn),定時(shí)截尾時(shí)間為t0,若記xk為第k個(gè)樣品的壽命,則第k個(gè)樣品的試驗(yàn)時(shí)間Sk(t0)是如下隨機(jī)變量:
其試驗(yàn)總時(shí)間為:
顯然,S1(t0),S2(t0),…,Sn(t0)是獨(dú)立同分布的隨機(jī)變量,若記其分布函數(shù)為G(t),則在t≤0時(shí),Sk(t0)的分布函數(shù)G(t)=0,當(dāng)t>0時(shí)有:
上式的第一項(xiàng)為:
上式第二項(xiàng)為:
由此可得Sk(t0)的分布函數(shù)為:
由Sk(t0)的分布函數(shù)可以看出,諸Sk(t0)是既非離散又非連續(xù)的隨機(jī)變量,由于Sk(t0)又都是有界隨機(jī)變量,它的期望與方差總存在,分別為:
容易驗(yàn)證,當(dāng)t0→+∞時(shí),上述期望和方差分別為L(zhǎng)indley分布的期望和方差。
S1(t0),S2(t0),…,Sn(t0)是獨(dú)立同分布的有界隨機(jī)變量,所以由中心極限定理知,當(dāng)n很大時(shí),總試驗(yàn)時(shí)間S(t0)近似服從正態(tài)分布,即:
首先給出定時(shí)截尾下參數(shù)θ的極大似然估計(jì)。設(shè)X1,X2,…,Xn為來(lái)自參數(shù)為θ的Lindley分布總體X的一個(gè)容量為n的樣本,試驗(yàn)進(jìn)行到t0(t0是預(yù)先給定的正數(shù))時(shí)刻停止。設(shè)在時(shí)刻t0以前有r個(gè)產(chǎn)品失效,記相應(yīng)的失效時(shí)間為x(1)≤x(2)≤…≤x(r)≤t0
似然函數(shù)為:
則上述方程的根即為參數(shù)θ的極大似然估計(jì)。
引 理 :對(duì)a>0,θ>0 的 方 程有唯一正實(shí)根。
則所求方程有唯一正實(shí)根。
下面用所得的參數(shù)θ的極大似然估計(jì)部分替換樞軸量H(θ)中的θ,從而容易得出近似置信區(qū)間和近似置信限。
記Uα2為標(biāo)準(zhǔn)正態(tài)分布的上側(cè)α2分位數(shù),則參數(shù)θ的置信水平為 1-α的近似置信區(qū)間為 [1,2],其中1,2分別為如下方程的根:
也即:
首先產(chǎn)生來(lái)自Lindley分布θ=0.5,θ=1,θ=1.5,θ=2,θ=2.5,θ=3的隨機(jī)樣本,其樣本容量分別為10,15,20,25,30,然后取置信水平為α=0.1,根據(jù)上述公式計(jì)算θ的近似置信區(qū)間,如此重復(fù)1000次計(jì)算出各個(gè)樣本量和各種截尾次數(shù)下近似置信區(qū)間的覆蓋率及區(qū)間長(zhǎng)度如表1所示。
表1 近似置信區(qū)間的覆蓋率和平均長(zhǎng)度
從上述模擬結(jié)果可以看出,在置信水平方面該方法還是可行的。
例1:取n=35,θ=0.5隨機(jī)產(chǎn)生一組服從Lindley分布的數(shù)據(jù):
0.0862 ,0.2368,0.5039,0.5777,0.8323,0.9287,1.0101,
1.1329 ,1.1397,1.3328,1.3364,1.3729,1.4431,1.5088,
1.5890 ,1.7558,1.9672,2.0647,2.2915,2.4510,2.5994,
3.0736 ,3.3280,3.4773,3.8549,3.9115,4.5798,5.0378,
5.1388 ,5.7566,6.7986,7.1352,7.3523,9.5156,10.8070
取截尾時(shí)間t0=5,取置信水平為α=0.1,標(biāo)準(zhǔn)正態(tài)分布的分位數(shù)U0.05=1.64,在定時(shí)截尾樣本下θ的極大似然估計(jì)為=0.5266,按上述方法得到的近似置信區(qū)間為[0.3656,0.8547]。
例2:文獻(xiàn)[9]中某一型號(hào)坦克維修過(guò)程中,經(jīng)過(guò)47次觀察得到基層Ⅰ級(jí)預(yù)防性維修二級(jí)保養(yǎng)時(shí)間的現(xiàn)場(chǎng)觀測(cè)值如下(單位:小時(shí)):
0.80 ,1.00,1.00,1.41,1.50,1.50,1.50,2.00,2.00,2.00
2.00 ,2.50,2.50,2.75,3.20,3.30,3.70,3.80,3.80,4.00
4.00 ,4.00,4.00,4.00,4.00,4.10,5.00,5.00,5.50,5.50
5.50 ,6.00,6.50,7.00,7.16,7.75,8.00,8.00,9.50,9.73
10.00 ,11.40,12.00,12.00,14.00,15.21,15.50
先對(duì)樣本數(shù)據(jù)進(jìn)行擬合檢驗(yàn),檢驗(yàn)其是否服從Lindley分布:
在文獻(xiàn)[9]中對(duì)樣本數(shù)據(jù)進(jìn)行了χ2擬合優(yōu)度檢驗(yàn),按照文獻(xiàn)[9]的分組方法對(duì)樣本進(jìn)行分組,假設(shè)H0:該型坦克的基層Ⅰ級(jí)預(yù)防性維修二級(jí)保養(yǎng)時(shí)間服從艾拉姆伽分布,參數(shù)t0的極大似然估計(jì)為:t?0=5.4598,檢驗(yàn)結(jié)果如表2所示。
表2 原假設(shè)H0的 χ2檢驗(yàn)計(jì)算結(jié)果
χ2擬合優(yōu)度檢驗(yàn)的自由度取值為:區(qū)間數(shù)-未知參數(shù)個(gè)數(shù)-1,在文獻(xiàn)[9]中將樣本分成了6個(gè)區(qū)間,艾拉姆伽分布的分布函數(shù)中含有一個(gè)未知參數(shù)θ,但其檢驗(yàn)的自由度取3,這是不正確的,所以此處取自由度為4更為妥當(dāng)。
χ2擬合優(yōu)度檢驗(yàn)依賴于區(qū)間的劃分,即使原假設(shè)H0:F(x)=F0(x)不成立,在某種劃分下還是可能有F(ai)-F(ai-1)=F0(ai)-F0(ai-1)=pi0,i=1,2,…,m,從 而不影響統(tǒng)計(jì)量的值。所以,下面用柯?tīng)柲缏宸驒z驗(yàn)對(duì)樣本數(shù)據(jù)進(jìn)行檢驗(yàn)。
柯?tīng)柲缏宸驒z驗(yàn):設(shè)隨機(jī)變量X的分布函數(shù)F(x)未知,X1,X2,…,Xn為從中抽取的簡(jiǎn)單隨機(jī)樣本,F(xiàn)0(x)為給定的某個(gè)分布函數(shù)。檢驗(yàn)問(wèn)題H0:F(x)=F0(x)。首先,將樣本觀測(cè)值從小到大排列為x(1),x(2),…,x(n),求出F(x)的經(jīng)驗(yàn)分布函數(shù)為:
給出檢驗(yàn)水平α,查表得到檢驗(yàn)的臨界值Dn,α,在n較大時(shí)可近似的決定檢驗(yàn)的臨界值,其中,當(dāng)α給定時(shí),λ可查表求出。若Dn>Dn,α則拒絕原假設(shè)H0,否則就接受原假設(shè)H0。
柯?tīng)柲缏宸驒z驗(yàn)此樣本是否服從Lindley分布:取置信水平為α=0.05 ,查表得λ1-α=1.36,則檢驗(yàn)統(tǒng)計(jì)量:
故接受原假設(shè)H0,即認(rèn)為這批產(chǎn)品的壽命服從Lindley分布。
如取定時(shí)截尾時(shí)間為t0=9,置信水平為α=0.1,標(biāo)準(zhǔn)正態(tài)分布的分位數(shù)U0.05=1.64,在定時(shí)截尾樣本下θ的極大似然估計(jì)為=0.3137,按上述方法得到的近似置信區(qū)間為[0.1714,0.5058]。
[1]Lindley D,Introduction to Probability and Statistics from a Bayesian Viewpoint[J].Cambridge University Press,1965.
[2]Lindley D V,Fiducial Distributions and Bayes’theorem[J].Journal of the Royal Statistical Society,1958,(20).
[3]Ghitany M E,Atieh B,Nadarajah S.Lindley Distribution and Its Application[J].Mathematics and Computers in Simulation,2008,78(4).
[4]Zakerzadeh H,Dolati A.Generalized Lindley Distribution[J].Journal of Mathematical Extension,2017.
[5]Sankaran M,The Discrete Poisson-Lindley Distribution[J].Biometrics,1970,(26).
[6]Ghitany M E,Al-Mutairi D K,Nadarajah S.Zero-truncated Poisson-Lindley Distribution and Its Application[J].Mathematics and Computers in Simulation,2008,79(3).
[7]杜偉娟,彭家龍,李體政.Lindley分布參數(shù)的經(jīng)驗(yàn)Bayes檢驗(yàn)的收斂速度[J].統(tǒng)計(jì)與決策,2012,(21).
[8]龍兵.Lindley分布中參數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn)[J].廣西民族大學(xué)學(xué)報(bào),2014,20(1).
[9]呂會(huì)強(qiáng),高連華,陳春良.艾拉姆咖分布及其在保障性數(shù)據(jù)分析中的應(yīng)用[J].裝甲兵工程學(xué)院學(xué)報(bào),2000,16(3).