劉小寧
(溫州大學(xué)數(shù)學(xué)與信息科學(xué)學(xué)院,浙江溫州 325035)
基于ECM算法的混合改進(jìn)威布爾分布的參數(shù)估計(jì)
劉小寧
(溫州大學(xué)數(shù)學(xué)與信息科學(xué)學(xué)院,浙江溫州 325035)
混合改進(jìn)威布爾分布是壽命數(shù)據(jù)分析中重要的統(tǒng)計(jì)模型,但是利用矩估計(jì)、極大似然估計(jì)等傳統(tǒng)的統(tǒng)計(jì)方法來(lái)估計(jì)模型的參數(shù)比較困難.應(yīng)用結(jié)合牛頓迭代法的 ECM 算法研究了混合改進(jìn)威布爾分布在正常工作條件下的完全數(shù)據(jù)場(chǎng)合、截尾數(shù)據(jù)場(chǎng)合的參數(shù)估計(jì)問(wèn)題,并得出了相應(yīng)數(shù)據(jù)場(chǎng)合下各參數(shù)的極大似然估計(jì).
混合改進(jìn)威布爾分布;ECM算法;牛頓迭代法;完全數(shù)據(jù);截尾數(shù)據(jù)
壽命數(shù)據(jù)分析已經(jīng)成為工業(yè)、生命科學(xué)等多個(gè)領(lǐng)域研究的熱點(diǎn)問(wèn)題.在壽命可靠性分析中,經(jīng)常會(huì)用到威布爾分布,一般形式為二參數(shù)威布爾分布,因其簡(jiǎn)單易解且具有優(yōu)良的統(tǒng)計(jì)性質(zhì)而被廣泛使用.然而對(duì)于具有以損耗失效為特征的某些機(jī)械零部件,與二參數(shù)威布爾分布相比,采用三參數(shù)威布爾分布進(jìn)行擬合和參數(shù)估計(jì),可以得到更高的精度,更能反映產(chǎn)品可靠性的實(shí)際情況,也更具合理性.改進(jìn)威布爾分布[1](the New Modified Weibull Distribution)是一項(xiàng)有浴缸形故障率函數(shù)的新的壽命分布,被認(rèn)為是另一有用的三參數(shù)威布爾分布的一般形式.對(duì)于單個(gè)總體壽命數(shù)據(jù)的分析,其統(tǒng)計(jì)方法已經(jīng)非常成熟,但是在實(shí)際應(yīng)用時(shí)經(jīng)常會(huì)遇到混合分布的情況.大量事實(shí)表明,混合改進(jìn)威布爾分布作為具有一個(gè)以上失效模式的單元的壽命分布模型是合適的,但是由于缺少混合改進(jìn)威布爾分布的統(tǒng)計(jì)分析方法,這種模型沒(méi)有得到廣泛應(yīng)用.目前國(guó)內(nèi)外研究多是對(duì)三參數(shù)威布爾分布進(jìn)行參數(shù)估計(jì),往往是單個(gè)總體,如嚴(yán)曉東等[2]選擇常用的5種三參數(shù)威布爾分布參數(shù)估計(jì)法進(jìn)行比較研究,湯銀才等[3]給出了三參數(shù)威布爾分布參數(shù)的貝葉斯估計(jì).對(duì)于混合威布爾分布的參數(shù)估計(jì)研究,多數(shù)討論的是混合二參數(shù)威布爾分布,如蔣卉等[4]利用ECM(Expectation Constraint Maximization)算法對(duì)混合二參數(shù)威布爾分布進(jìn)行參數(shù)估計(jì),取得了較好的成果.對(duì)于混合三參數(shù)威布爾分布的參數(shù)估計(jì)研究較少,張錫清[5]采用混合三參數(shù)威布爾分布來(lái)描述齒輪的可靠性,用極大似然法估計(jì)分布參數(shù),并通過(guò)最優(yōu)化方法求極大似然值,取得了正確結(jié)果.
基于ECM算法在多參數(shù)估計(jì)方面的優(yōu)越性和混合改進(jìn)威布爾分布的實(shí)用性,本文構(gòu)造混合改進(jìn)威布爾分布,利用ECM算法,在完全數(shù)據(jù)場(chǎng)合和截尾數(shù)據(jù)場(chǎng)合下,對(duì)參數(shù)進(jìn)行估計(jì).為了研究方便,本文僅考慮兩個(gè)改進(jìn)威布爾分布混合的情形.下面記NMWD(the New Modified Weibull Distribution)為新改進(jìn)的威布爾分布.
1.1 ECM算法
EM(Expectation Maximization)算法是近幾年發(fā)展很快且應(yīng)用很廣的一種估計(jì)參數(shù)的方法,它是一種迭代方法,由Dempster等[6]提出,這種方法簡(jiǎn)化了極大似然估計(jì)的計(jì)算.當(dāng)極大化無(wú)顯式表示時(shí),給出了廣義EM算法,即GEM(General Expectation Maximization)算法.Meng等[7]提出了一種特殊的GEM算法,稱之為ECM算法,該算法保留了EM算法的簡(jiǎn)單性和穩(wěn)定性.
EM算法主要用來(lái)解決不完全數(shù)據(jù)情況下對(duì)未知參數(shù)進(jìn)行極大似然估計(jì)的問(wèn)題.假設(shè)Y是觀測(cè)數(shù)據(jù),Z是潛在數(shù)據(jù),θ是未知參數(shù),以表示θ的基于觀測(cè)數(shù)據(jù)Y的后驗(yàn)分布密度函數(shù).表示添加數(shù)據(jù)Z后得到的關(guān)于θ的后驗(yàn)分布密度函數(shù),表示在給定θ和觀測(cè)數(shù)據(jù)Y下潛在數(shù)據(jù)Z的條件分布密度函數(shù).我們計(jì)算的目的是觀測(cè)后驗(yàn)分布的眾數(shù).于是,EM算法可以如下進(jìn)行,記θ(m)為第m+1次迭代開始時(shí)后驗(yàn)眾數(shù)的估計(jì)值,則第m+1次迭代的兩步為:
1.2 牛頓迭代法
牛頓迭代法又稱為牛頓-拉夫遜方法,它是牛頓在17世紀(jì)提出的一種在實(shí)數(shù)域和復(fù)數(shù)域上近似求解方程的算法.我們知道大量非線性方程不存在顯示解,求精確根非常困難,甚至不可能,而牛頓迭代法是解非線性方程最著名和最有效的方法之一.所謂牛頓迭代法,其基本思想是將非線性方程轉(zhuǎn)化為線性方程來(lái)求解.
設(shè)f(x)為一個(gè)連續(xù)可微的分布函數(shù),f(x)在點(diǎn)x0的某領(lǐng)域內(nèi)展開成泰勒級(jí)數(shù).的情況下,取其線性部分,并令其等于0,即,以此作為非線性方程的近似方程.若,則其解為,這樣,得到牛頓迭代法的一個(gè)迭代關(guān)系式
混合分布的參數(shù)估計(jì)用常規(guī)方法很難得到其極大似然估計(jì),而用ECM算法可以很好地解決這一難題.下面我們用ECM算法來(lái)求混合改進(jìn)威布爾分布在完全數(shù)據(jù)場(chǎng)合的參數(shù)估計(jì).
由于我們不知道Xi是來(lái)自 f1i還是來(lái)自 f2i的改進(jìn)威布爾總體,因而Ii是不能被觀測(cè)到的隨機(jī)變量.Xi和Ii的聯(lián)合分布為
從而在Xi給定下,Ii的條件分布為:
文中k=7,每一步條件極大化可按下面的方法求得.
3.1 定數(shù)截尾情形
如果觀測(cè)到有r個(gè)產(chǎn)品失效則停止試驗(yàn),觀測(cè)時(shí)間為xr,則有(n-r)個(gè)產(chǎn)品未失效.記:
其中Sj ,j=1,2表示(n-r)個(gè)未失效產(chǎn)品的生存函數(shù).對(duì)于沒(méi)有截尾的樣品, Xi和的聯(lián)合分布為.在給定條件下,Ii的條件分布:
1)E步:求期望(m=1,2,...).
3.2 定時(shí)截尾情形
如果壽命試驗(yàn)進(jìn)行到時(shí)刻τ為止,有r個(gè)產(chǎn)品失效,則有(n-r)個(gè)產(chǎn)品未失效.記:
給定初始值(0)θ 的ECM算法的步驟為:
混合改進(jìn)威布爾分布是壽命數(shù)據(jù)分析中一個(gè)重要的統(tǒng)計(jì)模型,但是利用傳統(tǒng)的統(tǒng)計(jì)方法如矩估計(jì)、極大似然估計(jì)等來(lái)估計(jì)模型參數(shù)是比較困難的.在混合 NMWD分布中,待估參數(shù)為,本文在利用ECM算法對(duì)混合NMWD分布進(jìn)行參數(shù)估計(jì)時(shí),只能得到p,a1,a2的顯示解,而無(wú)顯示解,文中用牛頓迭代法得到的近似解.本文為混合NMWD分布的參數(shù)估計(jì)提供了一種有效方法,不過(guò)還存在一些地方需要探討,比如文中為了讓算法介紹的清晰性和簡(jiǎn)潔性,只討論了兩個(gè)分布的混合,而兩個(gè)總體的樣本區(qū)分度在小樣本場(chǎng)合或數(shù)據(jù)缺失較多的情況下,該方法參數(shù)估計(jì)的效率較低.牛頓迭代法具有二階收斂速度,且方法簡(jiǎn)單,不過(guò)其初始值的選取比較苛刻,由此可嘗試用其他迭代方法(如Chebyshev迭代算法[11])對(duì)混合NMWD分布進(jìn)行參數(shù)估計(jì).
參考文獻(xiàn)
[1] Lai C D,Xie M,Murthy D N P. A modified weibull distribution [J]. Ieee Transactions on Reliability,2003,52(1): 33-37.
[2] 嚴(yán)曉東,馬翔,鄭榮躍,等.三參數(shù)威布爾分布參數(shù)估計(jì)方法的比較[J].寧波大學(xué)學(xué)報(bào)(理工版),2005,18(3):301-305.
[3] 湯銀才,侯道燕.三參數(shù)Weibull分布參數(shù)的Bayes估計(jì)[J].系統(tǒng)科學(xué)與數(shù)學(xué),2009,29(1):109-115.
[4] 蔣卉,湯銀才.混合Weibull分布參數(shù)估計(jì)的ECM算法[J].系統(tǒng)科學(xué)與數(shù)學(xué),2010,30(1):79-88.
[5] 張錫清.混合三參數(shù)威布爾分布的參數(shù)估計(jì)[J].哈爾濱電工學(xué)院學(xué)報(bào),1996,19(1):1-7.
[6] Dempster A P,Laird N,Rubin D B. Maximan likelihood estimation from incomplete data via the EM algorithm (with discussion) [J]. J Roy Statist Soc B,1977,39: 1-38.
[7] Meng X L,Rubin D B. Maximum likelihood estimation via the ECM algorithm [J]. A General Framework Biometrika,1993,80(2): 267-278.
[8] 茆詩(shī)松,王靜龍,濮曉龍.高等數(shù)理統(tǒng)計(jì)[M].2版.北京:高等教育出版社,2006:427-439.
[9] 康兆敏,方秀男.?dāng)?shù)值計(jì)算方法[M].2版.北京:清華大學(xué)出版社,2013:32-42.
[10] 茆詩(shī)松,湯銀才,王玲玲.可靠性統(tǒng)計(jì)[M].北京:高等教育出版社,2008:97-108.
[11] 李光輝,張洪,葉緒國(guó).混合Weibull分布參數(shù)估計(jì)的MCEM算法[J].重慶師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,32(2):123-132.
Parameter Estimation of the Mixture Newly-Modified Weibull Distribution Based on ECM Algorithm
LIU Xiaoning
(College of Mathematics and Information Science,Wenzhou University,Wenzhou,China 325035)
The paper probes into the mixture newly modified Weibull distribution which is an important statistical model in life data analysis. However,it is quite different to estimate the parameters of the model by means of traditional statistical methods such as the moment estimation,the maximum likelihood estimation (MLE). The application of the ECM algorithm combined with Newton iterative method to study the complete sample data occasion with the mixture newly modified Weibull model under the normal operating conditions,the parameter estimation problem of censored data occasion. The maximum likelihood estimation (MLE) of all parameters under the relevant data occasion is thereby obtained.
The Mixture Newly-modified Weibull Distribution; ECM Algorithm; Newton Iterative Method; Complete Sample Data; Censored Sample Data
O213.2
:A
:1674-3563(2017)01-0001-11
10.3875/j.issn.1674-3563.2017.01.001 本文的PDF文件可以從xuebao.wzu.edu.cn獲得
(編輯:封毅)
2015-09-30
國(guó)家自然科學(xué)基金項(xiàng)目(11201345);溫州大學(xué)研究生創(chuàng)新基金(3162015028)
劉小寧(1991- ),女,河北邯鄲人,碩士研究生,研究方向:應(yīng)用統(tǒng)計(jì)與數(shù)理金融