第一作者鄭銳男,碩士,工程師,1985年4月生
三參數(shù)威布爾分布參數(shù)估計及在可靠性分析中的應用
鄭銳
(中國船舶重工集團公司第七一六研究所,江蘇連云港222006)
摘要:威布爾分布是可靠性中應用最廣泛的分布之一。三參數(shù)威布爾分布尤其適用于在開始使用時有一時間段內(nèi)不發(fā)生故障的情況。由于該分布的位置參數(shù)不等于0,在參數(shù)估計時不能采用簡單的參數(shù)估計方法實現(xiàn),限制了該分布形式在可靠性分析中的應用。根據(jù)三參數(shù)威布爾分布的特點提出了一種綜合圖解法和遺傳算法的參數(shù)估計方法,應用該方法可以獲得更精確的參數(shù)估計值。隨后應用于某系列數(shù)控車床計算機數(shù)控系統(tǒng)的故障分析中,驗證了參數(shù)估計方法的可行性。
關鍵詞:三參數(shù)威布爾分布;參數(shù)估計;圖解法;遺傳算法;數(shù)控機床
基金項目:國家自然科學
收稿日期:2013-09-03修改稿收到日期:2014-03-27
中圖分類號:TG659文獻標志碼:A
Parameter estimation of three-parameter Weibull distribution and its application in reliability analysis
ZHENGRui(The 716th Research Institute of China Shipbuildnig Industry Corporation, Lianyungang 222006,China)
Abstract:Weibull distribution is one of the most widely used distributions in reliability analysis. However, the application of three-parameter Weibull distribution is often limited due to the fact that its positional parameter is not equal to 0 and its parameters cannot be estimated with simple methods. Actually, the three-parameter Weibull distribution is particularly suitable for the case that there is no fault in a period of time at the beginning of use. Here, a parameter estimation method synthesizing graphical method and genetic algorithm for three-parameter Weibull distribution was presented according to the characteristics of the distribution. Then the three-parameter Weibull distribution with the proposed parameter estimation method was applied in failure analysis of a series of CNC lathes and successful results were achieved.
Key words:three-parameter Weibull distribution; parameter estimation,graphical method; genetic algorithm; CNC machine tools
可靠性分析的首要問題是尋找能夠確切反映系統(tǒng)故障機理并與故障數(shù)據(jù)的分析結(jié)果相符合的故障分布規(guī)律。常用的方法是將故障數(shù)據(jù)擬合成某種分布形式,在確定出各分布參數(shù)之后,對故障數(shù)據(jù)進行可靠性評估和預測[1]。
威布爾分布是描述機械系統(tǒng)及其零部件壽命數(shù)據(jù)分布規(guī)律最常用的一種分布形式[2]。兩參數(shù)威布爾分布憑借其參數(shù)估計簡單和適應性較強的特點在故障分析中占據(jù)重要的地位。兩參數(shù)威布爾分布描述的設備在t>0的任意時間內(nèi)都可能發(fā)生故障。然而,大量的工程實踐證明,許多設備在投入使用后一段時間段內(nèi)不會發(fā)生任何故障,這些設備的故障數(shù)據(jù)經(jīng)過威布爾變換后在威布爾概率紙上呈現(xiàn)的不再是一條直線,此時如果仍然采用兩參數(shù)威布爾分布模型擬合故障數(shù)據(jù)就可能會給可靠性分析帶來較大的誤差。三參數(shù)威布爾分布尤其適用于這種情況,能夠提供更精確的分析結(jié)果。
三參數(shù)威布爾分布的參數(shù)估計相比兩參數(shù)威布爾分布的參數(shù)估計要復雜得多,其最常用的參數(shù)估計方法是極大似然法[3]。三參數(shù)威布爾分布的似然方程組是非線性的,結(jié)構(gòu)十分復雜,常采用Newtom-Raphson迭代等方法求解。用這種方法求解時,初選值的選擇不當會導致迭代過程發(fā)散,無法得到最終結(jié)果。另外,三參數(shù)威布爾分布的參數(shù)估計方法還有雙線性回歸法、概率權(quán)重矩法、相關系數(shù)優(yōu)化法、灰色估計法、Bayes統(tǒng)計分析法等[4-8],這些方法針對不同樣本容量的適應能力各不相同,但都難免復雜的計算。本文提出一種綜合圖解法和遺傳算法的三參數(shù)威布爾分布參數(shù)估計方法,其中圖解法為遺傳算法提供搜索范圍,而遺傳算法可通過迭代獲得更精確的參數(shù)估計值。
1參數(shù)估計方法
1.1圖解法
三參數(shù)威布爾分布的可靠度函數(shù)表達式為
(1)
式中:β為形狀參數(shù),η為尺度參數(shù),γ為位置參數(shù)(t<γ時無故障)。
對式(1)兩次取自然對數(shù)后可以轉(zhuǎn)換為
ln{-ln[R(t)]}=βln(t-γ)-βln(η)
(2)
對式(2)作威布爾變換,即令y=ln{-ln[R(t)]},x=lnt,并不能得到線性函數(shù),但可以利用威布爾概率紙進行參數(shù)估計。根據(jù)式(2)的性質(zhì),當t-γ=0,即x=ln(γ)時,y趨向于-;而當t趨向于時,y=βx-βln(η)。即x=lnγ和y=βx-βln(η)是式(2)經(jīng)過威布爾變換后的得到的函數(shù)的兩條漸近線。由此可得三參數(shù)威布爾分布參數(shù)估計的步驟如下:
(2)在故障數(shù)據(jù)的WPP圖上擬合兩條漸近線:其中一條在所有散點左側(cè),垂直于橫坐標,其表達式為x=x0;另一條是當x趨向于∞時的漸近線,其表達式為y=kx-b。根據(jù)三參數(shù)威布爾分布的圖形性質(zhì)可得以下方程組。
(3)
1.2遺傳算法
圖1 遺傳算法流程圖 Fig.1Flow Chart of GA
遺傳算法(GA)具有較強的全局優(yōu)化能力,是一種自適應的、智能的搜索技術(shù),其最成功的應用領域是復雜的非線性優(yōu)化問題。遺傳算法是一種群體型操作,該操作以群體中的所有個體為對象,它的基本流程如圖1所示,包含6個基本要素。
(1)參數(shù)編碼。編碼是解空間向GA空間的映射,是連接問題與算法的橋梁。編碼的方法有二進制編碼,實數(shù)編碼,區(qū)間值編碼等。編碼方法的選擇將直接影響選擇、雜交、變異等算子的設計,也影響算法的復雜性。
(2)生成初始群體。遺傳迭代前,需要首先建立一個由若干初始解(也稱為個體)組成的群體,即初始群體。初始群體中的每個個體都是通過隨機方法得到的參數(shù)編碼。
生成初始群體前通常要確定每個參數(shù)的范圍,稱作搜索空間。搜索空間必須足夠大,能夠涵蓋每一個適合的個體,但是太大的搜索空間又會影響收斂的速度,因此搜索空間的定義非常重要。對于三參數(shù)威布爾分布的各個參數(shù)的搜索空間,這里利用圖解法產(chǎn)生的參數(shù)估計值獲得。首先給定寬松系數(shù)θ(0<θ<1),定義分布中每個參數(shù)的搜索空間為
(4)
式中:θ值越大,搜索范圍越大;反之,越小。
(3)適應度評估。遺傳算法在遺傳迭代時基本不利用外部信息,僅以適應度函數(shù)為依據(jù),利用種群中的每個個體的適應度值進行搜索。適應度值越大的個體被選擇的概率越大。因此,適應度函數(shù)的選取將直接影響個體的質(zhì)量,并同樣會影響收斂速度。
對于三參數(shù)威布爾分布,本文在d檢驗(柯爾莫哥洛夫-斯米爾諾夫檢驗,或k-s檢驗)[9-10]的基礎上經(jīng)過適當?shù)奶幚碜鳛檫m應度函數(shù)。
d檢驗法是可靠性分析中常用的檢驗方法,它比χ2檢驗法精細,而且還適用于小樣本的情況。d檢驗法是將n個試驗數(shù)據(jù)按由小到大的次序排列,根據(jù)假設的分布,計算每個數(shù)據(jù)對應的R0(ti),將其與經(jīng)驗分布函數(shù)Rn(ti)進行比較,其中差值的最大絕對值即檢驗統(tǒng)計量Dn的觀察值。將Dn與臨界值Dn,α進行比較。若滿足式(5),則接受原假設;否則,拒絕原假設。
(5)
式中:R0(t)為原假設分布函數(shù),即三參數(shù)威布爾分布,函數(shù)中的參數(shù)對應于種群中個體的染色體段。
由此可得三參數(shù)威布爾分布的適應度函數(shù)的表達式如下
Fitness(t)=Dn,α-Dn
(6)
適應度函數(shù)的取值越大,表明原假設分布函數(shù)越貼近經(jīng)驗分布函數(shù),即獲得的分布函數(shù)越精確,在遺傳迭代中被選擇的幾率越大。而且這個適應度函數(shù)還有一個重要的優(yōu)勢:如果對于某個體使Fitness(t)>0,則可以判定該個體中的參數(shù)估計值通過d檢驗,可以在遺傳迭代中直接獲得符合d檢驗的參數(shù)估計值。
(4)選擇。在對個體適應度進行評價的基礎上把優(yōu)化的個體直接遺傳到下一代,或通過配對交叉產(chǎn)生新的個體,再遺傳到下一代。
(5)交叉。交叉操作是遺傳算法中最主要的操作。交叉的步驟為:首先對種群中個體進行隨機配對;然后,在配對個體中隨機設定交叉處(一點或多點),配對個體彼此交換部分信息。
(6)變異。變異操作是按位(bit)進行的,即把染色體某一位的內(nèi)容進行編譯。編譯操作同樣也是隨機進行的。一般而言,變異概率都取得較小。變異操作是十分微妙的遺傳操作,它需要和交叉操作配合使用,目的是挖掘群體中個體的多樣化,克服有可能限于局部解的弊病。
選擇、交叉、變異均屬遺傳算法的基本操作,方法繁多,但僅與收斂速度有關,在此不作贅述,請參看相關文獻。
2在可靠性分析中的應用
計算機數(shù)控系統(tǒng)(Computer Numerical Control)是數(shù)控機床的核心部分,主要有計算機數(shù)控裝置(CNC)、伺服驅(qū)動裝置、位置檢測裝置、可編程控制器PLC和接口電路組成。計算機數(shù)控系統(tǒng)的故障往往會帶來較大的危害度,其可靠性對于數(shù)控機床至關重要。表1給出了某系列數(shù)控機床數(shù)控系統(tǒng)出廠使用半年的故障數(shù)據(jù)。
圖2 給出了數(shù)控機床計算機數(shù)控系統(tǒng)故障間隔時間的散點圖,從圖中可以看出散點并不呈一條直線,具有明顯的拐點,符合三參數(shù)威布爾分布的特征。故而假設計算機數(shù)控系統(tǒng)的故障間隔時間服從三參數(shù)威布爾分布。按照圖解法的步驟,在WPP圖上作兩條漸進線L1和L2,見圖2。兩條漸近線表達式分別為:
(7)
圖2 計算機數(shù)控系統(tǒng)故障數(shù)據(jù)WPP及漸近線圖 Fig.2 WPP and asymptotic line graph of CNC system
序號tiRn(ti)xiyi11040.96734.6444-3.403521220.92064.8040-2.49173171———41710.82715.1417-1.661652570.78045.5491-1.394462730.73365.6095-1.17217282———82820.64025.6419-0.807493070.59355.7268-0.6505103740.54675.9243-0.5045113860.50005.9558-0.3665124940.45336.2025-0.2341135010.40656.2166-0.1053145150.35986.24420.0219155760.31316.35610.1495166740.26646.51320.2798176990.21966.54970.4160187010.17296.55250.5625198030.12626.68840.72762010360.07946.94310.92932111980.03277.08841.2297
由此可得三參數(shù)威布爾分布圖解法的初始解為:β=1.42,η=530.94,γ=99.48。
令寬松系數(shù)θ=0.5,可得三參數(shù)威布爾分布的搜索空間為
(8)
運用遺傳算法進行遺傳迭代可得三參數(shù)威布爾分布的參數(shù)估計值及適應度見表2,其適應度大于0且遠大于圖解法得到的適應度,說明遺傳算法的參數(shù)估計值不但能通過d檢驗,而且計算精度遠大于圖解法。
表2 參數(shù)的估計值及其適應度
因此,計算機數(shù)控系統(tǒng)的故障間隔時間服從三參數(shù)威布爾分布的假設成立,其可靠度函數(shù)為
(9)
圖3給出了計算機數(shù)控系統(tǒng)的可靠性函數(shù)曲線,圖中的散點即為故障時間點的經(jīng)驗分布函數(shù)值。圖中的散點均勻的分布在曲線的兩側(cè),說明三參數(shù)威布爾分布及文中給出參數(shù)估計方法對于計算機數(shù)控系統(tǒng)的故障分析是適用的。
圖3 計算機數(shù)控系統(tǒng)的可靠度函數(shù)圖 Fig.3 Reliability graph of CNC system
3結(jié)論
首先揭示了三參數(shù)威布爾分布在可靠性分析中的特殊意義,然后針對其參數(shù)估計復雜的問題,提出了一種綜合圖解法和遺傳算法的參數(shù)估計方法。該方法以圖解法的解為基礎形成搜索空間,用遺傳算法提高解的精度,從而得到更精確的參數(shù)估計值。隨后三參數(shù)威布爾分布應用于計算機數(shù)控系統(tǒng)的可靠性分析中,驗證了本文提出的參數(shù)估計方法的可行性。本文提出的參數(shù)估計方法對于其他復雜的威布爾分布形式(例如競爭威布爾分布)的參數(shù)估計具有一定的啟示意義。
參考文獻
[1]張英芝,申桂香,吳甦,等. 隨機結(jié)尾數(shù)控機床三參數(shù)威布爾分布模型[J]. 吉林大學學報(工學版),2009,39(2):378-381.
ZHANG Ying-zhi, SHEN Gui-xiang, WU Su, et al. 3-parameter Weibull distribution for random truncated NC machine tool falt data[J]. Journal of Jilin University (Engineering and Technology Edition), 2009,39(2):378-381.
[2]Murthy D N P, Xie M, et al. Weibull models [M]. New York ,John Wiley,2004.
[3]楊謀存,聶宏. 三參數(shù)Weibull分布參數(shù)的極大似然估計數(shù)值解法[J]. 南京航空航天大學學報, 2007,39(1):22-25.
YANG Mou-cun, NIE Hong. Advanced algorithm for maximum likelihood estimation of three parameter weibull distribution[J]. Journal of Nanjing University of Aeronautics & Astronautics, 2007,39(1):22-25.
[4]嚴曉東,馬翔,鄭榮躍. 三參數(shù)威布爾分布參數(shù)估計方法比較[J]. 寧波大學學報(理工版),2005,18(3):301-305.
YAN Xiao-dong, MA Xiang, ZHENG Rong-yue. Comparion of the parameters estimation methods for 3-parameter weibull distribution[J].Journal of Ningbo University (NSEE), 2005,18(3):301-305.
[5]Tsionas E G. Posterior analysis, prediction and reliability in three-parameter Weibull distributions [C]. Communications in Statistic-Theory and Methods, 2000,29(7):1435-1449.
[6]楊志忠,劉瑞元. 三參數(shù)Weibull分布參數(shù)估計求法改進[J]. 工程數(shù)學學報, 2004,21(2):281-284.
YANG Zhi-zhong, LIU Rui-yuan. Improvement of parameter estimation method for Three-parameter Weibull distribution[J]. Journal of Engineering Mathematics,2004,21(2):281-284.
[7]Teimouri M, Gupta A K. On the Three-parameter weibull distribution shape parameter estimaion[J]. Journal of Data Science,2013,11:403-414.
[8]盧安平,趙林,郭增偉,等.基于Monte Carlo法的極值分布類型及其參數(shù)估計方法比較[J]. 哈爾濱工業(yè)大學學報, 2013,45(2):87-95.
LU An-ping, ZHAO Lin, GUO Zeng-wei, et al. A comparative study of extreme value distribution and parameterestimation based on the Monte Carlo method[J]. Journal of Harbin Institute of Technology, 2013,45(2):87-95.
[9]陸陽,王強, 岳峰, 等.軟件可靠性關鍵參數(shù)判定的據(jù)估計方法[J]. 系統(tǒng)工程理論與實踐,2014,34(1): 248-254.
LU Yang,WANG Qiang, YUE Feng, et al. Key parameter judgment with moment estimation in software reliability prediction[J].Systems Engneering-Theory & Practice,2014,34(1): 248-254.
[10]Xing L, Boddu P, Sun Y, et al. Reliability analysis of static and dynamic fault-tolerant systems subject to probabilistic common-cause failures [J]. Proceedings of the Institution of Mechanical Engineers part 0-Journal of Risk and Reliability,2010,224(1):43-45.