祁 輝,廖逢釵,李淑婷,唐必成
(1.三明學院 信息工程學院, 福建 三明365004;2.數字福建工業(yè)能源大數據研究所, 福建 三明365004;3.工業(yè)大數據分析及應用福建省高校重點實驗室, 福建 三明365004;4.物聯(lián)網應用福建省高校工程研究中心, 福建 三明365004)
Frechet 分布是一種重要的壽命分布。它是由Frechet[1]在1927年發(fā)布的一篇關于極大值的漸近分布的論文中提出。Frechet 分布在實際中有重要的應用, 例如可以用來分析自然災害造成地損失, 某種新型病毒的傳播速度等。對于產品的壽命T 服從兩參數的Frechet 分布, 其概率密度函數和分布函數表示如下:
其中α>0 稱為形狀參數, β>0 稱為尺度參數。
關于Frechet 分布的性質和應用, 已有許多學者進行了研究。其中Mann[2]研究了三參數模型下的Weibull 分布以及Frechet 分布的估計問題。Harlow[3]鑒于Frechet 分布在不同領域的應用,提出該分布也是工程研究中是一種非常實用的分布。Nadarajah 和Kotz[4]在社會學研究模型中引入Frechet分布。Abbas 和Tang[5]研究了形狀參數已知的情況下, Frechet 分布中尺度參數的貝葉斯估計、極大似然估計和概率加權矩估計。駱正山等[6]討論了將Frechet 分布用于海底油氣管道腐蝕的評價與預測。曾林蕊等[7]討論了定數截尾樣本下Frechet 分布中參數的近似極大似然估計。何亮和徐曉嶺[8]將Frechet 分布應用于加速壽命試驗, 并利用極大似然估計以及MPS 估計、 最小距離估計方法對參數進行估計。
樣本數據的刪失常出現(xiàn)于壽命觀測和可靠性試驗中, 由于樣本中的個體無法被觀測或者實驗中途停止, 導致樣本數據刪失的情形。樣本數據刪失類型主要有以下3 種: Ⅰ型刪失, II 型刪失以及混合型刪失。I 型刪失的特點就是刪失時間是固定的, 即對所有個體的觀察停止在一個時間T, 這類刪失也稱為定時刪失。II 型刪失的特點事先有一個故障次數r, 若同時對n 個個體進行觀察, 直到有r(r<n)個體死亡(故障)為止, 樣本數據被刪失。
基于混合刪失下樣本的壽命數據描述如下: 假定從總體中隨機抽取容量為n 的樣本進行測試,當實驗失敗次數達到事先確定次數r(r<n)時或者實驗時間達到事先確定的時間T 時, 實驗結束。因此, 在混合刪失情形下, 實驗時間和實驗失敗次數分別不會超過T 和r。令X1,X2, …,Xn為樣本中n 個個體的壽命, X1:n<X2:n<…<Xn:n為相應的順序統(tǒng)計量, 實驗觀察時間和實驗失敗次數分別記為隨機變量C=min(Xr:n,T)和D, 則混合刪失下樣本為(X1:n,X2:n,…,XD:n,C,D)。特別是當D=0 時, 沒有失敗的信息會被觀察到, 但由于實驗時間存在刪失變量, 因此個體壽命X(D+1):n,X(D+2):n,…,Xn:n一般不會被完全觀測到。
相比Ⅰ型和Ⅱ型刪失模型, 混合刪失模型在實際運用中更靈活, 已成為眾多學者的研究對象。Chids 等[9]研究了基于混合刪失樣本下指數分布的似然估計, Kundu[10]考慮了Weibull 分布在混合刪失樣本下的統(tǒng)計推斷, Kundu 和Pradhan[11]討論了混合刪失樣本下廣義指數分布的參數估計, Dube等[12]研究了混合刪失樣本下對數正態(tài)分布的估計問題, Dey 和Pradhan[13]研究了混合刪失樣本下的廣義倒指數分布。鑒于Frechet 分布壽命觀測和自然災害分析中的重要應用, 為此, 研究了混合刪失樣本下的Frechet 分布的參數估計問題。
在混合刪失樣本下, 考慮Frechet 分布的極大似然估計, 令c, d 分別表示隨機變量實驗觀察時間C 和實驗失敗次數D 的觀察值, 那么, 極大似然函數可以表示為:
由于分布函數中尺度參數做為分布類標識, 因此, 考慮尺度參數β 已知的情形下形狀參數α 的估計, 不妨設β=2, 則極大似然函數可以表示為:
取對數, 可得對數似然函數:
兩邊同時對α 求導, 可得:
對于似然方程:
由于上式似然方程的復雜性, 無法利用一般的求解方法得到結果。從可編程性考慮, 牛頓迭代法操作簡單, 每次迭代都是簡單的機械化運算, 易于編寫算法程序。因此, 運用牛頓迭代法對混合刪失下Frechet 分布的似然方程進一步求解, 算法步驟如下:
取其中的線性部分用來作為非線性方程f(α)=0 的近似方程,則有:
設f'(α0)≠0,則其解為:
求出a1附近f(α)的泰勒展開式, 再取其線性部分作為f(α)=0 的近似方程。若f'(α1)≠0, 則得:
這樣, 得到牛頓(Newton-Rapfson)算法[14]的一個迭代的關系式:
當達到迭代次數n 或者誤差不超過給定ε 時, 迭代停止, 求出似然方程的近似解α^。
通過隨機模擬來驗證所提出的估計方法的正確性。首先,從尺度參數β=2 的Frechet 總體中抽取容量為n=30 的簡單隨機樣本X1,X2,…,Xn,樣本的容量n 分別為30,50 以及80 不等??紤]到混合刪失的情形,假定刪失時間變量T 在每種抽樣容量下分別取大小不等3 個值,以此來逐步提高刪失率。刪失次數變量分別取不等3 個值為:0.8, 1.5, 3, 以此來區(qū)分刪失率。當形狀參數真值α=0.8, 基于500 次的模擬結果見表1~3, 當形狀參數真值, 基于500 次的模擬結果見表4~6。
表1 當α=0.8、T=0.8 時估計量的隨機模擬結果
表1 當α=0.8、T=0.8 時估計量的隨機模擬結果
n 30 50 80 r 10 15 25 20 30 40 40 50 60 mean α 0.9150410 0.8869617 0.9070617 0.8677661 0.8593394 0.8439460 0.8217997 0.8255935 0.8298795 rmse α 0.2384779 0.1946554 0.2211332 0.1602285 0.1417189 0.1321461 0.1024124 0.1042219 0.1029260
表2 當α=0.8、T=1.5 時估計量的隨機模擬結果
表2 當α=0.8、T=1.5 時估計量的隨機模擬結果
n 30 50 80 r 10 15 25 20 30 40 40 50 60 mean α 0.9056136 0.8885545 0.8932017 0.8396100 0.8465484 0.8450863 0.8331837 0.8323408 0.8328658 rmse α 0.2381911 0.2227183 0.2293879 0.1489262 0.1408064 0.1568668 0.1015955 0.1110191 0.1124685
表3 當α=0.8、T=3 時估計量的隨機模擬結果
表3 當α=0.8、T=3 時估計量的隨機模擬結果
n 30 50 80 r 10 15 25 20 30 40 40 50 60 mean α 0.8452288 0.8301479 0.8400956 0.8384349 0.8138544 0.8241999 0.8098737 0.8134814 0.8032727 rmse α 0.16797170 0.15646270 0.16193770 0.12630400 0.12010790 0.11516640 0.08853260 0.08640164 0.08404830
從表1~3 的中形狀參數估計量的統(tǒng)計指標:估計量的均值(mean),估計量的均方誤差(rmse)可以看出, 當刪失次數變量r 固定時, 隨著樣本容量n 增大, 在同等刪失率下, 估計結果越來越好; 當刪失次數變量r 和樣本容量n 均固定時, 隨著刪失時間變量T 的增大,刪失率提高, 估計量仍然表現(xiàn)良好。即使在n=30 的小樣本情形下依然成立。對比表1~3, 當刪失次數變量r 逐漸增大, 刪失率降低, 在同等情形下, 估計量的估計結果表現(xiàn)得更好。
當形狀參數α 真值增大到2 時, 由隨機模擬的結果表4~6 可以看出, 上述情形仍然成立, 估計量的統(tǒng)計結果仍然表現(xiàn)良好。
表4 當α=2、T=0.8 時估計量的隨機模擬結果
表4 當α=2、T=0.8 時估計量的隨機模擬結果
n 30 50 80 r 10 15 25 20 30 40 40 50 60 mean α 1.783388 1.791919 1.789607 1.789686 1.798035 1.778554 1.833184 1.824481 1.832820 rmse α 0.2008732 0.2011010 0.2109656 0.1382963 0.1308918 0.1338026 0.1125829 0.1122783 0.1024405
表5 當α=2、T=1.5 時估計量的隨機模擬結果
表5 當α=2、T=1.5 時估計量的隨機模擬結果
n 30 50 80 r 10 15 25 20 30 40 40 50 60 mean α 2.226087 2.273969 2.224721 2.146189 2.137436 2.140004 2.096855 2.088440 2.081841 rmse α 0.5626685 0.5921566 0.5199464 0.3961160 0.3631685 0.3610385 0.2674839 0.2716929 0.2746031
表6 當α=2、T=3 時估計量的隨機模擬結果
表6 當α=2、T=3 時估計量的隨機模擬結果
n 30 50 80 r 10 15 25 20 30 40 40 50 60 mean α 2.161996 2.056156 2.029569 2.069200 2.041950 2.019589 2.024157 1.998279 1.982394 rmse α 0.4424088 0.3748913 0.3446413 0.2943757 0.2797575 0.2543793 0.2225639 0.1970202 0.1793307
對于混合刪失樣本下的Frechet 分布, 考慮尺度參數β 已知的情形下形狀參數α 的極大似然估計, 隨機模擬結果顯示上述估計方法具有良好的性質。此外, 如何在尺度參數β 和形狀參數α 均未知的情形下構建新的算法求解似然方程組值得進一步進行研究。下一步,考慮構造Frechet 分布的對數似然函數Fisher 信息矩陣, 利用迭代算法, 求解Frechet 分布尺度參數β 和形狀參數α 的估計。