梅夢(mèng)玲, 周菊玲, 董翠玲
(新疆師范大學(xué) 數(shù)學(xué)與科學(xué)學(xué)院,烏魯木齊 830017)
變點(diǎn)(change point)指的是某一位置或時(shí)刻在此前后觀測(cè)值或數(shù)據(jù)遵循兩個(gè)不同的模型. 變點(diǎn)問題是近幾年統(tǒng)計(jì)方向研究中比較熱門的話題,主要應(yīng)用于質(zhì)量控制、水文統(tǒng)計(jì)、金融經(jīng)濟(jì)、地震預(yù)測(cè)等領(lǐng)域. 目前變點(diǎn)分析方法主要有極大似然法、最小二乘法、貝葉斯法和非參數(shù)方法等. 關(guān)于變點(diǎn)問題,國內(nèi)外的學(xué)者進(jìn)行了深入研究,James B J[1]在1992 年對(duì)多元正態(tài)分布位置參數(shù)的變點(diǎn)用似然比檢驗(yàn)做了假設(shè)檢驗(yàn);Kokoszka 和Leipus[2]在1998 年用累積和方法檢測(cè)了ARCH 模型中的均值變點(diǎn),證明了CUSUM 統(tǒng)計(jì)量的一致性;陳希孺[3]在1988 年研究了序列中只有一個(gè)變點(diǎn)的情況;1991年陳希孺[4]還在變點(diǎn)系列文章中介紹了基本理論及其常用的方法,如最小二乘法、局部比較法、Bayes法等,并對(duì)這些方法進(jìn)行了舉例說明. 近些年來,關(guān)于隨機(jī)截尾試驗(yàn)的研究比較多,帶有不完全信息隨機(jī)截尾試驗(yàn)(random censoring test with incomplete information,簡(jiǎn)稱IIRCT)由Elperin T I,Gertsbakh I B[5]首次研究,后來又有許多學(xué)者對(duì)IIRCT下壽命分布的參數(shù)估計(jì)問題進(jìn)行了深入研究[6-11]. 指數(shù)分布是概率統(tǒng)計(jì)中一種重要的分布,關(guān)于指數(shù)變點(diǎn)問題的研究也有很多,胡興[12]研究了完全數(shù)據(jù)下單參數(shù)指數(shù)族分布參數(shù)單變點(diǎn)的貝葉斯估計(jì);彭秋曦[13]研究了左截?cái)嘤覄h失數(shù)據(jù)下指數(shù)分布單變點(diǎn)和多變點(diǎn)的Bayes估計(jì);黃月蘭[14]使用了最小二乘法、極大似然法和貝葉斯法三種方法對(duì)指數(shù)分布變點(diǎn)問題進(jìn)行研究;王黎明[15]研究了雙參數(shù)指數(shù)分布的變點(diǎn)問題. 變點(diǎn)問題在實(shí)際應(yīng)用中也很廣泛,雷鳴等[16]、馮娜[17]、周影輝等[18]研究了不同情況下上證指數(shù)的變點(diǎn)問題;廖遠(yuǎn)甦[19]利用方差多變點(diǎn)分析技術(shù)對(duì)SARS疫情的研究;許歡[20]基于ASAMC算法對(duì)氣象數(shù)據(jù)的變點(diǎn)進(jìn)行估計(jì). 本文主要是通過添加缺失數(shù)據(jù),得到完全似然函數(shù),然后基于MCMC方法研究了IIRCT下指數(shù)分布的多變點(diǎn)模型的參數(shù)估計(jì)問題.
指數(shù)分布多變點(diǎn)模型如下:
當(dāng)αi=1,βi=1時(shí),
當(dāng)αi=0時(shí),
利用逆變換法可以產(chǎn)生z1i,利用篩選法產(chǎn)生z2i,由于λ1,λ2,λ3的滿條件分布是伽馬分布,所以這三個(gè)參數(shù)可以直接利用Gibbs抽樣,而k1,k2的滿條件分布比較復(fù)雜,不能直接用Gibbs抽樣,所以利用Metropolis-Hastings算法進(jìn)行抽樣.
下面給出MCMC方法的具體步驟.
其中:m=1,2;j=1,2,3 .
令n=200,取真實(shí)值(k1,k2,λ1,λ2,λ3)=(50,150,3,8,5),取λ1,λ2,λ3的先驗(yàn)分布分別為gamma(6,2),gamma(8,1.2),gamma(15,2.6). yi服從指數(shù)分布,且參數(shù)為0.5,假設(shè)顯示概率a=0.8,取M=20 000,B=10 000.參數(shù)的貝葉斯估計(jì)見表1.
表1 參數(shù)k1,k2,λ1,λ2,λ3 的貝葉斯估計(jì)Tab.1 Bayesian estimation of parameters k1,k2,λ1,λ2,λ3
變點(diǎn)位置參數(shù)的Gibbs抽樣迭代過程見圖1和圖2.
圖1 參數(shù)k1 的Gibbs抽樣迭代過程Fig.1 Gibbs sampling iteration process of parameter k1
圖2 參數(shù)k2 的Gibbs抽樣迭代過程Fig.2 Gibbs sampling iteration process of parameter k2
Gibbs 抽樣收斂性判斷最常用的方法是同時(shí)產(chǎn)生多條markov 鏈,MCMC 收斂性判斷的常用方法是抽樣時(shí)出入兩組初始值產(chǎn)生兩條鏈,當(dāng)抽樣收斂時(shí)迭代重合. 在模擬過程中,輸入兩組初始值分別進(jìn)行10 000次迭代,k1、k2的兩條迭代鏈如圖3和圖4
圖3 k1 的多層迭代鏈軌跡Fig.3 Multiple iterative chain trajectory of k1
圖4 k2 的多層迭代鏈軌跡Fig.4 Multiple iterative chain trajectory of k2
由表可得參數(shù)估計(jì)的相對(duì)誤差不超過6%,MC誤差也較小,故整體上參數(shù)估計(jì)的精度較高,Gibbs抽樣迭代值波動(dòng)較小,估計(jì)效果較好. 由圖3和圖4可以看出參數(shù)的兩條迭代鏈都分別趨于重合,這說明由MCMC算法產(chǎn)生的馬爾科夫鏈?zhǔn)諗?