宗鳳喜,李如兵,2
(1.曲靖師范學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,云南 曲靖 655011;2.上海財(cái)經(jīng)大學(xué) 經(jīng)濟(jì)學(xué)院,上海 200433)
排序集抽樣是Mclntyre[1,2]首次提出的,在樣本容量相同的情況下,與簡單隨機(jī)抽樣相比,排序集抽樣得到的樣本包含更多的總體信息,從而能夠?qū)傮w做出更準(zhǔn)確的推斷。有時(shí)候,對樣本的測量可能比較困難,比如成本較高,或者花費(fèi)時(shí)間較長,或者具有破壞性,但是通過簡單的方法容易對樣本的大小進(jìn)行排序,比較適合用排序集抽樣方法。很多學(xué)者都研究了基于排序集抽樣的情況下,某些分布未知參數(shù)的Bayes估計(jì)。例如,Adatia[3]介紹了half-logistic分布在排序集抽樣下的Bayes估計(jì);Shaibu和Muttlak[4]介紹了在排序集抽樣下正態(tài)分布、指數(shù)分布以及Gamma分布的Bayes估計(jì)和相關(guān)性質(zhì);Sinha等[5]研究了在排序集抽樣下正態(tài)分布和指數(shù)分布參數(shù)的最優(yōu)線性無偏估計(jì);Stokes[6]研究了在排序集抽樣下位置-尺度分布族參數(shù)的最大似然估計(jì);Al-Saleh等[7]探討了在排序集抽樣下基于平方損失函數(shù)指數(shù)分布參數(shù)的Bayes估計(jì),Sadek等[8]研究了在排序集抽樣下指數(shù)分布參數(shù)的Bayes估計(jì)。
Pareto分布是意大利經(jīng)濟(jì)學(xué)家Pareto(1987)將其作為一種收入分布最先研究的,一個(gè)多世紀(jì)以來,被廣泛應(yīng)用在很多領(lǐng)域,比如,個(gè)人收入、城市人口、股票價(jià)格、保險(xiǎn)風(fēng)險(xiǎn)、商業(yè)失效、某種藥理過程后病人的存活時(shí)間等都可以用Pareto分布來描述。因此,研究Pareto分布具有重要的理論意義和實(shí)用價(jià)值。國內(nèi)外很多學(xué)者都討論過Pareto分布的性質(zhì):Abu-Dayyeh等[9]研究了排序集抽樣下Pareto分布形狀參數(shù)及尺度參數(shù)的最大似然估計(jì)、最小方差無偏估計(jì);Omar等[10]研究了在極值排序集抽樣下Pareto分布形狀參數(shù)及尺度參數(shù)的矩估計(jì)以及最小偏差無偏估計(jì);Ouyang等[11]對壽命分布為Pareto分布的n個(gè)元件進(jìn)行定數(shù)截尾實(shí)驗(yàn),當(dāng)觀測到有r個(gè)元件失效后,研究了剩余元件的失效時(shí)間以及還需要的實(shí)驗(yàn)時(shí)間的Bayes預(yù)測;李海芬和峁詩松[12]討論了Pareto分布的R2檢驗(yàn)法;李艷穎[13]在平方損失及Q-對稱熵?fù)p失下給出了Pareto分布形狀參數(shù)的貝葉斯估計(jì),并討論了估計(jì)的容許性;康會(huì)光等[14]和韋瑩瑩等[15]研究了Linex損失下Pareto分布族參數(shù)的經(jīng)驗(yàn)Bayes估計(jì)。
本文針對Pareto分布的尺度參數(shù),首先給出基于簡單隨機(jī)樣本(SRS)下的Bayes估計(jì),接著研究基于排序集樣本(RSS)下的Bayes估計(jì),最后通過Monte Carlo模擬來比較各種估計(jì)的偏差和均方誤差,結(jié)果表明,相同條件下基于RSS得到的估計(jì)比基于SRS得到的估計(jì)更有效,并且在相同條件下基于共軛先驗(yàn)得到的估計(jì)比基于Jeffreys先驗(yàn)得到的估計(jì)更有效。
設(shè)總體的概率密度和分布函數(shù)分別為f(x),F(xiàn)(x),容量為n的排序集樣本按如下程序獲得:首先從總體中獲取容量為 n2個(gè)簡單隨機(jī)樣本:X11,X12,…X1n;X21,X22,…,X2n;…;Xn1,Xn2,…,Xnn。對每組樣本按從小到大的順序進(jìn)行排序:X(1)1,X(1)2,…X(1)n;X(2)1,X(2)2,…,X(2)n;…;X(n)1,X(n)2,…X(n)n。記Yi=X(i)i,i=1,2,…,n。則稱Y1,Y2,…,Yn為一組只有一個(gè)循環(huán)的排序集樣本,如將上述過程循環(huán)m次,則可以得到有m個(gè)循環(huán)的排序集樣本:Y11,Y12,…Y1n;Y21,Y22.,…,Y2n;…;Ym1,Ym2,…,Ymn,簡稱 RSS。在上述獲取RSS的過程中,如果假設(shè)排序過程中不存在誤差,或誤差非常小可以忽略不計(jì),則Yi或Yjii=1,2,…,n;j=1,…,m的概率密度即為容量為n的簡單隨機(jī)樣本(SRS)的第i個(gè)次序統(tǒng)計(jì)量的概率密度,具有如下表達(dá)式:
Pareto分布的概率密度和分布函數(shù)分別為如下表達(dá)式:
其中,θ為形狀參數(shù),α為尺度參數(shù),也稱為門限參數(shù),在這里假設(shè)是已知的。
損失函數(shù)是Bayes估計(jì)中非常重要的一部分,下面給出本文中涉及到的三種損失函數(shù):平方損失函數(shù)(squard error loss function)、Q-對稱熵?fù)p失函數(shù)(Q-symmetric entropy loss function)、Linex 損失函數(shù)(Linex loss function),表達(dá)式分別為:
其中,δ是θ的估計(jì)值。
研究Bayes估計(jì)的前提是要給出待估參數(shù)的先驗(yàn)分布,本文主要考慮共軛先驗(yàn)分布即Gamma分布,以及Jeffreys先驗(yàn)分布,其表達(dá)式分別為:
當(dāng)β=λ=0,共軛先驗(yàn)分布就變成了Jeffres先驗(yàn)分布。
設(shè)X1,X2,…,Xn為來自Pareto分布的簡單隨機(jī)樣本(SRS),x1,x2,…,xn為相應(yīng)樣本的觀測值;設(shè)Y1,Y2,…,Yn為來自Pareto分布的只有一個(gè)循環(huán)的排序集樣本(RSS),y1,y2,…,yn為相應(yīng)樣本的觀測值;Y11,Y12,…Y1n;Y21,Y22.…,Y2n;…;Ym1,Ym2,…,Ymn為來自Pareto分布的有m個(gè)循環(huán) 的 排 序 集 樣 本 ,y11,y12,…,y1n;y21,y22,…,y2n;ym1,ym2,…,ymn為相應(yīng)樣本的觀測值,本文用 π(θ|x),π(θ|y)分別表示在給定SRS(X)和RSS(Y)下的參數(shù)θ的后驗(yàn)概率密度。
基于SRS的Bayes估計(jì),很多文獻(xiàn)都進(jìn)行了研究,這里只是以定理的形式列舉出來,而要推導(dǎo)出定理中涉及的結(jié)論,要用到的關(guān)鍵內(nèi)容以引理的形式給出,這些引理在后面推導(dǎo)基于RSS的Bayes估計(jì)時(shí)也要用到,并且下面的引理適用于任何分布的參數(shù)以及任何給定的先驗(yàn)分布。
引理1[16]:在給定先驗(yàn)分布及平方損失函數(shù)下,θ的Bayes估計(jì)為后驗(yàn)分布 π(θ|X)的均值,即:
并且該估計(jì)是唯一的,是可容許的。
引理2[13]:在給定先驗(yàn)分布及Q-對稱熵?fù)p失函數(shù)下,θ的Bayes估計(jì)為:
并且該估計(jì)是唯一的,是容許的。
引理3[13]:在給定先驗(yàn)分布及Linex損失函數(shù)下,θ的Bayes估計(jì)為:
并且該估計(jì)是唯一的,是容許的.
下面以三個(gè)定理的形式給出基于平方損失、Q-對稱熵?fù)p失以及Linex損失下θ的Bayes估計(jì)。
定理1[13]:在SRS和平方損失函數(shù)下:基于Gamma先驗(yàn)分布θ的Bayes估計(jì)為:
而基于Jeffreys先驗(yàn)分布的Bayes估計(jì)為:
定理2[13]:在SRS和Q-對稱熵?fù)p失函數(shù)下,基于Gamma先驗(yàn)分布θ的Bayes估計(jì)為:
而基于Jeffreys先驗(yàn)分布θ的Bayes估計(jì)為:
定理3[13]:在SRS和Linex損失函數(shù)下,基于Gamma先驗(yàn)分布,θ的Bayes估計(jì)為:
而基于Jeffreys先驗(yàn)分布θ的Bayes估計(jì)為:
定理4:在只有一個(gè)循環(huán)的RSS和平方損失函數(shù)下,基于Gamma先驗(yàn)分布θ的Bayes估計(jì)為:
而基于Jeffreys先驗(yàn)分布的Bayes估計(jì)為:
其中Cij(j)同上
證明:由式(1)至式(3)式可知Yj的概率密度為:
由于Y1,Y2,…,Yn是相互獨(dú)立的,因此只有一個(gè)循環(huán)的RSS的聯(lián)合概率密度為:
因此,當(dāng)先驗(yàn)分布為Gamma分布時(shí),θ的后驗(yàn)概率密度 π(θ|Y)有如下性質(zhì):
根據(jù)Gamma分布概率密度的性質(zhì),由引理1可得在只有一個(gè)循環(huán)的RSS和平方損失函數(shù)下,基于Gamma先驗(yàn)分布θ的Bayes估計(jì)為:
當(dāng)上式中的β=λ=0時(shí),可得在只有一個(gè)循環(huán)的RSS和平方損失函數(shù)下,基于Jeffreys先驗(yàn)分布的Bayes估計(jì)為:
定理5:在只有一個(gè)循環(huán)的RSS和Q-對稱熵?fù)p失函數(shù)下,基于Gamma先驗(yàn)分布θ的Bayes估計(jì)為:
其中Cij(j)同上
而基于Jeffreys先驗(yàn)分布的Bayes估計(jì)為:
注:由引理2、定理4中的式(20)以及Gamma分布概率密度的性質(zhì),定理5很容易得到證明。
定理6:在只有一個(gè)循環(huán)的RSS和Linex損失函數(shù)下,基于Gamma先驗(yàn)分布θ的Bayes估計(jì)為:
而基于Jeffreys先驗(yàn)分布的Bayes估計(jì)為:
與定理4中的相同。
注:由引理3、定理4中的式(20)以及Gamma分布概率密度的性質(zhì),定理6很容易得到證明。
下面介紹在有m個(gè)循環(huán)的RSS下Pareto分布尺度參數(shù)θ的Bayes估計(jì)。
定理7:在有m個(gè)循環(huán)的RSS和平方損失函數(shù)下,基于Gamma先驗(yàn)分布θ的Bayes估計(jì)為:
而基于Jeffreys先驗(yàn)分布的Bayes估計(jì)為:
其中:
因此,當(dāng)先驗(yàn)分布為Gamma分布時(shí),θ的后驗(yàn)概率密度 π(θ|Y)有如下性質(zhì):
根據(jù)Gamma分布概率密度的性質(zhì),由引理1可得在有m個(gè)循環(huán)的RSS和平方損失函數(shù)下,基于Gamma先驗(yàn)分布θ的Bayes估計(jì)為:
當(dāng)上式中的β=λ=0時(shí),可得在有m個(gè)循環(huán)的RSS和平方損失函數(shù)下,基于Jeffreys先驗(yàn)分布的Bayes估計(jì)為:
定理8:在有m個(gè)循環(huán)的RSS和Q-對稱熵?fù)p失函數(shù)下,基于Gamma先驗(yàn)分布θ的Bayes估計(jì)為:
而基于Jeffreys先驗(yàn)分布的Bayes估計(jì)為:
注:由引理2、定理7中的式(27)以及Gamma分布概率密度的性質(zhì),定理8很容易得到證明。
定理9:在有m個(gè)循環(huán)的RSS和Linex損失函數(shù)下,基于Gamma先驗(yàn)分布θ的Bayes估計(jì)為:
而基于Jeffreys先驗(yàn)分布的Bayes估計(jì)為:
注:由引理3、定理7中的式(27)以及Gamma分布概率密度的性質(zhì),定理9很容易得到證明。
在上文中,在Matlab中利用Monte Carlo法,通過比較偏差和均方誤差來比較得到的各種估計(jì)的優(yōu)劣,偏差與均方誤差越小,估計(jì)就越好。借鑒文獻(xiàn)[8],本文取n=3,4,5,6;λ=β=1;C=1,-1;關(guān)于Pareto分布,本文選取文獻(xiàn)[10]中涉及到的一個(gè)真實(shí)模型:α=1.625,θ=2.314.q=1。模擬結(jié)果見下頁表1和表2。
從表1發(fā)現(xiàn),關(guān)于參數(shù)θ的所有Bayes估計(jì)都是有偏的,但偏差隨著樣本容量n的增加而減??;相同條件下,基于Gamma先驗(yàn)分布得到的參數(shù)θ的Bayes估計(jì)值與基于Jeffery先驗(yàn)分布得到的Bayes估計(jì)值相比,偏差要小一些;最重要的是,在相同條件下,基于RSS得到的參數(shù)θ的Bayes估計(jì)與基于SRS得到的Bayes估計(jì)相比偏差要小得多。
從表2發(fā)現(xiàn),所有Bayes估計(jì)的均方誤差隨著樣本容量n的增加而減小,符合點(diǎn)估計(jì)的一般要求;相同條件下基于Gamma先驗(yàn)分布得到的參數(shù)θ的Bayes估計(jì)值與基于Jeffery先驗(yàn)分布得到的Bayes估計(jì)值相比,均方誤差明顯的小很多;最重要的是,在相同條件下,基于RSS得到的參數(shù)θ的Bayes估計(jì)與基于SRS得到的Bayes估計(jì)相比,均方誤差要小的多.當(dāng)c=-1時(shí),定理6中的式(24)對數(shù)中出現(xiàn)了負(fù)數(shù),所以此時(shí)的偏差與均方誤差都是復(fù)數(shù),在表1和表2中復(fù)數(shù)沒有列出。表1和表2的結(jié)果充分表明了,針對Pareto的形狀參數(shù),本文介紹的基于RSS的Bayes估計(jì)是有效的。
表1 Bayes估計(jì)的偏差
表2 Bayes估計(jì)的均方誤差