顧蓓青,王蓉華,徐曉嶺
(1.上海對外經(jīng)貿(mào)大學(xué) 統(tǒng)計(jì)與信息學(xué)院,上海 201620;2.上海師范大學(xué) 數(shù)理學(xué)院,上海 200234)
Cauchy分布的統(tǒng)計(jì)分析方法研究
顧蓓青1,王蓉華2,徐曉嶺1
(1.上海對外經(jīng)貿(mào)大學(xué) 統(tǒng)計(jì)與信息學(xué)院,上海 201620;2.上海師范大學(xué) 數(shù)理學(xué)院,上海 200234)
文章在刻度參數(shù)λ已知的情形下,給出了位置參數(shù)μ的分位數(shù)估計(jì)與逆矩估計(jì),通過模擬比較發(fā)現(xiàn)分位數(shù)估計(jì)更加精確。同時(shí)還給出了參數(shù)μ的區(qū)間估計(jì),考察了區(qū)間估計(jì)的精度;在位置參數(shù)μ已知的情形下,給出了刻度參數(shù)λ的極大似然估計(jì),考察了點(diǎn)估計(jì)的精度;在參數(shù)μ,λ都未知的情形下,給出了參數(shù)μ,λ的點(diǎn)估計(jì),通過模擬認(rèn)為位置參數(shù)μ的點(diǎn)估計(jì)取樣本中位數(shù),而刻度參數(shù)λ的點(diǎn)估計(jì)取極大似然估計(jì)(依賴于μ的估計(jì))較為精確。
Cauchy分布;位置參數(shù);刻度參數(shù);逆矩估計(jì);極大似然估計(jì);分位數(shù)估計(jì)
設(shè)隨機(jī)變量X服從位置參數(shù)μ、刻度參數(shù)λ的兩參數(shù)Cauchy分布(記為C(μ,λ)),其密度函數(shù)f(x)和分布函數(shù)F(x)分別為:
特別地,(1)取μ=0 ,此時(shí),
(2)取λ=1,此時(shí),
(3)若取μ=0,λ=1,此時(shí)X~C(0,1),即稱X服從標(biāo)準(zhǔn)Cauchy分布或t(1),其密度函數(shù)f(x)和分布函數(shù)為:
由于Cauchy分布的數(shù)學(xué)期望不存在,使得它在分布理論中占有特殊的地位,在幾乎所有的教科書中,Cauchy分布均作為不存在矩的反例而出現(xiàn),從而使人們誤認(rèn)為它是人為杜撰出來的,并沒有其他的實(shí)際意義。實(shí)際上,文獻(xiàn)[1]中曾指出,Cauchy分布在力學(xué)、電學(xué)、心理生物學(xué)、人類學(xué)和計(jì)量學(xué)中都有許多應(yīng)用。
關(guān)于Cauchy分布的參數(shù)估計(jì),有一些學(xué)者做了研究,取得了一些成果。郭彥在文獻(xiàn)[2]中利用特征函數(shù)討論了Cauchy分布的結(jié)構(gòu)、可加性、無窮可分性等概率性質(zhì),針對C(μ,1)的參數(shù)估計(jì)問題,說明了矩法、均方誤差最小、極大似然估計(jì)法等常用的估計(jì)方法均不合適,并利用Cauchy分布的中位數(shù)給出了參數(shù)μ的點(diǎn)估計(jì)。王志祥在文獻(xiàn)[3]中針對C(0,λ)通過引入新的隨機(jī)變量,利用局部矩估計(jì)方法給出了參數(shù)λ的點(diǎn)估計(jì)與區(qū)間估計(jì),但局部矩估計(jì)依賴于C的取值,影響了該方法的應(yīng)用。吳慶波等在文獻(xiàn)[4]中針對兩參數(shù)Cauchy分布C(μ,λ),給出了位置參數(shù)μ和刻度參數(shù)λ的分位數(shù)估計(jì)。
本文在刻度參數(shù)λ已知的情形下,給出了位置參數(shù)μ的分位數(shù)估計(jì)、逆矩估計(jì)及區(qū)間估計(jì),通過模擬考察了點(diǎn)估計(jì)和區(qū)間估計(jì)的精度,并發(fā)現(xiàn)分位數(shù)估計(jì)更加精確。其次,在位置參數(shù)μ已知的情形下,給出了刻度參數(shù)λ的極大似然估計(jì),通過模擬考察了點(diǎn)估計(jì)的精度。最后,在參數(shù)μ,λ都未知的情形下,給出了參數(shù)μ,λ的點(diǎn)估計(jì),通過模擬認(rèn)為位置參數(shù)μ的點(diǎn)估計(jì)取樣本中位數(shù)較為精確,而刻度參數(shù)λ的點(diǎn)估計(jì)取極大似然估計(jì)(依賴于μ的估計(jì))較為精確。
設(shè)X1,X2,…,Xn為來自總體X~C(μ,λ0)的一個(gè)容量為n的簡單隨機(jī)樣本,其中刻度參數(shù)λ0已知,而位置參數(shù)μ未知時(shí),下面求參數(shù)μ的點(diǎn)估計(jì)與區(qū)間估計(jì)。
如果次序統(tǒng)計(jì)量記為X(1)≤X(2)≤…≤X(n),給定0<p<1,樣本的p分位數(shù)X*(p)可定義為:
其中上式中的<pn>為pn的整數(shù)部分。
由于F(μ)=0.5,則位置參數(shù)μ的分位數(shù)估計(jì)為:1=X*(0.5)
化簡得:
引理1:(1)μ的方程有唯一實(shí)根。(2)對正常數(shù)a,μ的方程有唯一實(shí)根。
易見,方程(1)的根即為參數(shù)μ的逆矩估計(jì)2。
再者易知:
于是,給定置信水平1-α下,參數(shù)μ的區(qū)間估計(jì)為:
其中,21,22分別為如下方程的根:
給定樣本容量n,參數(shù)真值取μ=1,λ0=1,通過1000次Monte-Carlo模擬得到參數(shù)μ的點(diǎn)估計(jì)的均值與均方差,結(jié)果列于表1,從中可以看到不論是小樣本還是大樣本,方法一都優(yōu)于方法二。
表1 參數(shù)μ的點(diǎn)估計(jì)模擬比較
給定樣本容量n,參數(shù)真值取μ=1,λ0=1,置信水平1-α=0.95,通過1000次Monte-Carlo模擬得到參數(shù)μ的區(qū)間估計(jì)的平均下限、平均上限、平均區(qū)間長度,以及區(qū)間估計(jì)包含參數(shù)真值的次數(shù),結(jié)果列于表2,從中可以看到0.95的置信水平基本達(dá)到,同時(shí)隨著樣本容量n的增加,區(qū)間估計(jì)的平均長度呈減小趨勢,也就是區(qū)間估計(jì)越精確。
表2 參數(shù)μ的區(qū)間估計(jì)
設(shè)X1,X2,…,Xn為來自總體X~C(μ0,λ)的一個(gè)容量為n的簡單隨機(jī)樣本,其中位置參數(shù)μ0已知,而刻度參數(shù)λ未知時(shí),下面求參數(shù)λ的點(diǎn)估計(jì)。
表3 參數(shù)λ的0.25分位數(shù)估計(jì)和0.75分位數(shù)估計(jì)大于0的次數(shù)
記樣本觀察值為x1,x2,…,xn,則似然函數(shù)為:
注:文獻(xiàn)[4]中所給出的關(guān)于刻度參數(shù)λ的似然方程是錯(cuò)誤的。
引理 2:λ的方程有唯一正實(shí)根。
易見,方程(4)的根即為參數(shù)λ的極大似然估計(jì)2。
給定樣本容量n,參數(shù)真值取μ0=1,λ=1,通過1000次Monte-Carlo模擬得到參數(shù)λ的點(diǎn)估計(jì)的均值與均方差,結(jié)果列于表4,從中看到其精度還是令人滿意的。
表4 參數(shù)λ的點(diǎn)估計(jì)
設(shè)X1,X2,…,Xn為來自總體X~C(μ,λ)的一個(gè)容量為n的簡單隨機(jī)樣本,次序統(tǒng)計(jì)量記為X(1)≤X(2)≤…≤X(n),其次序觀察值記為x(1)≤x(2)≤…≤x(n)。
則參數(shù)μ,λ的點(diǎn)估計(jì)為:=X*(0.5),1=X*(0.5)-X*(0.25)
則參數(shù)μ,λ的點(diǎn)估計(jì)為:=X*(0.5),2=X*(0.75)-X*(0.5)
位置參數(shù)的點(diǎn)估計(jì)取為=X*(0.5),而刻度參數(shù)的點(diǎn)估計(jì)3可取為如下方程的根:
給定樣本容量n,參數(shù)真值取μ=1,λ=1,通過1000次模擬得到參數(shù)λ的點(diǎn)估計(jì)的均值與均方差,結(jié)果列于表5,從中可以看到方法三更優(yōu)。
例1:文獻(xiàn)[3]提供了如下算例,取樣本容量n=10,刻度參數(shù)λ的真值取為5,通過Monte-Carlo模擬產(chǎn)生10個(gè)服從C(0,λ)分布的隨機(jī)數(shù)如下:
2.3008,3.9756,-6.4165,11.9341,16.4812,-0.2428,-7.9044,-6.3136,14.5784,-1.9155
文獻(xiàn)[3]得到了參數(shù)λ的局部矩估計(jì)為:=5.0953
(1)當(dāng)參數(shù)λ=5已知時(shí),參數(shù)μ的點(diǎn)估計(jì)為1=X*(0.5)=1.029,=1.6879,給定置信水平0.95下,參數(shù)μ的區(qū)間估計(jì)為:
(2)當(dāng)參數(shù)μ=0已知時(shí),參數(shù)λ的0.25分位數(shù)估計(jì)為1(0.25)=μ0-X*(0.25)=6.3136 ,0.75 分位數(shù)估計(jì)為1(0.75)=X*(0.75)-μ0=11.9341,極大似然估計(jì)2=5.5386 ;
(3)當(dāng)參數(shù)μ,λ都未知時(shí),μ的點(diǎn)估計(jì)為=X*(0.5)=1.029 ,λ的 點(diǎn) 估 計(jì) 為1=X*(0.5)-X*(0.25)=7.3426 ,2=X*(0.75)-X*(0.5)=10.9051 ,3=5.6939
例2:取樣本容量n=30,通過Monte-Carlo模擬產(chǎn)生一組服從C(2,3)分布的隨機(jī)數(shù)如下:
5.11597, -0.232211, 6.7509, 5.26303, 2.80716,1.96063,-0.943453,-0.754331,3.11886,5.40918,-6.09775,2.3691,0.499949,1.11528,2.4189,0.284043,-2.20647,11.5716,284.604,22.5808,5.52263,7.28462,-4.86067,4.58242,-21.4326,4.87815,3.84585,2.19667,-0.332737,-42.9647
(1)當(dāng)參數(shù)λ=3已知時(shí),參數(shù)μ的點(diǎn)估計(jì)為1=X*(0.5)=2.394 ,2=2.4367 ,給定置信水平0.95下,參數(shù)μ的區(qū)間估計(jì)為:
(2)當(dāng)參數(shù)μ=2已知時(shí),參數(shù)λ的0.25分位數(shù)估計(jì)為1(0.25)=μ0-X*(0.25)=2.3327 ,0.75 分位數(shù)估計(jì)為1(0.75)=X*(0.75)-μ0=3.2630,極大似然估計(jì)2=2.8423;
(3)當(dāng)參數(shù)μ,λ都未知時(shí),μ的點(diǎn)估計(jì)為=X*(0.5)=2.394 ,λ的點(diǎn)估計(jì)為1=X*(0.5)-X*(0.25)=2.7267 ,2=X*(0.75)-X*(0.5)=2.8690 ,3=2.8081
考慮到Cauchy分布C(μ,λ)其數(shù)學(xué)期望不存在的特殊性及其在眾多領(lǐng)域的重要應(yīng)用,本文在已有研究成果的基礎(chǔ)上,進(jìn)一步討論了它的參數(shù)估計(jì)問題。在參數(shù)λ已知的情形下,給出了參數(shù)μ的分位數(shù)估計(jì)、逆矩估計(jì)及區(qū)間估計(jì);另外,在參數(shù)μ已知的情形下,給出了參數(shù)λ的分位數(shù)估計(jì)和極大似然估計(jì);并且分別通過Monte-Carlo模擬考察了點(diǎn)估計(jì)和區(qū)間估計(jì)的精度,發(fā)現(xiàn)參數(shù)μ的分位數(shù)估計(jì)較優(yōu),參數(shù)λ的極大似然估計(jì)較優(yōu)。最后,在兩個(gè)參數(shù)μ,λ都未知的情形下,給出了參數(shù)μ,λ的幾種點(diǎn)估計(jì)方法,通過大量Monte-Carlo模擬發(fā)現(xiàn)參數(shù)μ的點(diǎn)估計(jì)取樣本中位數(shù)較為精確,而刻度參數(shù)λ的點(diǎn)估計(jì)取極大似然估計(jì)(依賴于μ的估計(jì))較為精確。
[1]方開泰,許建倫.統(tǒng)計(jì)分布[M].北京:科學(xué)出版社,1987.
[2]郭彥.對柯西分布性質(zhì)的進(jìn)一步討論[J].淮陰工學(xué)院學(xué)報(bào),2005,(5).
[3]王志祥.Cauchy分布刻度參數(shù)的矩估計(jì)與區(qū)間估計(jì)[J].統(tǒng)計(jì)與決策,2008,(23).
[4]吳慶波,李再興,景平.一元Cauchy分布族中兩參數(shù)的分位數(shù)估計(jì)及其性質(zhì)[J].廊坊師范學(xué)院,2010,(1).
[5]徐曉嶺,王蓉華.概率論與數(shù)理統(tǒng)計(jì)[M].北京:人民郵電出版社,2014.
Study on Statistical Analysis Method of Cauchy Distribution
Gu Beiqing1,Wang Ronghua2,Xu Xiaoling1
(1.School of Statistics and Information,Shanghai University of International Business and Economics,Shanghai 201620,China;2.College of Mathematics and Science,Shanghai Normal University,Shanghai 200234,China)
This paper gives the quantile estimate and inverse moment estimate of location parameterμin the case of known scale parameterλ,and finds that quantile estimate is more accurate through simulation comparison.At the same time,the interval estimate of parameterμis given and the precision of interval estimate investigated;the maximum likelihood estimate of scale parameterλalso given in the case of known location parameterμ,and the precision of point estimate investigated;the point estimates of parametersμ,λis provided in the case of unknown parametersμ,λ;the paper finds that sample median is more accurate for point estimate of location parameterμ,while maximum likelihood estimate depending on estimate ofμis more accurate for point estimate of scale parameterλ.
Cauchy distribution;location parameter;scale parameter;inverse moment estimate;maximum likelihood estimate;quantile estimate
O212
A
1002-6487(2017)20-0019-04
國家自然科學(xué)基金資助項(xiàng)目(11671264)
顧蓓青(1984—),女,上海人,博士,講師,研究方向:應(yīng)用統(tǒng)計(jì)。
(責(zé)任編輯/亦 民)