徐美萍,段景輝
(1.北京工商大學(xué) 應(yīng)用數(shù)學(xué)系,北京 100037;2.中國(guó)人民大學(xué) 統(tǒng)計(jì)學(xué)院,北京 100872)
統(tǒng)計(jì)推斷是在不知道總體全部特征的情形下,通過(guò)樣本提供的信息來(lái)推斷總體分布或數(shù)字特征的一種統(tǒng)計(jì)程序。作為統(tǒng)計(jì)學(xué)中不可缺少的研究手段,它的重要性是不言而喻的。Bayes統(tǒng)計(jì)作為統(tǒng)計(jì)學(xué)中的兩大主要學(xué)派之一,其推斷的基礎(chǔ)是后驗(yàn)分布。Bayes推斷利用總體分布中未知參數(shù)θ的先驗(yàn)分布 π(θ)與樣本觀測(cè)值 x=(x1,x2,…,xn)提供的信息,得到后驗(yàn)分布h(θ|x)。由于h(θ|x)綜合了總體、樣本和先驗(yàn)信息,包含了θ所有可供利用的信息,所以有關(guān)θ的估計(jì)和檢驗(yàn)的統(tǒng)計(jì)推斷都按一定方式從后驗(yàn)分布中提取信息,其提取方法相對(duì)于頻率學(xué)派的經(jīng)典統(tǒng)計(jì)推斷,簡(jiǎn)單明了;對(duì)小樣本一般也有較好的推斷效果。
根據(jù)統(tǒng)計(jì)判決理論,在使用統(tǒng)計(jì)推斷結(jié)果時(shí)必需與得失聯(lián)系在一起考慮,即用d=δ(x)作為未知參數(shù)θ的估計(jì)會(huì)帶來(lái)一定的損失,其損失函數(shù)通常用w(θ,d)表示。由于w(θ,d)作為θ的函數(shù)是不可觀測(cè)的,所以有必要對(duì)w(θ,d)作精度估計(jì)。假設(shè)r是損失函數(shù)w(θ,d)的一個(gè)精度估計(jì),文獻(xiàn)[1]引入新的損失函數(shù)
該損失函數(shù)把w(θ,d)與其精度估計(jì)γ集合起來(lái),給出了γ關(guān)于 L(θ,d,γ)的 Bayes估計(jì) γB(x),恰好是 θ 的 Bayes估計(jì) δB(x)的后驗(yàn)損失,即
從頻率學(xué)派的觀點(diǎn)考慮[2],總希望損失函數(shù)w(θ,d)的一個(gè)估計(jì) γ(x)是一個(gè)保守估計(jì),即滿足 Eθ[γ(x)]≥R(θ,δ(x))=Eθ[w(θ,d)],那么從總體上來(lái)說(shuō)可使r(x)不會(huì)低于平均損失。為此給出γ(x)成為一個(gè)保守估計(jì)的未知參數(shù)θ需滿足的一般條件就顯得非常重要。
在統(tǒng)計(jì)、工程和數(shù)學(xué)文獻(xiàn)中我們經(jīng)常會(huì)遇到Laplace分布。它具有較高的尖和稍厚的尾,常用于模擬長(zhǎng)尾對(duì)稱數(shù)據(jù),如誤差、收益率等。Laplace分布還具有幾何無(wú)限可分性,即,若設(shè)vp服從均值為1/ρ的幾何分布,{Xi,i=1,2,…,}為獨(dú)立同分布的隨機(jī)變量序列,且與vp獨(dú)立,則存在實(shí)數(shù)ap>0,bp使得當(dāng)p→∞時(shí)的極限分布為L(zhǎng)aplace分布。在金融資產(chǎn)定價(jià)中我們總是用幾何布朗運(yùn)動(dòng)來(lái)解釋Laplace分布的這種無(wú)限可分性質(zhì)[3]。
文獻(xiàn)[5]、[6]等分別討論了一些常見(jiàn)分布的參數(shù)估計(jì)的損失函數(shù)和風(fēng)險(xiǎn)函數(shù)的Bayes推斷,得出了一些有用的結(jié)果。本文將討論Laplace分布參數(shù)估計(jì)的損失函數(shù)和風(fēng)險(xiǎn)函數(shù)的Bayes推斷問(wèn)題,給出其損失函數(shù)和風(fēng)險(xiǎn)函數(shù)的Bayes估計(jì)為保守估計(jì)的一般條件,并對(duì)上證指數(shù)收益率數(shù)據(jù)作實(shí)證分析。
本文討論的Laplace分布的密度表達(dá)式為
設(shè)x=(x1,x2,…,xn)是來(lái)自(3)的一組樣本觀測(cè)值,則有似然函數(shù)
若 θ 取(4)式的共軛先驗(yàn)分布 IΓ(α,λ),即
其中 α>0,λ>0,則 θ 的后驗(yàn)分布為
即 IΓ(n+α,t+λ)[7]。
取 w(θ,d)為平方損失函數(shù)(θ-d)2(其中 d=δ(x)是未知參數(shù)θ的估計(jì)),則θ的Bayes估計(jì)為
式(6)增加了未知參數(shù)θ的先驗(yàn)信息,可以看作是其最大似然估計(jì)θ^的一個(gè)修正。
設(shè) w(θ,d)的精度估計(jì)為 γ,則 w(θ,d)關(guān)于損失函數(shù) L(θ,d,γ)=w(θ,d)γ-1/2+γ1/2的 Bayes估計(jì)為
由(6)式,θ的Bayes估計(jì)δB(x)的風(fēng)險(xiǎn)函數(shù)為
從上式可看出R(θ,δB)是未知參數(shù)θ的函數(shù),所以可對(duì)它進(jìn)行估計(jì)。又由于 R(θ,δB)是 w(θ,δB(x)的均值,故我們還可以把R(θ,δB)的估計(jì)作為 w(θ,δB(x)的估計(jì)。 在平方損失下,R(θ,δB)的Bayes估計(jì)為
定理 1 對(duì)給定的 α>0,λ>0,γB(x)為保守估計(jì)的充要條件是θ滿足:
注意到保守估計(jì)的定義及(8)式,要使 Eθ[γB(x)]≥R(θ,δB),當(dāng)且僅當(dāng)
移項(xiàng)整理即得(10)式。
定理 2 對(duì)給定的 α>0,λ>0,φ(δB)為保守估計(jì)的充要條件是θ滿足:
接下來(lái)的證明與定理1類似。
綜合上述討論,φ(δB)與 γB(x)作為平方損失函數(shù) w(θ,d)的精度估計(jì)各有優(yōu)勢(shì),我們可以結(jié)合的先驗(yàn)信息,根據(jù)實(shí)際需要及具體計(jì)算結(jié)果,選取其中之一作為損失函數(shù)的精度估計(jì)。如果樣本容量較大,先驗(yàn)信息又告訴我們的可能取值較小,那么選取φ(δB)要好, 而當(dāng) θ的可能取值較大時(shí),取 γB(x)作為 w(θ,d)的精度估計(jì)不失為一種良策。下面的實(shí)證分析結(jié)果表明當(dāng)θ接近于 1,而n、α、λ的值較大時(shí),保守性是較易滿足的一種條件。
圖1 上證指數(shù)收益率數(shù)據(jù)的累積分布與laplace分布函數(shù)圖
本文數(shù)據(jù)來(lái)源于 http://www.google.cn/finance/historical。我們選取了2000.1.4~2009.5.15的上證指數(shù)收盤價(jià)共2253個(gè)數(shù)據(jù),通過(guò)繪制上證指數(shù)收益率(單位:%)數(shù)據(jù)的累積分布與laplace分布函數(shù)圖發(fā)現(xiàn)它們的擬合度很高(圖1)。KS(Kol?mogorov-Smirnov)檢驗(yàn)結(jié)果顯示它們之間的最大距離為D=0.0149,相伴概率為0.6968,可以認(rèn)為上證指數(shù)收益率服從Laplace分布。由于收益率數(shù)據(jù)常常近似獨(dú)立,所以我們從原始數(shù)據(jù)中隨機(jī)抽樣500次,每次抽取容量為1000的一個(gè)樣本,計(jì)算θ的最大似然估計(jì),并把它們作為θ的一組樣本觀測(cè)值,得到θ的樣本平均值為1.1995,樣本方差為0.0009。由于我們假定 θ 取先驗(yàn)分布 IΓ(α,λ),所以 E(θ)=λ/(α-1),Var(θ)=λ2/(α-1)2(α-2),由矩估計(jì)法可解得 α=1600.667,λ=1918.8。再做KS檢驗(yàn),結(jié)果表明θ的樣本觀測(cè)值與先驗(yàn)分布之間的最大距離為D=0.0362,相伴概率為0.5302,不能拒絕θ服從IΓ(α,λ)分布,符合假定。 易算得此時(shí) γB(x)與 φ(δB)均為平方損失函數(shù)的保守估計(jì)。
[1]Rukhin A L.Estimated Loss and Admissible Loss Estimators[C].In Proceedings of Forth Purdue Symposium on Decision Theory,Ed J O Berger and S S Gupta,1987,1.
[2]Kiefei J.Conditional Confidence Statements and Confidence Esti?mators[J].J Am Statist Assoc,1977,72.
[3]蔣春福,李善民,梁四安.中國(guó)股票收益率分布特征的實(shí)證研究[J].數(shù)理統(tǒng)計(jì)與管理,2007,26(4).
[4]Parsian A,Nematollahi N.Estimation of Scale Parameter under Entropy Loss Function[J].Statist Plan Inference,1996,52.
[5]夏亞峰,馬素麗.對(duì)數(shù)正態(tài)參數(shù)估計(jì)的損失函數(shù)和風(fēng)險(xiǎn)函數(shù)的Bayes推斷[J].蘭州理工大學(xué)學(xué)報(bào),2008,34(1).
[6]李楊.正態(tài)參數(shù)估計(jì)的損失函數(shù)和風(fēng)險(xiǎn)函數(shù)的Bayes推斷[J].沈陽(yáng)化工學(xué)院學(xué)報(bào),2000,14(2).
[7]茆詩(shī)松.貝葉斯統(tǒng)計(jì)[M].北京:中國(guó)統(tǒng)計(jì)出版社,1999.