摘要:介紹了廣義中心極限定理、穩(wěn)定分布,認(rèn)為穩(wěn)定分布因具有類似于現(xiàn)實(shí)實(shí)證分布的前段指數(shù),后端冪律的形式,以上證指數(shù)的日收益率序列為例,用穩(wěn)定分布對其進(jìn)行擬合,取得較理想的擬合效果。
關(guān)鍵詞:廣義中心極限定理;穩(wěn)定分布;Stable4.0擬合
一、引言
1963年Mandelbrot針對棉花期貨價格分布的尖峰厚尾特征,將布朗運(yùn)動服從正態(tài)分布改為服從穩(wěn)定分布,推廣和修正了布朗運(yùn)動。Mandebret是最先以穩(wěn)定分布來擬合實(shí)際資產(chǎn)收益。而穩(wěn)定分布是由PaulLevy于1920年提出的。隨后FamaRoll、Press和Zolotare基于穩(wěn)定分布的特征函數(shù)分別給出了穩(wěn)定指數(shù)α的估計方法。1996年,MuCulloch綜述了穩(wěn)定分布在金融領(lǐng)域的相關(guān)應(yīng)用。在國內(nèi),穩(wěn)定分布被不少學(xué)者應(yīng)用到金融模型分析、噪聲數(shù)據(jù)監(jiān)測、話務(wù)量建模等實(shí)際領(lǐng)域。徐龍炳等(2002)通過對中國股票市場的實(shí)證研究,發(fā)現(xiàn)其分布呈現(xiàn)厚尾,股票市場波動顯示出非線性、狀態(tài)持續(xù)性特征,用正態(tài)分布往往難以描述,而用穩(wěn)定分布卻能很好的處理該類分布。歐陽文卓等(2002)等對穩(wěn)定分布及其性質(zhì)特征展開了進(jìn)一步研究,并進(jìn)行參數(shù)估計。戴國強(qiáng)等(2004)對穩(wěn)定分布對外匯市場進(jìn)行實(shí)證研究,分析了匯率波動的穩(wěn)態(tài)特征。王玉玲(2004)對中國股票市場VaR值進(jìn)行了實(shí)證研究,用穩(wěn)定分布去擬合、模擬。2008年,田乃碩、徐秀麗、馬占友在《離散時間排隊論》中討論了馬爾可夫鏈與穩(wěn)定分布。
近年來對穩(wěn)定分布的研究越來越引起重視。本文采用穩(wěn)定分布來擬合上證指數(shù)日收益數(shù)據(jù),基于以下原因:首先,根據(jù)廣義中心極限定理,如果大量獨(dú)立同分布隨機(jī)變量的和存在極限分布,這個極限分布必定屬于穩(wěn)態(tài)分布族;其次,由于大多數(shù)數(shù)據(jù)序列分布具有尖峰厚尾特征,穩(wěn)定分布具有類似于現(xiàn)實(shí)實(shí)證分布的前段指數(shù),后端冪律的形式,用正態(tài)分布描述效果不佳,如果用穩(wěn)定分布去逼近能夠取得較理想的擬合效果。
二、廣義中心極限定理
在經(jīng)典的中心極限定理中,對于每個獨(dú)立同分布的隨機(jī)變量Xi,我們其分布形式?jīng)]作任何要求,唯一的要求是方差有限,這樣就可以保證n個隨機(jī)變量的和趨于一個正態(tài)分布。也就是:。因此,正態(tài)分布是一種非常具有魯棒性(Robust)的分布,它就像密度函數(shù)空間中的的吸引域,無論你一開始服從什么分布,最后都很有可能掉入這個吸引域。這也是正態(tài)分布如此常見的原因。然而,不得不說的是,經(jīng)典中心極限定理的巨大應(yīng)用價值下存在著致命的缺陷:該定理要求每個獨(dú)立的隨機(jī)變量都必須存在有限的方差,而這一要求在很多實(shí)際情況中往往不一定被滿足。以冪律分布為例,當(dāng)冪指數(shù)<2時,隨機(jī)變量的方差是發(fā)散的。因?yàn)閮缏煞植嫉亩A矩在冪指數(shù)α<2時就趨于無窮大。如下:
P.P.Levy,A.Kolmogrov等人于20世紀(jì)初擴(kuò)展了經(jīng)典中心極限定理,推廣到廣義中心極限定理,并在這個過程中,發(fā)現(xiàn)了穩(wěn)定分布(StableDistribution)這一新的概率分布形式。
簡單來說,廣義中心極限定理就是對于n個方差可以無限(當(dāng)然涵蓋方差有限情形)的獨(dú)立同分布隨機(jī)變量Y1,Y2,…Yn,當(dāng)n→∞時,它們的和收斂于一個穩(wěn)定分布Y,如下:
正態(tài)分布之所以普遍是因?yàn)樗喈?dāng)于方差有限的隨機(jī)變量的極限狀態(tài),即形成了一個吸引域,同樣的道理,我們之所以在各種復(fù)雜的系統(tǒng)中觀察到眾多的尾部服從冪律分布,也是在于穩(wěn)定分布的魯棒性,對方差可能無限的隨機(jī)變量和形成了一個吸引域。
穩(wěn)定分布受到了極大的關(guān)注,因?yàn)楹芏嘌芯勘砻?,現(xiàn)實(shí)世界普遍存在的冪律分布僅適用于實(shí)際密度函數(shù)的尾部,而在頭端,則會出現(xiàn)類似指數(shù)函數(shù)的形式。而穩(wěn)定分布恰恰具有類似于現(xiàn)實(shí)實(shí)證分布的這種前段指數(shù),后端冪指的形式,但是遺憾的是,穩(wěn)定分布僅僅能夠給出其特征函數(shù)的解析式,而不存在一般的概率密度表達(dá)式。穩(wěn)定分布的特征函數(shù)的解析式如下:
(1)
其中,s是自變量,i是虛數(shù)單位,sgn是符號函數(shù)(當(dāng)s>0,sgn(s)=1;當(dāng)s<0,sgn(s);當(dāng)s=0,sgn(s)=0),α,β,δ,γ為參數(shù),他們的取值范圍為:α∈(0,2]β∈[-1,1]δ∈(-∞,+∞)γ∈(0,+∞),這些參數(shù)決定了密度曲線f(x)的形狀和位置。其中δ為位置參數(shù),決定了曲線中心的位置,是一個平移參數(shù);γ為尺度參數(shù),是曲線在水平方向上的縮放參數(shù);而α,β這兩個關(guān)鍵參數(shù)分別叫做穩(wěn)定指數(shù)和偏度參數(shù),決定了概率密度曲線的陡峭程度和偏斜程度。
實(shí)際上,當(dāng)α、β取不同特殊值時,我們就能得到常見的曲線。如果讓α=2,β=0時,我們就得到了正態(tài)分布,均值μ=δ,方差σ2=2γ2。如果讓α=1,β=0,我們就得到了柯西分布。如果讓a=1/2,β=1,我們就得到了列維分布。而讓β=0,γ=0,穩(wěn)定分布便退化為常數(shù)。
三、穩(wěn)定分布的推導(dǎo)
那么我們是如何得到穩(wěn)定分布的特征函數(shù)解析式(1)的呢?接下來我們進(jìn)行簡答的推導(dǎo)。我們對經(jīng)典中心極限定理做一個小小的變形,即也可以表述為:對n個方差有限的獨(dú)立同分布的隨機(jī)變量X1,X2,…Xn的和,即:
其中,X服從標(biāo)準(zhǔn)正態(tài)分布N(0,1)
同樣的道理,廣義中心極限定理情形下可以表述為:
其中,Y為一個δ=0,γ=1的穩(wěn)定分布
我們發(fā)現(xiàn),(2)式和(3)式之間最主要的區(qū)別是(2)中an正比于n的1/2次冪,而(3)正比于n的1/α次冪。我們把n項分為兩部分:前面m項和后面n-m項,即:
其中,m、n-m均趨近于無窮大(因?yàn)閚趨近于無窮大),從而:
從而:原來的式(3)可以表述為:
我們比較(3)式和(4)式,會發(fā)現(xiàn)穩(wěn)定分布的隨機(jī)變量Y滿足下式:
其中,b=bm+n-bm-bn,等號表示方程兩邊的隨機(jī)變量有相同的分布(7)式就是穩(wěn)定分布的定義,也就是說任何滿足(7)式的隨機(jī)變量都是穩(wěn)定分布的,反過來,如果隨機(jī)變量是穩(wěn)定分布的,它就應(yīng)該滿足(7)式,接著,我們假設(shè)Y的概率密度函數(shù)是f(y),可以將(7)式改寫為如下表述:
對上式進(jìn)行fourier變換,即可得到穩(wěn)定分布特征函數(shù)解析式(1)。
四、穩(wěn)定帕累托分布實(shí)證擬合可行性
我們發(fā)現(xiàn),真正的統(tǒng)計物理學(xué)家或者數(shù)學(xué)家都很樂意提及一種稱為LevyStableDistribution的模型,也就是說,他們更愿意用穩(wěn)定帕累托分布來對數(shù)據(jù)進(jìn)行實(shí)證研究而非冪律分布。比如,大名鼎鼎的Mandelbrot在1967年就用Stable分布來擬合棉花期貨價格的波動分布。經(jīng)濟(jì)物理學(xué)之父H.E.Stanley和Mantegna曾勇截尾Stable分布來擬合股指波動的分布。為什么這些物理學(xué)家、數(shù)學(xué)家更傾向于用穩(wěn)定帕累托分布而非冪律分布呢?因?yàn)榉€(wěn)定分布的概率密度函數(shù)恰恰具有尾端趨于冪律分布,而頭端(x→0)偏離冪律,趨于指數(shù)分布的性質(zhì)。下面我們看一看Yakovenko等在1997年用美國真實(shí)稅收情況估計收入分布曲線的實(shí)證研究。
美國收入分布的累積概率圖,
來源:Yakovenko(2001)
其中,橫坐標(biāo)是收入值,縱坐標(biāo)是累積概率分布,也就是收入大于橫坐標(biāo)x人口比例。我們可以看出,收入分布曲線明顯的分成了兩段,第一段為左邊的那段弧形曲線,第二段為右下方的直線。由于上圖坐標(biāo)為雙對數(shù),所以直線段是冪律的,即Pareto分布,而第一段的曲線不是冪律的,作者用小圖表示出在橫坐標(biāo)不取對數(shù),縱坐標(biāo)取對數(shù)的情形,發(fā)現(xiàn)該曲線在半對數(shù)坐標(biāo)下變成了直線,也就是說收入在低端部分是指數(shù)分布。
五、穩(wěn)定分布擬合
(一)穩(wěn)定分布參數(shù)估計
本章采用JohnNolan所提供的STABLE4.0軟件。JohnNolan在2002年給出了對大樣本數(shù)據(jù)進(jìn)行處理的程序,可以通過程序擬合以下四個參數(shù):α,β,δ,γ他們的取值范圍為:α∈(0,2]β∈[-1,1]δ∈(-∞,+∞)γ∈(0,+∞)這些參數(shù)決定了密度曲線f(x)的形狀和位置。其中δ為位置參數(shù),決定了曲線中心的位置,是一個平移參數(shù);γ為尺度參數(shù),是曲線在水平方向上的縮放參數(shù);而α,β這兩個關(guān)鍵參數(shù)分別叫做穩(wěn)定指數(shù)和偏度參數(shù),決定了概率密度曲線的陡峭程度和偏斜程度。
運(yùn)行STABLE4.0程序,利用程序的第7項(forfittingasamplewithstableparameters),得到收益數(shù)據(jù)的基本統(tǒng)計信息;并進(jìn)一步選擇估計參數(shù)的方法(本文選擇了極大似然估計),估計出穩(wěn)定分布的四個參數(shù):α、β、δ、γ;同時,由穩(wěn)定分布的性質(zhì)α=2,β=0時,穩(wěn)定分布呈現(xiàn)正態(tài)分布。如下:
420010.9954160.999993
由表二,對比穩(wěn)定分布、正態(tài)分布與經(jīng)驗(yàn)分布函數(shù),可以看出穩(wěn)定分布具有更優(yōu)的擬合效果,尤其在眾數(shù)附近(表中加深區(qū)域),這也反映了穩(wěn)定分布的尖峰特性;同時,從尾部數(shù)據(jù)看,穩(wěn)定分布的數(shù)據(jù)相比正態(tài)分布的數(shù)據(jù)顯示出了厚尾性,更好的刻畫的極端事件的分布特點(diǎn)。
因此,本文引入穩(wěn)定分布來擬合極端事件的分布是合適、可行的,并發(fā)現(xiàn)用穩(wěn)定分布來擬合上證指數(shù)日收益數(shù)據(jù)的分布,更優(yōu)于正態(tài)分布,更能反映出收益分布左偏、厚尾特性。
參考文獻(xiàn):
[1]田乃碩,徐秀麗,馬占友著.離散時間排隊論[M].北京:經(jīng)濟(jì)科學(xué)出版社,2008。
[2]王玉玲.基于穩(wěn)定分布的中國股票市場VaR研究[D].武漢:武漢理工大學(xué),2004。
[3]FamaF,RollR.Somepropertiesofsymmetricstabledistributions[J].JournaloftheAmericanStatisticalAssociation,1968,63:817-836。
[4]MalcolmH.D.KempExtremeevents—RobustPortfolioConstructioninthePresenceofFatTail[M].PublishedbyJohnWileySons,Ltd.2011。
[5]MandelbrotB.Thevariationofcertainspeculativeprices[J].Journalofbusiness,1963:36:304-419。
[6]PressS.Estimationinunivariateandmultivariatestabledistributions[J].JournaloftheAmericanStatisticalAssociation,1972,67(340):842-847。
[7]Reiss,R.D.Thomas,M.Statisticalanalysisofextremevalues[M].PublishedbyBirkhuserBasel,2007。
[8]Stabledistribution:http://academic2.american.edu/~jpnolan/stable/stable.html。