蔡偉宏,唐齊鳴
(1.華中科技大學經(jīng)濟學院,湖北武漢430074;
2.廣東外語外貿(mào)大學國際經(jīng)濟貿(mào)易學院,廣東廣州510006)
基于無窮狀態(tài)轉(zhuǎn)換模型的中國股票市場收益率分析
蔡偉宏1,2,唐齊鳴1
(1.華中科技大學經(jīng)濟學院,湖北武漢430074;
2.廣東外語外貿(mào)大學國際經(jīng)濟貿(mào)易學院,廣東廣州510006)
本文建立一個狀態(tài)數(shù)目由數(shù)據(jù)決定的馬爾可夫轉(zhuǎn)換向量自回歸模型,用貝葉斯方法推斷模型參數(shù),并利用基于Gibbs分塊采樣的MCMC方法做逼近。然后本文用此模型和估計方法分析上海A股市場周收益率,結(jié)果發(fā)現(xiàn),我國股票市場最可能存在5個不同的狀態(tài),狀態(tài)間的區(qū)分首以波動性大小不同為標準,股市除了在初期波動性極小外,從1992年4月開始可以分為兩個階段,在各階段股市均在三個狀態(tài)之間轉(zhuǎn)換。
無窮狀態(tài)轉(zhuǎn)換;向量自回歸;貝葉斯推斷;分塊采樣;A股市場收益率
很多經(jīng)濟變量在一些時間段都會出現(xiàn)結(jié)構(gòu)性變化,其時間序列有明顯不同的表現(xiàn)。時間序列的顯著變化可以視為時間序列的生成過程在不同狀態(tài)之間的相互轉(zhuǎn)換。對于時間序列的這種復雜變化過程,如果能準確判斷狀態(tài)轉(zhuǎn)換什么時候發(fā)生,則可以對時間序列進行分段建模。但問題是狀態(tài)一般是隱藏著觀測不到的,在大多數(shù)情況下,沒有充分理由判定從哪一個時點開始模型的參數(shù)已經(jīng)發(fā)生了顯著改變。馬爾可夫狀態(tài)轉(zhuǎn)換模型(Markov Switching Model,狀態(tài)轉(zhuǎn)換模型、MS模型)能將這種狀態(tài)轉(zhuǎn)換作為一個內(nèi)生的隨機變量,進而用一個統(tǒng)一的模型來刻畫時間序列的顯著變化。
Hamilton[1]最初建立的狀態(tài)轉(zhuǎn)換模型是對單變量時間序列在兩個不同的狀態(tài)下建立自回歸模型(Autoregressive模型,AR模型),用于描述不同經(jīng)濟周期狀態(tài)下的經(jīng)濟增長。隨后的研究將狀態(tài)轉(zhuǎn)換的思想與其他基礎(chǔ)模型結(jié)合起來,出現(xiàn)了MS-VAR模型[2]、MS-VECM模型[3]、MS-ARCH模型[4]等擴展模型,狀態(tài)轉(zhuǎn)換模型作為一種重要的非線性計量經(jīng)濟模型,具有建模簡單,經(jīng)濟意義明確等優(yōu)點,在研究長期經(jīng)濟現(xiàn)象和短期經(jīng)濟波動方面得到廣泛的應用。
實踐上,現(xiàn)有的狀態(tài)轉(zhuǎn)換模型存在兩個值得注意的問題:(1)模型的漸進分布不是標準的,因此狀態(tài)數(shù)目不能通過通常的似然比檢驗、拉格朗日乘子檢驗或者Wald檢驗來決定[5-6]。一種可行處理辦法是采用AIC和HQ模型選擇準則,但只能是在少數(shù)可能的狀態(tài)數(shù)目之間進行對比,比如朱鈞鈞和謝識予[7]對股指收益率的分析。更通常的做法是主觀選擇狀態(tài)數(shù)目,比如對股市收益率的分析大多設(shè)定狀態(tài)數(shù)目為2個或3個[8-9]。由于實際數(shù)據(jù)的復雜性以及數(shù)據(jù)的動態(tài)更新性,人為地設(shè)定狀態(tài)數(shù)目通常不能最佳地描述數(shù)據(jù),模型從給定數(shù)據(jù)集中得到的信息有限。(2)目前狀態(tài)轉(zhuǎn)換模型的估計多采用Hamilton[1]的精確極大似然估計法或者Kim和Nelson[10]基于Hamilton方法提出的近似極大似然估計法,不利于發(fā)現(xiàn)小樣本經(jīng)濟數(shù)據(jù)的規(guī)律。Psaradakis和Sola[11]在研究了Hamilton方法的有限樣本性質(zhì)后發(fā)現(xiàn),由于Hamilton方法估計模型參數(shù)時要求觀測變量來自于不變分布,因此觀測值必須是大量的,以正態(tài)分布為例,即使是只設(shè)定兩種狀態(tài),也至少需要有400個觀測值,在小樣本條件下,參數(shù)估計量失去有效性。
小樣本問題不難采用偏倚估計量修正和解決,但決定狀態(tài)數(shù)目就比較困難了。Beal等[12]、Teh等[13]、Fox等[14]發(fā)展了無窮狀態(tài)隱馬爾可夫模型(infinite Hidden Markov Model,i HMM)及相應的分析算法,筆者發(fā)現(xiàn),如果用i HMM改進目前的狀態(tài)轉(zhuǎn)換模型,則能夠處理好以上兩個問題。無窮狀態(tài)的含義是,如果有必要,模型的狀態(tài)數(shù)可以是無窮大,但iHMM在實際應用中,將根據(jù)數(shù)據(jù)的情況以一定的概率增加或減少狀態(tài)數(shù),從而自動地選擇描述數(shù)據(jù)的最優(yōu)隱狀態(tài)個數(shù),而不需要人為地設(shè)定狀態(tài)數(shù)目。而且i HMM是貝葉斯模型,由于在小樣本條件下參數(shù)具有隨機性的特征,而貝葉斯方法恰恰將參數(shù)視為隨機變量,既能克服小樣本經(jīng)典估計不穩(wěn)定的缺點,又能保持大樣本經(jīng)典估計優(yōu)良性的穩(wěn)健估計,因此大、小樣本均適用。
目前的狀態(tài)轉(zhuǎn)換模型實質(zhì)是統(tǒng)計學中的有限狀態(tài)隱馬爾可夫模型(簡稱HMM)在經(jīng)濟中的應用。i HMM在隱狀態(tài)的轉(zhuǎn)換和與狀態(tài)對應的觀測等概念上體現(xiàn)了與有限狀態(tài)隱馬爾可夫模型一樣的數(shù)學建模思想,但它是一種新方法,對HMM的數(shù)學理論和算法做了全面的改變。i HMM中狀態(tài)轉(zhuǎn)換概率既不是固定的,也不服從一個參數(shù)分布,而是服從非參數(shù)的分層狄利克雷過程(Hierarchical Dirichlet Process,HDP),利用狄利克雷過程(DP)的性質(zhì),i HMM能自動生成狀態(tài)數(shù)。i HMM的建模用的是非參數(shù)貝葉斯方法,一般用馬爾可夫鏈蒙特卡羅(Markov Chain Monte Carlo,MCMC)逼近。不過,Beal等[12]、Teh等[13]的模型及所用的Gibbs采樣方法不適應于研究時變數(shù)據(jù),F(xiàn)ox等[14]在Teh等[13]的基礎(chǔ)上提出了一種i HMM處理向量自回歸(簡稱VAR)型和狀態(tài)空間型時間序列的研究模型,并介紹了一種基于截斷近似分塊采樣的模型估計方法。Fox[14]對巴西股市IBOVESPA指數(shù)1997年1月3日到2001年1月15日期間的日收益率數(shù)據(jù)建立狀態(tài)轉(zhuǎn)換隨機波動率模型,發(fā)現(xiàn)在識別收益率序列從一個狀態(tài)轉(zhuǎn)換到另一個狀態(tài)的時點方面與Carvalho和Lopes[15]的兩狀態(tài)轉(zhuǎn)換隨機波動率模型的結(jié)果非常類似,都識別出由于關(guān)鍵經(jīng)濟事件發(fā)生而導致的狀態(tài)改變,不同的是模型識別出有3個狀態(tài)而不是Carvalho和Lopes[15]主觀設(shè)定的2個。
Fox等[14]用i HMM處理了向量自回歸型和狀態(tài)空間型的時間序列,但所用的VAR不包含常數(shù)項,在建立VAR系統(tǒng)時,需要先對數(shù)據(jù)做離差處理,移除樣本均值,因此不能處理不同狀態(tài)下均值不同的時間序列。本文對Fox等[14]的模型進行修改,能處理帶截距項的VAR,使Fox模型更一般化,可以為不同狀態(tài)下有不同均值的時間序列建模。相對于原來的狀態(tài)轉(zhuǎn)換VAR模型,改進后的模型是一種無窮狀態(tài)轉(zhuǎn)換VAR模型(i MS-VAR模型)。從實踐來看,無窮隱馬爾可夫模型主要應用在工程領(lǐng)域,本文嘗試用這樣一個新的模型分析我國股市收益率狀態(tài)轉(zhuǎn)換行為。
與國內(nèi)現(xiàn)有的研究股市波動狀態(tài)轉(zhuǎn)換文獻對比,模型設(shè)定上,有的采用狀態(tài)轉(zhuǎn)換的帶截距自回歸模型[9],有的采用狀態(tài)轉(zhuǎn)換的ARCH類模型[7-8],有的采用均值依賴狀態(tài)但回歸系數(shù)不變的狀態(tài)轉(zhuǎn)換自回歸模型[16-17]。本文采用的是狀態(tài)轉(zhuǎn)換的帶截距自回歸模型。模型估計方面,有的用經(jīng)典方法[9,16-17],有的用貝葉斯方法[7-8]。本文用的是貝葉斯方法。本文與其他文獻的關(guān)鍵區(qū)別在于狀態(tài)數(shù)目的設(shè)定。有的文獻假設(shè)有兩個狀態(tài),原因是股市“牛熊”交替顯著[8]。而大多文獻設(shè)定的是三個狀態(tài),原因有的認為股市波動有上漲、下跌、橫盤狀態(tài)或其變化形式[9,16-17],,也有的是通過比較兩個狀態(tài)和三個狀態(tài)的模型結(jié)果而得出[7]。而本文與其他文獻有本質(zhì)的不同,本文中狀態(tài)數(shù)目是數(shù)據(jù)自己選擇的。其他用狀態(tài)轉(zhuǎn)換模型分析股市收益率波動非對稱性的文獻,使得股市狀態(tài)的劃分內(nèi)生化,“由樣本數(shù)據(jù)自己決定市場的實際狀態(tài)和在每種狀態(tài)的持續(xù)時間”[16],而本文進一步使得股市狀態(tài)數(shù)目本身內(nèi)生化,由樣本數(shù)據(jù)自己決定有幾種狀態(tài)。
我們將Hamilton[2]的專著中提出的狀態(tài)轉(zhuǎn)換VAR模型擴展為無窮狀態(tài)轉(zhuǎn)換VAR模型,并用貝葉斯方法進行估計。
2.1 模型設(shè)定
無窮狀態(tài)轉(zhuǎn)換VAR模型的形式如下:
其中,i,j=1,2,…。yt為時刻t的n維觀測值向量,滿足非限制性q階自回歸模型。A(st)0為依賴于狀態(tài)變量st的n維截距向量,A(st)m為依賴于狀態(tài)變量st的n×n維系數(shù)矩陣,e(st)t為依賴于狀態(tài)變量st的n維隨機誤差向量,服從n元正態(tài)分布,是它的方差協(xié)方差陣。st為時刻t不可觀測的狀態(tài)變量,它可以取可數(shù)無限個自然數(shù)值,s1:t-2=(st-2,…,s1)。P為無限維轉(zhuǎn)換概率矩陣,第j行第i列的元素πji表示狀態(tài)j轉(zhuǎn)換到狀態(tài)i的概率。y1:t-1=(yt-1′,…,y1′)′為包含至時刻t-1的全部觀測值的向量。狀態(tài)序列滿足馬爾可夫性。
模型需要估計的參數(shù)包括VAR參數(shù)A(j)0、和1。我們將轉(zhuǎn)換概率矩陣的先驗分布分二層設(shè)定為:
β|γ~GEM(γ)
πj|β~DP(α,(1-ρ)β+ρδj),j=1,2,…
第一層為中間參數(shù)β的分布,β=(β1,β2,…),它是一個關(guān)于自然數(shù)的隨機概率測度,服從參數(shù)為γ的斷棒過程(Stick Breaking Process),用GEM(γ)表示。
第二層為轉(zhuǎn)換概率矩陣每一行即πj的分布。在無窮狀態(tài)情形下,為了避免過度參數(shù)化,設(shè)定每一個πj(j=1,2,…)條件獨立同分布,服從精度參數(shù)為α、基分布為(1-ρ)β+ρδj的狄利克雷過程。其中,α是一個正數(shù),ρ是取值范圍在0到1之間的一個參數(shù),δj為在j處取值1的概率測度,即單點分布。狄利克雷過程是基于分布上的分布,這里的基分布是一以及轉(zhuǎn)換概率矩陣P?,F(xiàn)有的狀態(tài)轉(zhuǎn)換模型按對參數(shù)估計方法的不同,分為經(jīng)典模型和貝葉斯模型兩種,經(jīng)典模型用極大似然估計法,而貝葉斯模型先設(shè)定參數(shù)的先驗分布,結(jié)合樣本數(shù)據(jù)得到邊緣后驗分布后對參數(shù)進行推斷。但不管是哪一種模型,都事先固定了狀態(tài)的數(shù)目。我們模型的特點在于狀態(tài)數(shù)目不是固定的,而是由數(shù)據(jù)學習得到的,是一個貝葉斯推斷過程,開始時假設(shè)有無限個,相應的轉(zhuǎn)換概率矩陣P第j行的元素πj是一個無限維的向量,結(jié)合樣本數(shù)據(jù),推斷出最可能的狀態(tài)數(shù)目以及狀態(tài)間的轉(zhuǎn)換概率。而實現(xiàn)的關(guān)鍵是在貝葉斯分析框架下,設(shè)定模型中πj的先驗分布是一個服從狄利克雷過程的分布,它是一個不可用有限數(shù)量的參數(shù)描述的自由分布,性質(zhì)靈活可變,在貝葉斯推斷過程中有很好的聚類特性,而且不需要事先設(shè)定類別的數(shù)量。下面是無窮狀態(tài)轉(zhuǎn)換VAR模型的貝葉斯分析過程。
2.2 模型待估計參數(shù)的先驗分布
首先設(shè)定轉(zhuǎn)換概率矩陣的先驗分布。轉(zhuǎn)換概率矩陣P第j行的元素πj=(πj1,πj2,…),是一個關(guān)于自然數(shù)的概率測度,表示狀態(tài)j轉(zhuǎn)換到任何一個狀態(tài)i=1,2,…的概率分布。由于可能的狀態(tài)數(shù)目是無限的,因此轉(zhuǎn)換概率矩陣的每一行都是無限維的,并滿足πji≥0,且對所有的j都有個概率測度,起著控制樣本中心的作用,如這里的(1 -ρ)β+ρδj,為πj的均值;精度參數(shù)反映樣本與基分布的相似程度,如這里的α,為狄利克雷過程分布的方差的倒數(shù),精度參數(shù)α越大,則πj與基分布將更加相似。與原來的有限隱馬爾可夫模型相比,無窮狀態(tài)隱馬爾可夫模型引入了分層狄利克雷過程,因此也被稱為分層狄利克雷過程隱馬爾可夫模型(Hierarchical Dirichlet Process Hidden Markov Model,HDP-HMM)。
轉(zhuǎn)換概率分布πj的期望值是分布β和單點分布δj的凸組合,即無限維轉(zhuǎn)換概率矩陣的期望為:
在標準的i HMM[12-13]中,狄利克雷過程的基分布并不含有ρ和δj。將ρ和δj引入i HMM是Fox等[14]的貢獻,目的是使得iHMM能夠表現(xiàn)時變數(shù)據(jù)狀態(tài)持續(xù)的特征。如果沒有ρ和δj,模型在某狀態(tài)停留一定時間的概率隨著時間的增長呈指數(shù)下降,這在估計狀態(tài)是有限的隱馬爾可夫模型的時候問題還不算嚴重,因為狀態(tài)數(shù)目有限,還能保證每個狀態(tài)都有一定數(shù)量的觀測數(shù)據(jù),但在估計無窮狀態(tài)隱馬爾可夫模型的時候,每個不同的觀測數(shù)據(jù)歸到不同的狀態(tài),于是狀態(tài)會被稀釋,繼而非常不利于推斷出持續(xù)存在的狀態(tài)。因此,在Fox等[14]的文章之前,i HMM并不適合表征時變數(shù)據(jù)。
Fox等[14]通過將ρ和δj引入i HMM作為狄利克雷過程基分布的一部分,弱化了i HMM估計過程中狀態(tài)分配過于分散的現(xiàn)象,從而利于推斷出時變數(shù)據(jù)持續(xù)存在的狀態(tài)。這里的β給出一個狀態(tài)j(j =1,2,…)向任何一個狀態(tài)轉(zhuǎn)換的原始分布,δj體現(xiàn)了狀態(tài)j向自己轉(zhuǎn)換也就是狀態(tài)j繼續(xù),而ρ是一個權(quán)衡,ρ越趨近于1,狀態(tài)j向自己轉(zhuǎn)換的期望概率E[πjj|β,ρ]也就越大。Fox等[14]將其稱為粘性HDP-HMM(Sticky HDP-HMM)。對于經(jīng)濟時間序列來說,一個狀態(tài)一般會持續(xù)一段時間,因此在Fox等[14]的文章之后,i HMM才適應于經(jīng)濟時間序列的分析。
接下來我們給出VAR參數(shù)的先驗分布。記當前時刻為T。給定狀態(tài)序列s1:T,記狀態(tài)的個數(shù)為K,我們將觀測值模型分成K組參數(shù)不同的向量自回歸模型。設(shè)狀態(tài)k(k=1,…,K)下的觀測值向量有Nk個,Nk=|{t|st=k,t=1…,T}|,將這Nk個n維觀測值向量形成一個n×Nk維的矩陣,記為Y(k);相應的 Nk個滯后q 階觀測值向量形成的(n×q+1)×Nk維矩陣記為;記Rn×(n×q+1),則:
其中,E(k)為相應隨機誤差向量形成的矩陣。稱上式中的參數(shù){A(k),Σ(k)}(k=1,…,K)集合為動態(tài)參數(shù)集合,記為θ。
同樣為了不過度參數(shù)化,動態(tài)參數(shù)集合條件獨立服從同一先驗分布,設(shè)定Σ(k)的先驗為逆wishart分布:Σ(k)~IW(n0,S0)。
向量化的A(k)記為vec(A(k)),先驗分布為正態(tài)分布:vec(A(k))~N(ηA,ΣA)。
最后,我們給出轉(zhuǎn)換概率矩陣的先驗分布本身帶有的參數(shù)的先驗分布,這些參數(shù)被稱為超參數(shù),設(shè)定斷棒過程參數(shù)γ的先驗分布為Gamma(u,v),狄利克雷過程參數(shù)α的先驗分布為Gamma(c,b)、參數(shù)ρ的先驗分布為Beta(g,d)。
2.3 模型的估計
我們需要估計轉(zhuǎn)換概率矩陣的中間參數(shù)和超參數(shù)、隱含的狀態(tài)序列s1:T、模型動態(tài)參數(shù)θ。貝葉斯方法用參數(shù)后驗分布的期望作為參數(shù)的估計值。由于轉(zhuǎn)換概率矩陣每一行πj服從的狄利克雷過程是一個無法用有限數(shù)量的參數(shù)描述的分布,導致模型參數(shù)的邊緣后驗分布密度形式非常復雜,期望的計算困難,目前有兩種處理方法:一種是變分推斷近似,計算速度快,但有效算法很難得到;另一種是MCMC法,它比變分推斷可行性強,一般不需要作近似,僅需要對一系列條件概率分布進行循環(huán)采樣。這里采用MCMC法。
Gibbs采樣是一種簡單的MCMC方法,它先設(shè)定參數(shù)初始值,再依次從各參數(shù)的滿條件分布中采樣來模擬邊緣分布。對分層狄利克雷過程主要是采用Collapsed Gibbs采樣算法,算法特點是將不需要的變量(如邊緣轉(zhuǎn)換概率分布)積分掉,只對需要的變量進行采樣。但由于是逐個更新隨機變量,比如逐個采樣狀態(tài)序列的各個分量,采樣速度慢,特別在高維情況下。分塊采樣是特殊的Gibbs采樣,它基于條件獨立性對隨機變量進行分組,分別一次性更新組變量和條件變量,在處理高維隨機變量采樣時效率高,處理狀態(tài)和參數(shù)雙估計問題時更好。一次性采樣狀態(tài)序列可以利用狀態(tài)轉(zhuǎn)換的馬爾可夫性質(zhì)使用前向后向算法實現(xiàn),但該算法采樣狀態(tài)序列需要給定轉(zhuǎn)換概率分布πj,也就是說需要先采樣本來不需要的邊緣轉(zhuǎn)換概率分布,而服從狄利克雷過程的轉(zhuǎn)換概率是可數(shù)無限的,一種解決思路是用有限的分布去近似分層狄利克雷過程,F(xiàn)ox等[14]用的就是這種辦法,截斷無限的斷棒過程為有限的狄利克雷分布(Dirichlet Distribution)。將轉(zhuǎn)換概率矩陣的先驗分布近似為:
β|γ~Dir(γ/L,…,γ/L)
πj|β~Dir((1-ρ)αβ1,…,(1-ρ)αβi+ρα,…,(1-ρ)αβL)
其中,L為近似用的截斷值,即可能的最大狀態(tài)數(shù)目,一般取較大值。
然后運用Gibbs分塊采樣原理,將要采樣的隨機變量分為五組依次從各自的后驗分布中采樣。步驟如下:
(1)選取各參數(shù)的初始值和定義先驗概率密度函數(shù);
(2)采樣狀態(tài)序列s1:T;
(3)采樣一些輔助變量;
(4)采樣轉(zhuǎn)換概率參數(shù){β,π};
(5)采樣VAR參數(shù)即動態(tài)參數(shù)θ;
(6)采樣超參數(shù){α,ρ,γ};
(7)不斷重復(2)至(6)。
2.4 模型比較
為了體現(xiàn)無窮狀態(tài)轉(zhuǎn)換VAR模型的效果,我們將它與MS-VAR模型進行比較。由于MS-VAR模型可以用極大似然法估計,也可以用貝葉斯方法估計,因此一般的,我們用Geweke和Amisano[18]給出的模型比較方法,它可以用來衡量貝葉斯方法估計的模型與傳統(tǒng)方法估計的模型擬合同一數(shù)據(jù)集的好壞,該方法借助貝葉斯因子統(tǒng)計量[19]。模型H1相對于模型H2的貝葉斯因子B12的定義為:
其中,p(y1:T|H)為模型H的邊緣似然函數(shù)。根據(jù)Dawid[20],當數(shù)據(jù)是時間序列的時候,模型H的邊緣似然函數(shù)有如下形式:
其中,p(yt|y1:t-1,H)為預測似然函數(shù)。對于貝葉斯方法估計的模型,計算如下:
其中,ΨH為模型參數(shù)集合。預測似然函數(shù)可以用下式估計:
其中,Ψ(m)H為從參數(shù)集合后驗分布p(ΨH|y1:t-1,H)中第m次采樣得到的樣本。特別的,當H為iMS-VAR模型時,預測似然函數(shù)的估計為:
對于傳統(tǒng)方法估計的模型,預測似然函數(shù)直接為p(yt|y1:t-1,^Ψ(t-1)H,H),其中,^Ψ(t-1)H為以t-1時刻為止的歷史數(shù)據(jù)為條件得到的參數(shù)估計值。
用于模型比較的貝葉斯因子取對數(shù)后實為兩個模型的對數(shù)邊緣似然之差,如果H1是貝葉斯方法估計的模型,H2是傳統(tǒng)方法估計的模型,則:
根據(jù)Kass和Raftery[19],有如下判斷準則:如果對數(shù)貝葉斯因子在0到1之間,則無法分辨兩個模型的優(yōu)劣;如果該因子在1到3之間,則認為模型1優(yōu)一些;如果該因子在3到5之間,則認為模型1明顯好于模型2;如果該因子比5大,則認為模型1有決定性的優(yōu)勢。
本部分以上海A股市場作為我國股票市場的代表,以其收益率為實證分析的對象,建立單變量的無窮狀態(tài)轉(zhuǎn)換AR模型,探討股票市場的狀態(tài)轉(zhuǎn)換行為。
3.1 數(shù)據(jù)描述和初步分析
樣本為1990年12月末至2011年2月末上海A股市場考慮現(xiàn)金紅利再投資的流通市值加權(quán)平均法計算的周收益率。數(shù)據(jù)來源于CSMAR數(shù)據(jù)庫,共1022個觀測值。市場收益率是個股回報率的加權(quán)平均,一方面,個股回報率的計算可以考慮現(xiàn)金紅利再投資,也可以不考慮現(xiàn)金紅利再投資,我們采用考慮現(xiàn)金紅利再投資的個股回報率計算方法;另一方面,權(quán)重的計算方法至少有等權(quán)平均法、流通市值加權(quán)平均法和總市值加權(quán)平均法三種。非流通股不參與市場交易,因此市場價格的變化不包含這部分股份,所以采用流通市值加權(quán)平均法。CSMAR數(shù)據(jù)庫直接提供了滿足這兩個條件的上海A股、B股和深圳A股、B股、創(chuàng)業(yè)板的收益率,就代表性來說,本文使用上海A股的數(shù)據(jù)。
現(xiàn)有研究狀態(tài)轉(zhuǎn)移的文獻使用上證綜合指數(shù)的為多[16],也有使用深圳成分指數(shù)[17]。本文用的不是交易所指數(shù)收益率。交易所指數(shù)收益率只是市場收益率中的一種。一方面,為了覆蓋所有股票,本文沒有用成分股指數(shù);另一方面,考慮到中國轉(zhuǎn)軌時期股市特有的股權(quán)結(jié)構(gòu),我們用流通市值加權(quán)平均的收益率,而交易所發(fā)布的系列綜合指數(shù)均為總股本加權(quán),因此我們也沒有使用它們。
現(xiàn)有文獻樣本跨度有從指數(shù)發(fā)布日開始的[16],也有為了去掉如波動過于劇烈[7]、無漲停板制度[8]等的影響而取某個時點之后的數(shù)據(jù)。由于本文模型可以靈活識別狀態(tài)數(shù)目,理論上說適應數(shù)據(jù)能力強,所以時間跨度從市場成立的時候開始。
數(shù)據(jù)時間頻率有月頻[17]、周頻[7,9]和日頻[16]。本文用市場收益率的周頻數(shù)據(jù),其優(yōu)點是可以避免過高頻率導致的復雜關(guān)系的干擾和可能出現(xiàn)的周效應,又能保證時間序列數(shù)據(jù)有足夠的長度。
計算自然對數(shù)增長率是研究股市波動的一般做法,由于CSMAR中的收益率rt為百分比收益率,因此做轉(zhuǎn)換后再乘以100得到Rt=100×ln(rt+1)。用eviews6對收益率序列Rt做初步分析。圖1顯示市場收益率時間序列。
圖1 上海A股市場收益率時間序列
Jarque-Bera檢驗統(tǒng)計量估計值遠大于1%對應的臨界值,拒絕收益率為正態(tài)分布的假設(shè)。無窮狀態(tài)轉(zhuǎn)換模型是非線性建模的一種方法。為了檢驗市場收益率是否存在非線性,我們對其做BDS檢驗[21]。先消除可能有的序列自相關(guān)性質(zhì)的影響,建模發(fā)現(xiàn)滯后值為1的AR模型回歸系數(shù)顯著,其AIC值最小。對AR(1)模型回歸的殘差進行BDS檢驗以確定殘差是否獨立同分布。該統(tǒng)計量在1%的統(tǒng)計顯著性下拒絕原假設(shè),說明上海A股市場收益率有非線性特征。
3.2 模型估計
設(shè)定市場收益率的無窮狀態(tài)轉(zhuǎn)換自回歸模型滯后期與常規(guī)的AR模型相同,即同為1階,則模型方程如下:
采樣之前需要設(shè)置未知參數(shù)的初始值或先驗值。綜合運用設(shè)定先驗值的方法[22]。動態(tài)參數(shù)初始值的選擇利用常規(guī)的AR模型的結(jié)果[23]。截距和自回歸系數(shù)先驗均值分別設(shè)為0.2947和0.1105,先驗方差分別設(shè)為0.186和0.0311,相互之間的先驗協(xié)方差為0。的先驗逆Gamma分布的尺度和形狀參數(shù)分別設(shè)為2.5和1.5,對應的先驗均值為1,先驗方差為2。超參數(shù)先驗分布則如一般設(shè)定,α和γ的先驗分布均設(shè)為Gamma(1,0.1),ρ的先驗分布為Beta(30,1)。截斷近似取截斷值L等于10,即假設(shè)最大可能的狀態(tài)數(shù)目為10個。
以上模型的估計所用軟件為Matlab7.11,進行3萬次采樣,前5000次作為預熱舍去(Burn In),后25000次采樣值用于模型分析,計算各參數(shù)的邊緣后驗密度以及模型的對數(shù)預測似然函數(shù)。
3.3 模型比較結(jié)果
為了對比,除了對上海A股市場的周收益率建立上述模型外,還建立常用的兩狀態(tài)轉(zhuǎn)換一階自回歸模型MS(2)-AR(1)和三狀態(tài)轉(zhuǎn)換一階自回歸模型MS(3)-AR(1),分別用H1、H2、H3表示以上三個模型。各模型的對數(shù)邊緣似然函數(shù)和模型間對數(shù)貝葉斯因子的計算結(jié)果如表1所示,其中MS(2)-AR(1)模型和MS(3)-AR(1)模型對數(shù)邊緣似然的計算使用Perlin[24]的程序。
表1 模型比較的計算結(jié)果
由上表可見:對數(shù)貝葉斯因子lnB12、lnB13都遠大于5,根據(jù)Kass和Raftery[19]的判定標準,表明無窮狀態(tài)轉(zhuǎn)換一階自回歸模型相對另外兩個模型有決定性的優(yōu)勢。
3.4 實證結(jié)果與分析
圖2顯示市場收益率的無窮狀態(tài)轉(zhuǎn)換自回歸模型狀態(tài)數(shù)目的分布圖,后驗眾數(shù)為5,均值為5.5,說明股市最有可能存在5種狀態(tài)。采樣出的狀態(tài)數(shù)目以5個或6個為主,集中在5個,而截斷值L的設(shè)定相對較大,說明截斷值沒有約束到狀態(tài)數(shù)目的估計,截斷近似是合適的。
圖2 狀態(tài)數(shù)目的頻數(shù)直方圖
由于狀態(tài)是不可觀測的,我們只能推斷不同狀態(tài)的存在。圖3顯示25000次采樣得到的各個交易周狀態(tài)后驗眾數(shù)的序列,同時還顯示上海交易所A股指數(shù)各個交易周收盤價序列,狀態(tài)后驗眾數(shù)描述該周股市最有可能處于的狀態(tài),結(jié)果反映出股市很可能存在模型設(shè)定條件下的第二、六、八、九和第十個狀態(tài),收益率生成過程在這五個狀態(tài)間轉(zhuǎn)換。
有三個有趣的現(xiàn)象,一是狀態(tài)二主要出現(xiàn)在股市初期,即1992年3月之前,還有一次是在1997年3月中到4月末一段很短的時期出現(xiàn);二是股市在1992年4月至1996年12月只在狀態(tài)六、八、九之間轉(zhuǎn)換,在1997年1月后基本只在狀態(tài)八、九、十之間轉(zhuǎn)換;三是沒有出現(xiàn)過狀態(tài)六與狀態(tài)八以及狀態(tài)九與狀態(tài)十的相互轉(zhuǎn)換。進一步的分析可以解釋其中原因及意義。
圖4(a)~(e)依次顯示股市處于狀態(tài)二、六、八、九和十的概率估計,概率大則表示市場處于該狀態(tài),圖4和圖3相互印證。
狀態(tài)二、六、八、九和十或者說A股市場所處的不同狀態(tài)的特點由下表說明。表2顯示五個狀態(tài)下的截距a0、自回歸系數(shù)a1、隨機擾動項方差σ2的后驗均值、標準差,并計算相應的周收益率無條件均值a0/(1-a1)的估計值。
圖3 狀態(tài)后驗眾數(shù)序列及上海A股指數(shù)周收盤價序列
表2 模型動態(tài)參數(shù)的后驗均值、標準差
通常根據(jù)收益率的波動性以及均值的符號和取值大小區(qū)分狀態(tài)。五種狀態(tài)下周收益率方差σ2的估計值差異很大,表明不同狀態(tài)下收益率的波動性明顯不同;而五種狀態(tài)下a0/(1-a1)值均為正,表明各狀態(tài)的區(qū)分并不象其他文獻所示以“牛熊市”為標準。因此,狀態(tài)之間的區(qū)分首以收益率波動性的非對稱為標準。波動性從大到小的狀態(tài)依次為狀態(tài)六、狀態(tài)九、狀態(tài)八、狀態(tài)十和狀態(tài)二。波動性不同的狀態(tài)伴隨有其他一些特征。
狀態(tài)二下周收益率波動性極小,標準差僅為1.22%,但周收益率無條件均值最高,為0.5875%,轉(zhuǎn)換為年率表示達到30%,而且自回歸系數(shù)最大,為0.246,顯示收益率自相關(guān)性相對最強。狀態(tài)六下周收益率波動性極大,標準差達到22.39%,同時周收益率無條件均值次高,為0.3872%,轉(zhuǎn)換為年率表示也達到20%,但自回歸系數(shù)最小,為0.102,顯示收益率自相關(guān)性相對最弱。
狀態(tài)十下周收益率波動性較小,標準差為2.21%,周收益率無條件均值居中,為0.3005%,轉(zhuǎn)換為年率表示為16%,收益率的正自相關(guān)性相對較強,自回歸系數(shù)為0.153。中波動的狀態(tài)八下收益率標準差為2.58%,收益率均值較小,為0.2647%,轉(zhuǎn)換為年率表示為14%,但收益率的自相關(guān)性相對較弱。狀態(tài)九下周收益率波動性較大,標準差為5.63%,但平均收益率最小,為0.1561%,轉(zhuǎn)換為年率表示僅為8%,自回歸系數(shù)為0.1211,顯示收益率自相關(guān)性居中。
圖4 (a)~(e) 第二、六、八、九、十個狀態(tài)出現(xiàn)概率的時間序列
轉(zhuǎn)換概率矩陣元素π2,2、π6,6、π8,8、π9,9、π10,10的后驗均值分別為0.919、0.871、0.930、0.934、0.927,對應狀態(tài)二、狀態(tài)六、狀態(tài)八、狀態(tài)九和狀態(tài)十的平均持續(xù)時間分別為12.3個交易周、7.75個交易周、14.3個交易周、15個交易周、13.7個交易周。波動性極大的狀態(tài)六平均持續(xù)時間最短,波動性極小的狀態(tài)二次之,然后是較小波動的狀態(tài)十、中波動的狀態(tài)八,較大波動的狀態(tài)九平均持續(xù)時間最長。
市場收益率在不同狀態(tài)下的變動規(guī)律有明顯差異,而差異的原因可能可以進一步用制度和行為金融予以解釋。
股市作為一個新生事物,在發(fā)展初期不為公眾所認識,而且剛開始形成的股市監(jiān)管機制規(guī)定了漲跌幅限制,因此1992年3月之前股市處于波動率極小的狀態(tài),并顯示出相對強的自相關(guān)性。
由于股市初期掛牌交易的股票很少,價格被反復炒高,在賺錢效應的刺激下,社會公眾對股市的參與度增加,但由于股市參與者對股市的理性認識不足,加上漲跌停板限制被取消,股價往往暴漲暴跌,收益率波動性開始轉(zhuǎn)換到較高水平,甚至進一步轉(zhuǎn)換到極大的水平,因此,股市在1992年4月至1996年12月在波動性極大的狀態(tài)六、波動性較大的狀態(tài)九和波動性中等的狀態(tài)八之間轉(zhuǎn)換,期間收益率的自相關(guān)性都顯得相對弱。市場沒有出現(xiàn)過狀態(tài)六與狀態(tài)八之間的轉(zhuǎn)換,原因是從波動性相對大(小)到波動性相對?。ù螅┬枰^渡,而不會直接就轉(zhuǎn)換。波動性極大的狀態(tài)六到波動性中等的狀態(tài)八要通過波動性居于它們之間的狀態(tài)九來過渡。這也佐證狀態(tài)區(qū)分首以波動性為標準。極大波動性的狀態(tài)六主要發(fā)生在如下時期:1992年5月管理層出臺擴容政策,使股市出現(xiàn)連續(xù)性暴跌;1992年11月新華社發(fā)表《關(guān)于股市的通信》推動股指持續(xù)上漲,三個月漲幅超過3倍;1994年7月底在股市持續(xù)下跌的背景下管理層宣布三項“救市”措施,股市展開報復性反彈,一個半月內(nèi)漲幅超過2倍;1995年5月中旬,股市受到管理層關(guān)閉國債期貨消息的影響,出現(xiàn)短期井噴行情;1996年12月16日《人民日報》發(fā)表《正確認識當前股票市場》,股市短期暴跌。
1997年股市開始實行10%的漲跌停板制度,加上股市參與者對股市的理性認識提高,股市波動性整體下降,基本只在波動性較大的狀態(tài)九、波動性中等的狀態(tài)八和波動性較小的狀態(tài)十之間轉(zhuǎn)換,既沒有重現(xiàn)之前階段存在的波動性極大的狀態(tài),也難再出現(xiàn)股市初期波動性極小的狀態(tài)。同樣,高波動的狀態(tài)九到低波動的狀態(tài)十要通過中波動的狀態(tài)八來過渡。統(tǒng)計狀態(tài)發(fā)生次數(shù)發(fā)現(xiàn),有5個時期處于高波動的狀態(tài)九,11個時期處于中波動的狀態(tài)八,7個時期處于低波動的狀態(tài)十。高波動狀態(tài)主要發(fā)生在如下時期:1997年5、6月份受禁止國企炒作股票、禁止銀行資金違規(guī)流入股市的影響,股市短期暴跌;1999年5.19行情啟動;2000年頭兩個月股市走出瘋牛行情;2006年市場受股改刺激快速上漲到2007年10月,之后市場受高估值、外圍股市下跌等的影響持續(xù)快速下跌超過1年。
以上分析得出一些結(jié)論。五個狀態(tài)間的區(qū)分首先在于收益率的波動性不同,波動性不同的狀態(tài)伴隨其他一些特征。股市可以劃分為三個階段,1992年3月之前股市的波動性極小。1992年4月到1996年12月股市在波動性極大、較大和中等的三個狀態(tài)轉(zhuǎn)換,這既有新生市場的因素,也有制度的原因。而之后的股市走向成熟,可區(qū)分出較大波動、中波動和較小波動三種不同的狀態(tài)。較大波動狀態(tài)的特點是收益率均值小、持續(xù)時間長、發(fā)生次數(shù)少;中波動狀態(tài)的特點是收益率均值比較大、自相關(guān)性弱、發(fā)生次數(shù)多;較小波動狀態(tài)下收益率均值大、自相關(guān)性強、持續(xù)時間短。
本文通過模型計算,推斷出我國股市最可能存在5種狀態(tài),并識別出各狀態(tài)的特征和狀態(tài)間的轉(zhuǎn)換過程。用狀態(tài)轉(zhuǎn)換研究收益率波動非對稱的文獻,結(jié)論有的是收益率均值的非對稱,有的是收益率方差的非對稱,而本文發(fā)現(xiàn),由樣本數(shù)據(jù)內(nèi)生出的狀態(tài)區(qū)分的首要理由并不是“牛熊市”或者漲、跌、橫盤狀態(tài)等收益率均值的非對稱,而是不同狀態(tài)下收益率生成過程波動性大小的不同,波動性不同的狀態(tài)伴隨其他一些顯著的特征,但五種狀態(tài)下的收益率均值均為正,說明并沒有發(fā)現(xiàn)狀態(tài)以“牛熊市”或者漲、跌來劃分的證據(jù),均值均為正也與股票市場期望收益率為正相符。
本文針對狀態(tài)轉(zhuǎn)換模型建模過程中狀態(tài)識別和參數(shù)估計問題,將狀態(tài)數(shù)目能自適應數(shù)據(jù)的無窮狀態(tài)轉(zhuǎn)換模型應用于帶截距的向量自回歸時間序列,運用貝葉斯方法估計模型參數(shù),同時,利用基于Gibbs分塊采樣的MCMC仿真方法解決該模型高維數(shù)值計算的不便。
實證部分以上海A股市場收益率為對象,我們得到效果理想的狀態(tài)劃分結(jié)果和一些有趣的結(jié)論,最重要的是用此模型識別出5種狀態(tài)是最可能的,狀態(tài)的區(qū)分首以波動性大小不同為標準,進一步的討論發(fā)現(xiàn),股市除了在初期波動性極小外,從1992年4月開始可以分為兩個階段,在各階段股市均在三個狀態(tài)之間轉(zhuǎn)換。本文為中國股市狀態(tài)的劃分提供了一種新的客觀方法。
無窮狀態(tài)轉(zhuǎn)換向量自回歸模型可以自動選擇狀態(tài)變量的數(shù)目,而且本文實證部分得到的結(jié)果規(guī)律性強,這顯然要歸功于狄利克雷過程很好的聚類特性。與常見的兩狀態(tài)和三狀態(tài)轉(zhuǎn)換一階自回歸模型的對數(shù)邊緣似然值比較表明,無窮狀態(tài)轉(zhuǎn)換一階自回歸模型有決定性的優(yōu)勢。進一步的研究可以將無窮狀態(tài)轉(zhuǎn)換的思想和其它基礎(chǔ)模型結(jié)合起來,以新的途徑分析復雜結(jié)構(gòu)的經(jīng)濟數(shù)據(jù)的內(nèi)在特性。
[1]Hamilton J.A new approach to the economic analysis of nonstationary time series and the business cycle[J]. Econometrica,1989,(2):357-384.
[2]Hamilton J.Time series analysis[M].New Jersey:Princeton University press,1994.
[3]Krolzig M.Statistical analysis of cointegrated VAR processes with markovian regime shifts[R].Working Papers,Humboldt University,1996.
[4]Cai Jun.A Markov model of switching-regime ARCH[J].Journal of Business and Economic Statistics,1994,12(3):309-316.
[5]Garcia R,Perron P.An analysis of the real interest rate under regime shifts[J].The Review of Economics and Statistics,1996,78(1):111-125.
[6]Mills T C,Wang Ping.Regime shifts in European real interest rates[J].Review of world economics,2003,139(1)66-81.
[7]朱鈞鈞,謝識予.上證綜指馬爾可夫轉(zhuǎn)換模型的MCMC估計和分析[J].系統(tǒng)工程,2010,28(4):9-14.
[8]朱鈞鈞,謝識予.中國股市波動率的雙重不對稱性及其解釋——基于MSˉTGARCH模型的MCMC估計和分析[J].金融研究,2011,(3):134-148.
[9]嚴太華,陳明玉.基于馬爾科夫切換模型的上證指數(shù)周收益率時間序列分析[J].中國管理科學,2009,17(6):33-38.
[10]Kim C J,Nelson C R.State-space models with regimeswitching:Classical and gibbs-sampling approaches with applications[M].Cambridge,Mass:The MIT Press,1999.
[11]Psaradakis Z,Sola M.Finite sample properties of the maximum likelihood estimator in autoregressive models with Markov switching[J].Journal of Econometrics, 1998,86:369-386.
[12]Beal M J,Ghahramani Z,Rasmussen C E.The infinite hidden markov model[M].//Dietterich T G,Ghahrama Z ni.Advances in neural information processing systems.Cambridge,MA:MIT Press,2002.
[13]Teh Y W,Jordan M I,Beal M J,et al.Hierarchical dirichlet processes[J].Journal of the American Statistical Association,2006,101:1566-1581.
[14]Fox E B,Sudderth E B,Jordan M I,et al.Nonparametric bayesian learning of switching linear dynamical systems[M].//Koller D.Advances in neural information processing systems 21,Cambridge,MA:MIT Press,2009.
[15]Carvalho C,Lopes H.Simulation based sequential analysis of Markov switching stochastic volatility models[J].Computational Statistics and Data Analysis,2006,51(9):4526-4542.
[16]張兵.基于狀態(tài)轉(zhuǎn)換方法的中國股市波動研究[J].金融研究,2005,(3):100-108.
[17]高金余,陳翔.馬爾可夫切換模型及其在中國股市中的應用[J].中國管理科學,2007,15(6):20-25.
[18]Geweke J,Amisano G.Comparing and evaluating Bayesian predictive distributions of asset returns[J]. International Journal of Forecasting,2010,26(2):216 -230.
[19]Kass R E,Raftery A E.Bayes factors[J].Journal of the American Statistical Association,1995,90(430):773-795.
[20]Dawid A P.Statistical theory:The prequential approach[J].Journal of the Royal Statistical Society,1984,Ser.A,147:278-292.
[21]Brock W A,Dechert D,Scheinkman H,et al.A test for independence based on correlation dimension[J].E-conometric Reviews,1996,15(3):187-235.
[22]Luginbuhl R,Vos A.Bayesian analysis of an unobserved component time series model of GDP with Markov switching and time varying growths[J].Journal of Business and Economic Statistics,1999,17(4):456-465.
[23]Albert J H,Chib S.Bayes inference via gibbs sampling of autoregressive time series subject to markov mean and variance shifts[J].Journal of Business and Economic Statistics,1993,11(1):1-15.
[24]Perlin M.MSˉregress-the MATLAB Package for Markov regime switching models[EB/OL].2010-11 -26.http://ssrn.com/abstract=1714016.
Infinite Markov-switching VAR Model and Application to Analysis of China Stock Market Return
CAI Wei-hong1,2,TANG Qi-ming1
(1.School of Economics,Huazhong University of Science and Technology,Wuhan 430074,China;2.School of International Trade and Economics,Guangdong University of Foreign studies,Guangzhou 510006,China)
A new Markov-switching VAR model is developed in which the number of the regimes is driven by data.The model is inferenced with Bayesian methods,and estimated with block sampling based MCMC method.With the studying of weekly return data of Shanghai A share market,five contrasted regimes are identified using the proposed model which are differenciated by return volatility.Before April 1992,market volatility is extremely low and since then there are two periods and three regimes are switching in each period.
infinite Markov-switching;VAR;Bayesian inference;block sampling;A share market return
F224.0
:A
1003-207(2014)01-0010-10
2012-02-24;
2012-07-20
蔡偉宏(1975-),男(漢族),福建人,華中科技大學經(jīng)濟學院博士研究生,廣東外語外貿(mào)大學國際經(jīng)濟貿(mào)易學院講師,研究方向:數(shù)量經(jīng)濟學.