袁曉惠, 杜 讓, 胡 茜
(長(zhǎng)春工業(yè)大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院, 吉林 長(zhǎng)春 130012)
股票價(jià)格能夠體現(xiàn)一個(gè)國(guó)家的經(jīng)濟(jì)狀況,股市的波動(dòng)也時(shí)刻影響著個(gè)人和企業(yè)對(duì)股票的投資情況。當(dāng)前,中國(guó)經(jīng)濟(jì)飛速發(fā)展,國(guó)家經(jīng)濟(jì)市場(chǎng)面臨機(jī)遇和挑戰(zhàn),經(jīng)濟(jì)主體潛在的風(fēng)險(xiǎn)和不確定性日益凸顯,基于線性相關(guān)系數(shù)的分析方法不再適用于研究股票市場(chǎng)的發(fā)展?;诖?,黃義[1]研究了金融股票市場(chǎng)與房地產(chǎn)市場(chǎng)價(jià)格指數(shù)的動(dòng)態(tài)相關(guān)性。袁曉惠等[2]針對(duì)我國(guó)2011-2018年消費(fèi)者信心指數(shù)的經(jīng)濟(jì)數(shù)據(jù)擬合閾值自回歸模型,選出模型的自回歸參數(shù),并估計(jì)閾值點(diǎn)。馬育欣等[3]對(duì)股票收盤價(jià)序列進(jìn)行經(jīng)驗(yàn)?zāi)J椒纸?EMD),并對(duì)分解后的本征模函數(shù)(IMF)與殘差序列分別擬合ARMA-GARCH模型。
近20年來(lái),雙AR(p)模型受到人們的關(guān)注,F(xiàn)rancq C等[4]針對(duì)非線性過(guò)程提出雙AR(p)模型,可作為一種弱ARMA模型;Ling S[5]研究了雙AR(p)模型的平穩(wěn)遍歷條件,得出模型中參數(shù)的極大似然估計(jì)是漸近正態(tài)的結(jié)論;Zhu K等[6]研究雙AR(p)模型的擬極大似然估計(jì),發(fā)現(xiàn)該方法比加權(quán)一乘方法更具優(yōu)越性;玄海燕等[7]提出雙AR(p)模型的一種混成檢驗(yàn),再次驗(yàn)證了雙AR(p)模型在股價(jià)預(yù)測(cè)中的優(yōu)越性。
目前有關(guān)該模型的研究大多局限于對(duì)均值的建模,假定誤差項(xiàng)服從正態(tài)分布。當(dāng)數(shù)據(jù)為非正態(tài)時(shí),模型的擬合效率會(huì)降低,甚至錯(cuò)誤推斷。作為一類穩(wěn)健模型,分位數(shù)回歸不僅放寬了模型假設(shè),還可以刻畫不同分位點(diǎn)上的數(shù)據(jù)表現(xiàn),成為穩(wěn)健統(tǒng)計(jì)分析的首選模型之一[8-10]。對(duì)于經(jīng)典的雙AR(p)模型,其分位數(shù)回歸參數(shù)估計(jì)的計(jì)算較難實(shí)現(xiàn)。Zhu Q等[11]修正了模型假設(shè),將之轉(zhuǎn)化成線性形式,從而在一般分位數(shù)回歸的理論框架下討論參數(shù)估計(jì)。然而,針對(duì)經(jīng)典雙AR(p)模型分位數(shù)回歸的計(jì)算問(wèn)題,我們至今未檢索到相關(guān)文獻(xiàn)。因此,文中嘗試在雙AR(p)模型的基礎(chǔ)上對(duì)其分位數(shù)回歸進(jìn)行計(jì)算。
在線性分位數(shù)回歸問(wèn)題的研究中,Tian Y等[12]將EM算法引入線性復(fù)合分位數(shù)回歸模型,通過(guò)迭代加權(quán)進(jìn)行最小二乘估計(jì);Yang F[13]提出了一種分位數(shù)回歸模型的隨機(jī)EM算法,估計(jì)效果良好。
文中運(yùn)用EM算法對(duì)雙AR(p)分位數(shù)回歸模型進(jìn)行參數(shù)估計(jì),提出了兩階段迭代加權(quán)估計(jì),并考察其在不同分位點(diǎn)上的表現(xiàn)。模擬研究表明,文中所提EM算法在分位數(shù)回歸估計(jì)中表現(xiàn)出色。
考慮經(jīng)典的雙AR(p)模型[5-6]
(1)
其中,φi∈R,ω>0,βi≥0(1≤i≤p),并且{εt}是獨(dú)立同分布的白噪聲序列。令
φ=(φ1,φ2,…,φp)T,
β=(β1,β2,…,βp)T,
Y1t=(yt-1,yt-2,…,yt-p)T,
則模型表示為
(2)
通常假定{εt}是正態(tài)白噪聲,可以得到模型參數(shù)的最小二乘估計(jì)。
研究此模型在不同分位點(diǎn)上的表現(xiàn),類似于Koenker R等[8]提出的分位數(shù)回歸理論,第τ分位點(diǎn)下的估計(jì)為
(3)
其中,Θ={φ,ω,β},ρτ(μ)=μ{τ-I(μ<0)}是分位數(shù)回歸的損失函數(shù),I(·)為示性函數(shù)。但上述優(yōu)化問(wèn)題的求解較為困難,文中通過(guò)構(gòu)造EM算法求解此模型的參數(shù)估計(jì)。
在分位數(shù)回歸領(lǐng)域,非對(duì)稱拉普拉斯分布(ALD)越來(lái)越受到關(guān)注,根據(jù)Yu K等[9]基于ALD似然函數(shù)的貝葉斯分位數(shù)回歸思想,最小化目標(biāo)損失函數(shù)
ρτ(μ)=μ{τ-I(μ<0)},
(4)
相當(dāng)于在ALD誤差下最大化似然函數(shù)。ALD的概率密度函數(shù)為
(5)
式中:μ----位置參數(shù);
σ----尺度參數(shù);
τ----偏度,τ∈(0,1)。
即使對(duì)真實(shí)值的估計(jì)有一定的誤差,估計(jì)結(jié)果依舊是穩(wěn)健的。
運(yùn)用Kozumi H等[10]提出的概率重構(gòu)方法,將式(4)置于誤差分布為非對(duì)稱拉普拉斯分布的極大似然估計(jì)理論上。該誤差項(xiàng){εt}的分布可以表示為指數(shù)分布和正態(tài)分布的混合表達(dá):
(6)
其中,
vt~exp(1),
et~N(0,1)。
令
γ=(ω,β)T,
ht(γ)=ω+βTY2t=γTY3t,
則模型等價(jià)于
(7)
則有
exp{-vt},
(8)
vt的條件概率密度函數(shù)為
(9)
由此得到
(10)
完全數(shù)據(jù){yt,vt}下的條件似然函數(shù)為
(11)
取對(duì)數(shù),求得對(duì)數(shù)似然
(12)
對(duì)于含有潛變量的概率模型參數(shù)估計(jì)問(wèn)題,通過(guò)EM算法迭代可以進(jìn)行局部最優(yōu)求解。令Θ=(φ,γ),設(shè)初始值為Θ(0),給定第t次迭代值Θ(t),然后利用EM算法通過(guò)迭代E步和M步來(lái)搜索模型的極大似然估計(jì)值。該算法從Θ(0)開始迭代,然后在兩步之間交替。E表示期望,M表示最大化,EM算法計(jì)算過(guò)程如下:
E步:基于第t次的迭代值Θ(t),似然函數(shù)第(t+1)次的期望值為
Q(Θ|Θ(t))E[l(Θ|yt,vt)|Θ(t)]=
(13)
M步:將E步中的Q函數(shù)最大化,求導(dǎo)得到估計(jì)方程
令導(dǎo)函數(shù)為零,有
(15)
求解,得到第(t+1)步φ的估計(jì)值為
(16)
(17)
得到γ的估計(jì)
(18)
(19)
γ2即為所求γ的估計(jì)值。
具體算法過(guò)程如下:
1)設(shè)定初值(φ,γ)(0),由E步計(jì)算出Q(φ(1)|(φ,γ)(0));
4)將得到的(φ,γ)(1)估計(jì)值返回1),重復(fù)1)~3),當(dāng)滿足條件‖(φ,γ)(t+1)-(φ,γ)(t)‖≤10-5時(shí),停止迭代;
5)對(duì)γ的估計(jì)值標(biāo)準(zhǔn)化,最終得到參數(shù)估計(jì)結(jié)果。
BIC準(zhǔn)則又稱貝葉斯信息準(zhǔn)則,可用于模型的選擇,通過(guò)加入模型復(fù)雜度的懲罰項(xiàng)來(lái)避免過(guò)擬合問(wèn)題。借鑒Wang H等[14]提出的廣義貝葉斯信息準(zhǔn)則,得到:
(2p+1)log(n-pmax),
(20)
其中p在{1,2,…,pmax}上搜索,pmax為給定的最大階數(shù),n為樣本量,Q為EM算法中E步似然函數(shù)期望值。
通過(guò)模擬驗(yàn)證雙AR(p)分位數(shù)回歸模型在有限樣本下的表現(xiàn),基于模型
產(chǎn)生隨機(jī)數(shù)。其中,εt(τ),ht(γ)的形式參見(jiàn)式(6)。
設(shè)定回歸系數(shù)為
φ=(φ1,φ2)T=(0.1,0.2)T,
γ=(ω,β1,β2)T=(0.2,0.5,0.2)T。
對(duì)上述分位數(shù)回歸模型進(jìn)行擬合,令n=100、500和1 000。分別討論分位點(diǎn)τ為0.3、0.5和0.7時(shí)的估計(jì),通過(guò)EM算法迭代,并進(jìn)行1 000次模擬試驗(yàn),列出相應(yīng)參數(shù)估計(jì)值的偏度、標(biāo)準(zhǔn)差和均方誤結(jié)果。不同分位點(diǎn)τ參數(shù)估計(jì)模擬結(jié)果分別見(jiàn)表1~表3。
表1 參數(shù)估計(jì)模擬結(jié)果(τ=0.3)
表2 參數(shù)估計(jì)模擬結(jié)果(τ=0.5)
表3 參數(shù)估計(jì)模擬結(jié)果(τ=0.7)
以上結(jié)果可以看出,隨著樣本量的增大,三個(gè)分位點(diǎn)下估計(jì)的均方誤都減小,說(shuō)明估計(jì)具有相合性,EM算法在模型估計(jì)中表現(xiàn)較好。
通過(guò)BIC準(zhǔn)則對(duì)雙AR(p)分位數(shù)回歸模型進(jìn)行參數(shù)選擇,在4.1節(jié)模擬的基礎(chǔ)上,假定最大階數(shù)pmax為4,在{1,2,…,pmax}上搜索最優(yōu)階數(shù),通過(guò)式(20)求出BIC值最大時(shí)對(duì)應(yīng)的階數(shù)p,即為最優(yōu)階數(shù)。
以τ=0.5為例,通過(guò)模型
從表中可以看出,在對(duì)角線上元素的取值最高,即模型選到與真值相同階數(shù)的頻率很高。當(dāng)n=300時(shí),BIC準(zhǔn)則選擇效果明顯好于n=100,說(shuō)明BIC準(zhǔn)則進(jìn)行模型選階,樣本量較大時(shí),結(jié)果更為準(zhǔn)確。
表4 BIC待選頻數(shù)表
研究金融市場(chǎng)的發(fā)展規(guī)律,一般選取綜合性強(qiáng),能反映經(jīng)濟(jì)整體趨勢(shì)發(fā)展的指數(shù),以確保結(jié)論能夠符合大多數(shù)情況,滬深300指數(shù)(399300)可以反映中國(guó)證券市場(chǎng)股票價(jià)格變化的整體趨勢(shì)。因此,文中選取滬深300指數(shù)的部分收盤價(jià)數(shù)據(jù)進(jìn)行分析,以2018年1月2日至2021年7月27日的收盤價(jià)數(shù)據(jù)作為觀測(cè)值,2021年7月28日至2021年7月30日的數(shù)據(jù)作為預(yù)測(cè)值數(shù)據(jù),共870個(gè)樣本。數(shù)據(jù)來(lái)源于網(wǎng)易財(cái)經(jīng)(http://quotes.money.163.com/1399300.html)。
滬深300指數(shù)收盤價(jià)數(shù)據(jù)的時(shí)間序列圖和ACF圖如圖1所示。
(a) 時(shí)序圖 (b) ACF圖
由時(shí)序圖可知,在有限時(shí)間內(nèi),觀測(cè)數(shù)據(jù)波動(dòng)性較大,數(shù)據(jù)不平穩(wěn)。由ACF圖可以看出,樣本數(shù)據(jù)具有很強(qiáng)的自相關(guān)性。由于文中研究的模型在所給條件下是嚴(yán)平穩(wěn)的,我們對(duì)原始數(shù)據(jù)進(jìn)行平穩(wěn)化處理,采用一階對(duì)數(shù)差分變換,并做單位根檢驗(yàn),檢驗(yàn)的p值小于0.01,即變換后的數(shù)據(jù)為平穩(wěn)序列。
對(duì)處理后的數(shù)據(jù)作回歸分析,分別對(duì)τ取0.3、0.5和0.7,通過(guò)BIC準(zhǔn)則在p={1,2,3,4}上選取合適的階數(shù),結(jié)果見(jiàn)表5。
表5 最優(yōu)階數(shù)選擇BIC值
可以看出,在三個(gè)分位點(diǎn)上,BIC最大時(shí)對(duì)應(yīng)的p值均為1,所以,文中選取雙自回歸維數(shù)p=1。應(yīng)用雙AR(p)分位數(shù)回歸模型對(duì)滬深300指數(shù)進(jìn)行模擬,分別得到在τ分位點(diǎn)為0.3、0.5和0.7上的三種模型估計(jì),估計(jì)結(jié)果見(jiàn)表6。
表6 參數(shù)估計(jì)結(jié)果
由此得到如下模型。
模型一(τ=0.3):
yt=-0.006 60Y1t+
模型二(τ=0.5):
yt=-0.006 64Y1t+
模型三(τ=0.7):
yt=-0.004 35Y1t+
基于以上三種模型對(duì)2021年7月28日至2021年7月30日的股價(jià)進(jìn)行預(yù)測(cè),結(jié)果見(jiàn)表7。
表7 預(yù)測(cè)結(jié)果
由表7可以看出,不同分位點(diǎn)下的預(yù)測(cè)值和真實(shí)數(shù)據(jù)都非常接近,且變化趨勢(shì)相近,說(shuō)明文中提出的模型對(duì)滬深300指數(shù)的預(yù)測(cè)結(jié)果較為準(zhǔn)確,模型是有效的。
考慮雙AR(p)分位數(shù)回歸模型,首先運(yùn)用EM算法分別對(duì)不同分位點(diǎn)下的參數(shù)進(jìn)行估計(jì)。模擬研究發(fā)現(xiàn),參數(shù)中對(duì)非零真值估計(jì)的均方誤很小,且隨著樣本量的增大,均方誤也越來(lái)越小,估計(jì)效果較好;其次,通過(guò)BIC準(zhǔn)則選取模型階數(shù)的最佳p值,階數(shù)選擇結(jié)果準(zhǔn)確,正確率較高。最后對(duì)滬深300指數(shù)的股價(jià)數(shù)據(jù)進(jìn)行實(shí)證研究,驗(yàn)證了模型的有效性。