趙 越, 宋 立 新, 回 德 俊
(大連理工大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,遼寧 大連 116024)
時(shí)間序列分析方法是生產(chǎn)和實(shí)際中經(jīng)常用到的研究手段,在經(jīng)濟(jì)、氣象和水利等領(lǐng)域有著廣泛的應(yīng)用.本文所要研究的對象是非線性隨機(jī)序列,是指從非線性系統(tǒng)獲取的時(shí)間序列.當(dāng)系統(tǒng)具有混沌特征時(shí),前人已論證了對非線性時(shí)間序列采用動(dòng)力系統(tǒng)方法進(jìn)行預(yù)測比較有效[1].實(shí)際上,通過觀測或?qū)嶒?yàn)獲得的時(shí)間序列往往含有噪聲,也可能不平穩(wěn),需要進(jìn)行降噪處理,對含有隨機(jī)因素影響的原始觀測序列提取趨勢項(xiàng).常用的趨勢項(xiàng)提取方法有最小二乘法、平均斜率法和最佳擬合廣義多項(xiàng)式等方法,這些方法經(jīng)常用在信號(hào)處理、檢測技術(shù)等工程中[2、3].本文在趨勢項(xiàng)提取的判斷標(biāo)準(zhǔn)上引入一種新的衡量準(zhǔn)則,即基于Copula方法構(gòu)造積分絕對誤差函數(shù),以此來判斷不同方法所提取的趨勢項(xiàng)合理性.最后將動(dòng)力系統(tǒng)[1]建立在所提取的趨勢項(xiàng)數(shù)據(jù)基礎(chǔ)之上,針對次貸危機(jī)以來美國證券市場實(shí)際數(shù)據(jù)進(jìn)行模擬和預(yù)測.
在實(shí)踐中可以得到容量為n的一組時(shí)間序列觀測值,同樣對該樣本序列進(jìn)行類似的分解,記為.應(yīng)用不同提取趨勢項(xiàng)的方法,可得到不同的估計(jì),記為面對多組估計(jì),要找到最接近真實(shí)的一組,思路如下:由在 得 到 一 組 估 計(jì) 值后,將殘差作為的估計(jì)值,若它是最接近正態(tài)分布N(0,Σ)的殘差向量,其所對應(yīng)的即是要找的趨勢項(xiàng)的最優(yōu)估計(jì).通過Copula函數(shù),構(gòu)造了一個(gè)衡量模型來衡量積分絕對誤差,目標(biāo)完成.具體過程如下:對于任意的(u,v)∈I2= [0,1]2,由Sklar定理,可構(gòu)造二元Copula函數(shù),記為CΣ(u,v)[4].設(shè),其中,規(guī)定這里σ0為大于0的常數(shù).此時(shí)函數(shù)可寫為
式中:Nρ是二元正態(tài)分布函數(shù),F(xiàn)(·)和G(·)分別為邊緣分布函數(shù),Σ中σ1、σ2和相關(guān)系數(shù)ρ都是未知的.
記的秩為的秩為.則式(1)改寫為
同理對Yi+j≈bi+εi+j′,-h(huán)′≤j′≤h′,可得趨勢項(xiàng)bi的估計(jì).對應(yīng)一組(h,h′),可得一組趨勢項(xiàng)的估計(jì),(h,h′)究竟取值多少才能使趨勢項(xiàng)的估計(jì)最優(yōu),這個(gè)問題并沒有解決.設(shè)h、h′滿足已知,取最優(yōu)的(h,h′)為此范圍中使IAE達(dá)到最小者,此時(shí)得到的趨勢項(xiàng)的估計(jì)達(dá)到最優(yōu).下面介紹本文所要研究的時(shí)間序列觀測值,并用h-步平滑法提取趨勢項(xiàng).
例1h-步平滑法在股市上的應(yīng)用
選取具有代表性的美國標(biāo)準(zhǔn)普爾500和NASDAQ周收盤價(jià)為研究對象,從2007-01-03~2008-12-08共計(jì)有102組數(shù)據(jù)中xi為標(biāo)準(zhǔn)普爾500周收盤價(jià),yi為NASDAQ周收盤價(jià).先利用h-步平滑法求出趨勢項(xiàng)的眾多估計(jì)值,然后在IAE衡量模型下找到一組使趨勢項(xiàng)的估計(jì)最優(yōu)的(h,h′),在(h,h′)= (4,9)下算得趨勢項(xiàng)的估計(jì)值并做圖1[5、6].
h-步平滑估計(jì)用法簡單,其局限性在于忽略超出觀測時(shí)間范圍的那些數(shù)據(jù),這種不對稱平均可能會(huì)產(chǎn)生邊界偏倚.通過引進(jìn)一個(gè)加權(quán)設(shè)計(jì),可對滑動(dòng)平均估計(jì)進(jìn)行改善,具體改動(dòng)如下:其 中 權(quán) 數(shù)同理可得均是大于零的常數(shù).通過IAE法則算出一個(gè)最優(yōu)的權(quán)重λ1和λ2,使得積分絕對誤差最小.
例2 指數(shù)加權(quán)平均法在股市上的應(yīng)用
在IAE法則下尋找一個(gè)最優(yōu)的權(quán)重λ1和λ2.圖2是指數(shù)加權(quán)平均法給出的趨勢項(xiàng)的估計(jì)值.
在圖3中,虛線代表h-步平滑法提取趨勢項(xiàng)后的殘差波動(dòng),實(shí)線代表加權(quán)平均法提取趨勢項(xiàng)后的殘差波動(dòng).兩者相比,加權(quán)平均法的殘差波動(dòng)近乎一條0均值的直線.注意,波動(dòng)幅度越小不代表趨勢項(xiàng)的估計(jì)效果越好,亦可能是時(shí)間序列中的波動(dòng)項(xiàng)沒有與趨勢項(xiàng)分離,加權(quán)平均法提取的趨勢項(xiàng)中必然含有方差較大的隨機(jī)因素.
圖1 h-步平滑法下針對兩類指數(shù)提取趨勢項(xiàng)Fig.1 Extracting trends of two indexes by h-step smoothing method
圖2 在加權(quán)平均法下分別對兩類指數(shù)提取趨勢項(xiàng)Fig.2 Extracting trends of two indexes by weighted average method
圖3 h-步平滑法與加權(quán)平均法針對兩類指數(shù)提取趨勢項(xiàng)后的殘差圖像的比較Fig.3 Comparison on residual error of extracting trends between the h-step smothing method and weighted average method
針對次貸危機(jī)下的美國證券市場系統(tǒng),先從線性的角度來尋找函數(shù)關(guān)系,并進(jìn)行預(yù)測.
模型如下:
其中p是正整數(shù),根據(jù)經(jīng)驗(yàn)令p=3,α1、α2和α3是
未知參數(shù),有如下形式:
例3 線性回歸法在股市上的應(yīng)用
以例1中h-步平滑法估計(jì)出的趨勢項(xiàng)估計(jì)為原始數(shù)據(jù),用趨勢項(xiàng)前半段數(shù)據(jù)得到了模型(5)的3個(gè)未知參數(shù)的估計(jì)和圖4是由該線性模型模擬的證券市場走勢的圖像.
圖4 線性回歸法對兩類指數(shù)提取趨勢項(xiàng)Fig.4 Extracting trends of two indexes by linear regression method
易見此方法估計(jì)出來的市場走勢明顯與事實(shí)不符,由此初步斷定美國證券市場系統(tǒng)是非線性的.
其中c1,c2,…,c6未知.應(yīng)用h- 步平滑法求出趨勢項(xiàng)的估計(jì)值c^1,c^2,…,c^6,得二次多項(xiàng)式模型
例4 二次多項(xiàng)式法在股市上的應(yīng)用
由例1中h-步平滑法估計(jì)趨勢項(xiàng),得到趨勢項(xiàng)的估計(jì)值.用h-步平滑法得到的趨勢項(xiàng)估計(jì)值的前半段來估計(jì)二次多項(xiàng)式模型的6個(gè)未知參數(shù).圖5是二次多項(xiàng)式模型趨勢項(xiàng)的估計(jì)值圖.
易知線性回歸法和二次多項(xiàng)式法對趨勢項(xiàng)估計(jì)很差,下面用分段線性函數(shù)來給美國證券系統(tǒng)建模.
圖5 二次多項(xiàng)式法對兩類指數(shù)提取趨勢項(xiàng)Fig.5 Extracting trends of two indexes by quadratic polynomials
對于來自非線性系統(tǒng)的時(shí)間序列來說,分段線性函數(shù)簡單易行,分段線性數(shù)學(xué)模型如下:
設(shè)α=t0<t1<…<tm=β是區(qū)間[α,β]上的一種分割,記Ij(t)=I(tj-1≤t<tj)(1≤j<m-1),Im(t)=I(tm-1≤t<tm),b= (b0b1…bm)T,記
為依次連接點(diǎn) (t0,b0),(t1,b1),…,(tm,bm)的分段線性函數(shù),稱b為Gm的系數(shù).
例5 分段線性法在股市上的應(yīng)用
由例1中h-步平滑法估計(jì)趨勢項(xiàng),在本例中取m=4,用h-步平滑法得到的趨勢項(xiàng)估計(jì)值的前半段數(shù)值,來估計(jì)分段線性模型的5個(gè)未知參數(shù),然后預(yù)測后半段并與實(shí)際進(jìn)行比較,詳見圖6.
分段線性方法對趨勢預(yù)測比線性回歸法為好.不足之處:一是它沒有反映市場走勢的波動(dòng),二是真實(shí)市場是劇烈震蕩向下發(fā)展,而預(yù)測卻是在高位平緩.由此引入動(dòng)力系統(tǒng)方法來研究美國股市,最終給出市場的走勢預(yù)測.
圖6 分段線性方法對兩類指數(shù)提取趨勢項(xiàng)Fig.6 Extracting trends of two indexes by piecewise linear method
對于未知數(shù)學(xué)模型的混沌動(dòng)力系統(tǒng),通過觀測或?qū)嶒?yàn)手段可以獲得多變量時(shí)間序列[7].Takens和Mane的延遲嵌入定理證明了只要適當(dāng)選取延遲時(shí)間間隔τ和嵌入維數(shù)m,原未知數(shù)學(xué)模型的混沌動(dòng)力系統(tǒng)的幾何特征與重構(gòu)的m維狀態(tài)空間的幾何特征是等價(jià)的,這意味著原來未知數(shù)學(xué)模型的混沌動(dòng)力系統(tǒng)中的任何微分或拓?fù)洳蛔兞靠梢栽谥貥?gòu)的狀態(tài)空間中計(jì)算,并且可以通過在重構(gòu)的m維狀態(tài)空間中建立數(shù)學(xué)模型對原未知數(shù)學(xué)模型的動(dòng)力系統(tǒng)進(jìn)行預(yù)測.
記觀測到的多變量時(shí)間序列為{xl,n}Tn=1(l=1,2,…,L),假設(shè)T=N+P,前N個(gè)數(shù)據(jù)作為構(gòu)造模型所需的樣本,后P個(gè)數(shù)據(jù)作為預(yù)測精度的度量.采用延遲重構(gòu)法,在相空間中重構(gòu)的狀態(tài)向量為
或者得到多元函數(shù)Gl:Rm→R,滿足
例6 動(dòng)力系統(tǒng)在股市上的應(yīng)用
用標(biāo)準(zhǔn)普爾500和NASDAQ周收盤價(jià)作為時(shí)間序列觀測樣本.觀測的范圍從1988-01-04~2009-02-09,共1102組數(shù)據(jù).將1988-01-04~2008-12-08共計(jì)1092組數(shù)據(jù)作為構(gòu)造模型所需的樣本,將最后10個(gè)數(shù)據(jù)作為預(yù)測精度的度量,用這10個(gè)數(shù)據(jù)與動(dòng)力系統(tǒng)模型的預(yù)測結(jié)果進(jìn)行比較.
首先確定延遲時(shí)間間隔τ,采用自相關(guān)函數(shù)法,可得到兩類股市關(guān)于τ的圖像,觀察圖像,得到標(biāo)準(zhǔn)普爾500指數(shù)的CL(τ)第一次取0值時(shí)的時(shí)間間隔τ1=31,NASDAQ指數(shù)的τ2=30.
其次確定相空間的維數(shù)m,由于觀測數(shù)據(jù)是二維的,有m=m1+m2.于是用虛假鄰點(diǎn)方法估計(jì),得m1=4和m2=5[7].進(jìn)一步,對于原始時(shí)間序列{xl,n}1092n=1(l=1,2),采用延遲重構(gòu)法進(jìn)行相空間重構(gòu).通過局部多項(xiàng)式預(yù)測法對未知系數(shù)進(jìn)行估計(jì),并對系統(tǒng)的走勢進(jìn)行了短期預(yù)測,為了便于分析截取了包含10個(gè)預(yù)測數(shù)值的后102個(gè)數(shù)據(jù)作圖,最終得到圖7.
圖7 動(dòng)力系統(tǒng)對兩種指數(shù)短期預(yù)測Fig.7 Shortdated prediction on two indexes using dynamical method
圖7中最后一小段10個(gè)數(shù)值是動(dòng)力系統(tǒng)方法對該系統(tǒng)預(yù)測值.從圖中直觀上可以看出動(dòng)力系統(tǒng)方法對NASDAQ指數(shù)市場走勢預(yù)測得很好,但是對標(biāo)準(zhǔn)普爾500市場指數(shù)預(yù)測得不是很好.原因在于,NASDAQ指數(shù)的特點(diǎn)是收集和發(fā)布包含場外交易非上市股票的證券商報(bào)價(jià)的平均指數(shù),股指中對股票的選擇變動(dòng)不大.而標(biāo)準(zhǔn)普爾500是由上市公司股票500只成分股組成的,并且該指數(shù)的成分股是變動(dòng)的,對美國證券市場的指數(shù)選擇不同對分析結(jié)果可能會(huì)有影響.從波動(dòng)的同步性看,對最后10個(gè)數(shù)值預(yù)測的走勢與真實(shí)數(shù)值的走勢具有比較同步的波動(dòng),不論是震蕩的幅度還是方向都與真實(shí)的走勢相一致,只是數(shù)值上比真實(shí)數(shù)值普遍大400左右.數(shù)值上的差異可以用經(jīng)濟(jì)環(huán)境的異常來解釋.最后10個(gè)數(shù)值所處的時(shí)間段是2008年12月至2009年2月初,這段時(shí)間內(nèi)美國的經(jīng)濟(jì)徘徊在崩潰的邊緣.銀行機(jī)構(gòu)繼華爾投行后又掀起一輪破產(chǎn)潮,美國的實(shí)體經(jīng)濟(jì)以三大汽車生產(chǎn)商為代表流動(dòng)性枯竭,政治上美國總統(tǒng)換屆,經(jīng)濟(jì)刺激方案面臨著極大的不確定性.面對如此惡劣的經(jīng)濟(jì)環(huán)境,標(biāo)準(zhǔn)普爾500指數(shù)的走勢已經(jīng)不再沿著歷史正常波動(dòng),所以用20 a的歷史數(shù)據(jù)來建立動(dòng)力系統(tǒng)模型,是對處于正常狀態(tài)的指數(shù)走勢的預(yù)測,那么在異常狀態(tài)下必然會(huì)與真實(shí)值有所差別.對于異常狀態(tài)的美國股市,經(jīng)濟(jì)分析師都會(huì)下調(diào)股指走勢的預(yù)期,預(yù)測值和真實(shí)值之間的差別可以很好地處理,用動(dòng)力系統(tǒng)預(yù)測的指數(shù)震蕩的幅度和方向還是比較準(zhǔn)確的,因此可以作為經(jīng)濟(jì)決策的輔助數(shù)據(jù).從這一點(diǎn)看來,動(dòng)力系統(tǒng)方法在美國股市這個(gè)復(fù)雜系統(tǒng)上的預(yù)測還是很有意義的.
時(shí)間序列趨勢項(xiàng)的提取是時(shí)間序列分析研究中的重要課題.本文提出了一種基于Copula函數(shù)構(gòu)造的誤差衡量模型,基于美國股票數(shù)據(jù),對各種提取方法進(jìn)行評判分析.運(yùn)用動(dòng)力系統(tǒng)方法,在美國金融危機(jī)的背景下,對兩種股票指數(shù)進(jìn)行了短期預(yù)測,效果較好,為這一領(lǐng)域提供了一個(gè)新的研究視角.
[1]王海燕,盧 山.非線性時(shí)間序列分析及其應(yīng)用[M].北京:科學(xué)出版社,2006:16-21
[2]王廣斌,劉義倫,金曉宏,等.基于最小二乘原理的趨勢項(xiàng)處理及其 MATLAB的實(shí)現(xiàn)[J].有色設(shè)備,2005(05):4-8
[3]高品賢.趨勢項(xiàng)對時(shí)域參數(shù)識(shí)別的影響及消除[J].振動(dòng)、測試與診斷,1994(02):20-26
[4]NELSEN R B.An Introduction to Copulas[M].2nd ed.New York:Springer,2006:7-42
[5]魏 巍.MATLAB應(yīng)用數(shù)學(xué)工具箱技術(shù)手冊[M].北京:國防工業(yè)出版社,2004:277-328
[6]張善文,雷英杰,馮有前.MATLAB在時(shí)間序列分析中的應(yīng)用[M].西安:西安電子科技大學(xué)出版社,2007:20-27
[7]韓 敏.混沌時(shí)間序列預(yù)測理論與方法[M].北京:中國水利水電出版社,2007:80-91