何 凱,蘇梽芳,2,何衛(wèi)平
(1.華僑大學(xué) 經(jīng)濟(jì)與金融學(xué)院,福建 泉州 362021;2.中國(guó)社會(huì)科學(xué)院經(jīng)濟(jì)研究所 博士后流動(dòng)站,北京 100000;3.暨南大學(xué) 經(jīng)濟(jì)學(xué)院,廣東 廣州 510000)
上證基金指數(shù)波動(dòng)結(jié)構(gòu)分解與短期預(yù)測(cè):基于EEMD模型
何 凱1,蘇梽芳1,2,何衛(wèi)平3
(1.華僑大學(xué) 經(jīng)濟(jì)與金融學(xué)院,福建 泉州 362021;2.中國(guó)社會(huì)科學(xué)院經(jīng)濟(jì)研究所 博士后流動(dòng)站,北京 100000;3.暨南大學(xué) 經(jīng)濟(jì)學(xué)院,廣東 廣州 510000)
上證基金指數(shù)反映了基金市場(chǎng)的整體變動(dòng)情況,研究其波動(dòng)結(jié)構(gòu)特征對(duì)基金市場(chǎng)參與者具有重要作用。研究結(jié)果表明:(1)上證基金指數(shù)序列可由經(jīng)濟(jì)基本面決定的趨勢(shì)項(xiàng)、重大事件帶來的低頻分量和短期不均衡導(dǎo)致的高頻分量構(gòu)成,而且趨勢(shì)項(xiàng)主導(dǎo)上證基金指數(shù)的長(zhǎng)期走勢(shì),低頻分量在中期對(duì)該指數(shù)有較大影響,而高頻分量的影響可忽略不計(jì);(2)與直接SVM預(yù)測(cè)法相比,EEMD-SVM組合預(yù)測(cè)法有更高的預(yù)測(cè)精度,說明EEMD分解得到的各結(jié)構(gòu)分量有效地刻畫了上證基金指數(shù)的內(nèi)在運(yùn)行特征。
證券市場(chǎng);集成經(jīng)驗(yàn)?zāi)B(tài)分解;本征模態(tài)函數(shù);支持向量機(jī);上證基金指數(shù)
證券投資基金作為我國(guó)最大的機(jī)構(gòu)投資者,其在我國(guó)資本市場(chǎng)中的地位日漸凸顯。從它出現(xiàn)至今一直受到機(jī)構(gòu)和個(gè)人投資者的青睞和社會(huì)各界的廣泛關(guān)注。證券投資基金不僅可以有效地改善證券市場(chǎng)的投資結(jié)構(gòu),而且其作為一種新型的金融工具,還拓寬了人們的投資渠道和改善了金融市場(chǎng)的運(yùn)行。近年來,對(duì)證券投資基金的研究文獻(xiàn)逐漸增加,主要集中于基金業(yè)績(jī)?cè)u(píng)價(jià)、封閉式基金折價(jià)現(xiàn)象的分析、機(jī)構(gòu)投資者持股對(duì)股市是否具有穩(wěn)定作用以及基金內(nèi)部治理結(jié)構(gòu)等方面。然而,對(duì)于基金指數(shù)的波動(dòng)性研究及基金凈值預(yù)測(cè)的方法,研究角度還比較單一,而且沒有深入挖掘基金運(yùn)行的內(nèi)在結(jié)構(gòu)特征。而這恰恰對(duì)于投資者、監(jiān)管者以及基金管理者更好地認(rèn)識(shí)和了解我國(guó)封閉式基金市場(chǎng)近年來的運(yùn)行情況、風(fēng)險(xiǎn)特征與市場(chǎng)趨勢(shì)具有重要作用。
一方面,對(duì)于基金指數(shù)的波動(dòng)性研究,目前主要是運(yùn)用數(shù)據(jù)驅(qū)動(dòng)的方法,如ARCH類、GARCH模型和ARMA模型等。郭曉亭(2006)[1]分別運(yùn)用EGARCH和TGARCH模型對(duì)中信基金指數(shù)波動(dòng)的非對(duì)稱性和杠桿效應(yīng)進(jìn)行了實(shí)證研究;牛方磊和盧小廣(2005)[2]運(yùn)用ARCH模型族進(jìn)行實(shí)證分析,得出上證基金指數(shù)收益率表現(xiàn)出非正態(tài)性和條件異方差的特征;楊湘豫和周屏(2006)[3]認(rèn)為華安創(chuàng)新基金收益率存在異方差性和不對(duì)稱的現(xiàn)象,并且EGARCH (2,2)模型能較好模擬該基金收益率的特征。雖然此類數(shù)據(jù)驅(qū)動(dòng)的方法在短期上有好的研究效果,但是卻不能有效地解釋證券投資基金的經(jīng)濟(jì)含義和其波動(dòng)的內(nèi)在驅(qū)動(dòng)力。而Huang etal.(1998)[4]提出的經(jīng)驗(yàn)?zāi)B(tài)分解法(Empiricalmode decomposition,EMD)能有效地解決這個(gè)困境。該法能很好地處理非平穩(wěn)、非線性信號(hào),被認(rèn)為是對(duì)以線性和平穩(wěn)假設(shè)為基礎(chǔ)的傅立葉分解和小波基的重大突破,具有直觀、直接、后驗(yàn)和自適應(yīng)的優(yōu)點(diǎn),其根本原因在于這種變換是基于數(shù)據(jù)本身的一種分解,而不是基于事先設(shè)定好的基函數(shù)。近年來,該法也開始應(yīng)用于經(jīng)濟(jì)金融領(lǐng)域,如Zhang et al.(2008)[5]、王曉芳和王瑞君(2012)[6]。但EMD分解的一個(gè)重要缺陷是模態(tài)混疊,為克服該缺陷,Wu和Huang(2009)[7]提出具有有效的抗混分解能力的集成經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble EMD,EEMD)方法。另一方面,對(duì)于基金凈值和基金指數(shù)的預(yù)測(cè)主要有兩類:一是統(tǒng)計(jì)方法,如基于AR、MA、ARMA和GARCH等模型的預(yù)測(cè),這類方法是一種參數(shù)方法,首先要定義模型的具體形式,再根據(jù)歷史數(shù)據(jù)找出最優(yōu)參數(shù),但這容易導(dǎo)致模型不匹配;二是人工智能法,主要是人工神經(jīng)網(wǎng)絡(luò)方法,該法是一種數(shù)據(jù)驅(qū)動(dòng)的非參數(shù)法,容易避免模型不匹配問題,并有較強(qiáng)的泛化能力和噪聲容忍能力等優(yōu)點(diǎn),如肖國(guó)榮(2011)[8]用BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)了金泰基金價(jià)格,劉麗峰(2011)[9]提出采用粒子群優(yōu)化與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合的組合模型,用于基金凈值預(yù)測(cè)研究。但神經(jīng)網(wǎng)絡(luò)存在過度學(xué)習(xí)與維度災(zāi)難的缺陷。而支持向量機(jī)(Supportvectormachine,SVM)卻可以有效地避免該問題,如傅東升和曹麗娟(2007)[10],Xieetal.(2006)[11]。然而,目前對(duì)于基金指數(shù)的預(yù)測(cè)大多都是針對(duì)序列本身,而沒有充分的考慮其內(nèi)在的運(yùn)行特征。
因此,本文基于集成經(jīng)驗(yàn)?zāi)B(tài)分解方法,將上證基金指數(shù)分解為若干不同頻率的分量以探究其波動(dòng)的結(jié)構(gòu)性特征,為認(rèn)識(shí)上證基金指數(shù)的波動(dòng)提供新思路。為提高基金指數(shù)預(yù)測(cè)精度,本文提出了基于EEMD分解得到的各個(gè)本征模態(tài)函數(shù),根據(jù)其各自不同的特征,建立相應(yīng)的SVM回歸預(yù)測(cè)模型進(jìn)行預(yù)測(cè),再將各本征模態(tài)函數(shù)的預(yù)測(cè)值等權(quán)重疊加得到最終的預(yù)測(cè)值,并用MAPE、RMSE和DS等指標(biāo)對(duì)該模型的預(yù)測(cè)效果進(jìn)行評(píng)價(jià)。
(一)經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)理論與算法
Huang etal.(1998)提出了經(jīng)驗(yàn)?zāi)B(tài)分解方法(EMD),該分解方法具有直觀、直接、后驗(yàn)和自適應(yīng)的優(yōu)點(diǎn)。該法是基于時(shí)間序列內(nèi)在的特征,自適應(yīng)地通過篩選過程(Sifting process)從序列中提取出獨(dú)立的、不同頻率的本征模態(tài)函數(shù)(Intrinsic mode function,IMF),每個(gè)IMF可以是線性的,也可以是非線性的,它反映了上證基金指數(shù)內(nèi)在的波動(dòng)特性。EMD方法假設(shè)任何信號(hào)都是由一系列包含了原信號(hào)的不同時(shí)間尺度的局部特征信號(hào)的本征模態(tài)函數(shù)(IMF)組成,這種IMF分量必須滿足兩個(gè)條件:即其極值點(diǎn)個(gè)數(shù)和過零點(diǎn)數(shù)相同或最多相差一個(gè)以及其上下包絡(luò)關(guān)于時(shí)間軸局部對(duì)稱。從而EMD方法就可以將一個(gè)多分量信號(hào)的各階本征模態(tài)分量一一篩選出來,具體步驟如下:設(shè)時(shí)間序列為x(t)。
(1)首先計(jì)算x(t)所有的局部極大值點(diǎn)和局部極小值點(diǎn);
(2)用三次樣條插值分別連接所有局部極大值和局部極小值點(diǎn),構(gòu)造x(t)的上包絡(luò)線xmax與下包絡(luò)線xmin;
(3)根據(jù)求得的上下包絡(luò)線,計(jì)算均值包絡(luò)線,記為m1(t),以及x(t)與m1(t)的差值,記為h1(t),即:m1(t)=(xmax+xmin)/2,h1(t)=x(t)-m1(t);
(4)因?yàn)閔1(t)一般不是一個(gè)IMF分量,為此需要對(duì)它重復(fù)上述處理過程k次,直到h1k(t)=h1(k-1)(t)-m1k(t)符合IMF的定義要求,即認(rèn)為h1k(t)是一個(gè)IMF分量,記c1(t)=h1k(t),r1(t)=x(t)-c1(t),x(t)=r1(t);
(二)集成經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD)
為克服EMD分解出現(xiàn)的模態(tài)混疊現(xiàn)象,Wu和Huang(2009)提出了Ensemble EMD方法(EEMD)。EEMD的基本思想是每一個(gè)觀察數(shù)據(jù)都是白噪聲與真實(shí)數(shù)據(jù)的融合,即使每個(gè)數(shù)據(jù)的搜集是單獨(dú)觀察到的,并且每次觀測(cè)的白噪聲都不同,但最后通過集成平均可消除白噪聲的影響,可得到真實(shí)的序列。EEMD的分解步驟如下:第一,對(duì)目標(biāo)序列增加一列白噪聲;第二,在對(duì)增加白噪聲后的序列進(jìn)行分解;第三,重復(fù)上述步驟,但每次增加的白噪聲不一樣,把得到IMF的集成均值作為最后的結(jié)果。
(一)數(shù)據(jù)說明與統(tǒng)計(jì)描述
本文選取上證基金指數(shù)收盤價(jià)為研究對(duì)象,樣本范圍選取2000年5月10日至2013年4月3日的日數(shù)據(jù),數(shù)據(jù)來源于國(guó)泰安數(shù)據(jù)庫(CSMAR)。本文用matlab7.0來處理數(shù)據(jù)。樣本數(shù)據(jù)的時(shí)間序列,如圖1所示。
圖1 上證基金指數(shù)
表1 上證基金指數(shù)統(tǒng)計(jì)分析
從表1可知,上證基金指數(shù)的偏度為0.293,峰度為1.34,說明上證基金指數(shù)序列為一個(gè)為右偏的寬尾分布。
(二)EEMD分解以及各IMF的統(tǒng)計(jì)分析
在EEMD模型中,設(shè)定加入的白噪聲的標(biāo)準(zhǔn)差為0.2,集成次數(shù)為100。根據(jù)Rilling,etal.(2003)提出的終止條件,上證基金指數(shù)經(jīng)分解得到8個(gè)IMF和一個(gè)余項(xiàng)(圖2)。分解出來的所有IMF都是按頻率從高到低排列,且各IMF呈現(xiàn)出相似的波動(dòng)特征,即隨本征模態(tài)函數(shù)從高頻到低頻移動(dòng)而振幅增加;而余項(xiàng)即趨勢(shì)項(xiàng)是一個(gè)單調(diào)遞增的緩慢變化的時(shí)間序列。
圖2 上證基金指數(shù)的本征模態(tài)函數(shù)和趨勢(shì)項(xiàng)
下面我們主要從Pearson系數(shù)大小、平均周期、占上證基金指數(shù)的方差比和占分解后各IMF和趨勢(shì)項(xiàng)方差之和的比值這四個(gè)指標(biāo)來分析各IMF、余項(xiàng)與原始序列的關(guān)系。Pearson相關(guān)系數(shù)用來衡量每個(gè)IMF以及余項(xiàng)與原始序列的相關(guān)性大小。每個(gè)IMF的平均周期等于該IMF的樣本數(shù)與其所有極大值點(diǎn)個(gè)數(shù)的比值與所有極小值點(diǎn)個(gè)數(shù)的比值的平均值,用平均周期來反映每個(gè)IMF的頻率變化主要是因?yàn)镮MF的頻率和振幅隨著時(shí)間的推移發(fā)生細(xì)微變化,致使IMF的周期不是一個(gè)恒定值。另外,由于這些IMF彼此間相互獨(dú)立,因此可用每個(gè)IMF的方差分別占原始序列方差的比例和占分解后各IMF和趨勢(shì)項(xiàng)方差之和的比值來解釋其對(duì)原始序列波動(dòng)的貢獻(xiàn)率。
由表2可知,各IMF的平均周期和相關(guān)系數(shù)從上到下逐漸變大。IMF1的平均周期為2.86天,Pearson系數(shù)為0.014。而IMF8的平均周期最長(zhǎng),即1302.9天,Pearson系數(shù)為0.36。這表明高頻IMF與原始序列的相關(guān)系數(shù)較小可能是由于其周期較短、波動(dòng)頻繁導(dǎo)致;而低頻IMF與原序列相關(guān)系數(shù)較小,其原因可能是低頻模式函數(shù)周期比較長(zhǎng),趨勢(shì)方向變化較緩,即當(dāng)原始時(shí)間序列處于某一運(yùn)行趨勢(shì)時(shí),這些IMF難以及時(shí)調(diào)整其運(yùn)行方向。而IMF至IMF5的方差占原序列方差比之和與占分解后方差比之和分別都沒有超過1%,低頻模態(tài)函數(shù)(IMF6、IMF7和IMF8)和趨勢(shì)項(xiàng)的方差總和占到總方差的絕大部分。不難發(fā)現(xiàn)高頻分量對(duì)上證基金指數(shù)影響不大;在某一段時(shí)期內(nèi),由政治動(dòng)亂、金融危機(jī)和宏觀政策變化等重大事件影響造成的低頻分量在某一段時(shí)期對(duì)上證基金指數(shù)影響可能比較大;而在長(zhǎng)期內(nèi),作為上證基金指數(shù)內(nèi)在運(yùn)行軌跡的趨勢(shì)項(xiàng)對(duì)其影響最大,這意味著一般情況下大部分本征模態(tài)函數(shù)對(duì)基金市場(chǎng)指數(shù)影響都較小。
表2 基于EEMD分解的上證基金指數(shù)各IMF和余項(xiàng)分析
另外,趨勢(shì)項(xiàng)軌跡與原始時(shí)間序列的運(yùn)行軌跡基本吻合,而且趨勢(shì)項(xiàng)和原始序列的相關(guān)系數(shù)最高,達(dá)到0.897,趨勢(shì)項(xiàng)的方差占分解后各IMF和趨勢(shì)項(xiàng)方差之和的86.12%,占到原序列方差的76.93%,說明趨勢(shì)項(xiàng)能解釋上證基金指數(shù)的波動(dòng)的絕大部分,正如Huang etal.(1998)中提到,趨勢(shì)項(xiàng)常被人們視為原始時(shí)間序列中的內(nèi)在運(yùn)行軌跡。
(三)上證基金指數(shù)波動(dòng)結(jié)構(gòu)特征分析
上證基金指數(shù)序列經(jīng)EEMD分解成8個(gè)IMF和一個(gè)余項(xiàng)。IMF的頻率各不相同,高頻分量表現(xiàn)出隨機(jī)無序性,而低頻項(xiàng)具有很強(qiáng)的周期性。我們采用從高頻到低頻的重構(gòu)算法(Fine-to-coarse Reconstruction)對(duì)各模態(tài)本征函數(shù)重構(gòu),得到上證基金指數(shù)的結(jié)構(gòu)分量。重構(gòu)算法步驟如下:首先,對(duì)各模態(tài),計(jì)算從IMF1—IMF(i)的和的均值,其中i=1,2,…,8;其次,基于t檢驗(yàn),檢驗(yàn)從哪一個(gè)i起,對(duì)應(yīng)的均值顯著偏離于零,一旦i被識(shí)別為結(jié)構(gòu)轉(zhuǎn)折點(diǎn),則從IMF1—IMF(i-1)的重構(gòu)被識(shí)別為高頻分量,而其他IMF的重構(gòu)被識(shí)別為低頻分量。
從圖3中可以看出,對(duì)各IMF的均值進(jìn)行t檢驗(yàn),發(fā)現(xiàn)在IMF6處顯著地偏離了零。另外,IMF1-IMF5的均值近似等于零,即基本圍繞零均值線隨機(jī)波動(dòng),但從IMF6開始呈現(xiàn)出比較規(guī)則的周期性波動(dòng)。因此,將IMF1-IMF5歸為高頻分量,而IMF6-IMF8歸為低頻分量。
圖3 高低頻區(qū)分判別圖
表3 上證基金指數(shù)與三部分結(jié)構(gòu)分量的相關(guān)系數(shù)及方差來源分析
我們發(fā)現(xiàn)高低頻分量和趨勢(shì)項(xiàng)隱含著很強(qiáng)的經(jīng)濟(jì)學(xué)意義,趨勢(shì)項(xiàng)圍繞著長(zhǎng)期均值緩慢變化,描述了上證基金指數(shù)的長(zhǎng)期走勢(shì);低頻分量的每次波動(dòng)總是和一些政治動(dòng)亂、宏觀經(jīng)濟(jì)政策變化和金融危機(jī)等重大事件相關(guān),這都反映出這些重大事件對(duì)上證基金指數(shù)基金市場(chǎng)的影響;高頻分量振幅小、頻率高,圍繞零均值隨機(jī)波動(dòng),可以用來揭示基金市場(chǎng)短期的不均衡現(xiàn)象,并用其振幅的大小來表征短期不均衡的程度。由于上證基金指數(shù)針對(duì)的是滬深交易的封閉式基金,反映了基金市場(chǎng)的綜合變動(dòng)情況,故高低頻分量與趨勢(shì)項(xiàng)這三個(gè)結(jié)構(gòu)分量可用來揭示隱含在上證基金指數(shù)序列和其反映的基金市場(chǎng)的內(nèi)在運(yùn)行特征。
從高頻分量來看,它代表了基金市場(chǎng)的隨機(jī)波動(dòng),表現(xiàn)了基金市場(chǎng)的短期不均衡程度。由于高頻分量中的各本征模態(tài)函數(shù)周期短、變化快,所以了解基金市場(chǎng)中高頻分量的波動(dòng)特征對(duì)短期投資具有一定的意義。由表3可知高頻分量和原始序列相關(guān)系數(shù)為0.079,高頻分量占原始序列方差的比例為0.06%,且占分解后各IMF和趨勢(shì)項(xiàng)之和的方差比也才0.62%,說明短期不均衡造成的隨機(jī)波動(dòng)對(duì)基金市場(chǎng)的影響有限,市場(chǎng)投機(jī)行為不明顯,而且高頻分量的波動(dòng)主要是供需不均衡導(dǎo)致,屬正常的市場(chǎng)反應(yīng),這與我國(guó)基金市場(chǎng)特征是相符的。
從低頻分量來看,低頻分量反映了我國(guó)基金市場(chǎng)的中期波動(dòng)。用低頻曲線來表征重大事件對(duì)上證基金指數(shù)的影響,其中周期表示對(duì)指數(shù)產(chǎn)生影響的時(shí)間長(zhǎng)短,振幅表示對(duì)指數(shù)沖擊的大小。換句話說,周期越長(zhǎng),基金市場(chǎng)受重大事件沖擊影響的時(shí)間就越長(zhǎng);振幅越大,基金市場(chǎng)受事件沖擊就越大。重大事件對(duì)基金市場(chǎng)產(chǎn)生的沖擊主要體現(xiàn)在低頻分量(IMF6、IMF7和IMF8)中,這些沖擊引起的指數(shù)波動(dòng)幅度大,持續(xù)周期長(zhǎng)。從圖4和表3中觀察到,平均周期至少在半年以上,說明上證基金指數(shù)需要在相當(dāng)長(zhǎng)的時(shí)間才能消化重大事件帶來的沖擊。具體來說,在重大事件的影響期內(nèi),比如2008年的全球金融危機(jī),趨勢(shì)項(xiàng)變化比較緩慢,而高頻分量振幅又小,所以,低頻分量是引起上證基金指數(shù)大幅波動(dòng)最主要的原因,且基金市場(chǎng)短期內(nèi)無法消除這些影響。
從趨勢(shì)項(xiàng)來看,在表3中,趨勢(shì)項(xiàng)和原始序列相關(guān)系數(shù)為0.897,趨勢(shì)項(xiàng)占原始序列方差的比例將近76.93%,占分解后各IMF和趨勢(shì)項(xiàng)方差之和的比值為79.97%,說明趨勢(shì)項(xiàng)基本決定了上證基金指數(shù)的長(zhǎng)期走勢(shì)。從圖4可見,基金市場(chǎng)總的趨勢(shì)是上行的,這與我國(guó)經(jīng)濟(jì)發(fā)展情況是一致,因此在長(zhǎng)期我國(guó)基金市場(chǎng)的運(yùn)行由我國(guó)的經(jīng)濟(jì)基本面決定。而且,盡管基金市場(chǎng)常受到一些重大事件的沖擊大幅波動(dòng),但是待該事件影響結(jié)束后,指數(shù)仍會(huì)返回到趨勢(shì)附近圍繞其小幅波動(dòng)運(yùn)行。
圖4 上證基金指數(shù)高低頻分量和趨勢(shì)項(xiàng)分解圖
上證基金指數(shù)序列是典型的非平穩(wěn)、非線性時(shí)間序列,傳統(tǒng)的預(yù)測(cè)方法基本都是針對(duì)整個(gè)時(shí)間序列進(jìn)行預(yù)測(cè),而沒有充分考慮到該序列的隨機(jī)性、周期性和趨勢(shì)性的特點(diǎn),而這樣預(yù)測(cè)的精度還有提高的空間。因此,本文首先采用EEMD分解方法,把上證基金指數(shù)序列分解為具有不同頻帶的分量,對(duì)各分量建立相應(yīng)的支持向量機(jī)(Support vectormachine,SVM)回歸預(yù)測(cè)模型進(jìn)行預(yù)測(cè),然后將各個(gè)預(yù)測(cè)結(jié)果等權(quán)重疊加作為上證基金指數(shù)的預(yù)測(cè)值(即EEMD-SVM組合預(yù)測(cè)法)。同時(shí),為了檢驗(yàn)本文方法的預(yù)測(cè)效果,將該方法與將上證基金指數(shù)序列直接用SVM回歸預(yù)測(cè)方法(即直接SVM法)預(yù)測(cè)的效果進(jìn)行比較。本文選用平均絕對(duì)百分比誤差(MAPE)和均方根誤差(RMSE)來度量預(yù)測(cè)誤差的大??;用方向?qū)ΨQ值(DS)來度量各模型對(duì)上證基金指數(shù)方向性走勢(shì)的預(yù)測(cè)能力,顯示能正確預(yù)測(cè)目標(biāo)值方向的次數(shù)與預(yù)測(cè)樣本容量的百分比。
Vapnik etal.(1995)[12]在統(tǒng)計(jì)學(xué)習(xí)的理論基礎(chǔ)上首次提出支持向量機(jī)算法,該算法是一種全新的機(jī)器學(xué)習(xí)算法。SVM的主要思想可以概括為兩點(diǎn):一是可以將低維非線性問題轉(zhuǎn)化為高維的線性問題,用一個(gè)核函數(shù)代替高維中的內(nèi)積運(yùn)算,有效克服維度災(zāi)難及局部極小值問題;二是基于結(jié)構(gòu)風(fēng)險(xiǎn)最小原理在特征空間中建構(gòu)最優(yōu)分割超平面,使學(xué)習(xí)器得到全局最優(yōu)化,故具有良好的泛化能力。由于SVM出色的性能,因而在預(yù)測(cè)方面得到廣泛的運(yùn)用。
表4 預(yù)測(cè)誤差比較
SVM回歸預(yù)測(cè)的基本思路是對(duì)于給定樣本數(shù)據(jù){xk,yk} ,其中xk∈R為n維向量,yk∈R為相對(duì)應(yīng)的輸出變量,尋找一個(gè)函數(shù)f(x)來推斷任意的x所對(duì)應(yīng)的y值。SVM回歸預(yù)測(cè)的具體步驟為:(1)將上證基金指數(shù)日收盤價(jià)序列從2000年5月10日至2013年5月10日共3147個(gè)樣本數(shù)據(jù)分為兩部分,其中把2000年5月10日至2013年4月3日共3127個(gè)樣本數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),將2013年4月8日至2013年5月8日共20個(gè)交易日的數(shù)據(jù)作為測(cè)試數(shù)據(jù),同時(shí)將上證基金指數(shù)日收盤價(jià)序列進(jìn)行EEMD分解,得到8個(gè)不同頻帶的IMF及余項(xiàng);(2)本文利用所研究時(shí)間序列的過去10天的歷史值來預(yù)測(cè)未來一天的值,對(duì)各IMF及余項(xiàng)先處理得到各自的訓(xùn)練樣本和訓(xùn)練目標(biāo),其中訓(xùn)練樣本為一個(gè)10行3117列的矩陣,訓(xùn)練目標(biāo)為一個(gè)1行3117列的向量,為提高收斂速度將這兩類訓(xùn)練樣本歸一化為0~1之間;(3)選用徑向基函數(shù)為核函數(shù),利用交叉驗(yàn)證與網(wǎng)格搜索法選擇誤差值最小時(shí)的懲罰參數(shù)與核參數(shù),建立相應(yīng)的SVM回歸預(yù)測(cè)模型;(4)采用移動(dòng)窗口的一步向前預(yù)測(cè)法,利用相應(yīng)的SVM回歸預(yù)測(cè)模型預(yù)測(cè)得到不同頻帶未來20天的預(yù)測(cè)值,將各頻帶的預(yù)測(cè)值等權(quán)重疊加得到最終的預(yù)測(cè)值。本文基于Matlab7.0平臺(tái)的Libsvm2.89軟件包(http://www.csie.ntu.edu.tw/~cjlin/)進(jìn)行預(yù)測(cè)。具體預(yù)測(cè)結(jié)果與預(yù)測(cè)誤差比較如表4與圖5:
圖5 預(yù)測(cè)值與實(shí)際值比較
從表4可以看出,EEMD-SVM組合預(yù)測(cè)法的RMSE和MAPE分別為32.96與0.663%,直接SVM預(yù)測(cè)法的RMSE和MAPE分別為38.18與0.702%,而且從圖5可知,對(duì)于從2013年4月8日至2013年5月8日共20個(gè)交易日的預(yù)測(cè)數(shù)據(jù),在絕大部分時(shí)點(diǎn)上,EEMD-SVM組合法的預(yù)測(cè)值較直接SVM法的預(yù)測(cè)值更接近于真實(shí)值,這說明EEMD-SVM組合預(yù)測(cè)法較直接SVM預(yù)測(cè)法的相對(duì)誤差小,預(yù)測(cè)精度高;另外,EEMD-SVM組合預(yù)測(cè)法的DS為0.79,大于直接SVM法的0.58,說明前者更好地把握了上證基金指數(shù)的走勢(shì)方向。因此,本文提出的EEMD-SVM組合預(yù)測(cè)法較直接SVM預(yù)測(cè)法有更高的預(yù)測(cè)能力。
本文首先利用EEMD分解方法,將上證基金指數(shù)分解為8個(gè)IMF和一個(gè)趨勢(shì)項(xiàng),進(jìn)一步將其重組為高頻分量、低頻分量和趨勢(shì)項(xiàng)三個(gè)結(jié)構(gòu)分量。其中,高頻分量代表了上證基金指數(shù)波動(dòng)的隨機(jī)性特征,反映了市場(chǎng)的短期不均衡,而且其平均周期較短,方差占上證基金指數(shù)波動(dòng)的比重較小,說明基金市場(chǎng)投機(jī)行為較少;低頻分量代表了上證基金指數(shù)波動(dòng)的周期性特征,反映了重大事件對(duì)市場(chǎng)上證基金指數(shù)中期波動(dòng)的影響,其平均周期較長(zhǎng),方差占上證基金指數(shù)波動(dòng)的比重較大,說明基金市場(chǎng)受重大事件的影響較大;而趨勢(shì)項(xiàng)主導(dǎo)上證基金指數(shù)的長(zhǎng)期走勢(shì),反映了經(jīng)濟(jì)基本面的影響,并且其方差能解釋上證基金指數(shù)波動(dòng)的絕大部分。
其次,利用經(jīng)EEMD分解得到的不同本征模態(tài)函數(shù),建立相應(yīng)的SVM回歸預(yù)測(cè)模型進(jìn)行預(yù)測(cè),最后將各分量的SVM預(yù)測(cè)值等權(quán)重加總得到最終的預(yù)測(cè)值。預(yù)測(cè)結(jié)果顯示,EEMD-SVM組合預(yù)測(cè)法的預(yù)測(cè)效果要優(yōu)于直接SVM預(yù)測(cè)法,這說明了EEMD分解充分考慮了上證基金指數(shù)的周期性、隨機(jī)性和趨勢(shì)特性,從而提高了預(yù)測(cè)精度。
必須指出的是,由于上證基金指數(shù)序列是一個(gè)復(fù)雜的系統(tǒng),受到國(guó)內(nèi)外眾多因素的影響,僅從該時(shí)間序列自身出發(fā),建立相關(guān)模型進(jìn)行預(yù)測(cè),預(yù)測(cè)精度可能還有提高的空間。因此,把影響上證基金指數(shù)的主要變量納入到預(yù)測(cè)模型中,建立SVM時(shí)間序列預(yù)測(cè)模型進(jìn)行預(yù)測(cè)是一個(gè)研究方向。
[1]郭曉亭.中國(guó)證券投資基金市場(chǎng)波動(dòng)特征實(shí)證研究[J].中國(guó)管理科學(xué),2006,14(1):15-20.
[2]牛方磊,盧小廣.基于ARCH類模型的基金市場(chǎng)波動(dòng)性研究[J].統(tǒng)計(jì)與決策,2005,(12X):109-110.
[3]楊湘豫,周屏.GARCH模型在開放式基金中的實(shí)證研究[J].系統(tǒng)工程,2006,24(4):73-76.
[4]Huang,Norden E,et al.The Empirical Mode Decomposition and the Hilbert Spectrum for Nonlinear and Non-stationary Time Series Analysis[J].Proceedings of the Royal Society of London.Series A:Mathematical,Physical and Engineering Sciences 454.1971 (1998):903-995.
[5]Zhang X,LaiK K,Wang SY.A New Approach for Crude Oil Price Analysis based on Empirical Mode Decomposition[J].Energy Economics,2008,30:905-918.
[6]王曉芳,王瑞君.上證綜指波動(dòng)特征及收益率影響因素研究——基于EEMD和VAR模型分析[J].南開經(jīng)濟(jì)研究,2012,(006):82-99.
[7]Wu Z H,Huang N E.Ensemble Empirical Mode Decomposition:A Noise-assisted Data Analysis Method[J].Advances in Adaptive Data Analysis,2009, 1(1):1-41.
[8]肖國(guó)榮.BP神經(jīng)網(wǎng)絡(luò)在基金價(jià)格預(yù)測(cè)中的應(yīng)用研究[J].計(jì)算機(jī)仿真,2011,28(3):373-376.
[9]劉麗峰.組合模型的基金凈值預(yù)測(cè)研究[J].計(jì)算機(jī)仿真,2011,28(5):354-357.
[10]傅東升,曹麗娟.SVM與BP網(wǎng)絡(luò)對(duì)基金波動(dòng)的預(yù)測(cè)效果比較分析[J].世界經(jīng)濟(jì)情況,2007,(8):45.
[11]Xie W,Yu L,Xu S,et al.A New Method for Crude Oil Price Forecasting based on Support Vector Machines[M].Computational Science-ICCS 2006. Springer Berlin Heidelberg,2006:444-451.
[12]Cortes C,Vapnik V.Support-vector Networks [J].Machine Learning,1995,20(3):273-297.
(責(zé)任編輯:賈偉)
ract:Shanghai Securities Fund Index reflects the overall changes in fund market,so investigating its volatility structure is of the utmost importance to investors in thismarket.The results show that ShanghaiSecurities Fund Index can be composed of the trend series dominated by economic fundamentals,high frequency series created by short-term disequilibrium and low frequency series caused by big events;moreover,the trend decides the long-term trend of Shanghai Securities Fund Index,low frequency atmedian term exerts large influence upon it,buthigh frequency has little impacton it.Additionally,the forecasting results demonstrate effectiveness and attractiveness of the proposed EEMD-based SVM ensemble learning paradigm compared with single SVM,which illustrates that the EEMD decompositionmethod effectively depicts the inherent characteristics of Shanghai Securities Fund Index.
ords:stock market;ensemble empiricalmode decomposition(EEMD);intrinsicmode function (IMF);supportvectormachine(SVM);Shanghaisecurities fund index
1003-4625(2014)01-0080-06
F830.91
A
2013-10-20
本文為國(guó)家社會(huì)科學(xué)基金(11CJY104);福建省高等學(xué)校新世紀(jì)優(yōu)秀人才支持計(jì)劃(2012FJ-NCET-SK02);福建省高等學(xué)校杰出青年科研人才培育計(jì)劃(11FJPY04)。
何凱(1988-),男,湖南沅江人,信息經(jīng)濟(jì)學(xué)碩士研究生,研究方向:金融市場(chǎng)與貨幣經(jīng)濟(jì)學(xué);蘇梽芳(1977-),男,福建惠安人,華僑大學(xué)經(jīng)濟(jì)與金融學(xué)院副教授,金融系主任,中國(guó)社會(huì)科學(xué)院經(jīng)濟(jì)所理論經(jīng)濟(jì)博士后,研究方向:金融計(jì)量與通貨膨脹;何衛(wèi)平(1988-),男,湖南邵陽人,數(shù)量經(jīng)濟(jì)學(xué)碩士研究生,研究方向:金融計(jì)量學(xué)。