孫冰潔 唐 瑞 左 毅 黃明和
(1.江西師范大學(xué)軟件學(xué)院 南昌 330022)(2.江西省科技型中小企業(yè)創(chuàng)新基金管理中心 南昌 330046)
小波分析下的神經(jīng)網(wǎng)絡(luò)股票預(yù)測研究
孫冰潔1唐瑞1左毅2黃明和1
(1.江西師范大學(xué)軟件學(xué)院南昌330022)(2.江西省科技型中小企業(yè)創(chuàng)新基金管理中心南昌330046)
摘要研究股票價格準(zhǔn)確預(yù)測問題。股票市場是一個非常復(fù)雜的非線性動力學(xué)系統(tǒng),傳統(tǒng)的時間序列預(yù)測方法很難揭示其內(nèi)在規(guī)律,預(yù)測結(jié)果誤差較大。論文利用小波分解與重構(gòu),將原始非平穩(wěn)時間序列分解為不同尺度下的時間序列分量,依照其各自特點,分別采用Elman神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)模型,對各層系數(shù)進(jìn)行建模與預(yù)測,通過整合各層系數(shù),得到原始時間序列的預(yù)測值。通過對滬深300指數(shù)的仿真預(yù)測實驗表明,基于小波分解的神經(jīng)網(wǎng)絡(luò)組合預(yù)測方法比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)預(yù)測方法的預(yù)測精度明顯提高,具有實際的推廣應(yīng)用價值。
關(guān)鍵詞小波分解與重構(gòu); 神經(jīng)網(wǎng)絡(luò); 股票預(yù)測; 滬深300指數(shù)
Class NumberTP391
1引言
隨著我國市場經(jīng)濟(jì)的繁榮發(fā)展,股票走進(jìn)了千家萬戶,成為許多人息息相關(guān)的投資產(chǎn)品。因此,對股票走勢的預(yù)測成為越來越多人所關(guān)注的課題。準(zhǔn)確預(yù)測股票價格的運(yùn)行態(tài)勢,不論對于政府宏觀管理,還是對于投資者而言,都有很強(qiáng)的現(xiàn)實意義[1]。
人工智能和計算機(jī)技術(shù)的迅猛發(fā)展,尤其是人工神經(jīng)網(wǎng)絡(luò)技術(shù)的出現(xiàn),給股票預(yù)測研究提供了新的研究方向。隨著神經(jīng)網(wǎng)絡(luò)理論日趨完善,國內(nèi)外學(xué)者對其在股票市場的建模和預(yù)測方面進(jìn)行了大量研究,并取得了突出的研究成果。Cao等[2]采用小波神經(jīng)網(wǎng)絡(luò)、Shi等[3]采用回聲向量機(jī)、Han等[4]用遞歸神經(jīng)網(wǎng)絡(luò)分別對股票走勢進(jìn)行了預(yù)測。2010年,馮興杰和孟欣建立了基于遺傳算法的神經(jīng)網(wǎng)絡(luò)對股票走勢進(jìn)行了短期預(yù)測,改進(jìn)后的模型在預(yù)測精度方面顯著提高[5]。翁蘇駿等利用RBF神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)和Elman反饋神經(jīng)網(wǎng)絡(luò)進(jìn)行股票價格的短期預(yù)測,實驗結(jié)果表明反饋神經(jīng)網(wǎng)絡(luò)的預(yù)測能力高于前饋神經(jīng)網(wǎng)絡(luò)[6]。
然而,股票市場的價格走勢極為復(fù)雜,單一的預(yù)測模型以及對股票價格的直接預(yù)測無法揭示其內(nèi)在規(guī)律,預(yù)測精度無法進(jìn)一步提高。本文在小波分解與重構(gòu)的基礎(chǔ)上,對不同尺度下的時間序列分量進(jìn)行擬合預(yù)測,預(yù)測精度明顯提高。
2股票價格預(yù)測的基本思想
高噪聲、嚴(yán)重非線性和投資者的盲目任意性等因素決定了股票預(yù)測的復(fù)雜與困難度,應(yīng)用現(xiàn)有的技術(shù)分析方法,預(yù)測結(jié)果精度較低[7]。
隨著小波分析理論的提出與發(fā)展,因其多尺度分析的特性,而且在時頻兩域都具有表征信號局部特征的能力,被廣泛應(yīng)用于信號分析與處理。近年來,小波分析方法也被引入到經(jīng)濟(jì)和金融領(lǐng)域,并顯示出其獨特的優(yōu)勢。
本文在小波分解與重構(gòu)的基礎(chǔ)上,將原始時間序列分解成一個低頻序列和若干個高頻序列,分別采用動態(tài)Elman神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)靜態(tài)BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行擬合預(yù)測,分而治之,通過整合各層預(yù)測結(jié)果,得到原始時間序列的預(yù)測值。這樣,傳統(tǒng)的預(yù)測方法就可以應(yīng)用在非平穩(wěn)的時間序列研究中,從而為某些非平穩(wěn)時間序列的預(yù)測提供了一種新的方法。建模預(yù)測過程可以用圖1描述。
圖1 基于小波分析的股票預(yù)測模型建模過程
3股票價格預(yù)測的基本理論
3.1小波的分解與重構(gòu)
小波變換的實質(zhì)是將信號f(t)分解在基函數(shù)的不同頻帶上的子信號。小波具有多分辨率的特點,可以由粗到細(xì)地逐步觀察信號。
在股票預(yù)測分析中,原始時間序列就是一組信號值。利用多尺度分解,將原始序列分解到不同的頻率上。由于分解后的序列在頻率成分上比原始序列單一,并且小波分解對原始序列作了平滑處理,因此對分解后的時間序列建模得到的結(jié)果更準(zhǔn)確。
多尺度分析是小波分析中一種對信號的空間分解的方法,多尺度分析理論認(rèn)為任何一個信號都可以分解為兩部分:低頻(主體信息)和高頻(細(xì)節(jié)紋理)。為了將信號的低頻與高頻部分分開處理,Mallat提出了信號的塔式多尺度分解與重構(gòu)的著名算法,稱為Mallat算法[8],其算法的主要思想是:將有限能量信號f∈L2(R)在分辨率2j下的近似Cjf分解為分辨率2j-1下的近似Cj-1f,以及位于分辨率2j-1和2j之間的細(xì)節(jié)紋理Dj-1f之和。分解過程如圖2所示。
圖2 Mallat塔式分解過程
根據(jù)上述分解原理,得到Mallat塔式分解算法遞推公式的矩陣表達(dá)形式:
(1)
其中,Cj,Dj分別是小波系數(shù)的列向量形式;h0,h1為相應(yīng)的多尺度分析中濾波器的低通濾波與高通濾波系數(shù)。
分解后的各層小波系數(shù)可以通過單支重構(gòu)恢復(fù)到原序列長度,使之具有與原序列時間尺度一致的性質(zhì)[9]。有相應(yīng)的重構(gòu)公式:
(2)
3.2BP神經(jīng)網(wǎng)絡(luò)模型
由于BP神經(jīng)網(wǎng)絡(luò)具有構(gòu)造簡單、并行處理和有效解決非線性目標(biāo)函數(shù)的逼近問題的能力而被廣泛應(yīng)用于信號處理、模式識別、系統(tǒng)辨識等學(xué)科領(lǐng)域中[9]。
股票市場的潛在規(guī)律通過BP神經(jīng)網(wǎng)絡(luò)模型來學(xué)習(xí),進(jìn)而預(yù)測股票價格未來走勢,這對研究股票市場的非常規(guī)性的漲跌具有極其重要的意義。
BP網(wǎng)絡(luò)是一種分層型的典型多層網(wǎng)絡(luò),具有輸入層、隱含層和輸出層,層與層之間多采用全連接的方式。一個典型的三層BP神經(jīng)網(wǎng)絡(luò)如圖3所示。
圖3 三層BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
BP算法由兩部分組成:信息的正向傳遞和誤差的反向傳播。具體學(xué)習(xí)過程如下:
步驟1:信息的正向傳遞
1) 隱含層中第i個神經(jīng)元的輸出為
(3)
2) 輸出層第k個神經(jīng)元的輸出為
(4)
3) 定義誤差函數(shù)為
(5)
步驟2:利用梯度下降法求權(quán)值變化及誤差的反向傳播
1) 輸出層的權(quán)值變化。對從第i個輸入到第k個輸出的權(quán)值,有:
(6)
2) 隱含層權(quán)值變化。對從第j個輸入到第i個輸出的權(quán)值,有:
(7)
3.3Elman神經(jīng)網(wǎng)絡(luò)模型
Elman神經(jīng)網(wǎng)絡(luò)可以看做是一個具有局部記憶單元和局部反饋連接的前向神經(jīng)網(wǎng)絡(luò)。它與BP神經(jīng)網(wǎng)絡(luò)具有相似的多層結(jié)構(gòu),不同之處在于它多了一個承接層,如圖4所示。
圖4 Elman神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
承接層從隱含層接收反饋信號,用來記憶隱含層神經(jīng)元前一時刻的輸出值,承接層神經(jīng)元的輸出經(jīng)延遲與存儲,再輸入到隱含層。這樣就使其對歷史數(shù)據(jù)具有敏感性,增加了網(wǎng)絡(luò)自身處理動態(tài)信息的能力。
這樣,Elman神經(jīng)網(wǎng)絡(luò)給用于時間序列的股票價格預(yù)測的建模提供了理論保證。其學(xué)習(xí)算法采用BP算法。
3.4誤差分析
對序列的建模預(yù)測分析是為了探尋序列現(xiàn)象內(nèi)在的關(guān)系,而預(yù)測效果的好壞則是檢驗這種關(guān)系存在與否以及解析力度大小的標(biāo)準(zhǔn)[10]。
一般地,對預(yù)測結(jié)果采用誤差形式進(jìn)行評價,常用的衡量觀測值與實際值之間的偏差參數(shù)如下:
1) 均方誤差(Mean Squared Error)
(8)
2) 均方根誤差(Root Mean Squared Error)
(9)
3) 平均絕對誤差(Mean Absolute Error)
(10)
4) 平均絕對相對誤差(Mean Absolute Percent Error)
(11)
4股票價格預(yù)測的建模仿真
4.1樣本選取和數(shù)據(jù)劃分
滬深300指數(shù)股是從滬市和深市共挑選300只具有代表性的股票作為指標(biāo)股,它能很好地反應(yīng)市場的整體水平和情況。本文選取滬深300指數(shù)2013年6月4日至2014年9月30日共325個交易日的收盤價數(shù)據(jù),預(yù)測未來20天的收盤價。
本文進(jìn)行股票預(yù)測的分析周期選取5日,依次將順序五天的數(shù)據(jù)作為網(wǎng)絡(luò)的輸入數(shù)據(jù),其后一天的數(shù)據(jù)作為網(wǎng)絡(luò)輸出即目標(biāo)數(shù)據(jù),按此方式進(jìn)行滾動式排列,形成神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本。
4.2原始序列的小波分解與重構(gòu)
選取db4小波基函數(shù)對樣本數(shù)據(jù)進(jìn)行三層小波分解,并對小波分解后的各層小波系數(shù)進(jìn)行單支重構(gòu),獲得與原實際序列時間尺度一致的各層小波系數(shù),如圖5所示。
其中,x是原始數(shù)據(jù),a3代表低頻成分,d1,d2,d3為不同頻率的高頻成分,低頻成分a3與原始數(shù)據(jù)x的趨勢大體相同,d1,d2,d3均圍繞零上下波動,說明其趨勢項已得到很好的分離,然后采用上述的分別建模預(yù)測原理,對其進(jìn)行預(yù)測。
圖5 原始序列重構(gòu)后各層小波系數(shù)
4.3低頻序列和高頻序列的建模預(yù)測
低頻序列代表非平穩(wěn)時間序列分析中的長期走勢,適合有良好記憶性的動態(tài)Elman神經(jīng)網(wǎng)絡(luò)進(jìn)行建模預(yù)測,隱層網(wǎng)絡(luò)采用tansig傳遞函數(shù),輸出層采用purelin傳遞函數(shù),學(xué)習(xí)函數(shù)采用traingdx。在Matlab中進(jìn)行仿真建模,預(yù)測結(jié)果如圖6所示。
圖6 基于Elman神經(jīng)網(wǎng)絡(luò)的低頻序列預(yù)測
從圖6中可以看出,低頻序列的預(yù)測值和實際值基本吻合,在轉(zhuǎn)折點處誤差較大。
高頻序列代表波動項,它包含周期項和隨機(jī)項,在金融數(shù)據(jù)等實際的時間序列問題中,高頻信息成分常常就是隨機(jī)因素,可以認(rèn)為其對歷史數(shù)據(jù)不具有敏感性,因而使用傳統(tǒng)靜態(tài)BP神經(jīng)網(wǎng)絡(luò)分別對三個高頻序列進(jìn)行建模預(yù)測。仿真結(jié)果表明:高頻序列的預(yù)測結(jié)果和實際值吻合良好,文中不逐一列出。
4.4預(yù)測結(jié)果及比較分析
整合各層序列的預(yù)測結(jié)果,得到原始時間序列的預(yù)測值,預(yù)測結(jié)果如圖7所示。
為了驗證本文提出的基于小波分析的神經(jīng)網(wǎng)絡(luò)組合預(yù)測方法在預(yù)測精度方面的優(yōu)越性能,同時采用了傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)對原始序列進(jìn)行預(yù)測。預(yù)測結(jié)果如圖8所示。
圖7 基于小波分析的股票價格預(yù)測
圖8 基于BP神經(jīng)網(wǎng)絡(luò)的股票價格預(yù)測
由以上兩圖可以明顯看出基于小波分析的神經(jīng)網(wǎng)絡(luò)組合預(yù)測結(jié)果優(yōu)于BP神經(jīng)網(wǎng)絡(luò)的直接預(yù)測,前者不僅在數(shù)值上更接近實際值,而且在趨勢上更符合股票的實際漲跌情況,比如在第8、11和第14個交易日很好地糾正了BP神經(jīng)網(wǎng)絡(luò)預(yù)測趨勢相反的情況,這正是投資者更為關(guān)注的。
為了進(jìn)一步檢驗基于小波分析的神經(jīng)網(wǎng)絡(luò)組合預(yù)測模型的適用性和可靠性,根據(jù)3.4節(jié)誤差分析計算公式,將其預(yù)測結(jié)果和單一的BP神經(jīng)網(wǎng)絡(luò)模型的誤差評價指標(biāo)作對比分析,結(jié)果如表1所示。
表1 實驗誤差結(jié)果比較
對比可知,基于小波分析的神經(jīng)網(wǎng)絡(luò)模型的預(yù)測方法明顯優(yōu)于傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)模型。
5結(jié)語
由于股票價格序列中各種因素交織在一起,使得序列變得復(fù)雜,難以準(zhǔn)確預(yù)測。而小波分析的最大優(yōu)勢在于能將時間序列按不同尺度分解成不同的層次,這樣就可以根據(jù)不同層次序列的特點,分而治之,預(yù)測精度明顯提高。通過對滬深300指數(shù)進(jìn)行仿真預(yù)測,并與直接利用BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測效果進(jìn)行比較,表明本文提出的基于小波分析的神經(jīng)網(wǎng)絡(luò)預(yù)測模型是可行的,具有實際應(yīng)用價值。
參 考 文 獻(xiàn)
[1] 楊耀宇.基于支持向量機(jī)的滬深300指數(shù)預(yù)測研究[D].上海:上海師范大學(xué),2014.
YANG Yaoyu. Prediction of CSI 300 index based on support vector machine[D]. Shanghai: Shanghai Normal University,2014.
[2] CAO L Y, HONG Y G, FANG H P. Predicting chaotic time series with wavelet networks[J]. Physica D,1995,85(1/2):225-238.
[3] SHI Z W, HAN M. Support vector echo state machine for chaotic time series prediction[J]. IEEE Transactions on Neural Networks,2007,18(2):359-372.
[4] HAN M, XI J H, XU S G. Prediction of chaotic time series based on the recurrent predictor neural network[J]. IEEE Transactions on Signal Processing,2004,52(12):3409-3416.
[5] 馮興杰,孟欣.基于參數(shù)修正的BP改進(jìn)算法的股票價格預(yù)測[J]. International Conference on Services, Management and Engineering,2010.
FENG Xingjie, MENG Xin. Stock pirce prediction based on BP improved algorithm of parameter revision[J]. International Conference on Services, Management and Engineering,2010.
[6] 翁蘇駿,林熙.BP網(wǎng)絡(luò)、RBF網(wǎng)絡(luò)和Elman網(wǎng)絡(luò)在股價預(yù)測中的應(yīng)用[C]//中國智能自動化學(xué)術(shù)會議論文集,1999.
WENG Sujun, LIN Xi. The application of BP network, RBF nerwork and Elman network in stock price forecast[C]//China Intelligent Automation Conference Proceedings,1999.
[7] 趙煥平,張凌曉,楊新鋒.CAR-BPNN在股票價格預(yù)測中的應(yīng)用[J].計算機(jī)仿真,2012,29(1):348-351.
ZHAO Huangping, ZHANG Lingxiao, YANG Xinfeng. Application on Stock Price Prediction Based on CAR and BPNN[J]. Computer Simulation,2012,29(1):348-351.
[8] Mallat S G. Multi-frequency channel decom- positions of images and wavelet models[J]. IEEE Transactions on Acoustics, Speech and Signal Processing,1989,12:2091-2110.
[9] 王學(xué)武,譚得鍵.神經(jīng)網(wǎng)絡(luò)的應(yīng)用與發(fā)展趨勢[J].計算機(jī)工程與應(yīng)用,2003,39(3):98-100.
WANG Xuewu, TAN Dejian. Application and Developing Trends of Neural Network[J]. Computer Engineering and Application,2003,39(3):98-100.
[10] 黎志勇,李寧.基于小波的非平穩(wěn)時間序列預(yù)測方法研究[J].計算機(jī)工程與應(yīng)用,2014,50(10):38-43.LI Zhiyong, LI Ning. Research on non-stationary time series forecasting method based on wavelet[J]. Computer Engineering and Applications,2014,50(10):38-43.
Neural Network Stock Prediction Based on Wavelet Analysis
SUN Bingjie1TANG Rui1ZUO Yi2HUANG Minghe1
(1. College of Software, Jiangxi Normal University, Nanchang330022)(2. Jiangxi Provincial Administration Center of Innovation Foundation for Scientific Small-and-medium-sized Enterprises, Nanchang330046)
AbstractStock price prediction is current research hotspot. The stock market is a very complicated nonlinear dynamic system, the traditional time series forecasting merhods are difficult to reveal the inherent law, prediction results are often unsatisfactory. By using wavelet decomposed and reconstruction, the original non-stationary time series is decomposed into the time series components of different scales. According to their respective characteristics, the Elman neural network and BP neural network model are used to model and predict the coefficients of each layer, and the prediction value of the original time series is obtained by integrating the coefficients. The forecasting results of the CSI 300 index show that the forecasting accruacy of the neural network combination forecasting method based on wavelet decomposition is improved significantly than the traditional neural network forecasting method, which has the practical application value.
Key Wordswavelet decomposition and reconstruction, neural network, stock prediction, CSI 300 index
收稿日期:2015年12月7日,修回日期:2016年1月26日
作者簡介:孫冰潔,女,碩士研究生,研究方向:數(shù)據(jù)挖掘。唐瑞,男,碩士研究生,研究方向:數(shù)據(jù)挖掘,室內(nèi)定位。左毅,男,助理研究員,研究方向:數(shù)據(jù)挖掘。黃明和,男,碩士生導(dǎo)師,研究方向:數(shù)據(jù)挖掘,算法設(shè)計與分析。
中圖分類號TP391
DOI:10.3969/j.issn.1672-9722.2016.06.010