黃秋萍,周 霞,甘宇健,韋 宇(廣西財經學院 信息與統(tǒng)計學院,廣西 南寧 530003)
SVM與神經網絡模型在股票預測中的應用研究*
黃秋萍,周霞,甘宇健,韋宇
(廣西財經學院 信息與統(tǒng)計學院,廣西南寧 530003)
介紹了SVM、BP神經網絡和小波神經網絡模型在股票預測中的應用研究。通過輸入歷史股票價格走勢數(shù)據(jù)進行模型訓練,并分別進行三個模型預測輸出,最后通過均方誤差、走勢方向準確率和總盈利率三個指標分析比較三個模型,從而了解模型在股票預測領域的應用效果,為后續(xù)研究做參考。
股票預測;SVM;神經網絡
如何準確地對股票進行預測一直是一個熱門的證券研究話題。在國內,張秀艷、徐立本基于神經網絡集成理論,建立股市預測模型,實驗分析表明,股市預測神經網絡集成系統(tǒng)具有更好的穩(wěn)健性和更好的應用價值[1]。近幾年來,SVM(Support Vector Machines)發(fā)展較快,國內研究人員開展了許多有效的研究工作,取得了良好的效果[2-3]。在國外,神經網絡、SVM等經常出現(xiàn)在股票識別、走勢預測的論文中。除此之外,神經網絡模型已在借貸評估、市場研究、金融預測等方面得到了應用,并顯示出巨大的生命力。
SVM對經驗的依賴較小,能夠獲得全局最優(yōu)解,具有良好的泛化性能,從而有效地克服了神經網絡等方法無法避免的局部極值問題。另外,SVM是專門針對有限樣本而設計的學習機,它采用結構風險最小化原則對經驗風險和學習機的復雜度進行控制,有效地避免過學習現(xiàn)象的產生,能獲得比傳統(tǒng)學習方法更優(yōu)良的泛化能力。在人工神經網絡的實際應用中,80%~90%的人工神經網絡模型采用的是BP(Back Propagation)神經網絡或它的變化形式,它是前饋網絡的核心部分,體現(xiàn)了神經網絡的精華,具有非線性映射能力、自學習和自適應能力、泛化能力以及容錯能力。小波神經網絡結合了神經網絡和小波分析的優(yōu)點,克服了二者各自應用于預測系統(tǒng)的不足,具有神經網絡的自適應、自學習和容錯性的優(yōu)點,同時可以充分利用小波的時頻局部化性質,學習過程只利用局部信息就可以大大提高小波神經網絡的訓練收斂速度。
結合上述三個模型的優(yōu)點,本文通過建立SVM、BP神經網絡和小波神經網絡模型預測上證指數(shù),通過分析這三個模型在相同訓練數(shù)據(jù)長度下的預測結果,對比分析三個模型的優(yōu)缺點,為后續(xù)相關研究做準備。
1.1SVM模型
支持向量機(SVM)以統(tǒng)計學習理論為理論基礎,是結構風險最大化的近似實現(xiàn)。它的主要思想是通過建立一個分類超平面作為決策曲面,最大化正例和反例之間的隔離邊緣。與多層感知器網絡和徑向基函數(shù)網絡一樣,SVM可用于模式分類和非線性回歸。在處理非線性問題時,運用一個核函數(shù)來代替高維空間中的內積運算,將非線性問題轉化為高維空間的線性運算問題。其中K為核函數(shù),其種類主要有:
(1)線性核函數(shù)
K(x,xi)=xTxi
(2)二層神經網絡核函數(shù)
K(x,xi)=tanh(γxTxi+r)
(3)徑向基函數(shù)
K(x,xi)=exp(-γ‖x·xi‖2),γ>0 (4)多項式核函數(shù)
K(x,xi)=(γxTxi+r)p,γ>0
SVM神經網絡進行回歸預測的目標函數(shù):
Y=f(x)=(ω·x)+b
其中,ω為權重,x為樣本輸入值,b為偏置(閾值)。
1.2BP神經網絡模型
誤差反傳神經網絡(BP神經網絡)是一種基于誤差反向傳播算法的多層前饋型神經網絡。它由輸入層、中間層和輸出層組成,中間層也稱為隱含層,可以是一層也可以是多層。它的基本原理是梯度最速下降法,通過誤差反向傳播來不斷調整網絡的權值和閾值,網絡的總誤差最小。
與一般的人工神經網絡一樣,構成BP神經網絡的神經元仍然是神經元。按照BP算法的要求,神經元所用的激活函數(shù)必須是處處可導,一般使用S型函數(shù)。對一個神經元來說,它的網絡輸入可表示為:
其中,x1,x2,…,xn為神經元的輸入,w1,w2,…,wn分別是它們對應的連接權值。該神經元的輸出為:
小波神經網絡是一種以BP神經網絡拓撲結構為基礎,以小波分析為理論,將小波基函數(shù)作為隱含層節(jié)點的傳遞函數(shù),信號前向傳播的同時誤差反向傳播的神經網絡[4]。小波神經網絡結合了小波分析和神經網絡的優(yōu)點,在一定程度上克服了二者各自應用于預測系統(tǒng)的不足,因此,將小波神經網絡應用于股價預測具有重要的理論意義和實際的應用價值。而小波分析是針對傅里葉變換的不足發(fā)展而來,它能夠通過小波基函數(shù)的變換分析信號的局部特征,并且在二維情況下具有信號方向選擇性能力,它的特點包括:
(1)時域都具有緊支集或近似緊支集;
(2)直流分量為0。
小波函數(shù)是將一個母小波函數(shù)經過平移與尺寸伸縮得到的,小波分析即把信號分解成一系列的小波函數(shù)的疊加。
小波變換是指把某一基本小波函數(shù)φ(t)平移τ后,再在不同尺度 a下與待分析的信號 x(t)做內積:
式中,τ和a為參數(shù),τ相當于使鏡頭相對于目標平移,a相當于使鏡頭向目標推進和遠離。
參考目前論文中出現(xiàn)頻率最高的 SVM、BP神經網絡和小波神經網絡股票預測模型,分別構建了3個6輸入、1輸出的股票預測模型[5-7]。輸入分別為:某日上證指數(shù)的開盤指數(shù)(價)、指數(shù)(股價)最高值、指數(shù)(股價)最低值、收盤指數(shù)(價)、交易量和交易額;輸出為輸入次日的收盤指數(shù)(價)。
在設計SVM模型時,選取不同的核函數(shù)對SVM模型性能的影響不大,但核函數(shù)的參數(shù)g和誤差懲罰因子c卻會嚴重影響SVM模型的泛化推廣性能,故針對核函數(shù)g和誤差懲罰因子c的參數(shù)選擇方法尤為重要。本文選擇交叉驗證的方式尋找最優(yōu)參數(shù),將樣本數(shù)據(jù)進行分組,一部分作為訓練集,另一部分作為驗證集,先用訓練集對學習機器進行訓練,再利用驗證集檢測訓練得到的模型[4]。
在設計BP神經網絡時,輸入層和輸出層的神經元數(shù)目由實際情況而定,在設計時應盡量減小系統(tǒng)的規(guī)模和復雜度,使模型運行的時間減小。另外,由于BP神經網絡是非線性的,初始權值的選取對于模型的學習效果是否能達到局部最小和能否收斂有密切的關系,因此初始權值選取的一個重要標準是使得初始權值在輸入累加時每個神經元的狀態(tài)值能接近于零。
小波神經網絡權值參數(shù)修正算法類似于BP神經網絡權值修正算法,采用梯度修正網絡的權值和小波基函數(shù)參數(shù),從而使小波神經網絡預測輸出不斷逼近期望輸出。三個模型的算法流程如圖1所示。
圖1 三個模型的算法流程
為了對比分析三個模型的預測效果,本文選擇三個指標評判模型的預測結果:均方誤差、走勢準確率和總盈利率。
均方誤差是衡量平均誤差的一種較為方便的方法,可以評價數(shù)據(jù)的變化。大多學者在評價神經網絡模型時,常用的評價指標是均方誤差。在數(shù)學理論中,均方誤差越小可以說明預測結果越好。其計算公式為:
其中,a為預測期望輸出值,b為預測輸出值,n為預測個數(shù)。
走勢方向準確率是指預測走勢方向和期望走勢方向相同的次數(shù)與總預測數(shù)之間的比值。走勢方向準確率可以反映一個模型的預測勝算率,在一些投資場合,投資者可能只關心明天是漲是跌,而不關心具體漲多少或跌多少。走勢方向準確率如果能超過70%,則說明預測10次,準確7次,這樣的預測模型將有非常高的直接使用價值。
總盈利率是投資者非常關心的指標,該指標反映模型在一定交易日內的盈利情況。股票預測模型能否指導投資產生穩(wěn)定客觀的正贏利,是評判預測模型效果的重要指標之一。
其計算公式為:
本文選取上證指數(shù) 2000年 2月15日~2014年7月25日共3 500個交易日數(shù)據(jù)作為模型數(shù)據(jù)源,從中劃分訓練和預測數(shù)據(jù),訓練數(shù)據(jù)和預測數(shù)據(jù)相鄰。分別進行訓練1 000個數(shù)據(jù)預測500個數(shù)據(jù);訓練3 000個數(shù)據(jù),預測500個數(shù)據(jù)的試驗,之后計算預測結果的均方誤差、走勢方向準確率、500個交易日的總盈利率,結果見表1和表2。
表1 訓練數(shù)據(jù)為1 000個的結果
表2 訓練數(shù)據(jù)為3 000個的結果
由以上二表可知,三個模型的均方誤差較低,與前人研究的結果相近[5-7]。三個模型預測的走勢方向準確率不高,準確率徘徊在50%附近??傆实谋憩F(xiàn)也較差,且不穩(wěn)定,這說明若直接使用三個模型的預測結果進行股票投資無法取得穩(wěn)定良好的收益。此外,從預測結果還能發(fā)現(xiàn),BP神經網絡和小波神經網絡的運行結果波動性大,隨機性較強,而SV M的結果較為穩(wěn)定。
本文通過建立 SVM、BP神經網絡和小波神經網絡三種模型分別對上證指數(shù)進行訓練及預測,通過均方誤差、走勢方向準確率和總盈利率三個指標分析比較三個模型,發(fā)現(xiàn)直接使用三個模型的預測結果進行股票投資無法取得穩(wěn)定良好的收益。在今后的工作中,會繼續(xù)深入研究股票預測問題,尋找一個基于神經網絡等人工智能方法的可穩(wěn)定盈利的股票預測模型。
[1]張秀艷,徐本立.基于神經網絡集成系統(tǒng)的股市預測模型[J].系統(tǒng)工程理論與實踐,2003,23(9):67-70.
[2]喻勝華,肖雨峰.基于信息?;椭С窒蛄繖C的股票價格預測[J].財經理論與實踐,20011,32(6):44-47.
[3]程硯秋.基于支持向量機的證券價格預測方法研究[D].大連:大連理工大學,2007.
[4]MATLAB中文論壇.MATLAB神經網絡30個案例分析[M].北京:北京航空航天大學出版社,2010.
[5]馮居易.BP神經網絡股票價格預測模型研究[D].西安:西安建筑科技大學,2008.
[6]張立霞,馬芳芳,葉德謙.基于支持向量機方法的金融時間序列研究[J].遼寧工業(yè)大學學報,2008,28(1):28-30.
[7]張海珍.小波神經網絡在股價預測中的應用[D].西安:西安科技大學,2008.
Application of SVM and neural network model in the stock prediction research
Huang Qiuping,Zhou Xia,Gan Yujian,Wei Yu
(School of Information and Statistics,Guangxi University of Finance and Economics,Nanning 530003,China)
This paper introduces the SVM,BP neural network and wavelet neural network model in the application of stock prediction research.The historical stock price data was input for the three models training and then they output predicted values. Finally,through the mean square error,the accuracy of tendency and the total of profitability as evaluation index to analysis and compare the three models,so as to know application effect in the field of stock prediction models and make reference for subsequent researches.
stock prediction;SVM;neural network
TP391.4
A
1674-7720(2015)05-0088-03
2014年廣西壯族自治區(qū)級大學生創(chuàng)新創(chuàng)業(yè)訓練計劃項目(201411548098)
(2014-10-01)
黃秋萍(1990-),女,在讀本科,主要研究方向:模式識別、統(tǒng)計建模。
周霞(1993-),女,在讀本科,主要研究方向:數(shù)理統(tǒng)計。
甘宇?。?986-),通信作者,男,碩士研究生,助教,主要研究方向:模式識別、金融量化投資,E-mail:vhdl@foxmail. com。