高欽姣 張勝剛 賈曉薇
【摘要】支持向量機(jī)(support vector machine, SVM)是數(shù)據(jù)挖掘中的一項(xiàng)新技術(shù),是借助于最優(yōu)化方法解決機(jī)器學(xué)習(xí)問題的新工具。 支持向量機(jī)目前主要用來解決分類問題(模式識別,判別分析)和回歸問題。而股市行為預(yù)測通常為預(yù)測股市數(shù)據(jù)的走勢和預(yù)測股市數(shù)據(jù)的未來數(shù)值。而當(dāng)我們將走勢看作兩種狀態(tài)(漲、跌),問題便轉(zhuǎn)化為分類問題,而預(yù)測股市未來的價(jià)格是指為典型的回歸問題。本文旨在于介紹預(yù)測股票價(jià)格走勢的SVM簡單預(yù)測模型。 該模型可以用來預(yù)測未來若干天股票價(jià)格的大體走勢,這對于股票投資可以起到很好的指導(dǎo)性作用。
【關(guān)鍵詞】支持向量機(jī) 股票價(jià)格預(yù)測 量化分析
【中圖分類號】G64 【文獻(xiàn)標(biāo)識碼】A 【文章編號】2095-3089(2016)10-0227-01
一、引言
隨著金融市場的逐步完善,證券交易所的交易量也在不斷的提升,預(yù)測未來一段時(shí)間內(nèi)的證券價(jià)格成為廣大投資者密切關(guān)注的問題,同時(shí)產(chǎn)生了許多優(yōu)秀的證券分析預(yù)測方法[1],如基本分析和技術(shù)分析(K線圖、移動(dòng)平均線和OBV線等)。然而這些方法從本質(zhì)上來講只是分析方法,其預(yù)測結(jié)果不很理想。近年來,國內(nèi)外學(xué)者紛紛采用人工神經(jīng)網(wǎng)絡(luò)[2]、支持向量機(jī)[3]等方法對證券交易數(shù)據(jù),特別是股票市場的數(shù)據(jù)進(jìn)行處理,試圖揭示證券交易數(shù)據(jù)背后所蘊(yùn)含的意義,并對其價(jià)格進(jìn)行預(yù)測。目前,國內(nèi)外關(guān)于證券價(jià)格預(yù)測的方法主要有證券投資分析法、時(shí)間序列分析法、人工神經(jīng)網(wǎng)絡(luò)法和支持向量機(jī)方法[4]等。
自2000年以來,國內(nèi)外對支持向量機(jī)的研究不斷地增加,SVM應(yīng)用于證券價(jià)格預(yù)測領(lǐng)域的優(yōu)勢可概括為:
(1)SVM具有堅(jiān)實(shí)的數(shù)學(xué)理論基礎(chǔ),是專門針對小樣本學(xué)習(xí)問題提出的。
(2)從本質(zhì)上講,SVM算法是一個(gè)凸二次規(guī)劃問題,可以保證得到的解是全局最優(yōu)解。
(3)SVM采用核函數(shù)方法,有效的解決了復(fù)雜計(jì)算問題。
(4)SVM應(yīng)用了結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,因而具有很好的推廣能力。
基于以上優(yōu)點(diǎn),我們可以相信SVM在證券價(jià)格預(yù)測領(lǐng)域?qū)⒃絹碓绞芡瞥纭?/p>
二、支持向量機(jī)簡介
支持向量機(jī)分類的目標(biāo)是能在某特征空間中學(xué)習(xí)到一個(gè)分類超平面,使得在這個(gè)空間中能夠?qū)?shù)據(jù)線性分開。支持向量機(jī)的研究最初是針對模式識別中的二類線性可分問題提出來的。由于股市的數(shù)據(jù)是非線性的,SVM對數(shù)據(jù)進(jìn)行非線性映射,通過映射?覬:X→F ,將數(shù)據(jù)映射到一個(gè)合適的特征空間F中,從而使數(shù)據(jù)線性可分,然后在F中構(gòu)造最優(yōu)超平面。由于優(yōu)化函數(shù)和分類函數(shù)都涉及樣本空間的內(nèi)積運(yùn)算, 因此在變換后的高維特征空間E中需進(jìn)行內(nèi)積運(yùn)算<?覬(xi),?覬(xj)>,根據(jù)滿足Mercer定理,對應(yīng)線性變換空間中的內(nèi)積,<?覬(xi),?覬(xj)>=k(xi,xj)。采用適當(dāng)?shù)暮撕瘮?shù)k(xi,xj),就能代替向高維空間中的非線性映射,實(shí)現(xiàn)非線性變換后的線性分類。
三、支持向量機(jī)在股票價(jià)格預(yù)測中的應(yīng)用
(1)支持向量機(jī)核函數(shù)的選取問題
支持向量機(jī)方法是將數(shù)據(jù)映射到一個(gè)Hilbert特征空間中,然后在此特征空間中對數(shù)據(jù)進(jìn)行處理,數(shù)據(jù)分類時(shí)選擇合適的核函數(shù)非常重要。目前的方法大部分是使用一種徑向基函數(shù)Guass核函數(shù),同樣可以作為核函數(shù)的還有徑向基函數(shù)吳函數(shù)和Wendland函數(shù),在對徑向基函數(shù)和Guass核函數(shù)做了充分研究的基礎(chǔ)上,對支持向量機(jī)中的核函數(shù)可以進(jìn)行分析和改進(jìn)。
(2)將改進(jìn)的分類方法應(yīng)用到股票價(jià)格預(yù)測中
將分類方法應(yīng)用到股票價(jià)格預(yù)測中時(shí),要面臨以下問題: 一是變量的選取問題, 我們希望在選擇盡量少的向量的基礎(chǔ)上達(dá)到做好的預(yù)測效果。 二是變量的處理問題, 目的是不能出現(xiàn)向量被覆蓋的問題。
四、總結(jié)
隨著非線性理論、統(tǒng)計(jì)學(xué)、系統(tǒng)論、信息論、控制論和人工智能技術(shù)的空前發(fā)展,證券價(jià)格預(yù)測也開辟了新思路。支持向量機(jī)作為一種新的機(jī)器學(xué)習(xí)方法,它基于嚴(yán)格完備的數(shù)學(xué)理論,引入結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,可以得到全局最優(yōu)解,解決了陷入局部極小點(diǎn)的問題,利用支持向量機(jī)對證券時(shí)間序列進(jìn)行預(yù)測是目前金融預(yù)測領(lǐng)域的最好方法之一。
參考文獻(xiàn):
[1]彭麗芳, 孟志青, 姜華等.基于時(shí)間序列的支持向量機(jī)在股票預(yù)測中的應(yīng)用[J].計(jì)算技術(shù)與自動(dòng)化,2006, 25(3):88-91.
[2]彭望蜀.基于BP神經(jīng)網(wǎng)絡(luò)與支持向量機(jī)的股票指數(shù)預(yù)測模型比較[J]. 南方金融, 2013(1):71-72.
[3]克里斯蒂亞尼尼.支持向量機(jī)導(dǎo)論[M].電子工業(yè)出版社, 2004.
[4]劉道文, 樊明智.基于支持向量機(jī)股票價(jià)格指數(shù)建模及預(yù)測[J].統(tǒng)計(jì)與決策, 2013(2):76-78.
作者簡介:
高欽姣(1986.9—),女,山東日照人,博士,講師,研究方向:應(yīng)用數(shù)學(xué)。