亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于SVR的股市預(yù)測(cè)與擇時(shí)研究

        2016-04-11 01:13:41
        關(guān)鍵詞:時(shí)間序列機(jī)器學(xué)習(xí)

        張 鵬

        (太原工業(yè)學(xué)院理學(xué)系, 山西 太原 030008)

        ?

        基于SVR的股市預(yù)測(cè)與擇時(shí)研究

        張鵬

        (太原工業(yè)學(xué)院理學(xué)系, 山西太原030008)

        [摘要]本文首先闡述支持向量回歸機(jī)原理,在此基礎(chǔ)上建立了SVR預(yù)測(cè)模型,以HS300指數(shù)數(shù)據(jù)為測(cè)試樣本,分析了SVR模型在時(shí)間序列預(yù)測(cè)問題中的優(yōu)勢(shì),并在此基礎(chǔ)上進(jìn)行了交易實(shí)驗(yàn).結(jié)果表明:支持向量回歸機(jī)適用于預(yù)測(cè)股市大盤的短期走勢(shì),并能夠得到比較好的預(yù)測(cè)效果.

        [關(guān)鍵詞]機(jī)器學(xué)習(xí);支持向量回歸機(jī);時(shí)間序列

        眾所周知,股票市場(chǎng)是非線性動(dòng)態(tài)的復(fù)雜系統(tǒng),利用傳統(tǒng)的線性時(shí)間序列分析方法(如ARMA、GARCH等)對(duì)其研究并不能得到理想效果,而近些年興起的機(jī)器學(xué)習(xí)算法在對(duì)非線性時(shí)間序列的分析中表現(xiàn)出極大優(yōu)勢(shì).作為在數(shù)據(jù)挖掘算法中較為成熟的支持向量機(jī)算法,其在很多領(lǐng)域均能成功處理非線性回歸(時(shí)間序列)和分類(判別)等諸多問題.

        1支持向量回歸機(jī)基本原理

        支持向量機(jī)算法(support vector machines,SVM)最初是解決模式識(shí)別、特征提取等問題,都屬于支持向量機(jī)分類(SVC)問題[1].由于它具有強(qiáng)泛化能力而被推廣應(yīng)用于解決預(yù)測(cè)類問題,稱為支持向量回歸機(jī)(SVR).該理論將回歸問題轉(zhuǎn)化為二次規(guī)劃(quadratic programming,QP)問題,屬于黑匣子理論.

        1.1支持向量機(jī)SVM的基本思想

        首先將低維線性不可分訓(xùn)練數(shù)據(jù)集通過核函數(shù)映射到一高維特征空間(稱為Hilbert空間);然后在特征空間進(jìn)行線性可分的分類或回歸,這樣高維空間輸出層上的線性回歸或分類就對(duì)應(yīng)著低維空間輸入層的非線性回歸或分類.大量理論已經(jīng)證明,隱藏層維數(shù)如果足夠高,支持向量機(jī)就能夠逼近任意的非線性關(guān)系,并且核函數(shù)的使用能減少隱層的高維所帶來的計(jì)算復(fù)雜性等一系列問題[2].

        該算法的基本原理即為在所有的超平面中搜索一個(gè)最優(yōu)分離面.該超平面不僅能準(zhǔn)確分類,還能使超平面兩側(cè)的間距達(dá)到最大化.

        1.2支持向量回歸機(jī)SVR

        利用支持向量機(jī)做回歸與做分類大體相同,區(qū)別在于:SVC的輸出變量是分類型,而SVR的輸出變量是連續(xù)型.SVC是通過最優(yōu)分離超平面使兩類樣本盡可能分開,而SVR是希望所有樣本點(diǎn)距離超平面的總偏差最小,由此看出SVR實(shí)質(zhì)上就是一個(gè)最優(yōu)規(guī)劃問題.

        1.2.1線性回歸情形

        s.t. f(xi)-yi≤ε+ξi

        ξi≥0,ξi′≥0,i=1,2,…,n

        其中C(大于0) 是對(duì)ε以外樣本的懲罰,故稱為懲罰參數(shù)[4];ξi,ξi′稱為松弛變量,表示訓(xùn)練樣本擬合誤差ε時(shí)的損失.

        根據(jù)Karush-Kuhn-Tucker條件[5],通過引入拉格朗日乘數(shù),上述問題就轉(zhuǎn)化為對(duì)偶問題(dual problem):

        αi′,αi∈[0,C],i,j=1,2,…,n

        1.2.2非線性回歸情形

        非線性回歸首先是通過核函數(shù)將低維非線性問題轉(zhuǎn)化為高維空間的線性問題,然后再利用線性回歸情形分析.

        αi′,αi∈[0,C].i,j=1,2,…,n

        目前該算法中常用的核函數(shù)有3種類型,分別為線性核、多項(xiàng)式核、高斯核,一般形式分別為

        2構(gòu)建SVR預(yù)測(cè)模型

        2.1建模前的準(zhǔn)備

        (1)數(shù)據(jù)的選取.由于時(shí)間序列的特殊性,數(shù)據(jù)的選取是建模前需考慮的一個(gè)重要問題,尤其不能選取特殊時(shí)段,這樣將會(huì)失去一般性.本文數(shù)據(jù)來源于wind資訊,原始數(shù)據(jù)指標(biāo)體系為滬深300指數(shù)2010年1月4日到2012年12月31日的收盤價(jià)等時(shí)間序列,如表1所示.相關(guān)指標(biāo)有基礎(chǔ)指標(biāo)的前5日收盤價(jià)、最高價(jià)、最低價(jià)、成交量的對(duì)數(shù),技術(shù)指標(biāo)MA(10)、KDJ、RSI、BIAS、WR、PSY共計(jì)14個(gè)因子.

        表1 數(shù)據(jù)集

        (2)滾動(dòng)預(yù)測(cè).為了能將最新的市場(chǎng)信息及時(shí)反映在模型中,并且消除市場(chǎng)周期性的影響,本文采用滾動(dòng)時(shí)間窗口進(jìn)行建模,又考慮到時(shí)間窗口最好不要超過一個(gè)交易年,故選取240個(gè)交易日作為時(shí)間窗口,即若當(dāng)前日期為T,則樣本期選為T-1到T-240,找到樣本期內(nèi)最優(yōu)參數(shù),進(jìn)而利用T日的數(shù)據(jù)預(yù)測(cè)T+1日的收盤價(jià).

        上述公式表示基于t時(shí)期的j步向前的價(jià)格預(yù)測(cè)值為給定t時(shí)期前所有信息的j步向前真實(shí)價(jià)格的期望值.這里,t=N1,…,N-j,且令j=1,…,5,也就是說,最短預(yù)測(cè)未來一天的收盤價(jià),最長預(yù)測(cè)5天的收盤價(jià)(如果t表示每日).可見,預(yù)測(cè)區(qū)間固定為j向前,而預(yù)測(cè)起點(diǎn)t擇時(shí)逐步向后推移,因而是動(dòng)態(tài)的.

        2.2建立SVR預(yù)測(cè)模型

        (1)數(shù)據(jù)清洗.本文采用Pearson相關(guān)性檢驗(yàn)對(duì)解釋變量進(jìn)行篩選.鑒于股市中的變量之間可能存在非線性關(guān)系,本文對(duì)原始數(shù)據(jù)不完全直接進(jìn)行Pearson檢驗(yàn),而對(duì)于線性不明顯的變量采取一些變換,最終確定因子備選庫中含有13個(gè)解釋變量,基礎(chǔ)指標(biāo)的前5日收盤價(jià)、最高價(jià)、最低價(jià)、成交量的對(duì)數(shù),技術(shù)指標(biāo)MA(10)、KDJ、RSI、BIAS、PSY共計(jì)13個(gè)因子.

        (2)數(shù)據(jù)標(biāo)準(zhǔn)化.為避免因?yàn)樽兞块g因數(shù)量級(jí)差別較大而造成模型預(yù)測(cè)誤差失真的現(xiàn)象,本文統(tǒng)一對(duì)數(shù)據(jù)采用極差標(biāo)準(zhǔn)化處理.

        (3)變量的優(yōu)化組合——主成分分析.如果要真實(shí)、完整地反映實(shí)際問題,往往需要很多變量以及樣本,而各個(gè)變量之間并非獨(dú)立的,它們之間或多或少存在相關(guān)性.這樣不僅使得研究變得復(fù)雜,還可能導(dǎo)致預(yù)測(cè)精度降低.本文運(yùn)用主成分分析法將規(guī)范化后的變量壓縮為少量幾個(gè)互不相關(guān)的變量,計(jì)算每日的13個(gè)指標(biāo)值,并對(duì)其運(yùn)用主成分分析.當(dāng)主成分個(gè)數(shù)為6個(gè)時(shí),累計(jì)方差貢獻(xiàn)率達(dá)到98.79﹪,包含信息的完整性程度較好,因而選取前6個(gè)主成分作為輸入變量.

        (4)核函數(shù)和有關(guān)參數(shù)的選擇.本文尋找最優(yōu)的C和ε的主要思想是:首先將C和ε界定在一定范圍以內(nèi)([2-6,26]),然后用交叉驗(yàn)證進(jìn)行搜索使得MSE達(dá)到最小.為了避免因?yàn)閼土P參數(shù)C太大引起過學(xué)習(xí),所以本文選擇的是具有最小C的組合C和ε.這樣可以在一定程度上利于外推.篩選結(jié)果為Gaussian核函數(shù),C和ε都是0.25.

        2.3結(jié)果分析

        經(jīng)過變量的篩選組合以及模型參數(shù)的選取最終完成模型的建立,并用2012年的數(shù)據(jù)進(jìn)行測(cè)試.SVR預(yù)測(cè)值與真實(shí)值及相對(duì)誤差比較結(jié)果如圖1、圖2所示.

        圖1 預(yù)測(cè)值與真實(shí)值對(duì)比

        圖2 SVR預(yù)測(cè)相對(duì)誤差

        從圖1可以看出,SVR的預(yù)測(cè)值基本靠近真實(shí)值.圖2顯示,預(yù)測(cè)值相對(duì)于真實(shí)值的誤差絕大多數(shù)在2﹪以內(nèi),說明本文建立的SVR預(yù)測(cè)模型是有效的.

        2.4構(gòu)建時(shí)隔一周交易日的預(yù)測(cè)模型

        假設(shè)當(dāng)前日為T日,本文以第T+1、T+2、T+3、T+4、T+5日的收盤價(jià)分別作為輸出變量構(gòu)建5個(gè)模型,仍然采取240個(gè)交易日為滾動(dòng)時(shí)間窗口,然后對(duì)這5個(gè)模型進(jìn)行比較,如表2所示.

        表2 五種預(yù)測(cè)結(jié)果與真實(shí)對(duì)比

        從表2看出,SVR擇時(shí)模型在T+1、T+2、T+3、T+4和T+5日5種情況下,都是對(duì)下跌的預(yù)測(cè)精度要高于上漲的.在1年的測(cè)試數(shù)據(jù)下,SVR擇時(shí)模型均能保持較高的準(zhǔn)確率,5種類型的預(yù)測(cè)中,對(duì)于下跌的預(yù)測(cè)準(zhǔn)確率均能保持在0.65以上,對(duì)于上漲的預(yù)測(cè)準(zhǔn)確率保持在0.6以上,對(duì)整個(gè)市場(chǎng)的預(yù)測(cè)則能保持在0.62以上.所以,該模型對(duì)預(yù)測(cè)HS300指數(shù)具有可行性.

        2.5模擬交易

        擇時(shí)本質(zhì)上是預(yù)測(cè),即在預(yù)測(cè)的基礎(chǔ)上做擇時(shí)策略.SVR模型預(yù)測(cè)的結(jié)果只是給出一個(gè)漲跌的信號(hào),然后在此基礎(chǔ)上選擇合適的時(shí)刻進(jìn)行交易.

        基于一般性的考慮,本文以HS300指數(shù)作為標(biāo)的資產(chǎn),在實(shí)際操作中,考慮到?jīng)_擊成本與交易成本,選擇T+5日作為實(shí)際的交易時(shí)間,指定如下交易規(guī)則:

        (1)如果預(yù)測(cè)標(biāo)的是上漲的記為1,相反下跌的記為-1;

        (2)如果預(yù)測(cè)為上漲,并在市場(chǎng)行情低于T日的收盤價(jià)時(shí)買入并持有;

        (3)如果漲幅超過2﹪(止盈點(diǎn))則賣出,否則到T+5日自動(dòng)平倉;

        (4)設(shè)定止損點(diǎn)為2﹪,即如果虧損2﹪則平倉.

        (5)對(duì)于反向操作——做空,2和3則采取相反的操作,其余亦同.

        這樣的交易規(guī)則可以避免因?yàn)楣墒械谋q或暴跌帶給人們一時(shí)的收益或損失,該操作進(jìn)行的是長期交易.圖3表示在2012-02-01至2012-12-31期間的按照上述策略進(jìn)行交易的累計(jì)凈值情況.

        圖3 2012年HS300和SVR擇時(shí)策略的累計(jì)凈值

        T+5日SVR擇時(shí)策略對(duì)HS300指數(shù)同時(shí)采用多空操作, 通過利用被動(dòng)掛單的方法, 只要價(jià)格達(dá)到合適的位置則選擇開倉,如果沒有達(dá)到開倉條件則繼續(xù)等待,如果開倉后價(jià)格沒有觸及止盈點(diǎn)或止損點(diǎn)則以最后時(shí)刻平倉.從圖3看出,從2012年2月1日至2012年12月31日,HS300凈值從1增長到1.054,而通過SVM擇時(shí)策略進(jìn)行交易,凈值從1增長到1.576.

        3結(jié)語

        本文所構(gòu)建的SVR預(yù)測(cè)模型創(chuàng)新點(diǎn)是采用滾動(dòng)預(yù)測(cè)方案,即不同于處理靜態(tài)數(shù)據(jù)那樣所采用的固定預(yù)測(cè)方案.該預(yù)測(cè)方案采用迭代估計(jì)而非一次性估計(jì)和預(yù)測(cè).

        [參考文獻(xiàn)]

        [1]ETHEM ALPAYDIN.機(jī)器學(xué)習(xí)導(dǎo)論[M].范明,昝紅英,牛常勇,譯.北京:機(jī)械工業(yè)出版社,2014.

        [2]KIM K J. Financial time series forecasting using vector machines[J]. Neurocomputing,2003 (55):307-319.

        [3]邊肇祺,張學(xué)工.模式識(shí)別[M].北京:清華大學(xué)出版社,2002.

        [4]田盛豐. 基于核函數(shù)的學(xué)習(xí)算法[J]. 北方交通大學(xué)學(xué)報(bào), 2003(2):1-8.

        [5]BURBIDGE R, TROTTER M, BUXTON B, et al. Drug design by machine learning: support vector machines for pharmaceutical data analysis[J].Computer and Chemistry, 2001(1):5-14.

        [6]TROTTER M W B, BUXTON B F, HOLDEN S B. Support vector machines in combinatorial chemistry[J]. Measurement and Control, 2001(8):235-239.

        (責(zé)任編輯穆剛)

        Research of forecasting and timing in stock market based on SVR

        ZHANG Peng

        (Science Department, Taiyuan Institute of Technology, Taiyuan Shanxi 030008, China)

        Abstract:This paper firstly expounds the principle of support vector regression machine, on the basis of which SVR forecasting model is established and then the advantages of SVR model are analyzed in time series prediction problem, regarding HS300 index as the test sample. Based on this, trading experiment is conducted to show that SVR is applicable to predict the short-term trends of stock market, and it can get a better prediction effect.

        Key words:machine learning; support vector regression; time series

        [中圖分類號(hào)]C812

        [文獻(xiàn)標(biāo)志碼]A

        [文章編號(hào)]1673-8004(2016)02-0148-04

        [作者簡介]張鵬(1989—),男,山西長治人,助教,碩士,主要從事數(shù)據(jù)分析、統(tǒng)計(jì)決策方面的研究.

        [收稿日期]2015-10-18

        猜你喜歡
        時(shí)間序列機(jī)器學(xué)習(xí)
        基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
        基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
        基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
        上證綜指收益率的影響因素分析
        基于指數(shù)平滑的電站設(shè)備故障時(shí)間序列預(yù)測(cè)研究
        基于時(shí)間序列的我國人均GDP分析與預(yù)測(cè)
        商(2016年32期)2016-11-24 16:20:57
        前綴字母為特征在維吾爾語文本情感分類中的研究
        基于線性散列索引的時(shí)間序列查詢方法研究
        軟件工程(2016年8期)2016-10-25 15:43:57
        基于支持向量機(jī)的金融數(shù)據(jù)分析研究
        機(jī)器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
        精品久久亚洲中文字幕| 看曰本女人大战黑人视频| 67194熟妇在线永久免费观看| 亚洲一区二区三区日本久久九| 国产片三级视频播放| 欧美片欧美日韩国产综合片| 国产高清大片一级黄色| 丝袜美腿在线观看视频| 国产精品内射久久一级二| 久久久亚洲精品一区二区三区| 天堂8中文在线最新版在线| 国产精品网站夜色| 亚洲国产日韩在线精品频道| 99久久精品国产一区色| 亚洲写真成人午夜亚洲美女| 国产成人精品亚洲日本在线观看| 中文字幕无码日韩专区免费| 99久久综合九九亚洲| 国产裸体AV久无码无遮挡| 亚洲精品99久91在线| 亚洲乱码中文字幕综合久久| 中国老太婆bb无套内射| 欧美日韩视频在线第一区| 亚洲av日韩aⅴ永久无码| 麻美由真中文字幕人妻| 国产精品黑丝美腿美臀| 久久亚洲av午夜福利精品一区| 欧美一区二区三区红桃小说| 无码天堂亚洲国产av麻豆| 国产av一区二区三区在线| av男人的天堂亚洲综合网| 欧美精品亚洲精品日韩专区| 中文字幕人妻中文av不卡专区| 日韩中文字幕一区二区高清| 亚洲AV无码久久久久调教| 国产三级不卡在线观看视频| 黄色av亚洲在线观看| 国产乱妇无码大片在线观看| 亚洲成av人片一区二区| 国产精品天天看大片特色视频| 亚洲自偷自拍另类第一页|