亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于GA-SVM的股指期貨預(yù)測研究

        2016-09-20 07:22:30張德江程習(xí)武梁元浩劉元梓四川大學(xué)計算機(jī)學(xué)院成都610065
        現(xiàn)代計算機(jī) 2016年7期

        張德江,程習(xí)武,梁元浩,劉元梓(四川大學(xué)計算機(jī)學(xué)院,成都 610065)

        ZHANG De-jiang,CHENG Xi-wu,LIANG Yuan-hao,LIU Yuan-zi(College of Computer Science,Sichuan University,Chengdu 610065)

        基于GA-SVM的股指期貨預(yù)測研究

        張德江,程習(xí)武,梁元浩,劉元梓
        (四川大學(xué)計算機(jī)學(xué)院,成都610065)

        0 引言

        股指期貨交易市場瞬息萬變,投資人希望達(dá)到效益最大化,而其首先必須做到的就是對預(yù)定交易時刻指數(shù)的準(zhǔn)確預(yù)測。但是目前大部分股指期貨預(yù)測存在以下一些不足:一是各項預(yù)測以股指期貨的技術(shù)指標(biāo)作為基礎(chǔ)數(shù)據(jù),脫離交易本身所產(chǎn)生的交易信息進(jìn)行預(yù)測;二是以反轉(zhuǎn)點(diǎn)等指標(biāo)作為預(yù)測目的,而不是直接對指數(shù)進(jìn)行預(yù)測;三是使用默認(rèn)參數(shù)的支持向量機(jī)對股指期貨指數(shù)進(jìn)行預(yù)測,效果不理想。

        針對以上若干問題,本文采用某證券期貨交易公司所提供的2010年4月16日至2014年3月4日的近3000萬條滬深300股指期貨成交明細(xì)數(shù)據(jù),在對大量交易信息進(jìn)行一系列數(shù)據(jù)處理后,使用GA-SVM進(jìn)行回歸預(yù)測研究。

        1 實驗設(shè)計思路

        本實驗的設(shè)計思路即為針對前文提出的幾大不足做出改進(jìn),一是輸入數(shù)據(jù)采用交易本身信息,如買賣價格,成交價格等;二是以股指期貨的指數(shù)作為預(yù)測的目標(biāo);三是對SVM進(jìn)行參數(shù)優(yōu)化,達(dá)到最優(yōu)預(yù)測。實驗設(shè)計思路如圖1所示。

        圖1 實驗流程圖

        2 實驗數(shù)據(jù)預(yù)處理

        2.1原始數(shù)據(jù)采集

        本文所采用的數(shù)據(jù)是由某證券公司提供的2010 年4月16日至2014年3月4日的滬深300股指期貨當(dāng)月合約TICK數(shù)據(jù),通常也被稱作股指期貨當(dāng)月合約成交明細(xì)數(shù)據(jù)。根據(jù)實驗的需求,對上述的原始數(shù)據(jù)集進(jìn)行了加工提取。選取每天最后一個TICK數(shù)據(jù),即每天15:15:00的第二個TICK數(shù)據(jù)作為一天的收盤情況。從2010年4月16日至2014年3月4日,共取得924條數(shù)據(jù)。如表1所示。

        成交價、當(dāng)前價:表示目前交易成交時刻的最新價格(在本數(shù)據(jù)集中,兩者相等)。其中,成交價即是所謂股指期貨的“指數(shù)”,也是本文預(yù)測的目標(biāo)。

        表1 日數(shù)據(jù)集樣例

        表2 交易數(shù)據(jù)

        買一量、賣一量:表示目前交易的掛單情況,單位為手。

        買一價、賣一價:表示完成對應(yīng)交易所需要支付的每手單價。

        成交量:表示持續(xù)至當(dāng)前時刻為止的成交總量。

        持倉量:表示買賣雙方未平合約的總量。持倉量能夠反映市場上看多看空力量的大小、變化,以及多空力量的更新情況。

        2.2輸入樣本選取

        在本文實驗數(shù)據(jù)集之中,共有10個維度的數(shù)據(jù)。其中,成交價是回歸預(yù)測的目標(biāo)變量。另外,對于日期與時間兩個維度的數(shù)據(jù),直接認(rèn)定它們與成交價呈不相關(guān)關(guān)系。當(dāng)前價與成交價完全相等,因此這個維度的信息也應(yīng)該排除。有效變量的維度縮小到6維。令:

        X=<買一價;買一量;賣一價;賣一量;成交量;持倉量>

        Y=<成交價>。

        因此回歸模型的基本形式為:

        <成交價>=f(<買一價;買一量;賣一價;賣一量;成交量;持倉量>)

        假設(shè)數(shù)據(jù)集的最小時間間隔為t,即對于原始數(shù)據(jù)集,對于日數(shù)據(jù)集,t的長度為一天。那么:

        對于模型Yt=f(Xt),顯然只具有數(shù)學(xué)上的意義。由于f的映射過程需要一定時間的消耗,所以該模型僅僅有“回歸”的作用,而起不到“預(yù)測”的效果。

        因此,一個有意義的回歸預(yù)測模型至少應(yīng)該滿足:

        Yt+k=f(Xt)(k>0),即可以通過t時刻的X值,給出t+ k時刻的Y值。

        在本文的實驗中取k=1,因此一條基本的有意義的數(shù)據(jù)樣本的格式應(yīng)該滿足:(<成交價>t+1,<買一價;買一量;賣一價;賣一量;成交量;持倉量>t),

        例如,對于以下兩條數(shù)據(jù)(如表2)。

        可以得到一條有意義的輸入數(shù)據(jù)為:

        表3 交易數(shù)據(jù)

        依此規(guī)則選取一定數(shù)量的數(shù)據(jù)樣本,就能構(gòu)成一個預(yù)測模型的訓(xùn)練集。

        2.3數(shù)據(jù)歸一化處理

        由于樣本中的各個維度的數(shù)據(jù)代表著不同的意義,每一維的數(shù)據(jù)帶有的量綱也各不相同,如果直接使用這類數(shù)據(jù),會導(dǎo)致與因變量在比例上相近的數(shù)據(jù)的影響因子變相加大,回歸預(yù)測出現(xiàn)偏差甚至錯誤。因此,需要對各維度數(shù)據(jù)進(jìn)行歸一化處理,將其統(tǒng)一到某個固定區(qū)間,消除量綱帶來的影響。本文采用最小-最大標(biāo)準(zhǔn)化(Min-Max Normalization)方法進(jìn)行標(biāo)準(zhǔn)化處理,這種標(biāo)準(zhǔn)化通過數(shù)據(jù)的線性變換,能夠把結(jié)果放縮到[a,b]的范圍。轉(zhuǎn)換公式表示如下:

        其中,x是初始輸入值,x*是轉(zhuǎn)換后的值,max、min分別對應(yīng)輸入樣本中的最大值與最小值。實驗對自變量X及因變量Y分別進(jìn)行歸一化處理:X的歸一化范圍為[-1,1];Y的歸一化范圍為[0,1]。自變量X歸一化后的部分?jǐn)?shù)據(jù)樣例如表4所示。

        2.4主城份分析

        主成分分析(Principal Component Analysis,PCA),是一種統(tǒng)計學(xué)上對數(shù)據(jù)進(jìn)行降維處理的常用方法。主成分分析通過將原來的數(shù)據(jù)向量按照一定計算規(guī)則重新組合為一組數(shù)量較少,并且相互之間獨(dú)立的幾個綜合指標(biāo)向量來替換原來的指標(biāo)向量,這些綜合指標(biāo)能夠反映原來數(shù)據(jù)所包含的主要信息。

        表4 自變量X的歸一化效果

        使用主成分分析對自變量進(jìn)行降維處理,能夠有效提升支持向量機(jī)的預(yù)測精度。主成分分析的算法過程如表5所示。

        表5 主成分分析算法流程

        此處以表1數(shù)據(jù)為例進(jìn)行主成分分析處理:

        (1)求得的協(xié)方差系數(shù)矩陣為:

        表6 協(xié)方差系數(shù)矩陣

        (2)各個成分的貢獻(xiàn)率分別為:

        成分一 0.510674、成分二 0.262372、成分三0.106219、成分四0.09159、成分五0.028825、成分六0.00032。

        (3)如圖2所示,原本6個維度的數(shù)據(jù)在主成分取得95%的情況下降低到4個維度。

        3 基于改進(jìn)GA-SVM的日數(shù)據(jù)集預(yù)測研究

        3.1遺傳算法綜述

        遺傳算法(Genetic Algorithms,GA),是源于人們對生物遺傳行為原理的研究。達(dá)爾文的進(jìn)化論、孟德爾的遺傳理論還有魏慈曼的物種選擇學(xué)說都對其產(chǎn)生起到了重要的借鑒意義。在近一百年到兩百年的時間里,人們將物種進(jìn)化論運(yùn)用到各個的領(lǐng)域,例如醫(yī)學(xué)、仿生學(xué)、機(jī)械工程、管理學(xué)、計算機(jī)等。二十世紀(jì)八十年代起,計算機(jī)領(lǐng)域的快速發(fā)展,多種類生物行為的智能研究如機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等開始步入欣欣向榮的發(fā)展時期,各學(xué)科的交叉應(yīng)用也越來越頻繁,這恰恰給遺傳算法的研究和應(yīng)用帶來了新的契機(jī)。1962年,密歇根大學(xué)的John Holland提出利用群體進(jìn)化的思想。他指出“新的種群應(yīng)基于當(dāng)前種群的有效性而產(chǎn)生”,同時也給出了遺傳算法中常用的一些概念,如使用交叉、復(fù)制、變異、選擇等。此后,J.D.Bagley與1967年在他的博士論文中首次提到“遺傳算法”一詞,該詞的用法也由此沿用至今。

        圖2 主成分分析成分圖

        3.2尋優(yōu)目標(biāo)確認(rèn)

        實驗說明,當(dāng)使用默認(rèn)參數(shù)的支持向量機(jī)對股指期貨指數(shù)進(jìn)行預(yù)測時,預(yù)測效果較差。為了獲得更合理的參數(shù),需要對參數(shù)進(jìn)行尋優(yōu)。參數(shù)尋優(yōu)最為簡單的方法即是通過暴力查找的方式,對參數(shù)的每一個可能值進(jìn)行嘗試。這種算法的弊端顯而易見,一是需要耗費(fèi)大量的尋優(yōu)時間;二是對于參數(shù)在取值范圍內(nèi)是連續(xù)值而非離散值的時候,不能覆蓋所有的參數(shù)取值情況。由于遺傳算法具有動態(tài)搜索的特性,能夠克服暴力查找的缺點(diǎn),此處使用遺傳算法對支持向量機(jī)的參數(shù)進(jìn)行尋優(yōu),構(gòu)建GA-SVM預(yù)測模型。

        對于RBF核函數(shù)所要尋優(yōu)的參數(shù)有c、g。Poly核函數(shù)的參數(shù)較為復(fù)雜,實際研究中經(jīng)常令d=3,r=1。剩余需要要尋優(yōu)的參數(shù)同為c、g。

        另外,參數(shù)ε對支持向量的個數(shù)有影響,支持向量的數(shù)量與預(yù)測模型有直接關(guān)系,因此,合理的尋優(yōu)辦法應(yīng)該把ε也納入尋優(yōu)范圍。綜上所述,參數(shù)尋優(yōu)的目標(biāo)為參數(shù)對(c、g、ε)。

        3.3結(jié)合參數(shù)尋優(yōu)的預(yù)測流程

        GA-SVM模型的預(yù)測流程如表7所示。

        表7 GA-SVM模型預(yù)測流程

        GA-SVM詳細(xì)流程圖如圖3所示。

        圖3 GA-SVM詳細(xì)流程圖

        3.4基于 GA-SVM 的參數(shù)尋優(yōu)及預(yù)測效果結(jié)果為:

        訓(xùn)練集MSE=0.000701,r2=0.986797;測試集MSE= 0.000295,r2=0.924759。

        圖4 遺傳算法尋優(yōu)過程

        ②Poly核函數(shù)

        使用Poly核函數(shù)尋優(yōu)得到的最佳參數(shù)對(c,g,ε)= (0.4167,0.1404,0.0112),在該參數(shù)條件下的預(yù)測結(jié)果為:

        訓(xùn)練集MSE=0.000908,r2=0.906647;測試集MSE= 0.000953,r2=0.883146。

        對于使用RBF核函數(shù)和Poly核函數(shù)的GA-SVM,其預(yù)測性能都達(dá)到了十分優(yōu)秀的水準(zhǔn),足以用于實際的預(yù)測。

        4 實驗結(jié)果與分析

        本次實驗得到的結(jié)果為:

        圖5 RBF核函數(shù)預(yù)測結(jié)果

        本實驗使用前述的日數(shù)據(jù)集進(jìn)行研究。將前800個數(shù)據(jù)作為訓(xùn)練集,后123個數(shù)據(jù)作為測試集。

        ①RBF核函數(shù):

        使用遺傳算法的尋優(yōu)過程如圖4所示。

        最終得到的最佳參數(shù)對(c,g,ε)=(2.7997,0.0673,0.0114),使用該參數(shù)對重新對訓(xùn)練集進(jìn)行并進(jìn)行預(yù)測,

        其中,步驟2的設(shè)置情況如下:

        ①遺傳算法:

        進(jìn)化代數(shù)=50,種群規(guī)模=20,交叉概率為0.7,變異概率為0.01,參數(shù)ε的范圍設(shè)置為[0,1]。

        前文對于c、g的范圍做過定性測試,以之為參考:

        對于RBF核函數(shù),參數(shù)c的范圍設(shè)置為[0,100],參數(shù)g的范圍設(shè)置為[0,100]。

        對于Poly核函數(shù),參數(shù)c的范圍設(shè)置為[0,10],參數(shù)g的范圍設(shè)置為[0,10]。

        適應(yīng)度函數(shù)fitness=MSE。

        ①預(yù)測精度:從工程角度看,GA-SVM在日數(shù)據(jù)集上的預(yù)測MSE達(dá)到了10-3的數(shù)量級,這是一個十分準(zhǔn)確的預(yù)測結(jié)果。完全可以用來進(jìn)行實際操作。

        ②算法時間效率:在訓(xùn)練樣本集容量為800,交叉驗證折數(shù)為5的情況下,遺傳算法耗費(fèi)的時間分別為459.2283秒(RBF核)和417.1579秒(Poly核)。

        圖5為預(yù)測效果示意圖,圖中藍(lán)色曲線為實際走勢,紅色曲線是根據(jù)預(yù)測算法計算后的預(yù)測曲線,從圖中可看出預(yù)測曲線與實際走勢基本一致,由于數(shù)據(jù)是隨機(jī)選取的,所以可以得出結(jié)論,在股指期貨的日數(shù)據(jù)集上,通過對原始交易數(shù)據(jù)的選取、歸一化、主成份分析等預(yù)處理手段,采用經(jīng)過遺傳算法優(yōu)化過參數(shù)的支持向量機(jī)對其進(jìn)行預(yù)測,可以得到較好的預(yù)測效果。

        [1]聞杰.滬深300股指期貨對我國股票市場的影響分析[J].企業(yè)導(dǎo)報,2014,(11):14-15.

        [2]羅文輝.力量天平傾斜 期指金額超現(xiàn)貨.第一財經(jīng)日報,2010.4,20.

        [3]陳艷,褚光磊.關(guān)聯(lián)規(guī)則挖掘算法在股票預(yù)測中的應(yīng)用研究——基于遺傳網(wǎng)絡(luò)規(guī)劃的方法[J].管理現(xiàn)代化,2014,34(3):13-15. DOI:10.3969/j.issn.1003-1154.2014.03.005.

        [4]Manish Kumar.Forecasting Stock Index Movement:A Comparison of Support Vector Machines and Random Forest[C].Indian Institute of Capital Markets 9th Capital Markets Conference Paper.

        [5]Dai S Y,Li N.Using SVM to Predict Stock Price Changes from Online Financial News[J].Mechatronics&Applied Mechanics,2012, 157-158:1586-1590.

        [6]Publishing S R.Stock Market Prediction Using Heat of Related Keywords on Micro Blog[J].Journal of Software Engineering&Applications,2013,(3):37-41.

        Quantitative Trading;SVM;Genetic Algorithm;Prediction

        Prediction of Stock Index Future s Based on GA-SVM

        1007-1423(2016)07-0026-05

        10.3969/j.issn.1007-1423.2016.07.006

        張德江(1985-),男,新疆烏魯木齊人,在讀碩士,助教,研究方向為計算金融

        程習(xí)武(1985-),男,湖北天門人,在讀碩士,助理工程師,研究方向為面向設(shè)計與制造的軟件工程

        梁元浩(1988-),男,福建廈門人,碩士,職員,研究方向為計算金融

        劉元梓(1984-),男,重慶人,在讀碩士,助理工程師,研究方向為信息安全

        2016-01-05

        2016-02-18

        ZHANG De-jiang,CHENG Xi-wu,LIANG Yuan-hao,LIU Yuan-zi
        (College of Computer Science,Sichuan University,Chengdu 610065)

        近幾年來,跨學(xué)科交叉融合日益發(fā)展,許多非金融業(yè)界的研究者也投入到證券預(yù)測之中,各種數(shù)學(xué)模型被用來進(jìn)行投資預(yù)測,其中尤其以機(jī)器學(xué)習(xí)方法應(yīng)用最為廣泛。將對滬深300的交易信息進(jìn)行數(shù)據(jù)加工,采用GA-SVM對股指期貨進(jìn)行交易預(yù)測,該方法能夠有效地對股指期貨日交易進(jìn)行預(yù)測。

        量化交易;支持向量機(jī);遺傳算法;預(yù)測

        In recent years,with the growing of interdisciplinary integration,many non-financial industry researchers also predict into stocks among various mathematical models are used for investment forecasts,which especially the most widely used machine learning methods.Uses CSI 300 index for data processing,the use of GA-SVM prediction model for stock index futures trading can effectively predict the date of the transaction.

        成熟妇女毛茸茸性视频| 伊香蕉大综综综合久久| 国产精品国产三级国产在线观| 色综合色综合久久综合频道| 国产风骚主播视频一区二区| 最新在线观看免费的a站国产| 久久精品免费中文字幕| 欧美放荡的少妇| 国产成年无码V片在线| 欧美激情精品久久999| 亚洲精品中文字幕91| 男女男精品视频网站免费看| 日本黄网站三级三级三级| 亚洲人成影院在线无码观看| 亚洲av套图一区二区| 亚洲女同恋av中文一区二区| 人妻少妇精品中文字幕av| 日本免费人成视频播放| 亚洲一区二区三区一站| 国产一区二区av在线免费观看| 欧美成人精品a∨在线观看| 午夜成人鲁丝片午夜精品| 伊人精品无码AV一区二区三区| 亚洲成av人片在久久性色av| 在线观看中文字幕二区| 377p日本欧洲亚洲大胆张筱雨| 亚洲红怡院| 少妇激情一区二区三区| av网站大全免费在线观看| 久久婷婷人人澡人人喊人人爽 | 亚洲人成影院在线无码观看| 女同性恋一区二区三区四区| 国产成人综合久久久久久| 四川少妇大战4黑人| 欧美成人精品福利在线视频| 中文日本强暴人妻另类视频 | 国产精品人妻一区二区三区四| 丰满岳乱妇在线观看中字无码 | 免费网站国产| 综合图区亚洲偷自拍熟女| 久久久精品中文字幕麻豆发布|