亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于DFS—BPSO—SVM的股票趨勢預(yù)測方法

        2018-01-09 13:37:07李輝趙玉涵
        軟件導(dǎo)刊 2017年12期
        關(guān)鍵詞:支持向量機(jī)

        李輝+趙玉涵

        摘要:技術(shù)指標(biāo)廣泛應(yīng)用于股票市場的預(yù)測分析,不同特征組合對預(yù)測效果產(chǎn)生不同影響。為了提高股票趨勢預(yù)測的準(zhǔn)確度,提出一種兩層特征選取及預(yù)測方法。第一層特征選取以特征子集區(qū)分度衡量準(zhǔn)則——DFS為評價(jià)標(biāo)準(zhǔn),第二層特征選取以分類器分類效果為評價(jià)準(zhǔn)則,兩層特征選取均采用二進(jìn)制粒子群(BPSO)算法對特征空間進(jìn)行搜索。通過第一層特征選取可以高效剔除部分非預(yù)測相關(guān)特征,在保留預(yù)測特征集信息的基礎(chǔ)上縮小特征集規(guī)模;第二層特征選取可以準(zhǔn)確選擇出具有較好預(yù)測效果的特征子集。實(shí)驗(yàn)數(shù)據(jù)為2015~2016年上海證券綜合指數(shù),結(jié)果表明,DFS-BPSO-SVM預(yù)測模型相比于其它4種特征選取及預(yù)測模型,具有更好的預(yù)測效果。

        關(guān)鍵詞:二進(jìn)制粒子群算法;支持向量機(jī);兩層特征選取;特征子集區(qū)分度衡量準(zhǔn)則;股票趨勢預(yù)測

        DOIDOI:10.11907/rjdk.171931

        中圖分類號:TP319

        文獻(xiàn)標(biāo)識碼:A 文章編號:1672-7800(2017)012-0147-05

        Abstract:Technical indicator was widely used in stock predicting. Different combination of indicator have an effect on predicting performance. In order to improve stock price trend predicting performance, this study proposes a new predicting model that is Binary Particle Swarm Optimization combined with Support Vector Machine and DFS criterion (DFS-BPSO-SVM) predicting model. Its a two step feature selection predicting model. In first step, DFS criterion is used for feature selection and we got suboptimal feature subset. After this process, redundant features have been removed and the scale of the feature set becomes smaller. In second step, BPSO-SVM is used for feature selection on suboptimal feature subset and we got best feature subset which leads to best stock trend predicting performance. Based on best feature subset, sample set is constructed for stock trend predicting. In this study, the target is to predict 2015-2016 Shanghai securities composite index daily movement. The experiment results indicate that DFS-BPSO-SVM predicting model have a better performance on stock price and index daily movement than another 4 predicting model.

        Key Words:binary particle swarm optimization; support vector machine; two step feature selection; DFS; stock trend predicting

        0 引言

        自從股票誕生之日起,關(guān)于股票價(jià)格預(yù)測的嘗試與研究從未停歇。每一位股票交易者都希望自己能夠準(zhǔn)確預(yù)測未來股票的價(jià)格,從而獲得超額收益。然而,股票市場具有復(fù)雜非線性、非平穩(wěn)、高噪聲等特性[1],股票預(yù)測一直以來都充滿了困難和挑戰(zhàn)。

        隨著機(jī)器學(xué)習(xí)技術(shù)的誕生與發(fā)展,越來越多機(jī)器學(xué)習(xí)方法應(yīng)用于股票趨勢預(yù)測研究,基于人工神經(jīng)網(wǎng)絡(luò)(ANN)[1,3]、支持向量機(jī)(SVM)[4]的智能預(yù)測方法相比于傳統(tǒng)預(yù)測方法普遍具有較好的預(yù)測效果。不少改進(jìn)算法也相繼應(yīng)用于股票趨勢預(yù)測,并取得了一定效果[2, 5]。雖然預(yù)測算法在不斷改進(jìn)和發(fā)展,但是預(yù)測算法性能的提升只是在具有特定輸入特征的數(shù)據(jù)集上相應(yīng)地提升了預(yù)測效果,一旦輸入特征改變,將可能直接影響預(yù)測準(zhǔn)確度。由于股票市場具有復(fù)雜多變的特征,使得單一預(yù)測方法越來越難以滿足建模預(yù)測的要求。

        針對這一問題,不少研究著眼于構(gòu)建組合模型進(jìn)行預(yù)測,即先通過特征選取方法選擇用于預(yù)測的最優(yōu)特征集,然后將選取的特征用于股票預(yù)測。張煒等[6]提出了一種將自適應(yīng)遺傳算法與粗糙集理論結(jié)合的特征選取方法,該方法考慮到特征之間和特征與預(yù)測結(jié)果之間的知識體系,選擇包含信息較多的特征組成特征子集,然而該方法在選取特征時(shí)沒有考慮到預(yù)測結(jié)果的實(shí)際貢獻(xiàn);Zhang等[7]提出了一種CFS(Causal Feature Selection)方法,分別結(jié)合神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、隨機(jī)森林、樸素貝葉斯、決策樹、線性回歸與PCA、CART、NoFS、Lasso方法進(jìn)行對比實(shí)驗(yàn),結(jié)果驗(yàn)證了CFS方法的有效性,但該特征選取方法也僅考慮到了特征與預(yù)測結(jié)果的因果聯(lián)系,同樣未考慮特征子集對于實(shí)際預(yù)測結(jié)果的貢獻(xiàn);張偉等[8]提出了一種遺傳算法結(jié)合支持向量機(jī)(GA-SVM)的股票預(yù)測模型,該方法以預(yù)測效果作為特征選擇依據(jù),通過GA搜尋最優(yōu)特征子集。雖然該方法充分考慮到實(shí)際預(yù)測結(jié)果對于特征選取的影響,但此方法進(jìn)行特征選取時(shí)效率較低,當(dāng)特征較多時(shí)比較費(fèi)時(shí)。endprint

        針對上述研究存在的問題,本文提出了一種基于兩層特征選取方法構(gòu)建的股票趨勢預(yù)測模型。進(jìn)行第一層特征選取時(shí),充分考慮到特征和特征子集對于分類貢獻(xiàn)的大小,采用DFS(Discernibility of Feature Subset)準(zhǔn)則[9]作為特征子集衡量度標(biāo)準(zhǔn),選擇出分類貢獻(xiàn)大的特征子集作為次優(yōu)特征子集;進(jìn)行第二層特征選取時(shí),充分考慮模型實(shí)際預(yù)測結(jié)果對于特征選取過程的影響,以SVM模型的預(yù)測準(zhǔn)確度作為評價(jià)標(biāo)準(zhǔn),在第一層選擇出的次優(yōu)特征子集基礎(chǔ)上選出最優(yōu)特征子集。為了加快次優(yōu)、最優(yōu)特征子集的搜尋過程,同時(shí)盡可能得到全局最優(yōu)特征子集,本文采用了一種隨機(jī)搜索算法——BPSO算法進(jìn)行優(yōu)化搜索。

        1 用于股票趨勢預(yù)測的特征子集評價(jià)準(zhǔn)則

        股票趨勢預(yù)測即是對股票未來的漲跌進(jìn)行預(yù)測,實(shí)質(zhì)為二分類預(yù)測。分類預(yù)測效果與預(yù)測特征集的優(yōu)劣存在很大關(guān)聯(lián),因此需要對預(yù)測特征進(jìn)行篩選。在特征選取時(shí),需要考察已有特征之間的相互聯(lián)系和對分類的重要性,選擇出既能減少冗余或不相關(guān)信息,同時(shí)又能突出分類能力的特征子集。本文提出的是一種兩層特征選取方法,首先分析特征集內(nèi)部特征數(shù)據(jù)對于分類貢獻(xiàn)的大小,選擇分類貢獻(xiàn)大的特征子集作為次優(yōu)特征子集,然后根據(jù)分類器的實(shí)際預(yù)測效果,在次優(yōu)特征子集中選擇出最優(yōu)特征子集。兩層特征選取方法可以在保證以分類效果為最終評判標(biāo)準(zhǔn)的條件下,通過對特征進(jìn)行預(yù)篩選,提高特征選取過程的效率和準(zhǔn)確性。

        特征子集評價(jià)準(zhǔn)則直接影響是否能夠找到用于預(yù)測的最優(yōu)特征子集。總結(jié)以往的研究發(fā)現(xiàn),衡量特征集內(nèi)部特征對于分類貢獻(xiàn)大小的常見評價(jià)標(biāo)準(zhǔn)有兩類,一類是將單個(gè)特征的分類能力大小進(jìn)行排序,選擇分類能力強(qiáng)的特征組成特征子集,典型算法有Relief、 Fisher等;另一類是綜合考慮特征之間的相關(guān)性和分類能力大小,選擇特征之間相關(guān)性小并且分類能力強(qiáng)的特征作為特征子集[9],典型準(zhǔn)則有CFS、DFS等。第一類準(zhǔn)則僅考慮了單個(gè)特征分類能力的大小,忽視了特征間相關(guān)性對特征子集分類能力大小的影響;第二類準(zhǔn)則中CFS更多考慮的是特征之間的兩兩相關(guān)性,而對多個(gè)特征之間相關(guān)性考慮不足,同時(shí)僅能應(yīng)用于離散數(shù)據(jù),對于非離散數(shù)據(jù)需要進(jìn)行離散化處理;DFS綜合考慮特征子集分類能力和多個(gè)特征之間的相關(guān)性,同時(shí)適用于非離散數(shù)據(jù)[9]。通過以上分析,本文采用DFS準(zhǔn)則作為第一層特征選取的評價(jià)準(zhǔn)則。

        1.1 DFS特征子集評價(jià)準(zhǔn)則

        3 基于DFS-BPSO-SVM的上證指數(shù)預(yù)測實(shí)驗(yàn)

        3.1 實(shí)驗(yàn)數(shù)據(jù)

        本文將股票預(yù)測分析中常用的49個(gè)技術(shù)指標(biāo)(AD,BIAS,CCI,CR,DIFF,EMA12/26,LWR,MACD,Momentum,RSI,SDMA,KDJ,VR,WDMA,BHR5/20/60,ARBR,AROON,ATR,BOLL,CMO,CV,DMA,DMI,PosDI,NegDI,ADX,AMA,MA,DPO,EMV,MAEM,F(xiàn)IV,MFI,MTM,NVI,PVI,OBV,PSY,ROC,RVI,TRIX,MATRIX,VHF,WAD,WMS,WVAD)作為預(yù)測特征(輸入變量),股票指數(shù)每日趨勢作為預(yù)測目標(biāo)(輸出變量)??紤]到股票交易中存在的各種稅費(fèi)和傭金,當(dāng)股票價(jià)格相較前一日上漲0.3%時(shí),標(biāo)記為“1”,反之標(biāo)記為“-1”。

        根據(jù)技術(shù)指標(biāo)構(gòu)造的49維特征量中每一維特征分量都具有不同的取值范圍,并且取值范圍差別很大。特征分量之間巨大的數(shù)量差異會導(dǎo)致學(xué)習(xí)算法的參數(shù)尋優(yōu)過程變得復(fù)雜,增加了時(shí)間成本,同時(shí)也會造成大值特征主導(dǎo)預(yù)測模型,降低模型預(yù)測性能的不利情況[10]。因此,本文采用公式(9)對特征量進(jìn)行歸一化處理,將每一維特征分量都轉(zhuǎn)換到區(qū)間[-1,1]。

        實(shí)驗(yàn)采用的數(shù)據(jù)為上證綜合指2015~2016年的相關(guān)交易數(shù)據(jù)和特征指標(biāo),總共263個(gè)樣本數(shù)據(jù)。將樣本集中80%的樣本作為特征選取樣本集Train,20%樣本作為測試集P。其中特征選取樣本集又分為訓(xùn)練集和測試集。

        3.2 實(shí)驗(yàn)設(shè)計(jì)

        為了驗(yàn)證本文提出的特征選取及預(yù)測方法的有效性,分別將主成份分析(PCA)、特征權(quán)重算法(Relief)、遺傳算法(GA)與SVM結(jié)合的特征選取預(yù)測模型與DFS-BPSO-SVM模型進(jìn)行對比實(shí)驗(yàn),同時(shí)將未進(jìn)行特征選取的SVM預(yù)測模型作為對比。

        實(shí)驗(yàn)環(huán)境為Matlab2015a, 使用LIBSVM進(jìn)行分類預(yù)測實(shí)驗(yàn),RBF函數(shù)作為SVM核函數(shù)。需要設(shè)置的SVM參數(shù)有C、γ,本實(shí)驗(yàn)采用5-折交叉驗(yàn)證方法確定預(yù)測模型參數(shù)。通過網(wǎng)格搜尋的方法確定最佳參數(shù)組合,搜尋范圍C∈[0.5,50],步長為0.5;γ∈[0.2,6],步長為0.2。在PCA-SVM模型中,本實(shí)驗(yàn)將主成份累計(jì)貢獻(xiàn)率∑ni=1αi閾值設(shè)置為95%,即選取協(xié)方差矩陣特征值貢獻(xiàn)之和達(dá)到95%的前n個(gè)貢獻(xiàn)大的特征;在Relief特征選取過程中,需要確定特征分類權(quán)重閾值,圖2為特征選取過程中特征的權(quán)重分布和統(tǒng)計(jì)信息。為了在保留特征集主要信息的同時(shí)縮減特征子集規(guī)模,本實(shí)驗(yàn)將特征權(quán)重閾值設(shè)置為2 000;使用GA-SVM模型進(jìn)行特征選取時(shí),將種群規(guī)模P設(shè)置為30,最大進(jìn)化代數(shù)G設(shè)置為100,變異率M設(shè)置為0.1,交叉率C設(shè)置為0.8,圖3為GA-SVM特征選取時(shí)特征子集適應(yīng)度值變化曲線;使用DNS-BPSO-SVM選取次優(yōu)特征子集時(shí),兩層特征選取過程中粒子群粒子數(shù)N均設(shè)置為30,最大迭代次數(shù)I均設(shè)置為50,粒子群速度更新公式參數(shù)c1=c2=2,圖4、圖5分別為DFS-BPSO-SVM模型進(jìn)行兩層特征選取時(shí),特征子集適應(yīng)度值變化曲線。

        3.3 實(shí)驗(yàn)結(jié)果分析

        本文采用5種特征選取及預(yù)測模型,在相同的實(shí)驗(yàn)環(huán)境下分別進(jìn)行實(shí)驗(yàn)。表2列出了每種方法所選特征數(shù)、特征選取耗時(shí)、所選特征子集在測試集上的平均預(yù)測精確度(Precision)和準(zhǔn)確度(Accuracy),以及訓(xùn)練集平均預(yù)測耗時(shí)。通過表2實(shí)驗(yàn)結(jié)果可知,未進(jìn)行特征選取的SVM預(yù)測模型精確度和準(zhǔn)確度在幾種方法中都是最差的,同時(shí)訓(xùn)練耗時(shí)最多;PCA-SVM模型的特征選取過程時(shí)間最短,endprint

        但預(yù)測精確度和準(zhǔn)確度均不如GA-SVM模型及DFS-BPSO-SVM模型;Relief模型訓(xùn)練耗時(shí)最短,但預(yù)測準(zhǔn)確度和精確度僅優(yōu)于未進(jìn)行特征選取的SVM模型;DFS-SVM為兩層特征選取中次優(yōu)特征子集對測試集的預(yù)測,可以看出DFS-SVM模型預(yù)測表現(xiàn)優(yōu)于Relief模型,稍優(yōu)于PCA-SVM模型;GA-SVM和DFS-BPSO-SVM預(yù)測模型均具有較高的預(yù)測準(zhǔn)確度和精確度,DFS-BPSO-SVM預(yù)測精確度高于GA-SVM,而預(yù)測準(zhǔn)確度稍遜于GA-SVM。綜合考慮預(yù)測精確度和準(zhǔn)確度,DFS-BPSO-SVM模型優(yōu)于GA-SVM模型。無論是GA-SVM模型還是DFS-BPSO-SVM模型,特征選取都耗時(shí)很長,這也是以預(yù)測效果為特征選取準(zhǔn)則方法共有的問題。然而,在股票預(yù)測過程中更加重視預(yù)測效果,因而特征選取耗時(shí)為次要因素。對比DFS-BPSO-SVM和GA-SVM的特征選取耗時(shí),DFS-BPSO-SVM明顯低于GA-SVM,這是因?yàn)镈FS-BPSO-SVM在第一層特征選取過程中,剔除了一些非預(yù)測相關(guān)特征,縮減了特征子集規(guī)模,使分類器在訓(xùn)練過程中耗時(shí)減少。同時(shí),BPSO具有較高精確度和較快的收斂速度,從而提高了特征子集優(yōu)化效率。本文提出的兩層特征選取方法在保證預(yù)測效果的同時(shí),提高了以分類效果為評價(jià)準(zhǔn)則的特征選取效率。

        4 結(jié)語

        本文提出了一種基于DFS-BPSO-SVM的股票趨勢預(yù)測方法。首先通過DFS-BPSO進(jìn)行第一層特征選取,得到次優(yōu)特征子集;然后通過BPSO-SVM進(jìn)行第二層特征選取,得到最優(yōu)特征子集;最后以選取出的最優(yōu)特征構(gòu)建樣本集,使用SVM進(jìn)行訓(xùn)練預(yù)測。對比常用的幾種特征選取及預(yù)測方法,實(shí)驗(yàn)結(jié)果表明,本文提出的DFS-BPSO-SVM股票趨勢預(yù)測模型具有較好的預(yù)測效果。該方法通過第一層特征選取,高效剔除了一些非預(yù)測相關(guān)特征,減少了冗余信息對股票趨勢預(yù)測的影響,同時(shí)縮減了特征規(guī)模;通過第二層特征選取得到最優(yōu)特征組合,提高了預(yù)測準(zhǔn)確率。當(dāng)預(yù)測特征較多時(shí),該方法具有較好的特征選取及預(yù)測效果,并兼具相對較高的運(yùn)行效率。

        參考文獻(xiàn):

        [1] REFENES A N, BURGESS A N,BENTZ Y. Neural networks in financial engineering: a study in methodology[J]. IEEE transactions on neural networks, 1997,8(6):1222-1267.

        [2] JIGAR PATEL,SAHIL SHAH,PRIYANK THAKKAR,et al. Predicting stock and stock price index movement using trend deterministic data preparation and machine learning techniques [J]. Expert Systems with Applications, 2015,42(1):259-268.

        [3] XIAOTIAN ZHU, HONG WANG, LI XU, et al. Predicting stock index increments by neural networks: the role of trading volume under different horizons [J]. Expert Systems with Applications, 2008,34(4):3043-3054.

        [4] KYOUNG-JAE KIM. Financial time series forecasting using support vector machines [J]. Neurocomputing, 2003,55(1-2):307-319.

        [5] CHI-JIE LU. Hybridizing nonlinear independent component analysis and support vector regression with particle swarm optimization for stock index forecasting [J]. Neural Computing & Application, 2013,23(7-8):2417-2427.

        [6] 張煒,范年柏,汪文佳.基于自適應(yīng)遺傳算法的股票預(yù)測模型研究[J].計(jì)算機(jī)工程與應(yīng)用,2015,51(4):254-259.

        [7] XIANGZHOU ZHANG, YONG HU, KANG XIE, et al. A causal feature selection algorithm for stock prediction modeling[J].Neurocomputing, 2014,142:48-59.

        [8] 張偉,李泓儀,蘭書梅,等.GA-SVM對上證綜指走勢的預(yù)測研究[J].東北師大學(xué)報(bào):自然科學(xué)版,2012,44(1):55-59.

        [9] 謝娟英,謝維信.基于特征子集區(qū)分度與支持向量機(jī)的特征選擇算法[J].計(jì)算機(jī)學(xué)報(bào),2014,37(8):1704-1717.

        [10] YAKUP KARA,MELEK ACAR BOYACIOGLU, OMER KAAN BAYKAN. Predicting direction of stock price index movement using artificial neural networks and support vector machines: the sample of the istanbul stock exchange[J]. Expert Systems with Applications, 2011,38(5):5311-5319.

        [11] KENNEDY J, EBERHART R C. Particle swarm optimization [C]. Proceedings of International Conference on Neutral Networks IV, 1995:1942-1948.

        [12] 劉全金,趙志敏,李穎新,等.基于近鄰信息和PSO算法的集成特征選取[J].電子學(xué)報(bào),2016,44(4):995-1002.

        [13] KENNEDY J, EBERHAR R. A discrete binary version of the particle swarm algorithm[C]. Proceeding of the World Multiconference on Systemics, Cybernetics and Informatics, Newjersy: Piscataway, 1997:4104-4109.

        (責(zé)任編輯:黃 ?。〆ndprint

        猜你喜歡
        支持向量機(jī)
        基于支持向量回歸機(jī)的電能質(zhì)量評估
        基于智能優(yōu)化算法選擇特征的網(wǎng)絡(luò)入侵檢測
        數(shù)據(jù)挖掘技術(shù)在電廠經(jīng)濟(jì)性分析系統(tǒng)中的應(yīng)用Q
        基于改進(jìn)支持向量機(jī)的船舶縱搖預(yù)報(bào)模型
        基于SVM的煙草銷售量預(yù)測
        動態(tài)場景中的視覺目標(biāo)識別方法分析
        論提高裝備故障預(yù)測準(zhǔn)確度的方法途徑
        基于熵技術(shù)的公共事業(yè)費(fèi)最優(yōu)組合預(yù)測
        基于支持向量機(jī)的金融數(shù)據(jù)分析研究
        管理類研究生支持向量機(jī)預(yù)測決策實(shí)驗(yàn)教學(xué)研究
        考試周刊(2016年53期)2016-07-15 09:08:21
        国产三级av在线精品| 亚洲精品乱码久久久久久蜜桃图片| 综合无码一区二区三区| 亚洲精品一二区| 秋霞国产av一区二区三区| 精品国产日韩亚洲一区在线| 国产精品国产高清国产专区| 欧美精品亚洲精品日韩专区| 风韵人妻丰满熟妇老熟| 80s国产成年女人毛片| 超碰97资源站| 黑人巨大videos极度另类| 久久久久亚洲精品美女| 久久精品国产亚洲不av麻豆| 免费人成黄页网站在线观看国内| 一本色道久久综合亚洲精品不| 黄色国产精品福利刺激午夜片| 精品国产一区二区三区2021| 日韩日韩日韩日韩日韩日韩| 色一情一乱一伦一区二区三区日本| 男受被做哭激烈娇喘gv视频| 国产在线不卡免费播放| 久久久亚洲精品蜜臀av| 亚洲伊人av天堂有码在线| 亚洲sm另类一区二区三区| 久久精品人人做人人爽电影蜜月| 最新欧美一级视频| 少妇我被躁爽到高潮在线影片| 国产中文字幕免费视频一区| 69国产成人精品午夜福中文| 亚洲av无码av男人的天堂| 中文字幕精品久久天堂一区| 欧美丝袜秘书在线一区| 女人天堂国产精品资源麻豆| 欧美拍拍视频免费大全| 精精国产xxxx视频在线播放| 成人亚洲性情网站www在线观看| 无码一区二区三区在| 精品国产亚洲人成在线观看| 精品国产一区二区三区18p| 风流老熟女一区二区三区|