亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機(jī)器學(xué)習(xí)的股票趨勢(shì)預(yù)測(cè)方法研究

        2019-09-10 04:59:57黃敏健劉鈺萱
        現(xiàn)代鹽化工 2019年5期
        關(guān)鍵詞:機(jī)器學(xué)習(xí)

        黃敏健 劉鈺萱

        摘 ? 要:隨著我國(guó)經(jīng)濟(jì)制度和保障體制的不斷完善,越來(lái)越多的人投入到股票交易市場(chǎng)中,而在錯(cuò)綜復(fù)雜的股票市場(chǎng)中,根據(jù)股價(jià)趨勢(shì)選取最優(yōu)股并采取適當(dāng)?shù)慕灰撞呗?,是投資者和相關(guān)學(xué)者的討論中亟待解決的問(wèn)題,如何有效地對(duì)股票趨勢(shì)進(jìn)行預(yù)測(cè)成為研究領(lǐng)域的一個(gè)熱門(mén)。根據(jù)上市公司的股票數(shù)據(jù)和變化情況,運(yùn)用4種機(jī)器學(xué)習(xí)模型對(duì)股價(jià)進(jìn)行預(yù)測(cè),實(shí)驗(yàn)結(jié)果表明,各類(lèi)模型可以提高預(yù)測(cè)的準(zhǔn)確率,相較于K近鄰、邏輯回歸模型以及支持向量機(jī)模型,使用Tensorflow建立的模型各類(lèi)評(píng)價(jià)指標(biāo)上都表現(xiàn)出最好的預(yù)測(cè)結(jié)果。不同模型在結(jié)合金融投資特征適當(dāng)調(diào)整之后,預(yù)測(cè)準(zhǔn)確率有一定的提升。根據(jù)以上數(shù)據(jù)和分析,評(píng)價(jià)各種機(jī)器學(xué)習(xí)算法模型在股票趨勢(shì)預(yù)測(cè)方面的效用。

        關(guān)鍵詞:機(jī)器學(xué)習(xí);股票預(yù)測(cè);python

        隨著我國(guó)經(jīng)濟(jì)制度和保障體制的不斷完善,越來(lái)越多的人投入到股票交易的市場(chǎng)中,而在錯(cuò)綜復(fù)雜的股票市場(chǎng)中,根據(jù)股價(jià)趨勢(shì)選取最優(yōu)股并采取適當(dāng)?shù)慕灰撞呗裕峭顿Y者和相關(guān)學(xué)者的討論中亟待解決的問(wèn)題。

        盡管股票市場(chǎng)是一個(gè)非線性、非平穩(wěn)的系統(tǒng),但是相對(duì)穩(wěn)定條件下的股票市場(chǎng)依然存在一定的規(guī)律性。近年來(lái),隨著數(shù)理統(tǒng)計(jì)、概率論及神經(jīng)科學(xué)的發(fā)展融合,機(jī)器學(xué)習(xí)理論的日益完善,各類(lèi)機(jī)器學(xué)習(xí)的模型在股票預(yù)測(cè)領(lǐng)域也得到了廣泛的應(yīng)用。越來(lái)越多的人通過(guò)機(jī)器學(xué)習(xí)的方法實(shí)現(xiàn)對(duì)股票趨勢(shì)的預(yù)測(cè)。本文在sklearn框架下,分析清洗過(guò)后的股票歷史數(shù)據(jù),通過(guò)訓(xùn)練來(lái)得到可以預(yù)測(cè)股價(jià)的模型,在不同評(píng)測(cè)指標(biāo)下將預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,并針對(duì)模型的不足對(duì)模型結(jié)構(gòu)和參數(shù)進(jìn)行改良,將改進(jìn)前后的數(shù)據(jù)進(jìn)行對(duì)照并作出分析。

        1 ? ?相關(guān)技術(shù)和理論知識(shí)

        1.1 ?機(jī)器學(xué)習(xí)的基本方法

        機(jī)器學(xué)習(xí)通過(guò)研究計(jì)算機(jī)怎么模擬或?qū)崿F(xiàn)人類(lèi)的學(xué)習(xí)行為,以獲取新知識(shí)和技能,重新組織已有知識(shí)結(jié)構(gòu)使不斷改善自身性能。針對(duì)經(jīng)驗(yàn)E(Experience)和一系列任務(wù)T(Tasks)和一定表現(xiàn)的衡量P,如圖1所示,如果隨著經(jīng)驗(yàn)E的積累,針對(duì)定義好的任務(wù)T可以提高表現(xiàn)P,說(shuō)明計(jì)算機(jī)在過(guò)程中逐漸具備學(xué)習(xí)能力[1]。

        1.2 ?基于Python預(yù)測(cè)股票價(jià)格的模型

        1.2.1 ?K近鄰

        K近鄰(K-Nearest Neighbor,K-NN)通過(guò)計(jì)算測(cè)試對(duì)象和所有訓(xùn)練對(duì)象的距離,如式(1)所示,找出最近距離的k個(gè)對(duì)象中出現(xiàn)頻率最高的對(duì)象,通過(guò)其所屬類(lèi)別確定測(cè)試對(duì)象的類(lèi)別。

        1.2.2 ?邏輯回歸和支持向量機(jī)

        邏輯回歸(Logistics Regression,LP)模型為了線性擬合并且約束目標(biāo)值域,使用sigmoid函數(shù)作為邏輯回歸單元來(lái)進(jìn)行約束。數(shù)學(xué)模型如式(2):

        不同于使用均方誤差,為了達(dá)到盡可能使得曲線光滑以及盡可能使類(lèi)似于一元二次函數(shù)的目的,采用如式(3)代價(jià)函數(shù)進(jìn)行二分類(lèi),尋找全局最優(yōu)點(diǎn):

        即轉(zhuǎn)化為優(yōu)化交叉熵函數(shù),最小化損失的求解過(guò)程,如式(4)所示;支持向量機(jī)就是將向量進(jìn)行二分類(lèi)的算法。核心思想是使分開(kāi)的兩個(gè)類(lèi)別有最大間隔,使得分割具有更高的可信度。同為二元分類(lèi)器,SVM將股票指標(biāo)這樣線性不可分的數(shù)據(jù)投影至完美線性可分或基本線性可分的空間,從而將股價(jià)價(jià)格漲跌問(wèn)題轉(zhuǎn)化為漲跌分類(lèi)問(wèn)題。損失函數(shù)則構(gòu)合頁(yè)函數(shù)加上正則化項(xiàng)如式(5):

        1.2.3 ?TensorFlow與Keras

        對(duì)神經(jīng)網(wǎng)絡(luò)的建立,主要使用多層感知機(jī)(Multi-Layer Perceptron,MLP),包括輸入輸出層和隱層,其中,股票價(jià)格將被輸入到模型中,并且會(huì)使用特定權(quán)重值通過(guò)隱藏層向前送入以產(chǎn)生輸出。通過(guò)損失函數(shù)(Loss Function)來(lái)進(jìn)行評(píng)價(jià)和優(yōu)化,如式(6)所示:

        2 ? ?評(píng)價(jià)指標(biāo)

        2.1 ?部分回歸指標(biāo)

        回歸類(lèi)指標(biāo)中,y為預(yù)測(cè)的真實(shí)值,為預(yù)測(cè)值,在模擬的過(guò)程中,它們?cè)叫∧敲茨P皖A(yù)測(cè)的效果就越好,均方誤差(MSE)、均誤差(RMSE)和平均絕對(duì)誤差(MAE)如式(7)所示:

        2.2 ?部分分類(lèi)評(píng)價(jià)指標(biāo)

        查準(zhǔn)率(精準(zhǔn)率):Precision = TP÷(TP+FP)。

        查全率(召回率):Recall = TP÷(TP+FN)。

        正確率(準(zhǔn)確率):Accuracy=(TP+TN)÷(TP+FP+ TN+FN)。

        其中,TP—真正例,實(shí)際為正預(yù)測(cè)為正;FP—假正例,實(shí)際為負(fù)但預(yù)測(cè)為正;FN—假反例,實(shí)際為正但預(yù)測(cè)為負(fù);TN—真反例,實(shí)負(fù)預(yù)測(cè)。

        3 ? ?股票預(yù)測(cè)模型的構(gòu)建

        通過(guò)網(wǎng)絡(luò)爬蟲(chóng)獲取20只國(guó)內(nèi)上市公司股票的交易指標(biāo)和S&P 500 Index,也就是標(biāo)準(zhǔn)普爾500指數(shù),記錄了美國(guó)500家上市公司的股票指數(shù),其成分股由工業(yè)、運(yùn)輸業(yè)、公用事業(yè)和金融業(yè)股票組成。采樣面廣、代表性強(qiáng)。數(shù)據(jù)預(yù)處理環(huán)節(jié)如圖2所示。

        運(yùn)用理論部分監(jiān)督學(xué)習(xí)模型策略的知識(shí)對(duì)將對(duì)多支股票的交易特征分別進(jìn)行建模,預(yù)測(cè)漲跌趨勢(shì)。對(duì)于神經(jīng)網(wǎng)絡(luò)部分分別采用同步和異步預(yù)測(cè),同樣對(duì)價(jià)格趨勢(shì)進(jìn)行預(yù)測(cè)[2]。

        4 ? ?預(yù)測(cè)模型的實(shí)現(xiàn)

        4.1 ?傳統(tǒng)機(jī)器學(xué)習(xí)模型的實(shí)現(xiàn)

        4.2 ?TensorFlow的實(shí)現(xiàn)

        圖5為同步預(yù)測(cè),隨著訓(xùn)練次數(shù)增加,同步擬合的擬合率得分接近于0.98,各類(lèi)誤差指標(biāo)水平同樣較低,可以精準(zhǔn)地預(yù)測(cè)大盤(pán)價(jià)。盡管在精確度上表現(xiàn)良好,但是由于預(yù)測(cè)形式特殊,應(yīng)用于實(shí)際有一定困難。

        使調(diào)用歷史若干個(gè)時(shí)刻的股票指數(shù),通過(guò)神經(jīng)網(wǎng)絡(luò)循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)實(shí)際指數(shù)預(yù)測(cè)大盤(pán)指數(shù),結(jié)果如圖6所示。

        結(jié)果擬合程度較高,均方誤差為(0.10±0.05),測(cè)試集上為0.001 5。由于采用的是歷史價(jià)格,此方法更適合于用于實(shí)際預(yù)測(cè)。

        5 ? ?未來(lái)發(fā)展方向

        對(duì)股票交易的不同預(yù)測(cè)需求場(chǎng)景下對(duì)應(yīng)的指標(biāo)和方法選取需要有準(zhǔn)確的認(rèn)識(shí)?;貧w評(píng)價(jià)指標(biāo)和分類(lèi)評(píng)價(jià)指標(biāo)呈現(xiàn)出較大的差異性,因此,評(píng)價(jià)指標(biāo)和相應(yīng)機(jī)器學(xué)習(xí)方法的選取必須結(jié)合對(duì)股票預(yù)測(cè)的具體需求。如果策略更加偏向于準(zhǔn)確價(jià)格范圍預(yù)測(cè),由前文所述使用回歸評(píng)價(jià)指標(biāo),精度較高的可以有效地基于此比較誤差。此類(lèi)指標(biāo)的誤差均值對(duì)被評(píng)估數(shù)據(jù)的異常點(diǎn)(outliers)較敏感,如果交易指標(biāo)中有一些異常值出現(xiàn),會(huì)對(duì)以上指標(biāo)的值有較大影響,同時(shí)也對(duì)數(shù)據(jù)的清洗提出了更嚴(yán)格的要求。對(duì)于分類(lèi)評(píng)價(jià)指標(biāo),則更看重業(yè)務(wù)邏輯。對(duì)于傾向性問(wèn)題,如帶有感情色彩的策略制定,精度評(píng)價(jià)無(wú)法勝任;對(duì)于盈利虧損的接受程度,調(diào)整傾向決定了調(diào)整查全率、查準(zhǔn)率還是使用兼顧兩者的F1-Score的標(biāo)準(zhǔn),均能較好地適合期望穩(wěn)定收益的場(chǎng)景。AUC由于和概率的相對(duì)大?。ǜ怕逝判颍┯嘘P(guān),與絕對(duì)值無(wú)關(guān),不適合準(zhǔn)確價(jià)格的預(yù)測(cè)。因此更加適合非均衡(漲跌不均勻分布)時(shí)預(yù)測(cè),或基于趨勢(shì)選取交易策略的場(chǎng)景。

        6 ? ?結(jié)語(yǔ)

        從本文的相關(guān)研究發(fā)現(xiàn),機(jī)器學(xué)習(xí)算法可以通過(guò)一定范圍的指標(biāo)評(píng)估從而輔助交易策略。通過(guò)結(jié)合具體交易場(chǎng)景選取適當(dāng)?shù)膮?shù)和評(píng)價(jià)指標(biāo),則可以實(shí)現(xiàn)從價(jià)格趨勢(shì)的預(yù)測(cè)到實(shí)際收益提升的轉(zhuǎn)換。然而在實(shí)際環(huán)境中,模型預(yù)測(cè)的準(zhǔn)確率具有數(shù)據(jù)依賴(lài)性,無(wú)法訓(xùn)練一個(gè)模型適用于所有場(chǎng)景。一方面考慮到本文所取的股票樣本仍然不夠全面,且現(xiàn)實(shí)中的股票市場(chǎng)還有復(fù)雜的政治、經(jīng)濟(jì)因素會(huì)造成無(wú)法預(yù)估的影響,要得出具有泛化能力的模型,還需要對(duì)股票所屬產(chǎn)業(yè)和具體交易場(chǎng)景作進(jìn)一步的分類(lèi)和深入的調(diào)查,更加全面的數(shù)據(jù)分析和模型調(diào)整,將機(jī)器學(xué)習(xí)算法的思想和現(xiàn)實(shí)應(yīng)用更好地結(jié)合。

        [參考文獻(xiàn)]

        [1]傅航聰,張 ?偉.機(jī)器學(xué)習(xí)算法在股票走勢(shì)預(yù)測(cè)中的應(yīng)用[J].軟件導(dǎo)刊,2017,16(10):31-34,46.

        [2]文 ?成.基于機(jī)器學(xué)習(xí)方法的股票數(shù)據(jù)研究[D].重慶:重慶理工大學(xué),2011.

        猜你喜歡
        機(jī)器學(xué)習(xí)
        基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
        基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
        基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
        前綴字母為特征在維吾爾語(yǔ)文本情感分類(lèi)中的研究
        基于支持向量機(jī)的金融數(shù)據(jù)分析研究
        機(jī)器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
        国产亚洲精品成人aa片新蒲金| 亚洲人成在线播放a偷伦| 日韩精品极品免费观看| 国产在线一区二区三区香蕉| 免费在线观看亚洲视频| 亚洲av粉嫩性色av| 久久网站在线免费观看| 丝袜美腿国产一区二区| 成人国产激情自拍视频| 私人vps一夜爽毛片免费| 熟妇人妻av中文字幕老熟妇| 欧美日韩国产亚洲一区二区三区 | sm免费人成虐漫画网站| 日本强伦姧人妻一区二区| 末成年女a∨片一区二区| 国产suv精品一区二区69| 亚洲欧美v国产蜜芽tv| 日本高清一区二区在线播放| 麻豆精品国产av在线网址| 中文字幕久久熟女蜜桃| 丁香五月缴情综合网| 亚洲欧美日韩高清中文在线| 久久国产劲爆内射日本| 日本乱码一区二区三区在线观看| 精品人妻av区乱码| 人妻少妇精品视频一区二区三区 | 成人亚洲欧美久久久久| 国产精品农村妇女一区二区三区| 一区二区三区午夜视频在线| 国产无夜激无码av毛片| 国产成人vr精品a视频| 国产一级做a爱视频在线| 亚洲一区二区三区在线视频| 国产精品二区一区二区aⅴ污介绍| 久久国产热这里只有精品| 免费无码成人av在线播| 91精品国产综合久久青草| 在线人妻va中文字幕| 成年女人a级毛片免费观看| 69久久夜色精品国产69| 亚洲中文字幕精品一区二区|