亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于主成分LSTM 模型在股票預(yù)測中的研究

        2021-03-22 04:28:20王霄鵬楊川東
        關(guān)鍵詞:原始數(shù)據(jù)特征值股票

        王 東,王霄鵬,楊川東

        (重慶理工大學(xué) 計算機科學(xué)與工程學(xué)院,重慶 400054)

        隨著我國經(jīng)濟的高速發(fā)展及人們經(jīng)濟意識的提高,理財行為逐漸成為廣大家庭實現(xiàn)資產(chǎn)增值的主流方法之一。股票作為一種無償還期限的有價證券,以其高風(fēng)險、高收益的特征成為許多家庭理財投資的首要選擇。因此,針對股市的波動特性及存在的特定規(guī)律進行合理分析從而正確預(yù)測出股市的走勢,對于國家和家庭都具有重要意義。

        一個良好的股票預(yù)測模型需要有較好的泛化能力,在模型的建立中,為了更加全面系統(tǒng)地分析問題,必須要考慮眾多指標。但過多的變量無疑會增加分析問題的難度與復(fù)雜性。股票各項基礎(chǔ)數(shù)據(jù)之間存在的相關(guān)性也使得數(shù)據(jù)所反映的信息會在一定程度上有部分重疊,并且不能很好地展現(xiàn)深層隱含的規(guī)律。針對此類問題,本研究在LSTM模型的基礎(chǔ)上結(jié)合對股票價格反應(yīng)更加敏感的相關(guān)技術(shù)指標,根據(jù)股票特性對模型進行改進,提高模型泛化性。并引入主成分分析法來提取出互不相干的幾項主成分,在最大程度保留原始數(shù)據(jù)信息的同時,用較少的主成分代替原來較多的變量作為訓(xùn)練模型的輸入數(shù)據(jù)。降低模型復(fù)雜度,提高學(xué)習(xí)速率。

        1 基于主成分分析的LSTM 模型

        1.1 獲取訓(xùn)練數(shù)據(jù)

        通過各大財經(jīng)網(wǎng)站的股票數(shù)據(jù)站以及python的tushare財經(jīng)數(shù)據(jù)接口包,獲取了所選股票的九項基礎(chǔ)數(shù)據(jù):開盤價、收盤價、最高價、最低價、前收盤價、漲跌額、漲跌幅度、成交量以及成交金額。如表1所示。將針對基礎(chǔ)數(shù)據(jù)計算得出的KDJ、MACD指標共同作為模型的訓(xùn)練數(shù)據(jù)。

        表1 股票基礎(chǔ)數(shù)據(jù)

        KDJ指標是一種反映敏感快速的技術(shù)分析指標,主要是利用股票價格波動的真實波幅來反映價格變化趨勢的強弱,可以在股價尚未上升或下降之前發(fā)出買賣信號。通過一段周期內(nèi)出現(xiàn)過的最高價、最低價、周期最后的收盤價及這三者之間的比例關(guān)系,計算出周期最后一天的未成熟隨機值RSV,然后根據(jù)滑動平均線的方法來計算K、D、J值。

        K值為RSV的n天移動平均值,由K值連接而成的K線又被稱為快線,在3條曲線中變化速度中等。D值為K值的n天的移動平均值,3條線中D線變化速度最慢,被稱為慢線。J值變化最快,作為輔助觀察K線與D線所發(fā)出的買賣信號,J線被稱為超快線或確認線。3條線在同一坐標上就組成了能反映價格波動趨勢的KDJ指標。

        式中:Cn為第n日的收盤價;Ln為n日內(nèi)的最低價;Hn為n日內(nèi)的最高價;Kp、Dp為前一日的K值和D值,若無,則都用50代替。

        MACD稱為異同移動平均線。由快慢2條均線的聚合與分離狀況代表市場趨勢的變化,也是股票的一項常用技術(shù)指標??焖倥c慢速的移動平均值EMA一般選擇12日與26日,由它們的離差值DIF與離差值的9日移動平均值DEA經(jīng)過計算最終得到MACD。

        式中:n為移動平均值的天數(shù);C為當日收盤價;PEMA與PDEA為前一日的EMA與DEA。

        1.2 利用主成分分析法將數(shù)據(jù)降維

        主成分分析法是將多個互相關(guān)聯(lián)的原始數(shù)據(jù)通過空間坐標旋轉(zhuǎn),不改變樣本數(shù)據(jù)結(jié)構(gòu)地轉(zhuǎn)化為少量且兩兩不相關(guān)的線性組合。在最大程度地反映原始數(shù)據(jù)的信息的同時,用較少的變量取代原來較多的變量,從而實現(xiàn)降維,將復(fù)雜的多維問題簡單化。

        提取主成分首先要將原始數(shù)據(jù)標準化,即減去對應(yīng)變量的均值再除以方差,以消除量綱不同的影響。

        特征值λi是各個主成分的方差。用來描述對應(yīng)特征向量方向上包含的信息量,也就是特征值的大小直接反映了各個主成分的影響力。將某一特征值除以所有特征值的和的值就得到了該特征向量的方差貢獻率。為第i個主成分的貢獻率為前i個主成分的累計貢獻率。根據(jù)主成分個數(shù)的選取規(guī)則,選取的主成分要求特征值都大于1且累計貢獻率達到一個較高的百分數(shù)以上(一般為大于85%)。保證選取的主成分中包含原始數(shù)據(jù)的大部分信息。

        最后計算主成分載荷值,并求得主成分得分值作為新的訓(xùn)練數(shù)據(jù)。

        1.3 使用LSTM 模型進行預(yù)測

        LSTM的全稱是長期短期記憶人工神經(jīng)網(wǎng)絡(luò),是一種時間遞歸神經(jīng)網(wǎng)絡(luò),適合于處理和預(yù)測時間序列中間隔和延遲相對較長的重要事件。它是循環(huán)神經(jīng)網(wǎng)絡(luò)的一個變種,LSTM在算法中比循環(huán)神經(jīng)網(wǎng)絡(luò)多了一個判斷信息有用與否的細胞結(jié)構(gòu),如圖1所示。

        圖1 LSTM細胞結(jié)構(gòu)

        LSTM在一個細胞中設(shè)置了3道門,分別是遺忘門、輸入門和輸出門。一個數(shù)據(jù)進入LSTM的網(wǎng)絡(luò)之后,會根據(jù)規(guī)則來判定該數(shù)據(jù)是否有用,符合算法規(guī)則的會留下,不符合的會通過遺忘門遺忘。只有符合算法認證的信息才會留下,不符的信息則通過遺忘門被遺忘。

        而后輸入門會更新細胞狀態(tài),首先通過sigmoid層確定需要更新的值,以及tanh層創(chuàng)建的候選值向量,兩者相乘就可以得到新的候選值。

        然后將舊的細胞狀態(tài)與遺忘門定義的丟棄信息相乘,再加上新的候選值就得到了更新之后的細胞。

        最后基于當前的細胞狀態(tài),由sigmoid層確定輸出部分,將其與tanh處理后的細胞狀態(tài)相乘,得到確定輸出的值。

        在LSTM模型中,模型可以選擇保留哪些內(nèi)容和忘記哪些內(nèi)容,以便模型分析那些與任務(wù)最相關(guān)的數(shù)據(jù)。LSTM模型還可以學(xué)習(xí)數(shù)據(jù)的更加抽象表示,以便模型學(xué)習(xí)數(shù)據(jù)更多的特征。這些特性使得LSTM模型應(yīng)用于股票中時,可以更有效地分析股票走勢。

        2 實例分析

        2.1 樣本和指標數(shù)據(jù)選取

        LSTM模型需要進行多次訓(xùn)練,最終建立一個更優(yōu)的模型。所以訓(xùn)練數(shù)據(jù)不僅要足夠,而且要更加契合訓(xùn)練目標,才能使模型的預(yù)測效果更加準確。為了數(shù)據(jù)具有代表性,本文中選取平安銀行000001.SZ從2002年1月21日到2018年5月18日每個開盤日共3 800個相關(guān)數(shù)據(jù)作為原始LSTM模型的建模數(shù)據(jù),包括開盤收盤價、每日最高最低價、前收盤價、漲跌額、漲跌幅度、成交量、成交金額等。

        在針對股票特性改進的S-LSTM模型中,對原始數(shù)據(jù)進行進一步處理,計算周期的未成熟隨機指標值RSV、DIF、DEA等,并將所得出的每日的KDJ、MACD等相關(guān)指標,共同作為訓(xùn)練數(shù)據(jù)。

        在S-LSTM模型基礎(chǔ)上結(jié)合主成分分析法提取出原始數(shù)據(jù)的主成分,將原始數(shù)據(jù)標準化后根據(jù)式(4)計算相關(guān)系數(shù)矩陣R,再解特征方程求得特征值與方差貢獻率如表2所示。根據(jù)方差貢獻率由大到小對變量進行排序。依照主成分選擇規(guī)則,前3個成分的特征值均大于1,且累計方差貢獻率達到了98%,故選擇前3個作為主成分。

        表2 特征值及貢獻率

        最后經(jīng)過計算得到前3個成分的成分載荷值,如表3所示。利用式(5)得到3個主成分得分值。將主成分得分值與KDJ、MACD等相關(guān)指標,共同作為訓(xùn)練數(shù)據(jù)來建立基于主成分的PCA-SLSTM模型。

        在原始LSTM模型、針對股票特性改進的SLSTM模型與基于主成分的PCA-S-LSTM模型中,均采用平安銀行000001.SZ從2018年5月21日到2019年3月14日,共200 d的相關(guān)數(shù)據(jù)作為測試集。

        表3 主成分載荷值

        2.2 確定訓(xùn)練參數(shù)

        將訓(xùn)練集的起止日期之間的每個工作日的相關(guān)數(shù)據(jù)作為輸入值,將第2天的收盤價格作為輸出值,通過模型來進行訓(xùn)練。原始模型的輸入值為開收盤價等基礎(chǔ)數(shù)據(jù),神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)定為:輸入層維度為12,輸出層維度為1,初始化學(xué)習(xí)速率0.000 06,訓(xùn)練時間步長為20,隱含層神經(jīng)元為25個。

        針對股票特性對模型進行改進,在基礎(chǔ)數(shù)據(jù)之上添加了處理計算后得到的KDJ,MACD指標共16個變量。故輸入層維度提高為16。并根據(jù)股票波動周期通常為1~2周的特點,如圖2所示,通過逐一測試改進訓(xùn)練時間步長為10。

        圖2 訓(xùn)練時間步長測試結(jié)果曲線

        針對過擬合問題,根據(jù)隱含層神經(jīng)元個數(shù)的經(jīng)驗公式(10),以及多次對比測試,確定隱含層神經(jīng)元為14個。

        式中:m為輸入層神經(jīng)元數(shù);n為輸出層神經(jīng)元數(shù);α為1~10的常數(shù)。

        基于主成分的LSTM模型中,在針對股票特性改進的基礎(chǔ)上,結(jié)合主成分分析法,將輸入層的維度降至10,并經(jīng)過反復(fù)測試后,調(diào)整隱含層神經(jīng)元為7個,其他參數(shù)與原始模型保持一致。

        2.3 仿真結(jié)果對比與分析

        將原始LSTM模型、針對股票特性改進的SLSTM模型與基于主成分的PCA-S-LSTM模型分別進行訓(xùn)練。在將三者都訓(xùn)練至loss=0.016的情況下,記錄每個模型的單次訓(xùn)練時間、總誤差值、平均誤差率以及誤差的標準差。模型的性能以及誤差如表4所示。可以看出:S-LSTM模型比起原始LSTM模型改變了輸入變量以及網(wǎng)絡(luò)結(jié)構(gòu),減少了誤差以及訓(xùn)練時間,預(yù)測效果也更加穩(wěn)定。

        表4 3種LSTM模型的性能及誤差

        以S-LSTM模型為基礎(chǔ),結(jié)合主成分分析法,在不改變輸入樣本數(shù)據(jù)結(jié)構(gòu)的基礎(chǔ)上實現(xiàn)降維,直接減少了輸入層的維度與隱含層節(jié)點數(shù),使網(wǎng)絡(luò)結(jié)構(gòu)更加精簡。將單次訓(xùn)練時間縮短了一半左右,由原本的0.171 s減至0.082 s,進一步提高了模型的學(xué)習(xí)速率。

        PCA-S-LSTM模型在預(yù)測精度方面也有所提升。將S-LSTM模型預(yù)測的誤差總值由71.48到49.26下降明顯,平均誤差率由原本的3.48%減少至2.43%。而且誤差的標準差也有所減少,預(yù)測誤差的離散程度變低說明預(yù)測效果更加穩(wěn)定。

        模型改進前后的預(yù)測曲線如圖3~5。圖中預(yù)測曲線與真實值曲線基本擬合,能夠反映股票整體走勢。對比圖3~5可以看出:基于主成分的PCA-S-LSTM模型預(yù)測值與真實值的偏差比原始模型有所減少,曲線擬合程度更高,結(jié)果更加準確。

        圖3 原始LSTM模型預(yù)測結(jié)果曲線

        圖4 S-LSTM模型預(yù)測結(jié)果曲線

        圖5 PCA-S-LSTM模型預(yù)測結(jié)果曲線

        在忽略交易手續(xù)費的情況下,盈利率計算公式為

        根據(jù)波浪理論,在預(yù)測曲線中取上漲趨勢中第2個波谷后向上突破頸線時為買入點,取下跌趨勢中第2個波峰作為賣出點。利用所取點日期的平安銀行真實收盤價進行盈利率計算,在測試集200 d中共得到9段交易,如表5所示。

        表5 交易詳情以及盈利率

        從盈利率可以看出階段性有盈有虧,但總體處于盈利狀態(tài),且受整體市場影響。在股票市場興旺向上,整體走高的時候盈利率較高,大部分時候處于比銀行利率略高的水平。預(yù)測效果結(jié)合實際操作結(jié)果可以接受,模型具有一定的實用價值。

        3 結(jié)論

        本研究使用改進后的LSTM模型對股票價格進行預(yù)測,引入股票相關(guān)技術(shù)指標,根據(jù)股票特性對模型進行調(diào)整,并利用主成分分析法提取出的主成分及計算后的數(shù)據(jù)作為新的訓(xùn)練樣本集。實現(xiàn)了提高樣本質(zhì)量,深度挖掘數(shù)據(jù)內(nèi)隱含的信息,增加模型對股票的專用性以及對模型輸入數(shù)據(jù)的降維處理,消除了輸入特征的相關(guān)性,減少了LSTM神經(jīng)網(wǎng)絡(luò)的輸入層數(shù),在提升輸入數(shù)據(jù)精簡度的同時,也簡化了整體網(wǎng)絡(luò)結(jié)構(gòu)。通過對比仿真結(jié)果,得出基于主成分分析的模型比原始模型預(yù)測效果更好。不僅預(yù)測精度有所提高,訓(xùn)練時間也大幅縮短,提高了神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)速率,并且使預(yù)測效果更加穩(wěn)定。由于股市走勢也受外界因素及其自身的不穩(wěn)定性的影響,雖然結(jié)果和真實值會有偏差,但是預(yù)測的總體趨勢一致。

        本研究雖然得出了初步的結(jié)論,但還存在一些問題:

        1)技術(shù)方法分析預(yù)測股價的基礎(chǔ)是道氏理論的3個假設(shè),一切技術(shù)方法都是以量價關(guān)系作為研究對象。

        2)股票市場復(fù)雜多變,除了相關(guān)指標數(shù)據(jù)之外,國際形勢、國家政策、行業(yè)發(fā)展以及人為干預(yù)等都是外界影響股票走勢的因素。

        3)量價指標反應(yīng)股市具有滯后性,模型不能及時預(yù)測突發(fā)事件。

        4)模型的泛用性還有待在更多數(shù)據(jù)集上進行測試。只有繼續(xù)研究,針對各個方向?qū)δP瓦M行優(yōu)化,才能進一步提高模型的精度與速度,實現(xiàn)更加準確的股票預(yù)測。

        猜你喜歡
        原始數(shù)據(jù)特征值股票
        GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
        一類帶強制位勢的p-Laplace特征值問題
        單圈圖關(guān)聯(lián)矩陣的特征值
        受特定變化趨勢限制的傳感器數(shù)據(jù)處理方法研究
        全新Mentor DRS360 平臺借助集中式原始數(shù)據(jù)融合及直接實時傳感技術(shù)實現(xiàn)5 級自動駕駛
        汽車零部件(2017年4期)2017-07-12 17:05:53
        本周創(chuàng)出今年以來新高的股票
        本周創(chuàng)出今年以來新高的股票
        本周連續(xù)上漲3天以上的股票
        近期連續(xù)漲、跌3天以上的股票
        基于商奇異值分解的一類二次特征值反問題
        亚洲av无码专区电影在线观看| 91成人国产九色在线观看 | 亚洲av五月天天堂网| 日韩av一区二区三区高清| 国内精品久久久久久久97牛牛 | 国产av黄色一区二区| 不卡日韩av在线播放| 台湾无码av一区二区三区| 午夜a福利| 亚洲av熟女天堂久久天堂| 男人吃奶摸下挵进去啪啪软件| 999久久久国产精品| 少妇厨房愉情理伦bd在线观看| 国产亚洲精品久久久久秋霞| 91精品国产高清久久久久| 青青久在线视频免费视频| 高潮潮喷奶水飞溅视频无码| 中文字幕亚洲欧美日韩在线不卡| 国产一区二区三区观看视频| 久久精品国产亚洲av高清三区| 中文字幕肉感巨大的乳专区| 国产综合色在线视频| 日本高清色一区二区三区| 最美女人体内射精一区二区| 九月婷婷人人澡人人添人人爽| 亚洲九九夜夜| 风流熟女一区二区三区| 亚洲国产av无码专区亚洲av| 亚洲区小说区图片区qvod伊| 日日麻批视频免费播放器| 蜜臀久久99精品久久久久久| 成人性生交片无码免费看| 成在线人免费无码高潮喷水 | 午夜精品久久久久久久99老熟妇| 日韩人妻精品无码一区二区三区| 亚洲无码观看a| 日韩人妻中文字幕高清在线| 亚洲精品无码久久久久秋霞| 日韩精品久久久中文字幕人妻| 高清少妇二区三区视频在线观看| 一本色道久久88综合日韩精品|