亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于SARIMA和LSTM組合預(yù)測模型

        2020-05-15 05:19:28王若舟
        關(guān)鍵詞:可視化模型

        丁 銳 李 偉 王若舟

        (1.武漢郵電科學(xué)研究院 武漢 430074)(2.武漢烽火信息集成技術(shù)有限公司 武漢 430074)

        1 引言

        隨著我國經(jīng)濟(jì)的飛速增長,人們的生活越來越富裕,投資已經(jīng)成為一種常態(tài),股票的投資也成為人們關(guān)注的一個(gè)熱點(diǎn),其中股票價(jià)格的走勢成為股民們非常關(guān)心的問題。股票的走勢由于受到許多外界因素的影響,變化呈現(xiàn)出很復(fù)雜的趨勢,而且股票價(jià)格具有隨機(jī)性、季節(jié)性等特點(diǎn),因此研究出一種準(zhǔn)確率比較高的預(yù)測模型具有十分重要的現(xiàn)實(shí)意義[1]。

        SARIMA模型(季節(jié)求和自回歸移動(dòng)平均模型)對(duì)季節(jié)性的數(shù)據(jù)具有很精確的預(yù)測效果,這種線性預(yù)測可以很好地預(yù)測短期數(shù)據(jù),但是隨著預(yù)測時(shí)間的增長精確度也隨之降低[2]。LSTM(長短期記憶網(wǎng)絡(luò))是遞歸神經(jīng)網(wǎng)絡(luò)中一個(gè)優(yōu)秀的變種,非常適用于處理時(shí)間序列相關(guān)的問題,但是對(duì)于這種季節(jié)性波動(dòng)較大的數(shù)據(jù)預(yù)測結(jié)果并不是很好[3~4]。所以本文采用SARIMA和LSTM組合的方式來進(jìn)行時(shí)間序列的分析與預(yù)測,采用LSTM神經(jīng)網(wǎng)絡(luò)對(duì)SARIMA預(yù)測的數(shù)據(jù)進(jìn)行矯正,得到更加精確的預(yù)測結(jié)果。

        2 相關(guān)技術(shù)介紹

        2.1 SARIMA模型介紹

        SARIMA模型是時(shí)間序列預(yù)測主要方法之一,是主要針對(duì)具有季節(jié)性或周期性規(guī)律變化的時(shí)間序列[5]。SARIMA模型是在ARIMA模型的基礎(chǔ)上的一種對(duì)季節(jié)性或周期性數(shù)據(jù)的演化模型[6]。ARIMA模型是用來對(duì)平穩(wěn)時(shí)間序列進(jìn)行數(shù)據(jù)預(yù)測,所以必須對(duì)數(shù)據(jù)源進(jìn)行平穩(wěn)化處理,通過平穩(wěn)化處理的次數(shù)可以得到差分d和D的值,然后通過ACF(自相關(guān)函數(shù))和PACF(偏自相關(guān)函數(shù))圖形來判斷模型中的p,q和P,Q的值。p為自回歸階數(shù),q為移動(dòng)平均階數(shù),d為差分階數(shù),P,Q,D分別為季節(jié)求和自回歸移動(dòng)平均模型中的自回歸、移動(dòng)平均和差分的值,S為季節(jié)周期和循環(huán)長度[7~8]。季節(jié)求和自回歸移動(dòng)平均模型通用表達(dá)式為

        SARIMA建模分為幾步:1)首先將清理后的數(shù)據(jù)可視化,通過可視化后的時(shí)間序列折線圖進(jìn)行初步的平穩(wěn)性判斷。2)對(duì)非平穩(wěn)的數(shù)據(jù)進(jìn)行差分,直到差分后的數(shù)據(jù)為平穩(wěn)時(shí)間序列,此時(shí)差分的次數(shù)即為SARIMA模型中d和D的值。3)引入自相關(guān)系數(shù)和偏自相關(guān)系數(shù),使用python將自相關(guān)和偏自相關(guān)函數(shù)可視化,通過可視化的圖形是截尾還是拖尾來確定p和P、q和Q的值,如果自相關(guān)函數(shù)拖尾,偏自相關(guān)函數(shù)是截尾,通過可視化的階數(shù)確定p和P的值。如果自相關(guān)函數(shù)是截尾,偏自相關(guān)函數(shù)是拖尾,通過可視化階數(shù)確定q和Q的值。如果自相關(guān)函數(shù)和偏自相關(guān)函數(shù)都是拖尾,通過可視化階數(shù)可以確定p和P、q和Q的值。4)對(duì)季節(jié)性時(shí)間序列數(shù)據(jù)進(jìn)行分解,季節(jié)分解的主要方法包括平均發(fā)和移動(dòng)平均趨勢剔除法,最終來確定S的值。5)得到所有的參數(shù),對(duì)估計(jì)結(jié)果進(jìn)行校驗(yàn),使用參數(shù)估計(jì)對(duì)模型進(jìn)行校驗(yàn),確定最終模型[9]。

        2.2 LSTM神經(jīng)網(wǎng)絡(luò)模型介紹

        LSTM是一種RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))特殊類型,LSTM 由Hochreiter&Schmidhuber(1997)提出,并在近期被Alex Graves進(jìn)行了改良和推廣。LSTM在RNN的基礎(chǔ)上加入了3個(gè)cell,使得LSTM具有記憶功能,cell包含一個(gè)sigmoid神經(jīng)網(wǎng)絡(luò)層和一個(gè)pointwise乘法操作,sigmoid函數(shù)輸出0~1之間的數(shù)值,描述每個(gè)部分有多少量可以通過[10~11]。0代表“不許任何量通過”,1代表“允許任何量通過”。LSTM中的3個(gè)cell分別為“遺忘門”、“輸入門”和“輸出門”。遺忘門是用來決定是否丟棄信息的,sigmoid函數(shù)的輸出值決定前一個(gè)狀態(tài)的值是否丟棄,表達(dá)式為

        輸入門用來決定是否要保存新的信息,sig?moid函數(shù)決定什么值需要更新,然后一個(gè)tanh函數(shù)創(chuàng)建一個(gè)新的候選值向量(得到一個(gè)在-1與1之間的值)并與sigmoid函數(shù)的值相乘,最終會(huì)輸出我們確定輸出的那部分,表達(dá)式為

        輸出門用來決定輸出什么值,sigmoid函數(shù)將決定哪個(gè)部分將輸出出去,然后將之前的狀態(tài)與tanh函數(shù)進(jìn)行處理(得到一個(gè)在-1與1之間的值)與sigmoid函數(shù)的輸出相乘,最終我將輸出我們確定輸出的那部分,表達(dá)式為

        LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖如圖1所示。

        3 組合模型的設(shè)計(jì)

        3.1 基于SARIMA-LSTM組合模型設(shè)計(jì)

        整個(gè)組合模型主要分為以下幾個(gè)部分:數(shù)據(jù)的預(yù)處理、SARIMA模型預(yù)測、神經(jīng)網(wǎng)絡(luò)訓(xùn)練和SARIMA預(yù)測數(shù)據(jù)的矯正。組合模型的設(shè)計(jì)圖如圖2所示。

        圖2 組合模型設(shè)計(jì)圖

        3.2 組合模型原理

        單獨(dú)使用SARIMA模型預(yù)測的數(shù)據(jù)只能適用于短期預(yù)測,而LSTM模型預(yù)測容易受到季節(jié)因素的影響,所以提出一種組合模型預(yù)測。

        本文的設(shè)計(jì)思路主要是將股票數(shù)據(jù)先經(jīng)過SARIMA模型進(jìn)行初步預(yù)測,SARIMA模型預(yù)測的數(shù)據(jù)在短期內(nèi)準(zhǔn)確度比較高,并將一些季節(jié)或者周期因素考慮在內(nèi),具有一定的預(yù)測意義[12]。同時(shí)也將同樣的股票數(shù)據(jù)放入LSTM神經(jīng)網(wǎng)絡(luò)中,對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到一個(gè)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型。最后將SARIMA模型預(yù)測的數(shù)據(jù)放入到已經(jīng)訓(xùn)練好的LSTM神經(jīng)網(wǎng)絡(luò)中去,對(duì)SARIMA預(yù)測的數(shù)據(jù)進(jìn)行一個(gè)矯正。

        4 實(shí)驗(yàn)驗(yàn)證

        4.1 實(shí)驗(yàn)環(huán)境介紹

        本次實(shí)驗(yàn)使用Windows操作系統(tǒng),使用python編碼,IDE使用pycharm2017,其中SARIMA使用arima_model包實(shí)現(xiàn),LSTM則是使用tensorflow包來實(shí)現(xiàn)。

        4.2 實(shí)驗(yàn)數(shù)據(jù)處理

        本文數(shù)據(jù)來源為sz399001股票收盤的價(jià)格,選擇2013年1月到2014年2月的數(shù)據(jù)作為分析數(shù)據(jù),因?yàn)?013到2014年的股票數(shù)據(jù)外界影響因素小,包含季節(jié)性因素,所以本文選擇這兩年的數(shù)據(jù)作為數(shù)據(jù)源。將2013-01-01到2013-10-30的數(shù)據(jù)作為測試數(shù)據(jù),將2013-11-01到2014-01-18的數(shù)據(jù)作為預(yù)測數(shù)據(jù)。測試數(shù)據(jù)用來進(jìn)行對(duì)模型的訓(xùn)練,預(yù)測數(shù)據(jù)則是用來與模型預(yù)測的數(shù)據(jù)進(jìn)行對(duì)比分析,判斷模型預(yù)測的準(zhǔn)確度。

        4.3 SARIMA模型對(duì)數(shù)據(jù)的預(yù)測

        選取sz399001股票中2013年1月到2014年2月的數(shù)據(jù)作為分析數(shù)據(jù),將2013-01-01到2013-10-30的數(shù)據(jù)作為測試數(shù)據(jù),將2013-11-01到2014-01-18的數(shù)據(jù)作為預(yù)測數(shù)據(jù),SARIMA模型python預(yù)測圖如圖3所示。

        4.4 LSTM神經(jīng)網(wǎng)絡(luò)對(duì)原始數(shù)據(jù)進(jìn)行預(yù)測

        將之前選取的sz399001的股票數(shù)據(jù)分為訓(xùn)練集和測試集,使用Google的tensorflow深度學(xué)習(xí)框架構(gòu)建LSTM神經(jīng)網(wǎng)絡(luò)模型,將訓(xùn)練數(shù)據(jù)喂入LSTM中,對(duì)其進(jìn)行訓(xùn)練[13-15]。LSTM隱藏層我們選用10個(gè)節(jié)點(diǎn),7個(gè)輸入層,為的是將當(dāng)天的開盤價(jià)、收盤價(jià)、最高、最低、成交、變化、總價(jià)等因素都計(jì)入到預(yù)測中,提高預(yù)測的準(zhǔn)確性。LSTM神經(jīng)網(wǎng)絡(luò)py?thon預(yù)測圖如圖4所示。

        圖4 LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測圖

        由圖4可以看出灰色為預(yù)測的股票數(shù)據(jù),預(yù)測的趨勢基本上正確,并且也達(dá)到了長期預(yù)測的目的。LSTM神經(jīng)網(wǎng)絡(luò)訓(xùn)練300次預(yù)測丟失率如圖5所示。其中丟失率(loss)代表預(yù)測數(shù)據(jù)于實(shí)際數(shù)據(jù)差值的比例??梢钥闯鲇?xùn)練300次神經(jīng)網(wǎng)絡(luò)的丟失率已經(jīng)很低了。

        圖5 LSTM神經(jīng)網(wǎng)絡(luò)300次預(yù)測丟失率圖

        4.5 SARIMA與LATM組合預(yù)測

        還是選取sz399001股票中2013-01-01到2013-10-30的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)喂入LSTM神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,但是這次選擇SARIMA預(yù)測的數(shù)據(jù)作為測試的輸入數(shù)據(jù),輸出數(shù)據(jù)還是2013-11-01到2014-01-18的股票數(shù)據(jù)進(jìn)行預(yù)測,SARIMA-LSTM組合模型python預(yù)測圖如圖6所示。

        通過SARIMA-LSTM神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)預(yù)測圖可以看到,灰線與黑線的重合率越來越高。組合模型訓(xùn)練300次預(yù)測丟失率如圖7所示。

        圖6 SARIMA-LSTM組合模型預(yù)測圖

        圖7 組合模型300次預(yù)測丟失率圖

        由上圖可以看到此次預(yù)測的數(shù)據(jù)比前兩次的正確率有了一定的提高,準(zhǔn)確率提高了2個(gè)百分點(diǎn)??梢钥闯鼋M合模型的預(yù)測相比單個(gè)模型的預(yù)測具有一定程度的提高。

        5 結(jié)語

        本文通過實(shí)驗(yàn)表明SARIMA模型的短期預(yù)測準(zhǔn)確率比較高,但是隨著時(shí)間的推移,預(yù)測的結(jié)果與實(shí)際結(jié)果偏差較大,所以SARIMA模型不適合做長期預(yù)測。LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測丟失率穩(wěn)定到0.030,已經(jīng)可以應(yīng)用到股票數(shù)據(jù)的預(yù)測中。將SARIMA預(yù)測的數(shù)據(jù)放入到已經(jīng)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)中進(jìn)行矯正,預(yù)測丟失率穩(wěn)定在0.012,可以看出組合模型的正確率得到提升,預(yù)測也更加準(zhǔn)確。雖然SARIMA-LSTM預(yù)測提高了一定的準(zhǔn)確性,但是實(shí)際股票的趨勢會(huì)受到很多外界的因素影響,如宏觀經(jīng)濟(jì)因素、政治因素、法律因素等,所以對(duì)這種大的宏觀因素需要進(jìn)行進(jìn)一步的優(yōu)化。

        猜你喜歡
        可視化模型
        一半模型
        自然資源可視化決策系統(tǒng)
        北京測繪(2022年6期)2022-08-01 09:19:06
        思維可視化
        師道·教研(2022年1期)2022-03-12 05:46:47
        基于Power BI的油田注水運(yùn)行動(dòng)態(tài)分析與可視化展示
        云南化工(2021年8期)2021-12-21 06:37:54
        自然資源可視化決策系統(tǒng)
        北京測繪(2021年7期)2021-07-28 07:01:18
        重要模型『一線三等角』
        基于CGAL和OpenGL的海底地形三維可視化
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        “融評(píng)”:黨媒評(píng)論的可視化創(chuàng)新
        3D打印中的模型分割與打包
        五月天激情婷婷婷久久| 中文字幕有码人妻在线| 国产高清av在线播放| 亚洲欧美成人一区二区在线电影| 精品国产国产AV一区二区| 蜜桃视频色版在线观看| 日本淫片一区二区三区| 久久精品国产亚洲av久| 99精产国品一二三产品香蕉| 亚洲日韩区在线电影| 亚洲国产综合一区二区| 成午夜福利人试看120秒| 日韩av精品国产av精品| 久久亚洲AV成人一二三区| 亚洲av午夜福利一区二区国产| 99久久精品费精品国产一区二| 亚洲av无码国产精品色午夜洪| 亚洲最大成av人网站| 亚洲综合色视频在线免费观看| 精品国产午夜肉伦伦影院| 好屌草这里只有精品| 亚洲三区二区一区视频| 毛茸茸的女性外淫小视频| 粗大的内捧猛烈进出看视频| 国产mv在线天堂mv免费观看| bbbbbxxxxx欧美性| 久久伊人精品中文字幕有尤物| 国产人妖在线视频网站| 久久国产精品偷任你爽任你| 亚洲妓女综合网99| 日本变态网址中国字幕| 手机在线免费av资源网| 中文字幕在线亚洲日韩6页| 国产高清吃奶成免费视频网站| 国产高清大片一级黄色| 18国产精品白浆在线观看免费| 国产又黄又猛又粗又爽的a片动漫| 国产粉嫩嫩00在线正在播放| 青青草在线免费播放视频| 国产婷婷色综合av蜜臀av| 女的把腿张开男的猛戳出浆|