亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于組合神經(jīng)網(wǎng)絡模型的金融時序預測

        2023-01-16 12:46:12卜鈺家
        現(xiàn)代計算機 2022年22期
        關(guān)鍵詞:集上預測值殘差

        卜鈺家

        (澳門大學協(xié)同創(chuàng)新研究院,澳門 999078)

        0 引言

        股票價格預測是量化金融領域中的一個熱門課題,如何利用這些股票市場中海量交易數(shù)據(jù)來預測股票價格成為了研究熱點。以前研究股價預測問題時,常常選用的是單一模型,最開始使用ARIMA模型來進行股價預測[1-2],真實數(shù)據(jù)中包含著線性信息和非線性信息,但ARIMA 模型更多地只利用信息中的線性部分。隨著機器學習的發(fā)展,具有很好的非線性擬合能力的BP神經(jīng)網(wǎng)絡[3-4]和適合處理時間序列數(shù)據(jù)的LSTM 模型[5-6]也逐漸被應用在研究股價方面,學者也開始探究具有最好預測性的模型,但是單一的傳統(tǒng)模型總是難以兼顧精度和效率[7-8]。

        由于單一的模型不足以提取數(shù)據(jù)中的復雜關(guān)系,組合模型的概念開始被提出[9-10]。本文提出了BP-LSTM 模型和ARIMA-LSTM 模型,結(jié)合兩種單一模型的優(yōu)點,將數(shù)據(jù)中有效信息都描述出來,來提高預測結(jié)果的準確性。前者結(jié)合LSTM 模型處理時間序列的優(yōu)點和BP 模型優(yōu)秀的非線性映射能力和訓練時間段的優(yōu)點,后者結(jié)合LSTM 模型對非線性數(shù)據(jù)的極強處理能力和ARIMA模型有效提取數(shù)據(jù)中線性信息的能力。

        1 模型基本原理

        1.1 LSTM模型

        LSTM 模型在循環(huán)神經(jīng)網(wǎng)絡的基礎上進行改進,適用于從時間序列中提取時序特征,具有學習長期時間序列依存關(guān)系的能力。LSTM 模型主要規(guī)避了標準循環(huán)神經(jīng)網(wǎng)絡結(jié)構(gòu)中梯度爆炸和梯度消失問題,在其基礎上加入門控的概念,通過輸入門、遺忘門和輸出門對數(shù)據(jù)信息流動進行控制,因此,訓練速度也會更快。

        其中各個部分的解釋如下:

        (1)遺忘門ft:控制輸入量和上一層隱藏層輸出被遺忘的程度大小。

        (2)輸入門it:控制輸入量和當前計算的狀態(tài)更新到記憶單元的程度大小。

        (3)輸出門ot:決定需要輸出的部分。

        1.2 ARIMA模型

        ARIMA 模型全稱為差分整合移動平均自回歸模型,是一種對時間序列數(shù)據(jù)進行分析和預測的算法模型。ARIMA模型預測原理可簡括為:模型將時間序列數(shù)據(jù)默認為一組隨機序列,使非平穩(wěn)的數(shù)據(jù)經(jīng)過差分后趨于平穩(wěn),轉(zhuǎn)換為平穩(wěn)的時間序列,并對以往數(shù)據(jù)間的線性關(guān)系構(gòu)建模型,以預測數(shù)據(jù)未來值。

        1.3 BP神經(jīng)網(wǎng)絡模型

        BP 神經(jīng)網(wǎng)絡通常有三層或三層以上結(jié)構(gòu)。BP 神經(jīng)網(wǎng)絡包括輸入層、輸出層,以及一個或多個隱含層。圖2是一種三層BP神經(jīng)網(wǎng)絡結(jié)構(gòu)。BP 神經(jīng)網(wǎng)絡采用梯度下降法,通過反向傳播不斷調(diào)整網(wǎng)絡的權(quán)值和閾值,使網(wǎng)絡的實際輸出值和期望輸出值之間的均方誤差最小。其訓練過程包括輸入信號正向傳播和誤差信號反向傳播。這兩個過程循環(huán)進行,不斷計算輸出誤差和調(diào)整權(quán)值,直到均方誤差達到設定標準。

        圖1 LSTM模型的基本結(jié)構(gòu)圖

        圖2 BP神經(jīng)網(wǎng)絡模型的基本結(jié)構(gòu)圖

        1.4 BP-LSTM模型

        BP-LSTM 模型(見圖3)是混合模型,分為兩層,第一層采用BP 網(wǎng)絡;第二層采用LSTM模型。BP 神經(jīng)網(wǎng)絡結(jié)構(gòu)訓練速度快,能提高預測效率,但在處理時間序列上精度不如LSTM模型,BP 模型接受訓練集數(shù)據(jù)的輸入,通過梯度下降算法不斷修正權(quán)值和閾值,最后輸出預測結(jié)果和預測殘差,將殘差輸入到后端LSTM 模型中,LSTM 再對輸入進行訓練??梢蕴嵘W(wǎng)絡的非線性映射能力,同時避免過度擬合。最后得到股票的最終預測值是BP 神經(jīng)網(wǎng)絡的預測值加上LSTM修正的殘差值之和。

        圖3 BP-LSTM 組合模型的基本流程圖

        1.5 ARIMA-LSTM模型

        ARIMA-LSTM 模型(見圖4)是混合模型,分為兩層,第一層采用ARIMA 網(wǎng)絡;第二層采用LSTM 模型。ARIMA 模型只局限于預測數(shù)據(jù)的線性部分,而LSTM 神經(jīng)網(wǎng)絡模型更適合對數(shù)據(jù)的非線性部分信息進行提取,因此提出一種能夠提取數(shù)據(jù)線性及非線性特點的ARIMALSTM 混合模型對復雜的股票數(shù)據(jù)進行擬合。其思想是:通過ARIMA 模型建模提取股票數(shù)據(jù)存在的線性關(guān)系,充分利用時間序列上數(shù)據(jù)間的關(guān)聯(lián)性;根據(jù)自回歸差分平均模型可知殘差序列理應不呈現(xiàn)線性相關(guān),因此進一步利用LSTM 神經(jīng)網(wǎng)絡模型訓練修正殘差序列,再將修正后的殘差序列作為輸出。最終結(jié)合ARIMA 模型預測的線性部分和LSTM 模型對殘差的修正得到最終的股票預測值。

        圖4 ARIMA-LSTM 組合模型的基本流程圖

        2 數(shù)據(jù)表示和處理

        2.1 數(shù)據(jù)集選擇和特征選擇

        本文研究選擇了上證指數(shù)2017年1月3日到2022年7月4日共計1336 條股票數(shù)據(jù)作為數(shù)據(jù)集,來進行訓練和測試。將數(shù)據(jù)集的前80%作為訓練集,后20%作為測試集,即2017年1月3日到2021年7月1日的數(shù)據(jù)為訓練集,2021年7月2日到2022年7月4日的數(shù)據(jù)為測試集。本研究選擇了8個股票交易數(shù)據(jù),分別為最高價、最低價、開盤價、前收盤、漲跌額、漲跌幅、成交量和成交金額。

        2.2 數(shù)據(jù)預處理

        股票的各個交易指標具有不同的量綱和量綱單位,這容易影響數(shù)據(jù)分析的結(jié)果,為消除指標之間的量綱影響和提高模型的訓練效率,需要對數(shù)據(jù)進行標準化處理。本文采用最大最小標準化的方式處理數(shù)據(jù),標準化公式如式(1)所示:

        2.3 模型評估指標

        為了更好地評估模型的預測結(jié)果,本文選擇三個性能指標,均方誤差(Mean Square Error,MSE)、平均絕對誤差(Mean Absolute Error,MAE)和平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE),來評估和對比模型的預測能力。MSE是真實值與預測值的差值的平方然后求和平均;MAE揭示誤差絕對值的均值情況;MAPE是統(tǒng)計預測準確性的一種方法。以上三類誤差均是數(shù)值越小表示模型預測效果越好。方程如下所示:

        3 實證分析

        本文使用Python 語言來編程,深度學習框架Tensorflow 為后臺。組合神經(jīng)網(wǎng)絡模型,利用LSTM 優(yōu)化預測殘差,此處的LSTM 神經(jīng)網(wǎng)絡中引入Adam算法。

        3.1 LSTM模型

        圖5為在測試集上用LSTM 模型預測的值和真實值的對比圖。圖5顯示,LSTM 模型預測出的值和真實值有相似的整體趨勢,能夠反映出股價的局部變化。但可以看出預測值具有明顯的滯后性,并且精度不高。

        圖5 LSTM模型真實值與預測值

        3.2 BP神經(jīng)網(wǎng)絡模型

        圖6為在測試集上用BP 模型預測的值和真實值的對比圖。圖6顯示,BP 模型預測效果不太好。但在局部的一些位置可以反映出股票的發(fā)展趨勢,但是整體精度不夠,當股價急劇變化時,不具有敏感性。模型不能準確地預測出股價,但是符合股價的基本走勢,更適合用于預測股價的漲跌,而非具體的值。

        圖6 BP神經(jīng)網(wǎng)絡模型真實值與預測值

        3.3 構(gòu)建ARIMA模型

        圖7和圖8分別為上證指數(shù)的收盤價時序圖和一階差分圖。

        圖8 上證指數(shù)的收盤價的一階差分圖

        根據(jù)一階差分后股價序列的自相關(guān)和偏自相關(guān)圖,選取可能的ARIMA 模型進行參數(shù)顯著性、模型顯著性檢驗,選出針對上證指數(shù)的最優(yōu)模型——ARIMA(2,1,5)。圖9為在測試集上,用ARIMA(2,1,5)模型預測的值和真實值的對比圖。圖9顯示ARIMA(2,1,5)模型擬合結(jié)果與真實值高度接近。但存在滯后性的問題,并且在局部預測精度偏低。

        圖9 ARIMA(2,1,5)神經(jīng)網(wǎng)絡模型真實值與預測值

        3.4 構(gòu)建BP-LSTM模型

        圖10為在測試集上用BP-LSTM 模型預測的值和真實值的對比圖。圖10顯示,BP-LSTM 模型在一些峰值處呈現(xiàn)較大的誤差,說明BPLSTM 模型對于一些急劇變化過于敏感。但可以看出BP-LSTM模型預測效果優(yōu)于BP模型,首先BP-LSTM 模型的預測值更加貼近真實值,且預測值的走勢更符合真實值。

        圖10 BP-LSTM 組合模型的真實值與預測值

        3.5 構(gòu)建ARIMA-LSTM模型

        圖11為在測試集上用ARIMA-LSTM 模型預測的值和真實值的對比圖。圖11顯示,ARIMALSTM 模型預測效果優(yōu)于單一模型,結(jié)合了兩個模型的優(yōu)點,首先ARIMA-LSTM 模型的滯后性優(yōu)于ARIMA 模型,而且預測值更貼合真實值,這一點優(yōu)于LSTM模型。

        圖11 ARIMA-LSTM 組合模型的真實值與預測值

        4 實驗評估

        綜合對比以上五個模型的預測值和真實值的差異,可以得出ARIMA-LSTM 模型的預測效果最好,其次是ARIMA 模型,LSTM 模型,BPLSTM 模型,BP模型最差。

        由表1可知,這五種模型中ARIMA-BP 模型的MSE 和MAE 最小,說明在本文所選的數(shù)據(jù)集上ARIMA-LSTM 模型的預測效果最好,而BP模型的預測效果最差。對比BP 模型、BP-LSTM模型、ARIMA 模型和ARIMA-LSTM 模型可知,單一模型的預測效果沒有多模型組合的預測效果好,可能是因為單一模型對數(shù)據(jù)的有效性較低。ARIMA-LSTM 模型的MAPE 值最低,說明這個模型具有不錯的預測能力。

        表1 不同模型的評論指標

        5 結(jié)語

        本文選取了上證指數(shù)的1336 條數(shù)據(jù),通過建立LSTM、BP、ARIMA、BP-LSTM、ARIMALSTM 這五種神經(jīng)網(wǎng)絡模型,利用Python 語言實現(xiàn)對應算法,對數(shù)據(jù)集進行訓練分析和對比,探索組合神經(jīng)網(wǎng)絡模型是否優(yōu)于單一模型。從兩個方面來建立組合神經(jīng)網(wǎng)絡模型,BP-LSTM模型結(jié)合BP 網(wǎng)絡預測時間短和LSTM 模型精度高的優(yōu)點,利用BP 模型提取數(shù)據(jù)中的非時序信息,再用LSTM 模型提取數(shù)據(jù)中的時序信息。ARIMA-LSTM 模型結(jié)合ARIMA 模型有效讀取數(shù)據(jù)中線性信息和LSTM 適合提取數(shù)據(jù)中非線性信息的優(yōu)點。提出的兩種組合模型都是希望更高效地提取數(shù)據(jù)中的信息,實現(xiàn)更有效的預測,同時也是對股價預測的新的探索。本文得出ARIMA-LSTM 組合神經(jīng)網(wǎng)絡模型優(yōu)于單一模型,減少滯后性,同時在股價預測方面具有更高的準確度。BP-LSTM 組合模型優(yōu)于BP 模型,能預測股市的大概走勢,但是準確性并不高,并且在峰值處容易過度預測,更適合來做股價漲跌的預測。

        猜你喜歡
        集上預測值殘差
        IMF上調(diào)今年全球經(jīng)濟增長預期
        企業(yè)界(2024年8期)2024-07-05 10:59:04
        基于雙向GRU與殘差擬合的車輛跟馳建模
        加拿大農(nóng)業(yè)部下調(diào)2021/22年度油菜籽和小麥產(chǎn)量預測值
        ±800kV直流輸電工程合成電場夏季實測值與預測值比對分析
        基于殘差學習的自適應無人機目標跟蹤算法
        Cookie-Cutter集上的Gibbs測度
        法電再次修訂2020年核發(fā)電量預測值
        國外核新聞(2020年8期)2020-03-14 02:09:19
        鏈完備偏序集上廣義向量均衡問題解映射的保序性
        基于遞歸殘差網(wǎng)絡的圖像超分辨率重建
        自動化學報(2019年6期)2019-07-23 01:18:32
        復扇形指標集上的分布混沌
        中文字幕乱码亚洲精品一区| 亚洲人妻av在线播放| 久久狼人国产综合精品| 一本色道久久综合狠狠躁中文| 手机在线免费看av网站| 高清不卡av在线播放| 久久丝袜熟女av一区二区| 内射中出日韩无国产剧情| 成年女人黄小视频| 亚洲自偷自偷偷色无码中文| 国产WW久久久久久久久久| 亚洲中文字幕无码不卡电影| 国产av剧情精品麻豆| 亚洲人成网线在线播放va蜜芽| 麻豆国产原创视频在线播放| 日韩AVAV天堂AV在线| 我和丰满老女人性销魂| 亚洲精品av一区二区| 成人午夜福利视频| 久久久久久久女国产乱让韩| 中文字幕免费观看视频| 无码免费午夜福利片在线| 97激情在线视频五月天视频| 久久女人精品天堂av影院麻 | 国产福利酱国产一区二区| 欧美孕妇xxxx做受欧美88| 亚洲五月婷婷久久综合| 蜜臀av一区二区三区精品| 日韩精品中文一区二区三区在线| 宅男666在线永久免费观看| 四川丰满少妇被弄到高潮| 亚洲Va中文字幕无码毛片下载| 蜜桃久久综合一区二区| 四川丰满妇女毛片四川话| 911精品国产91久久久久| 丝袜美女美腿一区二区 | 97精品国产一区二区三区| 少妇极品熟妇人妻无码| 亚洲国产日韩综一区二区在性色 | 精品国产自拍在线视频| 一区二区三区中文字幕在线观看|