吳昌友,裴均珂,叢 敏
(山東工商學(xué)院 管理科學(xué)與工程學(xué)院,山東 煙臺(tái) 264005)
由于股票交易市場(chǎng)存在巨大的潛在利潤(rùn)空間,人們嘗試尋找準(zhǔn)確預(yù)測(cè)股票價(jià)格變化趨勢(shì)的方法和投資策略以從股票市場(chǎng)獲得最大收益[1-4]。準(zhǔn)確預(yù)測(cè)未來(lái)股市的走向,不僅有利于單個(gè)投資者從初始資本中獲得回報(bào),還能為企業(yè)未來(lái)的業(yè)務(wù)調(diào)整提供適當(dāng)?shù)男盘?hào)。此外,準(zhǔn)確的股市預(yù)測(cè)也有助于政府研究即將到來(lái)的經(jīng)濟(jì)形勢(shì),并為任何可能的經(jīng)濟(jì)衰退做好更充分的準(zhǔn)備。早期學(xué)者們針對(duì)股票價(jià)格預(yù)測(cè)問(wèn)題主要使用線性模型對(duì)股票價(jià)格進(jìn)行預(yù)測(cè),如多元線性回歸模型、自回歸滑動(dòng)平均模型(ARMA)和指數(shù)平滑法(ES)等[5],但影響股票價(jià)格波動(dòng)的因素較為復(fù)雜,使用單一的數(shù)學(xué)模型進(jìn)行預(yù)測(cè)很難得到較高的準(zhǔn)確率。
近年來(lái),許多學(xué)者開(kāi)始深入研究金融建模和優(yōu)化算法的改進(jìn)問(wèn)題。劉睿智等提出基于自適應(yīng)套索的人工神經(jīng)網(wǎng)絡(luò)(ANN)和ARIMA的組合研究股票指數(shù)收益率[6];Pan等提出一種多輸出支持向量機(jī)無(wú)限制混合數(shù)據(jù)采樣方法(MSVM-UMIDAS)研究股票價(jià)格預(yù)測(cè)的多輸出和混合頻率問(wèn)題[7];曹柯提出相關(guān)向量機(jī)(RVM)和EDM預(yù)測(cè)股指期貨價(jià)格的方法[8]。
上述文獻(xiàn)中的方法雖取得的預(yù)測(cè)效果較好,但模型多采用傳統(tǒng)的機(jī)器學(xué)習(xí)方法,導(dǎo)致訓(xùn)練過(guò)程中產(chǎn)生諸多問(wèn)題,如ANN存在計(jì)算量大、過(guò)度擬合等缺陷;SVM對(duì)大樣本的處理時(shí)間過(guò)長(zhǎng);RVM的訓(xùn)練時(shí)間會(huì)隨著樣本容量的增大而逐漸增加等。
為解決上述問(wèn)題,Huang等人提出了極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)[9],它克服了其他神經(jīng)網(wǎng)絡(luò)步驟較復(fù)雜、學(xué)習(xí)速度緩慢的不足,使機(jī)器學(xué)習(xí)的效率和泛化能力得到改善,被廣泛應(yīng)用于疾病診斷[10]、電池剩余壽命檢測(cè)[11]和煤電需求預(yù)測(cè)研究[12]等。
海洋捕食者算法(Marine Predators Algorithm,MPA)是由Faramarzi等人于2020年提出的一種新的啟發(fā)式智能算法[13],該算法主要模擬的是海洋中捕食者和獵物在不同速度比下的運(yùn)動(dòng)行為。海洋捕食者算法和粒子群算法等其他智能算法相比,它的全局搜索能力強(qiáng)并且容易實(shí)現(xiàn)?,F(xiàn)如今該算法已成功用于預(yù)測(cè)COVID-19的病例數(shù)[14]、武器-目標(biāo)分配問(wèn)題研究[15]等方面。目前,MPA算法還尚未被應(yīng)用到股票預(yù)測(cè)問(wèn)題中。
針對(duì)文獻(xiàn)中存在的不足,本文提出一種海洋捕食者算法與極限學(xué)習(xí)機(jī)相結(jié)合的方法,首先通過(guò)ELM對(duì)歸一化后的數(shù)據(jù)進(jìn)行訓(xùn)練,其次利用MPA對(duì) ELM 的關(guān)鍵參數(shù)進(jìn)行優(yōu)化,最后建立MPA-ELM組合預(yù)測(cè)模型。通過(guò)整理分析深證成指的交易數(shù)據(jù),運(yùn)用MPA-ELM模型對(duì)股票收盤價(jià)格進(jìn)行預(yù)測(cè),并與ELM、BOA-ELM、WOA-ELM等模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,研究結(jié)果表明MPA-ELM 模型相比于其他模型預(yù)測(cè)結(jié)果更加精確。
典型的ELM框架如圖1所示,包括p個(gè)輸入層節(jié)點(diǎn),q個(gè)隱含層節(jié)點(diǎn),m個(gè)輸出層節(jié)點(diǎn)。假設(shè)有N個(gè)樣本數(shù)據(jù)(xj,yi),wi代表輸入層與隱含層間的連接權(quán)值,βi表示隱含層和輸出層之間的權(quán)值,g(x)表示隱含層神經(jīng)元的激活函數(shù),αi為隱含層的閾值,ti是輸出值。ELM的數(shù)學(xué)模型如式(1)所示:
圖1 ELM框架
(1)
式(1)用矩陣表示為Hβ=T。H表示隱含層輸出矩陣,具體見(jiàn)式(2),T表示期望輸出值。
(2)
根據(jù)最小二乘法原理,連接權(quán)重β的計(jì)算公式如式(3)所示。
β=H+T。
(3)
H+是H的Moore-Penrose廣義逆矩陣。
海洋捕食者算法模擬了海洋中捕食者的覓食行為,捕食者或者獵物通過(guò)在Levy飛行和布朗運(yùn)動(dòng)隨機(jī)游走更新種群的位置。MPA優(yōu)化過(guò)程根據(jù)捕食者和獵物的不同速度比分為三個(gè)主要階段,同時(shí)設(shè)計(jì)魚(yú)類聚集裝置(FADs)以跳出局部最優(yōu),最后用海洋記憶功能重新計(jì)算個(gè)體適應(yīng)度并更新頂級(jí)捕食者。
MPA算法的基本實(shí)現(xiàn)步驟如下:
第一步,初始化MPA算法相關(guān)參數(shù)。第二步,計(jì)算每一個(gè)個(gè)體的適應(yīng)度,并將最低的適應(yīng)度值分配給頂級(jí)捕食者。第三步,在迭代初期,用公式(4)和(5)更新每個(gè)個(gè)體的位置。
stepi=RB?(Elitei-RB?Preyi),
(4)
Preyi=Preyi+p·R?stepi。
(5)
式中,stepi表示當(dāng)前階段的移動(dòng)步長(zhǎng),RB表示呈正態(tài)分布的布朗游走隨機(jī)向量,p為0.5,R為[0,1]之間的均勻分布值,?表示逐項(xiàng)乘法運(yùn)算值,Elitei表示由頂級(jí)捕食者組成的精英矩陣。
第四步,在迭代中期,用公式(6)和(7)分別更新獵物和捕食者的位置。
i=1,…,2/n,
(6)
i=2/n,…,n。
(7)
式中,RL表示萊維飛行運(yùn)動(dòng)隨機(jī)向量,CF表示影響捕食者移動(dòng)步長(zhǎng)的自適應(yīng)參數(shù);n表示種群的數(shù)量。
第五步,在迭代后期,捕食者最佳策略是做Levy運(yùn)動(dòng),用式(8)式(9)更新個(gè)體位置。
stepi=RL?(RL?Elitei-Preyi),
(8)
Preyi=Elitei+p·CF?stepi。
(9)
第六步,采用渦流或魚(yú)類聚集效應(yīng) (FADs)降低算法的局部停滯率,具體如式(10)所示。
(10)
式(10)中,FADS=0.2,U為二進(jìn)制數(shù)組,Pmax和Pmin分別表示邊界的最大和最小取值,r取[0,1]范圍內(nèi)的均勻隨機(jī)數(shù),Pr1和Pr2和表示在獵物種群中隨機(jī)選取的兩個(gè)獵物。
第七步,計(jì)算每個(gè)個(gè)體的適應(yīng)度值,如果小于頂級(jí)捕食者的適應(yīng)度值,就將該適應(yīng)度值賦值給頂級(jí)捕食者,將相應(yīng)的個(gè)體作為頂級(jí)捕食者所在的位置。第八步,如果達(dá)到最大迭代次數(shù),輸出頂級(jí)捕食者的位置和適應(yīng)度值;否則返回步驟3。
本文以深證成指的交易數(shù)據(jù)為研究對(duì)象,選擇多組交易數(shù)據(jù)作為收盤價(jià)格的影響因素,建立一個(gè)基于MPA-ELM的組合預(yù)測(cè)模型。首先,考慮到各個(gè)因素的差異性,對(duì)數(shù)據(jù)進(jìn)行歸一化處理,并將其分為訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集兩類。其次,采用MPA算法優(yōu)化ELM的主要參數(shù),其中,MPA算法的適應(yīng)度函數(shù)為ELM訓(xùn)練數(shù)據(jù)集的均方誤差。最后,將測(cè)試集輸入到優(yōu)化后的ELM模型中,得到收盤價(jià)的預(yù)測(cè)結(jié)果。MPA-ELM模型的流程圖具體如圖2所示。
圖2 MPA-ELM流程圖
具體的建模步驟如下:
第一步,輸入深證成指交易數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行歸一化處理,歸一化處理公式如下:
(11)
式中,x為數(shù)據(jù)輸入值,min為該數(shù)據(jù)所屬類別的最小值,max為該數(shù)據(jù)所屬類別的最大值。第二步,將數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集。第三步,初始化MPA參數(shù),捕食者的適應(yīng)度函數(shù)為ELM訓(xùn)練數(shù)據(jù)集的均方誤差。第四步,計(jì)算每個(gè)個(gè)體的適應(yīng)度值,記錄頂級(jí)捕食者的位置。第五步,根據(jù)種群當(dāng)前所在的階段,選用合適的公式更新個(gè)體位置。第六步,計(jì)算每個(gè)個(gè)體的適應(yīng)度值,更新頂級(jí)捕食者的位置。第七步,判斷是否達(dá)到最大迭代次數(shù),如果滿足條件,則輸出頂級(jí)捕食者;如果不滿足條件,則重復(fù)第三至第六步。最后,將測(cè)試數(shù)據(jù)集輸入到ELM預(yù)測(cè)模型中,并將頂級(jí)捕食者作為ELM預(yù)測(cè)模型的輸入權(quán)值矩陣和隱含層閾值,得到收盤價(jià)預(yù)測(cè)值,通過(guò)反歸一化得到最終收盤價(jià)預(yù)測(cè)值。
本文采用平均絕對(duì)誤差(MAE)、平均絕對(duì)百分比誤差(MAPE)、均方根誤差(RMSE)和確定系數(shù)(R2)作為股票預(yù)測(cè)效果的評(píng)價(jià)指標(biāo),
MAE、MAPE、RMSE和R2的計(jì)算公式如下:
(12)
(13)
(14)
(15)
本文選取2015年9月8日至2022年9月5日深證成指的1 703條數(shù)據(jù)對(duì)MPA-ELM模型的性能進(jìn)行評(píng)估,具體數(shù)據(jù)通過(guò)網(wǎng)易財(cái)經(jīng)平臺(tái)獲得。將開(kāi)盤價(jià)(c1)、最高價(jià)(c2)、最低價(jià)(c3)、成交量(c4)和成交金額(c5)5個(gè)影響因子作為輸入數(shù)據(jù),以收盤價(jià)格(y)作為輸出數(shù)據(jù)。其中,前1 603條數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,后100條數(shù)據(jù)作為測(cè)試數(shù)據(jù)集,其中深證成指的部分初始樣本數(shù)據(jù)如表1所示,初始樣本進(jìn)行歸一化后的數(shù)據(jù)如表2所示。
表1 部分樣本數(shù)據(jù)
表2 歸一化后的部分樣本數(shù)據(jù)(保留小數(shù)點(diǎn)后6位)
基于深證成指的原始數(shù)據(jù),分析MPA-ELM模型與未經(jīng)過(guò)參數(shù)尋優(yōu)的ELM模型的預(yù)測(cè)結(jié)果,比較兩模型的尋優(yōu)效果。模型參數(shù)設(shè)置如下:ELM隱含層節(jié)點(diǎn)數(shù)O=20,輸入神經(jīng)元個(gè)數(shù)為5,輸出神經(jīng)元個(gè)數(shù)為1。隱含層的激活函數(shù)選用sig-moid函數(shù),MPA算法參數(shù)設(shè)置如下:種群數(shù)量為30,最大迭代次數(shù)為500。ELM模型和MPA-ELM模型的預(yù)測(cè)結(jié)果分別如圖3、圖4所示。
圖3 ELM預(yù)測(cè)結(jié)果和原始數(shù)據(jù)對(duì)比
圖4 MPA-ELM預(yù)測(cè)結(jié)果和原始數(shù)據(jù)對(duì)比
由圖3和圖4可知,經(jīng)MPA優(yōu)化的ELM模型,預(yù)測(cè)結(jié)果和實(shí)際數(shù)據(jù)基本吻合,相比于傳統(tǒng)的ELM模型預(yù)測(cè)效果更優(yōu),說(shuō)明MPA算法中根據(jù)不同的速度比更新種群個(gè)體位置,能有效避免算法陷入局部最優(yōu),實(shí)現(xiàn)全局最優(yōu)。
為了比較模型的預(yù)測(cè)效果,將BOA-ELM、WOA-ELM模型與MPA-ELM模型的預(yù)測(cè)結(jié)果做橫向?qū)Ρ?在相同的數(shù)據(jù)集的情況下進(jìn)行建模。BOA的參數(shù)設(shè)置如下:a=0.1,c=0.01,p=0.6,種群數(shù)量為30,迭代次數(shù)為500次;BOA與WOA算法的種群數(shù)量與最大迭代次數(shù)與MAP算法設(shè)置相同。各模型適應(yīng)度值的收斂效果如圖5所示。
圖5 各模型收斂曲線對(duì)比
由圖5可知,與BOA-ELM、WOA-ELM模型相比,MPA-ELM模型的收斂速度最快且收斂精度最優(yōu),表明該模型能夠降低種群陷入局部桎梏的概率,提高種群全局尋優(yōu)的能力。
為了更直觀地比較預(yù)測(cè)結(jié)果,各模型的評(píng)價(jià)指標(biāo)值如表3所示。
表3 各模型評(píng)價(jià)指標(biāo)對(duì)比值
由表3可知, MPA-ELM模型的MAPE指標(biāo)比ELM低0.67%,比BOA-ELM低0.83%,比WOA-ELM低0.43%;MPA-ELM模型的RMSE指標(biāo)比未經(jīng)過(guò)參數(shù)尋優(yōu)的ELM模型低0.39%,相比BOA-ELM、WOA-ELM分別降低了0.92%、0.06%;MPA-ELM模型的MAE指標(biāo)相比傳統(tǒng)ELM、BOA-ELM和WOA-ELM模型分別減少了0.80%、1.54%、0.43%。綜上可知,MPA-ELM明顯優(yōu)于其他模型的求解結(jié)果,具有更好的預(yù)測(cè)精度,且該模型R2的值為0.999 2,比其他模型更接近于1,說(shuō)明MPA-ELM模型的擬合效果最佳。
為了提高股票價(jià)格預(yù)測(cè)的準(zhǔn)確率,本文提出了海洋捕食者算法和極限學(xué)習(xí)機(jī)相結(jié)合的MPA-ELM預(yù)測(cè)模型。在參數(shù)尋優(yōu)過(guò)程中,MPA算法無(wú)論在求解速度還是求解精度上均展現(xiàn)出較強(qiáng)的優(yōu)勢(shì)。運(yùn)用MPA算法對(duì)ELM的關(guān)鍵參數(shù)進(jìn)行優(yōu)化,降低了人為因素影響的概率,提高了模型的預(yù)測(cè)準(zhǔn)確率。將MPA-ELM模型與ELM 、BOA-ELM、WOA-ELM模型的預(yù)測(cè)效果進(jìn)行對(duì)比,結(jié)果表明MPA-ELM模型的尋優(yōu)精度較高、擬合效果較好。
山東工商學(xué)院學(xué)報(bào)2023年4期