張衛(wèi)國(guó)++李家銘
摘 要:
針對(duì)極限學(xué)習(xí)機(jī)易陷入過度學(xué)習(xí)和隱層節(jié)點(diǎn)數(shù)目難確定的問題,提出基于雙層差分進(jìn)化算法的極限學(xué)習(xí)機(jī)(雙層DE-ELM)預(yù)測(cè)模型,把極限學(xué)習(xí)機(jī)(ELM)的隱層節(jié)點(diǎn)數(shù)目和節(jié)點(diǎn)參數(shù)作為差分進(jìn)化(DE)算法的外層和內(nèi)層進(jìn)化個(gè)體,利用DE算法通過自然選擇淘汰機(jī)制對(duì)其進(jìn)行學(xué)習(xí)和完善。將該模型應(yīng)用于上證綜合指數(shù)和標(biāo)準(zhǔn)普爾500指數(shù)的短、中期預(yù)測(cè),并與DE-ELM等模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比分析。實(shí)證結(jié)果表明:雙層DE-ELM預(yù)測(cè)模型能夠有效地選擇隱層節(jié)點(diǎn)數(shù)目和參數(shù),具有較強(qiáng)的預(yù)測(cè)能力和較高的穩(wěn)定性。
關(guān)鍵詞:
雙層DE-ELM預(yù)測(cè)模型;隱層節(jié)點(diǎn);股票指數(shù);時(shí)間序列
中圖分類號(hào): F831 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1009-055X(2016)02-0018-09
引 言
股票指數(shù)的預(yù)測(cè)問題一直以來都是學(xué)界和業(yè)界十分關(guān)注的話題,指數(shù)平滑預(yù)測(cè)法[1]、ARMA(自回歸移動(dòng)平均模型)[2]和ARCH(自回歸條件異方差模型)[3]等傳統(tǒng)的時(shí)間序列分析法被學(xué)者廣泛研究。然而,這些模型具有較強(qiáng)的使用限制,只有滿足特定的條件時(shí)才能使用。為了克服這一問題,以時(shí)間序列驅(qū)動(dòng)的各類人工智能預(yù)測(cè)模型,特別是人工神經(jīng)網(wǎng)絡(luò)模型逐步成為研究的熱點(diǎn)。
1988年,White首次利用神經(jīng)網(wǎng)絡(luò)來預(yù)測(cè)股票每日?qǐng)?bào)酬率,然而預(yù)測(cè)效果并不理想。White認(rèn)為神經(jīng)網(wǎng)絡(luò)陷入局部極小值而無(wú)法跳出,影響了預(yù)測(cè)效果。[4]Kimoto等利用神經(jīng)網(wǎng)絡(luò)對(duì)東京證交所股價(jià)加權(quán)平均指數(shù)進(jìn)行預(yù)測(cè),指出神經(jīng)網(wǎng)絡(luò)模型對(duì)報(bào)酬率的預(yù)測(cè)效果優(yōu)于TOPIX加權(quán)平均指數(shù)方法。[5]為了進(jìn)一步提高神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)能力,許多學(xué)者又對(duì)人工智能技術(shù)進(jìn)行了改進(jìn),比如說,Hassan等把HMM、ANN和GA進(jìn)行結(jié)合對(duì)金融市場(chǎng)的行為進(jìn)行預(yù)測(cè),他們認(rèn)為,改進(jìn)后的模型對(duì)金融市場(chǎng)的預(yù)測(cè)與傳統(tǒng)人工智能技術(shù)相比更加精確。[6]Wang等提出WDBP神經(jīng)網(wǎng)絡(luò)來預(yù)測(cè)上證綜合指數(shù),其結(jié)果表明WDBP神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)相比具有更強(qiáng)的預(yù)測(cè)能力。[7]常松等利用小波包理論將價(jià)格波動(dòng)序列最優(yōu)地分解為一系列子波動(dòng)并運(yùn)用神經(jīng)網(wǎng)絡(luò)對(duì)子波動(dòng)進(jìn)行預(yù)測(cè),實(shí)證結(jié)果表明小波包與神經(jīng)網(wǎng)絡(luò)結(jié)合起來對(duì)股票價(jià)格的預(yù)測(cè)效果比單獨(dú)的神經(jīng)網(wǎng)絡(luò)更好。[8]徐少華等提出一種基于混沌遺傳與帶有動(dòng)態(tài)慣性因子的粒子群優(yōu)化相結(jié)合的學(xué)習(xí)方法來優(yōu)化神經(jīng)網(wǎng)絡(luò)的訓(xùn)練問題,以提高神經(jīng)網(wǎng)絡(luò)的訓(xùn)練精度。實(shí)證結(jié)果表明該改進(jìn)算法提供了PNN網(wǎng)絡(luò)的訓(xùn)練精度。[9]楊一等提出一種基于輸出敏感度方差重要性的結(jié)構(gòu)優(yōu)化算法來解決RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計(jì)問題。結(jié)果表明該算法可根據(jù)研究對(duì)象自適應(yīng)地調(diào)整RBF的網(wǎng)絡(luò)結(jié)構(gòu),提高其泛化能力。[10]
由于傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)存在結(jié)構(gòu)上的缺陷,比如說,學(xué)習(xí)速度慢、學(xué)習(xí)率難以確定、易過度訓(xùn)練等,學(xué)者們對(duì)人工神經(jīng)網(wǎng)絡(luò)的有效性產(chǎn)生質(zhì)疑。為了克服神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)缺陷,Huang等人提出極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)的概念。[11]ELM算法是一種十分簡(jiǎn)單快速的單隱層神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法,在網(wǎng)絡(luò)參數(shù)的確定過程中隱層節(jié)點(diǎn)參數(shù)(內(nèi)權(quán)和偏置值)隨機(jī)設(shè)置,且其在網(wǎng)絡(luò)學(xué)習(xí)過程中不再改變,而網(wǎng)絡(luò)外權(quán)通過最小化誤差的原理計(jì)算得出。ELM的學(xué)習(xí)機(jī)制使其只需進(jìn)行一次運(yùn)算即可輸出權(quán)值,與需要進(jìn)行多次迭代的前饋型神經(jīng)網(wǎng)絡(luò)相比大幅度地減少了學(xué)習(xí)時(shí)間、提高了學(xué)習(xí)效率,近年受到了廣泛的關(guān)注。
ELM算法的運(yùn)算機(jī)制使該算法同樣存在結(jié)構(gòu)上的不足,比如說:隱層輸出矩陣易發(fā)生奇異,部分隱層節(jié)點(diǎn)不起作用。為了進(jìn)一步改善ELM算法的不足,學(xué)者提出了一系列改進(jìn)方案,比如說:Lan等提出了CS-ELM算法,該算法對(duì)ELM算法的隱層節(jié)點(diǎn)參數(shù)進(jìn)行篩選,去除顯著性較弱的隱層節(jié)點(diǎn)來實(shí)現(xiàn)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化。[12]Wang等提出EELM算法,運(yùn)用對(duì)角占優(yōu)的方法來優(yōu)化隱層節(jié)點(diǎn)參數(shù),進(jìn)而保證了隱層輸出矩陣的非奇異性,提高了極限學(xué)習(xí)機(jī)的穩(wěn)定性。[13]Toh等通過添加正則項(xiàng)的方式避免了隱層矩陣奇異和接近奇異情況的發(fā)生,有效地提高了ELM算法的學(xué)習(xí)能力。[14]Huang等提出EI-ELM算法來優(yōu)化隱層節(jié)點(diǎn)參數(shù),簡(jiǎn)化了ELM算法的復(fù)雜度,提高了其優(yōu)化效率。[15]高光勇等提出CC-ELM算法,運(yùn)用復(fù)合混沌和混沌變尺度算法對(duì)極限學(xué)習(xí)機(jī)的參數(shù)進(jìn)行搜索和優(yōu)化,提高了ELM算法的泛化性能。同時(shí),通過算例指出CC-ELM算法與同類型算法相比更加有效。[16]
然而,上述改進(jìn)算法均未同時(shí)考慮隱層節(jié)點(diǎn)數(shù)目和參數(shù)兩方面。為了克服這一問題,本文提出雙層DE-ELM預(yù)測(cè)模型。該模型使用雙層差分進(jìn)化算法(DE)與極限學(xué)習(xí)機(jī)(ELM)結(jié)合,利用差分進(jìn)化(DE)算法對(duì)極限學(xué)習(xí)機(jī)(ELM)的網(wǎng)絡(luò)隱層節(jié)點(diǎn)數(shù)目、隱層內(nèi)權(quán)和偏置值進(jìn)行優(yōu)化。最后,本文利用雙層DE-ELM預(yù)測(cè)模型對(duì)上證綜合指數(shù)和標(biāo)準(zhǔn)普爾500指數(shù)的日度數(shù)據(jù)和月度數(shù)據(jù)進(jìn)行預(yù)測(cè),以討論雙層DE-ELM預(yù)測(cè)模型的應(yīng)用價(jià)值。
一、模型介紹
股票市場(chǎng)具有復(fù)雜性、非線性、多變性等特點(diǎn),隨著ETF和股指期貨等金融工具的出現(xiàn),股指對(duì)股票市場(chǎng)的重要性越發(fā)重要,投資者可以利用股指的衍生品進(jìn)行套利或套保,對(duì)股指走勢(shì)進(jìn)行預(yù)測(cè)就顯得越發(fā)重要。但股指同樣具有走勢(shì)難預(yù)測(cè)、方向難確定、影響因素多等方面的特點(diǎn),導(dǎo)致對(duì)其進(jìn)行預(yù)測(cè)具有很多的困難。
本文利用時(shí)間序列的方法,以股指過去n天/月的歷史收盤價(jià)作為模型的輸入,以第n+1天/月的收盤價(jià)作為輸出函數(shù)進(jìn)行一步預(yù)測(cè)。股票價(jià)格走勢(shì)與近期的歷史信息有關(guān),本文著重考慮單個(gè)因素(股價(jià))對(duì)自身短中期預(yù)測(cè)的影響,不考慮其他因素。
[BT4](一)極限學(xué)習(xí)機(jī)(ELM)
Huang等依據(jù)摩爾-彭羅斯(MP)廣義逆矩陣?yán)碚揫17]提出了極限學(xué)習(xí)機(jī)(ELM)算法。[11]該算法的特點(diǎn)是在網(wǎng)絡(luò)參數(shù)的確定過程中,內(nèi)權(quán)和偏置值隨機(jī)選取且無(wú)需進(jìn)行二次調(diào)節(jié),而網(wǎng)絡(luò)外權(quán)通過最小化損失函數(shù)得到。這種機(jī)制使得ELM算法在網(wǎng)絡(luò)參數(shù)確定過程中無(wú)需進(jìn)行任何迭代步驟,只需一次計(jì)算即可得出最優(yōu)網(wǎng)絡(luò)參數(shù)。這樣的處理機(jī)制大大降低了運(yùn)算時(shí)間,與需要多次迭代的前饋型神經(jīng)網(wǎng)絡(luò)相比具有巨大的優(yōu)勢(shì)。