朱文強(qiáng)
摘要:技術(shù)創(chuàng)新在金融行業(yè)扮演著越來越重要的地位,尤其是機(jī)器學(xué)習(xí)算法與深度學(xué)習(xí)算法的創(chuàng)新,相較于傳統(tǒng)計(jì)量經(jīng)濟(jì)模型對于金融市場風(fēng)險(xiǎn)、收益波動的預(yù)測效果,憑借互聯(lián)網(wǎng)大數(shù)據(jù),更多機(jī)構(gòu)或個(gè)人通過機(jī)器學(xué)習(xí)來擬合金融市場,加強(qiáng)投資策略。這種具備大數(shù)據(jù)、互聯(lián)網(wǎng)以及量化投資特征的研究將會成為金融行業(yè)的一大研究熱點(diǎn),而本文則依據(jù)國內(nèi)外學(xué)者對金融領(lǐng)域與深度學(xué)習(xí)的交叉研究開展綜述。
關(guān)鍵詞:深度學(xué)習(xí);量化投資;文獻(xiàn)綜述
1. 深度學(xué)習(xí)的發(fā)展前景
隨著科技發(fā)展,智能算法逐漸成為各個(gè)研究領(lǐng)域較為火熱的研究方法,尤其是針對于深度學(xué)習(xí)技術(shù)的優(yōu)勢,其在計(jì)算機(jī)視覺領(lǐng)域和自然語言處理領(lǐng)域的飛速發(fā)展。深度學(xué)習(xí)是在基于神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上更加強(qiáng)大的一種智能算法,神經(jīng)網(wǎng)絡(luò)是一種非常強(qiáng)大的非參數(shù)化工具,被廣泛應(yīng)用于信號處理、模式識別等諸多領(lǐng)域,可以有效處理模型參數(shù)之間的非線性關(guān)系。與其他計(jì)量經(jīng)濟(jì)學(xué)方法相比,它不需定義模型的方程形式,也無需假設(shè)變量之間的函數(shù)關(guān)系。因此,與傳統(tǒng)的諸如ARIMA、GARCH、OLS、VAR模型等參數(shù)計(jì)量經(jīng)濟(jì)模型相比,其具有(1)對非線性數(shù)據(jù)的擬合能力強(qiáng)于線性擬合;(2)由于沒有標(biāo)準(zhǔn)的函數(shù)方程約束,其更加適應(yīng)動態(tài)變化的金融市場,即對于金融時(shí)間序列數(shù)據(jù)的預(yù)測也存在顯著效果;(3)其是一種以數(shù)據(jù)驅(qū)動的而非參數(shù)驅(qū)動的弱計(jì)量模型,從而相對于傳統(tǒng)的計(jì)量經(jīng)濟(jì)模型來說,更容易避免模型設(shè)定產(chǎn)生的誤差??偟膩碚f,以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的模型在理論上依然產(chǎn)生了處理金融時(shí)間序列數(shù)據(jù)方面更加強(qiáng)大的優(yōu)勢。而在實(shí)際應(yīng)用方面,Hill et al.(1996)探究了神經(jīng)網(wǎng)絡(luò)與Box-Jenkins ARIMA模型、季節(jié)性指數(shù)平滑等六種統(tǒng)計(jì)模型對時(shí)間序列數(shù)據(jù)的預(yù)測效果,實(shí)證結(jié)果發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)的預(yù)測效果優(yōu)于傳統(tǒng)的統(tǒng)計(jì)模型,且證實(shí)神經(jīng)網(wǎng)絡(luò)特別適用于不連續(xù)時(shí)間序列數(shù)據(jù)的預(yù)測。繼而在兩年之后,Zhang和Hu(1998)也獲得了相同的結(jié)論。
而深度學(xué)習(xí)作為以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的一種更加強(qiáng)大的智能算法,相對于神經(jīng)網(wǎng)絡(luò)這樣淺層的機(jī)器學(xué)習(xí)算法,其具有能夠處理復(fù)雜高維數(shù)據(jù)的能力,從而避免了維度災(zāi)難和大數(shù)據(jù)等問題。深度學(xué)習(xí)實(shí)際上是多層神經(jīng)網(wǎng)絡(luò)所構(gòu)成的高層次神經(jīng)網(wǎng)絡(luò)模型,通過疊加多個(gè)神經(jīng)網(wǎng)絡(luò),將輸入數(shù)據(jù)通過每一個(gè)神經(jīng)層的抽象表達(dá),產(chǎn)生相應(yīng)的“學(xué)習(xí)”機(jī)能來學(xué)習(xí)輸入數(shù)據(jù)內(nèi)部隱含的特征,借此提取有效信息來提高數(shù)據(jù)預(yù)測能力。因此深度學(xué)習(xí)就是通過高特征提取和高表征輸出兩大優(yōu)勢,提高了樣本內(nèi)數(shù)據(jù)預(yù)測精度以及緩和過擬合問題,從而相對其他模型擁有更加強(qiáng)大的泛化能力。深度學(xué)習(xí)因其在金融時(shí)間序列過程中具有優(yōu)良的表現(xiàn)而得到越來越多學(xué)者的重視。在廣大研究者使用的多種研究方法中,深度學(xué)習(xí)具有完全圖靈測試機(jī)理,縝密的思維推導(dǎo)過程,其由數(shù)據(jù)驅(qū)動并且不基于任何假設(shè)的特點(diǎn),因此被認(rèn)為非常適合于處理這類數(shù)據(jù)。
2. 深度學(xué)習(xí)的發(fā)展及其應(yīng)用研究
深度學(xué)習(xí)主要包含了循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、長短記憶神經(jīng)網(wǎng)絡(luò)(LSTM)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)等。其中RNN是一種納入了序列相關(guān)性的神經(jīng)網(wǎng)絡(luò)從而能夠處理金融時(shí)間序列數(shù)據(jù)。Rather et al.(2015)通過RNN與GARCH、AMRIA模型對比股票收益率的預(yù)測效果分析,實(shí)證結(jié)果表明RNN的預(yù)測效果更優(yōu)。然而,RNN結(jié)構(gòu)因?yàn)榇嬖谔荻认Ш吞荻缺ㄟ@兩個(gè)問題,從而對于處理具有長期關(guān)系的序列數(shù)據(jù)則相形見絀。而LSTM則在一定程度上緩和了序列數(shù)據(jù)的長期依賴關(guān)系,LSTM最成功的應(yīng)用領(lǐng)域就是機(jī)器翻譯。文本翻譯與金融數(shù)據(jù)除了結(jié)構(gòu)上的不同,實(shí)際上都是時(shí)間序列數(shù)據(jù),因此有許多學(xué)者將LSTM應(yīng)用到股票價(jià)格波動率預(yù)測預(yù)測上來,進(jìn)而相似地得出了LSTM的預(yù)測能力和穩(wěn)定性要明顯強(qiáng)于其他模型的結(jié)論。盡管LSTM在一定程度上能夠處理時(shí)序相關(guān)問題,但是其并不能完全消除梯度爆炸和梯度消失問題。而為了更好提取時(shí)序數(shù)據(jù)特征,避免長期信息丟失問題,許多學(xué)者做了在LSTM上做了一些改進(jìn)?;贕oogle Deep Mind 團(tuán)隊(duì)在2014年提出將注意力機(jī)制用在圖像分類任務(wù)中,驗(yàn)證了注意力機(jī)制(Attention)在圖像處理領(lǐng)域的有效性,同時(shí)也使結(jié)合注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)成為研究的熱點(diǎn)。隨后,Bahdanau et al.(2014)將注意力機(jī)制和RNN結(jié)合解決機(jī)器翻譯任務(wù),使注意力機(jī)制成功融入自然語言處理領(lǐng)域??紤]到Attention機(jī)制能夠更好地捕捉圖像、文本數(shù)據(jù)中的有效信息,則將其與LSTM相結(jié)合構(gòu)建了A-LSTM來處理金融時(shí)序數(shù)據(jù)將是一個(gè)十分明顯的創(chuàng)新。此外,時(shí)間序列數(shù)據(jù)可以通過RNN、LSTM等方式捕捉有效時(shí)序信息,但是其空間局部相關(guān)性則被忽視,而CNN則可以通過限制隱藏單元的局部感知來提取局部特征。CNN結(jié)構(gòu)廣泛被用于人臉識別技術(shù),圖像處理領(lǐng)域。而近年來,CNN結(jié)構(gòu)也在金融鄰域大放光彩。例如,趙紅蕊和薛雷(2020)在股票價(jià)格預(yù)測研究中將Attention機(jī)制引入LSTM和CNN模型中,驗(yàn)證了在LSTM與CNN結(jié)合的網(wǎng)絡(luò)模型中加入Attention模塊的預(yù)測有效性和可行性。明顯可以看出,CNN結(jié)構(gòu)的優(yōu)越性激發(fā)了許多學(xué)者在其鄰域的運(yùn)用,例如熱電聯(lián)產(chǎn)供熱和貸款逾期等。
3.結(jié)束語
綜上所述,深度學(xué)習(xí)在各行業(yè)鄰域都有所滲透,尤其對于考慮到序列數(shù)據(jù)的要求,金融領(lǐng)域也就成了深度學(xué)習(xí)最理想的應(yīng)用場所。RNN、LSTM、CNN等深度學(xué)習(xí)算法在各個(gè)方面都有其優(yōu)勢,甚至相互融合能夠產(chǎn)生更加卓越的效果。然而如何將基準(zhǔn)算法相互混合能夠在金融市場產(chǎn)生更加優(yōu)異的效果以及如何創(chuàng)新地提出更加優(yōu)異的深度學(xué)習(xí)算法來更好地?cái)M合金融數(shù)據(jù)的需求,即基于不同深度學(xué)習(xí)方法對金融市場進(jìn)行擇時(shí)選股分析。
參考文獻(xiàn):
[1]Hill T.,O'Connor M.,& Remus W. Neural network models for time series forecasts[J]. Management science,1996,42(7):1082-1092.
[2]Zhang G. & Hu M. Y. Neural network forecasting of the British pound/US dollar exchange rate[J]. Omega,1998,26(4):495-506.
[3]Rather A. M.,Agarwal A. & Sastry V. N. Recurrent neural network and a hybrid model for prediction of stock returns[J]. Expert Systems with Applications,2015,42(6):3234-3241.
[4]Bahdanau D,Cho K,Bengio Y. Neural machine translation by jointly learning to align and translate[J]. arXiv preprint arXiv:1409.0473,2014.
[5]趙紅蕊,薛雷.基于LSTM-CNN-CBAM模型的股票預(yù)測研究[J].計(jì)算機(jī)工程與應(yīng)用,2021,57(03):203-207.