亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種多源數(shù)據(jù)驅(qū)動(dòng)的自動(dòng)交易系統(tǒng)決策模型

        2018-10-18 06:12:20文丹艷馬超群王琨
        自動(dòng)化學(xué)報(bào) 2018年8期
        關(guān)鍵詞:信號模型

        文丹艷 馬超群 王琨

        隨著信息技術(shù)的飛速發(fā)展,股票的自動(dòng)交易(也稱為算法交易、機(jī)器交易、黑箱交易)受到實(shí)業(yè)界和學(xué)術(shù)界越來越多的關(guān)注與重視.據(jù)報(bào)道,美國90%以上的證券經(jīng)理在建立投資組合時(shí)會使用自動(dòng)交易,而亞洲市場上也有約40%的交易依賴于自動(dòng)交易.自動(dòng)交易(Automatic trading,AT)指按照量化投資的基礎(chǔ)模式編寫程序,通過計(jì)算機(jī)自動(dòng)實(shí)現(xiàn)交易決策或輔助決策的一種交易模式[1?2].應(yīng)用自動(dòng)交易系統(tǒng)不僅可以節(jié)約人力成本、提高交易精度,而且可以同時(shí)監(jiān)控多支股票,捕捉到轉(zhuǎn)瞬即逝的交易時(shí)機(jī),因而大大提高了用戶的效率并增加獲利機(jī)會.因此,利用自動(dòng)交易進(jìn)行輔助決策乃至實(shí)際交易越來越成為一種趨勢.

        隨著自動(dòng)交易系統(tǒng)推廣,其核心處理模型即對股價(jià)、收益等關(guān)鍵變量的預(yù)測問題逐漸成為研究熱門[1].許多方法對自動(dòng)交易系統(tǒng)的研究重點(diǎn)圍繞金融系統(tǒng)的模擬、仿真或優(yōu)化某種與股價(jià)趨勢相關(guān)的變量[3?4].然而,無論是基于計(jì)算實(shí)驗(yàn)的方法、模擬仿真或優(yōu)化的方法,大多數(shù)的股價(jià)預(yù)測模型與股市預(yù)測模型都基于歷史股價(jià)數(shù)據(jù)[5?6].上述做法固然可以通過減少變量降低系統(tǒng)的復(fù)雜度,但也忽略了諸如財(cái)經(jīng)新聞等影響股價(jià)走勢的重要信息,容易造成預(yù)測的失靈.

        自動(dòng)交易系統(tǒng)能迅速處理大量影響股市價(jià)格波動(dòng)的一些公開或私密信息,以便從根本上提高預(yù)測的精度和效率.作為一種典型的公開信息,財(cái)經(jīng)新聞對股市具有重要而深遠(yuǎn)的影響.學(xué)術(shù)界關(guān)于新聞對股市影響的分析由來已久.早在1966年,金融學(xué)者M(jìn)errill就率先探索了利空新聞與股市價(jià)格的關(guān)系[7].隨后,學(xué)者們從多種角度分析各類不同的新聞對股市利空或利好的影響[5].然而,傳統(tǒng)的研究者或側(cè)重單類新聞事件,或側(cè)重新聞的情感,或側(cè)重某一方面的指標(biāo)對股市的影響(關(guān)系).關(guān)于實(shí)際影響股市的多類信息或?qū)⒇?cái)經(jīng)新聞融入交易策略的生成與應(yīng)用層面的研究非常少.

        為將財(cái)經(jīng)新聞?dòng)行У厝谌氲阶詣?dòng)交易系統(tǒng)中,本文從網(wǎng)絡(luò)新聞文本和歷史交易數(shù)據(jù)出發(fā),通過分析財(cái)經(jīng)新聞對股價(jià)的影響,構(gòu)建了一種多源數(shù)據(jù)驅(qū)動(dòng)的自動(dòng)交易模型.該模型以人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network,ANN)方法為基礎(chǔ)[8?11],利用歷史交易數(shù)據(jù)產(chǎn)生技術(shù)交易信號作為一類輸入源,利用財(cái)經(jīng)新聞數(shù)據(jù)產(chǎn)生新聞信號作為另一類輸入源,透過多層神經(jīng)網(wǎng)絡(luò)產(chǎn)生最終的交易信號.為實(shí)現(xiàn)股票自動(dòng)交易,本文重點(diǎn)解決影響自動(dòng)交易系統(tǒng)質(zhì)量的兩大問題.首先,如何從新聞文本中抽取財(cái)經(jīng)事件.即如何從大量網(wǎng)絡(luò)新聞文本中獲得與股價(jià)相關(guān)的財(cái)經(jīng)事件.第二,如何將財(cái)經(jīng)事件與非線性、非平穩(wěn)性的金融數(shù)據(jù)進(jìn)行有效地融合,讓計(jì)算機(jī)智能地根據(jù)有關(guān)信號作出最佳決策.

        針對上述兩個(gè)難點(diǎn)問題,本文從網(wǎng)絡(luò)文本中抽取出對股價(jià)具有重要影響的財(cái)經(jīng)類新聞事件,將新聞事件轉(zhuǎn)化為交易信號與技術(shù)指標(biāo)的信號進(jìn)行融合,設(shè)計(jì)了一種基于ANN模型的自動(dòng)交易框架.具體地,本文首先定義了影響股價(jià)的財(cái)經(jīng)類事件集,進(jìn)而針對不同類型財(cái)經(jīng)事件的特點(diǎn),設(shè)計(jì)了從網(wǎng)絡(luò)文本中抽取中文財(cái)經(jīng)類新聞事件的模板,并利用統(tǒng)計(jì)方法分析各類財(cái)經(jīng)事件與股價(jià)波動(dòng)的關(guān)系,將各類財(cái)經(jīng)事件轉(zhuǎn)化為股票價(jià)格漲跌的信號.然后,基于神經(jīng)網(wǎng)絡(luò)的方法,設(shè)計(jì)了以交易信號為基礎(chǔ)的自動(dòng)交易框架,并通過股市歷史數(shù)據(jù)驗(yàn)證了自動(dòng)交易框架的有效性.

        本文章節(jié)安排:第1節(jié)介紹相關(guān)工作;第2節(jié)提出考慮新聞變量的自動(dòng)交易框架與基于ANN的自動(dòng)交易模型;第3節(jié)提出中文財(cái)經(jīng)事件抽取的方法;第4節(jié)介紹10種技術(shù)指標(biāo)交易信號的產(chǎn)生方法;第5節(jié)通過實(shí)驗(yàn)驗(yàn)證本文提出的自動(dòng)交易框架的性能以及事件抽取與信號產(chǎn)生模型的有效性;第6節(jié)為總結(jié)與展望.

        1 相關(guān)工作

        自動(dòng)交易方法模型研究.股票自動(dòng)交易研究可以幫助投資者選擇買賣時(shí)機(jī),獲得穩(wěn)健的收益.自動(dòng)交易的關(guān)鍵在于如何精確地預(yù)測股價(jià)的走向,選擇合適的交易時(shí)機(jī).目前,股票價(jià)格預(yù)測的方法大體可以分為三類,一是經(jīng)濟(jì)學(xué)常用的計(jì)量回歸方法,如簡單線性回歸模型、門限自回歸(Threshold autoregressive model,TAR)、廣義自回歸條件異方差模型(Generalized autoregressive conditional heteroskedasticity,GARCH)等.二是計(jì)算數(shù)學(xué)的模型方法,如基于Agent的仿真模型、模糊系統(tǒng)(Fussy systems)模型等.三是基于一些計(jì)算機(jī)機(jī)器學(xué)習(xí)(Machine learning)的模型,如支持向量機(jī)(Support vector machine,SVM)、人工神經(jīng)網(wǎng)絡(luò)(ANN)等.

        計(jì)算數(shù)學(xué)的方法一般將Agent分為多種,例如基于大客戶、散戶,主導(dǎo)者、跟風(fēng)者等[12].Wang利用模糊意見網(wǎng)絡(luò)構(gòu)建了股價(jià)動(dòng)力學(xué)模型,并模擬股價(jià)走勢取得了很好的效果[13].股價(jià)動(dòng)力學(xué)構(gòu)建了以技術(shù)指標(biāo)為基礎(chǔ)的模糊系統(tǒng)、將啟發(fā)式方法轉(zhuǎn)化為非線性的動(dòng)力學(xué)方程,開辟了股票自動(dòng)交易系統(tǒng)的新思路[14?16].

        隨著金融數(shù)據(jù)非線性、非平穩(wěn)特征的日益凸顯,基于機(jī)器學(xué)習(xí)的方法逐漸成為股價(jià)預(yù)測研究的熱門.利用神經(jīng)網(wǎng)絡(luò)對復(fù)雜金融數(shù)據(jù)序列進(jìn)行預(yù)測正成為其中一個(gè)重要分支.上世紀(jì)90年代,Kimoto等在Nikko證券公司提供股票市場交易數(shù)據(jù)和Fujitsu提供神經(jīng)網(wǎng)絡(luò)技術(shù)的基礎(chǔ)上,開發(fā)了關(guān)于如何在東京股市選擇最佳時(shí)間買賣股票的算法交易系統(tǒng),獲得了較高的預(yù)測精度[17].Saad等發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)模型適用于股票市場價(jià)格、風(fēng)險(xiǎn)等短期趨勢預(yù)測[18].近年來,Dhamija和Bhalla比較了多層感知(Multi-layer perceptron,MLP)和徑向基(Radial basis function,RBF)兩種不同神經(jīng)網(wǎng)絡(luò)模型對匯率數(shù)據(jù)的預(yù)測結(jié)果,發(fā)現(xiàn)MLP模型比RBF模型的預(yù)測精度要高[19].Ballings等對比研究了人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(jī)(SVM)和隨機(jī)預(yù)測(Random forecast)等方法對歐洲5767家股票的預(yù)測能力[20].

        新聞對股市影響研究.盡管基于神經(jīng)網(wǎng)絡(luò)方法的研究比較多,但大多忽略了新聞消息對股市的影響.股市是消息驅(qū)動(dòng)市場,關(guān)于新聞對股票市場影響的研究主要有兩種思路,一是直接研究新聞的具體指標(biāo),如發(fā)布時(shí)間、信息不確定性與股票價(jià)格之間的關(guān)系.Rosen等觀察了收購消息發(fā)布后的價(jià)格動(dòng)量,發(fā)現(xiàn)價(jià)格動(dòng)量和起初的市場反應(yīng)以及收購消息的傳播有關(guān)[21].Zhang等探索了信息的不確定性程度和股票收益之間的關(guān)系[22].二是考慮新聞對投資者行為、情緒的影響,進(jìn)而間接研究新聞或消息與股價(jià)之間的關(guān)系[23].如Yuan研究了市場關(guān)注度和股票交易之間的關(guān)系,將新聞消息與投資者的行為聯(lián)系在一起[24].Hong等[25],Pagolu等[26]基于社交網(wǎng)絡(luò)的數(shù)據(jù)研究了股民情感和股票收益的關(guān)系.

        總結(jié)以上文獻(xiàn),傳統(tǒng)的自動(dòng)交易研究往往只考慮使用技術(shù)指標(biāo)信號而忽略了新聞的重要性,新聞與股價(jià)關(guān)系的研究又很少落實(shí)到自動(dòng)交易應(yīng)用層面.因此,本文基于ANN模型,考慮新聞對股價(jià)的影響以及技術(shù)指標(biāo)信號,試圖構(gòu)建一種綜合考慮新聞事件與股票市場關(guān)系的自動(dòng)交易框架.

        2 考慮新聞事件的自動(dòng)交易框架與模型

        新聞事件對股市具有重要影響,但此類影響關(guān)系復(fù)雜難以測量.為了量化這種影響并有效融合新聞事件數(shù)據(jù),本文選用可以適應(yīng)多元輸入的ANN模型綜合通過歷史交易數(shù)據(jù)產(chǎn)生的技術(shù)信號(Technical signal)與網(wǎng)絡(luò)新聞數(shù)據(jù)產(chǎn)生的新聞信號(News signal),設(shè)計(jì)了一種基于ANN模型的自動(dòng)交易框架,并給出此框架下的自動(dòng)交易模型.

        2.1 自動(dòng)交易框架

        圖1展示了本文設(shè)計(jì)的考慮了新聞事件的自動(dòng)交易技術(shù)框架.由該框架可知,新聞事件信號屬于交易信號的一部分.本文從網(wǎng)絡(luò)文本數(shù)據(jù)中獲取新聞,將新聞從文本數(shù)據(jù)形式轉(zhuǎn)化為財(cái)經(jīng)事件形式,然后根據(jù)新聞事件與股市漲跌的關(guān)系,將新聞事件以交易信號的形式輸入到ANN模型中.ANN模型的另一部分信號來自技術(shù)指標(biāo),通過傳統(tǒng)的技術(shù)策略方法產(chǎn)生交易信號.處理模型將上述兩方面的信號綜合在一起,通過模型計(jì)算生成最終的交易決策.本文將利用人工神經(jīng)網(wǎng)絡(luò)(ANN)融合新聞和技術(shù)指標(biāo)信號,證明本算法交易框架的有效性,同時(shí)通過控制模型的輸入源,重點(diǎn)分析新聞信號對于模型整體表現(xiàn)的作用.

        圖1 基于ANN模型的自動(dòng)交易框架Fig.1 Framework of automatic trading based on ANN

        2.2 基于ANN的自動(dòng)交易模型

        在基于ANN模型的自動(dòng)交易框架基礎(chǔ)上,本文構(gòu)建了一個(gè)基于人工神經(jīng)網(wǎng)絡(luò)(ANN)的自動(dòng)交易模型,可融合包含新聞事件信號在內(nèi)的各類信號.將不包含新聞信號輸入的ANN模型記為ANN,包含新聞信號輸入的模型記為ANN-News.參考相關(guān)文獻(xiàn)[27?28]并結(jié)合實(shí)際經(jīng)驗(yàn),ANN和ANN-News都設(shè)計(jì)為4層神經(jīng)網(wǎng)絡(luò)模型,其結(jié)構(gòu)都為1個(gè)輸入層、2個(gè)隱藏層和1個(gè)輸出層,每一層都與鄰近的層相連接并至少會使用到1個(gè)神經(jīng)元.ANN和ANN-News模型的區(qū)別在于輸入層:ANN僅包括10個(gè)常用的技術(shù)信號,而ANN-News除技術(shù)信號外還包含新聞信號.

        圖2展示了ANN模型的基本框架.每個(gè)技術(shù)信號或新聞信號輸入用一個(gè)神經(jīng)元表示.ANN和ANN-News模型的輸出為1、0和?1,分別代表買入、持有和賣出.隱藏層1和隱藏層2的神經(jīng)元細(xì)胞個(gè)數(shù)分別為n1和n2.某一層的神經(jīng)元和鄰接層的神經(jīng)元通過連接系數(shù)(權(quán)重)相連.ANN(ANNNews)模型神經(jīng)元計(jì)算如式(1)所示,連接系數(shù)αi(0≤αi≤c)的初始值隨機(jī)設(shè)定,然后通過學(xué)習(xí)算法調(diào)整優(yōu)化.神經(jīng)元計(jì)算方程:

        圖2 4層的ANN(ANN-News)模型Fig.2 4 layer ANN(ANN-News)model

        下面從新聞信號與技術(shù)信號兩個(gè)來源闡述基于ANN模型的算法,重點(diǎn)分析如何將網(wǎng)絡(luò)新聞文本轉(zhuǎn)化為交易信號.

        3 財(cái)經(jīng)新聞事件信號

        本文所說的財(cái)經(jīng)新聞事件是從新聞中抽取的與股票交易緊密相關(guān)的事件.作為自動(dòng)交易系統(tǒng)交易信號的財(cái)經(jīng)事件應(yīng)具備兩個(gè)特點(diǎn):1)必須和股價(jià)波動(dòng)緊密相關(guān),影響股票價(jià)格的因素很多,其與股價(jià)波動(dòng)的關(guān)系也很復(fù)雜,應(yīng)選擇對股價(jià)有直接影響的事件;2)必須有一定的出現(xiàn)頻率,如果出現(xiàn)次數(shù)少于一定比例,難以總結(jié)其對股價(jià)的影響規(guī)律,不宜作為自動(dòng)交易程序的輸入信號.為了便于計(jì)算機(jī)處理,本文將同類財(cái)經(jīng)事件視為沒有差別的獨(dú)立個(gè)體.

        參考文獻(xiàn)[2]以及大規(guī)模財(cái)經(jīng)領(lǐng)域語料的統(tǒng)計(jì)分析,本文總結(jié)出以下與中國股市波動(dòng)相關(guān)的14類頻繁事件:1)股價(jià)上漲;2)股價(jià)下跌;3)公司業(yè)績上揚(yáng);4)公司業(yè)績下跌;5)公司聲譽(yù)提升;6)公司聲譽(yù)受損;7)公司利潤上升;8)公司利潤下滑;9)公司負(fù)債狀況良好;10)公司負(fù)債狀況堪憂;11)公司高層變動(dòng);12)公司合作;13)公司業(yè)務(wù)擴(kuò)張;14)公司并購.

        3.1 財(cái)經(jīng)事件抽取方法

        考慮到財(cái)經(jīng)事件的特殊性(如區(qū)分上漲、下跌等結(jié)果要素),本文在參考中文事件抽取算法的基礎(chǔ)上[29?31],設(shè)計(jì)了基于規(guī)則的財(cái)經(jīng)事件的抽取算法和程序.

        3.1.1 財(cái)經(jīng)事件描述方法

        參考目前新聞?lì)愂录槿》椒╗32],為了更直接地表示財(cái)經(jīng)新聞事件,本文提出使用如下結(jié)構(gòu):Pattern=(Entity,Event-type,Trigger,Time,Path),即“主體(Entity)+方面(事件種類)(Event type)+ 觸發(fā)詞(關(guān)鍵動(dòng)詞、形容詞)(Trigger)+ 時(shí)間(Time)”四個(gè)核心元素和依存路徑(Path)來描述財(cái)經(jīng)類新聞事件.具體而言,主體一般為目標(biāo)股票,可使用股票名稱或者公司名稱來描述(含簡稱).本文使用股票和公司名稱作為上述14類事件的主體.關(guān)于“方面”即包括幾類財(cái)經(jīng)事件.將這14類事件劃分為“股價(jià)、業(yè)績、聲譽(yù)、利潤、負(fù)債、高層、業(yè)務(wù)”7個(gè)方面.觸發(fā)詞一般要求反映事件的核心特征,針對“股價(jià)、業(yè)績、利潤、負(fù)債”,本文使用“漲、跌”等與事件結(jié)果直接相關(guān)的動(dòng)詞(或名詞、形容詞)作為關(guān)鍵詞.

        除了核心元素外,構(gòu)造事件模板還需要考慮句法結(jié)構(gòu)特征.句法結(jié)構(gòu)主要包括觸發(fā)詞與論元(主體、方面)之間以及時(shí)間與敏感句的依存路徑(Path).依存路徑是指:1)主體(或主體的某方面)與觸發(fā)詞的關(guān)系,當(dāng)觸發(fā)詞被標(biāo)記為根動(dòng)詞(Root)時(shí)候,主體與觸發(fā)詞的關(guān)系有:SBV關(guān)系(Subjectverb,主謂關(guān)系),通常表示的是股價(jià)上漲(或下跌);ATT+SBV主體修飾方面詞,而方面詞與主體是ATT關(guān)系(Attribute,定中關(guān)系或修飾關(guān)系)時(shí),主體與觸發(fā)詞并不直接發(fā)生關(guān)系,其仍然屬于SBV關(guān)系,因?yàn)槭聦?shí)上此處的主語為主體的某個(gè)方面.當(dāng)主體被標(biāo)記為非根節(jié)點(diǎn)動(dòng)詞時(shí),需要同時(shí)考慮觸發(fā)詞、主體與該根節(jié)點(diǎn)動(dòng)詞的關(guān)系.2)時(shí)間(nt)元素與其他元素之間的關(guān)系,時(shí)間元素可以作為修飾語或存在于附近的語句中.3)規(guī)則特征,當(dāng)某種類型的元素唯一時(shí),它很有可能就是事件元素.如果出現(xiàn)兩個(gè)以上的主體元素,通過句法樹分析各個(gè)元素之間的關(guān)系.如果是并列關(guān)系,應(yīng)當(dāng)裂變?yōu)閮深愂录?如果是從屬(或?qū)Ρ?關(guān)系,應(yīng)當(dāng)區(qū)分具體的關(guān)系和對象.

        結(jié)合實(shí)例具體描述各個(gè)特征的解析與運(yùn)用.例如,“龍頭房企萬科5月銷售金額同比大漲近八成.”利用哈工大句法樹工具1http://www.ltp-cloud.com/給出的句法分析和詞性分析(圖3),不難發(fā)現(xiàn)觸發(fā)詞“漲”,主體詞“萬科”,方面詞“銷售”以及時(shí)間詞“5月”.觸發(fā)詞“漲”詞性為 “v” (動(dòng)詞),該詞前面的修飾詞 (“同比”、“大”)不存在否定副詞.“漲”的子節(jié)點(diǎn)為“金額”,而“金額”的子節(jié)點(diǎn)包含主體“萬科”和方面詞“銷售”,且關(guān)系都為ATT(定中關(guān)系),表示這兩個(gè)詞都是“金額”的某種屬性.另外,主體類型的元素“公司(萬科)”在句子中唯一,觸發(fā)詞子節(jié)點(diǎn)是方面詞“銷售”.因此,可以從該句中抽取一個(gè)“銷售上漲事件”,即“萬科(Entity)|銷售(Event type)|漲(Trigger)|五月 (Time)”.

        圖3 句法樹關(guān)系Fig.3 Parse tree

        3.1.2 財(cái)經(jīng)事件抽取規(guī)則與步驟

        本文設(shè)計(jì)的財(cái)經(jīng)事件抽取模板如表1,其中Ec和Es分別表示公司和股票主體,C表示修飾詞.需要說明的是,該表只列出了部分具有代表性的依存路徑.

        本文抽取財(cái)經(jīng)事件的基本步驟如下:

        1)敏感句提取.為了避免觸發(fā)詞太多導(dǎo)致相關(guān)事件抽取太多太龐雜,同時(shí)使事件抽取更具有針對性,本文使用財(cái)經(jīng)類新聞包含觸發(fā)動(dòng)詞的句子作為敏感句.

        表1 金融事件抽取模板Table 1 Template of the extraction of financial events

        2)命名實(shí)體識別.通過實(shí)驗(yàn)的主體股票、公司、代碼等名稱符號,過濾掉和目標(biāo)股票不相關(guān)的事件句子.

        3)句法樹分析.本文借助NLPIR(哈工大句法樹)進(jìn)行句法樹分析,根據(jù)句子中主體、客體、修飾詞(方向詞)的相應(yīng)模式分類.

        4)獲取事件的時(shí)間元素.首先獲取敏感句中的時(shí)間元素,如果是直接對應(yīng)于事件,則抽取為時(shí)間元素.如果敏感句中沒有,則抽取上下句(本自然段)中的時(shí)間元素.

        5)去重.對于在不同文章中報(bào)道的相同事件,將去除掉重合的事件.本文依據(jù)事件Pattern進(jìn)行分類,去除重合事件,通過交叉對比完善事件信息.

        6)以首次報(bào)道為準(zhǔn).對于在新聞文本中多次出現(xiàn)的事件,以首次報(bào)道的時(shí)間為財(cái)經(jīng)新聞事件的發(fā)布時(shí)間,并以該發(fā)布時(shí)間計(jì)算事件的影響.

        3.2 新聞事件信號產(chǎn)生規(guī)則

        提取財(cái)經(jīng)新聞事件后,需要分析財(cái)經(jīng)新聞與股價(jià)的關(guān)系,再依據(jù)一定的規(guī)則對每類新聞事件產(chǎn)生交易信號.本文首先預(yù)定義每一類新聞事件對股價(jià)正面或負(fù)面的影響力;然后利用統(tǒng)計(jì)方法分析不同類新聞事件與股票收益之間的關(guān)系,據(jù)此產(chǎn)生“買入”和“賣出”的新聞信號.

        首先分析每一類事件影響力的強(qiáng)度I,對上述14類事件根據(jù)專家意見預(yù)定義各自的影響力(Predefined impact),再分析預(yù)定義影響力和日均收益(Average return)之間的關(guān)系,通過統(tǒng)計(jì)分析驗(yàn)證新聞事件與股票價(jià)格之間的關(guān)系.本文用收益來評估新聞事件與股價(jià)的關(guān)系.股票i在事件報(bào)道后x日的收益Rix可基于股票收盤價(jià)(Closing price)按照如下公式計(jì)算:

        其中Pi代表事件報(bào)道前一天的收盤價(jià),x表示計(jì)算收益經(jīng)過的天數(shù),其中x≥0.

        如果在一段時(shí)間內(nèi)有多個(gè)同類事件報(bào)道,采用影響力衰減曲線計(jì)算每個(gè)事件對當(dāng)日股價(jià)的影響.對于一個(gè)在x天前報(bào)道的事件,其影響力衰減曲線的計(jì)算公式如下:

        其中I0為事件當(dāng)日產(chǎn)生的影響,Ix為x日后產(chǎn)生的影響.

        如果某一類事件的影響力通過了統(tǒng)計(jì)檢驗(yàn),本文便根據(jù)其對股價(jià)x日后的影響力Ix產(chǎn)生“買入”和“賣出”交易信號.然后再綜合技術(shù)指標(biāo)信號輸入到自動(dòng)交易模型中.綜合N類事件影響力方法如下:

        如果所有類事件的影響力加權(quán)大于0則發(fā)出“買入”信號,小于0則發(fā)出一個(gè)“賣出”的信號,其余則為0.

        表2 技術(shù)指標(biāo)信號介紹Table 2 Introduction of technical indicators

        4 技術(shù)指標(biāo)信號

        相比于公司的新聞事件數(shù)據(jù),技術(shù)指標(biāo)容易從市場交易數(shù)據(jù)中得到,而且具有較強(qiáng)的可操作性,因此技術(shù)分析在業(yè)界得到廣泛應(yīng)用.參考相關(guān)文獻(xiàn)[27?28],本文選擇了10個(gè)常用的技術(shù)指標(biāo)產(chǎn)生的交易信號作為ANN模型的輸入.這10個(gè)技術(shù)指標(biāo)分別為:指數(shù)平滑移動(dòng)平均線指標(biāo)(Moving average convergence divergence,MACD)、價(jià)格變動(dòng)率指標(biāo)(Price rate-of-change,ROC)、區(qū)間突破指標(biāo)(Trading range breakout rule,TRB)、離散指標(biāo)(Accumulation/distribution oscillator,A/D)、差異指標(biāo)(Disparity indicator,Dis)、變長移動(dòng)平均指標(biāo)(Variable length moving average,VMA)、簡易移動(dòng)值(Ease of movement value,EMV)、順勢指標(biāo)(Commodity channel index,CCI)、支撐壓力指標(biāo)(Resistance/support indicator,S/R)、相對強(qiáng)弱指標(biāo)(Relative strength index,RSI).

        表2報(bào)告了上述10個(gè)技術(shù)指標(biāo)的英文簡稱、相關(guān)公式以及相應(yīng)的買入、賣出和持有信號產(chǎn)生的條件.

        5 實(shí)驗(yàn)分析

        本小節(jié)通過實(shí)驗(yàn)驗(yàn)證基于ANN模型的自動(dòng)交易框架以及財(cái)經(jīng)新聞事件在模型中的作用.首先,獲取財(cái)經(jīng)新聞事件并分析其與股價(jià)之間的關(guān)系;再考察新聞事件信號與技術(shù)指標(biāo)信號在ANN自動(dòng)交易模型中的作用;最后對比ANN與ANN-News模型的表現(xiàn),評估驗(yàn)證ANN-News模型的有效性.

        5.1 實(shí)驗(yàn)準(zhǔn)備

        5.1.1 新聞數(shù)據(jù)集

        基于ANN模型的自動(dòng)交易系統(tǒng)使用的財(cái)經(jīng)新聞文本來自于多家中文網(wǎng)站財(cái)經(jīng)板塊,經(jīng)過清洗、去重、分詞和詞性標(biāo)注等預(yù)處理程序.為保證綜合量化的有效性和公平性,忽略每月僅有1篇以下新聞的網(wǎng)站.處理新聞時(shí)不區(qū)分“原創(chuàng)”和“轉(zhuǎn)載”,也不考慮網(wǎng)站權(quán)威性和影響力,財(cái)經(jīng)事件以最先發(fā)布時(shí)間為準(zhǔn).利用網(wǎng)絡(luò)新聞爬行器,本文采集了來自中國證券網(wǎng)、鳳凰財(cái)經(jīng)、和訊財(cái)經(jīng)等30多家新聞網(wǎng)站的新聞報(bào)道共計(jì)653624篇.經(jīng)過清洗等預(yù)處理,最后獲得與金融消息相關(guān)的財(cái)經(jīng)新聞共13813篇,時(shí)間區(qū)間為2015年1月1日~2016年12月31日.

        利用本文提出的財(cái)經(jīng)事件抽取方法以及相應(yīng)的“清洗提純”步驟,抽取“滬深300”股票的相關(guān)新聞事件,最終獲得可以使用的新聞事件數(shù)據(jù)集,包括14類新聞事件共7063條,各類財(cái)經(jīng)事件數(shù)量統(tǒng)計(jì)如圖4所示:

        圖4 金融事件統(tǒng)計(jì)Fig.4 Count of financial events

        5.1.2 股價(jià)數(shù)據(jù)集

        數(shù)據(jù)集1“滬深300”股價(jià)數(shù)據(jù)集2本文以2016年6月修訂版的“滬深300”股票為研究對象,樣本股交易數(shù)據(jù)來源于Wind數(shù)據(jù)庫..對應(yīng)于新聞數(shù)據(jù)集的時(shí)間區(qū)間,該數(shù)據(jù)集包含從2015年1月1日至2016年12月31日之間488個(gè)交易日的“滬深300”股票的收盤價(jià),以及相應(yīng)時(shí)間區(qū)間內(nèi)計(jì)算事件報(bào)道后x天的收益Rx及相關(guān)技術(shù)指標(biāo)所需的股票交易數(shù)據(jù).

        數(shù)據(jù)集2自選股價(jià)數(shù)據(jù)集.隨機(jī)選取滬深股市中“滬深300”股票以外的300支股票,時(shí)間區(qū)間同樣為2015年1月1日至2016年12月31日,構(gòu)建了一個(gè)包含488個(gè)交易日收盤價(jià)以及計(jì)算相應(yīng)時(shí)間區(qū)間內(nèi)Rx及相關(guān)技術(shù)指標(biāo)所需的股票交易數(shù)據(jù).

        本文隨機(jī)選取各數(shù)據(jù)集中80%的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),其余20%作為測試數(shù)據(jù).

        5.1.3 模型評價(jià)指標(biāo)

        本文使用預(yù)測準(zhǔn)確率(Accuracy)和平均收益率(Average return)來評估ANN模型的效果并分析新聞信號的效用.預(yù)測準(zhǔn)確率采用常用的“真陽”(True positive,TP),“假陽” (False positive,FP),“真陰”(True negative,TN)以及“假陰”(False negative,FN)來確定,具體見式(5).平均收益率為所有預(yù)測收益率的平均值,本文假設(shè)所有“買入”和“賣出”的股票的權(quán)重是相同的,N支股票在x天內(nèi)的平均收益率Ave(R)x見式(6).

        5.2 財(cái)經(jīng)事件與股價(jià)關(guān)系檢驗(yàn)

        表3列出了Rx與事件關(guān)系的統(tǒng)計(jì)分析結(jié)果.對于每一類事件,計(jì)算事件報(bào)道當(dāng)日的收益R0.類似地,本文也計(jì)算事件報(bào)道后第1、2、5、10天的收益.對于每類事件,計(jì)算專家給出的影響力正負(fù)與股價(jià)波動(dòng)的方向(上漲或下跌)之間的關(guān)系,并計(jì)算專家給出的“方向”的正確比例.當(dāng)某支股票在事件報(bào)道后股價(jià)上揚(yáng),如預(yù)定義影響力為正就算一次“正確”預(yù)測.同理,若某支股票在事件報(bào)道后股價(jià)下跌,若預(yù)定義影響力為負(fù)就算一次“正確”預(yù)測.根據(jù)該規(guī)則,本文計(jì)算出相關(guān)比例并用d表示.另外,本文對影響的顯著程度進(jìn)行了雙尾t-檢驗(yàn),相關(guān)結(jié)果用p表示.表3列出了財(cái)經(jīng)事件與股票收益的統(tǒng)計(jì)分析結(jié)果.

        觀察表3可以發(fā)現(xiàn)股票收益與預(yù)定義影響力方向一致約有54%到60%的正確率.即如果專家預(yù)測為正面影響,則R0、R1、R2、R5、R10收益大多數(shù)都為正;如果專家預(yù)測為負(fù)面影響,則R0、R1、R2、R5、R10大多數(shù)收益為負(fù).有兩類事件的方向是波動(dòng)的,即“公司高層變動(dòng)”與“公司業(yè)務(wù)擴(kuò)張”.專家認(rèn)為這兩類事件的影響都是輕微的正向,而實(shí)際產(chǎn)生的收益有時(shí)是輕微正向,有時(shí)又是輕微負(fù)向.由于這兩類事件的樣本數(shù)比較少,且可能受其他事件干擾,而這種小的負(fù)面收益在95%的置信水平上也是不顯著的.總體而言,本文所使用的預(yù)定義影響力評估是可靠的.

        當(dāng)考慮R0時(shí),產(chǎn)生最高收益的事件是“股價(jià)上漲”,其平均收益為1.71%,有84% 的該類型事件報(bào)道后產(chǎn)生了一個(gè)正面收益.意味著大部分該類型事件會產(chǎn)生正面收益,該類型事件會對價(jià)格產(chǎn)生一個(gè)向上的驅(qū)動(dòng).當(dāng)然,在某些情況下,與該類事件同現(xiàn)的其他事件會產(chǎn)生向下的價(jià)格驅(qū)動(dòng)力主導(dǎo)價(jià)格波動(dòng).總之,“股價(jià)上漲”事件是一個(gè)比較強(qiáng)烈的信號,容易主導(dǎo)價(jià)格波動(dòng).

        從短期收益來看,即當(dāng)考慮R0,R1和R2收益時(shí),有三類事件同時(shí)在統(tǒng)計(jì)上非常顯著,而且顯示了和專家標(biāo)注的影響力相同的方向.這三類事件分別為:股價(jià)上漲、股價(jià)下跌和公司業(yè)績上揚(yáng).從長期收益來看,例如,當(dāng)考慮R5和R10收益的時(shí)候,我們發(fā)現(xiàn)更多的事件與專家標(biāo)注的方向仍顯著相關(guān),如“公司利潤上升”、“公司利潤下滑”.由此可見,一些財(cái)經(jīng)新聞事件會經(jīng)過一定的發(fā)酵,在相對長久的時(shí)間內(nèi)發(fā)揮影響力.

        表3 財(cái)經(jīng)事件與股價(jià)收益統(tǒng)計(jì)分析Table 3 Statistic on the relationship between financial events and stock returns

        預(yù)定義的事件影響力和產(chǎn)生的平均收益之間的線性關(guān)系可以通過皮爾遜相關(guān)(Person′s correlation)系數(shù)來確定.表4報(bào)告了預(yù)定義影響力和收益Rx之間的關(guān)系,說明收益和預(yù)定義影響力之間是顯著的、正面相關(guān)的關(guān)系.觀察表4可以得出兩個(gè)結(jié)論:首先,財(cái)經(jīng)事件對股價(jià)的影響力是顯著的,可以從新聞中獲取的事件信息與技術(shù)指標(biāo)信號融合.第二,預(yù)定義事件影響力和股價(jià)波動(dòng)緊密,且影響力強(qiáng)度與股價(jià)波動(dòng)幅度具有較強(qiáng)的線性相關(guān)性.

        表4 預(yù)定義影響力和收益Rx的關(guān)系Table 4 Relationship between predefined impact andRx

        5.3 輸入信號質(zhì)量分析

        根據(jù)技術(shù)指標(biāo)的計(jì)算方法,本文在數(shù)據(jù)集1和數(shù)據(jù)集2上針對每一支股票計(jì)算其于當(dāng)天的“買入(+1)” “賣出 (?1)” 或 “持有 (0)” 的信號.照此方法獲得ANN模型的輸入部分,即每日每一支股票的10個(gè)信號.ANN模型的輸出部分為該支股票1日、5日的收益.為了便于比較和訓(xùn)練,取“賣出”信號1日、5日收益率的相反數(shù).本文為展現(xiàn)輸入信號的質(zhì)量,統(tǒng)計(jì)包括新聞在內(nèi)的11組交易信號“買入”和“賣出”發(fā)生后的收益,考察這11組信號的質(zhì)量.

        表5展示了數(shù)據(jù)集1使用技術(shù)信號與新聞事件信號進(jìn)行交易所獲得的平均收益3數(shù)據(jù)集2的技術(shù)信號結(jié)果與此類似,篇幅限制,在此不作報(bào)告.,R1、R2、R5分別表示信號產(chǎn)生1、2、5天之后的平均收益率.由表5可見,新聞事件發(fā)出“買入”信號后,產(chǎn)生的1、2、5日的平均收益都為正;發(fā)出“賣出”信號后,產(chǎn)生的1、2、5日的平均收益絕大部分為負(fù),說明“買入”和“賣出”信號都是基本準(zhǔn)確的.綜合多頻次的分析可以發(fā)現(xiàn),本文所選取的新聞事件所產(chǎn)生的交易信號對股票交易而言是有效的,可以作為股票自動(dòng)交易信號源的輸入.

        比較獨(dú)立使用新聞信號與獨(dú)立使用技術(shù)指標(biāo)信號所產(chǎn)生的不同情況.從表5展示的結(jié)果看,技術(shù)指標(biāo)產(chǎn)生的買入信號在1、2、5天后的平均收益都為正,說明買入信號質(zhì)量比較高.使用技術(shù)信號“賣出”時(shí)的收益并不都為負(fù),如CCI的交易信號會在2日后消失,A/D、Dis、SR、RSI的信號會在5日后消失,但總體效果仍比較理想.由表5可知,就中國市場而言,VMA(變長移動(dòng)平均)策略產(chǎn)生的收益最高.對比新聞事件信號與技術(shù)信號產(chǎn)生的收益可以發(fā)現(xiàn),新聞信號獲得的收益“更高”.說明新聞信號對于股票買賣時(shí)機(jī)的選擇更精準(zhǔn).另外,這兩方面獲得的信號啟示我們可以進(jìn)一步地融合新聞事件與技術(shù)指標(biāo)的信號,以獲得更穩(wěn)健的收益.

        表5 數(shù)據(jù)集1技術(shù)信號與新聞信號收益統(tǒng)計(jì)Table 5 Statistics of the returns generated by technical and news signals on Dataset 1

        5.4 ANN與ANN-News對比分析

        本節(jié)通過設(shè)置不同的參數(shù)對比分析ANN與ANN-News模型在輸入相同技術(shù)指標(biāo)信號條件下的表現(xiàn),分析新聞事件信號對ANN模型表現(xiàn)的效用.

        5.4.1 參數(shù)設(shè)置

        隱藏層神經(jīng)元的個(gè)數(shù)n1和n2,梯度下降法的學(xué)習(xí)率lr,動(dòng)量恒定值mc以及迭代次數(shù)ep是ANN模型的關(guān)鍵參數(shù).參考神經(jīng)網(wǎng)絡(luò)參數(shù)學(xué)習(xí)的相關(guān)文獻(xiàn)[27?28],本文將迭代次數(shù)ep設(shè)置為1000次.為了避免臨近最佳點(diǎn)時(shí)產(chǎn)生動(dòng)蕩從而致使無法收斂的現(xiàn)象,使用一個(gè)較小的學(xué)習(xí)率lr值(0.01).

        本文嘗試了 10個(gè)n1參數(shù) [41,42,···,50],10 個(gè)n2參數(shù) [26,27,···,35],9 個(gè)mc參數(shù)[0.1,0.2,···,0.9].ANN 參數(shù)設(shè)置總共有10×10×9=900(n1×n2×mc)種.將每種參數(shù)組合都應(yīng)用至數(shù)據(jù)集1和數(shù)據(jù)集2的訓(xùn)練集和測試集,按照上述參數(shù)設(shè)置進(jìn)行900組實(shí)驗(yàn),每組實(shí)驗(yàn)進(jìn)行10次,評估模型預(yù)測的準(zhǔn)確性.選擇表現(xiàn)最好的參數(shù)組合作為相應(yīng)模型的參數(shù).所有的實(shí)驗(yàn)都是基于MATLAB神經(jīng)網(wǎng)絡(luò)工具包完成的.

        5.4.2 參數(shù)組合分析

        首先在ANN模型上進(jìn)行參數(shù)實(shí)驗(yàn).分析實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),ANN模型在訓(xùn)練集上的準(zhǔn)確率在65.53%~78.60% 之間;在測試集上的準(zhǔn)確率在59.17%~72.03%之間.總的來看,ANN模型的參數(shù)設(shè)置對訓(xùn)練集和測試集都很重要且顯著,但ANN模型在訓(xùn)練集上的效果要好于測試集.需要說明的是,訓(xùn)練集獲得最好的效果和測試集獲得最好的效果并不是同一組參數(shù)組合.為進(jìn)一步對比ANN模型和ANN-News模型,計(jì)算訓(xùn)練和測試集合上的每一組參數(shù)組合的表現(xiàn),選擇其中性能最佳的3個(gè)參數(shù)組合.表6給出了最佳的3個(gè)參數(shù)組合以及相應(yīng)的預(yù)測準(zhǔn)確率.

        表6 表現(xiàn)最佳的3組ANN參數(shù)組合Table 6 The best three combinations of ANN model_

        由表6中可見,這3組參數(shù)在訓(xùn)練集和測試集上都獲得較高的準(zhǔn)確率,相應(yīng)的測試集的準(zhǔn)確率都比訓(xùn)練集要低.另外,3組參數(shù)在n1取值上都比較近似(49左右),在n2和mc這兩個(gè)參數(shù)上取值差別比較大.總體而言,上述參數(shù)組合是相似的.由于第三組平均測試的準(zhǔn)確率比其他兩組要高,總體表現(xiàn)比其他組合效果好,可認(rèn)為這一組是ANN模型最佳的參數(shù)組合.

        模型參數(shù)對準(zhǔn)確率的影響.本文對比了ANN模型、ANN-News模型以及文獻(xiàn)[27?28]中的1個(gè)隱藏層的ANN模型.圖5展示了數(shù)據(jù)集1的測試集上,使用不同參數(shù)對準(zhǔn)確率的影響.由圖可見,本文設(shè)計(jì)的雙隱藏層的ANN和ANN-News模型的準(zhǔn)確率比單隱藏層的ANN模型準(zhǔn)確率要高.究其原因,可能是由于雙隱藏層的ANN對股價(jià)波動(dòng)的解析更徹底.雙隱藏層的ANN模型在自動(dòng)交易上比單隱層的ANN模型更適用.另外,總體而言n1對模型的準(zhǔn)確率影響不大,對n1(單隱藏層取n)進(jìn)行參數(shù)實(shí)驗(yàn),發(fā)現(xiàn)ANN-News的準(zhǔn)確率變化不大,但是對單隱層和雙隱層的ANN模型影響較大,準(zhǔn)確率隨N增大呈上升趨勢,至49達(dá)到頂峰.

        圖5 ANN模型準(zhǔn)確率Fig.5 Accuracy of ANN

        模型準(zhǔn)確率與收益率之間的關(guān)系.一般認(rèn)為,準(zhǔn)確率高則收益率高.圖6展示了ANN模型準(zhǔn)確率與收益率之間的關(guān)系,由圖可知這二者之間并不是線性關(guān)系.由于所有個(gè)股的權(quán)重是一致的,因此準(zhǔn)確率和收益率并不完全成正比關(guān)系,準(zhǔn)確率高的收益率未必最高.通過該圖與上文中技術(shù)指標(biāo)和新聞信號收益率(表5)對比可以發(fā)現(xiàn),利用ANN模型綜合技術(shù)指標(biāo)信號和新聞信號,可以有效提升股票收益率.但是由于該模型并未針對收益率作專門的優(yōu)化,即未能突出收益率高的個(gè)股,因此該模型在收益率上并沒有明顯的提升.

        圖6 ANN模型準(zhǔn)確率與收益率Fig.6 The accuracy and return rate of ANN

        5.4.3 新聞信號有效性分析

        參照第5.4.1節(jié)的參數(shù)設(shè)置對ANN-News模型進(jìn)行實(shí)驗(yàn).根據(jù)實(shí)驗(yàn)結(jié)果,討論新聞信號在ANNNews模型中的作用.由于新聞數(shù)據(jù)集只包含“滬深300”股票的新聞,本節(jié)實(shí)驗(yàn)只在數(shù)據(jù)集1上進(jìn)行.由于新聞數(shù)據(jù)集中并非每天對每一支“滬深300”股票都有相關(guān)的財(cái)經(jīng)新聞,對于沒有新聞信號的股票,本文全部默認(rèn)設(shè)置為0(持有).

        對比ANN和ANN-News模型在使用相同參數(shù)設(shè)置下的表現(xiàn).表7展示了ANN和ANN-News模型的對比結(jié)果.由表7可見,在相同參數(shù)設(shè)置下(第1~3行),ANN-News與ANN 模型的表現(xiàn)差別不大.經(jīng)過實(shí)驗(yàn),發(fā)現(xiàn)ANN-News使用第4組參數(shù)組合(n1=49,n2=34,mc=0.5)時(shí)表現(xiàn)最佳,說明ANN-News可以獲得比原ANN模型更好的性能,且ANN-News的最佳參數(shù)組合與ANN并不一致.總體上有新聞參數(shù)比沒有新聞參數(shù)要好,且使用ANN模型最好的3組參數(shù)時(shí)表現(xiàn)都比原模型好.從穩(wěn)定性上看,ANN-News模型在訓(xùn)練集和測試集合上的差別比ANN模型的差別要略大,說明ANN-News模型的穩(wěn)定性略差.總體而言,雖然ANN模型在個(gè)別參數(shù)下表現(xiàn)比ANN-News模型好一些(第2組參數(shù)組合的測試集),但是ANN-News模型可以有效提升預(yù)測準(zhǔn)確率,且這樣的準(zhǔn)確率提升是穩(wěn)定的.

        表7 ANN與ANN-News模型對比Table 7 Comparison between ANN and ANN-News

        對比ANN模型和ANN-News模型的準(zhǔn)確率和收益率.設(shè)置相同參數(shù),分析ANN和ANN-News模型的準(zhǔn)確率和收益率.圖7展示了ANN和ANNNews模型在相同參數(shù)條件下準(zhǔn)確率.圖中的點(diǎn)都是經(jīng)過10次實(shí)驗(yàn)取得的平均值.由圖7可見,ANN和ANN-News的準(zhǔn)確率隨著變量mc值的增加而呈現(xiàn)一個(gè)先較快增長后略微下降的過程.包含新聞信號輸入的ANN-News模型準(zhǔn)確率提升了大約5%左右.

        圖8展示了ANN和ANN-News模型在相同參數(shù)條件下收益率.同樣地,從圖8中可見,收益率也存在一個(gè)隨著mc值先增長再略微下降的過程.經(jīng)計(jì)算,ANN-News模型收益率在ANN模型基礎(chǔ)上平均提升了大約7%左右.

        由圖7、圖8可見,ANN-News模型比ANN模型在準(zhǔn)確率和收益率上都更高,說明使用ANNNews通過參數(shù)訓(xùn)練,在交易時(shí)機(jī)選擇上更精準(zhǔn),而且可以獲得更高的收益率.選擇表現(xiàn)最佳的ANN和ANN-News,發(fā)現(xiàn)最佳性能的ANN效果與最佳的ANN-News效果仍然存在差距,這證明了無論是從準(zhǔn)確率還是從收益率角度,新聞信號對最終結(jié)果的表現(xiàn)都存在正面影響,利用新聞事件信息可以有效提升模型整體的收益率.

        圖7 ANN與ANN-News模型準(zhǔn)確率對比Fig.7 Comparison of the accuracy between ANN and ANN-News

        圖8 ANN與ANN-News模型收益率對比Fig.8 Comparison of the return between ANN and ANN-News

        穩(wěn)定性分析.設(shè)置不同的參數(shù),分析ANN和ANN-News模型的穩(wěn)定性.由圖7、圖8可見,當(dāng)n1和n2固定之后,變動(dòng)mc的值,發(fā)現(xiàn)對于準(zhǔn)確率而言,mc與準(zhǔn)確率并不是線性關(guān)系,準(zhǔn)確率先隨著mc的增大而增大,當(dāng)mc=0.7的時(shí)候達(dá)到了頂點(diǎn).但收益率與準(zhǔn)確率的變化趨勢并不是一致的.收益率基本呈現(xiàn)一個(gè)上升的過程,當(dāng)mc=0.8左右的時(shí)候達(dá)到了頂點(diǎn).

        參數(shù)n1和n2與準(zhǔn)確率的關(guān)系也有著類似的情況.在穩(wěn)定性方面,ANN和ANN-News模型的差別不大,但ANN總體上要比ANN-News穩(wěn)定一些,這可能是由于ANN-News采用了新聞事件信號所導(dǎo)致.

        5.5 與經(jīng)典機(jī)器學(xué)習(xí)模型對比

        股價(jià)預(yù)測中經(jīng)常使用到經(jīng)典的機(jī)器學(xué)習(xí)模型[27?28].本小節(jié)主要對比 ANN 模型與 SVM,Na¨?ve Bayes模型.重點(diǎn)考察本文使用的ANN 模型與同樣輸入的SVM、Na¨?ve Beiyes模型在準(zhǔn)確率、收益率方面的表現(xiàn).通過對比實(shí)驗(yàn),分析多源數(shù)據(jù)驅(qū)動(dòng)與單源數(shù)據(jù)驅(qū)動(dòng)以及不同的模型之間的區(qū)別.表8展示了本文利用第5.1.2節(jié)介紹的股價(jià)數(shù)據(jù)集(80%)進(jìn)行訓(xùn)練,并使用測試數(shù)據(jù)集(其余20%)進(jìn)行預(yù)測的情況.括號內(nèi)為準(zhǔn)確率和收益率的波動(dòng)情況(單位與括號外相同),SVM 和Na¨?ve Bayes模型的參數(shù)設(shè)置參考文獻(xiàn)[27?28].由表8可知:1)從準(zhǔn)確率和收益率角度來看,多源數(shù)據(jù)驅(qū)動(dòng)比單源數(shù)據(jù)驅(qū)動(dòng)的模型總體上效果更好:由于多了新聞數(shù)據(jù)源,SVM-News 和 Na¨?ve Bayes-News 比單獨(dú)使用技術(shù)因子信號的SVM和Na¨?ve Bayes模型要好,該結(jié)論與ANN模型是一致的,也說明本文提出的技術(shù)框架有較強(qiáng)的泛化能力.但SVM 和Na¨?ve Bayes模型增加了新聞信號的穩(wěn)健性略差.2)ANN-News比SVM-News 以及 Na¨?ve Bayes-News 準(zhǔn)確率高約 4個(gè)百分點(diǎn)左右,在收益率上比其他傳統(tǒng)(ANN)模型高出0.097(約為ANN模型收益率的7%)左右,總體表現(xiàn)也較穩(wěn)健,進(jìn)一步說明本文設(shè)計(jì)的ANN模型更為有效.

        篇幅限制,本文未報(bào)告更多案例,下一步將多源數(shù)據(jù)驅(qū)動(dòng)的ANN-News模型應(yīng)用到更多實(shí)例中去以檢驗(yàn)其性能.

        表8 ANN模型與經(jīng)典模型對比Table 8 The comparison among ANN and other classical models

        6 結(jié)論與展望

        股票的自動(dòng)交易系統(tǒng)需要獲取多方面的信息并加以綜合利用.本文以ANN模型為基礎(chǔ),提出了一個(gè)新聞數(shù)據(jù)和交易數(shù)據(jù)共同驅(qū)動(dòng)的自動(dòng)交易模型,并成功應(yīng)用至股票自動(dòng)交易系統(tǒng).為獲取新聞事件信息,本文設(shè)計(jì)事件抽取框架從互聯(lián)網(wǎng)新聞文本中抽取多類新聞事件,通過定量分析產(chǎn)生交易信號.在“滬深300”和自選股價(jià)數(shù)據(jù)集兩年的交易數(shù)據(jù)集上的實(shí)驗(yàn)顯示,將新聞事件信號作為輸入加入到模型中能產(chǎn)生比單獨(dú)使用技術(shù)指標(biāo)信號更高的收益,考慮了新聞因素的ANN-News模型比其他類傳統(tǒng)模型預(yù)測準(zhǔn)確率提高4%以上,收益能提高7%以上.總結(jié)本文工作,主要貢獻(xiàn)如下:

        1)提出了網(wǎng)絡(luò)新聞數(shù)據(jù)與歷史交易數(shù)據(jù)共同驅(qū)動(dòng)的自動(dòng)交易模型,構(gòu)建了考慮新聞事件的基于ANN模型的自動(dòng)交易框架.

        2)提出了從中文新聞文本中有效提取財(cái)經(jīng)新聞事件的方法,設(shè)計(jì)了中文財(cái)經(jīng)事件抽取方法并利用實(shí)際數(shù)據(jù)驗(yàn)證了該方法.

        3)利用實(shí)際數(shù)據(jù)驗(yàn)證了股票自動(dòng)交易框架的性能,從準(zhǔn)確度、收益率等角度對比分析了考慮新聞信號和不考慮新聞信號的ANN模型.

        結(jié)合相關(guān)工作的最新進(jìn)展,下一步研究將重點(diǎn)聚焦以下方面:1)在處理新聞與交易決策方面作更深入的研究,搜集整理更豐富的財(cái)經(jīng)事件數(shù)據(jù),借助模型具體地分析每一類的新聞事件對ANN模型效果的影響.2)在新聞信號與技術(shù)指標(biāo)信號融合方面,下一步將探討更優(yōu)的新聞信號產(chǎn)生方法,并設(shè)計(jì)更優(yōu)化的模型以融合新聞事件信息與技術(shù)指標(biāo)信號.3)考慮直接使用新聞文本數(shù)據(jù)作為原始數(shù)據(jù),構(gòu)建更自動(dòng)化的多源數(shù)據(jù)驅(qū)動(dòng)機(jī)器學(xué)習(xí)模型,通過計(jì)算機(jī)自動(dòng)提取特征數(shù)據(jù)并在測試中提高模型的性能.

        猜你喜歡
        信號模型
        一半模型
        信號
        鴨綠江(2021年35期)2021-04-19 12:24:18
        重要模型『一線三等角』
        完形填空二則
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        孩子停止長個(gè)的信號
        3D打印中的模型分割與打包
        基于LabVIEW的力加載信號采集與PID控制
        一種基于極大似然估計(jì)的信號盲抽取算法
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        亚洲欧美日韩综合久久| 国产精品成人自拍在线观看| а天堂中文地址在线| 亚洲熟妇av日韩熟妇在线 | 无码中文字幕在线DVD| 国产乱子伦农村xxxx| 我想看久久久一级黄片| 成人自慰女黄网站免费大全 | 精品人妻伦九区久久aaa片69| 国产女精品| 国产av一区网址大全| 极品尤物在线精品一区二区三区| 亚洲中文字幕无码天然素人在线 | 成年女人a级毛片免费观看| 国产自偷亚洲精品页65页| 亚洲av在线播放观看| 黄片免费观看视频播放| 国产a级三级三级三级| 亚洲中文字幕无码mv| 日韩不卡av高清中文字幕 | 极品少妇被黑人白浆直流| 特级av毛片免费观看| 91人妻无码成人精品一区91| 亚洲全国最大的人成网站| 久久久亚洲熟妇熟女av| 免费a级作爱片免费观看美国| 在线看片无码永久免费aⅴ| 久久亚洲一级av一片| 久草手机视频在线观看| 夫妇交换性三中文字幕| 亚洲精品无码久久毛片| 东京热加勒比日韩精品| 久久精品蜜桃亚洲av高清| 日韩av东京社区男人的天堂| 精品免费福利视频| av在线不卡一区二区三区| 亚洲av中文无码字幕色本草| 婷婷五月综合缴情在线视频 | av天堂午夜精品一区| 日日碰狠狠躁久久躁96avv| 天堂Av无码Av一区二区三区|