亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)分析的應(yīng)用案例
        ——投資模型的穩(wěn)健性

        2017-05-24 14:45:22覃雄派陳躍國(guó)王邦國(guó)
        計(jì)算機(jī)應(yīng)用 2017年3期
        關(guān)鍵詞:模型

        覃雄派,陳躍國(guó),王邦國(guó)

        (1.中國(guó)人民大學(xué) 信息學(xué)院, 北京 100872; 2.教育部數(shù)據(jù)工程與知識(shí)工程重點(diǎn)實(shí)驗(yàn)室(中國(guó)人民大學(xué)), 北京 100872) (*通信作者電子郵箱chenyueguo@ruc.edu.cn)

        大數(shù)據(jù)分析的應(yīng)用案例
        ——投資模型的穩(wěn)健性

        覃雄派1,2,陳躍國(guó)1,2*,王邦國(guó)1,2

        (1.中國(guó)人民大學(xué) 信息學(xué)院, 北京 100872; 2.教育部數(shù)據(jù)工程與知識(shí)工程重點(diǎn)實(shí)驗(yàn)室(中國(guó)人民大學(xué)), 北京 100872) (*通信作者電子郵箱chenyueguo@ruc.edu.cn)

        交易模型的穩(wěn)健性,指的是該模型的利潤(rùn)率曲線的波動(dòng)性較小,沒(méi)有大起大落。針對(duì)一個(gè)基于支持向量回歸(SVR)技術(shù)的算法交易模型的穩(wěn)健性問(wèn)題,提出了使用若干導(dǎo)出指標(biāo)訓(xùn)練統(tǒng)一的交易模型的策略,以及投資組合多樣化的方法。首先,介紹基于支持向量回歸技術(shù)的算法交易模型;然后,基于常用指標(biāo),構(gòu)造了若干導(dǎo)出指標(biāo),用于股票價(jià)格的短期預(yù)測(cè)。這些指標(biāo),刻畫(huà)了近期價(jià)格運(yùn)動(dòng)的典型模式、超買(mǎi)/超賣(mài)市場(chǎng)狀態(tài),以及背離市場(chǎng)狀態(tài)。對(duì)這些指標(biāo)進(jìn)行了規(guī)范化,用于訓(xùn)練交易模型,使得模型可以泛化到不同的股票;最后,設(shè)計(jì)了投資組合多樣化方法。在投資組合里,各個(gè)股票之間的相關(guān)性,有時(shí)會(huì)導(dǎo)致較大的投資損失;因?yàn)榫哂休^強(qiáng)相關(guān)關(guān)系的股票,其價(jià)格朝相同方向變化。如果交易模型預(yù)測(cè)的價(jià)格走勢(shì)不正確,引起止損操作,那么這些具有較強(qiáng)相關(guān)關(guān)系的股票,將引發(fā)雪崩式的止損,于是導(dǎo)致?lián)p失加劇。把股票根據(jù)相似性聚類(lèi)到不同類(lèi)別,通過(guò)從不同聚類(lèi)類(lèi)別中選擇若干股票來(lái)構(gòu)成多樣化的投資組合,其中,股票的相似性,通過(guò)交易模型在不同股票上近期的利潤(rùn)曲線的相似度進(jìn)行計(jì)算。在900只股票10年的價(jià)格大數(shù)據(jù)上進(jìn)行了實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果顯示,交易模型能夠獲得超過(guò)定期存款的超額利潤(rùn)率,年化利潤(rùn)率為8.06%。交易模型的最大回撤由13.23%降為5.32%,夏普指數(shù)由81.23%提高到88.79%,交易模型的利潤(rùn)率曲線波動(dòng)性降低,說(shuō)明交易模型的穩(wěn)健性獲得了提高。

        算法交易;支持向量回歸;穩(wěn)健性;投資組合多樣化;大數(shù)據(jù)

        0 引言

        算法交易,是使用復(fù)雜的計(jì)算機(jī)程序(軟件),實(shí)現(xiàn)交易過(guò)程的自動(dòng)化。這些程序使用機(jī)器學(xué)習(xí)或者數(shù)據(jù)挖掘算法,分析大量的數(shù)據(jù),進(jìn)而決定是否進(jìn)行交易,包括買(mǎi)進(jìn)還是賣(mài)出,什么時(shí)候進(jìn)行交易,以及訂單的大小等。

        算法交易具有若干優(yōu)勢(shì)。包括:1)交易模型體現(xiàn)出很強(qiáng)的一致性。2)交易模型可以同時(shí)處理多個(gè)金融資產(chǎn)(股票、期貨等)。3)交易模型進(jìn)行數(shù)據(jù)分析和執(zhí)行訂單的速度,比人更快。其中,最主要的優(yōu)勢(shì)是交易模型不像人類(lèi)投資者那樣具有情感,它僅僅依賴于數(shù)據(jù)分析結(jié)果,進(jìn)行交易決策,于是,它能夠保持一致的交易決策和行為。相反,由于人類(lèi)投資者受到自己情感的影響,在投資過(guò)程中,很難堅(jiān)持既定的原則。

        金融市場(chǎng)(股票市場(chǎng)、期貨市場(chǎng)等)是一個(gè)動(dòng)態(tài)變化的復(fù)雜系統(tǒng)[1],進(jìn)行價(jià)格預(yù)測(cè)是一件很困難的事情。著名的有效市場(chǎng)理論(Efficient Market Hypothesis, EMH)[2]指出,所有可以獲得的信息,立即反映在股票價(jià)格的變化中,只有新的信息到達(dá),才能引起股票價(jià)格的新變化。于是,對(duì)金融市場(chǎng)的價(jià)格運(yùn)動(dòng)進(jìn)行預(yù)測(cè),幾乎是不可能的,但是,信息的傳播是有一定的延遲的。另外,不同的人對(duì)接收到的同一信息,有不同的解釋。很多研究表明,一些宏觀經(jīng)濟(jì)變量(Macroeconomic Variables)和技術(shù)指標(biāo)(Technical Indicators),在一定程度上,能夠預(yù)測(cè)股票價(jià)格的未來(lái)變化。比如,文獻(xiàn)[3]的研究表明,南亞地區(qū)的四個(gè)股票市場(chǎng)的未來(lái)收益,存在一定的可預(yù)測(cè)性(Predictability)。

        在實(shí)際應(yīng)用中,世界范圍內(nèi)的各大銀行、對(duì)沖基金(Hedge Funds)廣泛采用算法交易技術(shù)和模型。根據(jù)文獻(xiàn)[4]的調(diào)查,僅僅在美國(guó),在2000年,從華爾街的算法交易系統(tǒng)發(fā)起的訂單(Order),占到全美股票交易量的40%。到2008年,這個(gè)數(shù)字攀升到60%,而到了2014年,這個(gè)數(shù)據(jù)超過(guò)了70%。

        人們采用兩種分析策略,來(lái)預(yù)測(cè)股票價(jià)格的變化,一種是基本分析(Fundamental Analysis),一種是技術(shù)分析(Technical Analysis)[5-6]。所謂基本分析,是通過(guò)分析影響股票內(nèi)在價(jià)值的各種經(jīng)濟(jì)因素,對(duì)股票價(jià)格作出預(yù)測(cè),一般用于中長(zhǎng)期預(yù)測(cè)。技術(shù)分析派,則相信歷史總會(huì)重演。他們使用作圖工具、指標(biāo)計(jì)算和數(shù)據(jù)分析工具,尋找可能盈利的價(jià)格變化模式(Pattern)。技術(shù)分析一般用于中短期價(jià)格預(yù)測(cè)。

        本文提出一種通過(guò)使用若干導(dǎo)出指標(biāo)訓(xùn)練統(tǒng)一的交易模型的策略,以及投資組合多樣化的方法,來(lái)提高交易模型的穩(wěn)健性。所謂交易模型的穩(wěn)健性,指的是模型的利潤(rùn)率曲線,具有較小的波動(dòng)性,沒(méi)有大起大落。該投資組合多樣化方法,是為一個(gè)基于支持向量回歸(Support Vector Regression, SVR)技術(shù)的交易模型服務(wù)的。本研究為該模型構(gòu)造了基于一些常用指標(biāo)的導(dǎo)出指標(biāo),這些指標(biāo)較好地刻畫(huà)了價(jià)格的變化模式、超買(mǎi)/超賣(mài)市場(chǎng)狀態(tài)以及背離市場(chǎng)狀態(tài)等。本研究首先對(duì)這些指標(biāo)進(jìn)行規(guī)范化處理,然后用于訓(xùn)練一個(gè)通用模型。訓(xùn)練后的交易模型可以用于不同的股票價(jià)格的預(yù)測(cè)。在此基礎(chǔ)上,為了實(shí)現(xiàn)投資組合的多樣化,本研究把股票聚類(lèi)到不同的類(lèi)別中。股票的相似性,定義為交易模型在這些股票上的利潤(rùn)率曲線之間的相似性。這樣定義相似性,其目的是,當(dāng)交易模型預(yù)測(cè)發(fā)生錯(cuò)誤的時(shí)候,系統(tǒng)將進(jìn)行止損,如果直接在價(jià)格數(shù)據(jù)上定義相似性,不能反映實(shí)際交易中的止損操作,是不可靠的。

        1 基于支持向量回歸的算法交易模型

        1.1 交易系統(tǒng)架構(gòu)

        本文首先介紹整個(gè)交易系統(tǒng)的架構(gòu),然后介紹交易模型細(xì)節(jié)。整個(gè)交易系統(tǒng)的各個(gè)組件及其關(guān)系,如圖1所示。本文通過(guò)交易模型的創(chuàng)建、交易模型的訓(xùn)練以及交易模型的運(yùn)行來(lái)介紹這些組件及其功能。

        圖1 交易系統(tǒng)的各個(gè)組件

        首先,本研究創(chuàng)建了一個(gè)基于SVR技術(shù)的交易模型。該模型不僅使用了一些常用的技術(shù)指標(biāo)作為輸入,還基于這些指標(biāo),構(gòu)造了一些導(dǎo)出指標(biāo),以刻畫(huà)價(jià)格的變化模式、超買(mǎi)/超賣(mài)市場(chǎng)狀態(tài)、以及背離市場(chǎng)狀態(tài)。

        接著,本研究使用股票價(jià)格數(shù)據(jù)對(duì)交易模型進(jìn)行訓(xùn)練。這些價(jià)格數(shù)據(jù)從Yahoo Finance網(wǎng)站上下載,并且保存到本地備用。Price Data Manager從本地硬盤(pán)提取價(jià)格數(shù)據(jù),饋入Indicator Generator,計(jì)算各種技術(shù)指標(biāo)。計(jì)算出來(lái)的指標(biāo),交給Trainer,以便對(duì)模型進(jìn)行訓(xùn)練。本研究從Yahoo Finance下載了900只股票、10年的價(jià)格數(shù)據(jù)。其中9年的數(shù)據(jù)用于訓(xùn)練(Training),最后1年的價(jià)格數(shù)據(jù)用于驗(yàn)證(Testing)。本研究使用遺傳算法對(duì)交易模型的參數(shù)進(jìn)行了優(yōu)化。

        為了泛化交易模型(適用于不同的股票),本研究在滑動(dòng)的時(shí)間窗口(Moving Window)內(nèi),對(duì)指標(biāo)進(jìn)行了規(guī)范化處理。價(jià)格的變化規(guī)律不僅在一只股票價(jià)格的歷史演變中重現(xiàn),而且在不同股票價(jià)格的歷史演變中重現(xiàn)。

        本研究使用驗(yàn)證數(shù)據(jù),對(duì)訓(xùn)練好的交易模型進(jìn)行驗(yàn)證。在驗(yàn)證階段,從驗(yàn)證數(shù)據(jù)計(jì)算指標(biāo),輸入到訓(xùn)練好的交易模型,進(jìn)行價(jià)格預(yù)測(cè),根據(jù)預(yù)測(cè)結(jié)果,決定是否交易?;谀P偷念A(yù)測(cè),Trading Signal Generator產(chǎn)生買(mǎi)/賣(mài)交易信號(hào)(BUY/SELL Signals),交給 Order Executor & Monitor 執(zhí)行。

        Order Executor & Monitor 對(duì)投資組合中的每只股票的每個(gè)交易進(jìn)行監(jiān)控,記錄盈利和損失情況。Historical Data Manager 負(fù)責(zé)管理交易數(shù)據(jù)(Trade)和利潤(rùn)數(shù)據(jù)(Profit)。

        本研究將考察三種為交易模型建立投資組合的方法。1) 第一種方法,從市場(chǎng)上隨機(jī)選擇Np只股票,給這些股票平均分配總資金的1/Np。這里Np是投資組合的股票數(shù)量。2) 第二種方法,使用交易模型,預(yù)測(cè)每只股票的未來(lái)收益(在1.2.4節(jié)詳述預(yù)測(cè)過(guò)程),然后根據(jù)預(yù)期收益對(duì)股票進(jìn)行排序,選擇Np只股票構(gòu)成投資組合。3) 第三種方法,首先根據(jù)交易模型在股票上最近30天的交易利潤(rùn)曲線(有些股票并未真正發(fā)生交易,可以使用模擬辦法計(jì)算這個(gè)利潤(rùn)曲線),計(jì)算股票間的相似性,進(jìn)而把股票聚類(lèi)到不同類(lèi)別。在每個(gè)類(lèi)別內(nèi),對(duì)各個(gè)股票根據(jù)預(yù)期收益率進(jìn)行排序。從每個(gè)類(lèi)別中,選擇若干只股票,總數(shù)是Np只股票,構(gòu)成多樣化的投資組合。這個(gè)方法將在第2章進(jìn)行詳細(xì)介紹。系統(tǒng)記錄的交易歷史數(shù)據(jù)和利潤(rùn)數(shù)據(jù)(HistoricalTradeandProfitData),將用來(lái)計(jì)算股票之間的相似度。

        本文提出的投資模型多樣化方法,和交易模型配合,為其建立投資組合。當(dāng)一個(gè)投資組合建立以后,資金被平均分配到各只股票。如果交易模型預(yù)測(cè)到一定的利潤(rùn),系統(tǒng)將為某只股票建立頭寸(買(mǎi)入),并且持有。隨著時(shí)間的推移,如果交易模型的預(yù)測(cè)不準(zhǔn),價(jià)格掉頭向下,超過(guò)預(yù)先設(shè)置的閾值,將引發(fā)止損操作。否則,股票一直持有到賣(mài)出日(SELLday),然后售出。幾天以后,當(dāng)所有的股票都賣(mài)出,系統(tǒng)將基于新的數(shù)據(jù),建立新的投資組合,開(kāi)始新一輪交易過(guò)程。

        1.2 創(chuàng)建交易模型

        1.2.1SVM和SVR

        支持向量機(jī)(SupportVectorMachine,SVM)技術(shù)最先由Vapnik等于1990年提出來(lái)。該技術(shù)分為兩類(lèi),包括支持向量分類(lèi)(SupportVectorClassification,SVC, 一般仍稱(chēng)為SVM),以及支持向量回歸(SupportVectorRegression,SVR)。

        SVM的目的,是找到高維空間的一個(gè)超平面(HyperPlane),把正例數(shù)據(jù)點(diǎn)(DataPoints,也叫向量)和負(fù)例數(shù)據(jù)點(diǎn)很好地分開(kāi),而且使得支持向量到超平面的距離最大。如果低維空間里的數(shù)據(jù)點(diǎn),不能用一個(gè)超平面分開(kāi),可以使用一個(gè)核函數(shù)(KernelFunction),把這些數(shù)據(jù)點(diǎn)變換為高維空間的向量,以便把它們?cè)诟呔S空間中較為容易地分開(kāi)。常用的核函數(shù),包括多項(xiàng)式核函數(shù)(Polynomial)以及徑向基函數(shù)(RadialBasis)。一般用一個(gè)正則化參數(shù)(RegularizationParameter)C,調(diào)節(jié)距離最大化和分類(lèi)誤差最小化之間的平衡。

        SVR技術(shù)則訓(xùn)練出一個(gè)模型,它可以接受新的輸入,預(yù)測(cè)一個(gè)目標(biāo)值。這個(gè)模型在訓(xùn)練的時(shí)候,針對(duì)訓(xùn)練數(shù)據(jù),在高維空間中擬合出一個(gè)超曲線(Hyper Curve),把盡量多的訓(xùn)練數(shù)據(jù)點(diǎn),包含到包圍這個(gè)曲線的一個(gè)管道(Enveloping Tube)中。具體來(lái)講,假設(shè),現(xiàn)有xi∈Rd(i=1,2,…,N),構(gòu)成d維空間的輸入向量。每個(gè)xi對(duì)應(yīng)一個(gè)yi∈R。給定一個(gè)任意的ε>0,如果存在一個(gè)超曲線f(x)=〈w,x〉+b,w∈Rn,b∈R,對(duì)于?(xi,yi)∈S,符合|yi-f(xi)|≤ε,那么f(x)=〈w,x〉+b稱(chēng)為訓(xùn)練樣本的ε-線性回歸。ε-線性回歸問(wèn)題,可以轉(zhuǎn)化為一個(gè)優(yōu)化問(wèn)題,形式如下:

        約束條件為|(wT·xi)+b-yi|≤ε(i=1,2,…,n),這個(gè)優(yōu)化問(wèn)題可以轉(zhuǎn)化為一個(gè)對(duì)偶問(wèn)題,并且用二次規(guī)劃(Quadratic Programming)方法加以解決。本研究在標(biāo)準(zhǔn)SVR技術(shù)上實(shí)現(xiàn)了交易模型,并使用了徑向基核函數(shù):K(xi,yi)=exp(-γ‖xi-yi‖2)。

        1.2.2 指標(biāo)計(jì)算以及規(guī)范化處理

        用某只股票的價(jià)格對(duì)交易模型進(jìn)行訓(xùn)練,很難泛化到其他股票。本研究對(duì)指標(biāo)進(jìn)行了規(guī)范化,忽略了價(jià)格數(shù)據(jù)的絕對(duì)值,刻畫(huà)了價(jià)格的近期的相對(duì)變化趨勢(shì)。

        本文認(rèn)為,不僅各只股票的價(jià)格變化,不斷重演其歷史。某些價(jià)格變化模式,也能夠在不同股票的價(jià)格演變中觀察得到,也就是歷史在不同的股票間重演。于是本研究用若干只股票的價(jià)格上計(jì)算的規(guī)范化指標(biāo),訓(xùn)練了一個(gè)統(tǒng)一的模型,并且把這個(gè)模型應(yīng)用到所有的股票上。

        本研究從價(jià)格數(shù)據(jù)上計(jì)算若干指標(biāo),用于對(duì)交易模型進(jìn)行訓(xùn)練,指標(biāo)(Indicators)也稱(chēng)為特征(Features)。

        1)簡(jiǎn)單移動(dòng)平均指標(biāo)。

        簡(jiǎn)單移動(dòng)平均(Simple Moving Average)指標(biāo)的計(jì)算公式為SMA=(Ct+Ct-1+Ct-2+…+Ct-n+1)/N,其中Ct表示第t天的收盤(pán)(Close)價(jià),Ct-1表示第t天的前一天的收盤(pán)價(jià)等。

        簡(jiǎn)單移動(dòng)平均指標(biāo),對(duì)移動(dòng)窗口內(nèi)的價(jià)格計(jì)算均值,對(duì)價(jià)格數(shù)據(jù)的變化進(jìn)行了平滑。本研究的交易模型,主要用于短期預(yù)測(cè),所以使用了兩個(gè)移動(dòng)平均指標(biāo),分別是5天的移動(dòng)平均(稱(chēng)為短期移動(dòng)平均(Short SMA, SSMA)),和10天的移動(dòng)平均(稱(chēng)為長(zhǎng)期移動(dòng)平均(Long SMA, LSMA))。

        對(duì)于移動(dòng)平均指標(biāo)的使用,有一個(gè)通用的投資策略,稱(chēng)為長(zhǎng)期和短期移動(dòng)平均指標(biāo)的交叉(Crossover)策略(http://www.investopedia.com, http://www.stockcharts.com)。這個(gè)策略使用短期、長(zhǎng)期兩個(gè)移動(dòng)平均指標(biāo),在趨勢(shì)性市場(chǎng)行情中,產(chǎn)生買(mǎi)/賣(mài)交易信號(hào)(BUY/SELL Signals)。如果短期移動(dòng)平均指標(biāo)從下往上和長(zhǎng)期移動(dòng)平均指標(biāo)交叉,并且向上發(fā)展,那么價(jià)格的總體趨勢(shì)是向上的,可以產(chǎn)生一個(gè)買(mǎi)信號(hào)(BUY)。相反,如果短期移動(dòng)平均指標(biāo)從上往下和長(zhǎng)期移動(dòng)平均指標(biāo)交叉,并且向下發(fā)展,那么價(jià)格的總體趨勢(shì)是向下的,可以產(chǎn)生一個(gè)賣(mài)出信號(hào)(SELL)。否則,持有資金或者持有股票頭寸,不產(chǎn)生任何交易信號(hào)。

        短期和長(zhǎng)期移動(dòng)平均指標(biāo)的交叉,是一個(gè)落后的指標(biāo)(Lagging Indicators),當(dāng)交叉發(fā)生的時(shí)候,價(jià)格已經(jīng)開(kāi)始攀升或者下跌。所以,本研究需要其他指標(biāo)來(lái)補(bǔ)充,以便交易模型能夠更為準(zhǔn)確地預(yù)測(cè)價(jià)格變化。

        2)相對(duì)強(qiáng)弱指標(biāo)。

        相對(duì)強(qiáng)弱指標(biāo)(Relative Strength Index, RSI)通常用來(lái)確定超買(mǎi)和超賣(mài)的市場(chǎng)狀況,RSI指標(biāo)在0~100變動(dòng)。當(dāng)RSI指標(biāo)大于70的時(shí)候,表明某只股票已經(jīng)處于超買(mǎi)狀態(tài),近期價(jià)格有可能下跌。當(dāng)RSI指標(biāo)小于30,則表明某只股票處于超賣(mài)狀態(tài),近期價(jià)格有可能上升。

        RSI指標(biāo)的計(jì)算公式為:

        其中:UPt表示第t天的價(jià)格上漲變化量,而DWt表示第t天的價(jià)格下跌變化量。

        本研究把當(dāng)天的RSI指標(biāo)作為一個(gè)訓(xùn)練模型用的特征(稱(chēng)為RSI0)。本研究還對(duì)如下重要時(shí)刻感興趣:①RSI曲線(由最近幾天的RSI指標(biāo)組成)從下往上突破70閾值;②RSI曲線從上往下突破70閾值;③RSI曲線從下往上突破30閾值;④RSI曲線從上往下突破30閾值;⑤RSI指標(biāo)在(30,70)震蕩。

        3)LarryWilliam’sR%指標(biāo)。

        類(lèi)似于對(duì)RSI指標(biāo)的處理,本研究使用當(dāng)天的W%R(W%R0,0表示當(dāng)天,-1表示前一天)作為訓(xùn)練模型的一個(gè)特征。本文還對(duì)如下重要時(shí)刻感興趣:①W%R曲線(由最近幾天的W%R指標(biāo)組成)從下往上突破-80閾值;②RSI曲線從上往下突破-80閾值;③RSI曲線從下往上突破-20閾值;④RSI曲線從上往下突破-20閾值;⑤RSI指標(biāo)在(-80,-20)震蕩。

        4)MACD指標(biāo)及導(dǎo)出動(dòng)量指標(biāo)。

        在股票價(jià)格的技術(shù)分析中,MACD指標(biāo)(Moving Average Convergence Divergence)經(jīng)常被用到。MACD 線通過(guò)把每天的12天的EMA(Exponential Moving Average)減去26天的EMA,繪制出來(lái)。然后,MACD的 9天的EMA線用作一個(gè)信號(hào)線(Signal Line),用來(lái)確定價(jià)格是否發(fā)生反轉(zhuǎn)(Reversal)。

        投資者一般尋找如下的投資機(jī)會(huì),包括以下內(nèi)容。①信號(hào)線交叉(Signal Line Crossovers):當(dāng)MACD指標(biāo)從下往上和信號(hào)線交叉,這是一個(gè)牛市信號(hào)線交叉;當(dāng)MACD指標(biāo)從上往下和信號(hào)線交叉,這是一個(gè)熊市信號(hào)線交叉。②中線交叉(Centerline Crossovers):當(dāng)MACD從下往上越過(guò)x軸,也就是12天的EMA線從下往上越過(guò)26天的EMA線,這是一個(gè)牛市中線交叉;當(dāng)MACD從上往下越過(guò)x軸,也就是12天的EMA線從上往下越過(guò)26天的EMA線,這是一個(gè)熊市中線交叉。③價(jià)格變化和MACD指標(biāo)變化趨勢(shì)的背離(Divergences):當(dāng)股票價(jià)格連創(chuàng)新低,但是MACD卻創(chuàng)出新高,表明一個(gè)牛市背離(Bullish Divergence)正在形成。股票價(jià)格連創(chuàng)新低,表明當(dāng)前的價(jià)格基本走勢(shì)是下跌趨勢(shì)(Downtrend),并且還將持續(xù),但是MACD連創(chuàng)新高,表明下跌的動(dòng)量(Downward Momentum)正在減弱。牛市背離,一般預(yù)示著趨勢(shì)正在反轉(zhuǎn)(Trend Reversal),股票價(jià)格隨后將有較大的回升。

        Google公司的股價(jià),在2008年10月到12月間,股票價(jià)格連創(chuàng)新低,而MACD連創(chuàng)新高,形成了一個(gè)牛市背離(Bullish Divergence)。于是緊接著,股票價(jià)格有一定的上漲(http://stock.finance.sina.com.cn/usstock/quotes/GOOG.html)。

        相似地,當(dāng)股票價(jià)格連創(chuàng)新高,但是MACD連創(chuàng)新低,意味著一個(gè)熊市背離(Bearish Divergence)正在形成。股票價(jià)格連創(chuàng)新高,意味著股票價(jià)格處在上升趨勢(shì)中。熊市背離,一般也預(yù)示著趨勢(shì)正在反轉(zhuǎn)(Trend Reversal),股票價(jià)格隨后將有較大的下跌。

        本研究使用兩個(gè)指標(biāo)來(lái)刻畫(huà)牛市背離和熊市背離。從MACD指標(biāo)導(dǎo)出的動(dòng)量指標(biāo)MUMMACD,其計(jì)算公式為MUMMACD=MUM0-MUM-9,其中:MACD0為當(dāng)天的MACD指標(biāo),而MACD-9當(dāng)天之前第9天的MACD指標(biāo)。股票價(jià)格的動(dòng)量指標(biāo)(Momentum of Price)MUMc,使用類(lèi)似的方法來(lái)計(jì)算,其計(jì)算公式為MUMc=C0-C-9。其中C0為當(dāng)天的股票收盤(pán)價(jià),而C-9為當(dāng)天之前第9天的股票收盤(pán)價(jià)。在計(jì)算這兩個(gè)指標(biāo)之前,MACD指標(biāo)和股票價(jià)格事先經(jīng)過(guò)規(guī)范化處理。表1總結(jié)了交易模型使用的13個(gè)指標(biāo)。

        表1 指標(biāo)及其描述

        1.2.3 訓(xùn)練交易模型

        為了進(jìn)行交易模型訓(xùn)練,從訓(xùn)練樣本的開(kāi)始時(shí)間戳,開(kāi)始計(jì)算表1所示的各個(gè)指標(biāo)。對(duì)于5天的SMA,可以在第5天獲得第一個(gè)有效的SMA(5) ,因?yàn)樵撝笜?biāo)是對(duì)前五天(包括當(dāng)天)的收盤(pán)價(jià)的均值。對(duì)于10天SMA來(lái)講,需要等到第10天,才能獲得第一個(gè)有效的SMA(10)。用于計(jì)算上述指標(biāo)的最長(zhǎng)的時(shí)間區(qū)間是26天(計(jì)算MACD指標(biāo)),于是從第26天開(kāi)始,就獲得有效的指標(biāo)集,包含13個(gè)指標(biāo)。從此以后的每天,都可以計(jì)算出對(duì)應(yīng)當(dāng)天的有效的13個(gè)指標(biāo)。

        對(duì)于獲得有效的13個(gè)指標(biāo)的每一天,利用一天以后的股票價(jià)格,計(jì)算一個(gè)利潤(rùn)率,表示如果當(dāng)天購(gòu)買(mǎi)股票,隔天賣(mài)出,能夠創(chuàng)造什么樣的利潤(rùn)率。利潤(rùn)率的計(jì)算公式為Rprofitt+1=(Ct+1-Ct)/Ct。13個(gè)指標(biāo)、以及天數(shù)(1天)作為輸入,利潤(rùn)率Rprofitt+1作為輸出,形成一個(gè)訓(xùn)練樣本。除此之外,針對(duì)2天、3天、4天、5天、6天、以及7天構(gòu)造訓(xùn)練樣本。這些訓(xùn)練樣本將用于交易模型的訓(xùn)練。表2展示了針對(duì)每天指標(biāo)及其后第1到第7天的預(yù)期利潤(rùn)率,所構(gòu)造的訓(xùn)練樣本。

        表2 每天的7個(gè)訓(xùn)練樣本

        在支持向量回歸(SVR)模型中,有兩個(gè)可調(diào)參數(shù),一個(gè)是正則化參數(shù)C,一個(gè)是徑向基核函數(shù)的γ參數(shù)。本文使用遺傳算法,對(duì)這兩個(gè)參數(shù)進(jìn)行優(yōu)化。

        1.2.4 使用交易模型進(jìn)行預(yù)測(cè)

        交易模型經(jīng)過(guò)訓(xùn)練以后,它能夠根據(jù)輸入的指標(biāo),預(yù)測(cè)股票的短期價(jià)格變化,指導(dǎo)交易。每一輪交易包含4個(gè)步驟,分別是:1)建立投資組合;2)產(chǎn)生交易信號(hào);3)買(mǎi)入并且持有股票,直到預(yù)期的賣(mài)出日,或者止損;4)清空當(dāng)前股票頭寸(Position),重新回到步驟1),開(kāi)始下一輪交易。

        這四個(gè)步驟詳述如下:

        1)投資組合管理(PortfolioManagement)。一輪投資的發(fā)起,從建立投資組合開(kāi)始。使用的方法在1.1節(jié)中已經(jīng)簡(jiǎn)單介紹,其中的投資組合多樣化方法,將在第2章詳細(xì)介紹。

        2)利用交易模型進(jìn)行預(yù)測(cè),并且產(chǎn)生交易信號(hào)。本研究把交易模型應(yīng)用到測(cè)試數(shù)據(jù)上,進(jìn)行短期預(yù)測(cè)(ShortTermPricePrediction)和交易。從測(cè)試樣本的開(kāi)始時(shí)間戳之后的第26天開(kāi)始,每天都能夠計(jì)算出有效的13個(gè)指標(biāo)。這些指標(biāo),加上天數(shù)(1~7),被輸入系統(tǒng),預(yù)測(cè)1天~7天以后的預(yù)期利潤(rùn)(ExpectedProfitRatio)。

        這7個(gè)預(yù)測(cè)作為候選集,本研究將基于這個(gè)候選集,產(chǎn)生買(mǎi)入交易信號(hào)(BUYsignal)。決策的原則是,對(duì)7個(gè)預(yù)測(cè)的預(yù)期利潤(rùn)率進(jìn)行排序,選出最高的預(yù)期利潤(rùn),并且檢查:①該利潤(rùn)率是否超過(guò)一定的閾值,以便覆蓋交易成本。②沒(méi)有一個(gè)更早(天數(shù)更少)的預(yù)期價(jià)格變化,可能引起一個(gè)止損操作。倘若如此,就產(chǎn)生一個(gè)買(mǎi)入交易信號(hào);否則,繼續(xù)尋找第二個(gè)最好的預(yù)期利潤(rùn)率。如果沒(méi)有一個(gè)預(yù)期利潤(rùn)率符合上述條件,本輪不對(duì)該股票進(jìn)行交易。

        下面給出一個(gè)具體例子,表3中的第一部分列出了交易模型對(duì)股票A的若干預(yù)測(cè),第二部分列出了交易模型對(duì)股票B的若干預(yù)測(cè),而第三部分則列出了交易模型對(duì)股票C的若干預(yù)測(cè)(表中的百分比為交易模型預(yù)測(cè)的針對(duì)各個(gè)天數(shù)的利潤(rùn)率)。本研究采用的止損閾值為下跌5%,可以買(mǎi)入的上漲閾值為7%。

        表3 預(yù)期利潤(rùn)與交易信號(hào)的產(chǎn)生

        其中,從表3的第一部分,可以看到針對(duì)7天的預(yù)測(cè)獲得最高的預(yù)期利潤(rùn),并且沒(méi)有一個(gè)更早的預(yù)期價(jià)格變化會(huì)引起止損操作。于是交易模型產(chǎn)生一個(gè)買(mǎi)入交易信號(hào),買(mǎi)入該股票,并且持有7天以后賣(mài)出。

        從表3的第二部分可以看出,針對(duì)7天的預(yù)測(cè),獲得最高的預(yù)期利潤(rùn),但是,4天的預(yù)測(cè)顯示價(jià)格將有5.5%的下跌,這個(gè)下跌幅度超過(guò)了止損閾值。于是,選擇3天的預(yù)測(cè),產(chǎn)生一個(gè)買(mǎi)入交易信號(hào),因?yàn)樗粌H超過(guò)可以買(mǎi)入的閾值,并且它之前沒(méi)有一個(gè)預(yù)測(cè)的價(jià)格變化,會(huì)引起一個(gè)止損操作。

        而對(duì)于股票C(表中的第三部分),從這些天的預(yù)測(cè)中,沒(méi)有看到任何的交易機(jī)會(huì),于是不產(chǎn)生任何交易信號(hào)。

        交易模型產(chǎn)生一個(gè)買(mǎi)入信號(hào)以后,根據(jù)分配給這只股票的資金,買(mǎi)入該只股票。

        3)持有股票到預(yù)期的賣(mài)出日或者進(jìn)行止損。交易模型監(jiān)控每只購(gòu)入的股票的價(jià)格變化,如果價(jià)格沒(méi)有按照預(yù)期上漲,而是下跌到止損閾值以下,那么對(duì)該只股票進(jìn)行止損,即及時(shí)賣(mài)出,減少損失。

        如果沒(méi)有發(fā)生止損情況,股票將持有到預(yù)期的賣(mài)出日期(SELLday,參考表3中的預(yù)測(cè)時(shí)使用的天數(shù)),并且賣(mài)出股票。比如對(duì)于表3中的股票A,買(mǎi)入該股票,并且持有7天,到第7天賣(mài)出。

        4)下一輪交易。當(dāng)所有的股票已經(jīng)賣(mài)出,進(jìn)入下一輪交易過(guò)程,也就是回到步驟1)。

        2 投資組合的多樣化

        投資組合的多樣化,就是遵循“雞蛋不要放在一個(gè)籃子里”原則進(jìn)行投資,其目的是減少大的損失。當(dāng)投資組合里某些股票的價(jià)格變化具有很強(qiáng)的相關(guān)性的時(shí)候,如果交易模型預(yù)測(cè)不準(zhǔn)確,對(duì)這些股票同時(shí)止損,將引起較大的損失。

        本研究使用聚類(lèi)技術(shù),把所有可交易的股票劃分到不同類(lèi)別中,然后從各個(gè)類(lèi)別選擇部分股票,構(gòu)成多樣化的投資組合。股票之間的相似性,定義為近期交易模型在這些股票上的交易性能,也就是交易模型在這些股票上的利潤(rùn)率曲線之間的相似性。

        2.1 股票之間的相似性定義(交易模型在股票上的收益)

        本研究沒(méi)有在股票價(jià)格上,直接計(jì)算股票之間的相似性。而是在股票價(jià)格上,運(yùn)行交易模型,并且記錄交易模型產(chǎn)生的交易信號(hào)和交易利潤(rùn)率,進(jìn)而計(jì)算股票間的相似性。在最近的一段時(shí)間內(nèi),交易模型歷次交易對(duì)應(yīng)的交易利潤(rùn)率,形成一個(gè)利潤(rùn)率曲線,對(duì)應(yīng)一個(gè)利潤(rùn)率向量(ProfitVector,PV)。股票之間的相似性,定義為其PV的相似性。

        對(duì)于不同的股票,交易模型在一定時(shí)間段內(nèi),產(chǎn)生的交易次數(shù)不一樣。也就是,兩只股票的PV擁有不同的元素,隸屬不同的高維向量空間,比如PV1∈Rn,而PV2∈Rm,m≠n。本文使用DTW(Dynamic Time Warping)技術(shù),對(duì)兩只股票的PV進(jìn)行相似性計(jì)算。該方法能夠計(jì)算時(shí)間序列數(shù)據(jù)的相似性,即便兩者的數(shù)據(jù)點(diǎn)數(shù)不一樣。

        本研究把投資組合內(nèi)的每只股票近30天的買(mǎi)賣(mài)交易記錄下來(lái),基于這些交易計(jì)算利潤(rùn)率,然后根據(jù)利潤(rùn)率計(jì)算每對(duì)股票之間的相似性。不在投資組合里的其它股票,并未進(jìn)行實(shí)際交易,而是通過(guò)模擬交易(SimulationTrading)記錄這些股票上的交易信息以及利潤(rùn)率,這些模擬交易的利潤(rùn)率反映了交易模型在這些股票上的性能表現(xiàn),基于此計(jì)算這些股票之間的相似度。

        2.2 股票聚類(lèi)

        聚類(lèi)技術(shù)把相似度大的股票聚集在一個(gè)類(lèi)別中,把相似性小的股票分解到不同的類(lèi)別中。可以用于聚類(lèi)的方法有兩種:1) 第一種方法,把股票的相似系數(shù),組織成一個(gè)N*N矩陣S,N是股票的個(gè)數(shù),Si, j是股票i和股票j之間的相似性。然后在系數(shù)矩陣上,使用傳統(tǒng)的聚類(lèi)方法,把股票劃分到不同類(lèi)別。2) 第二種方法,基于股票之間的相似性,建立一個(gè)股票之間的社交網(wǎng)絡(luò),形成一個(gè)無(wú)向帶權(quán)重的圖(Undirected Weighted Graph)。每個(gè)節(jié)點(diǎn)表示一只股票,每條邊(帶權(quán)重)表示股票之間的相似性。建立好股票的社交網(wǎng)絡(luò)后,可以使用網(wǎng)絡(luò)社區(qū)挖掘方法(Community Detection)[7-8],把股票劃分到不同的類(lèi)別,每個(gè)類(lèi)別對(duì)應(yīng)一個(gè)社區(qū)。其中,文獻(xiàn)[8]提供了一種針對(duì)帶權(quán)重的社交網(wǎng)絡(luò)的社區(qū)挖掘方法。

        本研究使用第一種方法對(duì)股票進(jìn)行聚類(lèi)。在未來(lái)工作中,將嘗試第二種方法,并且與第一種方法進(jìn)行比較

        2.3 根據(jù)預(yù)期收益率從各個(gè)聚類(lèi)的類(lèi)別中選擇股票

        完成聚類(lèi)分析以后,每只股票被劃分到不同的類(lèi)別。從這些類(lèi)別中,選擇一些股票,構(gòu)成投資組合,投資組合中的股票數(shù)量為Np。股票的選擇標(biāo)準(zhǔn)是預(yù)期收益率,預(yù)期收益率的計(jì)算方法和1.2.4節(jié)描述的方法一致,這里不再贅述。

        3 實(shí)驗(yàn)及結(jié)果分析

        3.1 數(shù)據(jù)集以及性能指標(biāo)

        本研究從YahooFinance網(wǎng)站上,獲取了上海股票交易所的900只股票的價(jià)格信息,時(shí)間跨度從2005年到2015年。2005年到2014年的價(jià)格數(shù)據(jù)用于訓(xùn)練,2015年的價(jià)格數(shù)據(jù)用于驗(yàn)證。

        對(duì)于交易模型的評(píng)價(jià),人們最感興趣的是其年化利潤(rùn)率(AnnualizedProfitRatio,也稱(chēng)收益率)。如果一個(gè)交易模型,不能在無(wú)風(fēng)險(xiǎn)的定期存款以外創(chuàng)造額外的收益,它是沒(méi)有用的。倘若如此,還不如直接把款項(xiàng)存為定期存款。

        本研究的工作,其目的是提高交易模型的穩(wěn)健性。本研究還使用另外兩個(gè)性能指標(biāo),即最大回撤(MaxDrawdown)和夏普指數(shù)(SharpRatio),來(lái)評(píng)價(jià)本文提出的方法的有效性。

        最大回撤指標(biāo)可以評(píng)價(jià)一個(gè)交易模型選擇的投資組合的風(fēng)險(xiǎn)度。最大回撤的計(jì)算公式為MDD=(A-B)/A,其中A為最大下跌之前的資產(chǎn)最大凈值(Peak Asset Value before Largest Drop),B為 資產(chǎn)凈值創(chuàng)出新高之前的最低的資產(chǎn)凈值(Lowest Asset Value before New High Established)。比如,一個(gè)投資組合的開(kāi)始凈值為$10 000,這個(gè)凈值經(jīng)過(guò)一系列股票交易以后發(fā)生變化,第一天為$17 000,第二天為$8 000,第三天為$13 000,第四天為$7 000,第五天為$19 000,那么,最大回撤為(17 000-7 000)/17 000=52.9%。最高凈值$19 000沒(méi)有用來(lái)計(jì)算最大回撤,因?yàn)檫@里的回撤是從最高點(diǎn)$17 000開(kāi)始的。投資模型的最大回撤越小越好。

        夏普指數(shù)是由WilliamF.Sharpe發(fā)明的一個(gè)指標(biāo)。他用標(biāo)準(zhǔn)差(StandardDeviation)以及超額收益(ExcessReturn),來(lái)計(jì)算每單位風(fēng)險(xiǎn)獲得的收益,這里的風(fēng)險(xiǎn)指的是波動(dòng)性。假設(shè),投資組合的年化收益率為12%,波動(dòng)性為10%,無(wú)風(fēng)險(xiǎn)的定期存款利率為5%,那么夏普指數(shù)為(0.12-0.05)/0.1=70%。投資模型的夏普指數(shù)越高,顯示投資模型越穩(wěn)健,收益越好。

        本研究把數(shù)據(jù)集劃分為3個(gè)子集,每個(gè)子集包含300只股票。本研究在3個(gè)數(shù)據(jù)子集上獨(dú)立進(jìn)行實(shí)驗(yàn),并且計(jì)算交易模型的年化收益率、最大回撤,以及夏普指數(shù)。交易模型使用的初始資金為$1 000 000,投資組合的容量為25只股票,無(wú)風(fēng)險(xiǎn)的定期存款利率為3.6%。

        3.2 通用交易模型和特定模型的性能比較

        本研究進(jìn)行的第一個(gè)實(shí)驗(yàn),用于比較為所有股票建立的通用模型,與為每只股票建立的特定模型的性能。

        首先,為所有的股票訓(xùn)練了一個(gè)通用模型,然后為這個(gè)模型建立多樣化的投資組合進(jìn)行交易;接著,為每只股票創(chuàng)建特定的交易模型(僅適用于該股票);然后,建立多樣化的投資組合,針對(duì)每只股票,使用特定交易模型進(jìn)行交易。表4顯示了實(shí)驗(yàn)的最終結(jié)果。

        表4 通用交易模型和特定交易模型的性能比較

        對(duì)于數(shù)據(jù)子集1,特定模型獲得了11.91%的年化收益率,比通用模型的年化收益率7.95%要高,但是在另外兩個(gè)指標(biāo)上,即最大回撤和夏普指數(shù),通用模型表現(xiàn)比特定模型要好。通用交易模型的最大回撤為5.34%,比特定模型的13.32%小。通用模型的夏普指數(shù)為88.78%,高于特定模型的81.30%。

        這些結(jié)果顯示,雖然通用模型的年化收益率較小,但是它更加穩(wěn)健。在數(shù)據(jù)子集2和數(shù)據(jù)子集3上,通用模型和特定模型在三個(gè)指標(biāo)上顯示出類(lèi)似的差異。為了檢驗(yàn)結(jié)論的可靠性,本文進(jìn)行了T檢驗(yàn),比較通用模型和特定模型的最大回撤的均值。檢驗(yàn)結(jié)果顯示兩者存在統(tǒng)計(jì)學(xué)意義上的顯著差異(t=-24.988, andp=0.001 6<0.05)。另外一個(gè)T檢驗(yàn),也驗(yàn)證了兩者在夏普指數(shù)上的顯著差異。

        3.3 不同投資組合構(gòu)造方法的比較

        第二個(gè)實(shí)驗(yàn)的目的,是比較不同的投資組合構(gòu)造方法的性能。投資組合的構(gòu)造方法為:1)隨機(jī)選擇法(Random);2)排序法(Rank);3)多樣化方法(Diversifying)。本文用通用的交易模型進(jìn)行實(shí)驗(yàn),從900只股票里建立包含75只股票的投資組合。實(shí)驗(yàn)結(jié)果如表5和圖2所示。

        表5 三種投資組合構(gòu)造方法的比較

        可以看出,多樣化的投資組合(Diversifying)獲得了8.06%的年化收益率,比另外兩種方法要低(Random和Rank),但是Diversifying方法在最大回撤和夏普指數(shù)兩個(gè)指標(biāo)上,都超過(guò)了Rank和Random。這個(gè)結(jié)果顯示,多樣化的投資組合提高了交易模型的穩(wěn)健性。

        出乎意料的是,Random方法的年化利潤(rùn)率高達(dá)11.82%,這可以歸因于支持向量回歸具有較強(qiáng)的非線性預(yù)測(cè)能力。

        圖2 三種投資組合構(gòu)造方法的比較

        圖3展示了Rank和Diversifying兩個(gè)投資組合的凈值變化情況(2015年)。x軸表示時(shí)間從2015年1月到2015年12月,y軸表示投資組合的凈值的變化,用相對(duì)于資產(chǎn)凈值的初值的百分比表示??梢灾庇^地觀察到,多樣化的投資組合,其凈值曲線的波動(dòng)性較小。由于Random投資組合的演化趨勢(shì)和Rank投資組合類(lèi)似,所以沒(méi)有一同繪制在圖3中。

        圖3 兩個(gè)投資組合凈值的變化情況

        4 相關(guān)工作與討論

        4.1 相關(guān)工作

        人們使用各種機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘方法,來(lái)進(jìn)行股票價(jià)格的預(yù)測(cè)[6],具體的技術(shù)包括支持向量機(jī)和支持向量回歸(SVMandSVR)[6,9]、人工神經(jīng)網(wǎng)絡(luò)[10]、樸素貝葉斯技術(shù)[11]、模糊系統(tǒng)[12]、遺傳算法[13]等。

        支持向量回歸技術(shù),以其強(qiáng)大的非線性建模能力,已經(jīng)在股票價(jià)格預(yù)測(cè)領(lǐng)域得到了廣泛的應(yīng)用[6]。人們還嘗試了把該技術(shù)和其他技術(shù)結(jié)合,包括小波分析(WaveletAnalysis)、粒子群優(yōu)化(ParticleSwarmOptimization)、神經(jīng)網(wǎng)絡(luò)(NeuralNetwork)等。有些基于SVR的交易模型,不僅使用技術(shù)指標(biāo)(TechnicalIndicators)作為輸入,同時(shí)把文本分析的結(jié)果也作為新的特征加以運(yùn)用。本文也基于SVR技術(shù)建立了交易模型,本文工作的主要區(qū)別是,在常用的基礎(chǔ)指標(biāo)上,本文手工構(gòu)造了一些導(dǎo)出指標(biāo),這些指標(biāo)刻畫(huà)了典型的價(jià)格運(yùn)動(dòng)模式、市場(chǎng)里的超買(mǎi)/超賣(mài)狀況和背離狀況。此外,本文對(duì)指標(biāo)進(jìn)行了規(guī)范化處理,以便訓(xùn)練出一個(gè)適用不同股票的通用交易模型。

        文獻(xiàn)[14]把關(guān)聯(lián)規(guī)則分析和聚類(lèi)分析結(jié)合起來(lái),研究不同金融市場(chǎng)的聯(lián)動(dòng)性(Co-movement),并且建立一個(gè)模型,用于投資組合推薦。文獻(xiàn)[15]提出了一種投資組合的多樣化方案。該方案通過(guò)K-means聚類(lèi)算法和社交網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)(CommunityDetection)算法實(shí)現(xiàn)。其使用的相似性系數(shù),依據(jù)一對(duì)股票在一段時(shí)間內(nèi)的預(yù)期收益來(lái)計(jì)算。即便兩只股票的價(jià)格變化表現(xiàn)出一定的相似性,但是當(dāng)把止損操作考慮進(jìn)來(lái)以后,交易模型在兩者上的盈利表現(xiàn)不一定一致。于是,本研究采用了和上述文獻(xiàn)不同的相似度計(jì)算方法,它通過(guò)交易模型在兩只股票上的近期歷史表現(xiàn)(即收益情況)來(lái)計(jì)算股票相似度,把交易模型預(yù)測(cè)不準(zhǔn)確的情況考慮進(jìn)來(lái)。如果預(yù)測(cè)不準(zhǔn)確,并且價(jià)格下跌到一定程度,交易系統(tǒng)將激發(fā)止損操作。傳統(tǒng)相似度計(jì)算方法,沒(méi)有考慮到這種情況,把一些股票分配到同一個(gè)聚類(lèi),在預(yù)測(cè)不準(zhǔn)確的時(shí)候,引起雪崩式的止損操作,導(dǎo)致比較大的損失。

        4.2 討論

        本文通過(guò)一些手工構(gòu)造的導(dǎo)出指標(biāo),刻畫(huà)了典型的價(jià)格運(yùn)動(dòng)模式、超買(mǎi)/超賣(mài)市場(chǎng)狀態(tài)以及背離市場(chǎng)狀態(tài)。近年來(lái),深度學(xué)習(xí)技術(shù)展現(xiàn)出優(yōu)異的性能,它能夠無(wú)監(jiān)督地從數(shù)據(jù)中學(xué)習(xí)各個(gè)抽象級(jí)別(從低級(jí)到高級(jí)的)的特征。使用深度學(xué)習(xí)技術(shù)[16-17]識(shí)別股票價(jià)格圖中的模式,是一個(gè)值得研究的課題。

        5 結(jié)語(yǔ)

        本研究基于支持向量回歸技術(shù)創(chuàng)建了一個(gè)交易模型。對(duì)于模型的輸入向量(特征),基于常用指標(biāo)構(gòu)造了若干導(dǎo)出指標(biāo),以便刻畫(huà)典型的價(jià)格變化模式、超買(mǎi)/超買(mǎi)市場(chǎng)狀況以及背離市場(chǎng)狀況。這些指標(biāo)經(jīng)過(guò)規(guī)范化處理,為所有股票訓(xùn)練一個(gè)統(tǒng)一的交易模型。為了提高該交易模型的穩(wěn)健性,提出了投資組合的多樣化方法。利用近30天交易模型在不同股票上的盈利表現(xiàn),計(jì)算股票的相似性,并且基于該相似性進(jìn)行股票聚類(lèi),從各個(gè)類(lèi)別中選擇部分股票,構(gòu)成多樣化的投資組合。實(shí)驗(yàn)結(jié)果顯示,該交易模型能夠?qū)Σ煌善边M(jìn)行交易,并且創(chuàng)造了超過(guò)定期存款利息的收益,顯示了其泛化能力。此外,交易模型的利潤(rùn)率曲線的波動(dòng)性降低了,意味著交易模型的穩(wěn)健性獲得了提高。

        )

        [1]ABU-MOSTAFAYS,ATIYAAF.Introductiontofinancialforecasting[J].AppliedIntelligence, 1996, 6(3): 205-213.

        [2]FAMAEF.Thebehaviorofstockmarketprices[J].JournalofBusiness, 1965, 38(1): 34-105.

        [3]NISARS,HANIFM.Testingweakformofefficientmarkethypothesis:empiricalevidencefromsouth-Asia[J].WorldAppliedSciencesJournal, 2011, 17(4): 414-427.

        [4]STEINERC.AutomateThis:HowAlgorithmsCametoRuleOurWorld[M].London:PortfolioPublishing, 2012: 75-99.

        [5]MURPHYJJ.Technicalanalysisofthefinancialmarkets:acomprehensiveguidetotradingmethodsandapplications[M].UpperSaddleRiver,NJ:PrenticeHallPress, 1999: 100-137.

        [6]CAVALCANTERC,BRASILEIRORC,SOUZAVLF,etal.Computationalintelligenceandfinancialmarkets:asurveyandfuturedirections[J].ExpertSystemswithApplications, 2016, 55: 194-211.

        [7]NEWMANMEJ.Fastalgorithmfordetectingcommunitystructureinnetworks[J].PhysicalReviewE:StatisticalNonlinearandSoftMatterPhysics, 2004, 69(6): 066133.

        [8]CUIA,CHEND,FUY.Communitydetectionbasedonweightednetworks[C]//NPC’08:Proceedingsofthe2008IFIPInternationalConferenceonNetworkandParallelComputing.Washington,DC:IEEEComputerSociety, 2008: 273-280.

        [9]LUCJ,LEETS,CHIUCC.Financialtimeseriesforecastingusingindependentcomponentanalysisandsupportvectorregression[J].DecisionSupportSystems, 2009, 47(2): 115-125.

        [10]LIYH,MAW.Applicationsofartificialneuralnetworksinfinancialeconomics:asurvey[C]//ISCID’10:Proceedingsofthe2010InternationalSymposiumonComputationalIntelligenceandDesign.Washington,DC:IEEEComputerSociety, 2010: 211-214.

        [11]PATELJ,SHAHS,THAKKARP,etal.Predictingstockandstockpriceindexmovementusingtrenddeterministicdatapreparationandmachinelearningtechniques[J].ExpertSystemswithApplications, 2015, 42(1): 259-268.

        [12]CHANGPC,LIUCH.ATSKtypefuzzyrulebasedsystemforstockpriceprediction[J].ExpertSystemswithApplications, 2008, 34(1): 135-144.

        [13]CHENY,MABUS,SHIMADAK,etal.Ageneticnetworkprogrammingwithlearningapproachforenhancedstocktradingmodel[J].ExpertSystemswithApplications, 2009, 36(10): 12537-12546.

        [14]LIAOS-H,CHOUS-Y.Datamininginvestigationofco-movementsontheTaiwanandChinastockmarketsforfutureinvestmentportfolio[J].ExpertSystemswithApplications, 2013, 40(5): 1542-1554.

        [15]KOOCHAKZADEHN.Aheuristicstockportfoliooptimizationapproachbasedondataminingtechniques[D].Calgary,Alberta,Canada:UniversityofCalgary, 2012: 23-69.

        [16]TAKEUCHIL,LEEY.Applyingdeeplearningtoenhancemomentumtradingstrategiesinstocks[EB/OL]. [2016- 07- 01].http://cs229.stanford.edu/proj2013/TakeuchiLee-ApplyingDeepLearningToEnhanceMomentumTradingStrategiesInStocks.pdf.

        [17] 孫志軍,薛磊,許陽(yáng)明,等.深度學(xué)習(xí)研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2012,29(8):2806-2810.(SUNZJ,XUEL,XUYM,etal.Surveyondeeplearningresearch[J].ApplicationResearchofComputers, 2012, 29(8): 2806-2810.)

        ThisworkispartiallysupportedbyNationalNaturalScienceFoundationofChina(61170013, 61432006),ProjectIndustrializationofHighThroughputandReal-timeBusinessIntelligenceSystemonBigDataofGuangdongScienceandTechnologyDepartment(2015B010131015).

        QIN Xiongpai, born in 1971, Ph.D., lecturer. His research interests include high performance database, big data.

        CHEN Yueguo, born in 1978, Ph.D., associate professor. His research interests include knowledge graph and big data systems.

        WANG Bangguo, born in 1993, M. S. candidate. His research interests include financial big data.

        Application case of big data analysis—robustness of a trading model

        QIN Xiongpai1,2, CHEN Yueguo1,2*, WANG Bangguo1,2

        (1.InformationSchool,RenminUniversityofChina,Beijing100872,China; 2.KeyLabofDataEngineeringandKnowledgeEngineeringofMinistryofEducation(RenminUniversityofChina),Beijing100872,China)

        The robustness of a trading model means that the model’s profitability curve is less volatile and does not fluctuate significantly. To solve the problem of robustness of an algorithmic trading model based on Support Vector Regression (SVR), several strategies to derive a unified trading model and a portfolio diversification method were proposed. Firstly, the algorithm trade model based on SVR was introduced. Then, based on the commonly used indicators, a number of derived indicators were constructed for short term forecasting of stock prices. The typical patterns of recent price movements, overbought/oversold market conditions, and divergence of market conditions were characterized by these indicators. These indicators were normalized and used to train the trading model so that the model can be generalized to different stocks. Finally, a portfolio diversification method was designed. In the portfolio, the correlation between various stocks, sometimes leads to great investment losses; because the price of the stock with strong correlation changes in the same direction. If the trading model doesn’t predict the price trend correctly, then stop loss will be triggered, and these stocks will cause loss in a mutual accelerated manner. Stocks were clustered into different categories according to the similarity, and a diversified portfolio was formed by selecting a number of stocks from different clustered categories. The similarity of stocks, was defined as the similarity of the recent profit curves on different stocks by trading models.Experiments were carried out on the data of 900 stocks for 10 years. The experimental results show that the transaction model can obtain excess profit rate over time deposit, and the annualized profit rate is 8.06%. The maximum drawdown of the trading model was reduced from 13.23% to 5.32%, and the Sharp ratio increased from 81.23% to 88.79%. The volatility of the profit margin curve of the trading model decreased, which means that the robustness of the trading model was improved.

        algorithm trading; Support Vector Regression (SVR); robustness; portfolio diversification; big data

        2016- 09- 26;

        2016- 10- 14。

        國(guó)家自然科學(xué)基金資助項(xiàng)目(61170013, 61432006);廣東省科技廳高通量大數(shù)據(jù)實(shí)時(shí)商業(yè)智能系統(tǒng)產(chǎn)業(yè)化項(xiàng)目(2015B010131015)。

        覃雄派(1971—),男(壯族),廣西德保人,講師,博士,CCF會(huì)員,主要研究方向: 高性能數(shù)據(jù)庫(kù)、大數(shù)據(jù); 陳躍國(guó)(1978—),男,遼寧營(yíng)口人,副教授,博士,CCF會(huì)員,主要研究方向:知識(shí)圖譜、大數(shù)據(jù)系統(tǒng); 王邦國(guó)(1993—),男,廣東中山人,碩士研究生,主要研究方向:金融大數(shù)據(jù)。

        1001- 9081(2017)03- 0660- 08

        10.11772/j.issn.1001- 9081.2017.03.660

        TP311.13

        A

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機(jī)模型
        提煉模型 突破難點(diǎn)
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達(dá)及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        中文字幕喷水一区二区| 日出白浆视频在线播放| 无码人妻丰满熟妇区bbbbxxxx| 天堂8在线天堂资源bt| 欧美性猛交xxxx乱大交蜜桃| 麻豆人妻无码性色AV专区| 91乱码亚洲精品中文字幕| 一区二区三区四区日韩亚洲| 日韩精品一区二区免费| 天堂视频在线观看一二区| 欧洲熟妇色 欧美| 欧美一级在线全免费| 男女好痛好深好爽视频一区| 国产av一区麻豆精品久久| 亚洲国产成人久久精品一区| 男人的天堂免费a级毛片无码| 国产午夜伦鲁鲁| 亚洲欧洲无码一区二区三区| 亚洲色图综合免费视频| 国产白浆一区二区三区佳柔| 久久精品国产亚洲av久| 西西大胆午夜人体视频| 国产91网| 一区二区三区手机看片日本韩国| 不卡一本av天堂专区| а天堂中文最新一区二区三区 | 国产精品自在线拍国产手机版| 欧美午夜精品久久久久免费视| 囯产精品无码一区二区三区AV | 久久久亚洲一区二区三区| 免费av片在线观看网址| 欧美黑人xxxx又粗又长| 亚洲A∨无码国产精品久久网| 亚洲国产精品一区二区第一 | 欧美日韩国产综合aⅴ| 小草手机视频在线观看| 免费无码专区毛片高潮喷水| 天下第二社区在线视频| 亚洲精品夜夜夜| 激情人妻中出中文字幕一区| 熟女人妻中文字幕av|