亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        采用機(jī)器學(xué)習(xí)與二維伽馬函數(shù)的股票指數(shù)量化交易策略

        2023-06-15 01:21:24柴昱白陳偉趙舒欣毛新越
        關(guān)鍵詞:方向分類策略

        柴昱白,陳偉,趙舒欣,毛新越

        (西安交通大學(xué)電子與信息學(xué)部,710049,西安)

        隨著我國證券市場(chǎng)的不斷迅猛發(fā)展,投資者面臨著更加動(dòng)態(tài)多變的投資可行集和市場(chǎng)環(huán)境[1]。因此,制定什么樣的投資交易策略始終是一個(gè)研究的熱點(diǎn)問題。近年來,使用計(jì)算機(jī)技術(shù)進(jìn)行量化投資的方式為投資者交易提供了新思路。量化交易是投資者使用金融數(shù)學(xué)模型對(duì)證券市場(chǎng)交易數(shù)據(jù)進(jìn)行量化分析而完成交易[2],其中投資擇時(shí)依靠投資者對(duì)資產(chǎn)價(jià)格趨勢(shì)的有效預(yù)判,選擇適當(dāng)時(shí)機(jī)買賣資產(chǎn),以實(shí)現(xiàn)規(guī)避風(fēng)險(xiǎn)、獲取超額收益[3]。計(jì)算機(jī)快速處理數(shù)據(jù)并計(jì)算得出結(jié)果的能力正適用于此。越來越多的量化交易者通過程序?qū)⒔灰走^程集成化,以程序化自動(dòng)交易完成整個(gè)交易過程。

        機(jī)器學(xué)習(xí)方法在金融量化交易中得到了廣泛的應(yīng)用。Lohrmann等使用隨機(jī)森林(random forest,RF)對(duì)標(biāo)普500指數(shù)構(gòu)建了一種四分類漲跌預(yù)測(cè)模型,證明此模型比只分漲跌模型更有助于改善交易策略[4]。王淑燕驗(yàn)證了隨機(jī)森林量化選股模型在中國股票市場(chǎng)上有較好的性能[5]。李斌等設(shè)計(jì)了一套基于機(jī)器學(xué)習(xí)和技術(shù)指標(biāo)的量化投資算法,證明由此構(gòu)建的投資組合收益率遠(yuǎn)超大盤指數(shù)[6]。張茂軍等設(shè)計(jì)并研究了一種基于決策樹的量化交易擇時(shí)策略,對(duì)比證明機(jī)器學(xué)習(xí)模型使用其構(gòu)造的區(qū)間突破分類標(biāo)簽進(jìn)行訓(xùn)練具有更好的預(yù)測(cè)效果[7]。高妮等使用集成經(jīng)驗(yàn)?zāi)B(tài)分解和不敏感支持向量回歸構(gòu)建低頻分量預(yù)測(cè)模型,構(gòu)建了良好的指數(shù)擇時(shí)策略[8]。

        除了傳統(tǒng)機(jī)器學(xué)習(xí)模型,神經(jīng)網(wǎng)絡(luò)模型在量化交易方面也得到了廣泛研究。Nemes等將神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于羅馬尼亞股票的短期趨勢(shì)預(yù)測(cè),提出了可為投資者交易決策提供參考的預(yù)測(cè)模型[9]。Thomas等發(fā)現(xiàn)利用長短期記憶神經(jīng)網(wǎng)絡(luò)模型(LSTM)預(yù)測(cè)非線性金融時(shí)序的精度顯著優(yōu)于隨機(jī)森林等模型[10]。楊青等構(gòu)造深層LSTM神經(jīng)網(wǎng)絡(luò)并對(duì)全球30個(gè)股票指數(shù)進(jìn)行不同期限的預(yù)測(cè)研究,發(fā)現(xiàn)LSTM能夠有效控制誤差波動(dòng),泛化能力很強(qiáng)[11]。

        現(xiàn)有的量化交易研究有一定的不足:一是標(biāo)簽構(gòu)造較為簡(jiǎn)單,僅基于價(jià)格漲跌標(biāo)記為(1:漲,2:跌),沒有考慮具體漲跌幅數(shù)值[4,7];二是交易策略較為基礎(chǔ),通常僅使用簡(jiǎn)單建倉策略,并沒有使用機(jī)器學(xué)習(xí)信號(hào)結(jié)合交易實(shí)時(shí)情況進(jìn)行更細(xì)化的設(shè)計(jì)[7-8,12];三是交易驗(yàn)證不充分,現(xiàn)有文獻(xiàn)通常僅使用歷史數(shù)據(jù)進(jìn)行回測(cè)實(shí)證,并沒有使用實(shí)時(shí)獲取的行情數(shù)據(jù)驗(yàn)證,對(duì)于其策略可在真實(shí)交易市場(chǎng)中獲取理想收益難具說服力。

        本文旨在通過探討不同分類方式下機(jī)器學(xué)習(xí)對(duì)于股票指數(shù)漲跌的預(yù)測(cè)效果選擇多空兩方向表現(xiàn)最好的預(yù)測(cè)模型,在此基礎(chǔ)上設(shè)計(jì)與機(jī)器學(xué)習(xí)預(yù)測(cè)信號(hào)緊密結(jié)合的實(shí)際交易策略,然后使用歷史數(shù)據(jù)回測(cè)以及最接近真實(shí)交易的模擬盤實(shí)時(shí)數(shù)據(jù)進(jìn)行驗(yàn)證分析,為投資者形成一種實(shí)際可用的交易策略提供參考。從而將機(jī)器學(xué)習(xí)的方法真正有效運(yùn)用在金融交易市場(chǎng)中,并為形成穩(wěn)定理性的股票交易市場(chǎng)提供行之有效的技術(shù)支持與智力支持。

        1 隨機(jī)森林和長短期記憶神經(jīng)網(wǎng)絡(luò)

        1.1 隨機(jī)森林

        隨機(jī)森林算法是Bagging類算法思想的一種改進(jìn)算法,其采用并行計(jì)算的學(xué)習(xí)方式,各個(gè)學(xué)習(xí)分類器之間相互獨(dú)立。隨機(jī)森林通過組合多個(gè)決策樹進(jìn)行分類或者回歸[13],得到廣泛使用。決策樹算法無需數(shù)據(jù)的歸一化處理,簡(jiǎn)單易行,但是面對(duì)繁多冗雜的數(shù)據(jù)存在容易過擬合的缺陷,預(yù)測(cè)分類能力較差。隨機(jī)森林通過自舉采樣和隨機(jī)子空間分割賦予的雙重隨機(jī)性解決了決策樹泛化能力弱的缺點(diǎn)[14]。

        1.2 長短期記憶神經(jīng)網(wǎng)絡(luò)

        LSTM是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的變體[15],它通過門機(jī)制使網(wǎng)絡(luò)具有長期記憶的功能[16]并且緩解了RNN的梯度問題[17]。LSTM由記憶塊遞歸連接而成,每個(gè)塊的基礎(chǔ)結(jié)構(gòu)又包括一個(gè)存儲(chǔ)單元和3個(gè)乘法單元。具體來說,乘法單元又根據(jù)實(shí)現(xiàn)的具體功能分別被稱為輸入門、輸出門以及遺忘門。輸入門決定輸入信號(hào)能否改變存儲(chǔ)器單元的狀態(tài),其可以短暫存儲(chǔ)相關(guān)信息,是LSTM不同于RNN的最大特點(diǎn)[15]。輸出門的功能是決定存儲(chǔ)單元能否改變其他存儲(chǔ)單元的狀態(tài)。遺忘門的功能是決定記住先前的狀態(tài)還是進(jìn)行遺忘丟棄,如果上一條網(wǎng)絡(luò)傳遞過來的輸入數(shù)據(jù)具體值沒有達(dá)到對(duì)應(yīng)閾值,則丟棄此數(shù)據(jù)。LSTM神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)如圖1所示。

        圖1 LSTM神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)

        2 量化擇時(shí)系統(tǒng)設(shè)計(jì)

        2.1 機(jī)器學(xué)習(xí)模型

        2.1.1 特征選取

        本文所使用的目標(biāo)數(shù)據(jù)包括15 min線級(jí)別股票指數(shù)的逐筆資金流數(shù)據(jù)和價(jià)格數(shù)據(jù),具體包括7個(gè)維度:主動(dòng)賣出額、主動(dòng)買入額、成交額、開盤價(jià)、收盤價(jià)、最高價(jià)和最低價(jià)。每日的交易時(shí)間為240 min,即一天共計(jì)16根15 min線數(shù)據(jù)。在最終7維度數(shù)據(jù)的基礎(chǔ)上,本文通過不同處理方式計(jì)算得到了總體的特征指標(biāo)共44維,所用方式基于不同指標(biāo)的時(shí)間周期,不同指標(biāo)相互間的不同運(yùn)算而變化。

        若輸入特征過多會(huì)使模型復(fù)雜化[18],所以需要對(duì)計(jì)算的特征進(jìn)行預(yù)處理。本文采用最大互信息系數(shù)法(MIC)[19]剔除特征相關(guān)性較大的指標(biāo),篩選后特征的數(shù)量由44維降至21維。

        2.1.2 標(biāo)簽定義

        本文提出了一種雙閾值漲跌不平衡型標(biāo)簽,其計(jì)算方式如下

        (1)

        使用兩個(gè)閾值的原因是:讓1(漲)與2(跌)的判定更加嚴(yán)格,從閾值來看三類別的區(qū)分度更高,能夠更便于模型進(jìn)行類別特點(diǎn)的學(xué)習(xí);這樣的標(biāo)簽在實(shí)際交易中具有更高的容錯(cuò)率:因?yàn)槠鋰?yán)格的判定條件,本在閾值相同型標(biāo)簽中可以標(biāo)記為1(漲)或2(跌)標(biāo)簽的樣本,若其收益的小值沒有超過小閾值,仍被標(biāo)記為0(平),這樣就存在0(平)標(biāo)簽仍可能獲利的情況,更有利于實(shí)際的交易。

        2.1.3 分類方式

        在傳統(tǒng)機(jī)器學(xué)習(xí)隨機(jī)森林算法的嘗試中發(fā)現(xiàn),直接進(jìn)行漲、跌、平(1、2、0)三分類,會(huì)將大量樣本分類為0,即平標(biāo)簽,實(shí)際上損失了很多可供交易的機(jī)會(huì),造成有效交易信號(hào)的減少,所以在三分類的基礎(chǔ)上本文還進(jìn)行了B-B分類、B-T分類兩次分類,其流程圖分別如圖2、圖3所示。本文的機(jī)器學(xué)習(xí)模型分類方式共有3種。

        圖2 B-B分類方式

        圖3 B-T分類方式

        (1)T方式。直接使用各個(gè)模型進(jìn)行基礎(chǔ)的三分類訓(xùn)練。

        (2)B-B方式[20]。訓(xùn)練集原始標(biāo)簽為0(平)、1(漲)、2(跌),第一次訓(xùn)練過程為:將其中1(漲)、2(跌)兩類視為一類,標(biāo)記為新的1,然后與原始標(biāo)簽0(平)組合成新的訓(xùn)練集進(jìn)行訓(xùn)練。第二次訓(xùn)練過程為:只取出原始數(shù)據(jù)中標(biāo)簽為1(漲)、2(跌)的樣本作為訓(xùn)練集進(jìn)行訓(xùn)練。

        (3)B-T方式。訓(xùn)練集原始標(biāo)簽為0(平)、1(漲)、2(跌),第一次訓(xùn)練過程為:將原始數(shù)據(jù)集中標(biāo)簽為1(漲)、2(跌)的樣本取出進(jìn)行訓(xùn)練,訓(xùn)練方式等同于B-B方式中的第二次訓(xùn)練方式。第二次訓(xùn)練過程為:將原始數(shù)據(jù)集樣本直接進(jìn)行漲跌平(1、2、0)三分類。

        2.2 交易策略

        簡(jiǎn)單建倉策略中交易信號(hào)只用于開倉,即預(yù)測(cè)信號(hào)為買入時(shí)進(jìn)行買入操作,達(dá)到止盈止損閾值時(shí)進(jìn)行賣出。為最大化發(fā)揮機(jī)器學(xué)習(xí)模型預(yù)測(cè)信號(hào)在交易過程中的指導(dǎo)作用,將其與交易策略緊密結(jié)合,同時(shí)考慮到ETF交易中手續(xù)費(fèi)較大的問題,本文在簡(jiǎn)單建倉策略的基礎(chǔ)上進(jìn)行了進(jìn)一步改進(jìn)。

        2.2.1 持倉中的更新

        本交易策略增添了根據(jù)正向交易信號(hào)進(jìn)行持倉更新的操作,更新對(duì)象包括參考價(jià)格、止盈止損價(jià)格與此方向的持倉時(shí)間。具體執(zhí)行過程為:若此時(shí)持有倉位且交易線程獲得開倉正向預(yù)測(cè)信號(hào),同時(shí),此時(shí)獲取的最新收盤價(jià)已優(yōu)于上一次更新的參考價(jià)格,則更新參考價(jià)格為此時(shí)的最新收盤價(jià),以參考價(jià)格與所定止盈止損閾值比例計(jì)算最新的止盈止損價(jià)格,更新持倉時(shí)間為0。

        2.2.2 開倉閾值自適應(yīng)調(diào)整

        漲跌幅限制是為了抑制過度投機(jī)行為和從眾行為而采取的一種價(jià)格穩(wěn)定機(jī)制[21],此制度是指在一個(gè)交易日內(nèi)證券的交易價(jià)格只能在指定的范圍內(nèi)波動(dòng)[22]。對(duì)于股票指數(shù)來說,單日內(nèi)的漲跌幅值不會(huì)過于夸張,因此當(dāng)行情在多(空)方向已有較大漲(跌)幅時(shí),應(yīng)對(duì)其同方向的開倉進(jìn)行限制以避免行情反轉(zhuǎn)帶來的虧損。本文統(tǒng)計(jì)所有數(shù)據(jù)多空方向的日內(nèi)相對(duì)于開盤價(jià)的漲跌幅分布統(tǒng)計(jì)結(jié)果,具體見表1,統(tǒng)計(jì)結(jié)果所依據(jù)的數(shù)據(jù)集為表2中的神經(jīng)網(wǎng)絡(luò)訓(xùn)練集數(shù)據(jù)。

        表1 中證500指數(shù)單日內(nèi)漲跌幅分布統(tǒng)計(jì)結(jié)果

        表2 模型數(shù)據(jù)集標(biāo)簽分布

        表1中:NL為數(shù)據(jù)集中漲與跌方向的樣本數(shù);Cmax為此方向絕對(duì)值最大的漲跌幅,將數(shù)據(jù)集中漲跌幅為25%~75%的數(shù)量分位數(shù)所對(duì)應(yīng)的漲跌幅表示為C25%~C75%。

        可以直觀得出:統(tǒng)計(jì)范圍內(nèi),中證500指數(shù)單日內(nèi)漲跌幅的整體分布集中在百分之一以內(nèi),日內(nèi)最大跌幅大于日內(nèi)最大漲幅,分別為(漲:0.035 0,跌:-0.057 2)。據(jù)此,本文借鑒圖像處理領(lǐng)域中一種使用光照分量對(duì)光照不均勻圖像進(jìn)行自適應(yīng)矯正的算法[23],提出一種根據(jù)日內(nèi)漲跌幅對(duì)開倉方向的類概率判別閾值進(jìn)行自適應(yīng)調(diào)整的二維伽馬函數(shù),其公式如下式

        (2)

        式中:Pt為此時(shí)要求的類概率判別閾值;m為表1中所統(tǒng)計(jì)的樣本75%分割點(diǎn)對(duì)應(yīng)的漲跌幅,此處兩方向判別閾值的絕對(duì)值均取近似值0.007 5;pc為此時(shí)刻獲取的最新收盤價(jià)相對(duì)于今日開盤價(jià)的漲跌幅。此函數(shù)為分段函數(shù),閾值一般情況下為0.5,只有在|pc|>|m|時(shí)才應(yīng)用式(2),其對(duì)閾值的自適應(yīng)調(diào)整效果如圖4所示。

        圖4 二維伽馬函數(shù)校正后的類概率判別閾值

        圖4中類概率判別閾值初始為0.5,以日內(nèi)漲跌幅正值為例,在pc>0.007 5時(shí)類概率判別閾值與pc呈正相關(guān),其增長趨勢(shì)為先緩慢增加而后迅速上漲,代表類別判據(jù)越來越嚴(yán)格。在機(jī)器學(xué)習(xí)預(yù)測(cè)過程中,只有在預(yù)測(cè)概率大于給定判別閾值時(shí)才能預(yù)測(cè)為對(duì)應(yīng)類別,而在橫坐標(biāo)日內(nèi)漲跌幅pc為0.02時(shí),縱坐標(biāo)類概率判別閾值Pt為0.99,即只有預(yù)測(cè)的概率大于0.99才可判為此類,已接近判別閾值的極限1。這意味著在pc>0.02后基本已不存在判為此類的可能,在交易過程中則表示為無此方向的交易信號(hào),不進(jìn)行持倉更新或開倉。據(jù)表1所用數(shù)據(jù)集統(tǒng)計(jì),pc>0.02的樣本僅占所有樣本的1.67%,所以,經(jīng)此函數(shù)調(diào)整閾值,只喪失了少于1.67%的交易機(jī)會(huì),說明此種算法對(duì)在交易方向上已出現(xiàn)較大日內(nèi)漲跌幅值行情時(shí)的開倉進(jìn)行限制的同時(shí),并沒有影響實(shí)際交易過程中所需要的良好召回率。

        3 實(shí)驗(yàn)分析

        本文先通過機(jī)器學(xué)習(xí)模型的對(duì)比分析選定交易策略中多空方向分別使用的機(jī)器學(xué)習(xí)預(yù)測(cè)模型,然后,為了驗(yàn)證本策略的收益能力,還設(shè)計(jì)了簡(jiǎn)易量化交易系統(tǒng),實(shí)現(xiàn)了交易策略的程序化自動(dòng)交易,不僅可以使用歷史數(shù)據(jù)進(jìn)行回測(cè)驗(yàn)證,還可以在交易日獲取實(shí)時(shí)行情數(shù)據(jù)進(jìn)行模擬盤的實(shí)時(shí)驗(yàn)證。量化交易系統(tǒng)總體框架如圖5所示。

        圖5 量化交易系統(tǒng)總體框架

        3.1 實(shí)驗(yàn)數(shù)據(jù)

        本文樣本集基于中證500指數(shù)日內(nèi)15 min線級(jí)別數(shù)據(jù)。隨機(jī)森林模型數(shù)據(jù)集共7 647條數(shù)據(jù)。研究表明使用近一年的交易日即約250天交易數(shù)據(jù)進(jìn)行訓(xùn)練具有良好的效果[7,10,24],據(jù)此,本文選取訓(xùn)練集為:2020年1月29日至2021年1月29日共4 147條數(shù)據(jù)。驗(yàn)證集為:2021年1月29日至2021年3月29日共562條數(shù)據(jù)。測(cè)試集為2021年3月29日至2021年12月29日共2 938條數(shù)據(jù)。

        參考文獻(xiàn)[10]對(duì)比實(shí)驗(yàn),本文設(shè)置神經(jīng)網(wǎng)絡(luò)模型中深度神經(jīng)網(wǎng)絡(luò)(DNN)為LSTM網(wǎng)絡(luò)的參照模型。因神經(jīng)網(wǎng)絡(luò)模型的學(xué)習(xí)能力依賴于樣本數(shù),而本文的15 min線級(jí)別數(shù)據(jù)每日只有16條數(shù)據(jù),一年(250交易日)約4 000條訓(xùn)練數(shù)據(jù),數(shù)據(jù)較少,而神經(jīng)網(wǎng)絡(luò)模型的學(xué)習(xí)性能依賴于更充分的訓(xùn)練樣本,所以本文在神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練預(yù)測(cè)中使用時(shí)間更久遠(yuǎn)的歷史數(shù)據(jù)共9 565條。其中,訓(xùn)練集:2019年7月3日至2021年1月29日共6 081條數(shù)據(jù),驗(yàn)證集與測(cè)試集與隨機(jī)森林模型相同。

        3.2 模型預(yù)測(cè)結(jié)果

        隨機(jī)森林模型幾乎無需調(diào)整參數(shù)便具有很好的預(yù)測(cè)性能[10],因此本文選用模型默認(rèn)參數(shù)進(jìn)行實(shí)驗(yàn)。DNN、LSTM模型則參考文獻(xiàn)[12,25]中的設(shè)置,設(shè)置結(jié)構(gòu)如下:一個(gè)輸入層(神經(jīng)元個(gè)數(shù)等于輸入特征數(shù)),兩個(gè)隱含層(神經(jīng)元個(gè)數(shù)分別為32、16),隱含層間設(shè)置Dropout層(失活概率0.1)以防止過擬合,一個(gè)輸出層(神經(jīng)元個(gè)數(shù)等于各分類方式中的目標(biāo)分類個(gè)數(shù))。

        表3與表4是本節(jié)所列預(yù)測(cè)模型分別在驗(yàn)證集與測(cè)試集數(shù)據(jù)中預(yù)測(cè)表現(xiàn)的評(píng)價(jià)指標(biāo)。常用的機(jī)器學(xué)習(xí)評(píng)價(jià)指標(biāo)包括精確率、錯(cuò)誤率、召回率,考慮到實(shí)際交易中除了追求預(yù)測(cè)的準(zhǔn)確性,還需要一定的召回率保證穩(wěn)定的交易機(jī)會(huì),否則,盲目追求預(yù)測(cè)正確而使召回率過低會(huì)導(dǎo)致開倉數(shù)量急劇減少,浪費(fèi)交易機(jī)會(huì),因此本文還重點(diǎn)關(guān)注召回率。

        表3 模型在驗(yàn)證集的預(yù)測(cè)效果評(píng)價(jià)

        表4 模型在測(cè)試集的預(yù)測(cè)效果評(píng)價(jià)

        表3驗(yàn)證集結(jié)果顯示多方向LSTM-B-T分類具有最高的精確率0.307 7,雖然其錯(cuò)誤率0.283 5比RF-B-T分類0.269 2略高,但其召回率0.274 0是RF-B-T分類0.137 6的二倍左右,因此認(rèn)為LSTM-B-T分類模型在驗(yàn)證集多方向預(yù)測(cè)表現(xiàn)最佳;做空方向DNN模型預(yù)測(cè)表現(xiàn)不佳,出現(xiàn)預(yù)測(cè)精確率為0的結(jié)果。其原因是由于DNN-T分類模型將待測(cè)樣本全部預(yù)測(cè)為0,導(dǎo)致預(yù)測(cè)精確率為0,而DNN-B-T分類模型的第二步分類是T分類,所以其最終精確率也為0。其他做空方向模型的預(yù)測(cè)結(jié)果中:RF-B-T分類的預(yù)測(cè)精確率0.485 3,大幅領(lǐng)先其他預(yù)測(cè)模型且其召回率理想,因此認(rèn)為RF-B-T分類在驗(yàn)證集空方向預(yù)測(cè)表現(xiàn)最佳。

        表4測(cè)試集結(jié)果顯示雖然多方向預(yù)測(cè)RF-B-T分類具有最高的精確率0.324 3,但其召回率僅有0.047 6,表現(xiàn)不佳,而召回率表現(xiàn)優(yōu)異的LSTM-B-T分類精確率0.246 7,錯(cuò)誤率0.186 4,召回率0.244 0,綜合表現(xiàn)相比于LSTM-T精確率0.247 2,錯(cuò)誤率0.216 1,召回率0.325 9,其精確率相近且錯(cuò)誤率更低,因此認(rèn)為LSTM-B-T分類在測(cè)試集多方向預(yù)測(cè)表現(xiàn)最佳;同理做空方向排除多數(shù)召回率低于0.1的模型后,RF-B-T分類在召回率0.453 0表現(xiàn)優(yōu)異的情況下其預(yù)測(cè)精確率0.225 6,錯(cuò)誤率0.170 6,精確率高于錯(cuò)誤率5個(gè)百分點(diǎn),預(yù)測(cè)結(jié)果是理想的,因此認(rèn)為RF-B-T分類模型在測(cè)試集空方向預(yù)測(cè)表現(xiàn)最佳。

        綜上所述,本文通過驗(yàn)證集與測(cè)試集在多空方向的評(píng)價(jià)指標(biāo)進(jìn)行對(duì)比歸納得出,在做多方向上LSTM-B-T模型最為理想,做空方向上RF-B-T模型的預(yù)測(cè)表現(xiàn)最為理想。其相應(yīng)方向評(píng)價(jià)指標(biāo)與原待測(cè)樣本中數(shù)據(jù)分布比例的對(duì)比結(jié)果顯示兩模型都對(duì)精確率與錯(cuò)誤率有較好的提升,同時(shí)保證了穩(wěn)定的召回率,適用于實(shí)際交易策略的形成。

        3.3 交易回測(cè)結(jié)果

        本文使用中證500指數(shù)ETF完成多空方向的回測(cè)與模擬盤交易驗(yàn)證。需要說明的是為使用指數(shù)ETF完成空方向的交易,需要在前一交易日提前持有底倉,因此本文的交易策略收益因底倉的存在而跟隨中證500指數(shù)波動(dòng),此策略追求獲得對(duì)標(biāo)指數(shù)基準(zhǔn)收益的超額收益,是一種指數(shù)增強(qiáng)型策略。

        本文對(duì)比實(shí)驗(yàn)中的交易策略如下:①買入并持有策略,后文以M1表示,此策略的收益率等于指數(shù)此段周期內(nèi)股票指數(shù)的價(jià)格增長率,是實(shí)驗(yàn)的基準(zhǔn)策略;②隨機(jī)建倉策略,即隨機(jī)給定此時(shí)刻預(yù)測(cè)信號(hào),結(jié)合簡(jiǎn)單建倉策略進(jìn)行買入賣出的策略,以M2表示;③持倉更新策略,即使用機(jī)器學(xué)習(xí)預(yù)測(cè)模型與持倉更新策略進(jìn)行交易的策略,以M3表示;④完整策略,即結(jié)合持倉更新策略與二維伽馬函數(shù)對(duì)開倉信號(hào)的類概率判別閾值進(jìn)行自適應(yīng)調(diào)整的策略形成的最終完整策略,以M4表示。

        各交易策略在2021年1月29 日至2021 年12月29日的回測(cè)收益曲線如圖6所示。

        圖6 不同策略整體回測(cè)收益曲線

        圖6中M2與M3對(duì)比可得,相比于隨機(jī)判斷,機(jī)器學(xué)習(xí)模型的預(yù)測(cè)信號(hào)提供了正確的指導(dǎo)作用,獲取了正向收益。M3與M4對(duì)比可得,加入開倉信號(hào)的類概率判別閾值自適應(yīng)調(diào)整策略實(shí)現(xiàn)了更小的回撤以及更大的收益。不同策略整體回測(cè)收益評(píng)價(jià)指標(biāo)見表5,本文的完整策略交易指標(biāo)整體最優(yōu),策略收益率為28.84%, 相比于持倉更新策略提升了約2個(gè)百分點(diǎn),相對(duì)于基準(zhǔn)策略的超額收益率為11.24%,實(shí)現(xiàn)了超越參考標(biāo)的中證500指數(shù)的增強(qiáng)收益。

        表5 不同策略整體回測(cè)收益評(píng)價(jià)指標(biāo)

        圖7為本文所提完整交易策略在驗(yàn)證集與測(cè)試集時(shí)間區(qū)間內(nèi)于多空兩向整體交易回測(cè)的開平倉交易點(diǎn)示意圖。

        圖7 完整策略多空方向整體回測(cè)交易點(diǎn)

        藍(lán)色曲線為交易標(biāo)的每時(shí)刻收盤價(jià)連起來的價(jià)格走勢(shì)曲線。可以看出,在驗(yàn)證集與測(cè)試集時(shí)間區(qū)間內(nèi)的交易情況中多空兩方向都表現(xiàn)為開倉點(diǎn)較為密集,證明開倉次數(shù)理想,沒有損失較多交易機(jī)會(huì)。且在2021年3月10日與2021年9月22日附近的流暢行情中,藍(lán)色曲線上空方向開平倉點(diǎn)較少,證明持倉更新的設(shè)定在流暢行情中有效增加了持倉時(shí)間,避免頻繁開平倉而造成手續(xù)費(fèi)的磨損,從而產(chǎn)生了相對(duì)較多的收益。

        3.4 模擬盤結(jié)果

        圖8為2022年3月15日至6月15日的模擬盤測(cè)試圖,點(diǎn)畫線從零開始呈逐漸上升趨勢(shì),代表超額收益始終為正值,收益表現(xiàn)良好。具體的模擬盤測(cè)試評(píng)價(jià)指標(biāo)見表6,勝率大于50%且盈虧比接近2.1,證明開倉創(chuàng)造的收益遠(yuǎn)大于開倉導(dǎo)致的虧損,這3個(gè)月的超額收益為2.599%,折算年化收益為13.38%,指數(shù)增強(qiáng)年化收益為11.08%,夏普比率為1.476。

        表6 模擬盤測(cè)試評(píng)價(jià)指標(biāo)

        圖8 模擬盤測(cè)試收益

        4 結(jié) 論

        本文設(shè)計(jì)了多空方向采用不同機(jī)器學(xué)習(xí)模型的日內(nèi)股指ETF程序化自動(dòng)交易策略并完成回測(cè)和模擬盤驗(yàn)證。研究發(fā)現(xiàn):本文給定的分類方式中,B-T方式具有較好的預(yù)測(cè)表現(xiàn),多空方向最終確定的LSTM-B-T模型、RF-B-T模型都以此分類方式為基礎(chǔ);使用歷史數(shù)據(jù)的回測(cè)對(duì)比實(shí)驗(yàn)結(jié)果顯示,本文提出的結(jié)合持倉更新及二維伽馬函數(shù)的完整交易策略使交易評(píng)價(jià)指標(biāo)得到整體性提升;最終,使用實(shí)時(shí)交易數(shù)據(jù)進(jìn)行程序化自動(dòng)交易的模擬盤測(cè)試獲取了11.08%的指數(shù)增強(qiáng)年化收益,證明此策略是一個(gè)對(duì)標(biāo)指數(shù)可獲得良好超額收益的量化交易策略,具有重要的工程應(yīng)用價(jià)值。

        猜你喜歡
        方向分類策略
        2022年組稿方向
        分類算一算
        2021年組稿方向
        2021年組稿方向
        例談未知角三角函數(shù)值的求解策略
        我說你做講策略
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        高中數(shù)學(xué)復(fù)習(xí)的具體策略
        教你一招:數(shù)的分類
        美女网站免费观看视频| 青青青国产免A在线观看| 日本一区二区高清在线观看| 亚洲色图综合免费视频| 亚洲一级天堂作爱av| 一本色道久久婷婷日韩| 国产一极内射視颍一| 精品国产香蕉伊思人在线又爽又黄| 国产精品一区二区av白丝在线| 亚洲av专区国产一区| 久久久久亚洲精品无码网址蜜桃 | 国产一区二区三区男人吃奶| 艳妇臀荡乳欲伦交换h在线观看 | 精品无人码麻豆乱码1区2区| 久久久久亚洲精品天堂| 狠狠色噜噜狠狠狠狠97俺也去| 丰满少妇被爽的高潮喷水呻吟| 2019最新中文字幕在线观看| 国产亚洲精品第一综合麻豆| 成在线人免费无码高潮喷水| 黄色影院不卡一区二区| 妺妺窝人体色www聚色窝| 四虎影视亚洲精品| 精品亚洲乱码一区二区三区| 色大全全免费网站久久| 熟妇人妻无乱码中文字幕 | 日本女u久久精品视频| av无码小缝喷白浆在线观看| 亚洲一本大道无码av天堂| √最新版天堂资源在线| 加勒比特在线视频播放| 神马影院午夜dy888| 波多野结衣中文字幕久久 | 伊人久久综合影院首页| 日本精品一区二区三区在线播放 | 国产精品高清亚洲精品| 精品国产午夜肉伦伦影院| 久久99精品国产99久久6尤物| 欧美精品日韩一区二区三区| 草逼视频免费观看网站| 国偷自产一区二区免费视频|