潘敬 胥少陽(yáng)|文
對(duì)期貨價(jià)格進(jìn)行技術(shù)分析,量(成交量、持倉(cāng)量)、價(jià)(價(jià)格及其形態(tài))因素缺一不可。采用無(wú)監(jiān)督學(xué)習(xí)的方法對(duì)倫敦金屬交易所鋅三月期貨合約進(jìn)行大數(shù)據(jù)挖掘,讓數(shù)據(jù)說(shuō)話(huà),打開(kāi)背后的“黑匣子”、揭示量與價(jià)之間的量化關(guān)系。
在傳統(tǒng)的技術(shù)分析方法中,學(xué)者們對(duì)量、價(jià)因素有著大量的定性研究:例如,具有長(zhǎng)上(下)影線(xiàn)的蠟燭圖往往預(yù)示著趨勢(shì)的反轉(zhuǎn)。價(jià)格下跌,而成交量、持倉(cāng)量增加,預(yù)示著價(jià)格仍將下行。然而多長(zhǎng)的上(下)影線(xiàn)才會(huì)預(yù)示著趨勢(shì)反轉(zhuǎn)? 成交量、持倉(cāng)量的變化需要達(dá)到什么樣幅度才會(huì)對(duì)價(jià)格趨勢(shì)產(chǎn)生影響?如果基于價(jià)格形態(tài)上看漲,但從量的因素分析上看跌,投資者們?cè)撊绾尉C合分析?諸如此類(lèi)問(wèn)題,僅僅依靠定性分析是無(wú)法解答的。投資者們不得不加入更多的主觀(guān)判斷。隨著科技的日益發(fā)達(dá),投資者們獲得交易數(shù)據(jù)的途徑更加便捷,通過(guò)對(duì)這些數(shù)據(jù)進(jìn)行挖掘,找出潛在的量化信息,彌補(bǔ)了傳統(tǒng)技術(shù)分析方法上的不足。因此,近年來(lái),通過(guò)大數(shù)據(jù)學(xué)習(xí)制定交易策略的方法越來(lái)越受到青睞。本文采用無(wú)監(jiān)督學(xué)習(xí)的方法對(duì)倫敦金屬交易所的鋅三月期貨合約(以下簡(jiǎn)稱(chēng)“倫鋅”)進(jìn)行分析,挖掘背后蘊(yùn)藏的定量關(guān)系并將具有相似量?jī)r(jià)關(guān)系的交易日歸為一類(lèi),通過(guò)對(duì)交易日進(jìn)行分類(lèi),找出最優(yōu)的交易策略。
本文采用倫鋅合約過(guò)去2527 個(gè)交易日的數(shù)據(jù)(2009年1月9日~2019年1月12日),包括:最高價(jià)、最低價(jià)、開(kāi)盤(pán)價(jià)、收盤(pán)價(jià)、成交量以及持倉(cāng)量,在R 語(yǔ)言平臺(tái)進(jìn)行挖掘。
首先,確定數(shù)據(jù)挖掘的維度?;谝陨蠑?shù)據(jù),模型從5 個(gè)維度進(jìn)行分析:第一,最高價(jià)與收盤(pán)價(jià)的差;第二,最低價(jià)與收盤(pán)價(jià)的差;第三,最高價(jià)與最低價(jià)的差;第四,當(dāng)日與上一交易日持倉(cāng)量的變化;第五,當(dāng)日成交量。第一個(gè)及第二個(gè)維度反映了價(jià)格沖高回落或觸底反彈的程度,第三個(gè)維度為當(dāng)日最大的波幅,持倉(cāng)量的變化反映了當(dāng)前價(jià)格是由于交易者清倉(cāng)離場(chǎng)還是主動(dòng)開(kāi)倉(cāng)造成的,成交量維度反映了價(jià)格變化的能量。在對(duì)數(shù)據(jù)進(jìn)行挖掘之前,首先對(duì)以上五個(gè)維度的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。
第二,選擇數(shù)據(jù)挖掘的算法。本文采用層次聚類(lèi)(Hierarchical Clustering)中的最遠(yuǎn)距離聚類(lèi)算法(Farthest-Neighbor Method) 從 以 上5 個(gè) 維度對(duì)2527 個(gè)交易日進(jìn)行分類(lèi),將具有相似交易情況的交易日歸在一起。最遠(yuǎn)距離聚類(lèi)算法通過(guò)計(jì)算歐氏距離來(lái)確定每個(gè)交易日之間的相似程度:
在確定45 個(gè)類(lèi)別個(gè)數(shù)后,最遠(yuǎn)距離聚類(lèi)算法將2527 個(gè)交易日分別歸入到45 個(gè)類(lèi)別之中,其中第7 個(gè)類(lèi)別包含的交易日最多,共413 個(gè)交易日,第20、21 和第43 個(gè)類(lèi)別包含的交易日最少,分別只包含了一個(gè)交易日。以第19 個(gè)類(lèi)別為例,有6 個(gè)交易日被歸到了一起,從下圖的數(shù)據(jù)可以看出(圖1),雖然每個(gè)交易日所處的價(jià)格區(qū)間大有不同,但這6 個(gè)交易日的波幅普遍較大,蠟燭圖實(shí)體較長(zhǎng),成交量也相對(duì)較大。
2018年11月12日 與2018年11月13日倫鋅價(jià)格分別收于2498 美元/噸、2492 美元/噸,雖然連續(xù)2 個(gè)交易日的收盤(pán)價(jià)基本持平,波幅也較為相似,但2 個(gè)交易日分別被無(wú)監(jiān)督學(xué)習(xí)模型納入了第7、第10 個(gè)類(lèi)別,或許這是由于2 個(gè)交易日的沖高回落幅度相差較大的所造成的,2018年11月12日從最高價(jià)到收盤(pán)價(jià)回落約0.99%,而11月13日的回落幅度約1.96%(圖2)。由此可見(jiàn),數(shù)據(jù)挖掘可以幫助人們找到大數(shù)據(jù)背后更多的潛在信息。
圖1 第19個(gè)類(lèi)別所包含的交易日
圖2 2018年11月12日與2018年11月13日的分類(lèi)結(jié)果
圖3 10種最優(yōu)做多交易策略
圖4 10種最優(yōu)做空交易策略
一個(gè)好的交易策略需要滿(mǎn)足三個(gè)條件:第一,勝率高;然而勝率高并不能保證最終盈利。假設(shè)根據(jù)一個(gè)策略共交易10 次,其中9 次正確,每次盈利1美元,而最后一次交易虧損100 美元,最終虧損為91 美元,所以第二個(gè)條件是較高的盈利;第三,最大回撤較低。通過(guò)聚類(lèi)分析,2527 個(gè)交易日被分為45 個(gè)類(lèi)別,也就意味著總共有1980 種(45×44)開(kāi)平倉(cāng)類(lèi)別組合。我們選定過(guò)去2527 個(gè)交易日中勝率高于70%的開(kāi)平倉(cāng)組合,并按照最大回撤進(jìn)行排序,分別選出10 種最優(yōu)的做多、做空策略。
圖3為最優(yōu)的10 種做多策略。10種開(kāi)平倉(cāng)組合在過(guò)去10年中總計(jì)出現(xiàn)過(guò)57 次,利潤(rùn)率均達(dá)到了兩位數(shù),但是其中7 種策略的最大回撤幅度較大,超過(guò)了10%。
最優(yōu)的10 種做空策略在過(guò)去10年間共出現(xiàn)過(guò)60 次(圖4),勝率高的同時(shí),利潤(rùn)率也超過(guò)了10%。其中排在第一的做空組合的最大回撤僅為7%左右,利潤(rùn)率卻高達(dá)18%。
得出最優(yōu)策略后,下一步需要將未來(lái)的每個(gè)交易日歸入到45 個(gè)類(lèi)別之中。首先,可以選擇神經(jīng)網(wǎng)絡(luò)或邏輯回歸等算法對(duì)過(guò)去的2527 個(gè)交易日及其所屬類(lèi)別標(biāo)簽進(jìn)行有監(jiān)督學(xué)習(xí),挖掘出背后的分類(lèi)算法,其次,將新的交易日的5 個(gè)維度代入到算法中,從而得出其所屬類(lèi)別。由于篇幅原因,本文在此不做詳細(xì)描述。
對(duì)交易數(shù)據(jù)進(jìn)行深度挖掘可以幫助人們找到背后的量?jī)r(jià)關(guān)系,做出科學(xué)的投資決策,從而避免了主觀(guān)判斷上的隨意性。對(duì)于倫鋅來(lái)說(shuō),根據(jù)過(guò)去10年間的數(shù)據(jù),本文分別選取出了10 種最佳的做多和做空交易策略。所選取的交易策略勝率較高且利潤(rùn)率超過(guò)10%以上,但由于鋅的交易流動(dòng)性較好,波動(dòng)較大,最大回撤幅度也比較高。
對(duì)于模型本身而言,在未來(lái)可以向兩個(gè)方向繼續(xù)進(jìn)行擴(kuò)展:一是可以根據(jù)不同的交易頻率(15 分鐘、30 分鐘、1小時(shí)級(jí)別等)從新對(duì)數(shù)據(jù)進(jìn)行學(xué)習(xí);二是可以增加更多的分析維度,例如通過(guò)增加時(shí)間維度,來(lái)反映一個(gè)趨勢(shì)力度的變化。