亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機(jī)器學(xué)習(xí)下量化選股的分析

        2018-05-31 02:49:24楊亞東
        商情 2018年14期
        關(guān)鍵詞:機(jī)器學(xué)習(xí)

        楊亞東

        【摘要】股票市場屬于非線性系統(tǒng),復(fù)雜性高而信噪比低。目前,多個(gè)領(lǐng)域中已經(jīng)證實(shí),機(jī)器學(xué)習(xí)是一種能夠針對(duì)模糊非線性數(shù)據(jù)建模的工具,所以機(jī)器學(xué)習(xí)具有天然的應(yīng)用到量化投資領(lǐng)域的優(yōu)勢。從本質(zhì)上看,選股是排序問題,投資者希望在眾多的股票中選擇出具有更好未來表現(xiàn)的股票?;诖耍疚姆治隽死脵C(jī)器學(xué)習(xí)量化選股的方法。

        【關(guān)鍵詞】機(jī)器學(xué)習(xí) 量化投資 選股

        相對(duì)于國外來說,我國屬于剛剛開始發(fā)展量化投資,存在的不足之處仍比較多,但從實(shí)際情況看,A股市場具有較短的發(fā)展歷程,與已經(jīng)發(fā)展的比較成熟的海外市場相比,市場有效程度比較弱,錯(cuò)誤定價(jià)的股票數(shù)量比較多,普遍存在非理性人投資行為,也正是因?yàn)榇朔N不成熟特征的存在,為我國量化投資的發(fā)展提供了巨大的空間。因此,在現(xiàn)階段A股市場中,更適合的量化投資方式為公正、理性、客觀的。由此看來,本文研究量化選股的方法具有十分重要的現(xiàn)實(shí)意義。

        一、短線選股策略

        本節(jié)構(gòu)建樣本集時(shí),特征選擇為20個(gè)交易日內(nèi)個(gè)股的收盤價(jià)走勢,訓(xùn)練樣本方法采用兩種,分別為機(jī)器學(xué)習(xí)算法GBDT、GBRank,模式識(shí)別有機(jī)器學(xué)習(xí)自動(dòng)進(jìn)行。

        (一)數(shù)據(jù)準(zhǔn)備

        需準(zhǔn)備的數(shù)據(jù)包含2部分,一部分為樣本內(nèi)數(shù)據(jù),屬于訓(xùn)l練集,另一部分為樣本外數(shù)據(jù),屬于測試集。本文數(shù)據(jù)均來源于Wind資訊,時(shí)間段為2006年1月1日2016年11月30日,均為A股收盤價(jià)。之后分割該時(shí)問段的數(shù)據(jù),使其變?yōu)椴淮嬖诮患膬刹糠郑?xùn)練樣本使用2006年1月1日2012年11月5日數(shù)據(jù),測試樣本使用剩余時(shí)間段的數(shù)據(jù)。訓(xùn)l練樣本和測試樣本生產(chǎn)時(shí),如果股票上市后的交易日未滿21個(gè),做剔除處理,最后,生產(chǎn)約240萬訓(xùn)練樣本。

        (二)提取特征

        構(gòu)建策略時(shí),關(guān)鍵性的一步為特征提取,因本章短線選股策略是在模式識(shí)別基礎(chǔ)上進(jìn)行的,因此,關(guān)注K線形態(tài)特,征過程中僅選擇20個(gè)交易日的。首先,通過指數(shù)移動(dòng)平均線,過濾到收盤價(jià)的噪聲,隨后進(jìn)行價(jià)格走勢形態(tài)特征向量的描述,描述序列為收益率序列,最后,完成特征提取。

        (三)模型訓(xùn)練

        排序模型訓(xùn)練時(shí),利用兩種算法進(jìn)行。第一種為GBDT,訓(xùn)練中,股票問相對(duì)順序不做考慮,僅擬合其絕對(duì)得分,訓(xùn)練樣本構(gòu)建過程中,3個(gè)交易日后,若樣本漲幅≥1%,則得分=1,否則樣本得分=O,根據(jù)此種方式,訓(xùn)練樣本集即可獲得,接著以訓(xùn)練樣本集作為GBDT的輸入樣本集,訓(xùn)練排序模型,此過程中,由于GBDT存在較多的參數(shù),如果調(diào)參采用交叉驗(yàn)證方式,將會(huì)耗費(fèi)大量的時(shí)間,因此,本文按照知識(shí)和經(jīng)驗(yàn),調(diào)優(yōu)逐步的進(jìn)行,完整訓(xùn)練后,排出函數(shù)h輸出,通過h,即可開展打分操作,依據(jù)分?jǐn)?shù)由高到低,排序未來3天內(nèi)漲幅會(huì)超過1%的股票,供投資者選擇。第二種為GBRank,這是一種pairwise方法,僅對(duì)同一時(shí)段內(nèi)股票的相對(duì)漲跌幅做出考慮,保證訓(xùn)練樣本不會(huì)受到系統(tǒng)性風(fēng)險(xiǎn)的影響,訓(xùn)練樣本集獲取后,輸入到GBRank中,訓(xùn)練排序模型,參數(shù)直接選擇相同于GBDT的,最終,排除函數(shù)h獲得,排序未來3天內(nèi)股票的表現(xiàn)。

        二、長線選股策略

        因短線選股策略僅能排序3天以內(nèi)的,時(shí)間較短,本節(jié)提出的長線選股策略可排序未來20個(gè)交易日內(nèi)的股票。

        (一)數(shù)據(jù)準(zhǔn)備

        本節(jié)中,數(shù)據(jù)來源、選取時(shí)間段、劃分訓(xùn)練樣本和測試樣本的方法均相同于1.1,不過,訓(xùn)練樣本和測試樣本生成時(shí),要將股票上市時(shí)間不足3個(gè)月的剔除,以能與44維的要求相符合。最后,生成約160萬的訓(xùn)練樣本。

        (二)特征提取

        因要構(gòu)建長線選股策略,因此要對(duì)個(gè)股在過去20個(gè)交易內(nèi)、2個(gè)月交易日內(nèi)、3個(gè)月交易日內(nèi)的動(dòng)量因子做出關(guān)注。首先。動(dòng)量、反轉(zhuǎn)效應(yīng)特征向量描述時(shí),采用的序列為個(gè)股動(dòng)量因子序列,z-score標(biāo)準(zhǔn)化處理每一維度的特征向量;其次,以元素所處維度為依據(jù),將每個(gè)元素的分位數(shù)計(jì)算出來;最后,組合上述兩步處理后的特征向量,使特征向量達(dá)到44維,此種特征向量能夠輸入到機(jī)器學(xué)習(xí)中。

        (三)模型訓(xùn)練

        模型訓(xùn)練時(shí),同樣采用1.3中的兩種方法。利用GBDT訓(xùn)練過程中,訓(xùn)練方式采用pointwise,無需對(duì)股票問相對(duì)順序做出考慮,僅需擬合其絕對(duì)分?jǐn)?shù),20個(gè)交易日后,與股票漲幅均值相比,樣本股價(jià)漲幅更大時(shí),得分=1,樣本股價(jià)漲幅更小時(shí),得分=O,此處劃分樣本參照的標(biāo)準(zhǔn)為漲幅均指,以能保證排序的客觀性、準(zhǔn)確性,隨后,獲得訓(xùn)練樣本集,并輸入到GBDT中,訓(xùn)練排序模型,由于本節(jié)特征向量維度要顯著高于1.3節(jié)的,因此設(shè)置參數(shù)時(shí)會(huì)不同于1.3,要增加回歸樹最大深度、并增加葉子結(jié)點(diǎn)數(shù)上限,完成訓(xùn)練后,排序函數(shù)h獲得,通過h,即可完成未來20個(gè)交易日內(nèi)的股票排序工作。利用GBRank訓(xùn)練過程中,訓(xùn)練方法相同于1.3此種方法,獲得訓(xùn)練樣本集后,輸入到GBRank中,接著訓(xùn)練排序模型,設(shè)定的參數(shù)完全相同于本節(jié)的GBDT方法,最終,排序函數(shù)h獲得,完成排序。

        三、結(jié)論

        機(jī)器學(xué)習(xí)基礎(chǔ)上,本文構(gòu)建了短線和長線量化選股策略,能夠排序未來3個(gè)交易日及未來20個(gè)交易日內(nèi)的股票,利于投資者實(shí)現(xiàn)量化選股,從而提高投資者投資的理性程度,促進(jìn)我國A股市場的良好發(fā)展。不過,本文構(gòu)建選股策略后,并未進(jìn)行實(shí)際的實(shí)驗(yàn),因而還需要進(jìn)一步的開展驗(yàn)證研究。

        參考文獻(xiàn):

        [1]馮楠,陳有為.基于量化趨勢跟蹤的計(jì)算機(jī)自動(dòng)化選股模型的設(shè)計(jì)與實(shí)現(xiàn)[J].自動(dòng)化與儀器儀表,2016,(08).

        [2]李姝錦,胡曉旭,王聰.淺析基于大數(shù)據(jù)的多因子量化選股策略[J].經(jīng)濟(jì)研究導(dǎo)刊,2016,(17).

        猜你喜歡
        機(jī)器學(xué)習(xí)
        基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
        基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
        基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
        前綴字母為特征在維吾爾語文本情感分類中的研究
        下一代廣播電視網(wǎng)中“人工智能”的應(yīng)用
        活力(2016年8期)2016-11-12 17:30:08
        基于支持向量機(jī)的金融數(shù)據(jù)分析研究
        基于Spark的大數(shù)據(jù)計(jì)算模型
        基于樸素貝葉斯算法的垃圾短信智能識(shí)別系統(tǒng)
        基于圖的半監(jiān)督學(xué)習(xí)方法綜述
        機(jī)器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
        国产一区二区三区资源在线观看 | 全黄性性激高免费视频| 久久久久波多野结衣高潮| 亚洲久热无码av中文字幕| 亚洲色婷婷综合开心网| 国产又色又爽的视频在线观看91| 虎白m粉嫩小在线播放| 国产美女精品视频线免费播放软件| 人人爽人人爽人人爽人人片av| YW亚洲AV无码乱码在线观看| 日韩精品精品一区二区三区| 美国黄色av一区二区| av大全亚洲一区二区三区| 在线天堂www中文| 午夜精品一区二区三区在线观看| 久久99国产亚洲高清观看首页| 九九久久精品一区二区三区av | 麻豆av在线免费观看精品| 在线观看中文字幕二区| 亚洲男同gay在线观看| 国产成人亚洲精品无码h在线| 韩国日本亚洲精品视频| 午夜亚洲精品一区二区| av在线播放男人天堂| 日本精品无码一区二区三区久久久| 欧美精品久久久久久久自慰| 亚洲AV专区一专区二专区三| 久久久国产熟女综合一区二区三区 | 激情久久黄色免费网站| 久久精品国产亚洲av麻豆图片| 亚洲国产另类久久久精品黑人| 九九久久精品大片| 中文字幕文字幕视频在线| 欧美颜射内射中出口爆在线| 激情五月六月婷婷俺来也| 精品国产sm最大网站| 亚洲av麻豆aⅴ无码电影| 国产国拍亚洲精品午夜不卡17| 亚洲天堂av在线免费看| 亚洲中文字幕舔尻av网站| 性大毛片视频|