亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于三種核函數(shù)的SVM選股模型的實(shí)證分析

        2020-08-10 09:16:31肖陽丁琦
        中國(guó)商論 2020年15期

        肖陽 丁琦

        摘 要:本文首先基于信息系數(shù)構(gòu)建了單因子策略,并利用近年來中國(guó)A股數(shù)據(jù)對(duì)市場(chǎng)上12大類共500多個(gè)因子進(jìn)行評(píng)分篩選,得到了22個(gè)有效因子。其次,結(jié)合上述有效因子,并基于三種不同的核函數(shù)建立了支持向量機(jī)多因子選股模型。最后,利用真實(shí)市場(chǎng)數(shù)據(jù)對(duì)上述模型進(jìn)行了回測(cè),并通過網(wǎng)格搜索和交叉驗(yàn)證法確定了模型參數(shù)的最優(yōu)取值,實(shí)驗(yàn)結(jié)果表明三種核函數(shù)都有獲得超額收益的表現(xiàn)。其中線性核函數(shù)具有高貝塔性,多項(xiàng)式核函數(shù)具有高的信息比率,而高斯核函數(shù)績(jī)效表現(xiàn)最優(yōu),年化收益達(dá)到24.76%。

        關(guān)鍵詞:量化投資? 支持向量機(jī)? 多因子模型? 股票

        中圖分類號(hào):F832.51 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-0298(2020)08(a)--03

        目前,國(guó)內(nèi)學(xué)術(shù)界對(duì)機(jī)器學(xué)習(xí)應(yīng)用在金融投資中的研究逐漸增加,對(duì)比判斷哪種因子和哪類模型在金融市場(chǎng)中是有效的,成為人們的研究目標(biāo)。歐陽中等對(duì)支持向量機(jī)的LS、OSU和SteveGunn三種不同核函數(shù)進(jìn)行了分類精度的比較,發(fā)現(xiàn)OSU分類性能最優(yōu)。劉佳祺等將BP神經(jīng)網(wǎng)絡(luò)算法與主成分分析法和遺傳算法相結(jié)合,對(duì)股票價(jià)格進(jìn)行預(yù)測(cè)。謝翔探究了七種機(jī)器學(xué)習(xí)算法在中國(guó)A股市場(chǎng)中的適應(yīng)效果。

        綜上,隨著數(shù)據(jù)和方法的增加,如何更有效的運(yùn)用使之與當(dāng)今的金融市場(chǎng)相匹配成為目前人們的主流研究方向。本文基于支持向量機(jī)方法和多因子選股模型,利用近年真實(shí)市場(chǎng)數(shù)據(jù)對(duì)三種不同的核函數(shù)和500個(gè)股票因子進(jìn)行實(shí)證研究,獲得了性能最優(yōu)的核函數(shù)模型和有效選股因子。

        1 文獻(xiàn)綜述

        多因子模型的適用性與收益率依賴于模型中所使用股票因子的有效性。劉帥針對(duì) 2848只股票和 20 個(gè)指標(biāo),提出了缺失數(shù)據(jù)的完備化過程,并以相對(duì)于大盤的漲跌概率為因變量分析有效因子。魏欣欣等從會(huì)計(jì)信息質(zhì)量以及中國(guó)股票特征兩個(gè)角度對(duì)50指數(shù)進(jìn)行了優(yōu)化研究??傊?,國(guó)內(nèi)學(xué)者正逐漸運(yùn)用多因子模型對(duì)大盤指數(shù)型成分股進(jìn)行實(shí)證分析,本文則在此基礎(chǔ)上運(yùn)用市場(chǎng)上500多不同類型的因子,并利用單因子策略給出股票因子的得分,以深挖A股市場(chǎng)中的有效因子。

        基于支持向量機(jī)模型的選股策略的超額收益率則取決于核函數(shù)和代入特征因子的有效性。陳陽將支持向量機(jī)與決策樹、隨機(jī)森林相結(jié)合,建立了滬深300指數(shù)的三分類預(yù)測(cè)模型,并選用了23個(gè)量?jī)r(jià)初始特征。江鵬選取了權(quán)益回報(bào)率、市盈率、換手率等價(jià)值,質(zhì)量、風(fēng)險(xiǎn)、動(dòng)量、情緒、收益等6大類共38個(gè)特征因子,將支持向量機(jī)與主成分分析相結(jié)合,開發(fā)了針對(duì)平安銀行股票的擇時(shí)策略??傊?,支持向量機(jī)與多因子模型有著多種結(jié)合方式與評(píng)價(jià)體系,并對(duì)滬深300指數(shù)的預(yù)測(cè)和股票擇時(shí)策略的設(shè)計(jì)提供了有力的技術(shù)支撐。本文利用所選出的有效因子與滬深300指數(shù)的成分股,對(duì)基于不同核函數(shù)的支持向量機(jī)選股模型進(jìn)行實(shí)證分析,以比較各個(gè)核函數(shù)的有效性與適用性。

        2 有效因子篩選

        本文從點(diǎn)寬網(wǎng)獲取了12類共500多個(gè)因子在2016年1月4日至2018年9月28日的真實(shí)市場(chǎng)數(shù)據(jù),并通過去極值、標(biāo)準(zhǔn)化和同趨化處理,將全部數(shù)據(jù)統(tǒng)一到相同維度。信息系數(shù)(IC,Information Coefficient)可以反映因子與股票收益之間的關(guān)系,其為所選因子在當(dāng)期(時(shí))的值與股票下期(時(shí))收益率的截面相關(guān)關(guān)系:

        進(jìn)而,將IC值與因子值的乘積作為買進(jìn)股票的選股標(biāo)準(zhǔn),稱其為排序因子:

        由此可以構(gòu)建單因子模型:在月初計(jì)算排序因子,選取因子值較大的前1/15只股票作為本月的目標(biāo)標(biāo)的,并在月底平倉(cāng),以后每月重復(fù)上述過程。

        針對(duì)所有因子,對(duì)上述模型進(jìn)行回測(cè),可以得到相應(yīng)的阿爾法、夏普比率、年化收益率、盈利因子等數(shù)據(jù),進(jìn)一步將上述數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,并以其等權(quán)重加總作為該因子的得分。本文最終選取得分最高的22個(gè)因子作為有效因子(表1)。

        3 支持向量機(jī)多因子選股模型

        支持向量機(jī)是一類按監(jiān)督學(xué)習(xí)方式對(duì)數(shù)據(jù)進(jìn)行二元分類的廣義線性分類器。在分類過程中,記()為輸入的因子數(shù)據(jù), 為每類因子的特征構(gòu)成的特征空間,將其作為決策邊界的超平面,把學(xué)習(xí)目標(biāo)按正負(fù)類分開,而學(xué)習(xí)股票的漲跌記為(),其中上漲為正類,下跌為負(fù)類。從而得到支持向量機(jī)模型:

        其中, 為超平面的法向量,為截距。分類后,在上間隔邊界上方的標(biāo)的屬于上漲類型,在下間隔邊界下方的標(biāo)的屬于下跌類型,而在間隔邊界上的漲跌類標(biāo)的為支持向量。

        在使用超平面作為決策邊界分類時(shí)會(huì)帶來損失,即部分支持向量在間隔邊界內(nèi),而不是在邊界上。這時(shí)鉸鏈損失函數(shù)可以對(duì)這類損失進(jìn)行量化,其公式為:

        在使用分類器學(xué)習(xí)并應(yīng)用新數(shù)據(jù)時(shí)會(huì)產(chǎn)生風(fēng)險(xiǎn),根據(jù)風(fēng)險(xiǎn)的類型可分為結(jié)構(gòu)風(fēng)險(xiǎn)和經(jīng)驗(yàn)風(fēng)險(xiǎn):

        其中,表示分類器。

        通常我們對(duì)于風(fēng)險(xiǎn)都希望其能最小化,可以通過最小化結(jié)構(gòu)風(fēng)險(xiǎn)和經(jīng)驗(yàn)風(fēng)險(xiǎn)的線性組合以確定模型參數(shù),此時(shí)對(duì)該分類器的求解轉(zhuǎn)化為一個(gè)正則化問題:

        其中,常數(shù)為是正則化系數(shù),表示模型對(duì)錯(cuò)誤分類的容忍度;而時(shí)即為正則化。

        在一些線性不可分的問題上,使用非線性函數(shù)可以將問題從原始的特征空間映射至更高維的空間,從而轉(zhuǎn)化為線性可分問題,其決策邊界的超平面表達(dá)式為:

        其中為映射函數(shù)。定義映射函數(shù)的內(nèi)積為核函數(shù),記為:

        常用的核函數(shù)有線性核、多項(xiàng)式核和高斯核。

        線性核解析式為:

        其中,為因子的特征空間數(shù)量。線性核主要用于線性可分的情況,特征空間到輸入空間的維度是一樣的。

        多項(xiàng)式核解析式為:

        其中,為原始數(shù)據(jù)映射到高維數(shù)據(jù)后,在高維特征空間中的分布,為映射的維度。主要用于正交歸一化數(shù)據(jù),可以實(shí)現(xiàn)將低維的輸入空間映射到高緯的特征空間。

        高斯核解析式為:

        是一種局部性強(qiáng)的核函數(shù),能夠?qū)颖居成涞礁呔S的空間內(nèi)。

        根據(jù)上述三類核函數(shù),分別建立支持向量機(jī)多因子選股模型:在月初利用支持向量機(jī)模型對(duì)滬深300股票池中股票進(jìn)行分類,選出為上漲形態(tài)的股票,對(duì)篩選出的股票進(jìn)行等權(quán)重買入,并將前一個(gè)月所持有的股票進(jìn)行平倉(cāng),以后每月重復(fù)上述過程。

        4 實(shí)證分析

        2016年1月至2018年9月可以按行情分為三個(gè)時(shí)期:2016年1月至2017年5月為震蕩市場(chǎng);2017年5月至2018年2月為上漲市場(chǎng);2018年2月至2018年10月為下跌市場(chǎng)。因而此時(shí)的市場(chǎng)具有很強(qiáng)的多變性與普適性,利用該時(shí)間段的真實(shí)市場(chǎng)數(shù)據(jù)進(jìn)行回測(cè),更能檢測(cè)出模型的優(yōu)劣。

        首先運(yùn)用網(wǎng)格搜索和交叉驗(yàn)證法確定不同核函數(shù)中參數(shù)的最優(yōu)取值。在線性核中取;在多項(xiàng)式核中取且;在高斯核中取且。

        進(jìn)而對(duì)本文所建多因子模型進(jìn)行回測(cè),回測(cè)績(jī)效見表2。

        由此可見,在累計(jì)收益率方面,高斯核最高,而線性核最低;在最大回測(cè)方面,則是線性核最高,而高斯核最低。因而高斯核在收益和風(fēng)險(xiǎn)兩方面均表現(xiàn)最優(yōu)。這一結(jié)果說明因子數(shù)據(jù)是十分多樣化的,極少存在線性可分和正交歸一化的情況,從而使得線性核和多項(xiàng)式核的表現(xiàn)弱于高斯核。

        按回測(cè)順序(線性核、多項(xiàng)式核和高斯核函數(shù)),阿爾法、夏普比率依次升高,最低年化收益率為14.56%,而基準(zhǔn)收益率僅為-0.87%,說明支持向量機(jī)策略在不同核函數(shù)上能夠同時(shí)獲得超額收益。多項(xiàng)式核和高斯核的夏普比率和信息比率均大于1,表現(xiàn)出策略每承擔(dān)1個(gè)單位的風(fēng)險(xiǎn)得到的收益大于風(fēng)險(xiǎn)。三種核對(duì)應(yīng)的貝塔均大于0.7,說明股票收益率與市場(chǎng)收益率是高度相關(guān)的。

        2016年1月至2018年9月的回測(cè)曲線如下:

        其中下方為滬深300指數(shù)走勢(shì),上方為支持向量機(jī)模型策略走勢(shì)。

        通過不同核函數(shù)策略之間對(duì)比回測(cè)曲線可以發(fā)現(xiàn),支持向量機(jī)模型在前期震蕩市場(chǎng)中,線性核和高斯核函數(shù)均能獲得明顯超額收益;在上漲市場(chǎng)中多項(xiàng)式核函數(shù)獲得超額收益的能力較強(qiáng);在下跌市場(chǎng)中線性核和多項(xiàng)式核都出現(xiàn)不同程度的下跌,而高斯核函數(shù)很快的適應(yīng)市場(chǎng)行情,收益創(chuàng)出新高。由此可見,基于高斯核函數(shù)的支持向量機(jī)選股策略不僅能夠在短期投資中獲得極大收益,在長(zhǎng)期投資中穩(wěn)健獲利,而且能夠極好的適應(yīng)各種市場(chǎng)行情。

        5 結(jié)語

        綜上所述,本文首先利用單因子模型從市場(chǎng)上12大類共計(jì)500多個(gè)因子中篩選出22個(gè)有效因子。然后,利用篩選出的有效因子構(gòu)建了基于不同核函數(shù)的支持向量機(jī)選股模型,并利用近年真實(shí)市場(chǎng)數(shù)據(jù)對(duì)該模型進(jìn)行了回測(cè)。從績(jī)效報(bào)告和回測(cè)曲線可以看出,基于高斯核函數(shù)的模型相比于其余兩種核函數(shù)表現(xiàn)更佳,能夠在不同的行情下獲得穩(wěn)健收益,以及較低的風(fēng)險(xiǎn)控制。

        參考文獻(xiàn)

        歐陽中,王育齊,俞梅洪.基于不同核函數(shù)的支持向量機(jī)的分析與比較[J].福建電腦,2013(10).

        劉佳祺,劉德紅,林甜甜.基于BP神經(jīng)網(wǎng)絡(luò)模型的股票價(jià)格研究[J].中國(guó)商論,2018(08).

        謝翔.機(jī)器學(xué)習(xí)算法對(duì)中國(guó)A股的適應(yīng)性比較[D].廣州:暨南大學(xué),2017.

        劉帥.量化投資:若干金融衍生品的定價(jià)模型及投資策略研究[D].上海:上海大學(xué),2016.

        魏欣欣,徐悅,張?jiān)娧?股票基本面指數(shù)的優(yōu)化研究[J].中國(guó)商論,2019(14).

        朱晨曦.我國(guó)A股市場(chǎng)多因子量化選股模型實(shí)證分析[D].北京:首都經(jīng)濟(jì)貿(mào)易大學(xué),2017.

        陳陽.基于SVM的滬深300指數(shù)漲跌預(yù)測(cè)及量化策略研究[D].西安:西北大學(xué),2019.

        江鵬.基于支持向量機(jī)(SVM)股票擇時(shí)策略的研究[D].南昌:江西財(cái)經(jīng)大學(xué),2019.

        亚洲综合伊人久久综合| 国产av无码专区亚洲av手机麻豆| 人妻无码中文专区久久综合| 久久精品网站免费观看| 国内自拍速发福利免费在线观看 | 亚洲最大不卡av网站| 特一级熟女毛片免费观看| 久久综合伊人有码一区中文字幕| 亚洲av成人无码久久精品老人| 99久久久精品免费观看国产| 天天躁日日躁狠狠躁av中文| 国产一级淫片a免费播放口 | 中文字日产幕码三区做法| 99999久久久久久亚洲| 精品国产三级在线观看| 乱人伦人妻中文字幕不卡| 中文字幕一区二三区麻豆| 曰韩无码无遮挡a级毛片| 8888四色奇米在线观看| 日本人妻少妇精品视频专区| 国产精品亚洲一区二区麻豆| 狠狠色综合7777久夜色撩人ⅰ| 精品免费在线| 一区二区视频网站在线观看| 干出白浆视频在线观看| 亚洲乳大丰满中文字幕| 亚洲va欧美va国产综合| 亚洲精品国产熟女久久| 精品露脸熟女区一粉嫩av| 朝鲜女人大白屁股ass| 中文字幕久久久久人妻无码| 国产成人一区二区三区| 成人免费无码大片a毛片抽搐色欲| 无码h黄动漫在线播放网站| 国产黄片一区视频在线观看| 国产精品成人一区二区不卡| 久久久国产精品免费a片3d| 亚洲日韩欧美一区二区三区| 国产黄色一级大片一区二区| 无码中文亚洲av影音先锋| 国产成人v爽在线免播放观看|