侯 威
(云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與數(shù)學(xué)學(xué)院 云南 昆明 650000)
Logistic模型在股票市場(chǎng)中的應(yīng)用
侯 威
(云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與數(shù)學(xué)學(xué)院 云南 昆明 650000)
伴隨著社會(huì)經(jīng)濟(jì)的發(fā)展,及目前大數(shù)據(jù)技術(shù)在經(jīng)濟(jì)、政府統(tǒng)計(jì)、生物統(tǒng)計(jì)、信息技術(shù)等各種領(lǐng)域的廣泛應(yīng)用,人們?cè)絹?lái)越希望能夠?qū)⒋髷?shù)據(jù)的技術(shù)應(yīng)用到金融市場(chǎng)中去,運(yùn)用大數(shù)據(jù)的方法對(duì)金融風(fēng)險(xiǎn)進(jìn)行控制。本文介紹的logistic模型是回歸中的一個(gè)常用的模型,在實(shí)際生活中應(yīng)用十分廣泛。本文將logistic模型應(yīng)用到股票市場(chǎng)中,過(guò)去的歷史數(shù)據(jù)為基礎(chǔ),擬合logistic模型,對(duì)單只股票的漲跌進(jìn)行二分類的預(yù)測(cè)。
logistic模型;股票市場(chǎng);漲跌預(yù)測(cè);逐步回歸
1.研究背景及意義
隨著社會(huì)經(jīng)濟(jì)的發(fā)展,我國(guó)的金融行業(yè)正進(jìn)入了一個(gè)飛速發(fā)展的時(shí)代,隨著社會(huì)財(cái)富的增加和人們理財(cái)意識(shí)的提高,越來(lái)越多的人愿意把自己的錢進(jìn)行投資,而股票也是人們投資的一個(gè)工具之一。隨著股票市場(chǎng)的不斷完善,以及數(shù)據(jù)規(guī)模的擴(kuò)大,越來(lái)越多的人開始進(jìn)行量化投資,即利用各種各樣的數(shù)據(jù)、指標(biāo)去預(yù)測(cè)金融市場(chǎng)的走向,并以此為基礎(chǔ)進(jìn)行投資。
Logistic模型作為回歸中的二分類模型,在股票市場(chǎng)上的應(yīng)用例子并不多。本文以個(gè)股的行情數(shù)據(jù)為基礎(chǔ),運(yùn)用logistic模型對(duì)股票進(jìn)行漲跌預(yù)測(cè),希望做到規(guī)避風(fēng)險(xiǎn)的目的。
2.寫作思路及步驟
本文嘗試將logistic二分類模型運(yùn)用到股票市場(chǎng)當(dāng)中去,對(duì)個(gè)股進(jìn)行漲跌預(yù)測(cè),使用wind金融資訊軟件進(jìn)行數(shù)據(jù)的提取,用R語(yǔ)言軟件對(duì)數(shù)據(jù)進(jìn)行處理和模型擬合。
首先,下載了wind金融資訊軟件,利用wind金融資訊軟件的R處理接口,嘗試與R軟件進(jìn)行對(duì)接,直接在R中即可獲取wind金融資訊軟件中的各種數(shù)據(jù)。
其次,獲取數(shù)據(jù)后,在R中對(duì)數(shù)據(jù)進(jìn)行處理,分成訓(xùn)練組和測(cè)試組,將某天漲跌幅大于等于0的數(shù)據(jù)定義為1,漲跌幅小于0的定義為0,用t期數(shù)據(jù)擬合logistic模型,去預(yù)測(cè)t+1期的漲跌。
再次,對(duì)模型進(jìn)行評(píng)價(jià),修改模型,得到最終的logistic預(yù)測(cè)模型,再利用測(cè)試組的數(shù)據(jù)對(duì)模型預(yù)測(cè)的準(zhǔn)確率進(jìn)行評(píng)估。
本文選取了股票市場(chǎng)個(gè)股的基本行情指標(biāo),包括有開盤價(jià)、最高價(jià)、最低價(jià)、收盤價(jià)、成交量、成交額、振幅、均價(jià)、換手率、尾盤凈流入資金、開盤凈流入資金、凈流入資金、凈流入量和漲跌等14個(gè)指標(biāo)。通過(guò)這些指標(biāo)可以較為全面地反映個(gè)股在股票市場(chǎng)上的表現(xiàn)。
1.數(shù)據(jù)提取
本文的相關(guān)數(shù)據(jù)都是通過(guò)wind金融資訊軟件提取,通過(guò)該軟件的R插件接口,對(duì)接上統(tǒng)計(jì)分析軟件R軟件,再用R軟件進(jìn)行數(shù)據(jù)的提取。
在本文中,提取了股票代碼為600152.SH的股票,從2014年1月份開始到2015年12月25號(hào)的數(shù)據(jù)。
2.數(shù)據(jù)清洗
得到600152.SH代碼的股票485期原始數(shù)據(jù)后,需要對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗。首先,將t+1期漲跌幅大于等于0的t期因變量y設(shè)置為1,將t+1期漲跌幅小于0的t期因變量y設(shè)置為0,即用t期的數(shù)據(jù)預(yù)測(cè)t+1期的漲跌。其次,將數(shù)據(jù)的y指標(biāo)整理為當(dāng)前期數(shù)t+1期的漲跌幅。再次,將455期以前的數(shù)據(jù)定為訓(xùn)練組數(shù)據(jù),455期之后的30期數(shù)據(jù)為測(cè)試組數(shù)據(jù)。
3.模型估計(jì)
對(duì)于logistic模型只能用極大似然法進(jìn)行估計(jì)。在處理上,首先直接把14個(gè)自變量納入模型,經(jīng)極大似然估計(jì)得出的系數(shù)存在較大的標(biāo)準(zhǔn)誤差,且部分指標(biāo)不能通過(guò)統(tǒng)計(jì)檢驗(yàn)。再通過(guò)逐步回歸的方法,找到AIC信息量最小的回歸。
逐步回歸結(jié)果可以確定引用模型中的變量個(gè)數(shù)為4個(gè),AIC值為618.68,引入的變量分別為最高價(jià)、最低價(jià)、凈流入資金和均價(jià)。
4.模型檢驗(yàn)
對(duì)原始模型和篩選完變量后的模型Model 10進(jìn)行方差分析,結(jié)果顯示,方差分析的卡方統(tǒng)計(jì)量的值不顯著(p=0.6234),表明只引入4個(gè)變量的模型與全變量的模型擬合程度一樣好,減少其余10個(gè)變量并不會(huì)影響模型的預(yù)測(cè)精度,因此可以依據(jù)更加精簡(jiǎn)的模型Model 10進(jìn)行解釋。
用模型的殘差偏差與殘差自由度進(jìn)行過(guò)度離勢(shì)檢驗(yàn),結(jié)果顯示,卡方統(tǒng)計(jì)量的p值為0.3895,顯然不顯著,不能拒絕殘差偏差與殘差自由度等于1的原假設(shè),故可認(rèn)為該模型的相應(yīng)變量并不存在過(guò)度離勢(shì)的情況。
似然比檢驗(yàn)LR統(tǒng)計(jì)量的結(jié)果表明統(tǒng)計(jì)顯著性很強(qiáng),可認(rèn)為模型通過(guò)了LR檢驗(yàn),拒絕了模型系數(shù)為0的假設(shè),可認(rèn)為自變量提供的信息是有用的。
對(duì)于logistic模型,估計(jì)未知總體參數(shù)時(shí)主要采用的是極大似然估計(jì)。本文中使用極大似然法對(duì)模型參數(shù)進(jìn)行估計(jì),并用Wald檢驗(yàn)法對(duì)參數(shù)進(jìn)行檢驗(yàn),結(jié)果顯示,可以看出各參數(shù)均顯著。
表1 極大似然估計(jì)和Wald檢驗(yàn)
基于上述分析與測(cè)算,可得出logistic回歸分析方程為:
自變量分別為:HIGH最高價(jià),LOW最低價(jià),AMT成交額,VWAP均價(jià)。
模型解釋:可以看到,最高價(jià)增加一個(gè)單位,漲跌的優(yōu)勢(shì)比將乘以0.2088,最低價(jià)增加一個(gè)單位,漲跌的優(yōu)勢(shì)比將乘以0.2403,成交額增加一個(gè)單位,張得的優(yōu)勢(shì)比將乘以1,當(dāng)均價(jià)增加一個(gè)單位的時(shí)候,將會(huì)引起漲跌優(yōu)勢(shì)比變?yōu)樵瓉?lái)的20.7641倍。這可以認(rèn)為,對(duì)漲跌比影響最大的因素就是均價(jià),而均價(jià)是證券在交易日所在指定周期內(nèi)所有成交額與所有成交量之比。因此,我們?cè)诮窈蟮淖C券價(jià)格預(yù)測(cè)研究中可以重點(diǎn)關(guān)注這個(gè)指標(biāo)。
[1]孫磊平.數(shù)據(jù)挖掘方法在股票分析中的應(yīng)用與研究[D].西南財(cái)經(jīng)大學(xué),2013
[2]肖朝勝.股市危機(jī)預(yù)警系統(tǒng)研究[D].西南交通大學(xué),2008
[3]于立勇,詹捷輝.基于Logistic回歸分析的違約概率預(yù)測(cè)研究[J].財(cái)經(jīng)研究,2004
[4]張韜.基于非參數(shù)統(tǒng)計(jì)的程序化交易策略研發(fā)報(bào)告[D].浙江工商大學(xué),2013
[5](美)卡巴科弗.R語(yǔ)言實(shí)戰(zhàn)[M].人民郵電出版社,2013.1
侯威(1992-),男,漢族,河南許昌人,云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與數(shù)學(xué)學(xué)院,研究方向:經(jīng)濟(jì)統(tǒng)計(jì)。