石好+邢小艷
【摘要】近年來(lái)高送轉(zhuǎn)題材受到投資者的追捧,但是對(duì)高送轉(zhuǎn)股票的預(yù)測(cè)模型多采用主觀(guān)性較強(qiáng)的打分排序法。本文深入分析了各主要因素對(duì)高送轉(zhuǎn)行為的影響程度,采用Logistic回歸與主成分分析相結(jié)合的方法,構(gòu)建了年報(bào)高送轉(zhuǎn)股票的預(yù)測(cè)模型,并用2009~2015年高送轉(zhuǎn)股票樣本數(shù)據(jù)對(duì)模型進(jìn)行了驗(yàn)證。實(shí)證結(jié)果顯示,模型正確率在55%以上,預(yù)測(cè)準(zhǔn)確度最高可達(dá)80.91%。
【關(guān)鍵詞】高送轉(zhuǎn) logistic回歸 主成分分析
一、引言
高送轉(zhuǎn)股票(簡(jiǎn)稱(chēng)—高送轉(zhuǎn))是高比例送股或高比例轉(zhuǎn)股的統(tǒng)稱(chēng)。一般10股送轉(zhuǎn)合計(jì)5股(包括5股)以上才為高送轉(zhuǎn)。
對(duì)投資者而言,實(shí)施高送轉(zhuǎn)被看作重大利好消息,如果能夠提前介入市場(chǎng),在分享除權(quán)前的超額收益的同時(shí),也可從除權(quán)后的填權(quán)行情中獲利。因此,為了賺取盡可能高的超額收益,如何準(zhǔn)確預(yù)測(cè)可能實(shí)施高送轉(zhuǎn)的公司就成為關(guān)鍵。
本文嘗試主成分分析與logistic回歸相結(jié)合的方法構(gòu)建高送轉(zhuǎn)預(yù)測(cè)模型,該方法既避免了市場(chǎng)上常用的打分排序法在指標(biāo)選取和權(quán)重分配上的主觀(guān)性,又通過(guò)降維解決了多元回歸中的多重共線(xiàn)性問(wèn)題,還可以比較各個(gè)主要因素對(duì)高送轉(zhuǎn)行為的影響程度,并對(duì)未來(lái)實(shí)施高送轉(zhuǎn)的概率進(jìn)行直接估計(jì)。因此,從方法的科學(xué)性和嚴(yán)謹(jǐn)性角度,本文的研究方法更具優(yōu)勢(shì)。
二、研究設(shè)計(jì)
(一)主成分分析與logistic回歸原理
主成分分析,它通過(guò)變量變換的方法把相關(guān)的變量變?yōu)槿舾刹幌嚓P(guān)的綜合指標(biāo)變量[4],從而實(shí)現(xiàn)對(duì)數(shù)據(jù)集的降維,使得問(wèn)題得以簡(jiǎn)化。
邏輯回歸模型是一個(gè)非線(xiàn)性模型[5],但是它本質(zhì)上又是一個(gè)線(xiàn)性回歸模型,是二項(xiàng)分類(lèi)因變量常用的統(tǒng)計(jì)分析方法。
(二)影響高送轉(zhuǎn)實(shí)施的主要因素
對(duì)高送轉(zhuǎn)行為進(jìn)行量化,變量名為gsz,如果公司實(shí)施了高送轉(zhuǎn),gsz=1;否則,gsz=0。影響上市公司實(shí)施高送轉(zhuǎn)的因素有很多,包括市場(chǎng)環(huán)境、財(cái)務(wù)狀態(tài)、股價(jià)表現(xiàn)和監(jiān)管層政策等。經(jīng)研究驗(yàn)證后,本文選取因素如下:每股凈資產(chǎn)(mgjzc)、每股資本公積金(mgzbgj)、每股未分利潤(rùn)(mgwflr)、每股現(xiàn)金凈流量(mgxjjll)、上市時(shí)間(years)、股價(jià)(price)、股本(gb)。
(三)高送轉(zhuǎn)預(yù)測(cè)模型的構(gòu)建
在線(xiàn)性回歸模型中,若解釋變量之間存在精確相關(guān)關(guān)系或高度相關(guān)關(guān)系,會(huì)導(dǎo)致模型估計(jì)失真,所以本文采用主成分分析法消除自變量之間的共線(xiàn)性性,以便使模型更加準(zhǔn)確。
首先對(duì)上文所述自變量提取主成分,具體形式如下:
其中式中l(wèi)n(.)為自然對(duì)數(shù),pi是第i個(gè)樣本實(shí)施高送轉(zhuǎn)的概率。β0,β1,…,βs是回歸系數(shù),εi為隨機(jī)擾動(dòng)項(xiàng)。
然后利用pi的大小來(lái)判斷樣本股票是否發(fā)生高送轉(zhuǎn)。若pi>0.5,則認(rèn)為該樣本股票實(shí)施高送轉(zhuǎn),gsz=1;否則,該樣本股票不實(shí)施高送轉(zhuǎn),gsz=0。
三、數(shù)據(jù)來(lái)源與處理
(一)數(shù)據(jù)選取
本文擬選取了2009~2015年間所有A股為樣本。上市公司的利潤(rùn)分配方案包括中期方案和年度方案,從歷年情況來(lái)看,中期方案的高送轉(zhuǎn)股票較少,本文只考慮年度方案?;赥年年報(bào)做出的送轉(zhuǎn)方案,其對(duì)應(yīng)的高送轉(zhuǎn)實(shí)施年份一般在T+1年中期,即存在財(cái)務(wù)年份和實(shí)施年份的區(qū)別,本文統(tǒng)一選取實(shí)施年份為高送轉(zhuǎn)年份,即,基于T年年報(bào)在T+1年實(shí)施的高送轉(zhuǎn)行為定義為T(mén)+1年高送轉(zhuǎn)。
假定在T年年末預(yù)測(cè)T+1年實(shí)施高送轉(zhuǎn)的股票,因?yàn)榇藭r(shí)T年年報(bào)未出,為了保持建模與預(yù)測(cè)一致性,每股凈資產(chǎn)等財(cái)務(wù)數(shù)據(jù)統(tǒng)一選取T年三季報(bào)數(shù)據(jù),股價(jià)等非財(cái)務(wù)數(shù)據(jù)統(tǒng)一選取T年最后一個(gè)交易日數(shù)據(jù)。本文數(shù)據(jù)均來(lái)源于TinySoft金融數(shù)據(jù)庫(kù)。
(二)數(shù)據(jù)處理
為了消除由于計(jì)量單位和數(shù)量級(jí)不同對(duì)回歸模型產(chǎn)生的影響,本文對(duì)變量進(jìn)行了Z值標(biāo)準(zhǔn)化的去量綱處理。
(三)統(tǒng)計(jì)量描述
我們把2009~2015年股票按照是否實(shí)施高送轉(zhuǎn)分為兩組,分別考察每年每股凈資產(chǎn)、每股資本公積等因子的差異情況,發(fā)現(xiàn)各指標(biāo)存在顯著差異性,表明這些指標(biāo)對(duì)高送轉(zhuǎn)行情是有一定識(shí)別作用。
四、實(shí)證分析
本文以2015年高送轉(zhuǎn)股票的預(yù)測(cè)為例,來(lái)實(shí)證上述模型的有效性,即用2014年高送轉(zhuǎn)股票數(shù)據(jù)預(yù)判2015年高送轉(zhuǎn)股票,其它年份方法類(lèi)似。
(一)主要變量相關(guān)性分析
我們考察了2014年A股股票各變量之間的相關(guān)系數(shù),發(fā)現(xiàn)每股凈資產(chǎn)與每股資本公積、每股凈資產(chǎn)與每股未分配利潤(rùn)之間相關(guān)性較高,為了使模型結(jié)果更加準(zhǔn)確,本文通過(guò)主成分分析法提取主成分來(lái)有效避免多重共線(xiàn)性。
(二)主成分提取
首先對(duì)樣本進(jìn)行主成分分析,我們選擇七個(gè)變量為主成分分析的對(duì)象,分析結(jié)果見(jiàn)表1:
如表1所示,前5個(gè)主成分的累計(jì)貢獻(xiàn)率為92.68%,說(shuō)明前5個(gè)主成分已經(jīng)反映原來(lái)7個(gè)指標(biāo)92.68%的信息,因此確定選擇前5個(gè)主成分建立模型??梢愿鶕?jù)系數(shù)矩陣B,可以給出主成分的表達(dá)式:
(F1,F(xiàn)2,F(xiàn)3,F(xiàn)4,F(xiàn)5)=(mgjzc,mgzbgj,mgwflr,mgxjjll,years,price,gb)*B (1)
(三)模型建立
對(duì)2014年高送轉(zhuǎn)股票的logistic模型,運(yùn)用SAS9.3對(duì)模型參數(shù)進(jìn)行極大似然估計(jì),得到模型估計(jì)結(jié)果發(fā)現(xiàn):變量F4的p值為0.1849,即使在顯著性水平為0.1的情況下也不顯著,即F4對(duì)gsz(是否高送轉(zhuǎn))并無(wú)顯著影響。因此,我們可將F4從模型中剔除,重新建立Logistic回歸模型。
運(yùn)用SAS9.3對(duì)模型參數(shù)進(jìn)行估計(jì),得到模型整體檢驗(yàn)結(jié)果中似然比、評(píng)分及Wald的p值都<0.0001,另外,模型回歸系數(shù)檢驗(yàn)結(jié)果如表2:
由表2可知,在0.05的顯著水平下,F(xiàn)1、F2、F3和F5對(duì)gsz(是否高送轉(zhuǎn))具有顯著影響。根據(jù)表2中的參數(shù)估計(jì)值,我們可以把2014年高送轉(zhuǎn)的logistic回歸模型改寫(xiě)為:
則股票發(fā)生高送轉(zhuǎn)的概率為:
(四)模型結(jié)果
將股票數(shù)據(jù)代入模型中,可預(yù)測(cè)出2015年A股股票發(fā)生高送轉(zhuǎn)事件的概率,若p>=0.5則認(rèn)為該只股票實(shí)施了高送轉(zhuǎn),否則不實(shí)施。預(yù)測(cè)出147只股票會(huì)發(fā)生高送轉(zhuǎn),與2015年真實(shí)實(shí)施高送轉(zhuǎn)股票對(duì)比,準(zhǔn)確率達(dá)62.80%.
為了模型穩(wěn)健性,下面采用同樣的方法對(duì)2010~2014的高送轉(zhuǎn)股票進(jìn)行預(yù)測(cè),預(yù)測(cè)準(zhǔn)確率分別為69.77%、80.91%、66.10%、56.94%、55%。
可以看出本文模型對(duì)高送轉(zhuǎn)股票的預(yù)測(cè)準(zhǔn)確率維持在55%以上,其中2011年的準(zhǔn)確率高達(dá)80.91%。
五、結(jié)論
每股凈資產(chǎn)、每股資本公積、每股未分配利潤(rùn)、每股現(xiàn)金凈流量和股價(jià)對(duì)公司實(shí)施高送轉(zhuǎn)具有顯著的正面作用,這意味著這些變量越高,公司實(shí)施高送轉(zhuǎn)的概率越大。上市年限和股本對(duì)公司實(shí)施高送轉(zhuǎn)具有顯著的負(fù)作用,意味著這兩變量越高,公司實(shí)施高送轉(zhuǎn)概率越小。
作者簡(jiǎn)介:石好(1989-),女,漢族,湖北黃石人,就讀于華南理工大學(xué),研究方向:隨機(jī)分析與金融工程;邢小艷(1989-),女,漢族,河南人,畢業(yè)于于華南理工大學(xué),研究方向:隨機(jī)分析與金融工程。