葉茶花 柯 林
(九江學(xué)院理學(xué)院 江西九江 332005)
多重線性回歸是簡單線性回歸的推廣,研究一個(gè)因變量與多個(gè)自變量之間的數(shù)量依存關(guān)系。多重線性回歸的數(shù)學(xué)模型為.
其中y為因變量,是隨機(jī)定量的觀測值;x1,…,xp為 p個(gè)自變量.β0為常數(shù)項(xiàng),β1,…,βp為回歸系數(shù).ε為隨機(jī)誤差,又稱為殘差,它是y的的變化中不能用自變量解釋的部分,服從N(0,σ2)分布.
選取16項(xiàng)微觀指標(biāo):市盈率x1;市凈率x2;凈資產(chǎn)收益率x3;總資產(chǎn)報(bào)酬率x4;毛利率x5;收入成長因子x6;營業(yè)利潤成長因子x7;總利潤成長因子x8;凈利潤成長因子x9;資產(chǎn)現(xiàn)金率x10;應(yīng)收應(yīng)付比x11;營業(yè)利潤占比x12;股價(jià)x13;流通市值x14;總市值x15;成交量x16.
然后以16個(gè)微觀指標(biāo)作為自變量,與2013年上半年的股票收益率y做多重線性回歸.
第一步:分別Stepwise(逐步法)進(jìn)行回歸檢驗(yàn).
逐步法是將自變量逐個(gè)引入方程,引入的條件是該自變量的偏相關(guān)系數(shù)在尚未選入的自變量中是最大的,并通過F檢驗(yàn) (F概率顯著水平≤0.05進(jìn)入方程,≥0.10移出方程;我們這里采用≤0.08進(jìn)入方程,≥0.10移出方程也是比較顯著的)的進(jìn)入標(biāo)準(zhǔn).在每引入一個(gè)新變量后,要對先前已入選的自變量逐個(gè)進(jìn)行F檢驗(yàn),將偏相關(guān)系數(shù)最小且達(dá)到F檢驗(yàn)移出標(biāo)準(zhǔn)的自變量從方程中剔除,如此不斷地引入直到方程外的自變量不能再進(jìn)入,方程的自變量不能再剔除為止.這樣在回歸方程中就只包含在標(biāo)準(zhǔn)范圍內(nèi)對因變量有顯著影響的自變量.
第二步:檢驗(yàn)變量間是否存在多重共線性以及回歸誤差是否呈正態(tài)分布.
在存在多重共線性的情形下,會引起嚴(yán)重的后果,比如普通最小二乘法估計(jì)的方差和標(biāo)準(zhǔn)差較大,總體參數(shù)的置信區(qū)間變寬,以致更容易接受零虛擬假設(shè),尤其會影響本文要討論的自變量系數(shù)的t檢驗(yàn).本文用方差膨脹因子 (VIF)來檢驗(yàn)多重共線性,如果VIF大于10,則多重共線性問題就比較嚴(yán)重.回歸誤差如果是正態(tài)分布就符合多因素模型的正態(tài)分布假設(shè)條件,所得出的結(jié)論將更精確.
第三步:回歸方程分析.
分析股票收益率顯著影響因素的解釋力度,檢驗(yàn)回歸方程的擬合程度,并通過方差分析 (F檢驗(yàn)),檢驗(yàn)回歸方程的顯著性水平.
逐步回歸結(jié)果分別見表1、表2、表3、表4、表5。
表1 變量移進(jìn)/移出信息表
從表1可以看出,系統(tǒng)在建立逐步回歸過程中產(chǎn)生了3個(gè)回歸模型,模型1是按照F概率值≤0.08進(jìn)入方程,≥0.10移出方程,先將與y線性關(guān)系最密切的自變量X13引入模型,建立y與X13之間的一元線性回歸模型.然后再逐步引入其它的自變量,表中模型2表明將自變量X2引入了回歸模型,建立有y與X2、X13之間的二元線性回歸模型;依此引進(jìn)X5,知表中模型3是y與X2、X13、X5之間的三元線性回歸模型[2].
表2 方差分析表
表2中給出了三個(gè)模型的方差分析結(jié)果:
對模型1:F=34.883,顯著性概率 Sig.=0.000<0.05
對模型2:F=20.155,顯著性概率 Sig.=0.000<0.05
對模型3:F=14.515,顯著性概率 Sig.=0.000<0.05
由模型3的 P值為0.000<0.05,拒絕原假設(shè),可以認(rèn)為2013年上半年股票收益率y與凈利率X2、股價(jià)X13、毛利率X5之間存在線性關(guān)系.
表3 回歸系數(shù)表
據(jù)表3中B的數(shù)值可知,逐步回歸過程先后建立的3個(gè)線性模型分別是:
模型1:y=0.35+0.28X13
模型2:y=0.11+0.12X2+0.26X13
模型 3:y=0.28+0.14X2+0.25X13-0.08X5
在這三個(gè)模型中代入X2、X13、X5的值,可以計(jì)算因變量y的預(yù)測值.
由統(tǒng)計(jì)量t與t分布雙尾顯著性概率Sig.知,各自變量對應(yīng)系數(shù)的檢驗(yàn)值都小于0.08,說明他們都有顯著性意義.
對模型3變量X2、X13、X5的容許度 (Tolreance)都比較大,方差膨脹因子 (VIF)都比較小,說明它們之間的共線性非常小甚至可認(rèn)為幾乎不存在共線性.
表4 殘差統(tǒng)計(jì)
表4顯示了預(yù)測值、殘差等的最小值、最大值、均值、標(biāo)準(zhǔn)差,根據(jù)概率3— 原則,標(biāo)準(zhǔn)化殘差絕對值的最大值為2.811<3σ,說明樣本數(shù)據(jù)里沒有奇異數(shù)據(jù).通過圖1可以看出標(biāo)準(zhǔn)化殘差完全近似正態(tài)分布。
圖表1 標(biāo)準(zhǔn)殘差正態(tài)概率圖
表5 模型3的數(shù)據(jù)
由表5知R2值為0.37,說明X2、X13、X5這3個(gè)變量對股票收益率的解釋能力為37﹪,由此知模型3擬合優(yōu)度比較好,結(jié)果比較理想.從回歸方程的F檢驗(yàn)值及顯著性水平的結(jié)果來看,回歸方程具有顯著的回歸效果.說明股票收益率與篩選出來的指標(biāo)之間存在顯著線性相關(guān)性,利用此模型估計(jì)股票收益率的準(zhǔn)確程度較高[1].
5結(jié)論
通過回歸分析,股票收益率主要受股價(jià)、市凈率、毛利率的影響,且影響非常顯著,可建立如下數(shù)學(xué)模型:
y=0.28+0.14X2+0.25X13-0.08X5
代入X2、X13、X5的值,可以計(jì)算因變量y的預(yù)測值,對提高上市公司的自身品質(zhì)以及提高投資者的投資決策水平具有積極的借鑒意義[1].
[1]張晶晶.中國上市公司股票收益率影響因素的實(shí)證研究 [D].大連:大連理工大學(xué),2007.
[2]張玉榮,周顯青,王鋒.粳稻新鮮度敏感指標(biāo)的篩選及其驗(yàn)證 [J].中國糧油學(xué)報(bào),2008,23(4):9.