張誼然
(南京大學(xué),江蘇 南京 210000)
在計算股票收益率時,人們往往運用收盤價計算股票的收益率,而忽略當(dāng)日股價變化情況。如果在每日閉市之前,能觀察出今日的開盤價、最高價、最低價,就可準(zhǔn)確預(yù)測出今日的收盤價。劉廣麗(2007)利用嶺回歸的方法,對我國上海股市進行研究,建立了多元線性回歸模型,并進行預(yù)測。本文通過編寫MATLAB程序,用2011 年242 個交易日的數(shù)據(jù),對“中國銀行”股票價格進行嶺回歸分析。
首 先, 建 立 回 歸 方 程。Y(i,1)=b(1,1)+b(2,1)*x(i,1)+b(3,1)*x(i,2)+ b(4,1)*x(i,3) ,其中Y(i,1)代表日收盤價,x(i,1)代表日最高價,x(i,2)代表日最低價,x(i,3)代表日最高價。經(jīng)過回歸得到線性方程Y(i,1)=0.0023-0.5253* x(i,1)+ 0.7818* x(i,2)+ 0.7433* x(i,3)?;貧w得到的R 方為0.9969,F(xiàn) 值為25349。因此,可以初步判斷上述回歸方程成立。但由于自變量間可能存在嚴(yán)重共線性,需要對其共線性進行分析。
其次,對自變量進行標(biāo)準(zhǔn)化處理。令z(i,j)=(x(I,j)-μj)/∑( x ( i , j )-μj)2, μj為自變量的樣本均值。得到的z 矩陣,為標(biāo)準(zhǔn)化的自變量。對z 進行線性回歸Y(i,1)=bb(1,1)+ bb(2,1)* z(i,1)+bb(3,1)*z(i,2)+bb(4,1)*z(i,3),得到回歸方程為Y(i,1)=3.7256-2.9928* z(i,1)+ 4.506* z(i,2)+ 4.1702*z(i,3)。最后,觀察方差膨脹系數(shù)。由于方差的膨脹系數(shù)VIF 為inv(z’z)主對角線上的數(shù),可觀察到VIF1=237.8; VIF2=162.17; VIF3=153.03,本模型存在嚴(yán)重的多重共線性。
嶺回歸法是A.E.Horel 在1962 年提出的一種能診斷和處理多重共線性的方法。在多重共線性非常嚴(yán)重的情況下,兩個共線變量的系數(shù)之間的二維聯(lián)合分布是山嶺狀曲面,曲面上的每個點均對應(yīng)一個殘差平方和,點的位置越高,相應(yīng)的殘差平方和越小。構(gòu)造嶺估計,估計參數(shù)bl=inv(z’z + kI)*z’Y ,其中k 為嶺回歸參數(shù)。當(dāng)k=0 時,估計參數(shù)就是普通最小二乘估計。當(dāng)k增加時,所有的參數(shù)估計的絕對值都不斷變小,對參數(shù)估計的偏差越大。但隨k 增加,矩陣inv(z’z + kI)主對角元素Cii(k)將不斷減少,即回歸系數(shù)的誤差平方和將下降,嶺估計的方差膨脹系數(shù)會隨k 的增加而減少。所以在k 取適當(dāng)?shù)闹禃r,用嶺回歸估計出的參數(shù)比用最小二乘法估計的參數(shù)更穩(wěn)定。一般而言,k的取值范圍為(0,0.5),在這個區(qū)間內(nèi),嶺回歸的方差膨脹系數(shù)Cii(k)≤10,說明共線性很小。
本文用MATLAB 選取k 范圍為[0.01,0.02]。利用膨脹系數(shù)C=inv(z'z+k*I(3))*z'z*inv(z'z+k*I(3)),選 擇出使C ≤10 的k。當(dāng)k 取[0.013,0.02]時,方差膨脹系數(shù)都小于10,特別當(dāng)k 等于0.02 時,方差膨脹因子最小(見表一)。繪制嶺跡圖k 取0.02 時,參數(shù)的估計值趨于穩(wěn)定。自變量最高價的估計參數(shù)也改變了符號,其對日收盤價的影響從負(fù)效應(yīng)變?yōu)檎?yīng),這也符合經(jīng)濟邏輯。據(jù)此,可以建立嶺回歸估計方程為Y(i,1)=3.7256+1.2812* z(i,1)+2.1984* z(i,2)+ 2.1636*z(i,3),把標(biāo)準(zhǔn)化后的自變量經(jīng)過還原后,回歸方程為Y(i,1)= -3.6616+0.2249* x(i,1)+ 0.3815* x(i,2)+ 0.3857* x(i,3),此時R 方為0.9807,F(xiàn) 值為4024.7,經(jīng)過嶺估計的回歸擬合成立,且消除共線性的影響。
表一 inv(z'z+0.02*I(3))*z'z*inv(z'z+0.02*I(3))
本文運用嶺回歸的方法解決了多重共線性的影響,得到了中國銀行股票日收盤價與開盤價、最高價、最低價的回歸方程。bb(i,1)= 0.2249,表示每增加一個單位的開盤價,會使當(dāng)日收盤價增加0.2249 個單位;bb(i,2)= 0.3815,表示每增加一個單位的最高價,會使當(dāng)日收盤價增加0.3815 個單位;bb(i,3)= 0.3857,表示每增加一個單位的最低價,會使當(dāng)日收盤價增加0.3857 個單位。這說明已知股票的開盤價、最高價、最低價,有利于估測該股票的收盤價。
[1]劉廣麗. 嶺回歸方法在股市中的應(yīng)用[J]. 金融經(jīng)濟,2007(16).
[2]楊楠. 嶺回歸分析在解決多重共線性問題中的獨特作用[J]. 統(tǒng)計與決策,2004(03).