李伯超
(伯明翰大學數(shù)學學院 英國伯明翰)
有色金屬是我國工業(yè)發(fā)展的重要材料,無論是在國防軍工產(chǎn)業(yè)還是在現(xiàn)代工業(yè)和新型農(nóng)業(yè)領域,都具有戰(zhàn)略意義,有色金屬上市公司的價值評估變得愈加重要。后疫情時代,經(jīng)濟全球化浪潮的席卷之下,有色金屬公司的市值劇烈波動,同時有色金屬原材料及相應金融衍生品的價格變化幅度較大,也加劇了有色金屬公司價值估計結果的不準確性。在實際估值分析時,張誼然(2013)基于嶺回歸設計并建立了回歸模型,通過引入今日股票的開盤價、最高價、最低價來對收盤價格進行預測。萬麗穎(2016)詳細闡述了嶺回歸模型預測過程,對如何選取嶺參數(shù)提供了理論支撐。韓鳴、宋淑鴻(2020)通過嶺回歸模型將影響估計結果的影響因子進行分析、篩選,通過再次整合回歸模型,使回歸模型具有更好的預測效果。
本文的研究目的是通過建立嶺回歸股票價格預測模型、價格影響因素模型篩選出對股票價格產(chǎn)生影響的財務指標。
在使用普通最小二乘估計時,當自變量之間存在多重共線性時,估計結果的方差偏大。股票價值分析時,由于自變量往往從財務指標中選取,財務指標之間大多存在多重共線性,嚴重影響估計結果的準確程度。
假設存在線性回歸y=β0+β1x1+β2x2+β3x3+e,其中隨機誤差項e符合正態(tài)分布,隨機生成參數(shù)β0= 0.439,β1=0.382,β2= 0.766,β3= 0.795,自變量x1~x3,符合正態(tài)分布的誤差項ei,計算得出相應的因變量yi。
當相關系數(shù)和隨機誤差項未知時,本文通過最小二乘法可以估計出參數(shù)β0~β3,通過數(shù)據(jù)統(tǒng)計計算得出β0=-0.6243,β1=-2.1158,β2=4.8097,β3=2.7520,與隨機生成的原始數(shù)據(jù)相差甚遠。通過分析我們可以計算出該線性模型的相關系數(shù)為0.3833,可以得出結論:多重共線性使模型估計結果出現(xiàn)誤差。
方差膨脹因子是用來衡量所選變量和其他變量之間多重共線性關系的指標。公式為:
其中,VIFi代表所選取的第i個變量的方差膨脹因子;代表第i個變量與其他變量之間的相關系數(shù)。
當方差膨脹因子超過10時,本文認為該變量存在多重共線性的問題,方差膨脹因子越大,多重共線性越嚴重。
嶺回歸分析是一種改良版的最小二乘分析方法。從一般形式的線性回歸方程組角度進行分析,通過Xβ=Y可以得到β=(X'X)-1X'Y,其中X'是X的轉置矩陣。在進行最小二乘估計時,一般假設X矩陣為滿秩,即 |X'X|≠ 0;當|X'X|=0時,通過最小二乘估計的待解矩陣β就會產(chǎn)生較大誤差。
由于多重共線性存在,導致X矩陣不為滿秩,即|X'X|=0,因此本文通過構建X'X+KI矩陣來達到減小誤差的目的,其中I為單位矩陣,k> 0。經(jīng)過整理后的嶺回歸估計為:
其中,k為嶺回歸參數(shù)。
從最小二乘法的矩陣形式來看,嶺回歸與最小二乘法的區(qū)別在于將估計系數(shù)向零收縮。給定響應向量y∈Rn預測矩陣y∈Rn*p,定義嶺回歸系數(shù)
在構建新的矩陣之后,需要對嶺回歸參數(shù)進行分析,在對k值進行選取時,一般采取嶺跡法。嶺跡法是一種通過分析k與β(k)之間的關系,選取合適嶺回歸參數(shù)的方法。β值隨著k值的變化而變化,選取k值時,要注意選取β值穩(wěn)定時的k值。
構建價格影響因素模型可以分析不同財務指標對價格的影響,篩選出有效變量,剔除影響模型準確度的變量。以洛陽鉬業(yè)公司近十年的財務指標為影響因素的選取范圍,選取了流動比率x1、速動比率x2、現(xiàn)金比率x3、營運資金與借款比x4、資產(chǎn)負債率x5等13個指標作為變量進行研究(數(shù)據(jù)來源:國泰安數(shù)據(jù)庫)。
本文通過使用各個因變量建立回歸方程,再對方程中的預測變量進行多重共線性分析,從而計算得出各個因變量的方差膨脹因子,得到絕大部分自變量方差膨脹因子大于10,超過半數(shù)自變量方差膨脹因子大于100,由此可以判斷因變量之間存在嚴重的多重共線性。為了消除多重共線性的影響,本文使用嶺回歸對數(shù)據(jù)進行分析。嶺回歸分析需要確定嶺回歸參數(shù)k,對回歸方程進行嶺回歸分析,繪制出體現(xiàn)嶺回歸系數(shù)變化的嶺跡圖(見圖1)。
圖1 嶺跡圖
由圖1k值變化趨勢可以看出:在(0.3,0.5)區(qū)間內(nèi),k值變化逐漸趨于平穩(wěn),從圖1得出:當k=0.4時,β值變化趨于穩(wěn)定;從數(shù)據(jù)中可以看出,當k值較小時,β值變化較大;當k=1.0時,自變量x6、x8、x9、x10、x11、x12、x13的k值趨近于0,表示此類變量在對預測模型結果方面屬于無效變量,因此將此類變量篩除,以提高預測的有效性、準確性。
將篩除無效變量后得到的數(shù)據(jù)按0.8∶0.2的比例分成訓練集和測試集,將訓練集數(shù)據(jù)構建模型。在分析自變量時,由于選取分析數(shù)據(jù)屬于時序數(shù)據(jù),不同自變量對因變量產(chǎn)生了共同作用,因此必須考慮多元回歸交叉項的影響。對x1、x2、x3、x4、x5進行相關性檢驗來確定各個因變量之間的相關性,在此僅考慮二階多元回歸交叉項,繪制出直觀表現(xiàn)各個自變量間關系數(shù)的圖像,如圖2所示。
圖2 各個因變量間相關性
由圖2可知,絕大多數(shù)二階多元回歸交叉項都具有高度相關性,相關系數(shù)超過了0.8,結合時序數(shù)據(jù)特點,可以確定多元回歸交叉項會對預測結果產(chǎn)生重要影響,此時回歸方程為:
通過select函數(shù)重新確定本模型k= 0.001984597,下一步將k= 0.001984597重新代入嶺回歸模型,此時得出模型公式為:
在構建嶺回歸模型后,將測試集數(shù)據(jù)代入模型進行擬合評估。此時,我們選定k= 0.001984597,將擬合結果與實際結果轉換為矩陣格式,形成兩組數(shù)據(jù)進行顯著性分析,我們采用獨立樣本的t檢驗法得到結果:p值為0.3365,置信區(qū)間為(-1.9207094,0.7113052),說明在α= 0.05條件下,擬合結果與實際結果并沒有顯著性差異。
從其他統(tǒng)計量來看,平均絕對誤差MAE=0.691095,均方根誤差RMSE=0.916156均處于較低水平,從另一方面證明了兩組數(shù)據(jù)沒有顯著性差異。
模型篩選出的影響因子x1、x2、x3、x4、x5分別表示不同的實際意義:
流動比率是唯一對模型結果產(chǎn)生負向影響的一階影響因素,代表著公司償債和變現(xiàn)能力。洛陽鉬業(yè)公司流動比率與股票價格成負相關,究其原因還要結合速動比率進行分析。速動比率與股票價格成正相關,對應財報會計科目為銀行存款,庫存現(xiàn)金等極易變現(xiàn)并可直接進行償債的資產(chǎn)。結合有色金屬行業(yè)特點與洛陽鉬業(yè)公司財務報表能夠分析出以洛陽鉬業(yè)為代表的有色金屬企業(yè)擁有大量存貨及非流動資產(chǎn),囤有大量的金屬原材料,建設巨大規(guī)模的國內(nèi)外金屬冶煉工廠,非流動資產(chǎn)占據(jù)大部分的企業(yè)總資產(chǎn)。
現(xiàn)金比率、營運資金與借款比、資產(chǎn)負債率與股票價格成正相關,這三者同樣說明了銀行存款、庫存現(xiàn)金等極易變現(xiàn)的資產(chǎn)對股票價格產(chǎn)生了積極影響。
二階多元回歸交叉項主要說明了一階變量在對股票價格產(chǎn)生影響的同時,也在產(chǎn)生互相影響。例如,現(xiàn)金比率、營運資金與借款比兩個一階變量都與股票價格成正相關,但兩者的二階變量x3、x4與股票價格成負相關。這表示x3、x4共同作為自變量進行分析時,相互間產(chǎn)生了相關性,從而對因變量的預測產(chǎn)生了一定程度的影響。二階多元回歸交叉項的主要作用是修正自變量間相關性對股票價格的影響,并沒有深遠的實際意義。
嶺回歸股票價格影響因素模型可應用于不同社會領域:
(1)從金融投資者角度出發(fā),嶺回歸股票價格影響因素模型在分析企業(yè)財務報表時提供量化數(shù)據(jù)指標,從統(tǒng)計學方面分析不同財務指標對股票價格產(chǎn)生的影響。投資者通過財務指標變化能夠初步預測股票價格變化趨勢,有利于提前規(guī)避風險及進行金融衍生品的套期保值。
(2)從有色金屬行業(yè)經(jīng)營者角度來看,嶺回歸股票價格影響因素模型分析結果所包含的現(xiàn)實意義能夠幫助經(jīng)營者做出更為合理的決策,有利于調(diào)整企業(yè)資產(chǎn)負債結構,提高企業(yè)價值,吸引更多投資。在對沖風險方面,從模型分析結果來看,非流動資產(chǎn)會對股票價格產(chǎn)生負面影響,而原材料又是非流動資產(chǎn)的主要組成部分,經(jīng)營者可以通過購買期貨、期權合約來減少原材料存量。第一,能夠通過減少非流動資產(chǎn)影響股票價格。第二,能夠釋放被大量存貨占據(jù)的現(xiàn)金流,提高現(xiàn)金比率,還可以利用衍生品市場進行風險規(guī)避,合理買賣期貨、期權合約能夠套期保值甚至投機獲利。
(3)從國家管理層面考慮,嶺回歸股票價格影響因素模型有利于市場監(jiān)督部門對行業(yè)進行監(jiān)察管理。模型分析高度依賴企業(yè)財務報表數(shù)據(jù),數(shù)據(jù)真實性將直接影響模型預測的結果,可以利用模型預測結果與報表數(shù)據(jù)進行顯著性檢驗,從統(tǒng)計學角度分析財務造假的可能。