王 重,劉黎明
(首都經(jīng)濟(jì)貿(mào)易大學(xué) 統(tǒng)計(jì)學(xué)院,北京 100026)
構(gòu)建經(jīng)濟(jì)計(jì)量模型研究經(jīng)濟(jì)問(wèn)題,首先確定研究對(duì)象,然后分析研究對(duì)象,確定影響研究對(duì)象的變量;根據(jù)變量之間的相互關(guān)系,確定經(jīng)濟(jì)計(jì)量模型的結(jié)構(gòu)解析式;而后利用搜集到的數(shù)據(jù)估計(jì)模型未知參數(shù);最后,對(duì)模型進(jìn)行檢驗(yàn),模型通過(guò)檢驗(yàn)后,就可以利用經(jīng)濟(jì)計(jì)量模型解釋經(jīng)濟(jì)現(xiàn)象。
經(jīng)濟(jì)計(jì)量模型的變量選取,模型結(jié)構(gòu)解析式的確定需要經(jīng)濟(jì)理論和先驗(yàn)的經(jīng)驗(yàn)研究,模型檢驗(yàn)是經(jīng)濟(jì)計(jì)量模型能夠解釋經(jīng)濟(jì)現(xiàn)象的保證。經(jīng)典線性模型中的檢驗(yàn)中有擬合優(yōu)度檢驗(yàn)、模型系數(shù)檢驗(yàn)、模型總體檢驗(yàn)。三個(gè)檢驗(yàn)方法中,擬合優(yōu)度檢驗(yàn)和模型總體檢驗(yàn)主要檢驗(yàn)?zāi)P偷臄M合程度,模型通過(guò)擬合優(yōu)度檢驗(yàn),才可以進(jìn)行系數(shù)檢驗(yàn)。
擬合優(yōu)度檢驗(yàn)最早由英國(guó)統(tǒng)計(jì)學(xué)家K·皮爾遜提出,皮爾遜明確指出統(tǒng)計(jì)學(xué)不僅僅研究樣本,而是根據(jù)樣本對(duì)總體進(jìn)行推斷。模型檢驗(yàn)是構(gòu)建模型過(guò)程中重要的一環(huán)。經(jīng)典的計(jì)量經(jīng)濟(jì)學(xué)通過(guò)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量進(jìn)行模型假設(shè)檢驗(yàn)。模型擬合優(yōu)度檢驗(yàn),模型假設(shè)和檢驗(yàn)統(tǒng)計(jì)量的構(gòu)造以數(shù)理統(tǒng)計(jì)知識(shí)為基礎(chǔ)。經(jīng)典的模型檢驗(yàn),需要檢驗(yàn)?zāi)P蛥?shù),并且還需檢驗(yàn)?zāi)P涂傮w顯著性。
回歸擬合度評(píng)價(jià)統(tǒng)計(jì)量:
擬合優(yōu)度檢驗(yàn)用于檢驗(yàn)回歸模型的擬合程度,擬合優(yōu)度檢驗(yàn)是模型系數(shù)檢驗(yàn)的基礎(chǔ),在模型通過(guò)擬合優(yōu)度檢驗(yàn)后,才可進(jìn)行模型系數(shù)檢驗(yàn)。統(tǒng)計(jì)量檢驗(yàn)?zāi)P偷臄M合程度被證明存在問(wèn)題,Anscombe在1973年給出了四組著名數(shù)據(jù),證明了R2不能充分檢驗(yàn)回歸模型擬合情況,統(tǒng)計(jì)量R2無(wú)法充分反映模型的擬合程度,使用統(tǒng)計(jì)量R2無(wú)法有效的檢驗(yàn)?zāi)P偷臄M合程度。
表1中數(shù)據(jù)被分為四組,G1(x1,y1),G2(x2,y2),G3(x3,y3),G4(x2,y4),對(duì)這四組數(shù)據(jù)進(jìn)行一元線性回歸。設(shè)定模型:
y=β0+β1x+ε
采用最小二乘法估計(jì)模型,得到模型參數(shù)和模型的主要統(tǒng)計(jì)量。
表1 Anscombe數(shù)據(jù)
表2 各數(shù)據(jù)組模型統(tǒng)計(jì)量
表3 各組數(shù)據(jù)估計(jì)模型殘差表
從表2可以看出,數(shù)據(jù)組G1,G2,G3的模型參數(shù)估計(jì)值和模型的擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量基本一致,0.7。擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量的值不是很高,但還是不能否認(rèn)R2本身存在的問(wèn)題。四組數(shù)據(jù)擬合模型,我們得到相似的回歸方程,但數(shù)據(jù)卻存在很大差別。
如圖1所示,模型y=3+0.5x對(duì)于數(shù)據(jù)組G1與G3的擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量為0.7,基本可以擬合,但是對(duì)于數(shù)據(jù)組G2,擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量也是0.7,擬合效果就要差很多,因此單獨(dú)利用R2檢驗(yàn)?zāi)P偷臄M合優(yōu)度是欠妥的。
擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量R2不能夠很好檢驗(yàn)?zāi)P偷臄M合情況,這與統(tǒng)計(jì)量 R2的構(gòu)造有關(guān)。 R2中包含有(Y-)與(Y^-),獲得自變量數(shù)值的方式不同,也就具有不同的含義。自變量Y數(shù)據(jù)來(lái)源有兩種方式,第一類是通過(guò)可重復(fù)實(shí)驗(yàn)獲得的數(shù)據(jù)。例如:在常溫,常壓狀態(tài)下,某工廠測(cè)量合金A的強(qiáng)度,對(duì)合金A施加100000牛沖擊力,實(shí)驗(yàn)3萬(wàn)次,合金A的3萬(wàn)次實(shí)驗(yàn)的數(shù)據(jù)記錄下來(lái),測(cè)算合金A的強(qiáng)度。合金A的強(qiáng)度為研究對(duì)象,構(gòu)造模型y=p×s+ε,利用數(shù)理方法,估計(jì)合金A的強(qiáng)度。可重復(fù)實(shí)驗(yàn)得到數(shù)據(jù),可以保證實(shí)驗(yàn)條件的穩(wěn)定性,把外界的干擾控制到最低。在實(shí)驗(yàn)中,可以精確的控制每一個(gè)Y影響研究對(duì)象的變量。本例中,可以精確的控制溫度、壓強(qiáng)、沖擊力。此時(shí)R2的就是試驗(yàn)觀測(cè)數(shù)值得均值,并且與每一個(gè)十分接近,此時(shí)R2作為檢驗(yàn)?zāi)P偷臄M合程度不是很合適。第二類是不可重復(fù)性試驗(yàn)的時(shí)間序列數(shù)據(jù)。在經(jīng)濟(jì)問(wèn)題的研究中,我們得到大量無(wú)法重復(fù)的時(shí)間序列數(shù)據(jù)。例如:為了研究某地區(qū)的消費(fèi)規(guī)律,根據(jù)統(tǒng)計(jì)資料查到該地區(qū)人均收入、人均儲(chǔ)蓄和人均消費(fèi)1981年到2002年的年度數(shù)據(jù),通過(guò)對(duì)數(shù)據(jù)的分析,估計(jì)人均收入、人均儲(chǔ)蓄對(duì)人均消費(fèi)的影響程度。人均消費(fèi)作為研究對(duì)象,記錄縱向年度不同時(shí)刻變量的值,利用這些統(tǒng)計(jì)數(shù)據(jù)構(gòu)建模型研究人均收入、人均儲(chǔ)蓄與人均消費(fèi)的關(guān)系。構(gòu)建面板數(shù)據(jù)模型,存在個(gè)自變量,研究面板數(shù)據(jù)研究自變量與因變量的關(guān)系,面板數(shù)據(jù)收集時(shí),n個(gè)自變量與因變量同時(shí)變化,這時(shí)就變成自變量Y的算術(shù)平均值,并不能保證與每一個(gè)Y十分接近,那么借助R2與對(duì)模型進(jìn)行擬合的檢驗(yàn)就可能出現(xiàn)Anscombe所論證的問(wèn)題。
檢驗(yàn)?zāi)P偷臄M合優(yōu)度可以構(gòu)建新的統(tǒng)計(jì)量,擬合優(yōu)度檢驗(yàn)的統(tǒng)計(jì)量可以設(shè)定為:
模型的擬合優(yōu)度檢驗(yàn)是檢驗(yàn)設(shè)定模型的擬合程度,檢驗(yàn)擬合優(yōu)度的統(tǒng)計(jì)量應(yīng)該實(shí)際反映模型的擬合水平。檢驗(yàn)?zāi)P偷臄M合程度,殘差是良好的統(tǒng)計(jì)量,使用殘差必須消除殘差的量綱影響,統(tǒng)計(jì)量αi消除量綱影響,殘差表示估計(jì)值與真實(shí)值之間的差別,殘差除以真實(shí)值表示殘差占真實(shí)值的比率。
模型因變量與自變量關(guān)系穩(wěn)定,確定模型變量之間的函數(shù)關(guān)系,yi服從正態(tài)分布。模型因變量服從正態(tài)分布,不可采用擬合優(yōu)度X2統(tǒng)計(jì)量檢驗(yàn)?zāi)P蛿M合優(yōu)度。估計(jì)模型函數(shù)關(guān)系確定后,構(gòu)造模型的擬合優(yōu)度檢驗(yàn)X2統(tǒng)計(jì)量
模型假設(shè) εi服從獨(dú)立正態(tài)分布,εi~N(0,σ2),計(jì)算 X2統(tǒng)計(jì)量,必須知道殘差的方差 σ 的值,在 εi~N(0,σ2)的前提假設(shè)條件下,采用無(wú)偏統(tǒng)計(jì)量σ^2代替,代入X2統(tǒng)計(jì)量,得到X2(n-k-1)=n-k-1,因此X2統(tǒng)計(jì)量無(wú)法作為模型的擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量。模型總體檢驗(yàn)使用F統(tǒng)計(jì)量,F(xiàn)統(tǒng)計(jì)量構(gòu)造中含有R2,R2檢驗(yàn)擬合優(yōu)度存在不足,那么使用F統(tǒng)計(jì)量檢驗(yàn)?zāi)P偷臄M合優(yōu)度也是存在問(wèn)題的,因此使用統(tǒng)計(jì)量β檢驗(yàn)?zāi)P蛿M合優(yōu)度是可行。
如果模型每一個(gè)ai都是小于0.95,那么可以認(rèn)定模型擬合程度高,在上例中,數(shù)據(jù)組G3的統(tǒng)計(jì)量R2受異常點(diǎn)的影響,R2值不理想,但模型的擬合程度還是很高的。統(tǒng)計(jì)量β由所有因變量的殘差與真實(shí)值比值絕對(duì)值的平均數(shù),表示模型總體的擬合情況。數(shù)據(jù)組 G1(x1,y1),G2(x2,y2),G3(x3,y3),G4(x2,y4)的檢驗(yàn)結(jié)果見(jiàn)表3,表4。
表4 各模型擬合檢驗(yàn)統(tǒng)計(jì)量表
從檢驗(yàn)結(jié)果來(lái)看,模型y=β0+β1x+ε對(duì)四組數(shù)據(jù)模擬,G3(x1,y3)的檢驗(yàn)值最小,統(tǒng)計(jì)量β=0.07,若假設(shè)β<0.1就可以接受模型,那么就可以利用模型對(duì)數(shù)據(jù)G3(x1,y3)進(jìn)行經(jīng)濟(jì)分析,數(shù)據(jù)組 G1(x1,y1),G2(x2,y2),G4(x2,y4)的模型需要進(jìn)行修正,僅當(dāng) G1、G2、G3 的模型統(tǒng)計(jì)量 βi<0.1,才可借助模型進(jìn)行經(jīng)濟(jì)分析。
檢驗(yàn)?zāi)P蛿M合優(yōu)度,統(tǒng)計(jì)量R2構(gòu)造存在問(wèn)題,不能很好地反映模型的實(shí)際擬合程度,而統(tǒng)計(jì)量β從模型本身出發(fā),可以準(zhǔn)確的辨別模型的擬合情況。實(shí)際研究中,根據(jù)研究對(duì)象的不同,設(shè)定不同精度,得到擬合數(shù)據(jù)的最佳模型,分析經(jīng)濟(jì)問(wèn)題。
[1]Anscombe,F.J,et al.Graphs in Statistical Analysis[J].Am.Statist,1973,27.
[2]Braun,H,et al.A Simple Method for Testing Goodness of Fit in the Presence of Nuisance Parameters[J].R.Staat.Soc.1980,42.
[3]Larntz,K,Small-sample Comparisons of Exact levels for Goodness of Fit Statistics[J].J.Am.Stat.Assoc,1978,73.
[4]Khan,Azizur Rahman,Carl Riskin,et al. Growth and Distribution of Household Income in China between 1995 and 2002[C].Working Paper,2008.
[5]Tigor,Robert L.W.Arthur Lewis and the Birth of Development Economics[M].Princeton:Princeton University Press,2006.
[6]Christopher M,Fleming Robert R,et al.Single-species Versus Multiple-species Models:the Economic Implications[J].Ecol Model,2003,170.
[7]Fafchamps,M Minten,et al.Returns to Social Network Capital Among Traders[J].Oxford Economic,2002,542.
[8]韋博成,魯國(guó)斌,史建清等.統(tǒng)計(jì)診斷引論(第一版)[M].南京:東南大學(xué)出版社,1991.
[9]謝識(shí)予,朱宏鑫.高級(jí)計(jì)量經(jīng)濟(jì)學(xué)(第一版)[M].上海:復(fù)旦大學(xué)出版社,2005.
[10]李子奈,潘文卿.計(jì)量經(jīng)濟(jì)學(xué)(第二版)[M].北京:高等教育出版社,2005.