武大勇,周永衛(wèi)
(鄭州航空工業(yè)管理學(xué)院 數(shù)理系,鄭州 450015)
假設(shè)我們要估計G(x)=E[Y|X=x],這里Y為被解釋變量,X為 p×1維解釋變量,在本文中,我們對于回歸函數(shù)G(x)利用下面形式的變系數(shù)模型做近似:
這里 β∈?p為一方向參數(shù)系數(shù) g(˙)=(g0(?),g1(?),…,gp(?))τ為未知函數(shù),我們將選擇方向參數(shù)β和系數(shù)函數(shù)gj(?)使得E[G(x)-g(x)]2達到最小。我們所給出的這種自適應(yīng)變系數(shù)模型與一般的變系數(shù)模型相比具有如下有點:一旦β給定,對于未知函數(shù)g(?)的估計我們很容易利用一維局部線性核估計的方法得到,而且,系數(shù)函數(shù)g(?)的圖像也很容易畫出,這或許對分析函數(shù)g(?)是如何變化的非常有用。另外,當(dāng)模型中的βτx固定時,模型(1)包含更多關(guān)于解釋變量xj的形式,如xj的平方項、xj的交叉項等,因此此模型對于捕捉作為解釋變量的xj的非線性結(jié)構(gòu)更具有實用性和靈活性。
在本文中,我們將把上面的自適應(yīng)變系數(shù)模型中推廣到面板數(shù)據(jù)中,以得到自適應(yīng)變系數(shù)面板數(shù)據(jù)模型。對于變系數(shù)面板數(shù)據(jù)數(shù)據(jù)模型中的非參數(shù)或半?yún)?shù)估計,已有一些結(jié)果,如Cai and Li(2005),Cai and Xiong(2006),Cai and Li(2007)中考慮了變系數(shù)動態(tài)面板數(shù)據(jù)的非參數(shù)估計,F(xiàn)an,Yao和Cai(2003)還考慮了一種自適應(yīng)的時間序列模型的非參數(shù)估計,但是對自適應(yīng)變系數(shù)的面板數(shù)據(jù)模型利用半?yún)?shù)的方法還沒有相關(guān)的文獻。
本文將介紹一種有效的后適應(yīng)算法來估計未知函數(shù)g(?),來選擇的核估計通過Monte Carlo試驗,對于上面所給出的估計從兩個具體的例子做出驗證。
在本文中我們考慮一種半?yún)?shù)的面板數(shù)據(jù)模型(自適應(yīng)變系數(shù)面板數(shù)據(jù)模型),我們假設(shè)模型有如下形式:
這里 Xi,t為 p×1維的,且第一個元素為1,系數(shù)函數(shù)g(˙)是?p空間里的光滑函數(shù);β為 p×1維的未知參數(shù),且誤差項假設(shè)為獨立同分布(i.i.d)的。在本文中我們主要的結(jié)果都是建立在Xi,t是純外生變量的基礎(chǔ)上,即 E(εi,t|Xi,t)=0 。
則模型(1)可被改寫為:
在模型(1)中包含許多我們所熟悉的模型,如若β=1,即
上模型一般稱為變系數(shù)面板數(shù)據(jù)模型,對模型(3),Cai和Li(2005),Cai和Xiong(2006),Cai和Li(2007)得到了函數(shù)系數(shù)g(Xi,t)的非參數(shù)廣義矩估計和估計的漸進正態(tài)性。并且,從后面我們的分析知自適應(yīng)變系數(shù)面板數(shù)據(jù)模型(1)比一般的變系數(shù)面板數(shù)據(jù)模型(3)所要估計的參數(shù)要少得多,避免了估計參數(shù)過多而引起的參數(shù)災(zāi)難問題,因此應(yīng)用起來也更方便、有效。
此模型就是一般的面板數(shù)據(jù)回歸模型,對于模型(4),Arellano(2003),Baltagi(2005),Hsiao(2003)得到了參數(shù)的廣義矩估計,后來,Byeong,Robin和Leopold(2007)利用一類特殊的矩條件,得到了此模型參數(shù)的半?yún)?shù)估計,并對參數(shù)估計的性質(zhì)從理論和數(shù)值試驗上得到了驗證。
因此,模型(1)所包含的形式顯然要比模型(3)和(4)要多,這樣我們就可以通過選擇與模型獨立的參數(shù)β的方位來減少估計的偏,同時,對于參數(shù)β在我們進行并不會為我們的參數(shù)估計帶來額外的困難。實際上,參數(shù)β通常只估計出它的數(shù)值解,而非參數(shù)函數(shù)g(˙)在參數(shù)β已知的條件下很容易被估計出。
對于模型(1),這里將介紹一種剖面最小二乘估計(Profile Least-Squares Estimation)的方法,對于模型中出現(xiàn)的參數(shù)β和變系數(shù)函數(shù)g(˙)給出估計。這種方法的基本思想是對于給定的參數(shù) β ,首先找到非參數(shù)項 g(˙)的估計,然后用估計出的參數(shù)函數(shù)再來估計未知的參數(shù)項β,即在模型(2)中,用替換掉 g(˙)后可得合成參數(shù)模型
(1)若給出 β ,非參數(shù)項 g(˙)的估計
對于給定的系數(shù)β=β0已知,我們假設(shè)為二階連續(xù)可微的函數(shù),則對于給定的和其鄰域內(nèi)的利用Taylor公式展開有z),這里則估計未知函數(shù)g(˙)可轉(zhuǎn)化最小化下面的式子
這里w( ?)為定義在一個有界支撐上的有界權(quán)函數(shù),它用來控制邊界效應(yīng)。函數(shù)為定義在緊支撐上的一對稱的概率密度函數(shù)。h為窗寬,用它來控制估計的精確性。
(2)若給出 g(˙)的估計 g(˙),估計參數(shù) β
若令實際上R(β)就是未知函數(shù)g(˙)的估計的殘差,它的大小從一個方面說明了我們所給出估計的好壞。若已知g(˙)的估計g(˙),估計參數(shù)β的過程實際上相當(dāng)于關(guān)于β最小化R(β)的過程。但是,由于非參數(shù)項 g(˙)的估計 g(˙;β)依賴參數(shù)β,因此關(guān)于β直接最小化(7)式是非常困難的,下面利用Newton-Raphson迭代的方法得到參數(shù)β的數(shù)值解。
由(7)式可得
上述參數(shù)和非參數(shù)估計的好壞依賴于核估計中窗寬的選擇,因此如何選取最優(yōu)的窗寬使我們的估計更有效是必須討論解決的問題。根據(jù)Craven and Wahba(1979)提供的選擇最優(yōu)窗寬的廣義交叉核實方法(the generalized cross-validation method),對 于 給 給 定 的 β ,令顯然
這 里 H(h)是 一 個 n×n矩 陣 ,顯 然 其 與是獨立的,根據(jù)廣義交叉核實方法(GCV),選擇h最小化
最小化上式可得最優(yōu)窗寬為
這里n=NT,其中的系數(shù)c0,c1,c2可根據(jù)Ruppert(1997)提供的方法獲得。為了計算tr(H(h)),對于給定的1≤l≤N;1≤s≤T ,有:
這里Ο為 p×1維元素全為0的列向量,令
(2)對于可供選擇的窗寬的值hk,k=1,…,q,重復(fù)下面的步驟(a)和(b),直到兩次迭代中(7)式 R(β)的差別足夠?。?/p>
(a)對于給定的 β ,按照(6)式來估計 gj( ?);
(b)對于給定的gj( ?),按照上面所給的方法來估計β;
(3)對于k=1,…,q,用β的估計值來計算GCV(hk),令c1和c2為最小化下式所得
考慮如下面的面板數(shù)據(jù)模型
模擬結(jié)果如表1。
表1為模型(10)的模擬,在這里核函數(shù)取的為Gauss核函數(shù),即
表1
由上例的模擬結(jié)果可以看出,對于一個未知函數(shù)g(?),估計的殘差是比較小的;同時,殘差對于樣本容量的選取有一定的依賴,當(dāng)樣本容量有顯著增大的時候,殘差也隨之變小。
[1]Arellano,M.Panel Data Econometrics[M].Oxford:Oxford University Press,2003.
[2]Baltagi,B.Econometric Analysis of Panel Data(2ndEdition)[M].New York:John Wiley and Sons,2005.
[3]Byeong,U.P,Robin,C.S.,Leopold,S.Semiparametric Efficient Estimation of Dynamic Panel Data Models[J].Journal of Econometrics,2007,136.
[4]Cai,Z,H.Xiong.Efficient Estimation of Partially Varying Coefficient Instrumental Models[C].Department of Mathematics and Statistics,University of North Carolina at Charlotte,2006.
[5]Cai,Z.,Q.Li.Nonparametric Estimation of Varying Coefficient Dynamic Panel Data Models[C].Department of Economics,Taxes A&M University,2005.
[6]Cai,Z.,Q.Li.Nonparametric Estimation of Varying Coefficient Dynamic Panel Data Models[R].The Wang Yanan Institute for Studies in Economics,Xiamen University in China,2007.
[7]Horowitz,J.L.,M.Markatou.Semi para metric Estimation of Regression Models for Panel Data[J].The Review of Economic Studies,1996,63.
[8]Hsiao,C.Analysis of Panel Data(2ndEdition)[M].Cambridge:University Press,2003.
[9]Kniesner,T.J.,Q.Li.Nonlinearity in Dynamic Adjustment:Semipara metric Estimation of Panel Labor Supply[J].Empirical Econometrics,2002,27.
[10]Fan,J.,Yao,Q.,Cai,Z.Adaptive Varying-coefficient Linear Models[J].Journal of the Royal Statistical Socient,Series B,2003,(65).
[11]Ruppert,D.Empirical-bias Bandwidths for Local Polynomial Nonparametric Regression and Density Estimation[J].Journal of the American Statistical Assiociation,1997,(92).