鄒靈,吳東晟,楊宜平
(重慶工商大學數(shù)學與統(tǒng)計學院,經(jīng)濟社會應用統(tǒng)計重慶市重點實驗室,重慶400067)
面板數(shù)據(jù)模型越來越廣泛應用于經(jīng)濟、環(huán)境、生物等領(lǐng)域,是近20年計量經(jīng)濟學模型的重要模型之一.關(guān)于模型的參數(shù)估計,大多數(shù)采用最小二乘法對興趣參數(shù)進行估計.當數(shù)據(jù)出現(xiàn)尖峰、厚尾、異方差、異常點等情況時,最小二乘法不再適用.為了解決該問題,Koenker和Bassett[1]首次提出分位數(shù)回歸的方法,分位數(shù)回歸以其穩(wěn)健的性質(zhì)已經(jīng)在醫(yī)學和經(jīng)濟領(lǐng)域得到廣泛的應用.目前已有一些學者對面板數(shù)據(jù)分位數(shù)回歸進行相關(guān)研究.Koenker[2]通過正則化的方法將分位數(shù)回歸用于面板數(shù)據(jù)當中;羅幼喜和田茂再[3]討論了固定效應的面板數(shù)據(jù)模型的三種分位數(shù)回歸方法并使用蒙特卡洛進行模擬;Canay[4]通過數(shù)據(jù)轉(zhuǎn)化消除固定效應,提出一種簡單的面板數(shù)據(jù)分位數(shù)回歸方法;Billger和Lamarche[5]使用面板數(shù)據(jù)分位數(shù)回歸的方法對英國和美國的移民收入分配進行研究;Galvao和Kato[6]研究了面板數(shù)據(jù)分位數(shù)回歸的固定效應問題.
從上述可以看出,面板數(shù)據(jù)分位數(shù)回歸的使用越來越廣泛,以上研究都是基于協(xié)變量是外生變量的情況下討論的面板數(shù)據(jù)分位數(shù)回歸.但在實際應用中,很多變量都具有內(nèi)生性.如:在研究外商直接投資對環(huán)境污染的影響時,外商直接投資作為解釋變量具有內(nèi)生性[7];在討論城鎮(zhèn)居民人均消費支出和人均可支配收入時,通過豪斯曼檢驗證實了城鎮(zhèn)居民人均可支配收入是具有內(nèi)生性的[8].然而當前關(guān)于含內(nèi)生變量的面板數(shù)據(jù)的分位數(shù)回歸的研究卻很少.因此促使本文討論面板數(shù)據(jù)分位數(shù)回歸模型的工具變量估計.
本文討論含有內(nèi)生變量的面板數(shù)據(jù)模型,為了解決協(xié)變量的內(nèi)生性問題,引入工具變量消除協(xié)變量的內(nèi)生性,再通過組內(nèi)中心化消除面板數(shù)據(jù)個體效應項,采用分位數(shù)回歸的方法估計回歸系數(shù),并證明其漸近性質(zhì).最后對Naive最小二乘估計、Naive分位數(shù)回歸、兩階段最小二乘估計和分位數(shù)回歸的工具變量估計進行模擬研究,比較四種方法在不同分布下的估計效果.
討論如下面板數(shù)據(jù)模型
其中Yit是響應變量,Xit是p維內(nèi)生協(xié)變量,Zit是q維外生協(xié)變量,(θ,β)是未知參數(shù),αi是不可測量的個體固定效應,εit表示隨機誤差項.為了模型可識別,假定
由于解釋變量Xit具有內(nèi)生性,已有估計不再適用.為了消除內(nèi)生變量對參數(shù)θ估計的影響,假定存在一個工具變量ωit,且滿足
其中Γ是p × k的未知參數(shù)矩陣,ωit是k ×1的工具變量,且與隨機誤差項εit不相關(guān),并滿足E(eit|ωit)=0.
下面討論(θ,β)的分位數(shù)回歸估計.首先,由(2.2)可以得到Γ的估計,即
其中Xi=(Xi1,Xi2,...,XiT),ωi=(ωi1,ωi2,...,ωiT),則=那么模型(2.1)轉(zhuǎn)化為:
由于αi未知,通過組內(nèi)變化消除αi的影響,即
其中ρτ(s)=τs?sI(s<0).
下面討論(θ,β)的估計的漸近性質(zhì),需如下正則條件:
(C1)?是正定矩陣,其中
定理3.1如果(C1)和(C2)成立,則有
其中ψ(τ)=E(η+f(0)eTθ)2,η=(I(0)?τ).
其中由Knight[9]中等式(2-13),我們有
首先,考慮BN,
其中ηit=(I(≤0)?τ).則有
本節(jié)通過模擬研究所提出方法的有限樣本性質(zhì).考慮如下含有內(nèi)生變量的面板數(shù)據(jù)模型:
該模型中θ=1.5,β=2,Γ=1,其中Xit是內(nèi)生性變量,Zit是外生性變量,Zit~N(0,1),ωit~N(0,1),eit~N(0,0.42),εit=eit+δit.分別討論服從以下分布,具體如下:δit~0.5N(0,1),δit~0.2t(1),δit~0.2C(0,1).我們計算了偏差(Bias)和標準差(SD),分別取樣本量為50、100和150.模擬研究比較了四種方法:Naive 最小二乘估計(NLS)、Naive分位數(shù)回歸估計(NQR)、兩階段最小二乘估計(2SLS)和分位數(shù)回歸的工具變量估計(IVQR)的估計效果,其中分位數(shù)回歸給出的是分位點為0.5的估計.重復試驗次數(shù)1000次.模擬研究結(jié)果如表4.1所示.
根據(jù)表4.1可以看出,無論模型誤差分布是何種情形,對θ的估計,NLS和NQR0.5是有偏的.由于Naive估計忽略了內(nèi)生變量的影響,直接用內(nèi)生變量估計,所得的估計是有偏.對模型誤差是正態(tài)分布時,2SLS和IVQR0.5兩者差別并不大,但是,當模型誤差分布為非正態(tài)分布時,2SLS方法的Bias和SD都很大,效果不好,而本文提出的IVQR0.5仍表現(xiàn)出良好的效果.隨著樣本量的增加,本文提出的IVQR0.5偏差和標準差變小.因此,本文提出的估計方法消除了內(nèi)生變量對估計造成的偏差,同時,估計不受模型誤差分布的影響.
為了驗證本文提出的分位數(shù)回歸的工具變量估計的漸近正態(tài)性,圖4.1和圖4.2分別給出了樣本量N=100,不同誤差分布情形下參數(shù)θ和β的Q-Q圖.
表4.1 四種估計方法下參數(shù)估計的偏差與標準差
圖4.1 參數(shù)θ的Q-Q圖
從圖4.1,圖4.2可以看出,圖上的點近似地在一條直線上.因此,所提出的IVQR估計具有漸近正態(tài)性.
圖4.2 參數(shù)β的Q-Q圖