袁曉惠,司 賀,王純杰
(長春工業(yè)大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)院,長春 130012)
作為一種穩(wěn)健性方法,分位數(shù)回歸由Koenker和Bassett(1978)[1]提出后,就得到國內(nèi)外統(tǒng)計學(xué)家廣泛的研究與應(yīng)用,取得了很多重要成果。Koenker(2005)[2]的專著詳盡地總結(jié)了近30年來分位數(shù)回歸相關(guān)的理論及研究結(jié)果。
面板數(shù)據(jù)是經(jīng)濟(jì)學(xué)中比較常見的一類數(shù)據(jù),此數(shù)據(jù)既含有時間序列的信息又包括個體截面的信息。對面板數(shù)據(jù)的有效分析能為研究者提供更多的信息。Wooldridge[3]介紹了處理面板數(shù)據(jù)的一些經(jīng)典統(tǒng)計方法。
面板數(shù)據(jù)的分位數(shù)回歸方法的相關(guān)研究,近十年來成為國內(nèi)外一個研究熱點(diǎn)。對于固定效應(yīng)的面板數(shù)據(jù)模型,羅幼喜和田茂再(2010)[4]通過模擬研究比較了三種分位數(shù)回歸估計方法,其中固定效應(yīng)變換分位回歸估計(FEQR)表現(xiàn)最好。Kato和Galvao(2012)[5]推導(dǎo)了固定效應(yīng)模型的分位數(shù)回歸估計漸近正態(tài)性質(zhì)。Galvao和Kato(2016)[6]基于核提出光滑的分位數(shù)回歸估計,并用核函數(shù)構(gòu)造回歸參數(shù)的漸近置信區(qū)間。核方法的估計效率依賴于窗寬的選擇,且一般需要假定數(shù)據(jù)獨(dú)立同分布,如果數(shù)據(jù)異質(zhì)性較強(qiáng),估計的效率可能會較低。
Brown和Wang(2005)[7]提出誘導(dǎo)光滑(IS)方法來估計秩回歸參數(shù)及相應(yīng)的置信區(qū)間。Brown和Wang(2009)[8]運(yùn)用此方法構(gòu)造分位數(shù)回歸參數(shù)的點(diǎn)估計和區(qū)間估計,相比于核光滑方法,誘導(dǎo)光滑方法不需要選擇窗寬,近幾年,此方法得到廣泛運(yùn)用。
本文針對固定效應(yīng)的分位數(shù)回歸模型,運(yùn)用誘導(dǎo)光滑的思想,構(gòu)造回歸參數(shù)的誘導(dǎo)光滑點(diǎn)估計和置信區(qū)間估計。通過蒙特卡洛實(shí)驗(yàn)和實(shí)例分析,說明新方法在回歸參數(shù)的點(diǎn)估計區(qū)間估計中具有一定的優(yōu)勢。
考慮含有個體固定效應(yīng)的分位數(shù)回歸模型:
其中:τ∈(0,1)是感興趣的分位數(shù),其中 yit是響應(yīng)變量在截面i和時刻t時的觀測值,相應(yīng)的xit是 p維協(xié)向量,β0∈Rp是未知的參數(shù)向量,αi是個體i的個體效應(yīng)。
通過求解如下優(yōu)化問題可以求得αi和β0的估計:
其中 ρ()
u=u(τ-I(u≤0))。在實(shí)際問題中,往往 n比較大但T卻比較小,即對于每個個體而言,其觀測值并不多,要想利用這少量的個體觀測值去估計每個個體效應(yīng)αi并非易事,而且即使能夠得到參數(shù)估計,其估計的效率也比較低。考慮到大多數(shù)的研究中,參數(shù)值β0才是人們的興趣所在,所以本文的重點(diǎn)將放在對β0的估計上。
β0的FEQR估計方法如下:然后基于考慮
最小化上述目標(biāo)函數(shù)得到β0的FEQR估計為:
相應(yīng)地,個體效應(yīng)的估計:
羅幼喜和田茂再(2010)[4]通過模擬比較了FEQR估計和另外兩種方法在有限樣本下的估計效率,F(xiàn)EQR估計表現(xiàn)較好。
本文將誘導(dǎo)光滑思想[6]應(yīng)用于式(2),首先構(gòu)造關(guān)于β的誘導(dǎo)光滑估計函數(shù)。
其中?(),Φ()分別為是標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)和分布函數(shù)。通過最小化(β)可得 β0的誘導(dǎo)光滑估計及相應(yīng)的個體效應(yīng)
在此方法中,Γ未知,首先令Γ=(nT)-1Ip,通過不斷迭代更新Γ。
令和
(2)在第k步迭代中,
(3)重復(fù)(2)直到 β(k+1)收斂于,(nT)Γ(k)收斂于ΣIS。
本文根據(jù)固定效應(yīng)面板數(shù)據(jù)模型產(chǎn)生模擬數(shù)據(jù),用以比較誘導(dǎo)光滑估計和其他幾種估計在有限樣本下的表現(xiàn)。
設(shè)定的產(chǎn)生數(shù)據(jù)的模型如下:
誤差分布選擇有3種:①標(biāo)準(zhǔn)正態(tài)分布N( )0,1 ,②標(biāo)準(zhǔn)柯西分布C(0,1),③自由度為3的T分布t(3)。真值β0=1,令 τ=0.3,0.5,0.7 及 n=10,T=30。在不同的誤差分布影響下計算β0的5種估計:
(1)忽略個體固定效應(yīng),直接使用混合數(shù)據(jù)的最小二乘估計,記為LS估計;
(2)忽略個體固定效應(yīng),直接使用混合數(shù)據(jù)的分位回歸估計,記為QR估計;
(3)考慮個體固定效應(yīng)的最小二乘估計,記為FELS估計;
(4)考慮個體固定效應(yīng)的變換分位數(shù)回歸估計,記為FEQR估計;
(5)本文提出的考慮個體固定效應(yīng)的誘導(dǎo)光滑估計,記為FEIS估計。
首先從均方根誤差(RMSE)的角度來衡量β0的估計的好壞。
這里K是模擬重復(fù)次數(shù),設(shè)定K=1000。RMSE越小,說明估計的效率越高,估計效果越好。表1列出了在不同的誤差分布及不同的分位數(shù)下,以上5個估計的RMSE。為了說明估計效果,每一行中,最小的RMSE用“*”標(biāo)出。
表1 在不同分位點(diǎn)不同誤差分布下β0的五種估計
從表1可以看出:
LS和QR的RMSE遠(yuǎn)遠(yuǎn)大于其余3種估計,說明在固定效應(yīng)面板數(shù)據(jù)模型中,忽略個體效應(yīng),導(dǎo)致估計效率降低。在參數(shù)估計中應(yīng)該將個體效應(yīng)納入估計方法中。
當(dāng)誤差分布為正態(tài)分布時,F(xiàn)ELS估計的RMSE最小,而當(dāng)誤差分布為柯西分布和T分布時,F(xiàn)ELS的RMSE變得很大,尤其是柯西分布時,F(xiàn)ELS估計的RMSE是FEQR和FEIS的RMSE的幾十甚至上百倍。而在實(shí)際數(shù)據(jù)的分析過程中,誤差分布的識別一般比較困難,且不一定會是正態(tài)分布。FELS估計在穩(wěn)健性方面的表現(xiàn)呈現(xiàn)一定劣勢。
在3種誤差分布下,F(xiàn)EQR和FEIS估計的RMSE都非常小,說明這兩個估計對誤差分布的依賴較弱,具有穩(wěn)健性。
大多數(shù)情形下,F(xiàn)EIS的RMSE小于FEQR的RMSE,說明FEIS方法在有限樣本下的點(diǎn)估計具有一定的優(yōu)勢。
表2 β0的FEIS估計的標(biāo)準(zhǔn)差95%的置信區(qū)間的覆蓋率
表2列出了FEIS估計的標(biāo)準(zhǔn)差SD和估計的標(biāo)準(zhǔn)差的平均SE以及95%的置信區(qū)間的覆蓋率。
正如表2所示,F(xiàn)EIS估計的SD和SE比較接近,且基于估計的標(biāo)準(zhǔn)差而構(gòu)造的置信水平為95%的置信區(qū)間的覆蓋率基本接近95%,說明FEIS方法置信區(qū)間估計表現(xiàn)較好。
本文通過一個真實(shí)的數(shù)據(jù)來展現(xiàn)FEIS方法在實(shí)際運(yùn)用中的表現(xiàn)。數(shù)據(jù)來源于《中國統(tǒng)計年鑒》。包含華北地區(qū)5省市,東北地區(qū)3省,華東地區(qū)7省市,中南地區(qū)6省從1996—2013年的城鎮(zhèn)居民家庭平均每人全年消費(fèi)性支出和城鎮(zhèn)居民平均每人全年家庭可支配收入的數(shù)據(jù)。目標(biāo)是探索居民消費(fèi)和收入之間的關(guān)系。
本文采用1978年全國年度消費(fèi)物價指數(shù)CPI對變量進(jìn)行平減,平減后的變量作為本文分析的對象。
表3 回歸結(jié)果比較
表3列出了上文中的5個估計的參數(shù)估計值(τ=0.5)。LS和QR的估計值較大,而考慮個體固定效應(yīng)的其他3個估計比較接近。
圖1 三種方法的回歸結(jié)果
圖1畫出了FELS和FEQR、QR在不同分位點(diǎn)的估計值。QR估計波動性較大,F(xiàn)ELS和FEQR估計值很接近。說明FELS的估計比較穩(wěn)定,而FELS可以同時得到區(qū)間估計,可以得到更可靠的信息,具有一定優(yōu)勢。
本文提出了面板數(shù)據(jù)分位數(shù)回歸的誘導(dǎo)光滑估計方法,可以在識別參數(shù)估計中同時得到參數(shù)點(diǎn)估計和區(qū)間估計,給實(shí)際工作者提高具有更可靠的信息。接著本文給出估計的簡單且有效的算法,通過很少的迭代數(shù)就可得到收斂的參數(shù)估計。蒙特卡洛模擬實(shí)驗(yàn)表明本文所提方法在小樣本下表現(xiàn)出色。實(shí)例分析說明此方法操作簡單,估計效果穩(wěn)定,具有實(shí)用價值,總體來說,誘導(dǎo)光滑估計方法在面板數(shù)據(jù)分位數(shù)回歸模型的參數(shù)估計中,具有一定的競爭力。