袁進(jìn)義,楊宜平
(1.重慶大學(xué)經(jīng)濟(jì)與工商管理學(xué)院,重慶400030;2.重慶工商大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶400067)
縱向數(shù)據(jù)下工具變量線性回歸模型的經(jīng)驗(yàn)似然推斷
袁進(jìn)義1,楊宜平2
(1.重慶大學(xué)經(jīng)濟(jì)與工商管理學(xué)院,重慶400030;2.重慶工商大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶400067)
文章考慮縱向數(shù)據(jù)下工具變量線性回歸模型,基于工具變量和二次推斷函數(shù)方法,提出了回歸參數(shù)的經(jīng)驗(yàn)對(duì)數(shù)似然比統(tǒng)計(jì)量。在一些正則條件下,證明了所提出的經(jīng)驗(yàn)對(duì)數(shù)似然比統(tǒng)計(jì)量漸近于標(biāo)準(zhǔn)卡方分布,由此構(gòu)造興趣參數(shù)的置信域。
縱向數(shù)據(jù);工具變量;二次推斷函數(shù);經(jīng)驗(yàn)似然;工作相關(guān)陣
經(jīng)典線性回歸模型在研究響應(yīng)變量與解釋變量之間的關(guān)系時(shí),往往假定解釋變量是外生變量?;谠摷俣?,采用最小二乘法可以獲得回歸系數(shù)無(wú)偏的和相合的估計(jì)。但是在大多實(shí)際問(wèn)題的研究中,尤其在社會(huì)、經(jīng)濟(jì)等許多領(lǐng)域解釋變量往往是內(nèi)生的。如Angrist和Krueger[1]在研究教育對(duì)收入的影響時(shí),教育是一個(gè)內(nèi)生變量;Frankel和Romer[2]在考慮國(guó)際貿(mào)易對(duì)經(jīng)濟(jì)增長(zhǎng)的影響時(shí),國(guó)際貿(mào)易是一個(gè)內(nèi)生變量。工具變量的引入有效地解決了內(nèi)生解釋變量所帶來(lái)的問(wèn)題。Angrist和Krueger[1]選擇“出生季節(jié)”作為教育年限的工具變量,對(duì)收入水平建立工具變量線性回歸模型來(lái)分析教育對(duì)收入的影響;Frankel和Romer[2]使用“地理因素”作為工具變量來(lái)解決國(guó)際貿(mào)易對(duì)經(jīng)濟(jì)增長(zhǎng)的促進(jìn)作用所面臨的內(nèi)生解釋變量的問(wèn)題。關(guān)于工具變量回歸模型的相關(guān)研究已有大量文獻(xiàn)。Basmann[3]提出了兩階段最小二乘法估計(jì)工具變量線性回歸模型中的回歸系數(shù);Buse[4]研究了工具變量估計(jì)的偏差問(wèn)題;Chamberlain和Imbens[5]討論了工具變量隨機(jī)效應(yīng)模型的估計(jì)問(wèn)題;張衛(wèi)東[6]討論了線性模型中的測(cè)量誤差問(wèn)題與工具變量方法;胡毅和王美今[7]提出了工具變量估計(jì)的最優(yōu)工具變量選取方法。
上述文獻(xiàn)都是在獨(dú)立數(shù)據(jù)下討論工具變量線性回歸模型的估計(jì)問(wèn)題。在分析實(shí)際問(wèn)題時(shí),往往會(huì)遇到縱向數(shù)據(jù)。當(dāng)前,關(guān)于縱向數(shù)據(jù)下工具變量回歸模型的研究很少。因此,本文考慮如下縱向數(shù)據(jù)工具變量線性回歸模型:
其中Yij是響應(yīng)變量,Xij是p×1內(nèi)生變量,即E(Xijεij)≠0,β是p×1未知參數(shù),Π為p×k維未知參數(shù)矩陣,εij為模型誤差,Zij是k×1工具變量,與解釋變量Xij相關(guān),且與模型誤差εij不相關(guān),即滿足
E(Zijεij)=0且E(Zijeij)=0,i=1,…n,j=1,…,ni
本文的目的是利用0wen[8]提出的經(jīng)驗(yàn)似然方法研究模型(1)中回歸參數(shù)β的置信域的估計(jì)問(wèn)題。關(guān)于該方法的相關(guān)研究參見(jiàn)文獻(xiàn)[9-10]。為了處理模型中縱向數(shù)據(jù)的組內(nèi)相關(guān)性,我們提出了基于工具變量和二次推斷函數(shù)法的經(jīng)驗(yàn)對(duì)數(shù)似然比函數(shù),并證明了所提出的經(jīng)驗(yàn)對(duì)數(shù)似然比函數(shù)漸近于標(biāo)準(zhǔn)卡方分布,進(jìn)而構(gòu)造回歸參數(shù)β的置信區(qū)間。本文方法的優(yōu)點(diǎn)在于:(1)利用二次推斷函數(shù)法處理縱向數(shù)據(jù)的組內(nèi)相關(guān)性,無(wú)需估計(jì)工作相關(guān)陣;(2)與傳統(tǒng)的正態(tài)逼近方法構(gòu)造置信區(qū)間相比,經(jīng)驗(yàn)似然方法具有其獨(dú)特的優(yōu)勢(shì)——不需要任何漸近方差的估計(jì)且區(qū)間估計(jì)的形狀完全由數(shù)據(jù)決定。
由于模型(2)中Xi是內(nèi)生變量,Zi是工具變量,則可以利用工具變量將內(nèi)生變量進(jìn)行分解。
由條件E(Zijeij)=0,結(jié)合模型(2)可得E(X|Z)=πZ。采用最小二乘法可得π的估計(jì)
因此,
采用Liang和Zerger[11]提出的廣義估計(jì)方程方法,可以構(gòu)造參數(shù)β的廣義估計(jì)方程:
其中Vi是工作相關(guān)陣。在實(shí)際應(yīng)用中Vi通常是未知的,且依賴(lài)有限維的討厭參數(shù),即將Vi進(jìn)行分解成Vi=,其中Ai=diag(var(Yi1),…,var(Yini)),R(ρ)是含討厭參數(shù)ρ的工作相關(guān)陣。為了避免錯(cuò)誤估計(jì)討厭參數(shù)ρ對(duì)估計(jì)效的影響,利用Qu等[12]的思想,可將工作相關(guān)陣的逆R-1(ρ)表示為一些基矩陣的線性組合,即
其中ai(i=1,…,m)是未知的常數(shù),Mi(i=1,…,m)是已知的基矩陣。一些常見(jiàn)的工作相關(guān)陣都可以由式(4)很好地逼近,具體參見(jiàn)文獻(xiàn)[11]。將式(4)代入式(3),得到如下估計(jì)方程:
注意到估計(jì)方程(5)是輔助隨機(jī)向量式(6)中元素的線性組合。如果β是參數(shù)真值,經(jīng)簡(jiǎn)單計(jì)算可得利用該信息,可以構(gòu)造回歸參數(shù)β的經(jīng)驗(yàn)對(duì)數(shù)似然比函數(shù)
由Lagrange乘子法,l(β)可表示為
其中λ是ps×1向量,且滿足
我們討論經(jīng)驗(yàn)對(duì)數(shù)似然比函數(shù)l(β)的漸近性質(zhì)。為了得到定理1,需給出一些正則條件。
C1:參數(shù)β定義域是Rp上的一個(gè)緊集,真值β0是其一個(gè)內(nèi)點(diǎn)。
C2:{} ni是有界的正整數(shù)列。
定理1:假定條件C1—C3成立,如果β是參數(shù)真值,則
基于定理1,可以構(gòu)造β的1-α(0<α<1)的置信域:
Rα(β)
為了證明定理1,需要下面引理。
引理1:假定條件C1—C3成立,如果β是參數(shù)真值,則
其中
其中Q2,s表示Q2的第s個(gè)分量。這就證得用Q3,s表示Q3的第s個(gè)分量,那么
定理1的證明:對(duì)l(β)進(jìn)行Taylor展開(kāi),可得
上式結(jié)合引理1可得定理1。
本文針對(duì)解釋變量是內(nèi)生變量的線性回歸模型,提出了基于工具變量的經(jīng)驗(yàn)似然推斷。在構(gòu)造輔助隨機(jī)向量時(shí),為了消除縱向數(shù)據(jù)的組內(nèi)相關(guān)性,對(duì)工作相關(guān)陣采用一些已知的基矩陣來(lái)逼近,避免了工作相關(guān)陣中討厭參數(shù)的估計(jì)。進(jìn)一步,為了避免內(nèi)生變量對(duì)區(qū)間估計(jì)的影響,借鑒工具變量線性回歸模型中兩階段最小二乘估計(jì)的思想,引入工具變量,利用工具變量將解釋變量進(jìn)行分解。在一些正則條件下,證明了所提出的經(jīng)驗(yàn)對(duì)數(shù)似然比函數(shù)漸近于標(biāo)準(zhǔn)卡方分布。
[1]Angrist JD,Krueger A B.DoesCompulsory School Attendance Affect Schooling and Earning?[J].Quarterly Journal of Economics,1991, (106).
[2]Frankel J,Romer D.Does Trade Cause Growth?[J].American Eco?nomic Review,1999,89(3).
[3]Basmann R L.A Generalized Classical Method of Linear Estimation ofCoefficients in a Structural Equation[J].Econometrica,1957,(25).
[4]Buse A.The Biasof Instrumental Variable Estimators[J].Econometri?ca,1992,(60).
[5]Chamberlain G,Imbens G.Random Effect Estimator With Many In?strumentalVariables[J].Econometrica,2004,72.
[6]張衛(wèi)東.線性模型中的測(cè)量誤差問(wèn)題與工具變量方法[J].統(tǒng)計(jì)與決策,2008,(8)
[7]胡毅,王美今.IV估計(jì)的最優(yōu)工具變量選取方法[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2011,(7)
[8]Owen A B.Empirical Likelihood Ratio Confidence Intervals for a Sin?gle Function[J].Biometrika,1988,75(2).
[9]Xue L G.Empirical Likelihood for Linear ModelsWith Missing Es?ponses[J].JournalofMultivariate Analysis,2009(100).
[10]Zhao P X,Xue L G.Empirical Likelihood Inferences for Semipara?metric Instrumental Variable Models[J].Journal of Applied Mathe?maticsand Computing,2013,(32).
[11]Liang K Y,Zeger SL.Longitudinal Data Analysis Using Generalized LinerModels[J].Biometrika,1986,(32).
[12]Qu A,Lindsay B G,Li B.Improving Generalized Estimating Equa?tionsUsingQuadratic Inference Functions[J].Biometrika,2000,(87).
(責(zé)任編輯/易永生)
0212.7
A
1002-6487(2016)19-0073-03
國(guó)家自然科學(xué)基金資助項(xiàng)目(11301569);國(guó)家社會(huì)科學(xué)基金資助項(xiàng)目(11CTJ004);重慶市基礎(chǔ)與前沿研究計(jì)劃項(xiàng)目(cstc2015jcyjA00023);重慶市教委科研項(xiàng)目(KJ1500614)
袁進(jìn)義(1982—),男,湖北咸寧人,博士研究生,研究方向:知識(shí)管理。楊宜平(1981—),女,湖北荊州人,副教授,研究方向:非參數(shù)統(tǒng)計(jì)。