韓本三
(西南財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)學(xué)院,成都 610074)
微觀面板模型是個(gè)有趣的也是富有挑戰(zhàn)性的研究領(lǐng)域。因?yàn)槊姘鍞?shù)據(jù)模型由傳統(tǒng)的線性過度到非線性面臨很多問題而且不同的數(shù)據(jù)類型處理方法上也差別很大。最基本的模型是帶有固定效應(yīng)的二元面板模型,稱為兩時(shí)期兩狀態(tài)模型(見Arellano和 Honore,2001)。這個(gè)二元模型是個(gè)潛變量模型,因變量被描述為解釋變量的線性組合與個(gè)體固定效應(yīng)以及隨個(gè)體時(shí)間而變化的設(shè)定沖擊的和。我們感興趣的參數(shù)是解釋變量的系數(shù)。如果我們用通常的極大似然法估計(jì),會(huì)產(chǎn)生“意外參數(shù)問題(Baltige,2005)。因?yàn)殡S著個(gè)體數(shù)N增加固定效應(yīng)的個(gè)數(shù)也在增加。對(duì)于Logit模型,Chamberlain(1980)發(fā)現(xiàn)二元因變量按時(shí)間求和對(duì)個(gè)體固定效應(yīng)是個(gè)最小的充分統(tǒng)計(jì)量(即 S-充分性,Barndorff-Nilsen,1987)。這樣便得到了解釋變量系數(shù)的條件Logit估計(jì)。這種方法的一個(gè)關(guān)鍵假設(shè)是設(shè)定沖擊間相互獨(dú)立性。Magnac(2004)在沒有沖擊獨(dú)立的條件下,推廣了條件Logit模型,提出了相應(yīng)的半?yún)?shù)估計(jì)。
基本模型如下:
yt=1,當(dāng)且僅當(dāng) xtβ+ηt+ε+μt>0;否則 yt=0
其中t=1,2,3,4;xt是L維實(shí)向量。為簡(jiǎn)便模型省略了個(gè)體下標(biāo) i。
假設(shè)R:
(1)x1(1)-x2(1)-x3(1)+x4(1)在整個(gè)實(shí)線上連續(xù)變化,xt(1)表示 xt的第一個(gè)分量,β(1)=1,即β的第一個(gè)分量為1;
(2)x1-x2-x3+x4的取值不共線;
(3)隨機(jī)沖擊(μ1,μ2,μ3,μ4)具有嚴(yán)格正的、連續(xù)的、有界的密度函數(shù),并且與x1,x2,x3,x4,η,ε獨(dú)立。
假設(shè)(1)和(2)是為了保證模型能夠被識(shí)別,參照Magnac(2004)。假設(shè)(3)是為了得到充分統(tǒng)計(jì)量的一個(gè)等價(jià)刻畫。對(duì)于條件 Logit估計(jì),μ1,μ2,μ3,μ4還被假設(shè)為獨(dú)立的, 并且服從Logistic分布。
當(dāng)K=0或4時(shí),上述結(jié)論顯然是成立的。下面說明當(dāng)K=1時(shí)結(jié)論是成立的,其他情況類似。當(dāng)K=1時(shí)會(huì)有四種情況出現(xiàn),我們選擇y1=1,y2=y3=y4=0來說明
證明:容易知道K和S的取值范圍分別為{0,1,…,3,4}和{0,1,…,8,10}。當(dāng)K=0,4或S=0,10時(shí),結(jié)論顯然成立。因?yàn)镵,S取值是相關(guān)的,根據(jù)其范圍我們可得只有當(dāng)K=2,S=5時(shí),y1,y2,y3,y4的取法才不唯一,此時(shí)y1=1,y2=y3=0,y4=1或y1=0,y2=y3=1,y4=0。
上述結(jié)果與η和ε無關(guān)。同理可得
從而我們可以寫出條件似然函數(shù)為
其中當(dāng) y1=0,y2=y3=1,y4=0時(shí),wi=1;當(dāng)y1=1,y2=y3=0,y4=1時(shí),
對(duì)于T>4的情況,我們可以對(duì)個(gè)體時(shí)間序列按相鄰的四個(gè)作為一組,構(gòu)造似然函數(shù),可以證明似然函數(shù)形式是相同的,區(qū)別僅在于K和S的取值上。這種方法雖然在一致性上沒有問題,但對(duì)于有效性,還有值得考慮的地方,因?yàn)槲覀儗⒁粋€(gè)四期的面板模型轉(zhuǎn)化為了一個(gè)截面數(shù)據(jù)模型。
第二部分的條件Logit估計(jì)方法有兩個(gè)很強(qiáng)的假設(shè):μt間的相互獨(dú)立性和Logistic分布假設(shè),因而受到批評(píng)(Magnac,2004)。 正如 Magnac(2004)中的做法,我們希望能夠在沒有沖擊獨(dú)立的假設(shè)下得到其似然函數(shù),對(duì)于Logistic分布假設(shè),一個(gè)自然的方法是利用半?yún)?shù)方法。充分性定義仍然和前面一樣:
下面我們給出充分性的一個(gè)等價(jià)刻畫。
證明:令 zt=-xtβ-ηt-ε,根據(jù)假設(shè) R(3)有
由充分性定義,我們只需要證明對(duì)(y1,y2,y3,y4)∈{(1,0,0,1),(0,1,10)}定理1成立。因?yàn)樵趯?duì)條件下,其概率和為1,所以我們只需要考慮一種情況就可以了。
根據(jù)假設(shè) R 可知 r(z1,z2,z3,z4)在 R4是光滑的,并且 z1,z2,z3,z4在整個(gè)實(shí)軸上變動(dòng)。
這樣要使得 r(z1,z2,z3,z4)與 η、ε 無關(guān),即有 z1,z2,z3,z4一種組合能夠消除η和ε,并且能夠保留我們需要估計(jì)的參數(shù)β。 因?yàn)?xt可能導(dǎo)致線性無關(guān)性,我們只需要考慮 z1,z2,z3,z4的線性組合。這樣只存在兩類組合方式:z1-z2-z3+z4和(z1-z4)+3(z3-z2)。其他組合是這兩種組合中一種的常數(shù)倍,所以我們只需要考慮這兩種類型。假設(shè)
在假設(shè) R 下,當(dāng) z1→∞ 時(shí),c((z1-z4)+3(z3-z2))→c(∞)=0,當(dāng)z3→∞ 時(shí),c((z1-z4)+3(z3-z2))→c(∞)=∞,矛盾。 所以我們有
我們還可以看出c(·)在R上是從∞到0的嚴(yán)格遞減的函數(shù)。根據(jù)定理2可得沒有獨(dú)立性假設(shè)下的條件似然函數(shù)
本文考察了帶趨勢(shì)的二元面板模型估計(jì)問題。對(duì)于非線性模型,差分方法已經(jīng)不再適用。但是由于固定效應(yīng)模型中固定效應(yīng)參數(shù)會(huì)隨著個(gè)體樣本增加而增加,從而利用極大似然估計(jì)會(huì)出現(xiàn) “意外參數(shù)問題 (incidental parameters prob-lem)”。為此,本文第二部分在隨機(jī)沖擊獨(dú)立并且其分布是Logistic分布的假設(shè)下,證明了對(duì)個(gè)體固定效應(yīng)和趨勢(shì)項(xiàng)系數(shù)是充分的。利用這個(gè)結(jié)果寫出了相應(yīng)的條件似然函數(shù)(2)。但是這兩個(gè)假設(shè)太強(qiáng),本文第三部分放松了這兩個(gè)假設(shè),并且得到了對(duì)個(gè)體固定效應(yīng)和趨勢(shì)項(xiàng)系數(shù)仍是充分的充要條件。據(jù)此我們可得到在沒有這兩個(gè)假定的情況下的半?yún)?shù)估計(jì)式(4)。
對(duì)本文的一個(gè)直接推廣是解釋變量不一定要求是線性組合形式xtβ,一般的形式為ft(xt,β)。這樣我們的結(jié)果就是非線性函數(shù)的差分。如果Matzkin(1992)中條件被滿足,ft(xt,β)甚至可以部分未知的。
一個(gè)比較困難的問題是帶趨勢(shì)的三期二元面板模型。本文的充分性對(duì)三期面板是不適用的。因?yàn)樵诔浞中缘拿總€(gè)可能取值條件下,yt的值都是確定的,從而條件似然函數(shù)都與個(gè)體固定效應(yīng)和趨勢(shì)項(xiàng)系數(shù)無關(guān)。考慮三期的一個(gè)明顯優(yōu)點(diǎn)是我們可以將一個(gè)四期轉(zhuǎn)化為兩個(gè)三期,從而可能增加信息度,提高有效性。
更困難可能是將這個(gè)方法推廣到其他模型中去,比如Poisson模型,動(dòng)態(tài)模型(Honore和 Kyriazidou,2000)以及 Tobit類模型估計(jì)。
[1]Arellano,M.,B.E.Honore.Panel Data Models:Some Recent Developments[A].In Handbook of Econometrics,Vol.5,ed.By E.Leamer and J.J.Hechman[Z].Amsterdam:NorthHolland,2001.
[2]Chamberlain,G.Analysis of Covariance with Qualitative Data,the Review of Economic Studies,Vol.47,No.1[J].Econometrics Issue,1980,(1).
[3]Honore,B.E.,E.Kyriazidou PanelDataDiscreteChoiceModels with Lagged Dependent Variables[J].Econometrica,2000,70.
[4]Matzkin,R.Nonparametric and Distribution-Free Estimation of the Binary Threshold Crossing and The Binary Choice Models[J].E-conometrica,1992,(60).
[5]Baltige,B.H.Econometric Analysis of Panel Data(3rdedition)[M].Chichester:John Windy&Sons Press,2005.
[6]Magnac,T.Panel Binary Variables and Sufficiency:Generalizing Conditional Logit[J].Econometrica,2004,6(72).
[7]Manski,C.F.Identification of Binary Response Models[J].Journal of the American Statistical Association,1988,(83).