易瑩瑩
(南京郵電大學(xué)經(jīng)濟(jì)與管理學(xué)院,南京 210046)
近年來(lái),我國(guó)經(jīng)濟(jì)在快速增長(zhǎng)的同時(shí),居民的收入差距也在呈不斷擴(kuò)大的趨勢(shì)。收入差距問(wèn)題成為了國(guó)內(nèi)外學(xué)者廣泛關(guān)注的熱門話題。家庭收入差距包括兩方面的內(nèi)容,一方面是指同一代人不同家庭之間的收入差距;另一方面是指同一家庭不同代人之間的收入不平等,即收入的代際流動(dòng)性。近年來(lái),國(guó)內(nèi)外學(xué)者對(duì)收入不平等代際轉(zhuǎn)移程度及相關(guān)問(wèn)題的研究不斷增加。由于家庭背景對(duì)于子女的成長(zhǎng)及其未來(lái)的生活經(jīng)濟(jì)狀況存在一定的影響,代際收入流動(dòng)衡量的就是子輩的收入在多大程度上是由其父輩收入決定的,從而反映一個(gè)社會(huì)的機(jī)會(huì)平等問(wèn)題,為不平等問(wèn)題的研究提供了新的視角。機(jī)會(huì)的不平等意味著一個(gè)人除了自身的努力之外的外部因素所帶來(lái)收入狀況和社會(huì)地位的提升。機(jī)會(huì)平等與否在一定程度上決定著人們的結(jié)果是否平等。
在國(guó)外較早就有學(xué)者對(duì)收入代際流動(dòng)進(jìn)行研究,如,Blau&Duncan(1967)、Sewell&Hauser(1975)、Becker&Tomes(1986)等等,他們得出的代際收入流動(dòng)性較小,不高于0.2,并且得出結(jié)論,樣本成員來(lái)自一個(gè)高度流動(dòng)的社會(huì)。Solon在1992年《美國(guó)經(jīng)濟(jì)評(píng)論》中對(duì)以前的研究提出了尖銳的批評(píng)。他認(rèn)為以前研究中樣本不具有代表性,從而導(dǎo)致代際收入流動(dòng)程度較低的偏差。他利用美國(guó)PSD數(shù)據(jù)(Production,Supply and Distribution database),建立了三個(gè)計(jì)量模型,其結(jié)果都表明代際收入彈性比較大,代際間收入的繼承性大,而流動(dòng)性小。他認(rèn)為,使用有代表性的樣本比用父親收入5年均值或是單一年份收入會(huì)對(duì)結(jié)果產(chǎn)生更重要的影響。自此以后,許多學(xué)者通過(guò)使用更具代表性的樣本和改進(jìn)的計(jì)量方法研究該問(wèn)題,發(fā)現(xiàn)美國(guó)的跨代收入彈性系數(shù)范圍在0.3至0.5之間,瑞典和芬蘭的收入彈性系數(shù)范圍在0.3以下,英國(guó)約為0.5,德國(guó)約為0.43(Solon,1992;Zimmerman,1992;Bjorklund&Jantti,1997;Dearden&Machin,1997;Wiegand,2006)。
與國(guó)外研究相比,國(guó)內(nèi)的相關(guān)實(shí)證研究非常少。最早對(duì)代際流動(dòng)收入做定量研究的當(dāng)屬王海港(2005)。他利用1988年和1995年中國(guó)社會(huì)科學(xué)院“城鄉(xiāng)居民收入分配課題組”的調(diào)查資料,得到1988年和1995年代際收入彈性分別為0.384和0.424。何曉琦和鄧曉嵐(2006)利用對(duì)福建省壽寧縣貧困戶的入戶抽樣調(diào)查數(shù)據(jù)進(jìn)行了實(shí)證分析,在模型中,使用父輩2002~2004年的平均收入和子輩2004的收入作為協(xié)變量和響應(yīng)變量進(jìn)行回歸,發(fā)現(xiàn)父輩與子輩的跨代收入彈性為0.151。郭叢敏、閔維方(2007)運(yùn)用Logit模型探討教育促進(jìn)收入代際流動(dòng)的功能,他們發(fā)現(xiàn)中國(guó)城鎮(zhèn)居民收入代際存在較為明顯的傳遞效應(yīng),多數(shù)子女依然滯留在與父親相同的收入組群,并且教育有助于促進(jìn)弱勢(shì)群體的子女實(shí)現(xiàn)經(jīng)濟(jì)社會(huì)地位的躍升,是一種重要的代際流動(dòng)機(jī)制。韓軍輝(2009a;2009b)為了控制地域差別,利用多水平統(tǒng)計(jì)模型研究代際收入流動(dòng)。即第一水平模型主要是控制子輩個(gè)體屬性的影響,將父輩收入引入方程來(lái)考察代際收入流動(dòng)性。在此基礎(chǔ)上引入隨機(jī)效應(yīng)作為第二水平模型,說(shuō)明子輩收入還可能受到地區(qū)變量的影響,最后發(fā)現(xiàn)父輩收入對(duì)子輩收入的效應(yīng)為0.3615,而如果在農(nóng)村地區(qū)兩者的效應(yīng)僅為0.2072。汪燕敏、錢珍(2009)綜述了使用代際收入彈性衡量收入代際流動(dòng)性導(dǎo)致的計(jì)量偏誤產(chǎn)生的原因及解決辦法。
縱觀上述研究,代際收入流動(dòng)問(wèn)題的研究難點(diǎn)可以歸結(jié)為以下三點(diǎn):第一,樣本數(shù)據(jù)選擇的同質(zhì)性問(wèn)題,同質(zhì)性往往會(huì)導(dǎo)致比較大的估計(jì)偏差;第二,如果選擇了具有異質(zhì)性的樣本,那么周圍家庭環(huán)境、社區(qū)以及地區(qū)經(jīng)濟(jì)也會(huì)對(duì)子輩收入產(chǎn)生影響;第三,估計(jì)方法的選擇問(wèn)題。以往研究主要是通過(guò)最小二乘法。但是Solon指出,由于收入的臨時(shí)波動(dòng),代際收入彈性是存在偏誤的,因此,他主張使用父親的收入均值計(jì)算。Zimmerman則提出使用工具變量法來(lái)糾正向下偏誤問(wèn)題,但在實(shí)際應(yīng)用中,要找到經(jīng)濟(jì)意義明確又與父輩收入高度相關(guān)而與隨機(jī)擾動(dòng)項(xiàng)不相關(guān)的工具變量是很困難的。
我國(guó)收入差距存在城鄉(xiāng)差異,且這個(gè)差異有在擴(kuò)大的趨勢(shì),那么,代際收入流動(dòng)在城鄉(xiāng)的狀況又是如何的呢?我國(guó)處于城鄉(xiāng)二元經(jīng)濟(jì)結(jié)構(gòu)的狀況,因此,研究城鄉(xiāng)居民的代際收入流動(dòng)狀況具有十分重要的現(xiàn)實(shí)意義。綜合前面學(xué)者的已有研究,本文的研究目的是分析代際收入流動(dòng)在城鎮(zhèn)和農(nóng)村的差異性。針對(duì)代際收入流動(dòng)問(wèn)題研究的難點(diǎn),我們根據(jù)CHNS微觀數(shù)據(jù),引入城鄉(xiāng)和城鄉(xiāng)與父親收入的交互效應(yīng)作為隨機(jī)效應(yīng)以反映城鎮(zhèn)和農(nóng)村地區(qū)的經(jīng)濟(jì)差異,建立一線性混合模型,并對(duì)隨機(jī)效應(yīng)假設(shè)非參分布以放松其分布假設(shè),從而尋求其穩(wěn)健估計(jì)。
代際收入流動(dòng)的研究依據(jù)是人力資本理論,以往研究中大多都采用一回歸模型來(lái)度量父輩和子輩收入的跨際彈性。
這里,y1i代表子輩的收入,y0i代表父輩的收入,下標(biāo)1表示子輩,0表示父輩,i代表第i個(gè)家庭;x指協(xié)變量向量,代表收入的影響因素;εi為殘差項(xiàng)。在式(1)中如果估計(jì)的參數(shù)α0=0,表示子輩的收入與父輩沒(méi)有聯(lián)系,代際收入完全流動(dòng);α0=1則表示子輩的收入完全由父輩決定,代際收入完全沒(méi)有流動(dòng)。
但是對(duì)于群集數(shù)據(jù)而言,不同單元的觀測(cè)對(duì)象存在異質(zhì)性,而處于同一單元的觀測(cè)對(duì)象又存在相關(guān)性。此時(shí),數(shù)據(jù)的變異來(lái)源于兩方面:群間方差和群內(nèi)方差。因此,我們既要考慮相同觀察對(duì)象的不同觀察值之間的相關(guān)性,又要考慮不同觀察對(duì)象之間的異質(zhì)性。一般的線性回歸模型很難描繪它們的這種結(jié)構(gòu)特征。線性混合模型具有復(fù)雜的多水平層次結(jié)構(gòu),通過(guò)引進(jìn)隨機(jī)效應(yīng)反映了不同觀測(cè)對(duì)象之間的異質(zhì)性以及同一觀測(cè)對(duì)象不同觀測(cè)值之間的相關(guān)性。
式(2)中,β是固定效應(yīng)參數(shù),反映了總體的平均趨勢(shì),所以它又被稱為總體特定參數(shù)(population-specific parameter);x是對(duì)應(yīng)于固定效應(yīng)的協(xié)變量向量;bi是隨機(jī)效應(yīng)參數(shù),描述了觀測(cè)與總體平均趨勢(shì)的偏離,所以它又被稱為觀測(cè)特定參數(shù)(subject-specific parameter);z是對(duì)應(yīng)于隨機(jī)效應(yīng)的協(xié)變量向量??梢钥闯?,該模型的似然函數(shù)中包含有高維積分,所以關(guān)于它的參數(shù)估計(jì)往往變得比較復(fù)雜。
Verbeke&Molenberghs(2004)對(duì)擬合連續(xù)群集數(shù)據(jù)的線性混合模型進(jìn)行了詳細(xì)介紹。他們認(rèn)為對(duì)固定效應(yīng)參數(shù)、隨機(jī)效應(yīng)參數(shù)以及其協(xié)方差矩陣的估計(jì)不能通過(guò)簡(jiǎn)單的極大似然估計(jì)法獲得。事實(shí)上,早在1948年,Neyman&Scott就指出在一定的觀測(cè)個(gè)數(shù)n下,隨著參數(shù)個(gè)數(shù)的增加,傳統(tǒng)的極大似然估計(jì)并不是一致估計(jì)量。與傳統(tǒng)學(xué)派不同,貝葉斯學(xué)派允許隨機(jī)效應(yīng)可以取非正態(tài)分布,從而能夠更好地描述我們對(duì)先驗(yàn)分布的不確定性,并且貝葉斯方法即使是在小樣本條件下,也能獲得精確的后驗(yàn)分布推斷。但是,Verbeke&Lesaffre(1997)研究了幾種不同的先驗(yàn)分布對(duì)后驗(yàn)分布推斷的影響,并證明當(dāng)隨機(jī)效應(yīng)的真實(shí)分布是混合正態(tài)分布,但如果只是假設(shè)其為簡(jiǎn)單的正態(tài)分布,會(huì)導(dǎo)致對(duì)隨機(jī)效應(yīng)的不一致估計(jì)。很自然地,我們考慮將先驗(yàn)分布從參數(shù)分布擴(kuò)展為非參數(shù)分布。
非參數(shù)貝葉斯方法由Ferguson在1973年發(fā)表的一篇論文《A Bayesian Analysis of Some Nonparametric Problems》正式提出。基于Ferguson的觀點(diǎn),對(duì)于非參數(shù)問(wèn)題,對(duì)先驗(yàn)分布有兩方面的要求:(1)樣本空間中,先驗(yàn)分布必須有足夠大的支撐,甚至是包括空間中所有的分布。這就保證了先驗(yàn)選擇的靈活性與廣泛性,以便于找到最適合模型的分布函數(shù)。(2)在真概率分布中,給定樣本觀測(cè)值的后驗(yàn)分布必須易于分析。這就要求后驗(yàn)分布或者是共軛分布,或者是容易分析,從而保證在實(shí)際中的應(yīng)用價(jià)值。然而這兩個(gè)要求常常是相悖的。Ferguson證明Dirichlet過(guò)程滿足這兩個(gè)要求,且具有許多理想的性質(zhì)。因此,在本文分析中,我們選擇隨機(jī)效應(yīng)參數(shù)b服從Dirichlet過(guò)程DP(α,G0),其中,G0為基礎(chǔ)測(cè)度,定義了Dirichlet過(guò)程的位置;α是精度參數(shù),它決定分布G集中于G0的程度,因此度量了我們對(duì)G0的信任程度。令固定效應(yīng)參數(shù)β服從正態(tài)分布。由于Dirichlet過(guò)程是以概率1為離散的,根據(jù)Antoniak在1974年提出的混合Dirichlet過(guò)程,我們將整個(gè)模型描述為:
事實(shí)上,子輩的收入情況不僅受微觀水平的個(gè)體特征(如年齡、教育程度的)影響,而且同時(shí)還會(huì)受到家庭環(huán)境以及居住地是在城鎮(zhèn)還是在農(nóng)村的影響。也就是說(shuō),被研究的對(duì)象除了自身的“個(gè)體效應(yīng)”之外,還存在著“組效應(yīng)”。因此,我們引入城鄉(xiāng)和城鄉(xiāng)與父親收入的交互效應(yīng)作為隨機(jī)效應(yīng)。因此,整個(gè)模型設(shè)定如下:
其中,變量AGE、EDUC、URBAN分別代表年齡、最高受教育程度、城鄉(xiāng);變量lny0×URBAN代表城鄉(xiāng)與父親收入的交互效應(yīng)。
本研究采用的是由美國(guó)北卡羅萊納大學(xué)與中國(guó)預(yù)防醫(yī)學(xué)會(huì)和食品醫(yī)療研究所聯(lián)合調(diào)查的關(guān)于中國(guó)居民健康與營(yíng)養(yǎng)調(diào)查(CHNS)2006年的數(shù)據(jù)。CHNS數(shù)據(jù)樣本來(lái)自位于遼寧、黑龍江、江蘇、山東、河南、湖北、湖南、廣西、貴州等九個(gè)省市在1989、1991、1993、1997、2000、2004、2006年大約4400個(gè)家庭的數(shù)據(jù),其中包括性別、教育水平、婚姻、工資收入等變量。這套調(diào)查數(shù)據(jù)采取的是多階段、隨機(jī)聚類法,從覆蓋了中國(guó)東、中、西部地區(qū)的9個(gè)省中抽取樣本,每個(gè)省抽取4個(gè)縣,每個(gè)縣抽取4個(gè)村,每個(gè)村抽取20個(gè)家庭,所以代表性較好。在我們的研究中,由于我們著重考慮的是代際收入流動(dòng)在城鎮(zhèn)與農(nóng)村之間的差異性,再加上數(shù)據(jù)的可得性原因,因此我們沒(méi)有選取幾年的平均收入作為考量,而是對(duì)子輩選取2006年的收入,對(duì)父輩選取1989年的收入。我們將子輩和父輩配好對(duì)后,再刪除一些缺失數(shù)據(jù),最后整理,共有123個(gè)樣本。
由于調(diào)查問(wèn)卷上所調(diào)查的收入是前一年的數(shù)據(jù),所以每個(gè)樣本的工資收入都用前一年對(duì)應(yīng)的指數(shù)進(jìn)行了平滑。其中每個(gè)平滑指數(shù)是以1989年《中國(guó)統(tǒng)計(jì)年鑒》中1988年遼寧省城市職工生活費(fèi)用價(jià)格分類指數(shù)=100為基礎(chǔ)計(jì)算的。表1描述了1989年父輩和2006年配對(duì)子輩的收入情況,配對(duì)樣本分為城鎮(zhèn)和農(nóng)村居民兩個(gè)子樣本。
表1 配對(duì)樣本描述 (單位:元)
從表1中我們可以發(fā)現(xiàn),無(wú)論是對(duì)于父輩還是對(duì)于子輩而言,處于城鎮(zhèn)地區(qū)的居民都要比在農(nóng)村地區(qū)的居民收入高。
在非參數(shù)貝葉斯方法下,我們感興趣的是隨機(jī)效應(yīng)參數(shù)b和固定效應(yīng)參數(shù)β的后驗(yàn)推斷值。在對(duì)本模型進(jìn)行估計(jì)時(shí),我們首先平行運(yùn)行2條馬爾可夫鏈,每條鏈退火(burnin)10000次,另外,為了克服因?yàn)檫B續(xù)抽取而導(dǎo)致的自相關(guān)性,我們?cè)O(shè)置thin=10,即所得的隨機(jī)數(shù)每隔10次抽取用于后驗(yàn)量的計(jì)算。最終得到各參數(shù)的軌跡圖和G-R統(tǒng)計(jì)量分別如圖1(左)和表2所示。圖1的右邊描繪了模型中各參數(shù)的后驗(yàn)密度,其中陰影部分是其95%的置信區(qū)間部分。
表2 各參數(shù)的G-R統(tǒng)計(jì)量和后驗(yàn)估計(jì)值
從各參數(shù)的軌跡圖可以看出,各個(gè)參數(shù)的抽取值達(dá)到了穩(wěn)定狀態(tài)。并且從G-R統(tǒng)計(jì)量也可以看出,各個(gè)參數(shù)的G-R統(tǒng)計(jì)量接近于1。因此,可以認(rèn)為各個(gè)參數(shù)在迭代過(guò)程中已經(jīng)達(dá)到收斂。
于是我們?cè)俚?000次,然后根據(jù)最后的5000個(gè)后驗(yàn)抽取進(jìn)行分析,得到的后驗(yàn)估計(jì)值如表2所示。由估計(jì)結(jié)果可以看出,最高受教育程度和年齡的參數(shù)系數(shù)分別為0.0754和0.0148,這說(shuō)明子輩本身的最高受教育程度和年齡都對(duì)他的收入有一定的影響作用,且這種作用是正向的。對(duì)于城鄉(xiāng)隨機(jī)變量,它的估計(jì)值為4.8110,很明顯可以看出,城鎮(zhèn)地區(qū)居民要比農(nóng)村地區(qū)居民收入高,城鄉(xiāng)間收入差距很大。
在控制了城鄉(xiāng)變量后,我們的模型中計(jì)算的父輩和子輩之間的代際收入彈性系數(shù)為0.0402,這個(gè)結(jié)果比我國(guó)學(xué)者的研究都要低①這有可能是由于我們選取的數(shù)據(jù)、模型和估計(jì)方法造成的。。由于交互效應(yīng)的估計(jì)值為0.0290,可以看出代際流動(dòng)存在城鄉(xiāng)差異,城鎮(zhèn)地區(qū)的代際收入彈性要高于農(nóng)村地區(qū),即我們的研究中父輩收入對(duì)子輩收入的影響在城鎮(zhèn)地區(qū)要高于在農(nóng)村地區(qū)。換句話說(shuō),對(duì)于城鎮(zhèn)地區(qū)居民而言,父親的高收入能為子女收入的提高更多的保護(hù)和促進(jìn)作用。
圖1 各參數(shù)的MCMC軌跡圖(左)和最大后驗(yàn)密度圖(右)
由于線性混合模型中的隨機(jī)效應(yīng)可以反映不同觀測(cè)對(duì)象之間的異質(zhì)性以及同一觀測(cè)對(duì)象不同觀測(cè)值之間的相關(guān)性,本文利用線性混合模型研究代際收入問(wèn)題,并針對(duì)隨機(jī)效應(yīng)較難估計(jì)的問(wèn)題,我們應(yīng)用Dirichlet過(guò)程放松隨機(jī)效應(yīng)的分布假設(shè)。結(jié)果發(fā)現(xiàn),受教育程度、年齡和城鄉(xiāng)地理位置都會(huì)影響個(gè)人的收入,并且城鎮(zhèn)地區(qū)的代際收入彈性要高于農(nóng)村地區(qū)。
由于收入較高的父輩對(duì)子女的教育投資一般也更高,這使得其子輩的教育年限和教育質(zhì)量會(huì)更高。此外,根據(jù)Case et al.(2002)的研究表明,部分社會(huì)經(jīng)濟(jì)地位的代際傳遞是通過(guò)父母收入對(duì)子女健康的影響傳遞的,并且低收入家庭子女的健康狀況往往比高收入家庭的子女更差。這些都能很好地說(shuō)明城鎮(zhèn)地區(qū)的代際收入彈性高于農(nóng)村地區(qū)的原因。再加上我國(guó)正處于轉(zhuǎn)型期,勞動(dòng)力市場(chǎng)還很不完善。二元經(jīng)濟(jì)結(jié)構(gòu)在很大程度上造成了城市勞動(dòng)力的就業(yè)保護(hù),限制了農(nóng)村勞動(dòng)力向城市的流動(dòng),嚴(yán)重的影響著人們獲取工作的均等機(jī)會(huì)。因此,目前,影響人們找工作的主要因素似乎有時(shí)候并不是個(gè)體本身的能力,而是個(gè)體之外的關(guān)系背景。高收入的父母往往會(huì)通過(guò)社會(huì)關(guān)系的傳遞來(lái)影響子女的收入。一般而言,處于城鎮(zhèn)地區(qū)的居民收入較高,其社會(huì)交際關(guān)系網(wǎng)也一般更廣和更有作用,子女也更容易獲取高收入的工作。
因此,完善勞動(dòng)力市場(chǎng),提高社會(huì)整體狀態(tài)及社會(huì)發(fā)展態(tài)勢(shì)趨勢(shì)的平等性是我們亟需解決的問(wèn)題。對(duì)于農(nóng)村地區(qū),提供公平的受教育機(jī)會(huì)、加大農(nóng)村地區(qū)的教育投資、提供更多的職業(yè)培訓(xùn)、增進(jìn)醫(yī)療健康的公平性、增加更多的公共資源供給可以提高農(nóng)村子女在勞動(dòng)力市場(chǎng)中的競(jìng)爭(zhēng)力,增進(jìn)農(nóng)村地區(qū)的代際流動(dòng)性,這對(duì)于促進(jìn)社會(huì)的公平和和諧具有重要的作用。
[1]Blau,P.,Duncan,O.D.The American Occupational Structure[M].New York:John Wiley&Sons,1967.
[2]Sewell,W.,Hauser,R.Education,Occupation and Achievement in the Early Career[M].New York:Academic Press,1975.
[3]Becker,G.S.,Tomes,N.An Equilibrium Theory of Distribution of In?come and Intergenerational Mobility[J].Journal of Political Economy,1979,87(6).
[4]Solon,G.Intergenerational Income Mobility in the United States[J].American Economic Review,1992,(3).
[5]Zimmerman,D.Regression toward Mediocrity in Economics Stature[J].American Economic Review,1992,(3).
[6]Bjorklund,A.,Jantti,M.Intergenerational Income Mobility in Sweden Compared to the United States[J].American Economic Review,1997,87(5).
[7]Dearden,L.,Machin,S.,Reed,H.Intergenerational Mobility in Britain[J].The Economic Journal,1997,107(440).
[8]Wiegand,J.Intergeneraional Earnings Mobility in Germany[C].Work?ing Paper,2006.
[9]王海港.中國(guó)居民收入分配的代際流動(dòng)[J].經(jīng)濟(jì)科學(xué),2005,(2).
[10]何曉琦,鄧曉嵐.跨代收入流動(dòng)及其評(píng)估[J].統(tǒng)計(jì)研究,2006,(6).
[11]郭叢敏、閔維方.中國(guó)城鎮(zhèn)居民教育與收入代際流動(dòng)的關(guān)系研究[J].教育研究,2007,(5).
[12]韓軍輝.中國(guó)農(nóng)村地區(qū)代際收入流動(dòng)的多水平統(tǒng)計(jì)模型分析[J].統(tǒng)計(jì)與信息論壇,2009,24(8).
[13]韓軍輝.自助多水平統(tǒng)計(jì)模型在代際收入流動(dòng)研究中的應(yīng)用[J].蘭州學(xué)刊,2009,192(9).
[14]汪燕敏,錢珍.收入代際流動(dòng)計(jì)量偏誤的文獻(xiàn)綜述[J].生產(chǎn)力研究,2009,(21).
[15]Escobar,M.,West,M.Bayesian Density Estimation and Inference Us?ing Mixture[J].Journal of the American Statistical Association,1995,90(7).
[16]Case,A.Lubotsky,D.,Paxson,C.Economic Status and Health in Childhood:the Origins of the Gradient[J].The American Economic Review,2002,92(5).