王艷明,徐 興,李心怡
(山東工商學院 統(tǒng)計學院,山東 煙臺 264005)
中國收入基尼系數(shù)自2008 年達到峰值后逐漸降低,近年來保持在0.46至0.47之間,仍處于較高的水平。基于國內(nèi)城鎮(zhèn)居民收入差距擴大的現(xiàn)狀,擴大中等收入群體規(guī)模是目前我國經(jīng)濟發(fā)展的重中之重,因此研究符合我國國情的中等收入群體界定方法十分必要。Lorenz(1905)[1]提出的洛倫茲曲線及基尼系數(shù)為收入分配問題的研究奠定了理論基礎(chǔ)??佃焙褪Y翠俠(2009)[2]論證了洛倫茲曲線與收入分布之間的等價性。中等收入人口規(guī)模和兩極分化可以從不同角度反映同一問題。洪興建和李金昌(2007)[3]述評了W型指數(shù)、ER型指數(shù)等方法對收入兩極分化進行測度的特點,同時指出兩極分化的測度體系仍不夠成熟,缺乏一定的公平性。因此,有必要進行更深入的研究。在中等收入人口規(guī)模定位與測度問題研究中,部分學者從數(shù)字特征的角度出發(fā)對中等收入問題進行研究。如李穎麗和江宗德(2013)[4]考量差異性等并通過中位數(shù)對中等收入人口比重進行測算;樊增增(2020)[5]通過分位數(shù)回歸模型對家庭收入分配進行了整體研究,深入挖掘了中國家庭收入不平等狀況。也有學者從收入分布的角度進行研究。
通過對現(xiàn)有文獻[6—11]的解讀和分析發(fā)現(xiàn),多數(shù)學者對于中等收入人口規(guī)模問題的研究需要借助中等收入群體界定的標準,而國內(nèi)外學者對此問題的觀點并不一致,因此導(dǎo)致部分方法在測度中等收入人口規(guī)模問題上存在一定的主觀性。本文基于參數(shù)分布與非參數(shù)分布對改進的M-曲線、S-曲線進行積分,進而通過簡單平均法、基于標準化收入分布的加權(quán)平均法、基于原始收入分布的加權(quán)平均法計算出相應(yīng)的中等收入人口規(guī)模指數(shù)進行綜合比較。采用不同年份的中國社會綜合調(diào)查(CGSS)數(shù)據(jù)實證分析2014—2020年城鎮(zhèn)居民中等收入人口規(guī)模的變化情況,本文的主要貢獻在于使用眾數(shù)回歸提升樹模型替代傳統(tǒng)非參數(shù)估計方法對居民收入數(shù)據(jù)進行估計,在數(shù)據(jù)呈現(xiàn)偏態(tài)分布的時候該模型的估計和預(yù)測都有良好的適配性。
由于居民收入信息完整包含于收入分布,因此收入分布函數(shù)就是中等收入人口規(guī)模測算最直接的方法。然而,使用收入分布函數(shù)進行中等收入人口規(guī)模測算具有一定的局限性,因此本文參照Foster和Wolfson(2010)[6]的研究,使用以下曲線克服這一弊端。
1.1.1 M-曲線和S-曲線
設(shè)定中等收入范圍和中等收入人口范圍:R=[zd,zu],Q=[qd,qu]。兩個范圍應(yīng)分別滿足以下條件:0 ≤Zd≤1 ≤Zu,qd≤0.5 ≤qu。定義收入分布函數(shù)的中位數(shù)為mK。此時,對于兩個不同的群體K和L,可以對其分別定義中等收入人口比例和中等收入差距并同時比較他們的中等收入人口規(guī)模和收入差距(分散化程度):
其中,是基于標準化分布Kz的,且是標準化收入函數(shù)的逆函數(shù)。
定義1:當且僅當對所有的R,有:
此時,記為KML。
定義2:對所有的Q,有:
此時,記為KSL。
但是上述兩個假設(shè)都分別依賴于范圍R和Q的選擇,即其結(jié)果為部分序。例如,在兩條不同的累積分布函數(shù)K和L曲線相交的時候,關(guān)于定義1 的KML 和LMK 會同時不成立。因此,可以通過標準化去解決這個問題,進行標準化后的M-曲線和S-曲線的結(jié)果如下:
進一步進行驗證發(fā)現(xiàn)存在以下關(guān)系:
這兩個關(guān)系體現(xiàn)出“上中等收入人口”和“下中等收入人口”可以作為中等收入人口規(guī)模和收入分散化程度的兩個部分,其測度方式分別為Mk(zd)和Mk(zu)、Sk(qu)和Sk(qd)。
在式(5)和式(6)的基礎(chǔ)上,給出以下命題:
命題1:KML當且僅當對所有的z時成立。
命題2:KSL當且僅當對所有的q時成立。
上述命題的意義在于對于不同收入分布K和L,在計算其M-曲線時只需提供一個系數(shù)z而無須提供一個具體的收入范圍R,計算S-曲線時只須提供一個系數(shù)q而無須再提供具體的中等收入人口范圍Q。在實踐中,M-曲線能夠避免臨界收入選取的隨意性,進而能夠?qū)θ我鈨蓚€收入群體K和L進行比較。M-曲線和S-曲線分別度量中等收入人口的集中程度和收入分散程度,是同一問題的不同角度。
1.1.2 中等收入人口規(guī)模指數(shù)
M-曲線仍存在一定的交叉現(xiàn)象,也許無法客觀地給出一個綜合結(jié)果。本文通過簡單平均法、基于標準化分布的加權(quán)平均法、基于原始分布F的加權(quán)平均法對M-曲線進行計算,構(gòu)造出能夠揭示中等收入人口規(guī)模狀況變動規(guī)律的指數(shù)。
(1)簡單平均法
將整個群體按照中位數(shù)收入mF分為兩個部分:低收入部分和高收入部分,分別對應(yīng):低于mF與0 ≤z≤1;高于mF與1 ≤z≤2。構(gòu)造對應(yīng)部分的中等收入人口規(guī)模指數(shù)。
由式(11)可知,綜合指數(shù)MI(1)的大小由Lorenz 曲線在mF及0.5 處的值以及累積分布函數(shù)的形狀μ/mF所決定;當F為對稱分布時,則由μ/mF=1所決定。
(2)加權(quán)平均法(基于標準化分布F?)
將相應(yīng)分布的概率密度函數(shù)f?(z)作為權(quán)重,構(gòu)造低收入部分與高收入部分的中等收入人口規(guī)模指數(shù):
得到整個群體的中等收入人口規(guī)模指數(shù)為:
由式(14)可知,綜合指數(shù)MI(2)的大小由累積分布函數(shù)F的信息所決定。
(3)加權(quán)平均法(基于原始分布F)
將相應(yīng)分布的概率密度函數(shù)f(z)作為權(quán)重,構(gòu)造低收入部分與高收入部分的中等收入人口規(guī)模指數(shù):
得到整個群體的中等收入人口規(guī)模指數(shù)為:
利用關(guān)系=F(μmF),將關(guān)于標準化分位數(shù)函數(shù)F的信息全部轉(zhuǎn)化為原始分布函數(shù)F的信息,兩邊關(guān)于z求導(dǎo)可得:
則有:
由式(19)可知,綜合指數(shù)MI(3)的大小由Lorenz 曲線與對角線在F(1)處的差值F(1)-L(F(1))以及原始收入分布的均值μ與中位數(shù)mF所決定。
本文通過分割、求和、取極限的方式計算該指數(shù)。
式(20)中,Δzi、ΔF(mF zi)、ΔF(zi)分別為z、F(mF z)、F(z)的微小增量。經(jīng)過多次計算發(fā)現(xiàn),當n=100 時指數(shù)收斂效果良好。
本文采用了對數(shù)正態(tài)分布、Pareto分布和眾數(shù)回歸提升樹這三種估計方法。
對數(shù)正態(tài)分布:
Pareto分布:
采用極大似然估計來估計未知函數(shù)參數(shù):
眾數(shù)回歸提升樹模型是將眾數(shù)回歸方法與提升回歸樹模型相結(jié)合的一種集成學習方法,其基本思想是:首先,以yi為響應(yīng)變量和xi為解釋變量擬合第一個眾數(shù)回歸樹;然后,計算第一個眾數(shù)回歸樹的殘差,以殘差為響應(yīng)變量和xi為解釋變量構(gòu)建第二個眾數(shù)回歸樹;依此類推,不斷將上一個眾數(shù)回歸樹的殘差作為新的響應(yīng)變量擬合新的眾數(shù)回歸樹;最后,將生成的所有眾數(shù)回歸樹進行線性組合,得到眾數(shù)回歸提升樹模型。構(gòu)建眾數(shù)回歸提升樹模型的具體步驟如下。
步驟1:以yi為響應(yīng)變量,xi為解釋變量,構(gòu)建眾數(shù)回歸樹,其中,參數(shù)估計的殘差為
步驟2:對m=1,2,…計算殘差:
對于上述估計方法的評估采用以下四個準則:MSE、MAE、MAS、卡方檢驗:
其中,F(xiàn)i為在第i個收入水平xi處的真實累積分布函數(shù)值;為使用模型在參數(shù)θ時估計出來的累積分布函數(shù)值;n為樣本量。
多數(shù)學者使用宏觀經(jīng)濟數(shù)據(jù)及具有權(quán)威性的微觀調(diào)查數(shù)據(jù)對收入分配問題進行研究。本文選取了2014 年、2017 年、2020 年的中國社會綜合調(diào)查(CGSS)數(shù)據(jù)作為研究對象并對數(shù)據(jù)做如下處理:(1)由于原始數(shù)據(jù)不能直接反映家庭人口數(shù)量的問題,因此使用Stata 對類似問題進行處理得到家庭人口數(shù)量并計算出家庭人均年收入;(2)剔除數(shù)據(jù)缺失嚴重(無法反映其收入狀況)及收入最高、最低5%的數(shù)據(jù),篩選出相對合格的數(shù)據(jù)作為觀測樣本。本文選取微觀數(shù)據(jù)中的采訪地點、所在省份、家庭年收入、家庭人口數(shù)量、家庭人均年收入作為變量,并按照《中國統(tǒng)計年鑒》的劃分方式,將居民收入數(shù)據(jù)劃分為7組,詳見下頁表1??梢钥闯觯杖霐?shù)據(jù)符合Lorenz曲線的特征:累計收入百分比始終小于累計人口百分比。由下頁表2 可知,3個年份的中位數(shù)均小于均值,同時偏度均大于0,說明城鎮(zhèn)居民收入數(shù)據(jù)呈右偏分布。
表1 城鎮(zhèn)居民家庭生活情況調(diào)查統(tǒng)計指標
表2 城鎮(zhèn)居民收入水平與差異狀況
由下頁表3 可知,2014 年、2017 年、2020 年城鎮(zhèn)居民收入對數(shù)正態(tài)分布的μ分別為10、10.27、10.2,呈現(xiàn)先增后減的趨勢,其σ2分別為0.45、0.59、0.57;Pareto分布的xm分別為5355.44、5696.72、5489.23,其α分別為0.71、0.61、0.64;眾數(shù)回歸提升樹模型的h分別為4509.17、5637.59、5467.73。三種分布函數(shù)得到了一樣的結(jié)果:城鎮(zhèn)居民收入先增加后減少,其整體收入分布位置先向右偏移再向左偏移。
表3 不同分布下城鎮(zhèn)居民參數(shù)估計結(jié)果
由下頁表4 可知,不同分布下的城鎮(zhèn)居民收入擬合結(jié)果在5%的水平下均表現(xiàn)良好。觀察并對比卡方檢驗的P值(越大越好),可以得出三個分布的擬合結(jié)果的優(yōu)良排序從低到高依次為:眾數(shù)回歸提升樹、Pareto、對數(shù)正態(tài)。
表4 不同分布下城鎮(zhèn)居民收入擬合效果比較
基于對數(shù)正態(tài)分布、Pareto 分布、眾數(shù)回歸提升樹模型得到的收入分布函數(shù)及其逆函數(shù)估計的結(jié)果,對M-曲線與S-曲線進行積分,進而對城鎮(zhèn)中等收入人口規(guī)模進行評估分析。對于M-曲線,因為標準化后的分布函數(shù)有=F(mF)=0.5,所以一定經(jīng)過(1,0)這個點;而對于S-曲線,因為F-1(0)=0、F-1(0.5)=mF,所以一定經(jīng)過(0,1)和(0.5,0)這兩個點。結(jié)果見圖1至圖3。
圖1 城鎮(zhèn)居民基于對數(shù)正態(tài)分布的M-曲線和S-曲線
圖2 城鎮(zhèn)居民基于Pareto分布的M-曲線和S-曲線
圖3 城鎮(zhèn)居民基于眾數(shù)回歸提升樹的M-曲線和S-曲線
城鎮(zhèn)居民收入的三個分布函數(shù)(對數(shù)正態(tài)分布、Pareto分布和眾數(shù)回歸提升樹)對M-曲線積分所得到的結(jié)果均是2014 年在最上方、2020 年在最下方,表明2020 年中等收入人口規(guī)模最小,也側(cè)面體現(xiàn)了我國城鎮(zhèn)居民高收入人口變得越來越多。城鎮(zhèn)居民的S-曲線與M-曲線結(jié)果恰好相反,2020年在最上方,然后是2017年、2014年,結(jié)合前文對數(shù)正態(tài)分布和Pareto分布的參數(shù)估計結(jié)果可以發(fā)現(xiàn),2014—2017 年我國城鎮(zhèn)居民收入穩(wěn)步提高,受新冠肺炎疫情影響,2020年城鎮(zhèn)居民收入略微下降,但整體來看城鎮(zhèn)高收入分布人群收入提高明顯。結(jié)果見表5。
表5 不同分布城鎮(zhèn)居民中等收入人口規(guī)模指數(shù) (單位:%)
通過三種方法計算所得到的城鎮(zhèn)居民中等收入人口規(guī)模綜合指數(shù)結(jié)果和M-曲線的所得結(jié)論一致:2014年中等收入人口規(guī)模最大,然后是2017年、2020年。
本文通過構(gòu)造中等收入人口規(guī)模指數(shù)的方法對2014年、2017年、2020年城鎮(zhèn)居民處理后的微觀收入數(shù)據(jù)進行實證研究。結(jié)果表明:(1)采用構(gòu)造的中等收入人口規(guī)模指數(shù)對城鎮(zhèn)居民中等收入人口規(guī)模進行測算得到了和M-曲線、S-曲線一致的結(jié)論;(2)我國城鎮(zhèn)居民收入總體呈現(xiàn)增長趨勢,中等收入人口規(guī)模基本不變,且收入分布先右移再左移,城鎮(zhèn)居民收入顯著提高。
基于此,本文提出如下建議:(1)通過高質(zhì)量發(fā)展實現(xiàn)共同富裕,擴大中等收入人口規(guī)模。高質(zhì)量發(fā)展有利于優(yōu)化分配結(jié)構(gòu),進而擴大中等收入人口規(guī)模。(2)通過優(yōu)化分配制度和政策推動實現(xiàn)共同富裕,擴大中等收入人口規(guī)模。堅持按勞分配為主體,但同時通過增加城鄉(xiāng)居民財產(chǎn)性收入等其他政策來提高居民收入。(3)加快完善并優(yōu)化第三次分配制度的構(gòu)建。在秉承自愿原則的前提下鼓勵更多高收入群體回報社會,助力擴大中等收入群體規(guī)模。