郭秀榮
(重慶大學 數(shù)學與統(tǒng)計學院,重慶 401331)
早在2000年國家統(tǒng)計局就公布了當年的基尼系數(shù)為0.412,十多年了,現(xiàn)在的數(shù)字怎樣了呢?帶著這個疑問,我們通過官方中國統(tǒng)計年鑒公布的數(shù)字,試圖理出一個基尼系數(shù)的走勢圖來。
關于基尼系數(shù)的文獻眾多,國內也有不少的研究。意大利統(tǒng)計學家C.Gini[1]在其1912年發(fā)表的Variabilità e Mutabilità一書中,首次提出了一種不均等指數(shù)及其計算方法。但直到8年以后才引起國際學術界的廣泛重視。英國收入分配專家H.Dalton在1920年的《收入不均等的測量》一文中首次在英文文獻中介紹Gini的不均等指數(shù),并把它稱之為平均差(mean difference)指數(shù),而且認為該指數(shù)可以用來研究收入分配問題。從此以后,Gini的不均等指數(shù)逐步受到更多人的重視,并被后人稱為基尼系數(shù)。
基尼還從數(shù)學上論證了基尼系數(shù)與洛倫茲曲線的幾何含義是一致的(Dalton[2],1920)?;嵯禂?shù)的原始計算公式如下:
計算公式如下[3][4]:
對有限樣本的問題,這兩個公式已經再明白不過了,只要獲得一國所有公民的收入數(shù)據,是不難直接算出Gini系數(shù)的。但這樣一來,完整的數(shù)據獲取不宜,二來如果要動態(tài)的監(jiān)測Gini系數(shù),就有必要進行抽樣或者在其他已經獲得的分層數(shù)據中進行估算。如果估算才能盡可能的反映真實的Gini系數(shù),成為今天學術界關注的一個焦點問題,重慶市近年來提出在努力提高GDP的前提下,重點控制好Gini系數(shù),并把Gini系數(shù)作為城市經濟發(fā)展的重要指標進行定期監(jiān)測,這又提出了如果適時動態(tài)的根據抽樣或分層數(shù)據計算Gini系數(shù)的問題。
我國對國民的收入統(tǒng)計分農村和城鎮(zhèn)居民分別統(tǒng)計,因此只能分別計算出各自的基尼系數(shù),好在R.M.Sundrum在文獻[5]中提出分類計算基尼系數(shù)的如下公式:
其中,G1和G2分別表示基于農村居民和城鎮(zhèn)居民的Gini系數(shù);P1和P2分別表示農村居民和城鎮(zhèn)居民占總人口的比例;μ,μ1和μ2分別為全體居民的人均收入,農村居民人均收入和城鎮(zhèn)居民人均收入。這樣只要能分別得到城鎮(zhèn)居民和農村人口的分類基尼系數(shù),不難獲得我國的基尼系數(shù)。
表1和表2是歷年來中國統(tǒng)計年鑒公布的相關數(shù)據。
從表中可以看出最高收入的10%城鎮(zhèn)人口2000年占比不過20.5,約1/5強,到2009年已經占到25.4,超過1/4了,財富有向富人集聚的明顯趨勢。2011年以來,由于創(chuàng)業(yè)板和中小板的瘋狂造富運動,財富進一步向富人集中的趨勢在加快。
相對而言,農村居民收入各個層次變化不甚明顯。但20%的富人占有40%以上的財富無論農村還是城鎮(zhèn)都是一樣的。
國家統(tǒng)計局局長馬建堂直言不諱的指出,高收入者目前還缺乏好的統(tǒng)計辦法,因此目前的統(tǒng)計數(shù)字應該還有較大的誤差,灰色收入很難統(tǒng)計。同樣,對于絕對貧困人口,如城鎮(zhèn)5%的困難戶,農村20%的最低收入者,也存在統(tǒng)計口徑問題。筆者通過大學申請補助的貧困生填寫的家庭收入情況登記表統(tǒng)計的結果是占大學生1/3的學生家庭2009年平均家庭人均收入僅2739元,遠低于公布的統(tǒng)計數(shù)字。而2011年這個數(shù)字下降到2456元,可見與富人收入越來越多相對照的是窮人的收入仍在下降,如果沒有獎學金等保障措施,供孩子讀書越來越不容易。
表1 城鎮(zhèn)居民平均每人全部年收入
表2 農村居民平均每人總收入
表3 城鎮(zhèn)居民逐年累計人口各個百分點上的累計收入對照表
表4 農村居民逐年累計人口各個百分點上的累計收入對照表
由于數(shù)據的原因我們無法通過公式(1)、(2)計算基尼系數(shù)。下面討論如何根據洛侖茲曲線計算歷年城鎮(zhèn)居民和農村居民的Gini系數(shù)。
顯然不能簡單的進行曲線擬合,考慮到人口比例和收入的現(xiàn)實情況,和最高收入比較,大部分人收入相對較低,因此曲線應該在開始階段走勢比較平緩,進入高收入區(qū)后應該相對陡峭,我們發(fā)現(xiàn)中心在縱軸正半軸上的橢圓曲線就很合適,也就是如下的模型:
剩下的問題是如何估計參數(shù)a和b以及檢驗模型的顯著性了,利用R軟件編制程序如下:
獲得的結果如下:
模型的檢驗是顯著的,我們由此得到2000年的洛侖茲曲線方程為:
下面的R程序可以畫出2000年城鎮(zhèn)居民收入累計洛侖茲曲線圖(圖1、2分別是2000~2009歷年城鎮(zhèn)居民收入的洛侖茲圖)。
圖1 2000年城鎮(zhèn)居民收入累計洛侖茲曲線圖
圖2 城鎮(zhèn)居民歷年收入累計洛侖茲曲線圖
plot(x,z0,type="l",main="2000年城鎮(zhèn)居民收入累計洛侖茲曲線圖",xlab="人口累計率",ylab="收入累計率")
這樣我們就能方便的計算出2000年的基尼系數(shù),程序如下:
計算結果為0.3225478 with absolute error<0.00012,從而基尼系數(shù)為1-2*0.3225478=0.3549,同樣使用模型(4)可以其他年份城鎮(zhèn)居民的基尼系數(shù)和農村居民的基尼系數(shù),列入表5、6。
表5 城鎮(zhèn)居民各年度基尼系數(shù)
表6 農村居民各年度基尼系數(shù)
由于農村基尼系數(shù)缺了2000和2010年的,我們通過時間序列的自回歸模型AR(4)進行內插,R程序如下:
運行結果為:
由此得到預測模型為:
下面根據公式(3)來計算全國的基尼系數(shù),對于農村居民收入,我們建議選擇純收入,而不是總收入,這與城鎮(zhèn)的收入具有可比性,計算均列入表5。
表5 全國居民收入基尼系數(shù)計算表
本文的結論表明,根據我們的經驗測算公式獲得的全國基尼系數(shù)比較符合實際。我國僅僅在2000年公布過基尼系數(shù),是0.412,而我們估計的結果是0.413,而到2009年,基尼系數(shù)已經是0.49了,這也與大多數(shù)學者的預測相符,相信2010和2011全國的基尼系數(shù)過0.5沒有懸念,這只需要把中國統(tǒng)計年鑒公布的相關數(shù)據帶入本文介紹的經驗測算公式就可以算出來,見表6。
表6 全國各年基尼系數(shù)一覽表
[1]C.Gini.Variabilità e Mutabilità,Bologna:Tipografia di Paolo Cuppini [Z].1912.
[2]H.Dalton.Measurement of the Inequality of Income[J].Economic Jour?nal,1920,(30).
[3]A.Sen.On Economic Inequality,Expanded Edition[M].Oxford:Oxford University Press,1997.
[4]D.G.Champernowne,F.A.Cowell.Economic Inequality and Income Distribution[M].Cambridge:Cambridge University Press,1998.
[5]R.M.Sundrum.Income Distribution in Less Developed Countries,First Published by Routledge[M].New York:Chapman and Hall,l990.