杜文超,劉亞相
(西北農(nóng)林科技大學(xué) 理學(xué)院,陜西 楊凌 712100)
新Lorenz曲線模型及應(yīng)用
杜文超,劉亞相
(西北農(nóng)林科技大學(xué) 理學(xué)院,陜西 楊凌 712100)
Lorenz曲線作為分析國(guó)家收入分配狀況的重要工具,近年來(lái)得到廣大學(xué)者的關(guān)注和廣泛應(yīng)用。文章提出了新的Lorenz曲線模型,通過(guò)Monte Carlo數(shù)值模擬及實(shí)際應(yīng)用分析,并與十個(gè)經(jīng)典的Lorenz曲線模型作對(duì)比,來(lái)說(shuō)明新模型的優(yōu)越性和合理性。
Lorenz曲線;新模型;數(shù)值模擬;實(shí)際應(yīng)用
在經(jīng)濟(jì)學(xué)研究領(lǐng)域,Lorenz曲線是分析國(guó)民收入和財(cái)富分配狀況的重要工具,并受到廣泛應(yīng)用。Lorenz曲線首先由Max Otto Lorenz提出,隨后受到許多學(xué)者的關(guān)注。目前,Lorenz曲線模型的建立主要有3種方法:幾何算法、曲線擬合法和分布函數(shù)法。本文討論的內(nèi)容屬于曲線擬合法,基于前人的研究,根據(jù)Lorenz曲線所具有的性質(zhì),構(gòu)造了新的Lorenz曲線模型。
1.1 orenz曲線的定義
Lorenz曲線L(p)表示的是收入小于或等于x的人口所擁有的收入占總收入的比例,即:
其中,μ是平均收入,x表示收入,f(x)是收入分配的密度函數(shù)。記收入分布函數(shù)為F(x),p=F(x)表示收入小于或等于x的人口比例,F(xiàn)-1(p)表示F(x)的反函數(shù),那么Lorenz曲線還可以表示為:
1.2 Lorenz曲線的性質(zhì)
由定義可知Lorenz曲線L(p)具有如下性質(zhì),
性質(zhì)1也是使函數(shù)L() p成為L(zhǎng)orenz曲線的充分必要條件。1999年Jose-Maria Sarabia等人研究了Lorenz曲線的衍生模型,提出如下性質(zhì):
性 質(zhì)2:若 L(p )是 一 個(gè)Lorenz曲 線 ,考 慮Lα(p)=pαL(p),α≥0,
當(dāng)α≥1時(shí),Lα(p)是一個(gè)Lorenz曲線;
當(dāng)0<α≤1,且L?(p)≥0時(shí),Lα(p)是一個(gè)Lorenz曲線。
2011年,王祖祥等人在Sarabia等人研究的基礎(chǔ)上,進(jìn)一步分析了Lorenz曲線,擴(kuò)充了Lorenz曲線的性質(zhì),提出性質(zhì)3。
性質(zhì)3:假設(shè) f(p)和g(p)都是Lorenz曲線。那么L(p)=f(p)αg(p)υ也是Lorenz曲線,只要下面任一條件成立:
①α≥1,υ≥1;
[ ]
0,1上遞增;
1.3 新模型的構(gòu)建
Kakwani和Podder(1923)提出了較早的Lorenz曲線模型:
隨后,Rasche et al(1980)、Gupta(1984)、Chotikapanich(1993)、Jose-Maria Sarabia和Enrique Castillo(1997)相繼提出如下Lorenz曲線的經(jīng)典模型:
2009年,Wang等人根據(jù)Schader和Schmid于1994年提出的模型
在模型(7)的基礎(chǔ)上用e-γp替換了ηpγ,提出了如下模型:
并指出該模型比基于Pareto分布而得到的Lorenz曲線基礎(chǔ)模型:
具有更高的擬合精度。此外,國(guó)內(nèi)外學(xué)者還提出了許多衍生的Lorenz曲線模型,例如:
本文利用Lorenz曲線的性質(zhì),基于前人提出的基礎(chǔ)模型,構(gòu)造了如下四個(gè)新模型:
令f(p)=1-e-ap(1 -p)b,g(p)=1-(1-p)c。則當(dāng)0<b≤1,0≤a+b≤時(shí),f(p)為L(zhǎng)orenz曲線模型(8)且f?(p)≥0;當(dāng)0<c≤1時(shí),g(p)為L(zhǎng)orenz曲線基礎(chǔ)模型(10);當(dāng)0<c≤1,d≥1時(shí),g(p)d為L(zhǎng)orenz曲線模型(5)。由 Lorenz曲線的性質(zhì) 1可知,當(dāng) 0<b≤1,0≤a+b≤, 0<c≤1 時(shí) , 均 有f′(p)≥0,f″(p)≥0,g′(p)≥0,g″(p)≥0,進(jìn)而當(dāng)m∈[0 ,1]時(shí)有 L11′(p)≥0,L11′(p)≥0,p∈[0 ,1] 。且 L11(p)滿足L11(0)=0,L11(1)=1。故L11(p)為L(zhǎng)orenz曲線模型。同理可知當(dāng)0<b≤1,0≤a+b≤,0<c≤1,d≥1,m∈[0 ,1]時(shí),L12(p)也為L(zhǎng)orenz曲線模型。再根據(jù)性質(zhì)3可得,當(dāng)0<b≤1,0≤a+b≤,0<c≤1,d≥1時(shí),L13(p)為L(zhǎng)orenz曲線模型;當(dāng)0<b≤1,0≤a+b≤,0<c≤1,d≥1時(shí),L(p)也為L(zhǎng)orenz曲線模型。14
基于Monte Carlo數(shù)值模型,對(duì)本文提出的四個(gè)Lorenz曲線新模型與已有的十個(gè)經(jīng)典Lorenz曲線模型的擬合結(jié)果進(jìn)行對(duì)比,來(lái)表明其擬合效果。
成邦文(2005)指出,社會(huì)經(jīng)濟(jì)規(guī)模指標(biāo)近似服從對(duì)數(shù)正態(tài)分布。由此,本文假定收入變量X~lnN(μ ,σ),F(xiàn)(x)為X的分布函數(shù),則Lorenz曲線上任一點(diǎn)所對(duì)應(yīng)的橫坐標(biāo)滿足p=F(x),且Lorenz曲線滿足L(p)=Φ(Φ-1(p)-σ),其中Φ與Φ-1分別表示標(biāo)準(zhǔn)正態(tài)分布函數(shù)及其逆函數(shù)。由Lorenz曲線與收入分布函數(shù)之間關(guān)系,利用Monte Carlo數(shù)值模擬方法,生成服從對(duì)數(shù)正態(tài)分布的隨機(jī)數(shù),再分別計(jì)算收入分布函數(shù)值及Lorenz曲線函數(shù)值,進(jìn)而估計(jì)Lorenz曲線模型。
本文采用最常用的三個(gè)指標(biāo)來(lái)比較擬合效果:均方根誤差(RMSE)、平均絕對(duì)誤差(MAE)以及最大絕對(duì)誤差(MAS)。為使得模擬結(jié)果不失一般性,本文取μ=0,σ=1,模擬100次,結(jié)果如圖1至圖3所示。圖1至圖3分別給出了模型L1~L14擬合效果指標(biāo)RMSE、MAE、MAS的箱線圖。在圖中,箱線圖的高低代表了模型擬合誤差的大小,箱體觸須的長(zhǎng)短則代表了模型擬合效果的穩(wěn)定程度。在圖1中,本文提出的模型L14擬合效果最好,其次為L(zhǎng)12、L13和L7;在圖2中,L14仍表現(xiàn)最佳,其次為L(zhǎng)12和L13;在圖3中,模型L14要較之其他模型有明顯的優(yōu)勢(shì),其次為L(zhǎng)12和L13。綜合圖1至圖3,可以看出本文提出的模型L14具有非常好的擬合效果,并且擬合結(jié)果穩(wěn)定;其次,本文提出的模型L12、L13相較于已有模型也具有較好的擬合效果,L11略次之。
圖1 均方根誤差箱線圖
圖2 平均絕對(duì)誤差箱線圖
圖3 最大絕對(duì)誤差箱線圖
本文選用2013年第十屆華為杯全國(guó)研究生數(shù)學(xué)建模競(jìng)賽“中等收入定位與人口度量模型研究”中的數(shù)據(jù)來(lái)檢驗(yàn)?zāi)P蛯?shí)用性。本文所使用的原始數(shù)據(jù)見(jiàn)表1至表3所示。其中,競(jìng)賽E題表1收入分配分組數(shù)據(jù)用來(lái)比較新模型與已有模型的擬合效果;表2和表3收入分配分組數(shù)據(jù)則用來(lái)檢驗(yàn)新模型對(duì)Lorenz曲線的描述能力。
表1 收入分配分組數(shù)據(jù)
表2 收入分配分組數(shù)據(jù)(地區(qū)A,年份之一)
表3 收入分配分組數(shù)據(jù)(地區(qū)A,年份之二)
3.1 擬合效果比較
運(yùn)用Lorenz曲線模型L1(p)~L14(p)分別對(duì)競(jìng)賽E題中的表1收入分配分組數(shù)據(jù)進(jìn)行擬合,擬合效果如表4所示。從表中可以看出,擬合效果最好的為本文提出的四個(gè)模型L11(p)、L12(p)、L13(p)、L14(p),并且相較于已有模型,具有明顯的優(yōu)越性,其中L14(p)表現(xiàn)最佳,誤差最小。
表4 Lorenz曲線模型擬合結(jié)果
3.2 新模型實(shí)際應(yīng)用
為更好地說(shuō)明新模型的優(yōu)越性和合理性,本文選用L12(p)和L14(p)模型對(duì)競(jìng)賽E題中表2和表3收入分配分組數(shù)據(jù)進(jìn)行擬合,從而檢驗(yàn)新模型的實(shí)用性及對(duì)Lorenz曲線的描述能力。
L12(p)、L14(p)對(duì)地區(qū)A在年份一和年份二的收入分配分組數(shù)據(jù)擬合效果如圖4和圖5所示,其中黑色實(shí)線是真實(shí)Lorenz曲線,黑色虛線是模型擬合的Lorenz曲線。
圖4 地區(qū)A在 L12(p)模型下擬合的Lorenz曲線
從圖4和圖5中可以看出L12(p)與L14(p)模型擬合出的Lorenz曲線幾乎與真實(shí)Lorenz曲線完全重合。在圖4中,新模型L12(p)對(duì)年份一和年份二數(shù)據(jù)的擬合都表現(xiàn)出當(dāng)p=0.7至p=0.9時(shí)誤差變大,該模型低估了高分位點(diǎn)的總收入比重,因此由該模型計(jì)算的Gini系數(shù)將比真實(shí)值偏大。在圖5中,新模型L14(p)對(duì)數(shù)據(jù)的擬合也出現(xiàn)了低估高分位點(diǎn)總收入比重的情況;在年份一中,當(dāng)p處于0.8附近時(shí),該情況表現(xiàn)明顯;在年份二中,該情況得到明顯的改觀,擬合曲線幾乎完全逼近真實(shí)曲線。總體來(lái)說(shuō),新模型L12(p)和L14(p)均具有很好的擬合效果,都能夠幾乎準(zhǔn)確的表現(xiàn)真實(shí)Lorenz曲線,其中L14(p)表現(xiàn)更好,誤差更小。
圖5 地區(qū)A在L14(p)模型下擬合的Lorenz曲線
本文利用Lorenz曲線的性質(zhì),在前人研究的基礎(chǔ)上,提出了四個(gè)新Lorenz曲線模型,通過(guò)數(shù)值模擬和實(shí)際應(yīng)用,新模型較之已有模型,表現(xiàn)出明顯的優(yōu)越性和有效性,新模型能很好的逼近真實(shí)Lorenz曲線,更加精確地描述真實(shí)Lorenz曲線,反映收入分布狀況。新模型對(duì)于計(jì)算Gini系數(shù)以及更深一步的研究,具有很好的利用價(jià)值和參考意義。
[1]Ogwang J,Rao U L G.Hybrid Models of the Lorenz Curve[J].Econom?ics Letters,2000,(69).
[2]Sarabia J M,Castillo E,Pascual M,et al.Mixture Lorenz Curves[J].Eco?nomics Letters,2005,(89).
[3]Wang Z X,Ng Y K,Smyth R.A General Method for Creating Lorenz Curves[J].Review of Income and Wealth,2011,57(3).
[4]Wang Z X,Smyth R.A Hybrid Method for Creating Lorenz Curves[J]. Economics Letters,2015,(129).
[5]許啟發(fā).一個(gè)新的Lorenz曲線模型[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究, 2014,(11).
[6]成邦文.基于對(duì)數(shù)正態(tài)分布的洛倫茲曲線與基尼系數(shù)[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2005,(2).
[7]楊寶瑩.廣義Lorenz曲線的非參數(shù)統(tǒng)計(jì)推斷[J].中國(guó)科學(xué):數(shù)學(xué), 2012,(3).
(責(zé)任編輯/浩 天)
F222.3
A
1002-6487(2016)23-0077-03
杜文超(1991—),女,黑龍江伊春人,碩士研究生,研究方向:居民收入分配及消費(fèi)。
(通訊作者)劉亞相(1962—),男,陜西寶雞人,博士,教授,研究方向:博弈論、金融數(shù)學(xué)、經(jīng)濟(jì)數(shù)學(xué)。