田垠
摘要:本文采用灰色預(yù)測和神經(jīng)網(wǎng)絡(luò)的組合預(yù)測模型預(yù)測未來兩年城鄉(xiāng)居民收入差距。利用Adaptive-Lasso估計方法,得出就業(yè)率和經(jīng)濟(jì)實力是影響城鄉(xiāng)居民收入差距的關(guān)鍵因素,它們之間存在高度正相關(guān)關(guān)系。預(yù)測結(jié)果表明:我國城鄉(xiāng)居民收入差距在未來兩年會持續(xù)增長,因此現(xiàn)階段建議降低失業(yè)率,加強財政對農(nóng)村社會保障和教育支出,縮小城鄉(xiāng)居民收入差距。
關(guān)鍵詞:收入差距;Adaptive-Lasso估計;灰色預(yù)測;神經(jīng)網(wǎng)絡(luò);預(yù)測
引言
自上世紀(jì)八十年代以來,我國經(jīng)濟(jì)快速增長,人民的生活水平極速提升。但隨著經(jīng)濟(jì)快速發(fā)展,社會公平問題日益突出,城鄉(xiāng)居民之間收入差距的擴(kuò)大就是證明。我國現(xiàn)已從一個國民收入相對平均的經(jīng)濟(jì)體變成財富分配很不均勻的經(jīng)濟(jì)體。1978年,中國城鄉(xiāng)居民人均可支配收入分別為343.4元和133.6元,城鄉(xiāng)居民收入差距為209.8元。到2013年,兩者之間的差距擴(kuò)大到了18059.2元。相比于1978年,翻了85倍之多[1]。城鄉(xiāng)收入差距過大不僅意味著農(nóng)村居民不能和城鎮(zhèn)居民一樣享有改革開放帶來的同等成果,同時,它對中國當(dāng)前社會的穩(wěn)定和構(gòu)建和諧社會造成了一定威脅。因此,分析預(yù)測好未來城鄉(xiāng)居民收入差距,對于維護(hù)中國社會經(jīng)濟(jì)的健康發(fā)展以及整個和諧社會的構(gòu)建都具有重要的理論和現(xiàn)實意義。
而目前,針對城鄉(xiāng)居民收入差距這一問題,大多數(shù)學(xué)者采用的是ARMA模型來進(jìn)行建模與預(yù)測分析,但近年來也有不少學(xué)者采用灰色模型等其他方式進(jìn)行預(yù)測。我國學(xué)者張桂齡通過ARMA模型對1974-2014年城鄉(xiāng)收入差距進(jìn)行擬合和預(yù)測,認(rèn)為應(yīng)通過調(diào)整農(nóng)業(yè)結(jié)構(gòu),對農(nóng)產(chǎn)品實行保護(hù)價格等行為減少城鄉(xiāng)收入差距[2];兩位副教授呂艷麗和陳兵建也用ARMA模型分析和預(yù)測了甘肅省的收入差距[3];涂雄苓采用ARIMA模型、灰色模型和二次多項式模型三種建模方式進(jìn)行預(yù)測,通過使用具有最低平均相對誤差絕對值(MAPE)的二次多項式預(yù)測模型來執(zhí)行二期預(yù)測,給出相應(yīng)建議[4];張藝則是直接采用灰色預(yù)測GM(1,1)模型對河北省收入差距進(jìn)行預(yù)測并提出建議[5]。他們都是采用單個模型對城鄉(xiāng)居民收入差距進(jìn)行預(yù)測并分析建議,暫時還沒有學(xué)者嘗試用組合模型對我國城鄉(xiāng)居民收入差距進(jìn)行預(yù)測。筆者基于1995-2017年中國城鄉(xiāng)居民收入差距的數(shù)據(jù),建立灰色預(yù)測模型與人工神經(jīng)網(wǎng)絡(luò)的組合預(yù)測模型,得到我國城鄉(xiāng)居民收入差距的預(yù)測值。
1、模型設(shè)定與指標(biāo)選擇
1.1模型概述
近年來,Lasso被廣泛應(yīng)用于參數(shù)估計和變量選擇,使用Lasso進(jìn)行變量選擇已被證明在確定的條件下是一致的。Lasso最初由Robert Tibshirani于1996年提出,它是一種正則化方法,可同時執(zhí)行參數(shù)估計與變量選擇。Lasso參數(shù)估計的定義如下:
由于Lasso方法的運用具有需要滿足一定的苛刻條件的缺點,因此Zou給不同的系數(shù)賦予不同的權(quán)重,就此提出了一種改進(jìn)的Lasso方法,這種改進(jìn)的方法被稱為Adaptive-Lasso方法,定義如下:
最小二乘法得出的系數(shù)。
設(shè)一組非負(fù)單調(diào)原始數(shù)據(jù)序列為X(o)={X(0)(i),i=1,2...,n},對變量X(0)建立灰色預(yù)測模型,過程如下:
首先對變量X(O)進(jìn)行一次累加,得到X(O)的一次累加序列X(1)={X(1)(k)=1'2...,n}。
為X(l)建立一階線性微分方程,如下所示:
該微分方程即為GM(1,1)模型。
求解微分方程(3),可得到預(yù)測模型:
鑒于GM(1,1)模型得到的為一次累加量,將GM(1,1)模型計算所得數(shù)據(jù)X(1)(k+1)經(jīng)過累減還原為X(o)@+1),即X(O)的灰色預(yù)測模型為:
后驗差檢驗?zāi)P途缺砣绫?所示。
在本文中,我們使用Adaptive-Lasso估計來選擇變量,使用灰色預(yù)測模型對Adaptive-Lasso估計所選定的單個影響因素進(jìn)行預(yù)測,得到城鄉(xiāng)居民收入差距在2018年-2019年的預(yù)測值。為了使預(yù)測結(jié)果具有較強的適用性和容錯能力,建立了歷史數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型,將灰色預(yù)測得到的預(yù)測結(jié)果輸入神經(jīng)網(wǎng)絡(luò)模型中,得到結(jié)果。
預(yù)測模型過程的步驟如下:
(1)收集到與城鄉(xiāng)居民收入差距相關(guān)數(shù)據(jù);
(2)利用(1)形成的已完成數(shù)據(jù)預(yù)處理的建模數(shù)據(jù),建立Adaptive-Lasso變量選擇模型;
(3)在(2)的基礎(chǔ)上,建立單變量的灰色預(yù)測模型和人工神經(jīng)網(wǎng)絡(luò)預(yù)測模型;
(4)利用(3)的預(yù)測值代人人工神經(jīng)網(wǎng)絡(luò)模型中以獲得預(yù)測值。
1.2數(shù)據(jù)來源說明
從《中國統(tǒng)計年鑒》中得到1995-2015年我國城鎮(zhèn)居民人均可支配收入和農(nóng)村居民人均可支配收入,從我國財政報告中,可以找出2016-2017年我國城鎮(zhèn)居民人均可支配收入和農(nóng)村居民人均可支配收入,它們之間的差值是我國城鄉(xiāng)居民收入差距數(shù)據(jù),用y表示(表2)。
在查閱文獻(xiàn)以及經(jīng)濟(jì)學(xué)理論對其的解釋,共選取以下因素為影響城鄉(xiāng)居民收入差距(y)的自變量。
貿(mào)易依存度(Xl):根據(jù)基于要素稟賦理論的Stolpa-Samuelson定理,對外貿(mào)易會通過改變產(chǎn)品價格影響要素價格,從而影響一個國家的收入分配。為當(dāng)年的進(jìn)出口總額與當(dāng)年的GDP比值。
貿(mào)易順差(X2):出口總額與進(jìn)口總額的比值。
城鎮(zhèn)化(X3):城鎮(zhèn)人口占總?cè)丝诘谋嚷省?/p>
就業(yè)率(X4):城鎮(zhèn)就業(yè)人口占總就業(yè)人口的比率
經(jīng)濟(jì)實力(X5):財政總收入。
社會衛(wèi)生占比(X6):衛(wèi)生總費用占GDP的比值。
第一產(chǎn)業(yè)比重(X7):第一產(chǎn)業(yè)增量占GDP的比值。
第二產(chǎn)業(yè)比重(X8):第二產(chǎn)業(yè)增量占GDP的比值。
第三產(chǎn)業(yè)比重(X9):第三產(chǎn)業(yè)增量占GDP的比值。
根據(jù)以上描述,獲得最終變量數(shù)據(jù),如表3所示。
1.3主要變量分析
首先,對主要變量進(jìn)行描述性統(tǒng)計分析,以獲得對數(shù)據(jù)的整體理解。表4給出了主要變量的描述性統(tǒng)計結(jié)果。由表可見,城鄉(xiāng)居民收入(y)的均值和標(biāo)準(zhǔn)差分別為10660.19和6753.67。這說明我國城鄉(xiāng)居民收入差距存在較大差異。
注:Min為最小值,Max為最大值,Mean為均值,SD為標(biāo)準(zhǔn)差。
相關(guān)系數(shù)可用于來描述定量變量之間的關(guān)系,初步判定因變量和解釋變量之間是否存在線性相關(guān)。變量的Pearson相關(guān)系數(shù)矩陣如表5所示。
由表5可知,貿(mào)易依存度(xl)與城鄉(xiāng)居民收入的線性關(guān)系十分不顯著,而貿(mào)易順差(x2)與城鄉(xiāng)居民收入線性關(guān)系不顯著。其余變量中,除第一產(chǎn)業(yè)比重(x7)和第二產(chǎn)業(yè)比重(x8)與城鄉(xiāng)居民收入呈負(fù)相關(guān)之外,其余與城鄉(xiāng)居民收入高度正相關(guān)。
運用LARS算法進(jìn)行公式(2)的Adaptive-Lasso估計,LARS算法中對于每一個Y,都有一個最優(yōu)的λn與其對應(yīng)。本文取Y=l,計算結(jié)果如表6所示。
由表6可以看出,貿(mào)易依存度、貿(mào)易順差、城鎮(zhèn)化、社會衛(wèi)生占比、第一產(chǎn)業(yè)比重、第二產(chǎn)業(yè)比重與第三產(chǎn)業(yè)比重等因素的系數(shù)均為O,這說明在模型構(gòu)建過程中這幾個變量被剔除了。這是因為貿(mào)易依存度和貿(mào)易順差屬于進(jìn)出口方面因素,對國內(nèi)城鄉(xiāng)收入的影響十分小,對收入差距的影響更是微乎其微;城鎮(zhèn)化與城鄉(xiāng)居民收入存在明顯的共線性,因此在模型構(gòu)建中剔除了這個變量;在我國農(nóng)村醫(yī)保的大力實行的政策下,我們可以認(rèn)為社會衛(wèi)生對城鎮(zhèn)和農(nóng)村的影響是一樣大的;同理我們可以推斷地一、二、三產(chǎn)業(yè)增量對城鄉(xiāng)收入差距的影響一致,因此被剔除。上述結(jié)論體現(xiàn)了Adaptive-Lasso方法在構(gòu)建模型時,不僅能夠識別并剔除存在高度共線性關(guān)系的變量,同時還具有對同時多指標(biāo)進(jìn)行建模的優(yōu)勢。
綜上所述,影響城鄉(xiāng)收入差距的關(guān)鍵因素是就業(yè)率、經(jīng)濟(jì)實力。
2、城鄉(xiāng)居民收入預(yù)測
通過以上分析,得出就業(yè)率和經(jīng)濟(jì)實力是影響城鄉(xiāng)居民收入的關(guān)鍵因素。針對這兩個因素建立灰色預(yù)測與神經(jīng)網(wǎng)絡(luò)的組合預(yù)測模型,參數(shù)設(shè)置如下:誤差精度△t=10-7,學(xué)習(xí)次數(shù)n=10000次,神經(jīng)元個數(shù)為2。通過灰色預(yù)測模型計算得出就業(yè)率(x4)、經(jīng)濟(jì)實力(x5)在2018年及2019年的預(yù)測值,如表7所示,可知灰色預(yù)測模型得到的預(yù)測值具有很好的預(yù)測精度。
代入所建立的神經(jīng)網(wǎng)絡(luò)預(yù)測模型,得到城鄉(xiāng)收入差距真實值與預(yù)測值的對比圖,如圖1所示。由該圖可以看出,使用灰色預(yù)測和神經(jīng)網(wǎng)絡(luò)的組合預(yù)測模型具有一致性。
3、結(jié)論
本文利用Adaptive-Lasso變量選擇方法以及灰色預(yù)測和神經(jīng)網(wǎng)絡(luò)模型對我國城鄉(xiāng)收入差距及其影響值進(jìn)行分析與預(yù)測,預(yù)測結(jié)果表明,未來兩年內(nèi),我國城鄉(xiāng)居民收入差距將持續(xù)增加,且增長幅度較高。同時我國財政收入和就業(yè)率對縮減城鄉(xiāng)收入差距有好的影響,與城鄉(xiāng)收入差距呈高度正相關(guān)。由以上結(jié)論我們可以提出下面建議。
強化政府公共服務(wù),協(xié)調(diào)資源,努力為社會成員提供平等發(fā)展的機會,改善公民福利,促進(jìn)社會公平;通過打破行業(yè)壟斷,穩(wěn)定壟斷行業(yè)與一般行業(yè)人員收入差距,減小收入差距;建議從民間角度調(diào)整居民收入分配,努力提高低收入群體的收入水平。
還要加大對農(nóng)村、農(nóng)民的支持力度,提高其收入水平??s小城鄉(xiāng)收入差距的重點在于提高農(nóng)民收入,而農(nóng)民收入差距過大的原因在于區(qū)域間經(jīng)濟(jì)發(fā)展的不平衡,因此需要完善收入分配體制,給予農(nóng)村更多的政策支持。
參考文獻(xiàn):
[1]郭小東,付升華.社會保護(hù)底線支出、城鎮(zhèn)偏好與城鄉(xiāng)居民收入差距[J].社會保障研究,2017,02:95-105.
[2]張桂齡.基于ARMA模型對我國城鄉(xiāng)居民收入差距的分析與預(yù)測[J].經(jīng)營管理者,2017,20:66-67.
[3]呂艷麗,陳兵建.基于ARMA模型的城鄉(xiāng)居民收入差距分析與預(yù)測——以甘肅為例[J].商業(yè)經(jīng)濟(jì)研究,2017,2:204-206
[4]涂雄苓.我國城鄉(xiāng)居民收入差距預(yù)測模型比較研究[J].安徽農(nóng)業(yè)科學(xué),2011.39(24):57-59,62.
[5]張藝.基于灰色預(yù)測法的河北省城鄉(xiāng)居民收入的分析與預(yù)測[J].商,2015,28:197,188.
[6]霍炳男.中國城鄉(xiāng)居民收入差距影響因素的實證檢驗[J].統(tǒng)計與決策,2017,4(427):110- 112.
[7]馬斌,張富饒,城鄉(xiāng)居民收入差距影響因素實證分析[J].中國農(nóng)村經(jīng)濟(jì),2008,2:53-59.
[8]魏發(fā)凡.我國城鄉(xiāng)居民收入差距的影響因素分析[J].改革與開放,2010,7(298):4-6
[9]喻勝華,張靜.基于Lasso和BP神經(jīng)網(wǎng)絡(luò)的組合預(yù)測及其應(yīng)用——以居民消費支出預(yù)測為例[J].財經(jīng)理論與實,2016,39:123-128.
[10]薛嘉春,韓建雨.我國居民收入差距發(fā)展趨勢研究——基于ARIMA模型的預(yù)測分析[J].當(dāng)代經(jīng)濟(jì)研究,2011,12:79-84.
[11]龔承剛,王夢,謝航.基于ARIMA模型的湖北省城鄉(xiāng)居民收入差距的預(yù)測統(tǒng)計與決策[J].2014,15:94-97.
[12]張良均,云偉標(biāo),王路,劉曉勇.R語言數(shù)據(jù)分析與挖掘?qū)崙?zhàn)[M]北京:機械工業(yè)出版社,2015