黨鑫鑫 周麗娟 王康權(quán)
(廣西科技大學(xué) 理學(xué)院,廣西 柳州 545006)
近年來(lái),中國(guó)經(jīng)濟(jì)保持中高速發(fā)展,2018年全國(guó)GDP增長(zhǎng)率達(dá)到了6.6%,河南省高出國(guó)家平均水平1個(gè)百分點(diǎn),達(dá)到了7.6%。在中原崛起的背景下,河南省經(jīng)濟(jì)發(fā)展得到越來(lái)越多人的關(guān)心,在經(jīng)濟(jì)發(fā)展、工業(yè)化建設(shè)過(guò)程中,一些地區(qū),如鄭州、洛陽(yáng)等得到非常優(yōu)越的發(fā)展機(jī)會(huì)與條件,而一些經(jīng)濟(jì)水平相對(duì)較低的地區(qū)受到忽視,因此可能會(huì)導(dǎo)致省內(nèi)各地區(qū)之間發(fā)展不平衡的現(xiàn)象,其中最為人們關(guān)注的是居民收入影響因素。因此,有必要對(duì)河南省城鎮(zhèn)居民人均可支配收入的影響因素進(jìn)行測(cè)度。本文實(shí)證分析了影響城鎮(zhèn)居民人均可支配收入的主要因素,對(duì)河南省經(jīng)濟(jì)健康發(fā)展具有一定意義。
在已有的眾多文獻(xiàn)中,國(guó)內(nèi)學(xué)者陳懋昕和鄧霓冉[1]以蘇州市城鎮(zhèn)居民為例,搜集蘇州市城鎮(zhèn)常住居民人均可支配收入從1989年到2018年的時(shí)間序列數(shù)據(jù),以蘇州市城鎮(zhèn)常住居民人均可支配收入為例,除了建立單個(gè)預(yù)測(cè)模型外,并與其他兩個(gè)單一模型在MSE、SDE、MPAE三個(gè)指標(biāo)上進(jìn)行比較,選用組合預(yù)測(cè)模型作為蘇州城鎮(zhèn)常住居民人均可支配收入的預(yù)測(cè)工具,可以進(jìn)一步推廣到蘇州以外城市的居民人均可支配收入的預(yù)測(cè)。肖枝洪和馬澤巍等[2]針對(duì)1999—2018年中國(guó)31個(gè)省區(qū)市的城鎮(zhèn)居民人均可支配收入,提出一種函數(shù)型數(shù)據(jù)聚類方法,聚類結(jié)果表明:中國(guó)城鎮(zhèn)居民人均可支配收入呈不斷增長(zhǎng)的趨勢(shì)。聶燕萍和張懌洵等[3]在互聯(lián)網(wǎng)全面普及和迅猛發(fā)展的背景下,基于我國(guó)2013—2019年城鎮(zhèn)居民人均可支配收入和天貓雙十一銷售額的數(shù)據(jù),運(yùn)用SPSS軟件研究我國(guó)城鎮(zhèn)居民人均可支配收入和天貓雙十一銷售額的關(guān)系,建立了二者之間的回歸方程。結(jié)果表明城鎮(zhèn)居民人均可支配收入和天貓雙十一銷售額具有顯著的正相關(guān)關(guān)系。賀彥煜和王宇[4]以近17年來(lái)新疆居民消費(fèi)為研究對(duì)象,通過(guò)多元線性回歸模型的統(tǒng)計(jì)檢驗(yàn)、經(jīng)濟(jì)意義檢驗(yàn)和顯著性檢驗(yàn),建立適合新疆城鎮(zhèn)居民消費(fèi)的模型,得出新疆居民消費(fèi)現(xiàn)狀和相關(guān)影響因素。
國(guó)內(nèi)學(xué)者田玲和孫寧等[5]基于中國(guó)1990—2015年的地震損失數(shù)據(jù),論證了當(dāng)置信度不夠高時(shí),半?yún)?shù)分位數(shù)回歸法的預(yù)測(cè)效果略好于單純使用該方法選取節(jié)點(diǎn)并使用所選節(jié)點(diǎn)進(jìn)行常規(guī)分位數(shù)回歸法的預(yù)測(cè)效果。金林和劉洪[6]在介紹非參數(shù)回歸方法的基礎(chǔ)上,對(duì)1953—2010年中國(guó)財(cái)政收入增長(zhǎng)速度和GDP名義增長(zhǎng)率之間的關(guān)系進(jìn)行了非參數(shù)回歸。回歸結(jié)果表明:GDP名義增長(zhǎng)率取值在比較正常的范圍(0%—20%)內(nèi)時(shí),財(cái)政收入增長(zhǎng)速度和GDP名義增長(zhǎng)率之間近似于線性關(guān)系;超出這個(gè)范圍,二者之間的關(guān)系具有非線性關(guān)系。楊麗徙和張永鋒等[7]為了融合參數(shù)模型和非參數(shù)模型的優(yōu)點(diǎn),對(duì)半?yún)?shù)回歸模型在電力負(fù)荷預(yù)測(cè)中的應(yīng)用進(jìn)行了探究。在原始數(shù)據(jù)預(yù)處理的基礎(chǔ)上,運(yùn)用相關(guān)性分析理論確定了半?yún)?shù)模型中的參數(shù)與非參數(shù)變量,構(gòu)建了半?yún)?shù)回歸模型;利用兩階段最小二乘法和權(quán)重系數(shù)法對(duì)回歸系數(shù)和回歸參數(shù)進(jìn)行了估計(jì)。結(jié)果表明:半?yún)?shù)回歸分析法具有較高的負(fù)荷預(yù)測(cè)精度和較廣泛的適用范圍。
以往文獻(xiàn),很少有利用半?yún)?shù)回歸模型探究影響城鎮(zhèn)居民人均可支配收入因素的研究,本文首次將半?yún)?shù)模型運(yùn)用于對(duì)城鎮(zhèn)居民收入的研究,通過(guò)篩選對(duì)城鎮(zhèn)居民人均可支配收入影響最大的因素,建立這些因素與城鎮(zhèn)居民人均可支配收入的回歸模型。
本文的相關(guān)數(shù)據(jù)來(lái)源于河南省統(tǒng)計(jì)局網(wǎng)站,相關(guān)缺失數(shù)據(jù)的處理方法為統(tǒng)計(jì)學(xué)中常用的均值填補(bǔ)方法。
本文中各個(gè)自變量的選擇標(biāo)準(zhǔn)根據(jù)河南省城鎮(zhèn)發(fā)展現(xiàn)狀,以及筆者對(duì)相關(guān)文獻(xiàn)[9]的總結(jié)、篩選得出。選取影響城鎮(zhèn)居民人均可支配收入的指標(biāo)為:河南地區(qū)生產(chǎn)總值、全社會(huì)固定資產(chǎn)投資總額、社會(huì)消費(fèi)品零售總額、進(jìn)出口總額、保險(xiǎn)公司保費(fèi)收入、產(chǎn)業(yè)結(jié)構(gòu)、普通高等學(xué)校數(shù)、規(guī)模以上工業(yè)企業(yè)利潤(rùn)總額、發(fā)電量。被解釋變量為河南省城鎮(zhèn)居民人均可支配收入。
1.描述性統(tǒng)計(jì)
表1中x1表示河南地區(qū)生產(chǎn)總值,x2表示全社會(huì)總固定資產(chǎn)投資總額,x3表示社會(huì)消費(fèi)品零售總額,x4表示進(jìn)出口總額,x5保險(xiǎn)公司保費(fèi)收入,x6表示河南省產(chǎn)業(yè)結(jié)構(gòu),x7表示普通高等學(xué)校數(shù),x8表示規(guī)模以上工業(yè)企業(yè)利潤(rùn)總額,x9表示發(fā)電量(詳見表1)。
表1 各變量因子的描述性統(tǒng)計(jì)
2.LASSO算法變量選擇過(guò)程分析
LASSO算法通過(guò)構(gòu)造懲罰函數(shù)得到一個(gè)較為精煉的模型,并通過(guò)對(duì)變量賦予不同的權(quán)重值,體現(xiàn)各自變量對(duì)擬合目標(biāo)影響程度的大小。根據(jù)模型賦予的自變量權(quán)重值的大小,可以實(shí)現(xiàn)變量選擇功能。LASSO算法的優(yōu)化目標(biāo)函數(shù)可改寫為:
其中t≥0為約束值,是回歸系數(shù)的泛式懲罰。
以2個(gè)自變量的情況為例,設(shè)定系數(shù)為β1和β2,LASSO算法的優(yōu)化目標(biāo)函數(shù)可改寫成:
從上式可以看出,優(yōu)化目標(biāo)函數(shù)為有關(guān)β1和β2的二元二次方程,在三維空間內(nèi)為拋物面,懲罰函數(shù)為垂直于β1β2平面的無(wú)限長(zhǎng)長(zhǎng)方體。將圖像平行于β1β2平面剖開,剖面圖如圖1所示。其中,橫坐標(biāo)為β1取值,縱坐標(biāo)為β2取值。不加懲罰項(xiàng)時(shí),目標(biāo)函數(shù)取最小值的點(diǎn)??梢钥闯鲈黾討土P項(xiàng)后,最小值選取點(diǎn)落在了坐標(biāo)軸上,此時(shí)β1取值為0,說(shuō)明在建立的模型中,自變量維度從2維降至1維,完成了自變量選取。
圖1 自變量為2時(shí)優(yōu)化目標(biāo)函數(shù)示意圖
因此,當(dāng)模型處在較高維度時(shí),LASSO算法可以在高維空間內(nèi)選取影響較大的自變量xij,并給出相應(yīng)系數(shù)βj,同時(shí),將對(duì)結(jié)果影響較小自變量壓縮,甚至設(shè)為0,得到更為精煉準(zhǔn)確的模型。
3.LASSO檢驗(yàn)
利用R語(yǔ)言軟件對(duì)各個(gè)變量因子進(jìn)行LASSO降維,結(jié)果如表2。由結(jié)果可知,通過(guò)LASSO剔除了一個(gè)變量因子x4,即進(jìn)出口額;通過(guò)觀察影響程度表可知,影響程度最大的只有x6和x7,分別為產(chǎn)業(yè)結(jié)構(gòu)和普通高等學(xué)校數(shù),其他因子的影響程度很小,本文不再研究。
表2 影響程度表
各個(gè)指標(biāo)的影響程度如圖2所示,其中橫坐標(biāo)代表的是各個(gè)變量因子,縱坐標(biāo)代表的是影響程度的相關(guān)系數(shù),可以看出x6和x7的影響程度最為明顯,其余變量因子的影響程度很??;因此,本文考慮對(duì)x6和x7建立半?yún)?shù)回歸模型。
圖2 各個(gè)變量影響程度圖表
半?yún)?shù)回歸分析模型為:
Y=Xβ+g(T)+ε
為線性半?yún)?shù)回歸模型。這里(X,T)為取值于Rp×[0,1]上的隨機(jī)或非隨機(jī)向量,β為I維未知參數(shù)向量,g為定義于[0,1]上的未知函數(shù),ε是隨機(jī)誤差,E(ε)=0,E(ε2)=σ2,如果認(rèn)為(X,T)隨機(jī),則需假定(X,T)與ε獨(dú)立。模型任務(wù)是要以觀測(cè)數(shù)據(jù)yi,Xi=(xi1,…,xip),Ti,i=1,…,n出發(fā),估計(jì)未知函數(shù)g(Ti),未知參數(shù)β與σ2。模型的數(shù)據(jù)形式是:
Yi=Xiβ+g(Ti)+εi
其中 i=(1,2,…,n),yi是因變量;xi是參數(shù)部分自變量;Ti是非參數(shù)部分自變量;β是回歸系數(shù),即待求參數(shù);g為定義于實(shí)數(shù)集上的未知函數(shù);ε是隨機(jī)誤差,E(ε)=0,E(ε2)=δ2。xiβ反映了城鎮(zhèn)居民人均可支配收入預(yù)測(cè)的部分規(guī)律,把握因變量y變化的趨勢(shì)走向,為參數(shù)部分;g(Ti)+εi反映了城鎮(zhèn)居民人均可支配收入的不確定因素的影響,為非參數(shù)部分。
用權(quán)函數(shù)法作出未知函數(shù)gn(Ti)的估計(jì):
按照上述做法,參數(shù)部分與半?yún)?shù)部分的系數(shù)顯著性如表3、表4;
表3 參數(shù)部分系數(shù)顯著性
表4 非參部分系數(shù)顯著性
其中輸出R2為0.99,擬合效果很好,由上表結(jié)果也易看出,參數(shù)部分x7的P值為0.0001,通過(guò)顯著性檢驗(yàn),經(jīng)過(guò)平滑處理后的非參數(shù)部分x6也通過(guò)顯著性檢驗(yàn),并且半?yún)?shù)回歸模型的擬合程度較高,圖3、圖4分別為半?yún)?shù)回歸與一般線性回歸擬合曲線圖。圖中y代表1990年到2019年實(shí)際河南省城鎮(zhèn)居民人均可支配收入,Y分別代表了半?yún)?shù)回歸模型和一般線性回歸模型預(yù)測(cè)的城鎮(zhèn)居民人均可支配收入;由圖可以看出半?yún)?shù)回歸模型的擬合效果較好,幾乎處處重合,但一般線性回歸預(yù)測(cè)的模型一般,尤其是在第17年即2007年之后,真實(shí)值與預(yù)測(cè)值之間的差別越來(lái)越大,擬合效果越來(lái)越差。
圖3 半?yún)?shù)回歸擬合曲線
圖4 一般線性回歸擬合曲線
根據(jù)R語(yǔ)言軟件繪制出半?yún)?shù)模型中產(chǎn)業(yè)結(jié)構(gòu)因素的非參數(shù)效應(yīng)如圖5,x6所代表的河南省產(chǎn)業(yè)結(jié)構(gòu),由圖可知,當(dāng)?shù)诙?、三產(chǎn)業(yè)的比重較小時(shí),城鎮(zhèn)居民人均可支配收入隨著產(chǎn)業(yè)結(jié)構(gòu)的增加變化不明顯,當(dāng)產(chǎn)業(yè)結(jié)構(gòu)大于0.75、小于0.86時(shí),收入隨著產(chǎn)業(yè)結(jié)構(gòu)的增大增加明顯,產(chǎn)業(yè)結(jié)構(gòu)大于0.86、小于0.89時(shí),有減小趨勢(shì);大于0.89時(shí),又有增加趨勢(shì)。這也說(shuō)明了當(dāng)城鎮(zhèn)居民人居可支配收入較小時(shí),二、三產(chǎn)業(yè)的比重增加不會(huì)對(duì)居民收入產(chǎn)生顯著性影響,當(dāng)二、三產(chǎn)業(yè)的比重較小,即第一產(chǎn)業(yè)(農(nóng)業(yè))的比重相對(duì)較大時(shí),城鎮(zhèn)居民的人均可支配收入較小,所以提高二、三產(chǎn)業(yè)的比重對(duì)城鎮(zhèn)居民人均可支配收入具有顯著的促進(jìn)作用。
圖5 半?yún)?shù)模型中產(chǎn)業(yè)結(jié)構(gòu)的非參數(shù)效應(yīng)
本文對(duì)河南省1990—2019年城鎮(zhèn)居民人均可支配收入的影響因素進(jìn)行了分析,具體步驟為:首先通過(guò)LASSO降維篩選出對(duì)城鎮(zhèn)居民人均可支配收入影響較大的因素,接著分別用普通最小二乘回歸和半?yún)?shù)回歸的實(shí)證結(jié)果對(duì)比分析了河南省城鎮(zhèn)居民人均可支配收入與影響因素之間存在的關(guān)系,結(jié)果表明半?yún)?shù)回歸模型的擬合效果良好。通過(guò)對(duì)全樣本和子樣本實(shí)證結(jié)果的分析,得出以下基本結(jié)論:
普通高等學(xué)校數(shù)顯著正向影響河南省城鎮(zhèn)居民人均可支配收入,說(shuō)明普通高等學(xué)校數(shù)越多,人均受教育水平就越高,城鎮(zhèn)居民的就業(yè)形勢(shì)就越好,從而有利于人均可支配收入的提高。
產(chǎn)業(yè)結(jié)構(gòu)對(duì)河南省城鎮(zhèn)居民人均可支配收入也具有顯著正向影響,由產(chǎn)業(yè)結(jié)構(gòu)的非參數(shù)效應(yīng)圖也可以看出,隨著二、三產(chǎn)業(yè)比重的不斷增加,城鎮(zhèn)居民人均可支配收入也是不斷增加的,二、三產(chǎn)業(yè)比重的增加有助于城鎮(zhèn)居民更好的就業(yè),進(jìn)而促進(jìn)城鎮(zhèn)居民人均可支配收入的增加。
通過(guò)對(duì)實(shí)證結(jié)果的分析與討論,本文提出以下政策建議:首先,政府應(yīng)不斷提高河南省人均受教育水平,通過(guò)增加高等學(xué)校數(shù)量來(lái)提高學(xué)生的入學(xué)率,良好的教育水平有助于更好的就業(yè)。其次,政府應(yīng)不斷提高第二、三產(chǎn)業(yè)的比重,第二、三產(chǎn)業(yè)比重的增加有助于給城鎮(zhèn)居民提供更多的就業(yè)機(jī)會(huì),進(jìn)而提高城鎮(zhèn)居民的人均可支配收入?!?/p>
統(tǒng)計(jì)理論與實(shí)踐2021年10期