朱琳 陳飛
(云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與數(shù)學(xué)學(xué)院 云南 昆明 650221)
失業(yè)率是指失業(yè)人口(一定時(shí)期有工作意愿而仍未有工作的勞動(dòng)力人口)占勞動(dòng)人口的比率。失業(yè)是市場(chǎng)經(jīng)濟(jì)不可避免的一種經(jīng)濟(jì)社會(huì)現(xiàn)象。但失業(yè)人員數(shù)量過(guò)多,失業(yè)率過(guò)高,不僅會(huì)給失業(yè)者本人及家庭帶來(lái)極大沖擊,也會(huì)對(duì)經(jīng)濟(jì)發(fā)展和社會(huì)穩(wěn)定構(gòu)成重大威脅。因此,把失業(yè)率控制在社會(huì)可承受的范圍內(nèi),是市場(chǎng)經(jīng)濟(jì)環(huán)境下國(guó)家政府的重要目標(biāo)之一。
目前國(guó)內(nèi)關(guān)于失業(yè)率的研究已取得一定的成果。田力(2003)研究了影響失業(yè)率的主要因素及降低失業(yè)率的對(duì)策,利用數(shù)學(xué)的窮舉法,就影響供給的因素、影響需求的因素以及同時(shí)影響供求雙方的因素三個(gè)方面,分析了與失業(yè)密切相關(guān)的七大因素,但其研究缺乏一個(gè)量化的統(tǒng)計(jì)模型。程紅莉和劉強(qiáng)(2003)以全國(guó)30個(gè)省市的相關(guān)數(shù)據(jù)為樣本研究了區(qū)域失業(yè)率差異影響因素。陳幼芳和張?zhí)鞎?huì)(2006)對(duì)云南的失業(yè)率進(jìn)行了預(yù)測(cè)和研究,其貢獻(xiàn)在于給出了比較全面的預(yù)測(cè)模型,但是缺乏對(duì)模型的檢驗(yàn)。本文使用線性回歸模型對(duì)云南省失業(yè)率的影響因素進(jìn)行實(shí)證研究,通過(guò)變量選擇方法,篩選得到了對(duì)失業(yè)率具有顯著影響的因素,并建立了擬合模型,該模型通過(guò)了異方差性、序列相關(guān)性和異常值檢驗(yàn)。
本數(shù)據(jù)來(lái)源于云南統(tǒng)計(jì)局網(wǎng)站(http://www.stats.yn.gov.cn/TJJMH_Model/default.aspx)上統(tǒng)計(jì)公報(bào)公布的2001—2011的相關(guān)數(shù)據(jù)。
本文的失業(yè)率的影響因素的研究主要考察在眾多因素中哪些因素對(duì)失業(yè)率具有顯著的影響。我們首先給出自變量的待選變量集。奧肯定律認(rèn)為經(jīng)濟(jì)增長(zhǎng)與失業(yè)率是負(fù)相關(guān)的,故首先考慮把GDP引入待選變量集中。此外,由于失業(yè)保險(xiǎn)是解決失業(yè)所產(chǎn)生的不利因素的社會(huì)機(jī)制,故考慮把享受失業(yè)保險(xiǎn)人數(shù)、失業(yè)保險(xiǎn)參保人數(shù)、失業(yè)保險(xiǎn)金收入額也引入待選變量集中。云南勞動(dòng)力資源供給的潛力相當(dāng)大,這將給云南的就業(yè)形勢(shì)造成不容忽視的壓力,故而把人口總數(shù)也引入變量集。固定資產(chǎn)投資是生產(chǎn)規(guī)模的重要表征,對(duì)就業(yè)情況產(chǎn)生著重要影響,故此,應(yīng)將其也引入變量集中。綜上,我們選取失業(yè)保險(xiǎn)參保人數(shù)(十萬(wàn)人)、享受失業(yè)保險(xiǎn)人數(shù)(萬(wàn)人)、GDP(千億元)、人口總數(shù)(千萬(wàn)人)、失業(yè)保險(xiǎn)金收入額(億元)、生產(chǎn)性固定投資總額(百億元)為自變量,以城鎮(zhèn)登記失業(yè)率(%)為響應(yīng)變量。
綜上分析,我們建立云南省失業(yè)率影響因素分析的六元回歸預(yù)測(cè)模型:
y=a0+a1x1+a2x2+a3x3+a4x4+a5x5+a6x6
其中,x1系參保人數(shù)(十萬(wàn)人)、x2系享受失業(yè)保險(xiǎn)人數(shù)(萬(wàn)人)、x3系 GDP(千億元)、x4系人口總數(shù)(千萬(wàn)人)、x5系失業(yè)保險(xiǎn)金收入額(億元)、x6系生產(chǎn)性固定投資總額(百億元)、y系城鎮(zhèn)登記失業(yè)率(%)。
回歸方程的F檢驗(yàn)的p值為0.016<0.05,這意味著,在5%的顯著性水平下,解釋變量對(duì)被解釋變量的聯(lián)合線性影響是顯著的。而系數(shù)的t檢驗(yàn)中,p值最小的為0.208,故在5%顯著性水平下所有系數(shù)均不顯著,即每個(gè)解釋變量對(duì)被解釋變量的線性影響均是不顯著的。這說(shuō)明模型自變量間很可能存在多重共線性。事實(shí)上,t-檢驗(yàn)中解釋變量都不顯著,可能是由于某些自變量對(duì)因變量的影響被其他自變量掩蓋了。為了檢驗(yàn)多重共線性的存在,先求出自變量的樣本協(xié)方差矩陣,并求得該協(xié)方差矩陣的條件數(shù)(最大特征值與最小特征值之比)為1.7914*104,這說(shuō)明六個(gè)變量之間存在很嚴(yán)重的多重共線性。故此,分別通過(guò)逐步回歸法和AIC準(zhǔn)則進(jìn)行自變量的選擇。
對(duì)六個(gè)自變量采用逐步回歸方法進(jìn)行變量篩選,用SPSS軟件逐步回歸的結(jié)果如表1所示。
表1 逐步回歸法選擇的變量回歸系數(shù)表
逐步回歸結(jié)果顯示選擇的自變量應(yīng)當(dāng)為失業(yè)保險(xiǎn)參保人數(shù)(x1)和人口總數(shù)(x4)。在5%的顯著性水平下,他們的p值分別為.000和.000,表明這兩個(gè)解釋變量對(duì)方程的影響是顯著的。為了進(jìn)一步確證上述變量選擇結(jié)果,我們使用AIC準(zhǔn)則對(duì)一些重點(diǎn)待選模型進(jìn)行比較。比較結(jié)果如下:僅包含x1、僅包含x4和包含x1和x4兩個(gè)自變量和其他任意自變量搭配的模型,其AIC值均大于只包含x1和x4兩個(gè)自變量的模型的AIC值。可見,AIC準(zhǔn)則提供的變量選擇的結(jié)果與逐步回歸法一致,均選擇x1和x4。
以y為因變量,以x1和x4為自變量的回歸模型擬合結(jié)果如下:
在5%的顯著性水平下,所有解釋變量系數(shù)的t統(tǒng)計(jì)量的P值均小于0.05,故所有系數(shù)均不顯著為0,即每個(gè)解釋變量對(duì)被解釋變量的線性影響均是顯著的。F檢驗(yàn)(p=0.000<0.05)的結(jié)果顯示方程顯著,即在5%的顯著性水平下解釋變量對(duì)被解釋變量的聯(lián)合線性影響是顯著的。
由異方差性的White檢驗(yàn)來(lái)看,F(xiàn)統(tǒng)計(jì)量的p值為0.3869,在5%的顯著性水平下,落在接受域內(nèi)。所有的交叉項(xiàng)和獨(dú)立項(xiàng)的p值也都落在接受域內(nèi),說(shuō)明無(wú)法拒絕原假設(shè),所以模型中不存在明顯的異方差性。
異常點(diǎn)即為在預(yù)設(shè)統(tǒng)計(jì)模型下明顯與大多數(shù)數(shù)據(jù)點(diǎn)的統(tǒng)計(jì)規(guī)律不一致的數(shù)據(jù)點(diǎn)。在線性模型下,異常點(diǎn)可采用下述的均值漂移模型來(lái)檢驗(yàn),該模型的向量形式可表示為Y=Xβ+hiγ+ε,hi=(0,…,1,…,0)T。其中 hi中第 i個(gè)元素為 1,其余元素為 0,X為自變量矩陣,Y為因變量向量。若γ顯著,說(shuō)明第i個(gè)點(diǎn)的均值有漂移,則該點(diǎn)不符合既定的線性回歸方程,從而說(shuō)明第i個(gè)點(diǎn)為異常點(diǎn)。為了檢驗(yàn)γ是否顯著,我們采用參數(shù)顯著性檢驗(yàn)方法。
對(duì)異常點(diǎn)的檢驗(yàn)過(guò)程如下:新增加一個(gè)自變量z,可疑點(diǎn)所對(duì)應(yīng)的取值為1,其他元素取值為0,在模型(1)加入變量z再進(jìn)行線性回歸,若z的系數(shù)顯著,則判定相應(yīng)的樣本點(diǎn)為異常值點(diǎn)。經(jīng)過(guò)計(jì)算,在5%的顯著性水平下,2000年和2002年的數(shù)據(jù)中變量z通過(guò)了系數(shù)的顯著性檢驗(yàn)(其p值分別是0.014和0.006),故判定其為異常值點(diǎn)。
將2000年和2002年的數(shù)據(jù)點(diǎn)剔除,利用剩余十個(gè)年度的數(shù)據(jù)重新進(jìn)行逐步回歸得到由x1和x4組成的模型,并得到以下的擬合方程:可見,剔除2000年和2002年的異常點(diǎn)后變大了,表明模型的擬合優(yōu)度得到了改善。F檢驗(yàn)(p=0.000<0.05)的結(jié)果顯示方程顯著,即在5%的顯著性水平下解釋變量對(duì)被解釋變量的聯(lián)合線性影響是顯著的。該模型也通過(guò)了異方差和序列相關(guān)檢驗(yàn)。上述擬合模型即為我們最終所得的失業(yè)率對(duì)失業(yè)保險(xiǎn)參保人數(shù)和總?cè)藬?shù)的線性回歸模型。
從上述模型看,在失業(yè)保險(xiǎn)參保人數(shù)、享受失業(yè)保險(xiǎn)人數(shù)、GDP、人口總數(shù)、失業(yè)保險(xiǎn)金收入額和生產(chǎn)性固定投資總額這些自變量中,對(duì)失業(yè)率影響最顯著的是參保人數(shù)和人口總數(shù)。失業(yè)保險(xiǎn)參保人數(shù)和失業(yè)率呈負(fù)相關(guān),這說(shuō)明失業(yè)保險(xiǎn)對(duì)保障失業(yè)人員的基本生活、降低失業(yè)者的再就業(yè)成本具有顯著意義,對(duì)就業(yè)起到積極的促進(jìn)作用。人口總數(shù)和失業(yè)率呈正相關(guān),說(shuō)明人口增長(zhǎng)給就業(yè)帶來(lái)了不可忽視的壓力。雖然,本文中使用的失業(yè)率是城鎮(zhèn)登記人口的失業(yè)率,而云南省是一個(gè)農(nóng)業(yè)大省,農(nóng)村人口占大多數(shù),然而,近幾年進(jìn)城務(wù)工的農(nóng)村勞動(dòng)者人口數(shù)的不斷攀升,仍給城鎮(zhèn)勞動(dòng)者的就業(yè)帶來(lái)一定壓力。某一地區(qū)流動(dòng)人口的大量增長(zhǎng)會(huì)在短期內(nèi)造成該地區(qū)勞動(dòng)力市場(chǎng)的失衡,對(duì)本地區(qū)居民就業(yè)產(chǎn)生壓力,但流動(dòng)人口也對(duì)本地區(qū)經(jīng)濟(jì)增長(zhǎng)提供了勞動(dòng)力的支撐。面對(duì)由于這種原因造成的失業(yè),各地區(qū)應(yīng)采取的措施是有效完善勞動(dòng)力市場(chǎng)、加快勞動(dòng)力市場(chǎng)的信息化建設(shè)、促進(jìn)經(jīng)濟(jì)增長(zhǎng)帶動(dòng)就業(yè)以降低失業(yè)率。模型表明GDP對(duì)失業(yè)率的影響不顯著,這表明云南省經(jīng)濟(jì)增長(zhǎng)對(duì)降低失業(yè)率的貢獻(xiàn)不大,這似乎與奧肯定律相違背,奧肯定律認(rèn)為針對(duì)整個(gè)國(guó)家而言,經(jīng)濟(jì)增長(zhǎng)會(huì)引起失業(yè)率的下降。GDP對(duì)失業(yè)率的影響不顯著的原因除了經(jīng)濟(jì)增長(zhǎng)地區(qū)吸引勞動(dòng)力而造成就業(yè)壓力以外,還可能與云南省GDP質(zhì)量有關(guān)。此外,2000年和2002年的樣本點(diǎn)對(duì)于模型而言是異常值點(diǎn),其異常的原因值得進(jìn)一步研究。
[1]程紅莉、劉強(qiáng):區(qū)域失業(yè)率差異影響因素的實(shí)證分析[J].統(tǒng)計(jì)與信息論壇,2003(3).
[2]田力:影響失業(yè)率的主要因素及降低失業(yè)率的對(duì)策[J].哈爾濱金融高等專科學(xué)校學(xué)報(bào),2003(1).
[3]陳幼芳、張?zhí)鞎?huì):云南失業(yè)率預(yù)測(cè)和研究[J].經(jīng)濟(jì)問(wèn)題探索,2006(6).
[4]高惠漩:應(yīng)用多元統(tǒng)計(jì)分析[M].北京大學(xué)出版社,2005.