考慮到當(dāng)前中國(guó)青年失業(yè)率持續(xù)高位,這對(duì)各行業(yè)、企業(yè)以及個(gè)人的工作和生活產(chǎn)生了不利影響,并導(dǎo)致一系列消極社會(huì)現(xiàn)象,如過(guò)度依賴家庭和犯罪率上升。因此,我們需要高度關(guān)注青年的發(fā)展?fàn)顩r。最新的2022年數(shù)據(jù)表明,青年原本應(yīng)該成為推動(dòng)社會(huì)發(fā)展的優(yōu)質(zhì)勞動(dòng)力,但在當(dāng)今社會(huì)背景下,其失業(yè)率仍保持在17%的高水平。這不僅需要引起全社會(huì)的關(guān)注,還需要從統(tǒng)計(jì)學(xué)理論的角度對(duì)青年失業(yè)率水平進(jìn)行分析和預(yù)測(cè)。因此,本文基于中國(guó)統(tǒng)計(jì)局發(fā)布的2022年全國(guó)失業(yè)率調(diào)查數(shù)據(jù),并運(yùn)用各種統(tǒng)計(jì)學(xué)方法構(gòu)建模型,結(jié)合統(tǒng)計(jì)學(xué)理論對(duì)青年失業(yè)率進(jìn)行預(yù)測(cè)和分析,同時(shí)參考相關(guān)的調(diào)研報(bào)告,總結(jié)出對(duì)實(shí)際問(wèn)題有啟示意義的結(jié)論。
緒論
研究背景及意義
人口是屬于“牽一發(fā)而動(dòng)全身”的基礎(chǔ)性戰(zhàn)略性變量,現(xiàn)已有專家建議把“人口建設(shè)”納入百年戰(zhàn)略、千年大計(jì)之中,根據(jù)2022年已發(fā)布的數(shù)據(jù),年末全國(guó)人口為141175萬(wàn)人,比上年年末減少85萬(wàn)人,出生人口為956萬(wàn)人,死亡人口為1041萬(wàn)人,出生率及死亡率分別為6.77%和7.37%,人口自然增長(zhǎng)率為-0.6%。
而人口是關(guān)聯(lián)勞動(dòng)人口、養(yǎng)老、財(cái)政收入、消費(fèi)、醫(yī)療等方面的重大問(wèn)題,鑒于中國(guó)龐大的人口基數(shù),勢(shì)必需要有一個(gè)合理穩(wěn)定的人口及年齡結(jié)構(gòu),才能保證社會(huì)的發(fā)展,而在這其中,青年及中年人的作用不可忽視。
一般而言,青年勞動(dòng)者選擇從事低層次工作很可能將其視為個(gè)體人力資本投資的機(jī)會(huì),在積累工作經(jīng)驗(yàn)的同時(shí),學(xué)習(xí)與工作相關(guān)的特定技能,為職業(yè)晉升做準(zhǔn)備,或者為尋找合適的工作創(chuàng)造更多機(jī)會(huì)。而失業(yè)對(duì)于該個(gè)體而言,思想上容易造成自卑、消極及自閉等問(wèn)題,行為上造成消費(fèi)低迷,甚至是犯罪,并且目前中國(guó)的生育率為2.2%,已是全球最嚴(yán)重的低生育國(guó)家,針對(duì)以上幾個(gè)方面,本文從青年失業(yè)率的數(shù)據(jù)出發(fā),研究2022年數(shù)據(jù)分布的特征,并構(gòu)建與其他變量的關(guān)系方程,探討出可預(yù)測(cè)及推斷青年失業(yè)率水平的方程,進(jìn)而研究出可監(jiān)測(cè)青年失業(yè)率發(fā)展趨勢(shì)的方法。
研究設(shè)計(jì)
1.相關(guān)理論、研究重點(diǎn)與分析框架
本研究依據(jù)《現(xiàn)代基礎(chǔ)統(tǒng)計(jì)學(xué)》關(guān)聯(lián)分析理論,結(jié)合各類統(tǒng)計(jì)檢驗(yàn)等方法,對(duì)實(shí)際數(shù)據(jù)進(jìn)行分析,提出研究假設(shè)并構(gòu)建分析框架。
研究重點(diǎn)1:青年失業(yè)率存在一定的分布特征,如正態(tài)分布、遞減趨勢(shì);
研究重點(diǎn)2:青年失業(yè)率在時(shí)間變化上存在序列關(guān)系;
數(shù)據(jù)收集及說(shuō)明
本文從國(guó)家統(tǒng)計(jì)局-國(guó)家數(shù)據(jù)-月度數(shù)據(jù)-指標(biāo)-就業(yè)人員和工資-城鎮(zhèn)調(diào)查失業(yè)率收集的數(shù)據(jù)進(jìn)行整理及分析。
研究?jī)?nèi)容及方法
(1)全國(guó)16-24歲失業(yè)率的描述性統(tǒng)計(jì)分析。分析16-24歲青年失業(yè)率的現(xiàn)狀及數(shù)據(jù)分布情況,各描述性指標(biāo)情況,闡述目前失業(yè)率的特征及意義。
本章節(jié)主要對(duì)青年失業(yè)率的數(shù)據(jù)情況進(jìn)行描述性說(shuō)明,包含數(shù)據(jù)特征、數(shù)據(jù)基本規(guī)律及展示圖表內(nèi)容。
(2)全國(guó)16-24歲失業(yè)率的時(shí)間序列回歸關(guān)系分析?;诂F(xiàn)有的樣本量探索全國(guó)青年失業(yè)率時(shí)間序列關(guān)系,包含平穩(wěn)性檢驗(yàn)、自相關(guān)等方法,構(gòu)建序列模型,從而對(duì)全國(guó)青年失業(yè)率進(jìn)行預(yù)測(cè)及分析。
全國(guó)16-24歲失業(yè)率的描述性統(tǒng)計(jì)分析
數(shù)據(jù)預(yù)處理
通過(guò)中國(guó)統(tǒng)計(jì)局及數(shù)據(jù)篩選,挑選2022年的數(shù)據(jù)進(jìn)行分析,整理如下:
描述性統(tǒng)計(jì)計(jì)算及趨勢(shì)分析
計(jì)算2022年全國(guó)16-24歲青年失業(yè)率集中及離散指標(biāo),如下:
從已收集的數(shù)據(jù)來(lái)看整體分布均勻,不存在極端值,因此能較好地表示2022年的青年失業(yè)水平為平均數(shù):17.56%;水平保持在比率區(qū)間為[15,20),峰值出現(xiàn)在6月、7月,往后比例逐步下降;其中增幅最大達(dá)14%,出現(xiàn)在2月-3月,降幅最大達(dá)6%,出現(xiàn)在7月-8月之間。2022年青年失業(yè)率整體呈現(xiàn)增長(zhǎng)后下降的變化趨勢(shì),年中達(dá)到峰值,接近19.9%后逐步下降。
因?yàn)槠葹楹饬繑?shù)據(jù)分布指標(biāo),通過(guò)計(jì)算的數(shù)值-0.1968474lt;0,趨近于0,2022年青年失業(yè)率處于呈現(xiàn)左偏態(tài)分布,并且峰度1.962489>0,該數(shù)據(jù)峰度呈現(xiàn)尖峰狀態(tài),數(shù)據(jù)較與正態(tài)分布更為集中。
描述性統(tǒng)計(jì)分析總結(jié)
基于2022年發(fā)布的青年失業(yè)率數(shù)據(jù),從描述性分析的維度進(jìn)行解讀,得出以下結(jié)論:
(1)2022年全年青年失業(yè)率整體水平保持在比率區(qū)間為[15,20),平均水平在17.56%,峰值出現(xiàn)在6月到7月,其中增幅最大達(dá)14%,降幅最大達(dá)6%,呈現(xiàn)增長(zhǎng)后下降的變化趨勢(shì)。
(2)對(duì)2022年的數(shù)據(jù)進(jìn)行離散分布分析時(shí),通過(guò)偏度數(shù)值比較,發(fā)現(xiàn)全年數(shù)據(jù)整體呈現(xiàn)左偏態(tài),雖存在極小值,但從整體的數(shù)據(jù)分布情況來(lái)看,均值仍具備代表全年的失業(yè)率水平的含義,數(shù)據(jù)呈現(xiàn)尖峰態(tài),數(shù)據(jù)分布較正態(tài)分布更為集中,且SW檢驗(yàn)結(jié)果中W接近1,且p值大于0.05,因SW檢驗(yàn)的原假設(shè)為數(shù)據(jù)正態(tài)分布,因此后續(xù)的分析均基于2022年青年失業(yè)率可以近似認(rèn)為正態(tài)分布趨勢(shì)出發(fā)。
全國(guó)16-24歲失業(yè)率的時(shí)間序列回歸關(guān)系分析
本章節(jié)從時(shí)間序列的角度,以數(shù)據(jù)層面出發(fā),尋找青年失業(yè)率是否隨時(shí)間的發(fā)展而呈現(xiàn)一定特性,從而構(gòu)建模型,對(duì)后續(xù)其發(fā)展進(jìn)行預(yù)測(cè),最后再結(jié)合最新的數(shù)據(jù)進(jìn)行比對(duì),確定分析結(jié)論是否可靠。
基于以上思路,設(shè)想下面6個(gè)步驟分析:(1)觀察2022-01至2023-01之間的失業(yè)率折線圖,判定趨勢(shì)平穩(wěn)性。(2)構(gòu)建時(shí)間序列對(duì)象ts。(3)比較acf與pacf判定該時(shí)間序列適用模型。(4)進(jìn)行相關(guān)性、白噪音點(diǎn)檢驗(yàn)。(5)構(gòu)建模型并進(jìn)行預(yù)測(cè)。(6)與真實(shí)值進(jìn)行對(duì)比及分析。
構(gòu)建時(shí)間序列模型
收集整理2022-01至2023-01 13數(shù)據(jù),按照月度間隔,構(gòu)建時(shí)間序列,結(jié)合acf\pacf及自相關(guān)性等方法,判斷時(shí)間序列平穩(wěn)情況,從而選擇合適的函數(shù)進(jìn)行預(yù)測(cè)及分析。
構(gòu)建時(shí)間序列及檢驗(yàn)說(shuō)明
按照k=12的間隔構(gòu)建青年失業(yè)率時(shí)間序列,并進(jìn)行平穩(wěn)及自相關(guān)檢驗(yàn),驗(yàn)證模型有效性。
(1)平穩(wěn)序列檢驗(yàn)-序列趨勢(shì)檢驗(yàn)。基于趨勢(shì)圖判斷該序列無(wú)明顯的遞增或者遞減趨勢(shì),無(wú)波動(dòng)循環(huán)跡象,可初步判斷為平穩(wěn)序列,為了進(jìn)一步確認(rèn)是否為平穩(wěn)序列,進(jìn)行acf檢驗(yàn)。構(gòu)建時(shí)間序列的acf及pacf時(shí)序圖,觀察得,隨著延遲數(shù)的增加,平穩(wěn)時(shí)間序列的自相關(guān)函數(shù)會(huì)很快向0衰減,呈現(xiàn)拖尾現(xiàn)象,即自相關(guān)函數(shù)逐步趨向于0。
(2)自相關(guān)檢驗(yàn)。經(jīng)Box.test檢驗(yàn)觀察得p值<0.05,非白噪聲序列,具有研究的數(shù)據(jù)價(jià)值。
(3)小結(jié)說(shuō)明。結(jié)合上述結(jié)論,觀察該序列檢驗(yàn)結(jié)果,可初步判定為平穩(wěn)非白噪音序列,并且因其拖尾現(xiàn)象,需選擇AR模型而非MA模型。
參數(shù)估算及構(gòu)建時(shí)間序列
為確定時(shí)間序列需使用的參數(shù),為避免人工計(jì)算錯(cuò)誤,基于R語(yǔ)言自帶函數(shù)auto.arima()并將trace= T設(shè)置為機(jī)器檢驗(yàn),減少誤差,觀察結(jié)果得該序列最優(yōu)為ARIMA(1, 0, 0)模型,并構(gòu)建時(shí)間序列函數(shù),由計(jì)算結(jié)果可得,系數(shù)的估計(jì)值分別為17.0673和0.7991,估計(jì)值的標(biāo)準(zhǔn)差為0.1546及0.9705,模型殘差的方差為0.7263,AIC統(tǒng)計(jì)量為39.75。
對(duì)模型進(jìn)行檢驗(yàn):
觀察標(biāo)準(zhǔn)化殘差基本分布在零水平線附近,且在-2~2的范圍內(nèi);自相關(guān)函數(shù)迅速下降到兩條虛線內(nèi)。但Ljung-Box統(tǒng)計(jì)量P值大部分<0.05,可以判斷模型通過(guò)檢驗(yàn)。
最后,對(duì)模型進(jìn)行自相關(guān)檢驗(yàn),區(qū)間在[0.4966364,1.102693],區(qū)間不包含0,模型顯著。綜上所述,可以采用該模型進(jìn)行預(yù)測(cè)。
對(duì)AR模型預(yù)測(cè)及分析
設(shè)想選取未來(lái)5個(gè)月的預(yù)測(cè)值,并設(shè)置95%的置信區(qū)間,輸出預(yù)測(cè)值,其中整體預(yù)測(cè)值為17.18416,95%的可能性真實(shí)值會(huì)位于在[14.85154,19.51678]
另,通過(guò)中國(guó)統(tǒng)計(jì)局查詢最新發(fā)布的2023年2月青年失業(yè)率為18.1%,參考第14序號(hào)的預(yù)測(cè)情況,與真實(shí)值相差0.85,位于[14.85154 , 19.51678]之間,因此該模型具有一定的現(xiàn)實(shí)意義。
觀察預(yù)測(cè)圖與真實(shí)值趨勢(shì)圖,可用于后續(xù)觀察整體趨勢(shì)情況及區(qū)間變動(dòng)情況,其中藍(lán)色為預(yù)測(cè)值,灰色填充為預(yù)測(cè)置信區(qū)間變動(dòng)范圍。
本章小結(jié)
本章針對(duì)時(shí)間序列分析方法和各類檢驗(yàn)方法構(gòu)建了序列函數(shù)為:
根據(jù)預(yù)測(cè)及真實(shí)值對(duì)比,觀察及對(duì)比后可以有以下現(xiàn)實(shí)意義:
現(xiàn)實(shí)意義1:可以使用模型預(yù)測(cè)未來(lái)1-5個(gè)月的青年失業(yè)率分布情況,通過(guò)與真實(shí)值進(jìn)行對(duì)比分析,觀察是否存在超過(guò)異常區(qū)間的情況出現(xiàn),及時(shí)介入及監(jiān)測(cè)。
現(xiàn)實(shí)意義2:檢測(cè)未來(lái)預(yù)測(cè)值及置信區(qū)間變動(dòng)范圍,若識(shí)別到異常值,及時(shí)將青年失業(yè)率逐步控制在一個(gè)穩(wěn)定及平穩(wěn)的區(qū)間內(nèi)。
具體措施可結(jié)合發(fā)達(dá)國(guó)家序列中保持最低青年失業(yè)率的德國(guó)舉措,結(jié)合國(guó)情,嘗試從以下幾方面對(duì)青年就業(yè)提供就業(yè)支持:
(1)健全的就業(yè)法規(guī)體系,如完成了普通義務(wù)教育而沒(méi)有繼續(xù)升學(xué)的18歲以下青年接受義務(wù)職業(yè)教育,逐步頒布相關(guān)法律法規(guī),通過(guò)立法將職業(yè)教育納入義務(wù)教育范疇。
(2)完備的職業(yè)指導(dǎo)體系,如加強(qiáng)對(duì)勞動(dòng)者在勞動(dòng)力市場(chǎng)中個(gè)人責(zé)任感及自我推銷的相關(guān)技能,可通過(guò)在高等課程中設(shè)立自我領(lǐng)導(dǎo)力的就業(yè)指導(dǎo)課程,并在高等院校設(shè)立就業(yè)指導(dǎo)辦公室,專項(xiàng)指導(dǎo)青年的就業(yè)。
(3)富有特色的職業(yè)教育體系,如建立并完善學(xué)校及企業(yè)“ 雙軌制 ”的 職業(yè)教育,同時(shí)接收企業(yè)與學(xué)校的雙向教育,合格者準(zhǔn)予畢業(yè),從而實(shí)現(xiàn)教育及就業(yè)的接軌。
通過(guò)中國(guó)統(tǒng)計(jì)局發(fā)布的中國(guó)統(tǒng)計(jì)年鑒失業(yè)率數(shù)據(jù),從統(tǒng)計(jì)學(xué)的描述性分析、時(shí)間序列分析,得出16-24歲青年失業(yè)率的數(shù)據(jù)特征及分布,在其分布基礎(chǔ)上,對(duì)2022年青年失業(yè)率情況進(jìn)行評(píng)估。
2022年全年青年失業(yè)率平均水平在17.56%,其中增幅最大達(dá)14%,降幅最大達(dá)6%,呈現(xiàn)增長(zhǎng)后下降的變化趨勢(shì),近似可認(rèn)為符合正態(tài)分布趨勢(shì)。
通過(guò)序列分析方法,對(duì)全國(guó)青年失業(yè)率進(jìn)行時(shí)間序列研究發(fā)現(xiàn),2022年的青年失業(yè)率時(shí)間序列存在一定的現(xiàn)實(shí)意義,可通過(guò)對(duì)未來(lái)1-5個(gè)周期的數(shù)據(jù)進(jìn)行預(yù)測(cè),實(shí)現(xiàn)及時(shí)識(shí)別極端值并介入及監(jiān)測(cè)的工作。
綜上所述,基于2022年的數(shù)據(jù)來(lái)看,初步判斷青年當(dāng)前的失業(yè)率情況數(shù)據(jù)穩(wěn)定,無(wú)因經(jīng)濟(jì)下行、就業(yè)形式嚴(yán)峻等社會(huì)問(wèn)題出現(xiàn)導(dǎo)致急速上升的趨勢(shì)。
從時(shí)間序列方程來(lái)看,有95%的可能性1-5月內(nèi)的數(shù)據(jù)應(yīng)該保持在[14,19]的水平,若后續(xù)出現(xiàn)超過(guò)該區(qū)間的青年調(diào)查失業(yè)率數(shù)據(jù),可能需要引起關(guān)注。
(作者單位:對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)統(tǒng)計(jì)學(xué)院在職人員高級(jí)課程研修班)