張曼麗
摘要:本文主要針對(duì)廣東省戶(hù)籍人口的定量分析,所采用的模型是自回歸移動(dòng)平均模型(Autoregressive Integrated Moving Average Model,簡(jiǎn)記ARIMA)和指數(shù)平滑(Exponential Smoothing,簡(jiǎn)稱(chēng)ES)模型,它們是時(shí)間序列分析中常用的兩類(lèi)模型,在分析的過(guò)程中使用的是R統(tǒng)計(jì)軟件[1-4],使用的主要的程序包括fpp、forecast、Rcpp,主要內(nèi)容是把戶(hù)籍人口的變動(dòng)歸結(jié)為遷移和自然變動(dòng)兩類(lèi)因素,通過(guò)預(yù)測(cè)未來(lái)十年內(nèi)的遷移率和自然增長(zhǎng)率,對(duì)戶(hù)籍人口在未來(lái)十年的發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè)。
關(guān)鍵詞:ARIMA模型;ES模型;戶(hù)籍人口;預(yù)測(cè)
中圖分類(lèi)號(hào):G642.0 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2016)32-0190-02
本文主要針對(duì)廣東省的戶(hù)籍人口進(jìn)行研究,從廣東省政府網(wǎng)站(http://www.gdstats.gov.cn/tjnj/2012/c4.htm)下載的數(shù)據(jù),采用自回歸移動(dòng)平均模型(Autoregressive Integrated Moving Average Model,簡(jiǎn)記ARIMA)和指數(shù)平滑(Exponential Smoothing,簡(jiǎn)稱(chēng)ES)模型來(lái)研究人口趨勢(shì)問(wèn)題,它們是時(shí)間序列分析中常用的兩類(lèi)模型,在分析的過(guò)程中使用的是R統(tǒng)計(jì)軟件,使用的主要的程序包括fpp、forecast、Rcpp。本文主要對(duì)戶(hù)籍人口進(jìn)行分析預(yù)測(cè),進(jìn)而完成ARIMA和ES模型在人口預(yù)測(cè)方面的應(yīng)用。
相比較非戶(hù)籍人口,戶(hù)籍人口的數(shù)據(jù)相對(duì)豐富,因此,我們將重點(diǎn)分析戶(hù)籍人口的發(fā)展變化情況。首先我們把戶(hù)籍人口的變動(dòng)歸結(jié)為遷移和自然變動(dòng)兩類(lèi)因素,通過(guò)預(yù)測(cè)未來(lái)十年內(nèi)的遷移率和自然增長(zhǎng)率,對(duì)戶(hù)籍人口在未來(lái)十年的發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè)。由于國(guó)家人口調(diào)查數(shù)據(jù)的限制,分析所利用的數(shù)據(jù)截止至2010年,預(yù)測(cè)從2011年始,至2020年結(jié)束。雖然2011—2014年的人口可以從2015年廣東省統(tǒng)計(jì)年鑒里查到,我們不使用它,將它作為檢驗(yàn)?zāi)P蜏?zhǔn)確率的數(shù)據(jù)依據(jù)。
由于戶(hù)籍人口的遷移情況受人為因素的影響較大[5],戶(hù)籍人口的遷移將分別從遷入和遷出兩方面來(lái)分析,而戶(hù)籍人口的自然增長(zhǎng)情況受人為因素影響較少,將僅從凈自然增長(zhǎng)率來(lái)分析。記:R(t)=I(t)-E(t)+G(t),其中t表示時(shí)間,R(t)表示在時(shí)間點(diǎn)t廣東省戶(hù)籍人口每年的變化率,I(t)、E(t)和G(t)分別表示在時(shí)間點(diǎn)t戶(hù)籍人口的遷入率、遷出率和凈自然增長(zhǎng)率。
經(jīng)濟(jì)因素對(duì)人口遷移具有直接的影響作用,各國(guó)及各地區(qū)之間經(jīng)濟(jì)發(fā)展的不平衡是構(gòu)成人口遷移[6]的主要原因。通常,經(jīng)濟(jì)發(fā)展水平高的地區(qū)人口遷入率較高,而經(jīng)濟(jì)落后的地區(qū)遷出率高。所以在我們接下來(lái)的分析中,對(duì)于遷入率與遷出率的預(yù)測(cè),使用2000—2010年的數(shù)據(jù),因?yàn)榻鼛啄陱V東省的經(jīng)濟(jì)發(fā)展趨于穩(wěn)定,且與目前影響人口變動(dòng)的因素更加接近,所以使用近幾年的數(shù)據(jù)將更加具有說(shuō)服力。而對(duì)于凈自然增長(zhǎng)率,由于受人為因素的影響較少,則使用1982—2010年的數(shù)據(jù)。根據(jù)對(duì)數(shù)據(jù)的分析,2007年之前,遷入率在13%~18%之間波動(dòng),其中2004年和2006年達(dá)到兩個(gè)小高峰。但是,據(jù)查2004年和2006年廣東的經(jīng)濟(jì)發(fā)展沒(méi)有特殊的變化,故應(yīng)屬于正常的波動(dòng)。自2007年開(kāi)始,遷入率持續(xù)下降,只有在2010年有個(gè)微小的波動(dòng),這主要是由于廣東省政府對(duì)人口總量的宏觀控制所致,因此遷入率主要由人為因素控制。有鑒于此,我們將采用最近三年也就是2008—2010年遷入率的平均值作為其未來(lái)十年的預(yù)測(cè)值。即遷入率的預(yù)測(cè)值=×(13.46+11.64+12.07)=12.39。遷出率的變化情況可以看出,除2004年明顯由13%下降到9%之外,2004年前后均相對(duì)平穩(wěn),但考慮到2004年并無(wú)重大事件發(fā)生,這一波動(dòng)應(yīng)是統(tǒng)計(jì)口徑不同或者是收集數(shù)據(jù)有出入造成的。從凈自然增長(zhǎng)率的變化來(lái)看,1990年之前是比較穩(wěn)定的波動(dòng),從1990年開(kāi)始連續(xù)20年出現(xiàn)負(fù)增長(zhǎng),這一現(xiàn)象的發(fā)生應(yīng)與我國(guó)人口生育高峰的結(jié)束以及人口老齡化水平的上升有關(guān)。
下面利用ARIMA模型和ES模型,對(duì)廣東省未來(lái)10年戶(hù)籍人口的遷出率和凈自然增長(zhǎng)率進(jìn)行預(yù)測(cè)。首先畫(huà)了2000—2010年這段時(shí)間的遷出率和凈自然增長(zhǎng)率,圖示顯示都不是平穩(wěn)的時(shí)間序列,所以在使用ARIMA模型的時(shí)候都是要進(jìn)行差分使其變成平穩(wěn)的時(shí)間序列。同樣對(duì)遷出率也使用ES模型來(lái)預(yù)測(cè),圖1和圖2顯示ARIMA模型和ES模型對(duì)遷出率的預(yù)測(cè)結(jié)果。
從上面的ARIMA模型和ES模型對(duì)出生率的預(yù)測(cè)來(lái)看,ES模型更加合理,對(duì)于遷出率的預(yù)測(cè)我們采用ES模型來(lái)預(yù)測(cè),原因有以下幾點(diǎn):首先從模型的AIC來(lái)看ARIMA模型所顯示的AIC=41.85,而ES模型的AIC=34.28279,由此可以看出ES模型更準(zhǔn)確一些。其次,圖1可以看出ARIMA模型預(yù)測(cè)的結(jié)果基本保持在一個(gè)數(shù)值8.2,這和廣東省的實(shí)際情況是不吻合的。由于廣東省的發(fā)展,生活質(zhì)量的提高,越來(lái)越多的人喜歡在廣東省居住,所以遷出的人數(shù)應(yīng)該減少。綜上所述,對(duì)于出生率的預(yù)測(cè)ARIMA模型并不是很準(zhǔn)確,所以采用ES模型來(lái)進(jìn)行預(yù)測(cè)。對(duì)于凈自然增長(zhǎng)率我們使用了ARIMA和ES模型,精確度上兩種方法都可以,保留了這兩種方法的預(yù)測(cè)結(jié)果。
未來(lái)廣東省戶(hù)籍人口總量的預(yù)測(cè)可以根據(jù)以上預(yù)測(cè)得到的遷入率、遷出率以及凈自然增長(zhǎng)率來(lái)計(jì)算,計(jì)算公式為P(t)=P(t-1)?鄢I(t)-E(t)+G(t),其中P(t)是第t年的人口數(shù),P(t-1)是第t-1年的人口數(shù),I(t)是第t年的遷入率,E(t)是第t年的遷出率,G(t)是第t年的凈自然增長(zhǎng)率。分別由ARIMA模型和ES模型得到的2011—2020年廣東省戶(hù)籍人口的總體數(shù)目見(jiàn)表1。
以上是ARIMA模型和ES模型在人口預(yù)測(cè)方面的應(yīng)用,總的來(lái)說(shuō)是非常實(shí)用且準(zhǔn)確的兩種人口預(yù)測(cè)的方法。根據(jù)廣東省2015年的統(tǒng)計(jì)年鑒我們來(lái)看一下準(zhǔn)確度,表1中是預(yù)測(cè)的人口總數(shù),而2015統(tǒng)計(jì)年鑒統(tǒng)計(jì)的廣東省2011—2014年的人口數(shù)分別為8637.19、8635.89、8759.46、8886.88,大家可以看一下其準(zhǔn)確度還是挺高的,可以作為人口預(yù)測(cè)的兩種實(shí)用的方法。
參考文獻(xiàn):
[1]薛毅,陳立萍.統(tǒng)計(jì)建模與R軟件[M].北京:清華大學(xué)出版社,2007:297-321.
[2]徐俊曉.統(tǒng)計(jì)學(xué)與R讀書(shū)筆記[M].第六版.2012:882-944.
[3]Introductory Time Series with R .Paul S.P.Cowpertwait,Andrew V.Metcalfe Publisher:Springer;1 edition(May 29,2009).
[4]王燕.應(yīng)用時(shí)間序列分析[M].北京:中國(guó)人民大學(xué)出版社,2005.
[5]馮麗華.人口增長(zhǎng)的綜合預(yù)測(cè)分析[J].系統(tǒng)工程,2001,(1):71-75.
[6]王振營(yíng).人口遷移規(guī)律——不同條件下人口遷移模型的研究[D].北京:中國(guó)人民大學(xué),1993.