趙子銘
摘要:以我國1949—2017年人口總數(shù)為研究對象,利用時間序列方法及不同檢驗、最優(yōu)化方法建立ARIMA模型,并用于預測2019年我國人口總數(shù).通過AIC系數(shù)比較、白噪聲檢驗,可以認為ARIMA(1,2,1)模型能夠較好擬合我國成立至今的人口趨勢.結(jié)果顯示:我國人口數(shù)在1949年起不斷攀升,并仍將在未來保持穩(wěn)定的增速擴張;預測我國2019年及2020年的人口總數(shù)分別為140453.6048、141162.1572萬人.
關鍵詞:人口預測;ARIMA模型;純隨機序列檢驗
中圖分類號:O212? 文獻標識碼:A? 文章編號:1673-260X(2019)09-0010-03
1 引言
人口總量指一國在某一時間點上的人口總數(shù).利用數(shù)據(jù)探究一國人口總數(shù)的變化趨勢、預測人口總量的變化對于民生政策、經(jīng)濟政策具有重要意義.本文選擇使用中國自成立至2017年的年人口總數(shù)作為研究對象,旨在建立特定模型對我國人口增長趨勢進行模型解釋,并對我國未來人口數(shù)量進行合理的預測.由于人口數(shù)是存量的時間序列指標,因此嘗試使用ARIMA模型對人口序列進行擬合.
ARIMA模型全稱為求和自回歸移動平均模型,是擬合、預測時間序列數(shù)據(jù)的重要模型之一.由于差分能夠較好地提取確定性趨勢,因此ARIMA模型經(jīng)常被用于擬合非平穩(wěn)時間序列.ARIMA(p,d,q)模型共有3個參數(shù),其中p代表模型的AR(自回歸)階數(shù),q代表模型的MA(移動平均)階數(shù),而d代表序列的差分階數(shù).其數(shù)學表達式如下:
其中1-iLi代表ARIMA模型中自回歸項系數(shù),1+?茲iLi代表ARIMA模型中移動平均項系數(shù),(1-L)d代表差分階數(shù),其中L代表延遲算子.根據(jù)上述理論,使用中國1949—2017年人口總數(shù)序列進行ARIMA(p,d,q)模型的構(gòu)建.
2 基于ARIMA模型的中國人口序列預測
由于人口數(shù)量是典型的存量指標,所以一般是二階單整的,即在經(jīng)過二次差分之后,該序列會由非平穩(wěn)序列轉(zhuǎn)換為平穩(wěn)序列.因此引入ARIMA模型,初定差分的階數(shù)為二階.[1]
構(gòu)建ARIMA模型是一個比較繁瑣的過程,建模步驟可以分為以下幾步:
通過ADF檢驗判斷該序列的單整階數(shù)d;
確定序列的準確差分階數(shù)d后,通過Q統(tǒng)計量檢驗判斷差分序列是否是純隨機序列.
(1)如果該序列通過Q統(tǒng)計量檢驗,則意味著該序列是純隨機序列,每一期的值是完全獨立不相關的,則不存在繼續(xù)建模和預測的意義;
(2)如果該序列不是純隨機序列,則我們可以繼續(xù)ARIMA模型的構(gòu)建;
若差分后序列不是純隨機序列,則判斷差分后的序列自相關系數(shù)是否拖尾或在q階截尾.
(1)如果該序列在q階截尾,則可以確定其ARIMA模型中MA(也即移動平均項)的階數(shù)為q;
(2)若其拖尾,則階數(shù)為0;
觀察其偏自相關系數(shù)是否拖尾或存在p階截尾.
(1)如果該序列在p階截尾,則可以確定ARIMA模型中AR(也即自回歸項)的階數(shù)為p;
(2)若其拖尾,則階數(shù)為0;
通過上述分析得出ARIMA模型的三個系數(shù):p,d,q,并以此為依據(jù)建立ARIMA(p,d,q)模型;
對模型進行AIC系數(shù)比較、純隨機序列檢驗及顯著性檢驗,判斷模型對原序列的擬合是否良好;
利用模型對我國人口進行預測.[2]
2.1 確定單整階數(shù)
本文使用Eviews軟件對人口時間序列進行ADF檢驗及后續(xù)建模、檢驗.這里使用ADF檢驗判斷人口序列的單整階數(shù).ADF檢驗的3個模型如下:
ΔXt=δXt-1+∑βiΔXt-i+εt(None)
ΔXt=α+δXt-1+∑βiΔXt-i+εt(Intercept)
ΔXt=α+βt+δXt-1+∑βiΔXt-i+εt(Trend and Intercept)
其中∑βiΔXt-i代表高階項,α代表常數(shù)項隨機性趨勢,時間項t代表確定性趨勢.在實際檢驗中,只要時間序列在上述3種模型中的任意一種中檢驗被認為不存在單位根,則可證明序列是平穩(wěn)過程.由于時間序列平穩(wěn)的性質(zhì)各不相同,故ADF檢驗和DF檢驗的原假設均為:H0:時間序列存在單位根.
先前討論指出,人口序列為典型的存量序列,故應為2階單證序列.實驗證明:在0階、1階差分下,人口序列均不能通過ADF檢驗,即至少含有1個單位根.因此對其進行2階差分,并再次進行ADF檢驗.結(jié)果如下表所示:
從ADF檢驗的伴隨概率可以看出,在二階差分情況下,人口序列可以被認為是平穩(wěn)序列,即ARIMA模型中的差分項d=2.
2.2 純隨機序列檢驗
利用Q統(tǒng)計量檢驗對人口二階差分序列進行純隨機序列的檢驗.Q統(tǒng)計量檢驗也即序列自相關檢驗,自相關檢驗的原理是通過檢驗時間序列及其k階滯后序列的相關程度,判斷時間序列的歷史數(shù)據(jù)是否存在某種相關聯(lián)系.隨機時間序列的自相關函數(shù)為:[4]
其中:γk=cov(Xt,Xt+k),γ0=cov(Xt,Xt).分子代表滯后k期的時間序列協(xié)方差,分母代表時間序列的方差.如果ρk=0對任意k>0都成立,那么可以認為時間序列不存在自相關性.(此為原假設).通過構(gòu)造QLB統(tǒng)計量對時間序列自相關性進行檢驗,具體統(tǒng)計量的建立如下:
rk為樣本自相關函數(shù).統(tǒng)計量近似服從自由度為m的χ2分布(其中m為滯后期數(shù)).若Q值大于顯著性水平的臨界值,則拒絕所有rk同時為零的假設,即時間序列具有自相關性.
對二階差分后的人口序列進行上述檢驗,結(jié)果如下圖所示:
由于任意滯后階數(shù)下,人口二階差分序列Q統(tǒng)計量檢驗的伴隨概率均顯著為0,因此拒絕其是純隨機序列的假設,可以認為該序列不是純隨機序列,后續(xù)ARIMA模型建模具有了理論支撐及現(xiàn)實意義.
2.3 判斷序列p、q階數(shù)
通過觀察二階差分序列的自相關系數(shù)、偏相關系數(shù)的截尾性選擇合適的ARMA模型p、q階數(shù).利用Python生成二階差分后的人口序列進行自相關系數(shù)、偏自相關系數(shù)的可視化圖,如下所示:[5]
從圖中可以看出,該序列的自相關系數(shù)和偏自相關系數(shù)均在1階滯后后迅速降至0附近,因此可以認為該模型的p、q值均為1,也即:該序列的AR項滯后系數(shù)為1,MA項滯后系數(shù)也為1.
2.4 構(gòu)建人口序列ARIMA(1,2,1)模型
通過上述4節(jié)分析,可以確定人口序列模型的自回歸項、差分項、移動平均項的項數(shù)分別為:1,2,1.據(jù)此,通過Eviews建立人口序列的ARIMA(1,2,1)模型.
注意到人口序列的ARIMA(1,2,1)模型等價于二階差分后的人口序列的ARMA(1,1)模型,所以可以直接對二階差分后的人口序列進行ARMA模型的構(gòu)建.構(gòu)建出的模型結(jié)果如下:
結(jié)果顯示,使用極大似然估計擬合ARMA模型的參數(shù)結(jié)果中:
C、AR(1)、MA(1)的t值均小于0.05,通過了顯著性檢驗;殘差序列在經(jīng)過短暫的震蕩后進入二倍標準差范圍中,顯示出良好的擬合效果;
模型的AIC函數(shù)為14.9475;
模型的最終形式為:
X=-4.4849+0.5084X+ε-0.61960ε
2.5 基于ARIMA(1,2,1)模型的人口預測
根據(jù)上節(jié)構(gòu)建的模型對我國2018年—2020年人口總數(shù)進行預測,預測結(jié)果如下:
圖中三角標志表示人口數(shù)的原始值,×號代表模型計算得出的預測值.結(jié)果認為:模型預測值與原始值相近,模型擬合效果良好;模型對于2018年、2019年及2020年的人口總數(shù)預測為:(單位:萬人)139735.5451、140453.6048、141162.1572萬人.
3 結(jié)論
本文通過建立ARIMA(1,2,1)模型對我國1949 —2017年人口總數(shù)進行了擬合、預測.ARIMA(1,2,1)模型通過了系數(shù)、模型顯著性檢驗,且殘差項均處于2倍標準差內(nèi),對我國人口總數(shù)序列的擬合程度較好.預測認為我國2019年及2020年的人口總數(shù)分別為140453.6048、141162.1572萬人.
——————————
參考文獻:
〔1〕陳艷玫,劉子鋒,李賢德,黃奕祥.2015—2050年中國人口老齡化趨勢與老年人口預測[J].中國社會醫(yī)學雜志,2018,35(05):480-483.
〔2〕趙華,薛紅艷.基于ARIMA模型的河北省人口預測[J].時代金融,2013(24):125-126.
〔3〕唐宇,余嬌嬌.重慶市人口預測與發(fā)展趨勢分析[J].現(xiàn)代商貿(mào)工業(yè),2019,40(23):4-8.
〔4〕陳艷玫,劉子鋒,李賢德,黃奕祥.2015—2050年中國人口老齡化趨勢與老年人口預測[J].中國社會醫(yī)學雜志,2018,35(05):480-483.
〔5〕韓紹庭,周雨欣.多元線性回歸與ARIMA在中國人口預測中的比較研究[J].中國管理信息化,2014,17(22):100-103.