王穎俐
(長治學(xué)院 數(shù)學(xué)系,山西 長治 046011)
數(shù)學(xué)家耶爾最早提出時間序列分析方法與自回歸模型,此后不斷發(fā)展完善。時間序列分析方法主要應(yīng)用于預(yù)測,例如房價預(yù)測、碳排放預(yù)測、人口預(yù)測等等。
人口數(shù)量與地區(qū)及國家經(jīng)濟(jì)發(fā)展關(guān)系密切。因此人口的研究、預(yù)測與控制關(guān)乎國計民生。最早提出人口預(yù)測模型的人是英國人口學(xué)家馬爾薩斯。隨后,人們又提出logistic模型和隨機(jī)性模型。文章選取1980-2017年的全國人口數(shù)據(jù),采用時間序列分析方法建立模型進(jìn)行分析及預(yù)測。具體數(shù)據(jù)見表1。
ARIMA模型(自回歸移動平均模型)是時間序列分析中使用范圍較廣的模型,其結(jié)構(gòu)如下:
ARIMA模型建模的基本思想就是將差分運(yùn)算與ARMA模型進(jìn)行組合。首先將非平穩(wěn)時間序列進(jìn)行一定階數(shù)的差分后轉(zhuǎn)化為平穩(wěn)時間序列,進(jìn)而對差分后的序列擬合ARMA模型。它遵循如下操作流程(見圖1)。
表1 我國1980-2017年年末人口數(shù)
圖1 建模流程圖
圖2 時序圖
圖3 一階差分序列時序圖
圖4 二階差分序列時序圖
由圖2知,序列呈上升趨勢,即序列為非平穩(wěn)。接下來通過ADF單位根檢驗(yàn),知其P值均比0.05大,故是非平穩(wěn)序列。
由圖3、圖4知,序列二階差分后方為平穩(wěn)序列,且經(jīng)過ADF檢驗(yàn)知其P值均比0.05小,故是平穩(wěn)序列,與時序圖直觀顯示出來的結(jié)果一致。
圖5 自相關(guān)圖
圖6 偏自相關(guān)圖
由圖5及圖6知二階差分序列自相關(guān)圖及偏自相關(guān)圖均截尾,這與ARMA模型的定階原則不相符。因此應(yīng)嘗試以下各種模型,并估計各模型的參數(shù)的參數(shù),最后通過對比從中得到最佳模型。
表2 各擬合模型對比表
運(yùn)用R軟件可得表2所示數(shù)據(jù),得AR(1)模型和MA(1)模型相對最優(yōu),且都能通過顯著性檢驗(yàn),因此可以選用這兩個模型來擬合該序列。
(四)預(yù)測
圖7 AR(1)預(yù)測圖
圖8 MA(1)預(yù)測
表3 未來5年的預(yù)測值
圖7給出由AR(1)模型預(yù)測得到我國未來五年的人口趨勢圖,圖8為由MA(1)模型預(yù)測得到我國未來五年的人口趨勢圖,這兩個圖十分相似。表3為兩個模型預(yù)測可得的具體人數(shù),由表中數(shù)據(jù)可知,應(yīng)用這兩個模型預(yù)測差別不大。
對1980~2017年我國人口數(shù)據(jù),應(yīng)用時間序列分析中ARIMA模型,對我國人口問題進(jìn)行預(yù)測。首先對原序列進(jìn)行二階差分后得到平穩(wěn)序列;進(jìn)而通過多個模型的對比,選用AR(1)模型和MA(1)模型來擬合該序列;最后運(yùn)用模型進(jìn)行了預(yù)測,發(fā)現(xiàn)這兩個模型預(yù)測出的結(jié)果相差不大。確立的我國人口預(yù)測模型為
由預(yù)測結(jié)果可知我國未來5年內(nèi)人口可能還會持續(xù)增長,這將使我們面臨許多社會問題,比如住房困難問題、就業(yè)嚴(yán)峻問題、教育問題等。