王葉WANG Ye
(安徽財經(jīng)大學(xué)統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院,蚌埠233000)
新中國成立以來,我國人口總量持續(xù)增長,近年來雖然人口增速放緩,但人口問題始終是中國的一個大問題,人口基數(shù)多,人均耕地面積少,人均占有資源不足是我國的基本國情。從本質(zhì)上來說,人口問題是發(fā)展問題,會制約我國的發(fā)展。要有效控制人口增長,前提是要了解人口數(shù)量的變化規(guī)律,需要建立合適的人口預(yù)測模型,進(jìn)行較為準(zhǔn)確的預(yù)測。
國內(nèi)目前有很多學(xué)者采用不同的方法來預(yù)測中國的人口總量。涂雄苓(2009)分別利用指數(shù)平滑法和ARIMA 時間序列模型對中國人口數(shù)量進(jìn)行預(yù)測, 并將二者的預(yù)測結(jié)果進(jìn)行比較,得出最優(yōu)預(yù)測模型是ARIMA(2,2,1)模型[1];韓紹庭(2014)運用了多元線性回歸預(yù)測和ARIMA 預(yù)測,發(fā)現(xiàn)多元線性回歸模型的預(yù)測精度更高[2];李利利(2014)在綜合考慮了自然資源、環(huán)境條件等因素的情況下,建立了Logistic 模型對中國人口進(jìn)行預(yù)測[3]。經(jīng)過學(xué)者不斷研究發(fā)現(xiàn),單一的預(yù)測方法存在著很多的缺陷和不足。Bates和Granger 在1969 年提出了組合預(yù)測方法,它是將各個單一預(yù)測方法看成一個個包含著不同信息的片段,通過將各項信息集成后分散單項預(yù)測的不確定性和減少總體不確定性,從而提高預(yù)測精度[4];陳華友和劉春林通過引進(jìn)誘導(dǎo)有序加權(quán)算術(shù)平均(IOWA)算子,這是一種以誤差平方和最小為準(zhǔn)則的組合預(yù)測模型,并給出了IOWA 權(quán)向量的確定的數(shù)學(xué)規(guī)劃方法[5]。該模型提出了一種新的賦權(quán)思想,根據(jù)各單項預(yù)測方法在各時點上的擬合精度的高低進(jìn)行有序賦權(quán),優(yōu)先給予預(yù)測精度最高的單項預(yù)測方法最高的賦權(quán)系數(shù)。
因此,為了更準(zhǔn)確的預(yù)測中國人口總量,本文采用基于IOWA 算子的組合預(yù)測模型對我國人口總量進(jìn)行預(yù)測。首先分別采用多元線性回歸模型、ARIMA 模型和二次指數(shù)平滑預(yù)測法這三種預(yù)測方法對中國的人口進(jìn)行單項預(yù)測,然后建立基于IOWA 算子的組合預(yù)測模型來分析所建立的組合預(yù)測模型的優(yōu)越性。在此基礎(chǔ)上,使用IOWA 算子組合預(yù)測模型對我國未來五年的人口總量進(jìn)行預(yù)測,以此來分析我國的人口總量及其增長情況。
則稱函數(shù)fw是由v1,v2,…,vm所產(chǎn)生的m 維誘導(dǎo)有序加權(quán)平均算子,即IOWA 算子。其中v-index(i)是v1,v2,…,vm中按照從大到小的順序排序后第i 個大的數(shù)的下標(biāo),其中是加權(quán)向量,滿足。從上述概念中可以看出IOWA算子是對誘導(dǎo)值v1,v2,…,vm按從大到小的順序排序后所對應(yīng)的a1,a2,…,am中的數(shù)進(jìn)行有序加權(quán)平均,ωi與ai的大小和位置無關(guān),而是與其誘導(dǎo)值所在的位置有關(guān)。
選擇不同預(yù)測方法在各個時點上的預(yù)測精度作為該方法的誘導(dǎo)值,其中預(yù)測精度為:
其中,i=1,2,…,m;t=1,2,…,N,vit表示第i 種預(yù)測方法在第t 時刻的預(yù)測精度,xt為第t 時刻的實際值,xit表示第i 種預(yù)測方法在第t 時刻的預(yù)測值。此時,m 種預(yù)測方法在t 時刻的預(yù)測精度與其預(yù)測值構(gòu)成了m 個二維數(shù)組:
于是,N 期總的組合預(yù)測誤差平方和S2為:
IOWA 算子組合預(yù)測法通過各單項預(yù)測法在各個時點上預(yù)測精度的高低按順序賦權(quán),并以誤差平方和最小為準(zhǔn)則建立組合預(yù)測模型,符合實際需要,所以本文采用IOWA 算子的組合預(yù)測模型。
筆者選取2000~2018 年之間24 年的全國總?cè)丝冢▂)作為被解釋變量,人均GDP(x1),城鎮(zhèn)化率(x2),初中畢業(yè)生人數(shù)(x3),城鄉(xiāng)收入差距(x4),人均受教育年限(x5)以及時間t 作為解釋變量。在導(dǎo)入數(shù)據(jù)后,利用R 軟件進(jìn)行多元線性回歸模型,逐步回歸后,剔除一些不顯著變量,最終得到如下回歸模型:
各個自變量的系數(shù)均通過顯著性檢驗,R2=0.9969,F(xiàn)統(tǒng)計量的值為32020,p 值為0,說明在0.05 水平下回歸方程整體顯著。模型的預(yù)測值和預(yù)測精度見表1。(注:***表示在0.05 水平下顯著)
ARIMA 模型是以平穩(wěn)隨機序列為前提建模的,經(jīng)過對原序列以及各階差分?jǐn)?shù)據(jù)進(jìn)行ADF 檢驗后,發(fā)現(xiàn)二階差分序列平穩(wěn),并通過觀察其自相關(guān)圖和偏自相關(guān)圖以及比較模型的R2,統(tǒng)計量t 和AIC 準(zhǔn)則,最后確定建立ARIMA(0,2,0)模型,模型的預(yù)測值及預(yù)測精度見表1。
指數(shù)平滑法是在時間序列統(tǒng)計模型的基礎(chǔ)上進(jìn)行預(yù)測的方法。指數(shù)平滑法分為一次指數(shù)平滑法和多次指數(shù)平滑法。一般情況下,運用最多的是二次指數(shù)平滑法,其公式為:
對于以上三種模型的預(yù)測結(jié)果,選取2000~2018 年的預(yù)測數(shù)據(jù)建立組合預(yù)測模型。其中三種預(yù)測方法的各項預(yù)測結(jié)果如表1 所示。
由于要建立誘導(dǎo)(以預(yù)測精度作為誘導(dǎo)值)有序加權(quán)算術(shù)平均(IOWA)組合預(yù)測模型,將三種預(yù)測模型在樣本期(2000-2018 年)各時點按照預(yù)測精度由大到小的順序重新排列,得到預(yù)測精度最高、預(yù)測精度次高和預(yù)測精度最差的誘導(dǎo)預(yù)測模型對應(yīng)的預(yù)測值和預(yù)測精度,見表2。
根據(jù)各單項預(yù)測精度值和誤差,建立基于誤差平方和最小的組合預(yù)測模型,三種單項預(yù)測的誤差信息矩陣為:
使預(yù)測誤差平方和最小的誘導(dǎo)有序加權(quán)算術(shù)平均組合預(yù)測模型:
表2 按照精度從大到小排序的預(yù)測值與精度
表1 三種單項預(yù)測預(yù)測值與精度
利用LINGO11 解得最優(yōu)權(quán)重系數(shù)為:ω1=0.684,ω2=0.283,ω3=0.033。根據(jù)最優(yōu)權(quán)重系數(shù)及IOWA 算子組合預(yù)測模型,得出各年組合預(yù)測值見表1,以及各年組合預(yù)測值的預(yù)測精度見表2。
結(jié)合各單項外推預(yù)測計算出2019-2023 年的各單項預(yù)測值,再乘以各單項預(yù)測方法的最優(yōu)權(quán)重系數(shù)求和,即可計算出我國人口總量的后五年預(yù)測值,見表3。
由表3 可知,未來幾年我國人口仍在持續(xù)不斷地增長,到2023 年人口總數(shù)會達(dá)到142854 萬人,從預(yù)測結(jié)果可以看出我國由于人口基數(shù)過大,短期一段時間內(nèi)人口仍呈增長趨勢,人口發(fā)展問題仍是未來幾年的工作的重點。
表3 2019-2023 年全國人口預(yù)測值
本文在回顧誘導(dǎo)有序加權(quán)平均(IOWA)算子的組合預(yù)測模型的理論基礎(chǔ)上,首先分別采用了多選線性回歸模型、ARIMA 模型及二次指數(shù)平滑三種單項預(yù)測模型對我國2000-2018 年期間的人口總量,然后建立以單項預(yù)測法預(yù)測精度為誘導(dǎo)值,以誤差平方和最小為準(zhǔn)則的IOWA 算子的組合預(yù)測模型。預(yù)測結(jié)果顯示,由于我國人口基數(shù)較大,在未來的幾年中,人口依然處于持續(xù)增長階段,中國在發(fā)展過程中的人口問題依然是一個重點問題。