邱旭輝 呂盛鴿 (杭州電子科技大學(xué)經(jīng)濟與統(tǒng)計研究所,浙江 杭州 310018)
基于VAR模型的浙江省老齡化系數(shù)預(yù)測
邱旭輝 呂盛鴿 (杭州電子科技大學(xué)經(jīng)濟與統(tǒng)計研究所,浙江 杭州 310018)
命題;格蘭杰因果檢驗;向量自回歸模型;老齡化系數(shù)
老齡化系數(shù)指老年人口占總?cè)丝诘谋戎?。對于老年人口的年齡界限,當(dāng)前國際上還沒有統(tǒng)一標準,本文定義 65歲及以上人群為老年人口。國際上通常認為,一個地區(qū) 65歲及以上老年人數(shù)占總?cè)丝诘谋壤^ 7%(簡稱為老齡化系數(shù)),就意味著該地區(qū)已經(jīng)步入老年型社會。浙江省 1988年就步入了老年型社會(老齡化系數(shù)為 7.07%),2008年老齡化系數(shù)增長到11.3%,預(yù)計未來老齡化趨勢將更加嚴峻。因此,準確預(yù)測浙江省老齡化系數(shù)的變動趨勢,對實現(xiàn)浙江省人口與經(jīng)濟協(xié)調(diào)發(fā)展具有重要意義。
如何準確預(yù)測人口數(shù)量成為當(dāng)前人類面臨的重要難題之一,國內(nèi)外學(xué)者從不同角度對人口預(yù)測模型進行了研究。Lutz等〔1〕建立年齡移算模型,通過設(shè)定不同總和生育率水平來預(yù)測總?cè)丝跀?shù);陳愛平〔2〕建立多元回歸模型,采用一般回歸法、后退法和逐步回歸法分別對參數(shù)進行估計,從中選取擬合樣本精度高的模型進行預(yù)測;林芳華〔3〕對馬爾薩斯 (Malthus)人口模型作了適當(dāng)改進,提出可應(yīng)用于人口預(yù)測的 Logistic模型,并用浙江省 1980年~2004年人口數(shù)據(jù)對模型的預(yù)測能力進行了實證檢驗。年齡移算模型、回歸模型等都是常用的人口預(yù)測模型,其中年齡移算模型是通過遞推移算,一旦參數(shù)估計有偏誤,將導(dǎo)致模型預(yù)測值與實際值的偏差隨時間推移而不斷增大;人口序列一般都存在自相關(guān)現(xiàn)象,且不同序列間很可能存在雙向因果關(guān)系,以回歸模型為代表的單方程模型不能有效表達變量間的雙向因果關(guān)系。而向量自回歸 (Vector Autoregression,VAR)彌補了上述兩類模型的不足〔4〕。因此,本文建立人口數(shù)量的VAR模型,預(yù)測浙江省 2009年~2050年的總?cè)丝跀?shù)、老年人數(shù)和老齡化系數(shù)。
任何人口模型的預(yù)測能力都是有度的,模型擬合樣本精度高也不能無條件地進行長期預(yù)測,即使是中長期預(yù)測能力較好的 VAR模型,也同樣存在著預(yù)測的瓶頸。鑒于上述問題,本文在建立 VAR模型之前,先設(shè)法估算老年人數(shù)的未來變動路徑和峰值期,提出判斷老年人數(shù)中長期變動趨勢特征的命題,然后以命題為約束條件建立 VAR模型。
1.1 參考聯(lián)合國平均預(yù)期壽命發(fā)展趨勢模型,對浙江省 2009年~2050年平均預(yù)期壽命進行假定:在 2008年浙江省平均預(yù)期壽命 76.81歲的基礎(chǔ)上,2009年起每年較上一年增加 0.07歲,當(dāng)超過 77.5歲時,每年增加 0.02歲。
1.2 根據(jù)浙江省 2009年~2050年平均預(yù)期壽命、2000年和2005年人口數(shù)據(jù)推算未來年份各年齡組的死亡概率,編制2000年、2010年、2020年和 2030年人口完全生命表;接著,利用四個生命表的數(shù)據(jù)估算 2000年 i歲的人平均存活到 t年(t=2030,2031,…,2039)x歲的總生存率 TLPi,x,t,估算公式為:
(i=2 064-t,2 065-t,…,ω -1-(t-2 000);x=i+(t-2 000)
其中 LPi,j,t表示根據(jù) t年生命表估算的 t年 i歲的人平均活到 j歲的生存率,公式為 LPi,j,t=Lit|ljt,Ljt和 lit分別表示 t年生命表中 j歲的平均生存人年數(shù)和 i歲尚存人數(shù)。
1.3 以 2000年各年齡組實際人口數(shù)為預(yù)測基數(shù),根據(jù)式 (1)的結(jié)果估算 2031年~2040年每年進入老年群體人數(shù)、老年人口死亡總數(shù)和老年人口凈增加數(shù),見表1。
表1 老年人口凈增加數(shù)變動結(jié)果(萬人)
表1說明,2031年~2038年老年人口凈增加數(shù)都為正值,2039年開始老年人口凈增加數(shù)變?yōu)樨撝?。因?根據(jù)表1數(shù)據(jù)可提出命題如下:
命題:若浙江省 2009年~2050年平均預(yù)期壽命按聯(lián)合國平均預(yù)期壽命發(fā)展趨勢模型進行推算,則老年人口數(shù)將在 2038年前后達到峰值。
2.1 指標選取及數(shù)據(jù)說明 結(jié)合人口學(xué)原理,本文選取總?cè)丝?、老年人口、男女性別比、總和生育率、死亡率、平均預(yù)期壽命和省際凈遷入人數(shù) 7個指標 ,依次用 y1t、y2t、y3t、y4t、y5t、y6t和 y7t表示 ,用 yj,t-i表示 yjt的 i階滯后期 (j=1,2,3,4,5,6,7;i=1,2,…)。樣本數(shù)據(jù)為浙江省 1978年~2008年戶籍人口數(shù)據(jù) (平均預(yù)期壽命為常住口徑),數(shù)據(jù)由浙江省公安廳和浙江省統(tǒng)計局提供。
2.2 格蘭杰因果檢驗 為建立被解釋變量包括 y1t和 y2t的
VAR模型,先用格蘭杰因果檢驗找出對 y1t或 y2t有顯著影響的序列。格蘭杰因果檢驗對滯后期很敏感,所以我們對所有可能的滯后期都進行檢驗,取相伴概率最小的。在 0.1的顯著性水平下 ,y1t、y2t和 y3t兩兩存在雙向因果關(guān)系 ,y6t是 y1t和 y2t的格蘭杰原因 ,y4t、y7t是 y1t的格蘭杰原因 ,y5t不是 y1t和 y2t的格蘭杰原因。根據(jù)上述分析,在建立 VAR模型時不必考慮我 y5t,只需考慮 y1t、y2t、y3t、y4t、y6t和 y7t。見表2。
表2 格蘭杰因果檢驗結(jié)果
2.3 VAR模型
2.3.1 檢驗?zāi)P蜏蕜t 根據(jù) y1t和 y2t的平均絕對百分誤(MAPE)、方程 I和方程 II的調(diào)整決定系數(shù) 選擇模型形式,根據(jù)VAR系統(tǒng)整體的赤池信息量 (Akaike Information Criterion,A IC)和施瓦茲信息量 (Schwatz Criertion,SC)選擇模型滯后期。其中選擇 y和 y的MAPE都比較小、方程 I和方程 II的都
1t2t接近于 1的模型形式,選擇 VAR系統(tǒng)整體的 A IC值和 SC值都較小時對應(yīng)的滯后期。
2.3.2 建立模型 綜合格蘭杰因果檢驗結(jié)果和人口統(tǒng)計學(xué)原理,為預(yù)測浙江省總?cè)丝跀?shù)和老年人口數(shù),建立內(nèi)生變量包括y1t和 y2t的 27個 VAR模型,利用檢驗?zāi)P蜏蕜t (見表3)。最終選擇以下 3個模型為VAR備選模型:
模型一:內(nèi)生變量為 y1t和 y2t,滯后 1階;控制變量為 y3t、y4t、y6t和 y7t,滯后 2階 ;
模型二:內(nèi)生變量為 y1t和 y2t,滯后 2階;控制變量為 y4t、y6t和 y7t,滯后 2階;
模型三:內(nèi)生變量為 y1t、y2t和 y3t,滯后 3階;控制變量為y4t、y6t和 y7t,滯后 2階 。
表3 備選 VAR模型檢驗結(jié)果
由表3可見,模型三的各項檢驗結(jié)果都優(yōu)于另外兩個模型,根據(jù)檢驗?zāi)P蜏蕜t,靜態(tài)預(yù)測浙江省 2009年總?cè)丝跀?shù)和老年人口數(shù)時,模型三是最優(yōu)的 VAR模型。由 Eviews軟件可得到模型三的方程,即:
2.4 老齡化系數(shù)預(yù)測
2.4.1 控制方案 控制人口總量增長是當(dāng)前浙江省人口發(fā)展的首要任務(wù),但從中長期來看,為提前應(yīng)對老年人口高峰,建議考慮逐步放開的生育政策。另外,東部勞動密集型產(chǎn)業(yè)向中西部轉(zhuǎn)移的步伐在加快,預(yù)計浙江省凈遷入人數(shù)將呈先增后減趨勢。綜合上述分析,在 2009年~2050年各年平均預(yù)期壽命與命題中假定相同條件下,提出兩種方案如下:
方案一:2009年~2015年總和生育率為 1.35,2016年~2029年為 1.40,2030年~2050年為 1.50;2009年~2015年省際凈遷入人數(shù)每年較上一年增加 0.4萬人,2016年開始每年減少 0.5萬人,2045年減少至 0后保持不變。
方案二:2009年總和生育率為 1.35,2010年~2019年為1.40,2020年~2029年為 1.60,2030年~2050年為 1.70;對省際凈遷入人數(shù)的控制同方案一。
2.4.2 預(yù)測過程 在方案一下,基于式 (2),用靜態(tài)法預(yù)測2009年總?cè)丝跀?shù)和老年人口數(shù),然后把 2009年預(yù)測值作為實際值,重新建立上述 3個 VAR模型,并根據(jù)檢驗?zāi)P蜏蕜t選擇最優(yōu)模型(模型一)靜態(tài)預(yù)測 2010年總?cè)丝跀?shù)和老年人口數(shù),……,重復(fù)上面步驟,直到模型趨于穩(wěn)定,基于合適的模型 (模型二)進行動態(tài)預(yù)測;最后根據(jù)命題選擇老年人數(shù)在 2038年附近達到峰值的預(yù)測結(jié)果作為最終結(jié)果。在方案二下進行預(yù)測時,預(yù)測過程類似于方案一。
2.4.3 預(yù)測結(jié)果分析 兩種方案下,分別預(yù)測了浙江省戶籍總?cè)丝跀?shù)、老年人口數(shù)和老齡化系數(shù),部分年份的預(yù)測結(jié)果見表4。
表4 總?cè)丝跀?shù)、老年人數(shù)及老齡化系數(shù)預(yù)測結(jié)果
兩種方案下預(yù)測的總?cè)丝跀?shù)均呈先增后減的變動趨勢,分別在 2034年、2039年達到峰值 5158.8萬人、5336.7萬人,到2050年總?cè)丝跀?shù)分別下降至 5048.1萬人、5284.8萬人??偤蜕瘦^高的方案,總?cè)丝跀?shù)達到峰值時人口規(guī)模越大,峰值以后人口數(shù)量下降越慢。與總?cè)丝跀?shù)的變動特征不同,同一年份不同方案下老年人口數(shù)預(yù)測值相差不多 (相對差距不超過1.6%),且都在 2038年前后達到峰值,峰值期老年人數(shù)維持在1168.7萬人至 1187.3萬人之間。老齡化系數(shù)的變動趨勢與老年人數(shù)基本同步,同樣在 2038年前后達到峰值,2020年以后老齡化系數(shù)都在 20%以上,最高達到 23.1%,由此可見,浙江省未來老齡化問題十分嚴峻。
綜上所述,總和生育率高,老齡化較容易得到緩解,但老齡化的緩解根本上是由總?cè)丝跀?shù)的提高引起的,預(yù)測期內(nèi)老年人數(shù)的變動趨勢并未得到根本改變,且總和生育率越高的方案,總?cè)丝跀?shù)達到峰值后人口數(shù)量下降越慢,越不利于緩解人口總量對社會經(jīng)濟發(fā)展的壓力。
1 LutzW,O′Neill BC,Scherbov S.Europe′s population at a turning point〔J〕.Science,2003;299(5675):1991-2.
2 陳愛平,安和平.中國人口時間序列預(yù)測模型的探討〔J〕.人口與經(jīng)濟 ,2004;6:13.
3 林芳華 (2006).基于消失江省人口模型的研究〔D〕.浙江大學(xué)碩士學(xué)位論文,2006:5.
4 高鐵梅.計量經(jīng)濟分析方法與建模:Eviews應(yīng)用及實例〔M〕.北京:清華大學(xué)出版社,2006:267-80.
C921
A
1005-9202(2010)24-3824-03
國家社會科學(xué)基金項目 (09BTJ005);2009年浙江省新苗人才計劃-創(chuàng)新項目 (ZX100701040)
呂盛鴿 (1953-),男,教授,主要從事人口統(tǒng)計學(xué)研究。
邱旭輝(1985-),男,在讀碩士,主要從事數(shù)據(jù)挖掘方法與應(yīng)用的研究。
〔2010-08-18收稿 2010-10-16修回〕
(編輯 袁左鳴)