曹 園
(中國人民大學 統(tǒng)計學院,北京100872)
根據(jù)《中國人口統(tǒng)計年鑒》及《中國人口和就業(yè)統(tǒng)計年鑒》整理各年男性及女性分年齡死亡率數(shù)據(jù)可看到我國死亡率水平隨時間呈下降趨勢。死亡率改善不僅會延長人口預期壽命,還會改變?nèi)丝诮Y(jié)構(gòu)、增加老年撫養(yǎng)比。我國目前已成為人口老齡化發(fā)展速度最快的國家之一,且是世界上老年人口最多的國家,即我國人口老齡化進入快速發(fā)展階段的同時,還伴隨著高齡化的快速推進。人口老齡化以及人口老化勢必對經(jīng)濟社會各個方面產(chǎn)生影響。Ashgar Zaidi(2012)[1]認為人口老齡化的挑戰(zhàn)可以看作是老齡化相關(guān)的政府支出的增加,特別是養(yǎng)老金支出的增加,使現(xiàn)行的養(yǎng)老保險制度不可持續(xù)。因此對死亡率改善程度的準確預判,有助于決策層制定符合未來人口特征的人口政策、經(jīng)濟政策以及養(yǎng)老政策等。
Lee和Carter(1992)[2]提出了預測死亡率的隨機方法,將影響對數(shù)中心死亡率的因素分解為時間和年齡因素,建立了由對數(shù)表達式和ARIMA模型構(gòu)成的預測死亡率的外推模型,計算相對方便簡單。目前很多國內(nèi)外學者都采用此方法進行死亡率的預測。Girosi和King(2007)[3]詳細分析了Lee-Carter模型,并將其與一般的隨機游走模型進行對比,認為該模型是一個更為簡單的,可以減少偏差的帶漂移隨機游走模型的特例。Koissi等(2006)[4]運用Lee-Carter模型對北歐國家的死亡率進行預測,通過奇異值分解法、加權(quán)最小二乘法以及極大似然法估計參數(shù),認為極大似然法具有更好的擬合效果。李南和胡華清(1998)[5]全面介紹了Lee-Carter模型,并應用該方法首次完成了中國隨機人口預測。李志生和劉恒甲(2010)[6]介紹了Lee-Carter模型參數(shù)估計的四種方法,分別是:奇異值分解法(SVD)、最小二乘法(OLS)、加權(quán)最小二乘法(WLS)、極大似然法(MLE)。但是當數(shù)據(jù)缺失時,隨機模型的預測精度下降。對于有限數(shù)據(jù),Li等(2004)[7]令k的表達式服從帶漂移的隨機游走模型,并證明如果k服從嚴格的隨機游走假設(shè),則若數(shù)據(jù)的時間跨度足夠大只需要3年的數(shù)據(jù)就可以準確預測模型的參數(shù)及死亡率。韓猛和王曉軍(2010)[8]也采用了類似的方法對Lee-Carter模型進行了改進,通過對Lee-Carter模型中的時間項建立一個雙隨機過程減小因樣本量不足對預測結(jié)果的影響。
以上文獻主要存在以下兩個問題。第一,研究發(fā)現(xiàn)高齡人口死亡概率已不再呈指數(shù)增長,而是在某一水平上下波動,具有很強的線性趨勢。因此,運用Lee-Carter模型預對高齡人口死亡率結(jié)果預測將存在較大的偏差。J.M.Robine等(2007)[9]分別采用了Gompertz、Weibull、Heligman and Pollard、Quadratic、Logistic和Kannisto模型擬合對高齡死亡率數(shù)據(jù)進行擬合和預測,通過對比分析,認為Kannisto模型對高齡死亡率的模擬效果優(yōu)于其他幾個模型。安平(2010)[10]選用Gompertz函數(shù)、Coale-Kisker是方法是以及極值理論方法對高齡人口死亡數(shù)據(jù)進行擬合,并通過加權(quán)最小平方法進行比較,認為Coale-Kisker方法是對高齡死亡率擴展的最佳方法。第二,文獻中對死亡率數(shù)據(jù)以每5歲的年齡來分組進行參數(shù)估計及預測。然而這種分年齡組處理的方法會造成預測結(jié)果出現(xiàn)一定偏差,顯然一組內(nèi)各年齡的死亡率是不同的。
因此,本文將做以下改進:首先,因個別年齡死亡率缺失或為零,不能對這些死亡率數(shù)據(jù)取對數(shù),因此無法使用矩陣奇異值分解法進行參數(shù)估計。為了提高預測精度,本文采用加入數(shù)據(jù)存在或缺失權(quán)重的極大似然估計法處理缺失數(shù)據(jù)。其次,通過對比Kannisto模型及Coale-Kisker方法可知,后者操作性更強,因此本文通過Coale-Kisker方法擴展高齡死亡率,提高死亡率預測精度。最后,本文不對死亡率進行分組處理,直接運用分年齡數(shù)據(jù)對分年齡分性別死亡率進行預測。
本文對死亡率的預測主要分以下幾個步驟:
第一步,建立對數(shù)中心死亡率模型,并通過過去數(shù)據(jù)估計模型參數(shù)。模型基本公式為:
其中,mx,t為t年度x歲人的中心死亡率;αx為影響死亡率的年齡因素,其值為各年齡死亡率按時間統(tǒng)算出的基數(shù),即為影響死亡率的時間因素,表示t年度死亡率水平的變化;βx為各年齡別死亡率的偏差情況;ξx,t為誤差項,其均值為0,標準差為σ。
由模型可知,運用任意常數(shù)c對參數(shù)進行轉(zhuǎn)換都可以使原模型保持不變,例如可將參數(shù)變換成:
因此本文對參數(shù)增加約束條件即使參數(shù)標準化,取值唯一確定。模型參數(shù)可由不同方法估計。
第二步,預測κt。運用時間序列模型對κt進行估計,進而根據(jù)死亡率模型推估未來死亡率。本文采用參數(shù)估計方法。該方法下假設(shè)死亡人數(shù)可通過參數(shù)為λx,t的泊松分布進行模擬,即dx,t~Poisson(Ex,tmx,t)
其中為 t年度 x歲的死亡人數(shù),Ex,t為t年度x歲人的死亡風險暴露數(shù)。極大似然函數(shù)表達式為(Natacha Brouhns,2002):
其中C為常數(shù),由不受參數(shù)λ的影響項構(gòu)成。運用牛頓迭代公式,根據(jù)約束條件,本文參考李志生和劉恒甲(2010)[6]的初始值選定方案從參數(shù)初始值=0、=1和=0開始,按以下步驟更新參數(shù):
其中第v次更新需滿足條件設(shè)置迭代更新的停止條件,例如當參數(shù)更新使式(2)的增加量很小時(如小于10-6)停止迭代,得到參數(shù)估計值。
第三步,對高齡死亡率進行擴展。
由于《中國人口統(tǒng)計年鑒》以及《中國人口和就業(yè)統(tǒng)計年鑒》中只有0~89歲的分年齡死亡率數(shù)據(jù),90歲以上分年齡死亡率數(shù)據(jù)缺失,本文通過Coale-Kisker方法對各年份高齡死亡率數(shù)據(jù)進行擴展。該方法假設(shè)死亡率以一個變化的、線性的速率遞增,從提出至今被廣泛使用于高齡人口死亡率的擴展。在實際操作中,一般假設(shè)從85歲開始使用該方法。具體模型如下:
其中k(x)=ln(mx/mx-1),R為k(x)與k(x-1)的線性差額。由于我國《中國人壽保險業(yè)經(jīng)驗生命表(2000—2003)》將終極年齡設(shè)為105歲,因此本文假設(shè)m105=1。由此,可得:
為減小個別數(shù)據(jù)的波動對模型整體的影響,可以選用從82~86歲中心死亡率的算術(shù)平均值代替上式的m84,用[ln(m87/m80)]/7代替上式的k(84)。
由《中國人口統(tǒng)計年鑒》及《中國人口和就業(yè)統(tǒng)計年鑒》,可得1995—2015年分年齡、性別死亡率數(shù)據(jù),其中2000年和2010年分年齡、性別死亡率數(shù)據(jù)缺失,總共19年的樣本數(shù)據(jù)。1996年數(shù)據(jù)為0~84歲分年齡、性別死亡率數(shù)據(jù)以及85歲以上分性別總體死亡率數(shù)據(jù),其余各年份數(shù)據(jù)為0~89歲分年齡、性別死亡率數(shù)據(jù)以及90歲以上分性別總體死亡率數(shù)據(jù)。將1996年85~89歲分年齡、性別死亡率數(shù)據(jù)視為缺失數(shù)據(jù)。同時,2005年人口數(shù)據(jù)為百分之一抽樣,其余各年人口數(shù)據(jù)為千分之一抽樣。因此將2005年抽樣分年齡、性別人口數(shù)和抽樣分年齡、性別死亡人口數(shù)除以10,使其與其他各年數(shù)據(jù)保持相同數(shù)量集。
本文根據(jù)加入權(quán)重的極大似然參數(shù)估計方法估計男性、女性死亡率模型參數(shù)。結(jié)果見下頁表1、表2及圖1、圖2。
圖1 男性、女性死亡率模型參數(shù)ax的估計值變動趨勢
由表1、圖1可知,男性及女性死亡率隨著年齡增加先減小后增大,且男性死亡率高于女性死亡率。
圖2 男性、女性死亡率模型參數(shù)kt的估計值變動趨勢
由表2、圖2可知,死亡率隨著時間推移整體呈下降趨勢,且女性死亡率改善速度快于男性。
表1 死亡率模型參數(shù)αx、βx的估計值
表2 死亡率模型參數(shù)κt的估計值
基于參數(shù)估計,運用ARIMA模型,根據(jù)kt的估計值對未來κt的值進行預測,令缺失的2000年及2010年數(shù)據(jù)為前后兩年κt估計值的算數(shù)平均值。分別對ARIMA(2,1,1)、ARIMA(0,1,1)以及ARIMA(1,1,1)模型進行擬合檢驗,根據(jù)lnL準則①lnL是衡量統(tǒng)計模型擬合優(yōu)良性的一種標準,數(shù)值越大擬合效果越好。lnL=(2k-AIC)/2,其中AIC=2k+nln(RSS/n),k是參數(shù)的數(shù)量,假設(shè)模型的誤差項服從獨立正態(tài)分布,n為觀察數(shù),RSS為剩余殘差平方和。以及t統(tǒng)計量進行檢驗。lnL數(shù)值越大擬合效果越好,t統(tǒng)計量越大參數(shù)越顯著。綜合考慮InL檢驗以及t統(tǒng)計量,對于男性及女性均選用ARIMA(1,1,1)模型對參數(shù)κt進行預測??捎嬎隳行?、女性死亡率模型參數(shù)κt的預測表達式分別為:
根據(jù)預測的kt值,預測未來死亡率。
在參數(shù)估計及預測kt的基礎(chǔ)上對未來各年男性、女性0~89歲分年齡死亡率進行預測,預測區(qū)間為20年。其次運用Coale~Kisker方法預測未來各年85歲以上高齡人口分年齡、性別的死亡率,并用該方法預測的未來各年85~89歲分年齡、性別死亡率替代運用Lee-Cater模型預測的未來各年85~89歲分年齡、性別死亡率。
根據(jù)以上方法預測的未來各年分年齡、性別死亡率見下頁表3(由于篇幅限制,本文展示、2020年、2025年、2030年以及2035年分年齡、性別死亡率數(shù)據(jù),且只列示部分年齡數(shù)據(jù))。
由表3預測結(jié)果可以看出我國死亡率水平將持續(xù)改善。
x歲人的預期剩余壽命計算公式為:
其中Kx(t)為x歲的人預期壽命的整數(shù)部分。根據(jù)公式(1)及預測的死亡率,對預期壽命進行預測,結(jié)果見下頁表4(表中僅展示部分年份)。
由表4可知我國預期壽命將不斷延長。
根據(jù)2033年死亡率數(shù)據(jù)計算,2033年我國男性、女性預期壽命分別為81歲和86歲。此預期壽命水平與2015年日本預期壽命水平基本持平(男性平均壽命80歲,女性平均壽命86歲)。考慮到日本是世界上最長壽的國家以及我國與日本經(jīng)濟生活水平的差距,因此本文假定死亡率收斂于2033年的水平,2033年后分年齡、性別死亡率將維持2033年的水平不變。
忽略人口遷移因素,考慮未來死亡率及生育率對未來分年齡、性別人口進行預測。我國總和生育率水平在1996—2003年間約為1.4,最近幾年略有所回升,但大概也只有1.5左右的水平。由于我國逐漸實行寬松的人口政策,因此將2016及以后生育率水平設(shè)定為1.55。
表3 分性別、年齡死亡率預測結(jié)果
表4 未來人口預期壽命
令hx,t表示標準化生育模式,將2015年底的生育模式設(shè)為標準化生育模式,有:
可見hx,t實際上是分攤總和生育率形成分年齡生育率的分年系數(shù)。當其不隨時間變化時,可以用未來總和生育率和穩(wěn)定的生育率模式預測未來的分年齡生育率。則可通過式(4)計算總和生育率為1.55時,未來各年分年齡的生育率水平為:fx,t=hx,2015·1.55 。
由《中國人口和就業(yè)統(tǒng)計年鑒》可知2015年底0~94歲分年齡、性別人口占比,對于95歲以上分年齡人口占比可根據(jù)擴展的跟年齡死亡率進行推估,并推出95歲分年齡人口占比。以2015年底總?cè)藬?shù)及人口占比為基數(shù),基于未來死亡率、生育率預測值,忽略人口遷移因素,預測我國未來分年齡、分性別人口數(shù),并計算老年撫養(yǎng)比。老年撫養(yǎng)比=(65歲以上人口數(shù)/15~64歲人口數(shù))×100%,見表5。
表5 未來老年撫養(yǎng)比
由表5可知,我國未來老年撫養(yǎng)比不斷上升,到2070年將高達84.01%,即平均每10個年輕人會供養(yǎng)8.4個老年人。
通過對死亡率的預測,以及推估的人口預期壽命和老年撫養(yǎng)比,如此快的老齡化進程勢必給我國經(jīng)濟社會各方面產(chǎn)生影響,特別是加重我國養(yǎng)老負擔,給養(yǎng)老保險的持續(xù)發(fā)展提出挑戰(zhàn),對死亡率及人口結(jié)構(gòu)的準確預測,有助于決策層制定符合未來人口特征的人口政策、經(jīng)濟政策以及養(yǎng)老政策等,弱化人口老齡化帶來的負面影響。
參考文獻:
[1] Zaidi A.Population Aging and Financial and Social Sustainability Challenges of Pension Systems in Europe:A Cross-national Perspec?tive[M].London:Cambridge University Press,2012.
[2] Lee R D,Cater L R.Modeling and Forecasting US Mortality[J].Jour?nal of the American Statistical Association,1992,(89).
[3] Girosi F,King G.Understanding the Lee-Carter Mortality Forecasting Method.Technical Report,2007.
[4] Koissi M C,et al.Evaluating and Extending the Lee-Carter Model for Mortality Forecasting:Bootstrap Confidence Interval[J].Insurance:Mathematics and Economics,2006,(38).
[5] 李南,胡華清.中國隨機人口預測[J].中國人口科學,1998,(1).
[6] 李志生,劉恒甲.Lee-Carter死亡率模型的估計與應用——基于中國人口數(shù)據(jù)的分析[J].中國人口科學,2010,(3).
[7] Li N,Lee R,Tuljapurkar S.Using the Lee-Carter Method to Forecast Mortality for Populations With Limited Data[J].International Statisti?cal Review,2004,(1).
[8] 韓猛,王曉軍.Lee-Carter模型在中國城市人口死亡率預測中的應用與改進[J].保險研究,2010,(10).
[9] Robine J M,Eileen M,Yi Z,et al.Human Longevity,Individual Life Duration,and the Growth of the Oldest-Old Population[M].Berlin:Springer,2007.
[10] 安平.基于長壽風險的中國人口死亡率擴展方法[J].統(tǒng)計與決策,2010,(24).