閆 春, 李延星, 陳祥輝, 邱藝偉
(山東科技大學 數(shù)學與系統(tǒng)科學學院, 山東 青島 266590)
分層廣義線性模型在準備金評估中的建模研究*
閆 春?, 李延星, 陳祥輝, 邱藝偉
(山東科技大學 數(shù)學與系統(tǒng)科學學院, 山東 青島 266590)
考慮到賠付流量三角形數(shù)據同一事故年反復觀測的縱向特征以及數(shù)據結構的層次性,建立了分層廣義線性模型.與通常的隨機模型相比,分層廣義線性模型不但可以選擇條件反應變量的分布而且風險參數(shù)分布范圍也更加廣泛.利用h-似然函數(shù)估計分層廣義線性模型的模型參數(shù),降低了計算量.為使模型具有可比性,評估模型的預測精度,推導了模型預測誤差的估計式.為充分利用已知賠付信息,將賠付額和賠付次數(shù)兩種賠付信息納入未決賠款準備金評估模型,建立了兩階段分層廣義線性模型.在線性預測量中考慮了各種固定效應和隨機效應以及模型結構的散布參數(shù),改進了線性預估量結構.研究表明:分層廣義線性模型對于數(shù)據的各種分布及形式都具有很好的適應性,更加符合保險實務現(xiàn)實的賠付規(guī)律.
保險數(shù)學;分層廣義線性模型;h-似然函數(shù);預測誤差
未決賠款準備金的評估方法是非壽險精算的重要組成部分,其評估模型的理論與實踐正在經歷著巨大的變革.為維護保險行業(yè)的健康發(fā)展,保監(jiān)會規(guī)定了保險實務中常用的幾種評估未決賠款準備金的確定性方法.但賠款額本質上是一個隨機變量,確定性評估方法只能基于歷史數(shù)據對未決賠款準備金進行點估計,無法得到估計誤差及波動程度.在全球經濟市場環(huán)境不穩(wěn)定、巨額索賠風險頻繁發(fā)生的情況下,引入可靠性強、能夠度量準備金波動性以及模擬準備金預測分布的隨機模型顯得尤為重要.為了實施新的會計準則,保監(jiān)會財務會計部在2010年1月舉辦了關于非壽險未決賠款責任準備金評估方法的系列培訓,新出臺的保險合同相關會計處理規(guī)定鼓勵財險公司采用隨機性模型與方法(如Mack模型、GLM模型、Bootstrap方法等) 評估未決賠款準備金.
但是隨機性模型并非完美無瑕,仍有不少亟需完善的問題.即使經典的廣義線性模型(Generalized Linear Models,GLM)仍存在不少缺陷,如對于在某些水平上數(shù)據量很少的分類解釋變量GLM參數(shù)估計的標準誤差會很大.對于相互獨立且具有層次性結構的數(shù)據,若直接應用GLM會產生過多的待估參數(shù).此外,GLM線性預估量僅僅包含固定效應,忽略了不同事故年賠付數(shù)據之間的異質性以及相同事故年不同進展年間賠付數(shù)據的相關性.為了克服了GLM的缺陷,有些學者引入了廣義線性混合模型(Generalized Linear Mixed Models, GLMM),該模型在線性預測部分引入了隨機效應,不僅考慮了不同事故年間的互異性,還反映了同一事故年不同進展年賠付數(shù)據由于共同縱向特征而產生的組內數(shù)據的相關性.近年來GLMM在精算中的應用越來越受到國內外學者的重視,如Kelvin(2003)[1]等對索賠頻率分別使用GLM和GLMM建模,通過對比分析指出了GLMM的優(yōu)勢.Antonio和 Beirlant( 2008)[2]基于GLMM 的半參數(shù)回歸模型結合貝葉斯方法模擬了索賠準備金的預測分布.Klinker(2011)[3]進一步研究了GLMM在Buhlmann-Straub信度模型理論上的應用.謝遠濤和楊娟(2014)[4]基于操作時間來重新設計流量三角形,并利用GLMM評估準備金.劉新紅和孟生旺(2014)[5]對增量已決賠款建立GAMLSS模型,并將此模型應用于一組具有明顯異方差的車險數(shù)據,證明擬合效果優(yōu)于均值回歸模型.
然而GLMM的主要缺點是隨機效應必須服從正態(tài)分布,且隨機效應項的引入使得邊際似然函數(shù)的計算更加復雜,往往需要高階微積分運算,算法實現(xiàn)具有局限性.針對GLMM的缺陷,學者們進一步將模型推廣為隨機效應服從指數(shù)類分布族的分層廣義線性模型(Hierarchical Generalized Linear Models,HGLM).該模型的基本思想在于模型的某些參數(shù)本身需要建模,分層模型中固定效應為通過樣本數(shù)據直接估計的模型參數(shù),隨機效應則是通過模型的超參數(shù)間接估計的模型參數(shù).GLM等隨機評估方法大多沒有體現(xiàn)賠付數(shù)據隨事故年反復觀測的縱向特征,而HGLM作為處理縱向數(shù)據的一種自然方式,將賠付流量三角形視作分層數(shù)據,以每個事故年相應的賠付數(shù)據為一個“目標”來評估索賠準備金.近年來有關廣義線性分層模型的研究不斷涌現(xiàn),1996年Y. Lee和J.A.Nelder[6]首次提出了HGLM的概念,并于2006[7]年對HGLM進一步推廣給出了雙廣義線性分層模型.
隨后Y. Lee和M. Noh于2012[8]年又給出了雙廣義線性分層模型的隨機效應方差.Payne R W(2014)[9]回顧了廣義非線性模型及算法,依據HGLM相關理論確定了分層廣義非線性模型.HGLM通過h-似然函數(shù)來估計模型參數(shù),它是反應變量和風險參數(shù)聯(lián)合密度函數(shù)的對數(shù).目前國內關于分層模型的研究剛剛起步,其中張連增、段白鴿[9](2013)依據損失進展模型LDF模型、Cape Cod模型以及Clark(2003)[10]提出的兩種體現(xiàn)損失進展過程的非線性增長曲線——Loglogistic增長曲線和Weibull增長曲線建立了非線性分層模型,后來又將其與貝葉斯理論相融合建立了貝葉斯非線性分層模型(2013)[11],并做了分層模型在非壽險精算學中應用的研究評述(2013)[12],指出了HGLM評估準備金的研究前景.除此之外,非壽險領域中尚未見更一般意義下的HGLM理論及應用研究.
HGLM不但可以處理具有相關性的縱向數(shù)據、空間聚類數(shù)據、甚至更寬泛的聚類數(shù)據,為不滿足獨立性假設且具有層次結構的非壽險賠付數(shù)據提供了處理“大規(guī)模分類”問題的一種自然方式,而且HGLM能提供統(tǒng)一的貝葉斯信度建模框架,種種優(yōu)勢注定了HGLM技術成為當前國際非壽險精算理論研究的熱點領域.隨著國內財險公司對GLM在非壽險精算中的應用,相信經過一段時間的實踐探索,國內財險公司必然會迫切需要對更合適準備金評估和非壽險定價的HGLM應用研究.鑒于此,建立了分層廣義線性模型,利用h-似然函數(shù)估計分層廣義線性模型的模型參數(shù),降低了計算量.通過推導模型預測誤差的估計式來評估模型的預測精度.利用賠付額和賠付次數(shù)兩種賠付信息建立了未決賠款準備金評估的兩階段分層廣義線性模型,并改進了模型的線性預估量使之更加符合真實的賠付規(guī)律.提出的未決賠款準備金評估的HGLM,理論上有助于完善未決賠款準備金評估的建模理論和方法,改進模型穩(wěn)定性、適用范圍及預測能力,豐富未決賠款準備金評估領域內的研究內容.在實際應用價值方面,提出的這一改進模型為精算人員提供構建評估模型的新思路與方法,無論對保險公司還是保險監(jiān)管部門都將提供理論支持和實務參考.
設觀測變量為Yij,隨機效應為U=U(U0,…,Ut),其中(Ui,Yi0,…,Yit),0≤i≤t相互獨立.在第i個對象的隨機效應Ui=ui給定的條件下,Yi0,…,Yit,0≤i≤n相互獨立且服從于某一指數(shù)分布族:
fYij|Ui=ui(y;θij,φ)
(1)
其中ωij>0是已知權重,θij是典則參數(shù),φ是散布參數(shù).Yij|Ui=ui的條件期望和條件方差如下:
(2)
其中V代表方差函數(shù),其表達式為
V(μ)=b″(b′-1(μ))=b″(θ).
結構假設如下:
當wi=g(ui)且g(u)=v=b′-1(u)時稱g為典則聯(lián)結函數(shù)或自然聯(lián)結函數(shù).
其中,β為固定效應,對所有觀測值都相同.隨機分量U 是不可觀測的,同一對象的觀測值對應的Ui的取值相同,不同對象的觀測值對應的Ui的取值不同.u服從任意指數(shù)分布族,其離散參數(shù)常記為λ.反應變量y|u 和隨機效應 u采用不同分布假設,則有與之對應的聯(lián)結函數(shù).在分層廣義線性模型中,如果u的分布為正態(tài)分布,則其聯(lián)結函數(shù)w為恒等函數(shù),此時的分層廣義線性模型即為廣義線性混合模型.y|u 和 u的分布常取為共軛分布,此時分層廣義線性模型有一些特殊的性質,易于計算和理解.因此假設風險參數(shù)Wi=b′-1(Ui)服從Yij|Ui=ui的指數(shù)分布族的共軛分布:
(3)
這里的HGLM其實是一種共軛HGLM,其條件反應變量服從廣義線性模型,具有典則聯(lián)結函數(shù).在線性預估量中有一部分代表已知的協(xié)變量,添加項的值由典則函數(shù)轉化風險參數(shù)得到,風險參數(shù)服從條件反應變量的共軛分布.常見的共軛HGLM如表1所示.
下面以流量三角形為數(shù)據基礎給出分層廣義線性模型參數(shù)估計方法,流量三角形結構如表2所示.
表1 常見的幾類共軛HGLM模型
表2 流量三角形
設賠付額或者賠付次數(shù)為反應變量Yij,i,j=0,…,t.隨機參數(shù)Ui,i=0,…,t是事故年i的不可觀測的風險參數(shù),描述了事故年i的風險特征.其中,回歸參數(shù)β稱為固定效應,wi,i=0,…,t為隨機效應,φ和λ是散布參數(shù).
設xij是Yij的協(xié)變量向量,xij包括了任何影響反應變量Yij分布的所有可觀測特征的影響.假設影響賠付的所有可觀測特征均包含在事故年,進展年和賠付年因素中.不同事故年的反應變量是獨立的,但是由于風險參數(shù)相同,同一事故年i在不同進展年的響應變量Yij并非獨立.這可能是因為在同一事故年重復測得賠付數(shù)據的賠付模式相關或者同一事故年的觀測值之間存在殘差的異質性.
為求解HGLM,Lee和Nelder[6]在1996年介紹了h-似然估計方法,h-似然函數(shù)基于流量三角形的觀測值y=(yij,i+j≤t)T,是風險參數(shù)W=(W0,…,Wt)T和反應變量 Y=(Yij,i+j≤t)T聯(lián)合密度函數(shù)的對數(shù)函數(shù),由h≡log fY,W=lY|W=w+lW定義.其中l(wèi)Y|W=w表示Y|W=w的log-似然函數(shù),與Y|U=u的log-似然函數(shù)等價,lW是W密度函數(shù)的對數(shù).然后,在這個特殊的模型中,將不相關的常數(shù)項略去,得到公式(4):
(4)
其中,由典則聯(lián)接函數(shù)得到:
(5)
(6)
其中θij參照(5)給出的形式,由于假定ψi,i=0,1,…,t已知,那么似然函數(shù)(6)可以視為yij,i+j≤t和ψi擴展GLM的log-似然函數(shù),則相關反應變量和GLM有如下結構:
3)聯(lián)結函數(shù):g=b′-1(典則聯(lián)結)
(7)
設計矩陣和回歸參數(shù)如下:
(8)
(9)
(10)
(11)
(12)
條件均值方差作為評估不確定性的一個度量,在給定Dt觀測值下由公式(12)定義.
(13)
(14)
其中,H11代表似然函數(shù)、相應于β和β的衍生矩陣塊,H22代表相應于w和w的衍生矩陣塊,H12是β和w混合衍生矩陣塊.
(15)
(16)
(17)
注意函數(shù)r可以被看作是由三個函數(shù)的組成,因此雅可比矩陣Jr可以通過J∑JμZ+得到,其中:Z+是函數(shù)w的雅可比矩陣;因此Z+是(t(t+1)/2×(t+1))矩陣,其列向量k相應于賠付值Yij的元素在k=i,k=0,…,t時為1.
Jμ是函數(shù)(ηij)i=1,…,t(i+j>t)(μij=g-1(ηij))i=1,…,t,(i+j>t)的雅可比矩陣.
J∑是函數(shù)(μij)i=1,…,t(i+j>t)∑i,j:i+j>tμij的雅可比矩陣.
(18)
(19)
(20)
據上面公式可得:
(21)
(22)
(23)
(24)
(25)
(26)
通過全期望公式,在給定U下Yij條件獨立,有:
E(R|Dt)=E[E(R|U,Dt)|Dt]
var (R|Dt)=E[var (R|U)|Dt]
+var [E(R|U)|Dt]
(27)
那么得到:
(28)
之前公式右邊第二項的估計值由(26)給出.對于第一項誤差,根據模型假定,得到:
(29)
(30)
(31)
(32)
最后,得到:
(33)
其中第一項由(31)給出,第二項由(24)給出.因此,只要參數(shù)估計值和費舍信息矩陣估計可用,則這兩個等式就可以通過對矩陣微分得到.
有了模型的基本結構、參數(shù)估計方法以及預測誤差,就可以建立未決賠款準備金的評估模型.通常的未決賠款準備金評估模型,往往直接對各單元的累計賠付總額的分布進行假設,并對累計賠付額進行參數(shù)估計,忽略了索賠次數(shù)和案均賠款等重要數(shù)據信息.因此,試圖建立一個兩階段分層廣義線性模型,該模型分別對索賠次數(shù)與案均賠款構造分層廣義線性模型,更符合非壽險未決賠款準備金評估的實際需求.此外,改進了模型的線性預估量,使之不但符合隨進展年的推延先按冪升再按指數(shù)降的賠付規(guī)律,而且減少了待估計參數(shù)得的個數(shù).
第一階段模型,對賠付次數(shù)建立HGLM.通常假設賠付次數(shù)符合二項分布、負二項分布、泊松分布或者過度分散的泊松分布等離散型分布,下面以泊松分布——伽瑪分布共軛HGLM為例給出評估模型.
(34)
c+αi+ζilnj+γij,
(35)
其形式體現(xiàn)了索賠額除了依賴事故年因素αi外,還隨進展年的推延先按冪升再按指數(shù)降的賠付規(guī)律.Hoerl曲線中的進展年因素類似連續(xù)型協(xié)變量,對其進行外推可以得到尾部因子的估計.對Hoerl曲線進行簡化以減少參數(shù),如式(21)所示.
c+αi+ζlnj+γj.
(36)
第二階段模型,對案均賠款額建立HGLM.設案均賠款額服從ED*(指數(shù))類分布,評估模型如式(36)所示.
(37)
在分層廣義線性模型的全新視角下建立了未決賠款準備金的評估模型,鑒于流量三角形層次性和相關性的數(shù)據結構,在線性預測量中考慮了固定效應和隨機效應,并且拓展了風險參數(shù)的分布范圍.利用h-似然函數(shù)估計分層廣義線性模型的模型參數(shù),減少了估計過程的計算量.利用參數(shù)誤差與過程誤差的和作為均方誤差來評估模型的預測精度,使得模型的精確程度具有可比性.此外,將賠付額和賠付次數(shù)兩種賠付信息納入評估模型,建立了兩階段分層廣義線性模型,在線性預測量中考慮了各種固定效應和隨機效應以及模型結構的散布參數(shù),改進了線性預估量結構,并充分利用了已知賠付信息,這使得分層廣義線性模型能夠更好的適應各類數(shù)據的結構與形式,具有更高的靈活性,在保險實務中可以處理各種賠付規(guī)律的案件,較之傳統(tǒng)的廣義線性模型具有更高的實用性.
[1]KELVINKW,YAUKarenCH,YIPHKYUEN.Modellingrepeatedinsuranceclaimfrequencydatausingthegeneralizedlinearmixedmodel[J].JournalofAppliedStatistics, 2003, 30(8): 857-865.
[2]ANTONIOK,BEIRLANTJ.Issuesinclaimsreservingandcredibility:asemiparametricapproachwithmixedmodels[J].JournalofRiskandInsurance,2008,75( 3) : 643-676.
[3]KLINKERF.Generalizedlinearmixedmodelsforratemaking:ameansofintroducingcredibilityintoageneralizedlinearmodelsetting[J].CasualtyActuarialSocietyE-Forum, 2011(2):1-25.
[4] 謝遠濤,楊娟. 基于操作時間和廣義線性混合模型的準備金評估技術研究[J]. 保險研究,2014(3):54-62.
[5] 劉新紅,孟生旺. 基于藤Copula的GAMLSS模型與非壽險準備金評估[J]. 經濟數(shù)學,2014(4):68-74.
[6]LEEY,NELDERJA.Hierarchicalgeneralizedlinearmodels[J].JournaloftheRoyalStatisticalSociety,SeriesB,1996,58 ( 4 ) :619-678.
[7]GELMANA,HILLJ.Dataanalysisusingregressionandmultilevelhierarchicalmodels[M].Cambridge:CambridgeUniversityPress, 2007.
[8]LEEY,NOHM.Modellingrandomeffectvariancewithdoublehierarchicalgeneralizedlinearmodels[J].StatisticalModelling, 2012, 12(6):487-502.
[9] 段白鴿,張連增. 索賠準備金評估的非線性分層增長曲線模型研究[J]. 財經理論與實踐,2013(4):23-29.
[10]CLARKDR.LDFCurve-fittingandstochasticreserving:amaximumlikelihoodapproach[J].CASForum, 2003(3):41-92.
[11]段白鴿,張連增. 索賠準備金評估的貝葉斯非線性分層模型[J]. 山西財經大學學報,2013(10):20-31.
[12]段白鴿,張連增. 分層模型在非壽險精算學中的應用研究評述[J]. 統(tǒng)計研究,2013(05):98-105.
[13]BOOTHJG,HOBERTJP.Standarderrorsofpredictioningeneralizedlinearmixedmodels[J].JournaloftheAmericanStatisticalAssociation, 2012, 93(441):262-272.
[14]LEEY,HAID.OrthodoxBLUPversush-likelihoodmethodsforinferencesaboutrandomeffectsinTweediemixedmodels.StatisticsandComputing2010, 20(3): 295-303.
Modeling Study of Hierarchical Generalized Linear Model in the Assessment of the Reserve
YAN Chun, LI Yan-xing, CHEN Xiang-hui, QIU Yi-wei
(College of Mathematics and Systems Science , Shandong University of Science and Technology, Qingdao, Shandong 266590,China)
By considering the longitudinal characteristics of repeated measurements over time of loss for a given accident year in the loss runoff triangles and regarding the loss runoff triangles as hierarchical data, this paper established a hierarchical generalized linear model. Compared with the usual stochastic model, the hierarchical generalized linear model can choose the distribution of conditional response variables and the distribution of risk parameters is more extensive. Using the h-likelihood function to estimate the model parameters of the hierarchical generalized linear model, the calculation amount was reduced. In order to make the model to be comparable, the prediction accuracy of the model was evaluated, and the estimation formula of the model prediction error was derived. In order to make full use of the known payment information, a two-stage hierarchical generalized linear model was established to consider two payment information -the number of compensation and the amount of compensation. The linear prediction considers the distribution parameters of fixed effects, random effects and the distribution parameters of the model structure. The research shows that the hierarchical generalized linear model has good adaptability to all kinds of distribution and form of the data, and it is more consistent with the real payment rule in the insurance practice.
insurance mathematics; hierarchical generalized linear model; h-likelihood function; prediction error
2016-01-12
國家自然科學基金項目(61502280);青島市應用基礎研究計劃項目(青年專項)(14-2-4-55-jch);山東省自然科學基金面上項目(ZR2014FM009);山東科技大學研究生教育創(chuàng)新計劃項目(KDYC14016)
閆 春(1978—),女,山東鄒城人,副教授,工學博士E-mail:yanchunchun9896@sina.com
F840.65
A