包振華,張 姝
(遼寧師范大學(xué) 數(shù)學(xué)學(xué)院,遼寧 大連 116029)
保險(xiǎn)損失數(shù)據(jù)因既包含大量小額損失又包含少量的高額損失,從而具有尖峰厚尾的特點(diǎn)。在保險(xiǎn)精算相關(guān)文獻(xiàn)中,很多學(xué)者使用對(duì)數(shù)正態(tài)分布、逆高斯分布、伽馬分布及威布爾分布等單一分布對(duì)此類數(shù)據(jù)進(jìn)行擬合,但對(duì)實(shí)際損失數(shù)據(jù)的尾部擬合往往不足。Cooray和Ananda(2005)[1]提出了一類組合統(tǒng)計(jì)模型,他們用對(duì)數(shù)正態(tài)分布擬合小額損失而用帕累托分布擬合髙額損失,同時(shí)保證對(duì)數(shù)正態(tài)分布和帕累托分布的平滑連接。使用丹麥火災(zāi)損失數(shù)據(jù)擬合實(shí)驗(yàn)表明,該組合模型的擬合效果優(yōu)于單一模型。Scollnik(2007)[2]使用可變權(quán)重系數(shù)代替文獻(xiàn)[1]中組合模型的常系數(shù),提高了組合模型的擬合效果,并提出對(duì)數(shù)正態(tài)-廣義帕累托組合模型。Scollnik和Sun(2012)[3]按相同的思路設(shè)計(jì)了威布爾-帕累托組合模型,并與對(duì)數(shù)正態(tài)-帕累托組合模型進(jìn)行比較。Bakar等(2015)[4]提出一種新的組合方法,該組合模型依據(jù)組合分布的參數(shù)調(diào)節(jié)混合權(quán)重系數(shù)和閾值,研究了威布爾分布與其他厚尾分布的組合,實(shí)證結(jié)果顯示威布爾-布爾組合模型擬合效果最優(yōu)。
本文采用文獻(xiàn)[4]的方法研究指數(shù)威布爾分布與一類轉(zhuǎn)換貝塔分布族的組合統(tǒng)計(jì)模型,使用R語言對(duì)丹麥火險(xiǎn)損失數(shù)據(jù)進(jìn)行擬合,并通過似然比檢驗(yàn)比較指數(shù)威布爾組合模型和相應(yīng)的威布爾組合模型。
指數(shù)威布爾分布(以下簡(jiǎn)記為EW分布)通過在威布爾分布中增加一個(gè)形狀參數(shù)得到,最早由Mudholkar和Srivastava(1993)[5]提出,相關(guān)性質(zhì)可參見文獻(xiàn)[6]。設(shè)隨機(jī)變量X服從EW分布,其分布函數(shù)為:
相應(yīng)的概率密度函數(shù)為:
其中α為第一形狀參數(shù),γ為第二形狀參數(shù),λ為尺度參數(shù)。圖1和圖2分別展示了EW密度函數(shù)關(guān)于兩個(gè)形狀 參 數(shù)α,γ的 變 化 。 當(dāng)λ=0.5,γ=2時(shí),分 別 取α=0.5,1,2,4,EW分布密度變化如圖1所示。EW分布的密度曲線都是單峰的,且當(dāng)參數(shù)α<1時(shí),概率密度單調(diào)遞減。保持參數(shù)γ,λ不變,隨著α的增加,概率密度的峰值右移且變大,密度曲線形態(tài)越來越相似。當(dāng)λ=0.5,α=2時(shí),分別取γ=0.5,1,2,4,EW分布密度變化如圖2所示。當(dāng)γ<1時(shí),概率密度函數(shù)單調(diào)遞減,且只有尾部形態(tài)。保持參數(shù)α,λ不變,隨著γ的增加,概率密度的峰值越來越大,且尾部越來越薄。
圖1 EW分布關(guān)于參數(shù)α概率密度變化
圖2 EW分布關(guān)于參數(shù)γ概率密度變化
相較于威布爾分布的單調(diào)失效率函數(shù),EW分布的失效率函數(shù)根據(jù)形狀參數(shù)和尺度參數(shù)取值范圍的不同而呈現(xiàn)出不同的特征。具體的,當(dāng)α=γ=1時(shí),失效率函數(shù)為一條直線;γ≥1且αγ≥1時(shí),失效率函數(shù)單調(diào)遞增;γ≤1且αγ≤1時(shí),失效率函數(shù)單調(diào)遞減;γ<1且αγ<1時(shí),失效率函數(shù)為浴盆型;γ>1且αγ>1時(shí),失效率函數(shù)為反浴盆型。這些獨(dú)特屬性使得EW分布在壽命數(shù)據(jù)分析方面得到了廣泛的應(yīng)用。
特別地,當(dāng)α=1時(shí),EW分布退化為經(jīng)典的威布爾分布;當(dāng)γ=1時(shí),EW分布退化為廣義指數(shù)分布(以下簡(jiǎn)記為EE分布)。EE分布的形態(tài)與威布爾和伽馬分布相似,相關(guān)性質(zhì)參見文獻(xiàn)[7]。
考慮Bakar等(2015)[4]提出的組合方法,組合模型的密度函數(shù)具有如下形式:
為某個(gè)概率密度函數(shù),F(xiàn)i(x)為相應(yīng)的累積分布函數(shù)。為保證概率密度的連續(xù)性,組合模型在閾值θ處滿足以下兩個(gè)條件:
根據(jù)約束條件(2),可以給出參數(shù)φ的具體表達(dá)式:
其中(?)=1-Fi(?)。根據(jù)約束條件(3),參數(shù)θ可由式(5)確定:
以下假設(shè)f1(x)由式(1)確定,而f2(x)屬于轉(zhuǎn)換的貝塔分布族,其密度函數(shù)由下式確定:
其中β,φ和τ是三個(gè)形狀參數(shù),σ是尺度參數(shù),且所有參數(shù)均大于零,貝塔函數(shù)B(?)定義為:
本文將考慮轉(zhuǎn)換的貝塔分布族中如下六種形式的分布,詳細(xì)介紹參見文獻(xiàn)[8]:
(1)當(dāng)φ=1時(shí),f2(x)退化為廣義帕累托分布;
(2)當(dāng)β=1時(shí),f2(x)退化為逆布爾分布;
(3)當(dāng)β=1,φ=τ時(shí),f2(x)退化為逆Paralogistic分布;
(4)當(dāng)φ=1,τ=1時(shí),f2(x)退化為帕累托分布;
(5)當(dāng)τ=1,φ=β時(shí),f2(x)退化為Paralogistic分布;
(6)當(dāng)τ=1時(shí),f2(x)退化為布爾分布,具體表達(dá)式如下:
本文僅以EW-布爾組合模型為例,即f2(x)由式(6)確定,其他組合模型的構(gòu)造過程類似。根據(jù)式(4),φ的表達(dá)式可寫成如下形式:
盡管閾值θ沒有一個(gè)確切的表達(dá)式,但它可以根據(jù)式(5)求出數(shù)值解。經(jīng)過化簡(jiǎn),最終EW-布爾組合模型共由六個(gè)未知參數(shù)α,γ,λ,β,φ,σ確定。EW分布、布爾分布及EW-布爾組合模型的密度函數(shù)如圖3所示,其中EW分布參數(shù)取為α=4,γ=2,λ=0.5,布爾分布參數(shù)為β=1.5,φ=0.5,σ=1。EW-布爾組合模型的密度峰值比EW分布更小,尾部比EW分布更厚,說明EW-布爾組合模型可以更好的擬合低頻高額損失數(shù)據(jù)。
圖3 EW-布爾組合模型密度函數(shù)圖
本文引用丹麥火災(zāi)損失數(shù)據(jù)進(jìn)行實(shí)證分析。該數(shù)據(jù)記錄了1980—1990年由火災(zāi)引起的保險(xiǎn)索賠數(shù)據(jù),并將數(shù)據(jù)調(diào)整到1985年的物價(jià)水平,以排除通貨膨脹和價(jià)格指數(shù)等因素的影響,單位是百萬克朗,共2492個(gè)數(shù)據(jù),其中損失低于1百萬克朗的數(shù)據(jù)有325個(gè)。該數(shù)據(jù)集可在R語言的SMPracticals包中找到。丹麥火險(xiǎn)損失數(shù)據(jù)的相關(guān)描述性統(tǒng)計(jì)量如表1所示。
表1 丹麥火災(zāi)損失數(shù)據(jù)描述性統(tǒng)計(jì)量
由表1可知,該組數(shù)據(jù)的峰度為546.13,偏度為19.88,且1/4分位數(shù)與3/4分位數(shù)離最大值很遠(yuǎn),具有明顯的正偏性,如圖4所示。圖5的損失數(shù)據(jù)直方圖顯示該組數(shù)據(jù)在1左右處達(dá)到密度峰值,并有很長(zhǎng)的右拖尾,說明數(shù)據(jù)具有明顯的尖峰厚尾特征。
圖4 丹麥火險(xiǎn)數(shù)據(jù)箱線圖
圖5 丹麥火險(xiǎn)數(shù)據(jù)柱狀圖
使用最大似然估計(jì)法對(duì)組合模型進(jìn)行參數(shù)估計(jì),以NLL、AIC和BIC作為檢驗(yàn)標(biāo)準(zhǔn),并借助R語言實(shí)現(xiàn)具體運(yùn)算。如前所述,本文將考察轉(zhuǎn)換貝塔分布族中的六種分布,包括帕累托分布、廣義帕累托分布、布爾分布、逆布爾分布、Paralogistic分布以及逆Paralogistic分布?;贓W組合模型的估計(jì)結(jié)果如表2所示。
表2 EW組合模型的估計(jì)結(jié)果
根據(jù)表2結(jié)果顯示,各EW組合模型中參數(shù)α,γ,λ的估計(jì)值十分相似,說明EW組合模型的擬合差異主要取決于閾值后分布的擬合效果。其中EW-布爾組合模型的NLL和AIC在所有組合模型中最小,意味著在這兩個(gè)準(zhǔn)則下EW-布爾組合模型的擬合效果最好。由于布爾分布比逆Paralogis分布多一個(gè)參數(shù),EW-布爾組合模型的BIC比EW-逆Paralogis組合模型大0.841,意味著在BIC準(zhǔn)則下EW-逆Paralogis組合模型的擬合效果最好。
由于EW-帕累托組合模型和EW-布爾組合模型是分級(jí)的巢式模型,且前者是后者的特例,下面采用似然比檢驗(yàn)來判斷EW-布爾組合模型擬合效果是否有顯著性提高。檢驗(yàn)量似然比表達(dá)式如下:
其中L(θ0)和L(θ1)分布表示EW-帕累托組合模型和EW-布爾組合模型的最大對(duì)數(shù)似然值。根據(jù)表2可知LR=2[3821.889-3815.202]=13.374,根據(jù)Wilks提出的理論,LR近似符合自由度為1的卡方分布,根據(jù)卡方檢驗(yàn)臨界值表,顯著性水平為0.001時(shí)對(duì)應(yīng)臨界值為9.500,說明LR相應(yīng)p值應(yīng)小于0.001,且EW-布爾組合模型與EW-帕累托組合模型比顯著性提高。
特別地,當(dāng)EW分布中的形狀參數(shù)α=1時(shí),EW組合模型即轉(zhuǎn)化為威布爾組合模型,基于威布爾組合模型的估計(jì)結(jié)果如表3所示。
表3 威布爾組合模型的估計(jì)結(jié)果
根據(jù)表3結(jié)果顯示,威布爾-布爾組合模型的NLL和AIC最小,說明在這兩個(gè)準(zhǔn)則下威布爾-布爾組合模型的擬合效果最優(yōu),這個(gè)結(jié)論與Bakar等(2015)[4]的研究結(jié)果一致。與表2結(jié)果對(duì)比,威布爾組合模型與相應(yīng)EW組合模型閾值后分布擬合結(jié)果相似,說明兩種組合模型擬合效果差異主要取決于閾值前的分布擬合效果。
注意到威布爾組合模型是相應(yīng)EW組合模型的特例,并且根據(jù)表2和表3結(jié)果可知EW組合模型的NLL值比相應(yīng)的威布爾組合模型小2至3。以比較EW-布爾組合模型和威布爾-布爾組合模型擬合效果為例,根據(jù)式(7)可得LR=2[3817.57-3815.202]=4.736,當(dāng)自由度為1顯著性水平為0.05時(shí),卡方臨界值為3.841,說明LR相應(yīng)p值應(yīng)小于0.05,EW-布爾組合模型的擬合效果與威布爾-布爾組合模型相比有顯著性提高。類似地可知每個(gè)EW組合模型相較于威布爾組合模型有顯著性提高。
保險(xiǎn)損失數(shù)據(jù)往往呈現(xiàn)尖峰厚尾的特點(diǎn),相比于單一分布,組合模型可以明顯提高這類數(shù)據(jù)的擬合效果。本文基于指數(shù)威布爾分布構(gòu)建了一類組合統(tǒng)計(jì)模型,其中閾值之后的分布取自轉(zhuǎn)換的貝塔分布簇,當(dāng)參數(shù)取特殊值時(shí)獲得六種具體的組合分布。使用R語言對(duì)丹麥火險(xiǎn)損失數(shù)據(jù)做擬合分析,給出六種組合模型的參數(shù)估計(jì)及擬合優(yōu)度比較,結(jié)果表明EW-布爾組合模型在NLL和AIC準(zhǔn)則下擬合效果最好。根據(jù)似然比檢驗(yàn),EW組合模型擬合效果相較于威布爾組合模型有顯著性提高,意味著在尖峰厚尾損失數(shù)據(jù)建模中,EW組合模型具有較大優(yōu)勢(shì)。
[1]Cooray K,Ananda M M A.Modeling Actuarial Data With a Composite Lognormal-Pareto Model[J].Scandinavian Actuarial Journal,2005,(5).
[2]Scollnik D P M.On Composite Lognormal-Pareto Models[J].Scandinavian Actuarial Journal,2007,(1).
[3]Scollnik D P M,Sun C.Modeling With Weibull-Pareto models[J].North American Actuarial Journal,2012,16(2).
[4]Bakar S,Hamzah N A,Maghsoudi S,et al.Modeling Loss Data Using Composite Models[J].Insurance Mathematics and Economics,2015,(61).
[5]Mudholkar G S,Srivastava D K.Exponentiated Weibull Family for Analyzing Bathtub Failure Rate Data[J].IEEE Transactions on Reliability,1993,(42).
[6]Pal M,Ali M M,Woo J.Exponentiated Weibull Distribution[J].Statistica,2006,2(2).
[7]Gupta R D,Kundu D.Exponentiated Exponential Family:an Alternative to Gamma and Weibull[J].Biometrical Journal,2001,43(1).
[8]Klugman S A,Panjer H H,Willmot G E.Loss Models:From Data to Decisions[M].New Jersey:Wiley,2012.