張開強(qiáng)
【摘 要】本文結(jié)合非壽險(xiǎn)精算中普遍存在的具有層次性和相關(guān)性的數(shù)據(jù)結(jié)構(gòu),在分層模型的全新視角下,充分借鑒分層模型的理論研究成果,對分層模型在非壽險(xiǎn)定價(jià)與索賠準(zhǔn)備金評估中的應(yīng)用研究的最新成果進(jìn)行了系統(tǒng)梳理和總結(jié),并將貝葉斯方法、隨機(jī)模擬、信度理論、數(shù)據(jù)分析技術(shù)、科學(xué)計(jì)算等融合其中,在此基礎(chǔ)上,提出了一些有待深入探索和進(jìn)一步擴(kuò)展的新思路,這對提升我國非壽險(xiǎn)精算學(xué)科的統(tǒng)計(jì)分析體系,促進(jìn)我國非壽險(xiǎn)精算學(xué)科的發(fā)展具有重要的科學(xué)研究意義。
【關(guān)鍵詞】非壽險(xiǎn);分層模型;貝葉斯方法
一、引言
分層模型是20世紀(jì)90年代在國際上形成并正被迅速推廣應(yīng)用的新的統(tǒng)計(jì)分析技術(shù)。分層模型通過設(shè)置自身的概率子模型來確定模型參數(shù)的方式,擴(kuò)展了標(biāo)準(zhǔn)的線性模型、廣義線性模型和非線性模型。這些標(biāo)準(zhǔn)模型在進(jìn)行統(tǒng)計(jì)分析時(shí),通常要求觀測數(shù)據(jù)來自獨(dú)立( 隨機(jī)) 變量,而在很多精算和統(tǒng)計(jì)問題中,更多需要處理縱向數(shù)據(jù)、空間聚類數(shù)據(jù)、甚至更一般的聚類數(shù)據(jù),這些數(shù)據(jù)都不滿足獨(dú)立性假設(shè),且具有一定的層次結(jié)構(gòu)。由數(shù)據(jù)的層次結(jié)構(gòu),可將數(shù)據(jù)劃分為不同層次的目標(biāo)組,進(jìn)而引入分層模型的概念。這種分層建模方式可以將復(fù)雜問題分解為相互聯(lián)系的各個組成部分,為科學(xué)研究提供了一種新的分析框架。
在非壽險(xiǎn)精算學(xué)中,定價(jià)與索賠準(zhǔn)備金評估是兩大核心專題。定價(jià)是否充足合理,直接影響到財(cái)險(xiǎn)公司產(chǎn)品競爭力和公司盈利水平20世紀(jì)90年代,英國精算師把GLM引入到非壽險(xiǎn)定價(jià)中,20年來GLM在很多國家的非壽險(xiǎn)定價(jià)實(shí)務(wù)中取得了長足發(fā)展。盡管如此,GLM仍存在一定的缺陷,如當(dāng)某些分類解釋變量在某些水平上的數(shù)據(jù)量很少時(shí),會使得這些水平參數(shù)估計(jì)的標(biāo)準(zhǔn)誤差很大。另外,在這種情況下,直接應(yīng)用GLM也會面臨待估計(jì)參數(shù)個數(shù)過多的問題。為了解決這一問題,精算師試圖將信度理論融入到GLM框架中,涌現(xiàn)出了一些統(tǒng)計(jì)模型與方法的應(yīng)用研究,如廣義線性混合模型,分層廣義線性模型等。作為更一般意義下的分層建模技術(shù),不但為具有相關(guān)性和層次結(jié)構(gòu)的非壽險(xiǎn)經(jīng)驗(yàn)數(shù)據(jù)提供了一種處理大規(guī)模分類問題的自然方式,而且HGLM能提供貝葉斯信度建模的統(tǒng)一框架,也很容易將信度理論融入到GLM或非線性建??蚣苤?。這些優(yōu)勢注定了分層建模技術(shù)成為當(dāng)前國際精算理論研究的熱點(diǎn)問題。
索賠準(zhǔn)備金通常是財(cái)險(xiǎn)公司資產(chǎn)負(fù)債表中份額最大的負(fù)債。在確定財(cái)險(xiǎn)公司的經(jīng)營業(yè)績和償付能力方面,都依賴于索賠準(zhǔn)備金負(fù)債的準(zhǔn)確評估,因此合理評估該負(fù)債對財(cái)險(xiǎn)公司意義重大。目前,關(guān)于索賠準(zhǔn)備金評估的隨機(jī)性方法研究已經(jīng)成為非壽險(xiǎn)精算熱點(diǎn)之一,尤其在采用嚴(yán)格的統(tǒng)計(jì)模型與方法度量準(zhǔn)備金的波動性,進(jìn)而模擬準(zhǔn)備金的預(yù)測分布方面,已經(jīng)取得了很大進(jìn)展。在這方面的研究中,針對損失流量三角形( 按事故年和進(jìn)展年對損失數(shù)據(jù)整理得到的二維數(shù)據(jù)表) 建立模型假設(shè),并結(jié)合隨機(jī)模擬方法來得到準(zhǔn)備金的預(yù)測布。這種主流的評估方法沒有體現(xiàn)出流量三角形數(shù)據(jù)隨時(shí)間反復(fù)觀測的縱向特征。分層模型作為分析縱向數(shù)據(jù)的一種自然方式,可以把損失流量三角形視為分層數(shù)據(jù),每個事故年對應(yīng)的數(shù)據(jù)可作為一個目標(biāo),進(jìn)而應(yīng)用分層模型來研究索賠準(zhǔn)備金的評估問題,這樣不但體現(xiàn)了同一事故年損失數(shù)據(jù)的縱向特征,以反映組內(nèi)數(shù)據(jù)的相關(guān)性,而且也考慮了不同事故年由未觀測到的特征所導(dǎo)致的異質(zhì)性,這是一個新的研究思路,有待于深入探索。另外,近年來貝葉斯方法已經(jīng)成為分層模型中的重要方法之一。如果能把HGLM非線性分層模型與貝葉斯方法結(jié)合起來,應(yīng)用馬爾可夫蒙特卡羅隨機(jī)模擬方法,可以設(shè)想這為得到準(zhǔn)備金的預(yù)測分布提供了另一種思路。最后,在準(zhǔn)備金評估中,結(jié)合損失進(jìn)展過程的建模方法,如各種增長曲線模型和光滑模型等,將這些模型納入分層建模技術(shù)中,也可以有效避免尾部進(jìn)展因子的選定問題,這些問題的深入探索已成為索賠準(zhǔn)備金評估的最新研究方向.
二、分層模型
分層模型的基本思想在于: 模型的某些參數(shù)本身需要建模,即在分層模型中,一些模型參數(shù)不是通過樣本數(shù)據(jù)來估計(jì),而是通過模型的超參數(shù)使用極大似然估計(jì)或相關(guān)的優(yōu)化技術(shù)來估計(jì),這些模型自帶的參數(shù)有時(shí)也稱為隨機(jī)效應(yīng); 另外一些參數(shù)是通過樣本數(shù)據(jù)直接估計(jì)的,這些參數(shù)也稱為固定效應(yīng),從中可以看出,分層模型的核心思想是通過在預(yù)測量中引入隨機(jī)效應(yīng),來體現(xiàn)目標(biāo)組內(nèi)數(shù)據(jù)的相關(guān)性和不同目標(biāo)組間的異質(zhì)性。這一部分將從以下個方面對分層模型的理論進(jìn)行系統(tǒng)梳理和總結(jié)。
(一)從LM到一般化的分層線性模型的理論研究
對于某些不滿足獨(dú)立性并具有層次性的數(shù)據(jù)結(jié)構(gòu)(如聚類數(shù)據(jù)、縱向數(shù)據(jù)),標(biāo)準(zhǔn)的LM不再適合。LM要求觀測變量具有獨(dú)立性,即模型中只含固定效應(yīng)變量,因而沒有考慮數(shù)據(jù)間的相關(guān)性和層次結(jié)構(gòu)。作為推廣,在線性混合效應(yīng)模型中,既含固定效應(yīng)變量,又含隨機(jī)效應(yīng)變量,且隨機(jī)效應(yīng)變量服從正態(tài)分布。有關(guān)隨機(jī)效應(yīng)的經(jīng)典文獻(xiàn)可以參考little等。該文獻(xiàn)對一些標(biāo)準(zhǔn)統(tǒng)計(jì)術(shù)語,基于固定效應(yīng)的估計(jì)量和基于隨機(jī)效應(yīng)的預(yù)測量之間的差異,LME的參數(shù)估計(jì)方法\模型檢驗(yàn)和診斷以及不同LME模型之間擬合效果的比較等進(jìn)行了系統(tǒng)總結(jié),并使用SAS軟件對實(shí)施LME的大量數(shù)值實(shí)例進(jìn)行了細(xì)致討論。LME的更一般推廣是分層線性模型,此時(shí)隨機(jī)效應(yīng)變量的分布可不局限于正態(tài)分布.目前,LME已在社會 學(xué)中得到了充分的應(yīng)用,經(jīng)典著作為Randernbush和Brky。
匯總這些研究,可以得出從LM到HLM推廣具有以下四方面的優(yōu)勢。第一,與LM相比,采用LME和更一般的HLM將會避免模型過度參數(shù)化.第二,在LME和HLM中,隨機(jī)效應(yīng)參數(shù)通過模型的超參數(shù)估計(jì),采用信度加權(quán)平均來計(jì)算。從信度理論的角度講,標(biāo)準(zhǔn)的LM和按類別分組后的LM都是分層模型的特例,即對應(yīng)于HLM的隨機(jī)效應(yīng)的方差分別趨于0和無窮時(shí)的情況。第三,通過僅僅向LM模型中加入附加超參數(shù)的方式,分層建模技術(shù)潛在地可以實(shí)現(xiàn)更好的擬合。第四,分層模型是嵌套模型,可以使用對數(shù)似然統(tǒng)計(jì)量、赤池信息準(zhǔn)則,貝葉斯信息準(zhǔn)則等比較不同模型的優(yōu)劣,權(quán)衡模型的復(fù)雜性和擬合效果,最終選擇合適的模型。
(二)線性分層模型的理論研究
實(shí)際中,變量之間也可能存在非線性關(guān)系,對于那些不可線性化的非線性模型,以及更適合采用非線性模型來描述的問題,采用一個具體非線性函數(shù)形式可以清晰地為這些問題建模。以增長曲線為例,對增長過程的主觀判斷以及經(jīng)驗(yàn)有助于確定選擇哪一類曲線。二是模型的簡潔性。精心挑選的非線性函數(shù),有時(shí)能為一個非線性過程建立比含有多個多項(xiàng)式的線性模型更少的參數(shù)。同時(shí),非線性分層建模方法也可以避免模型過度參數(shù)化。三是對觀測樣本外數(shù)據(jù)的有效性。當(dāng)然,使用一個模型對樣本外數(shù)據(jù)進(jìn)行外推,始終會面臨預(yù)測效果不佳的可能。然而,在選定一模型時(shí),非線性分層模型至少提供了根據(jù)對具體問題的了解程度進(jìn)行判斷的思路。與一個缺乏簡潔性或更多非理論性的曲線擬合方法相比,這樣一種方法操作更有效。
值得注意的是,在使用HLM估計(jì)參數(shù)時(shí)不需要設(shè)定參數(shù)的初始值,而使用非線性分層模型估計(jì)參數(shù)時(shí)則需要設(shè)定參數(shù)的初始值,不同的初始值會導(dǎo)致模型不一定收斂,或者不能收斂到一個正確的結(jié)果.通過快速觀察殘差圖更有助于判斷結(jié)果是否正確.在大多數(shù)情況下,可以通過簡單分析方法輔助選擇初始值.如在貝葉斯非線性分層模型中,可以參考參數(shù)的極大似然估計(jì),選取合適的先驗(yàn)分布來得到參數(shù)的后驗(yàn)分布.另外,為了估計(jì)模型參數(shù),需要使用MCMC方法模擬完整的后驗(yàn)分布,進(jìn)而使用每個參數(shù)的模擬樣本值實(shí)施推斷。
三、啟示和建議
本文在分層模型的全新視角下,結(jié)合非壽險(xiǎn)精算中普遍存在的具有層次性和相關(guān)性的數(shù)據(jù)結(jié)構(gòu),探討了國外非壽險(xiǎn)定價(jià)與索賠準(zhǔn)備金評估的最新研究方向致力于為我國非壽險(xiǎn)精算學(xué)科建立一套完善一致的統(tǒng)計(jì)分析架構(gòu)。
綜上所述,本文面向國際精算理論研究前沿與熱點(diǎn),結(jié)合財(cái)險(xiǎn)公司目前對精算技術(shù)的需求,以分層模型的全新視角,充分借鑒分層模型的理論研究成果,對分層模型在非壽險(xiǎn)定價(jià)與索賠準(zhǔn)備金評估中的應(yīng)用研究的最新成果進(jìn)行了系統(tǒng)梳理和總結(jié),并提出了一些有待深入探索和進(jìn)一步擴(kuò)展的新思路。其中,涉及分層模型對非壽險(xiǎn)精算其他專題和技術(shù)(如經(jīng)驗(yàn)費(fèi)率厘定\信度理論、貝葉斯方法、隨機(jī)模擬數(shù)值方法等)的包含與擴(kuò)展,這必將深化對非壽險(xiǎn)精算諸分支、諸方法的理論研究,提升非壽險(xiǎn)精算學(xué)科的統(tǒng)計(jì)分析體系,促進(jìn)非壽險(xiǎn)精算學(xué)科的發(fā)展。
【參考文獻(xiàn)】
[1] 段白鴿, 張連增.分層模型在非壽險(xiǎn)精算學(xué)中的應(yīng)用研究評述[J].統(tǒng)計(jì)研究, 2013, 30(5):98-105.
[2] 盧志義, 劉樂平.廣義線性模型在非壽險(xiǎn)精算中的應(yīng)用及其研究進(jìn)展[J].統(tǒng)計(jì)與信息論壇,2007,22(4):26-31.
[3] 孫維偉, 張連增. 基于HLM2的算例分析及其在中國非壽險(xiǎn)精算中的思考[J].統(tǒng)計(jì)與決策,2016(22):4-8.