李宛虹 李墨文
【摘要】隨著保險(xiǎn)欺詐問題的重要性越來越被人們所認(rèn)知和重視,保險(xiǎn)公司希望能獲得更準(zhǔn)確、更靈活的欺詐率估計(jì)方法。本文簡要分析介紹了PRIDIT與PRIDIT-FRE方法的特點(diǎn),希望進(jìn)一步為研究保險(xiǎn)欺詐程度探測分類提供參考。
【關(guān)鍵詞】保險(xiǎn)欺詐;非監(jiān)督分類方法;欺詐可能性評(píng)分
在保險(xiǎn)欺詐行為愈發(fā)嚴(yán)重、保險(xiǎn)欺詐索賠數(shù)額與日俱增的情況下,各保險(xiǎn)行業(yè)相關(guān)企業(yè)和機(jī)構(gòu)都越來越重視保險(xiǎn)欺詐問題,對(duì)于一個(gè)準(zhǔn)確而又經(jīng)濟(jì)的欺詐程度探測分類的方法的需求也迫在眉睫。
但由于保險(xiǎn)欺詐的特性,傳統(tǒng)的監(jiān)督下數(shù)據(jù)分類方法不再適用:第一,它的成本太高;第二,對(duì)“欺詐”這一標(biāo)簽的界定十分模糊;第三,由于保險(xiǎn)欺詐當(dāng)事人傾向于隱藏自身行為的欺詐性質(zhì),監(jiān)督分類方法的有效性不容樂觀。因此,非監(jiān)督分類方法成為了我們的重點(diǎn)考慮對(duì)象。
最初使用的RIDIT評(píng)分方法只針對(duì)離散變量。而在這基礎(chǔ)上發(fā)展而成的PRIDIT方法,將連續(xù)變量也納入了考量,提高了評(píng)分的準(zhǔn)確性。對(duì)于單個(gè)預(yù)測變量的選擇,我們自然應(yīng)當(dāng)考慮使更低的評(píng)分能反映更高的欺詐可能性。PRIDIT方法定義了“變量分?jǐn)?shù)”,其對(duì)每一不同的變量都預(yù)測了欺詐可能性大小:并定義At以反映變量t對(duì)欺詐類與非欺詐類索賠的區(qū)分程度——At取值越大,說明變量t區(qū)分能力越強(qiáng),則其越適合用來作為PRIDIT方法的評(píng)分依據(jù)。單個(gè)變量雖然無法對(duì)判斷欺詐是否存在起到?jīng)Q定性作用,但每一變量都有良好的提示效果。PRIDIT方法就是將這些提示聯(lián)系起來,從而得以對(duì)索賠進(jìn)行欺詐風(fēng)險(xiǎn)程度的排序——這就需要計(jì)算各預(yù)測變量在總體分?jǐn)?shù)中的權(quán)重。變量權(quán)重是利用各變量分?jǐn)?shù)與總體分?jǐn)?shù)的關(guān)系,以等權(quán)重為起點(diǎn),使用迭代法計(jì)算得出的。
然而在實(shí)際運(yùn)用過程中,新的問題又產(chǎn)生了。由于保險(xiǎn)欺詐當(dāng)事人會(huì)在對(duì)保險(xiǎn)人行為的“學(xué)習(xí)”中發(fā)現(xiàn)規(guī)律,從而隱藏自身的欺詐行為,使保險(xiǎn)人對(duì)欺詐率的估計(jì)值偏離真實(shí)值;因此,為了使估計(jì)準(zhǔn)確,保險(xiǎn)人不得不花費(fèi)大量金錢來更新樣本數(shù)據(jù),這就導(dǎo)致了成本增加。一個(gè)優(yōu)越的估計(jì)方法,應(yīng)當(dāng)能以較低成本被納入公司的保險(xiǎn)欺詐管理體系,減輕保險(xiǎn)欺詐問題對(duì)公司運(yùn)營的不利影響。
在這種情況下,PRIDIT-FRE方法進(jìn)入了我們的視野。不同于上述PRIDIT方法利用各欺詐預(yù)測變量對(duì)每一索賠的欺詐可能性進(jìn)行評(píng)分,使得索賠可根據(jù)評(píng)分排序、分類:PRIDIT-FRE方法是在PRIDIT的基礎(chǔ)上,通過在欺詐類和非欺詐類情況下兩種情況下期望值之間的數(shù)學(xué)關(guān)系得出欺詐率的估計(jì)。
我們也可以將PRIDIT-FRE方法與最簡單明了的“標(biāo)準(zhǔn)”方法即“計(jì)數(shù)法”(直接計(jì)算欺詐索賠數(shù)在總索賠數(shù)中所占比例)進(jìn)行對(duì)比,這可以讓我們輕松地體會(huì)到PRIDIT-FRE方法的優(yōu)越性。不同于“計(jì)數(shù)法”,PRIDIT-FRE方法在利用PRIDIT對(duì)整體數(shù)據(jù)進(jìn)行評(píng)分后,只需要獲知一個(gè)小樣本在保險(xiǎn)欺詐可能性方面的分類情況,就能給出較為準(zhǔn)確的估計(jì)。Jing Ai(2012)等人使用了西班牙與美國兩個(gè)經(jīng)驗(yàn)數(shù)據(jù)集對(duì)PRIDIT-FRE方法進(jìn)行了實(shí)證分析。其中,西班牙數(shù)據(jù)集為車險(xiǎn)財(cái)產(chǎn)損失索賠數(shù)據(jù)集,分為合法索賠與欺詐索賠兩類。美國數(shù)據(jù)集為車險(xiǎn)人身傷亡索賠數(shù)據(jù)集,并按欺詐可能性進(jìn)行分類、排序。兩個(gè)數(shù)據(jù)集的差別可更好地論證PRIDIT-FRE方法在不同情況下的優(yōu)越性。
樣本有偏差是研究者在估計(jì)保險(xiǎn)欺詐問題時(shí)經(jīng)常需要考慮的因素,因?yàn)檫@往往會(huì)對(duì)方法結(jié)果產(chǎn)生重要影響。對(duì)此,一方面,審查樣本的工作人員需要克服自滿或大意的情緒,盡可能保證樣本的準(zhǔn)確性:另一方面,我們也應(yīng)盡可能去發(fā)掘如PRIDIT-FRE方法這樣不依賴于工作人員審查準(zhǔn)確性的方法,從程序上直接解決這一問題。根據(jù)PRIDIT-FRE方法與計(jì)數(shù)法的對(duì)比我們也可以看出,所謂“標(biāo)準(zhǔn)”的并不一定是準(zhǔn)確的,好的估計(jì)方法應(yīng)該充分考慮到可行性(成本低、操作方便)和準(zhǔn)確性??偠灾?,PRIDIT-FRE方法是一種穩(wěn)定的估計(jì)方法,它在各種復(fù)雜情況下均能準(zhǔn)確地估計(jì)目標(biāo)值。而在監(jiān)督方法的對(duì)比過程中,我們也可以發(fā)現(xiàn),研究者并不需要花費(fèi)大量時(shí)間精力去預(yù)定義欺詐標(biāo)準(zhǔn),反而更為重視欺詐類索賠分類。這也充分說明,在未來的數(shù)據(jù)分析方法設(shè)計(jì)上,我們應(yīng)更多地關(guān)注數(shù)據(jù)的內(nèi)部結(jié)構(gòu),研究其內(nèi)在聯(lián)系反映出的規(guī)律。