吳景泰 張育儒
摘要:本文從反欺詐角度出發(fā),對意外險風險進行了研究。首先,分析了意外險保險欺詐的現(xiàn)狀、成因和分類。其次,運用Logistic回歸與k-means聚類分析從種類特征和個體特征兩個方面進行理賠風險識別,查找欺詐因子。再次,根據(jù)風險識別的因素確定研究所需的自變量,然后根據(jù)自變量建立決策樹分類處理模型。最后,運用實例進行驗證。
關(guān)鍵詞:意外傷害險;風險分析;保險欺詐;Logistic回歸;決策樹
中圖分類號:F062.9 文獻識別碼:A文章編號:2096-3157(2020)26-0152-03
保險欺詐是指僅投保人、被保險人、保險受益人違反保險最大誠信原則,隱瞞保險標的的真實情況,利用雙方信息不對稱來騙取巨額保險金的行為。意外險保險欺詐不僅給保險企業(yè)造成重大經(jīng)濟損失,增加誠信投保人的投保成本,擾亂市場經(jīng)濟秩序,而且欺詐行為的出現(xiàn)會導致人員傷亡,保險欺詐日益成為危害社會公共安全和經(jīng)濟穩(wěn)定的因素。意外險經(jīng)營狀況直接影響著壽險保險公司的穩(wěn)定性,是保險欺詐的嚴打區(qū),為了索賠,故意制造事故,不僅影響著誠實投保人的利益,給保險公司帶來巨大的經(jīng)濟損失,而且危害公共安全。精準分析理賠風險、識別欺詐因子,具有極為重要的意義。
一、意外傷害事故特征指標
經(jīng)研究,事故的特征指標分為事故總類特征指標和個體特征指標。
1.事故總類特征指標
(1)承保信息提取指標:投保人和被保人姓名、投保人性別、投保人年齡、投保渠道、投保人近期投保次數(shù)、保單總批改次數(shù)、已有索賠次數(shù)、保費、保險金額、被保人年齡、被保人性別、被保人工作性質(zhì)、被保人與投保人關(guān)系、家庭收入債務情況、被保人身體狀況,依次分別用xi(i=1,2,…,15)表示。
(2)出險信息提取:被保人傷亡情況、報警時間、警察開具的事故現(xiàn)場勘查報告和事故性質(zhì)認定書、報案時間、是否第一現(xiàn)場報案、保單與事故的時間間隔、出險時間、事故現(xiàn)場方位概貌情況、事故的形式類型、事故現(xiàn)場痕跡,依次分別用xi(i=16,17,…,25)表示。
(3)理賠信息提?。菏欠耖W賠、是否自動核賠、索賠類型、索賠金額、是否集中一次賠付、是否多家索賠、是否急于索賠,依次分別用xi(i=26,27,…,32)表示。
2.事故個體特征指標
(1)交通事故:制動拖印長度、剎車時間、整體分離痕跡、事故發(fā)生的第一接觸點、附著物、車輛與人的狀態(tài)、姿勢、拋出物距離。
(2)高墜事故:高墜起點高度、血跡面積、物品或工具的散落范圍、著地點與起點的水平距離、承痕客體擦劃痕跡。
(3)煤氣中毒:HbCO%飽和度、尸斑顏色、安定含量、煤氣管道是否泄漏、現(xiàn)場通風情況。
(4)溺水事故:現(xiàn)場足跡數(shù)量、肺中積水量、口鼻部有無泡沫、落水點有無跌倒滑蹬痕跡、手中是否抓有異物。
(5)火災爆炸事故:起火點個數(shù)、起火源、起火物、口腔內(nèi)有無煙灰炭末、炸點形狀、爆炸殘留物種類、拋出物距離。
(6)觸電事故:觸電方式、電流斑個數(shù)、有無皮膚電擊紋、絕緣物體有無破損漏電痕跡、用電導電設備有無分離痕跡。
二、意外傷害險反欺詐識別模型
1.欺詐案件總體指標相關(guān)性分析模型
本文釆用的是二元Logistic回歸分析方法,模型為:
2.反欺詐識別模型構(gòu)建
3. 個體特征指標相關(guān)分析
個體特征指標相關(guān)分析采用的是k-means聚類分析。數(shù)據(jù)點x和y間的歐氏距離是兩個點的k個變量值之差的平方和的平方根,數(shù)學公式為:
選擇k個觀測量作為初始的聚類中心點,根據(jù)距離最小的原則將各個實測量分配到這k個類中。在所有類的實測量中計算變量均值并形成新的k個聚類中心點。依此不斷迭代,直到收斂或達到分析者的要求為止。
4.意外傷害險反欺詐判斷模型
決策樹模型是基于數(shù)據(jù)挖掘算法的機器學習推理模型,提供一系列確定什么條件下得什么值的規(guī)則并對數(shù)據(jù)進行分類的過程。決策樹分類器就像判斷模塊和終止塊組成的流程圖,通過詢問方式區(qū)分是否屬于某些組的一系列問題的結(jié)果來進行預測。意外險欺詐因子數(shù)據(jù)輸入變量為分類、數(shù)值混合變量且為多叉樹,輸出變量為“是否欺詐”二分類變量,因此,本文選擇C 5.0決策樹算法。
三、實證分析
本文選用30個樣本進行分析。將樣本數(shù)據(jù)代入式(1)進行Logistic回歸分析,得出各欺詐因子變量與保險欺詐之間的相關(guān)顯著性大小,剔除掉顯著性為0的無效指標,再將樣本數(shù)據(jù)代入式(1)進行回歸分析,得出結(jié)果(見表1)。
由此,列出欺詐因子變量(見表2)。
以交通事故為例進行k-means聚類分析,其最終聚類中心表如表3所示。
案例A:有一投保人李某出險,性別女,年齡21歲,傍晚6點20分在市區(qū)購物后步行回家,被機動車撞成輕度身殘。經(jīng)檢驗,現(xiàn)場機動車剎車時間1.6秒,制動拖印長度15米,事故現(xiàn)場與事故類型相符。案例B:有一投保人王某出險,性別男,年齡49歲,夜晚10點30分在郊區(qū)鄉(xiāng)道步行回家,被機動車撞成身亡。經(jīng)檢驗,現(xiàn)場機動車剎車時間1.1秒,制動拖印長度5米,事故現(xiàn)場與事故類型不符。將2個案例的識別指標代入決策樹模型,計算欺詐可能性等級。
四、結(jié)語
通過實證運用,本文的結(jié)論是意外險反欺詐識別模型的整體識別效果好,整體預測準確率為97.82%,但應盡可能地增大分析樣本,這樣才能推廣使用。本文的識別指標應進一步完善,特征也應更突出,算法也應進一步優(yōu)化,這樣才能不斷完善我國意外險反欺詐識別體系的構(gòu)建。
參考文獻:
[1]崔松,欒菩菩.關(guān)于保險欺詐的研究綜述[J].經(jīng)濟研究導刊,2013,(06):112~113.
[2]周建濤,秦炳山,迪麗,等.健康、意外保險惜賠識別[J].新疆社會科學,2013,(03):47~52.
[3]Cowell R G, Verrall R J,Yoon Y K.Modeling Operational Risk With Bayesian Networks[J].The Journal of Risk and Insurance,16 November 2007.
[4]張偉偉.基于Tobit回歸的健康保險欺詐識別研究[D].青島:青島大學,2016.
[5]賈蘭.我國機動車保險欺詐及識別問題研究[D].石家莊:河北經(jīng)貿(mào)大學,2019.
[6]劉軼.保險欺詐風險與分類監(jiān)管對策[J].征信,2018,36(02):68~74.
[7]Warren D ?E,Schweitzer M ?E.When weak sanctioning systems work:Evidence from auto insurance industry fraud investigations[J].Organizational Behavior and Human Decision Processes,2019.
[8]Müge Demir,Zeynep nder.Financial connectivity and excessive liquidity:Benefit or risk?[J].Journal of International Financial Markets,Institutions & Money,2019.
[9]Chun Yan,Meixuan Li,Wei Liu,Man Qi.Improved adaptive genetic algorithm for the vehicle Insurance Fraud Identification Model based on a BP Neural Network[J].Theoretical Computer Science,2019.
[10]Michal Reid,Humberto K.Choi,Xiaozhen Han,Xiaofeng Wang,Sanjay Mukhopadhyay,Lei Kou,Usman Ahmad,Xiaoqiong Wang,Peter J.Mazzone.Development of a Risk Prediction Model to Estimate the Probability of Malignancy in Pulmonary Nodules Being Considered for Biopsy[J].Chest,2019,156(2).
作者簡介:
1.吳景泰,沈陽航空航天大學教授,博士;碩士生導師;研究方向:安全經(jīng)濟學。
2.張育儒,沈陽航空航天大學碩士研究生;研究方向:系統(tǒng)安全及保險。