亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大額保險大數(shù)據(jù)智能反欺詐系統(tǒng)設計

        2021-08-06 19:49:55須秋夢章民融
        計算機時代 2021年7期
        關鍵詞:Apriori算法大數(shù)據(jù)技術實踐

        須秋夢 章民融

        摘? 要: 為了更好地識別針對大額保險的欺詐行為,總結(jié)了大額保險的主要風險類型,明確了大額保險反欺詐系統(tǒng)的主要構建方向?;贏priori算法提出了大額保險大數(shù)據(jù)智能反欺詐系統(tǒng)模型,重點分析了數(shù)據(jù)統(tǒng)計識別、保險欺詐規(guī)律挖掘、保險欺詐行為識別。構建的大額保險大數(shù)據(jù)智能反欺詐系統(tǒng)經(jīng)實證運行,結(jié)果表明,基于Apriori算法構建的大額保險大數(shù)據(jù)智能反欺詐系統(tǒng)能快速完成對大額保險欺詐行為的有效識別。

        關鍵詞: 大數(shù)據(jù)技術; Apriori算法; 反欺詐系統(tǒng); 實踐

        中圖分類號:TP311.52? ? ? ? ? 文獻標識碼:A? ? ?文章編號:1006-8228(2021)07-117-03

        Design of big data intelligent anti fraud system for large amount insurance

        Xu Qiumeng, Zhang Minrong

        (1. PICC Property and Casualty Company Limited Shanghai Branch, Shanghai 200010, China; 2. Shanghai Institute of Computing Technology)

        Abstract: In order to better identify the fraud against large amount insurance, this paper summarizes the main risk types of large amount insurance, and defines the main construction direction of large amount insurance anti fraud system. A big data intelligent anti fraud system model for large amount insurance is proposed based on Apriori algorithm, focusing on the analysis of data statistical identification, insurance fraud rule mining, insurance fraud behavior identification. Empirical operation of the constructed big data intelligent anti fraud system for large amount insurance shows that the system based on Apriori algorithm can quickly complete the effective identification of the fraud behaviors against large amount insurance.

        Key words: big data technology; Apriori algorithm; anti fraud system; practice

        0 引言

        大額保險是指投保的保險金額相對較大的人身保險,通常保險金額是在50萬以上,投保時需要對其實施契約調(diào)查,充分掌握投保人的資產(chǎn)情況,明確投保人的投保動機,身體健康情況等[1]。近年來,在中國經(jīng)濟飛速發(fā)展的影響下,國內(nèi)保險行業(yè)迅速崛起,為廣大社會群體提供了健康保障。大額保險作為保險行業(yè)非常重要的一類產(chǎn)品,具有“避債、避稅、傳承”的作用,成為了高凈值人士投資理財?shù)臒衢T選擇,這使得大額保單量持續(xù)增加,保額也在不斷攀升。

        本文擬根據(jù)大額保險的特點,基于關聯(lián)規(guī)則挖掘算法的經(jīng)典算法Apriori算法,設計一套具有較高可行性的反欺詐系統(tǒng),期望以此降低保險運營成本,營造一個良好的保險行業(yè)環(huán)境。

        1 大額保險大數(shù)據(jù)智能反欺詐系統(tǒng)模型設計

        本文從變量篩選、數(shù)據(jù)預處理、保險欺詐規(guī)律挖掘和行為識別等方面,挖掘數(shù)據(jù)信息,基于Apriori算法建立大額保險大數(shù)據(jù)智能反欺詐系統(tǒng)。

        1.1 數(shù)據(jù)統(tǒng)計識別

        1.1.1 變量選擇

        變量篩選主要是從個人行為數(shù)據(jù)中選擇能夠反映個人信用的變量。因為互聯(lián)網(wǎng)上個人行為種類繁多,有些變量能很好體現(xiàn)個人信用度,有些變量則對個人信用的影響不明顯。因此,我們需要選擇合適變量,才能夠準確評價用戶的信用度[2]。

        大額保險用戶大致可分為以下幾個方面。

        用戶數(shù)據(jù):包括用戶的年齡,性別,婚姻,職業(yè),教育程度,收入情況等。

        信用數(shù)據(jù):包括用戶在銀行的征信記錄,用戶在銀行或其他征信公司的征信記錄。

        交易數(shù)據(jù):包括用戶的交易金額,交易頻率,交易地點,交易賬戶等。

        消費數(shù)據(jù):包括用戶的消費時間,消費地點,消費習慣,消費金額等。

        社交數(shù)據(jù):包括用戶的好友數(shù)量,好友的信用評級,好友的身份特征等。

        除此之外變量之間可能存在一定聯(lián)系,共同反映用戶的某種特性,所以我們要盡量從多個維度來刻畫用戶的特征。

        1.1.2 數(shù)據(jù)預處理

        原始數(shù)據(jù)集常規(guī)情況下很難直接將其作為系統(tǒng)數(shù)據(jù)來源,針對該情況,必須對所收集到的數(shù)據(jù)作出相應的處理,以確保建模和統(tǒng)計處理的相關要求。

        1.2 保險欺詐規(guī)律挖掘

        保險欺詐盡管花樣百出,但保險公司有豐富的經(jīng)驗和積累了豐富的數(shù)據(jù),那么就能夠結(jié)合數(shù)據(jù)掌握其具體規(guī)律。目前,不少的保險公司,針對大額保險的欺詐處理,多以保險人員個人的經(jīng)驗為主,并從中總結(jié)出相應的規(guī)律。

        大額保險所出現(xiàn)的欺詐行為分析指標主要包括了欺詐特征、行為特征指標兩個部分,抽取其中的一部分的指標用來對Apriori算法進行演示。

        1.3 保險欺詐行為識別

        經(jīng)由保險公司的信息系統(tǒng)數(shù)據(jù)庫來進行數(shù)據(jù)的構建,在對傳統(tǒng)分析模型進行使用的過程中,結(jié)合Apriori算法數(shù)據(jù)關聯(lián)挖掘技術,對欺詐行為進行分析、識別和評價。借助欺詐行為發(fā)生風險、可能性和成本、指數(shù)的分析,總結(jié)出一套相應的欺詐風險評價結(jié)果,并基于提出反欺詐風險管理策略與監(jiān)督管理體系。

        考慮到保險欺詐行為的識別業(yè)務的特殊性,如果將保險欺詐的挖掘業(yè)務模式應用與保險欺詐行為的識別業(yè)務中是不可行的。為此,本文在進行欺詐行為識別業(yè)務過程中,首先提出了先分布、然后再集中的流程處理模型。保險欺詐行為的詳細識別業(yè)務模型如圖1所示。各個保險公司首先將內(nèi)部數(shù)據(jù)庫中的業(yè)務數(shù)據(jù)進行數(shù)據(jù)預處理,所有的公司處理后的數(shù)據(jù)結(jié)構應該是一致的。

        2 大額保險大數(shù)據(jù)智能反欺詐系統(tǒng)實證分析

        2.1 數(shù)據(jù)預處理及描述

        本文基于Apriori算法構建大額保險大數(shù)據(jù)智能反欺詐新系統(tǒng),具體的操作步驟如下。

        首先掃描整張事務數(shù)據(jù)庫D,設置一個最小支持度Smin,根據(jù)最小支持度Smin產(chǎn)生第一個頻繁項集S1;由S1執(zhí)行連接和剪枝操作,產(chǎn)生候選項集的集合,并根據(jù)Smin產(chǎn)生頻繁項集S2;接下來再由S2產(chǎn)生S3;這樣的操作一直進行下去,直到Sk成為空集時結(jié)束。

        根據(jù)聚類分析中運行效率高低的類別,所有的事務也可以分為五大類。對這五類數(shù)據(jù)分別使用Apriori算法,找到各自情況下的主要影響因素。所以頻繁項集的最小支持度滿足:

        [Sminn

        公式⑴中,[An]主要用于表示第n類運行效率的事務集;[Sminn]主要用于對該事務集的頻繁項集的最小支持度進行表示。

        每個影響因素都產(chǎn)生五個“項”,假設最終數(shù)據(jù)產(chǎn)生的項為B1, B2,B3,B4, C1, C2,C3,D1,...,掃描整張數(shù)據(jù)表格,根據(jù)最小支持度Smin找到第一個頻繁項集的集合;在此基礎上,連接下一個項,產(chǎn)生含有兩個項的候選項集(例如:B1BC2,B1BC3,C2D2,...);剪枝后根據(jù)最小支持度得出第二個頻繁項集的集合。以此類推,直到最后產(chǎn)生的頻繁項集是空集。最終,該算法一共得到五個頻繁項集。

        該算法分別找出了可以欺詐行為風險高、較高、一般、較低、低的頻繁項集。在這些項集中,所有出現(xiàn)的疑似欺詐行為,都是導致大額保險管理風險的主要影響因素。

        2.2 大額保險大數(shù)據(jù)智能反欺詐系統(tǒng)實證結(jié)果

        2.2.1 系統(tǒng)主體業(yè)務流程

        系統(tǒng)的主體業(yè)務流程分為四個階段:

        Step1:數(shù)據(jù)抽取,系統(tǒng)通過把各個保險公司的大額保險業(yè)務數(shù)據(jù)集合起來并進行預處理,然后把保單數(shù)據(jù)保存至汽車保險反欺詐系統(tǒng)的中央數(shù)據(jù)庫。

        Step2:數(shù)據(jù)加工,大額保險反欺詐系統(tǒng)的核必系統(tǒng)通過這些數(shù)據(jù)進行挖掘,發(fā)現(xiàn)其中的規(guī)律,并將規(guī)律與數(shù)據(jù)進行保存。

        Step3:數(shù)據(jù)查詢,當各個保險公司的業(yè)務員在建立保單時,需要通過大額保險的反欺詐系統(tǒng)進行風險分析,以確定該保單是否接受,當投保人要求理賠時,可以根據(jù)分析結(jié)果來確定是否應該賠付與賠付的具體額度。

        Step4:數(shù)據(jù)保存,對于風險特別高的數(shù)據(jù),業(yè)務員應該保存到大額保險反欺詐系統(tǒng)中。

        2.2.2 試驗結(jié)果

        將已有的數(shù)據(jù)分別分為訓練集和測試集兩個部分,訓練集用于反向傳播訓練系統(tǒng),測試集用來檢驗系統(tǒng)輸出的誤差與精度。將所有數(shù)據(jù)循環(huán)處理一次,時間在0.5s左右,此時的測試誤差約15%;循環(huán)處理100、1000、2000次系統(tǒng)的預測精度會有明顯的提升。最終將2000次循環(huán)后的結(jié)果等價為:運行效率與其主要影響因素的定量關系。

        將提取主要影響因素的訓練結(jié)果(CNN4)、不提取主要影響因素的結(jié)果(CNN6)以及使用Apriori算法的結(jié)果放到一張表中進行對比,結(jié)果見表1。

        從表1對比結(jié)果來看,Apriori算法考慮全部影響因素的運行效率預測值誤差為0.98%;而僅考慮主要影響因素的預測誤差0.71%,預測精度都很高,都可以很好地預測運行效率值。

        本系統(tǒng)已經(jīng)在某財險的部分分公司與某保險的部分分公司試運營,通過半年內(nèi)的152件減損與拒賠的案件的處理,總共為保險公司減損或拒賠的金額達9638.84萬元。

        3 結(jié)束語

        近年來,我國各個地區(qū)保險欺詐事件的頻頻出現(xiàn),且發(fā)生率日漸明顯。面對這種層出不窮的欺詐行為,保險人士很難經(jīng)由個人經(jīng)驗來進行有效識別,但隨著大數(shù)據(jù)技術的發(fā)展,基于Apriori算法就能夠?qū)崿F(xiàn)對各項數(shù)據(jù)的關聯(lián)處理,從而快速完成對大額保險欺詐行為的有效識別。為了能夠盡可能地減少欺詐案件,推動社會資金的合理分配與保險行業(yè)的正常發(fā)展,本文基于Apriori算法構建起了大額保險大數(shù)據(jù)智能反欺詐系統(tǒng),較好的實現(xiàn)對現(xiàn)階段大額保險欺詐行為的有效識別,但該系統(tǒng)還存在一定的局限之處,還需要借助數(shù)據(jù)挖掘技術對各項業(yè)務數(shù)據(jù)做進一步的挖掘,提高系統(tǒng)運作的有效性。

        參考文獻(References):

        [1] 白浩,袁智勇,孫睿等.基于Apriori算法和卷積神經(jīng)網(wǎng)絡的配電設備運行效率主要影響因素挖掘[J].電力建設,2020.41(3):31-38

        [2] 翟繼強,馬文亭,肖亞軍.Apriori-KNN算法的警報過濾機制的入侵檢測系統(tǒng)[J].小型微型計算機系統(tǒng),2018.39(12):2632-2635

        猜你喜歡
        Apriori算法大數(shù)據(jù)技術實踐
        基于Hadoop平臺的并行DHP數(shù)據(jù)分析方法
        基于Apriori算法的高校學生成績數(shù)據(jù)關聯(lián)規(guī)則挖掘分析
        基于云平臺MapReduce的Apriori算法研究
        論大數(shù)據(jù)技術在智能電網(wǎng)中的應用
        高校檔案管理信息服務中大數(shù)據(jù)技術的應用
        關聯(lián)規(guī)則挖掘Apriori算法的一種改進
        中國市場(2016年36期)2016-10-19 04:10:44
        大數(shù)據(jù)技術在電氣工程中的應用探討
        大數(shù)據(jù)技術在商業(yè)銀行中的應用分析
        初中政治教學中強化新八德教育探討
        成才之路(2016年26期)2016-10-08 11:14:30
        體驗式學習在數(shù)學教學中的應用研究
        成才之路(2016年25期)2016-10-08 10:50:54
        91国语对白在线观看| 男女18视频免费网站| 国产精品一区二区三区专区| 最新日本人妻中文字幕| 亚洲精品一区二区国产精华液| 久久精品无码一区二区日韩av| 久久狠狠色噜噜狠狠狠狠97| 性一交一乱一乱一视频| 亚洲av日韩aⅴ无码电影| 在线观看国产精品自拍| 亚洲av一二三四又爽又色又色| 精品福利一区二区三区| 水蜜桃在线精品视频网| 婷婷成人丁香五月综合激情| 国产av无码专区亚洲awww | 性一交一乱一乱一视频| 国产高清精品自在线看| 九九精品国产99精品| 国产自产拍精品视频免费看| 国产精品亚洲精品日产久久久| 加勒比特在线视频播放| 色婷婷久久精品一区二区| 一二区成人影院电影网| 日本最大色倩网站www| 亚洲一线二线三线写真| 小12箩利洗澡无码视频网站| 国产成人综合久久久久久| 熟女人妻中文字幕一区| 日韩精品一区二区三区人妻在线| 日本一区二区三级在线观看| 国产精品毛片va一区二区三区| 内射人妻视频国内| 免费人成视频在线| 国内精品无码一区二区三区| 91性视频| 亚洲女同系列高清在线观看| 蜜桃av噜噜噜一区二区三区| 亚洲精品第一页在线观看| 国产女人的高潮国语对白| 亚洲一区爱区精品无码| 一本久久a久久精品综合|