亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        K-means聚類在A保險(xiǎn)公司客戶細(xì)分模型中的研究

        2021-10-28 13:27:18徐華杰
        關(guān)鍵詞:輪廓保險(xiǎn)公司聚類

        ◆徐華杰

        K-means聚類在A保險(xiǎn)公司客戶細(xì)分模型中的研究

        ◆徐華杰

        (華東師范大學(xué)計(jì)算機(jī)工程學(xué)院 上海 200000)

        實(shí)現(xiàn)客戶管理、轉(zhuǎn)變傳統(tǒng)保險(xiǎn)營(yíng)銷模式是保險(xiǎn)行業(yè)大數(shù)據(jù)應(yīng)用最重要的一個(gè)方向[1]。本文以上海市A保險(xiǎn)公司的真實(shí)生產(chǎn)客戶數(shù)據(jù)為基礎(chǔ),通過(guò)K-means訓(xùn)練客戶樣本數(shù)據(jù),實(shí)現(xiàn)保險(xiǎn)金融行業(yè)對(duì)客戶的精準(zhǔn)營(yíng)銷[2]。本算法基于平均輪廓系數(shù)(Average Silhouette Coefficient)尋找最優(yōu)K值[8]和 K-means 算法搭建真實(shí)客戶的聚類模型,然后基于改進(jìn)的RFM客戶模型進(jìn)行聚類因子建模,迭代優(yōu)化,該模型可用于產(chǎn)品開(kāi)發(fā)師的設(shè)計(jì)指南,經(jīng)真實(shí)市場(chǎng)驗(yàn)證可知,該模型可以提升保單投保率和續(xù)保率。

        保險(xiǎn)客戶;K-means;RFM模型;無(wú)監(jiān)督學(xué)習(xí)

        1 引言

        保險(xiǎn)公司都有著大量的客戶數(shù)據(jù)信息,對(duì)于千萬(wàn)級(jí)別的客戶數(shù)據(jù),大部分公司對(duì)其利用并不充分,造成了嚴(yán)重的資源浪費(fèi)。而且隨著不斷變化的互聯(lián)網(wǎng)金融環(huán)境,其原有的保險(xiǎn)代理人中介營(yíng)銷模式已經(jīng)無(wú)法應(yīng)對(duì)當(dāng)前的需求大環(huán)境,想要真正地實(shí)現(xiàn)精準(zhǔn)營(yíng)銷,必須從客戶數(shù)據(jù)源著手,通過(guò)技術(shù)手段進(jìn)行數(shù)據(jù)挖掘,并對(duì)數(shù)據(jù)挖掘結(jié)果進(jìn)行聚類操作,進(jìn)而指定更加完備的精準(zhǔn)營(yíng)銷策略。

        本文所研究的客戶分類技術(shù)將是以上海某保險(xiǎn)集團(tuán)真實(shí)客戶數(shù)據(jù)為例,對(duì)保險(xiǎn)公司客戶數(shù)據(jù)整合利用的應(yīng)用可以更加使系統(tǒng)從科學(xué)的視角將保險(xiǎn)公司的源數(shù)據(jù)、技術(shù)手段和業(yè)務(wù)流程進(jìn)行綜合探究,客戶管理不僅可以提高本項(xiàng)目組在公司內(nèi)部的核心競(jìng)爭(zhēng)力,還可以提高客戶對(duì)公司品牌的忠誠(chéng)度和公眾認(rèn)可度,同時(shí)還可以降低營(yíng)銷成本,大幅提升服務(wù)效率。

        2 數(shù)據(jù)集提取和標(biāo)準(zhǔn)化處理

        2.1 數(shù)據(jù)集提取

        RFM模型是體現(xiàn)用戶對(duì)公司價(jià)值高低的一種指標(biāo),本模型由三個(gè)指標(biāo)組成,分別是用戶最近一次購(gòu)買時(shí)間(R)、指定周期內(nèi)的消費(fèi)頻率(F)以及總消費(fèi)金額(M),本研究基于特定的業(yè)務(wù)場(chǎng)景提出了LBTRM模型。

        2.2 數(shù)據(jù)標(biāo)準(zhǔn)化

        由于生產(chǎn)環(huán)境的數(shù)據(jù)庫(kù)數(shù)據(jù)存在數(shù)據(jù)缺失、數(shù)據(jù)重復(fù)、數(shù)據(jù)不合理等問(wèn)題,為保證聚類效果需要對(duì)數(shù)據(jù)集進(jìn)行離群點(diǎn)刪除、數(shù)據(jù)缺失值補(bǔ)填等標(biāo)準(zhǔn)化處理,數(shù)據(jù)處理流程如下:

        2.2.1查看數(shù)據(jù)分布情況以及缺失值審查

        本研究第一步是通過(guò)Python的數(shù)據(jù)處理包進(jìn)行數(shù)據(jù)集基本信息的查看,原始數(shù)據(jù)的基本描述性信息包括所有特征的數(shù)據(jù)類型以及數(shù)值型特征的五值分布(mean、std、min、max、count),缺失值審查,包括查看缺失值的總函數(shù)。

        第二步是查看不同屬性間的相關(guān)聯(lián)系性,相關(guān)性高就代表兩個(gè)特征在建立模型的時(shí)候作用效果是一樣的,為降低運(yùn)算復(fù)雜度降低原始數(shù)據(jù)的維度,需要將其刪除其一。由實(shí)驗(yàn)可知,身高和體重的相關(guān)性非常高,這兩個(gè)屬性模型的訓(xùn)練貢獻(xiàn)度大體相同,可刪除其一。

        2.2.2類別變量獨(dú)熱編碼

        One-Hot編碼又稱為一位有效編碼,比如性別存在兩個(gè)類別,分別是男和女,那么其獨(dú)熱編碼形式為[1,0]代表男,[0,1]代表女。本研究針對(duì)客戶的性別、機(jī)構(gòu)、是否吸煙、工作編碼、支付方式、所在機(jī)構(gòu)、是否結(jié)婚等特征進(jìn)行獨(dú)熱編碼。

        2.2.3數(shù)據(jù)標(biāo)準(zhǔn)化處理

        通過(guò)sklearn包中的API對(duì)獨(dú)熱編碼前的矩陣進(jìn)行標(biāo)準(zhǔn)化處理,然后合并所有維度,最后得到的是一個(gè)200000*334的高維矩陣。

        3 平均輪廓系數(shù)以及K-means聚類

        3.1 平均輪廓系數(shù)

        平均輪廓系數(shù)(Average Silhouette Coefficient)是權(quán)衡聚類成果好壞的重要指標(biāo)之一,它由簇內(nèi)聚合度(Cohesion)和簇間分離度(Separation)兩部分組成,其中簇內(nèi)聚合度是衡量同一簇內(nèi)樣本點(diǎn)差別的參數(shù),而簇間分離度是衡量不同簇間差異的參數(shù),因而兩者組合而成的輪廓系數(shù)綜合反映了同一簇內(nèi)和不同簇間的狀況。

        3.2 K-means聚類

        K-means 作為一種無(wú)監(jiān)督聚類算法在各種業(yè)務(wù)場(chǎng)景中得到較為普及的運(yùn)用。聚類算法就是按照樣本之間的相似度,旨在將沒(méi)有標(biāo)簽信息的數(shù)據(jù)分為幾個(gè)類別的過(guò)程,其中同一個(gè)類簇之間的樣本相似度大,不同類簇之間的樣本相似度小,這是在無(wú)監(jiān)督學(xué)習(xí)的任務(wù)上完成的基本工作之一,K-means 是將給定數(shù)據(jù)集中的數(shù)據(jù)使用其不同特征進(jìn)行聚類的算法模型,之所以稱該模型為K-均值是因?yàn)樗梢岳脽o(wú)監(jiān)督學(xué)習(xí),將數(shù)據(jù)集分為K個(gè)不同的簇,且每個(gè)簇的聚類核心點(diǎn)采用簇中所含值的平均值計(jì)算而來(lái)。簇的個(gè)數(shù)K是用戶手動(dòng)指定的,每一個(gè)簇經(jīng)過(guò)其聚類核心點(diǎn)(即簇中所有點(diǎn)的中心)來(lái)描述。

        “孩子,我對(duì)不起你……”范堅(jiān)強(qiáng)失聲道,“本來(lái),你是不應(yīng)該活著的,但你是我在這世上唯一的親人了,當(dāng)我看到你脖子上戴的玉佩時(shí),我就知道,你是那個(gè)我找了二十多年的親人。所以,才把你關(guān)在石屋里。你不知道,我每天在石屋外面徘徊,心里有多難過(guò)。”范堅(jiān)強(qiáng)的話里帶著幾份凄涼。

        3.3 K-means實(shí)驗(yàn)步驟和結(jié)果

        3.3.1自動(dòng)確定聚類數(shù)目

        數(shù)據(jù)標(biāo)準(zhǔn)化處理后,經(jīng)過(guò)平均輪廓系數(shù)測(cè)驗(yàn)得到最佳的KMeans聚類模型,由實(shí)驗(yàn)結(jié)果可知,?當(dāng)K=3時(shí)聚類模型效果最好。

        本研究將K-means應(yīng)用于實(shí)際的客戶數(shù)據(jù)集,數(shù)據(jù)集標(biāo)準(zhǔn)化完成后,利用平均輪廓系數(shù)進(jìn)行初始聚類數(shù)目的確定,確認(rèn)完數(shù)目之后作為K-means模型的輸入,進(jìn)行聚類。

        (1)實(shí)驗(yàn)結(jié)果

        當(dāng)K=3時(shí),聚類效果最佳,聚類模型所生成的雷達(dá)圖如圖1所示。

        (2)實(shí)驗(yàn)結(jié)果分析

        對(duì)于第0類,可以從雷達(dá)圖中看出,該類人群的年收入和負(fù)債都比較高,年齡都在中年偏上左右,此年齡段常常事業(yè)有成,收入不菲,但是房貸車貸家庭支出壓身,該類客戶為了更好地保護(hù)自己或者家人的安全會(huì)投健康險(xiǎn)或者意外險(xiǎn)等險(xiǎn)種,公司規(guī)劃產(chǎn)品時(shí)可以針對(duì)這兩款險(xiǎn)種進(jìn)行一些創(chuàng)新和優(yōu)惠,加大投保力度。

        對(duì)于第1類,可以從雷達(dá)圖中看出,該類人群的最大購(gòu)買能力較高,但是收入較低,且該類人群普遍是未成年或者老年人,該類人群通常作為被保人或者受益人存在,公司在以后規(guī)劃產(chǎn)品時(shí)可針對(duì)此人群設(shè)計(jì)教育保險(xiǎn)套餐以及一些老年疾病保險(xiǎn)。該類人群是最應(yīng)該發(fā)展的人群。

        對(duì)于第2類,可以從雷達(dá)圖中看出,該類人群收入較高,但是最大購(gòu)買能力較小,支付方式也大部分為躉交,所以公司在以后規(guī)劃產(chǎn)品時(shí)可以設(shè)計(jì)價(jià)格較低并支持持續(xù)繳費(fèi)的短期產(chǎn)品。

        圖1 客戶聚類雷達(dá)圖

        4 討論

        結(jié)合目前在金融界的研究情況,成熟的保險(xiǎn)公司收集了上千萬(wàn)的客戶數(shù)據(jù),但是大多數(shù)保險(xiǎn)公司對(duì)其利用并不充分,造成了嚴(yán)重的資源浪費(fèi)。而且隨著不斷變化的互聯(lián)網(wǎng)金融環(huán)境,其原有的保險(xiǎn)代理人中介營(yíng)銷模式已經(jīng)無(wú)法應(yīng)對(duì)當(dāng)前的需求大環(huán)境,2018下半年,中國(guó)銀保監(jiān)會(huì)再次提出了“科技賦能,營(yíng)銷創(chuàng)新“的要求,受銀保監(jiān)會(huì)監(jiān)管的保險(xiǎn)公司即使有想改變傳統(tǒng)銷售模式的動(dòng)機(jī),卻缺少科學(xué)的科技支持。想要真正地轉(zhuǎn)變傳統(tǒng)代理人營(yíng)銷模式,保留現(xiàn)有客戶是關(guān)鍵,需要提升客戶對(duì)企業(yè)的忠誠(chéng)度,因此本文所探究的客戶管理將以A保險(xiǎn)公司生產(chǎn)環(huán)境的客戶為依托,對(duì)客戶進(jìn)行分類梳理,客戶管理不僅可以提高本項(xiàng)目組在公司內(nèi)部的核心競(jìng)爭(zhēng)力,還可以提高客戶的忠誠(chéng)度和公眾認(rèn)可度,同時(shí)還可以降低營(yíng)銷成本,可以大幅提升服務(wù)效率。結(jié)合以上客戶管理的優(yōu)勢(shì),因此本文提出并進(jìn)行了以下工作:

        (1)本文提出了將K-means算法應(yīng)用于非圖像數(shù)據(jù)進(jìn)行聚類并介紹了K-means算法的原理和基本流程,隨后介紹了平均輪廓系數(shù)的原理,分析比較并找到了確定最優(yōu)K值的方法,實(shí)驗(yàn)得知平均輪廓系數(shù)所得出的K值進(jìn)行模型訓(xùn)練時(shí)準(zhǔn)確率最高。

        (2)本文針對(duì)A公司客戶提出了LBTRFM模型并人工制作數(shù)據(jù)集,并介紹了人工制作客戶數(shù)據(jù)集的一般流程,包括去重、填補(bǔ)、獨(dú)熱編碼等流程

        (3)本文通過(guò)對(duì)分析K-means算法的缺陷提出了采用隨機(jī)梯度下降算法進(jìn)行迭代優(yōu)化,從而降低落入局部最小值的概率。

        5 結(jié)語(yǔ)

        雖然本論文對(duì)真實(shí)保險(xiǎn)客戶進(jìn)行提取并利用K-means模型進(jìn)行分類,但在整個(gè)對(duì)保險(xiǎn)客戶挖掘的研究過(guò)程中仍存在著以下幾點(diǎn)不足之處。

        (1)是否存在比歐氏距離更好的度量公式來(lái)計(jì)算相似度,客戶的不同特征對(duì)于客戶畫像的影響不盡相同,是否可以考慮對(duì)于不同特征加權(quán),消除特征平行性。

        (2)對(duì)于獨(dú)熱編碼后的矩陣維度過(guò)高,是否要引入當(dāng)前火熱的深度神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取,矩陣降維,再將降維后的數(shù)據(jù)輸入進(jìn)模型進(jìn)行計(jì)算,減少模型計(jì)算時(shí)間。

        今后研究的工作重點(diǎn)是探究適用于保險(xiǎn)客戶數(shù)據(jù)特征訓(xùn)練的神經(jīng)網(wǎng)絡(luò),旨在提升算法的執(zhí)行效率以及準(zhǔn)確率。

        [1]樊仙仙.基于聚類分析的 H 銀行客戶細(xì)分及營(yíng)銷策略研究[D].華東理工大學(xué),2015.

        [2]李艷君.K-means聚類算法在銀行CRM系統(tǒng)客戶細(xì)分中的應(yīng)用[D].哈爾濱工業(yè)大學(xué),2017.

        [3]陳葉旺,申蓮蓮,鐘才明,等.密度峰值聚類算法綜述[J].計(jì)算機(jī)研究與發(fā)展,2020,57(02):378-394.

        [4]徐森,皋軍,花小朋,李先鋒,徐靜.一種改進(jìn)的自適應(yīng)聚類集成選擇方法.自動(dòng)化學(xué)報(bào),2018,44(11):2103-2112.

        [5]楊玉梅.基于信息熵改進(jìn)的K-means 動(dòng)態(tài)聚類算法[J].重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,28(2):254-259.

        [6]Dutta Dipankar,Sil Jaya,Dutta Paramartha .Automatic clustering by multi-objective genetic algorithm with numeric and categorical features. Expert Systems With Applications,2019(137):357-379.

        [7]Ye Zong-Lin,Cao Hui,Zhang Yan-Bin,Jia Li-Xin. Outlier factor based partitional clustering analysis with constraints discovery and representative objects generation.Neurocomputing, 2016(173):1538-1553.

        [8]賈瑞玉,李玉功.類簇?cái)?shù)目和初始中心點(diǎn)自確定的K-means 算法[J].計(jì)算機(jī)工程與應(yīng)用,2018,54(7):152-158.

        [9]Arshad A,Riaz S,Jiao L. Semi-supervised deep fuzzy c-mean clustering for imbalanced multi-class classification.IEEE Access,2019(7):28100-28112.

        猜你喜歡
        輪廓保險(xiǎn)公司聚類
        保險(xiǎn)公司和再保險(xiǎn)公司之間的停止損失再保險(xiǎn)策略選擇博弈
        OPENCV輪廓識(shí)別研究與實(shí)踐
        不慎撞死親生兒 保險(xiǎn)公司也應(yīng)賠
        公民與法治(2020年5期)2020-05-30 12:33:46
        基于實(shí)時(shí)輪廓誤差估算的數(shù)控系統(tǒng)輪廓控制
        保險(xiǎn)公司中報(bào)持股統(tǒng)計(jì)
        保險(xiǎn)公司預(yù)算控制分析
        基于DBSACN聚類算法的XML文檔聚類
        基于改進(jìn)的遺傳算法的模糊聚類算法
        在線學(xué)習(xí)機(jī)制下的Snake輪廓跟蹤
        一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
        老熟女重囗味hdxx70星空 | 日韩男女av中文字幕| 日本高清一区二区三区在线观看| 日本熟妇色xxxxx日本妇| 精品无码国产自产野外拍在线| 天天插视频| 操老熟妇老女人一区二区| 国产精品黑丝高跟在线粉嫩| 国偷自产一区二区免费视频| 色丁香在线观看| 91青青草在线观看视频| 男女交射视频免费观看网站| 国产无遮挡又黄又爽免费网站| 日本色噜噜| 日本a一区二区三区在线| 亚洲高清中文字幕视频| 帮老师解开蕾丝奶罩吸乳视频 | 国产免费网站在线观看不卡| 人妻丰满熟av无码区hd| 丰满人妻熟妇乱又伦精品视| 亚洲综合久久1区2区3区 | 水蜜桃一二二视频在线观看免费 | 亚洲女同恋中文一区二区| 国产毛片黄片一区二区三区 | 国产精品美女久久久久久2018| 色一情一区二| 黄 色 成 年 人 网 站免费| 国产亚洲精品一区在线| 蜜桃一区二区三区视频网址| 国产精成人品日日拍夜夜免费| 无码久久流水呻吟| 久久2020精品免费网站| 无码中文字幕人妻在线一区| 成人亚洲性情网站www在线观看| 无码伊人久久大香线蕉| 亚洲色图专区在线视频| 成人国产精品一区二区视频| 国产香蕉尹人综合在线观| 亚洲国产丝袜美女在线| 成人片黄网站a毛片免费| 国产成人无码免费网站|