張馨予 門玉杰 孫曉紅
摘 要:為了幫助壽險(xiǎn)行業(yè)從海量業(yè)務(wù)交易中提取有效客戶信息并進(jìn)行客戶保留,本文首先用K-Means算法進(jìn)行壽險(xiǎn)客戶的價(jià)值細(xì)分,初步判斷哪類客戶最有可能流失,并針對(duì)不同價(jià)值群體的客戶給予公司不同的建議;其次對(duì)細(xì)分后的客戶群體建立Logistic二分類回歸預(yù)測(cè)模型,比較與細(xì)分前的預(yù)測(cè)精度差異。實(shí)驗(yàn)結(jié)果中,細(xì)分后客戶群對(duì)應(yīng)Logistic模型的準(zhǔn)確率、召回率和F1值較細(xì)分前均有提升,這說(shuō)明客戶細(xì)分能為其流失預(yù)測(cè)提供有價(jià)值的信息,有助于壽險(xiǎn)公司盈利水平的提高。
關(guān)鍵詞:壽險(xiǎn)客戶流失? 客戶細(xì)分? K-Means算法? Logistic模型
中圖分類號(hào):F840.62 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-0298(2020)09(a)--03
客戶流失是指公司現(xiàn)存客戶停止與當(dāng)前公司的業(yè)務(wù)交易,轉(zhuǎn)而與該公司的競(jìng)爭(zhēng)對(duì)手進(jìn)行業(yè)務(wù)交易[1],它是引發(fā)公司經(jīng)濟(jì)不景氣的潛在不利因素。壽險(xiǎn)客戶為非合約客戶,相關(guān)性較弱且流動(dòng)率較高,因此客戶保留工作不容小覷。
國(guó)內(nèi)針對(duì)壽險(xiǎn)行業(yè)的客戶流失預(yù)測(cè)研究起步較晚、成果較少。2008年,孫紅等建立壽險(xiǎn)客戶流失的價(jià)值指標(biāo)體系,用決策樹算法輸出各項(xiàng)指標(biāo)對(duì)決策的影響[2]。2013年,周曉瑋構(gòu)建壽險(xiǎn)預(yù)警指標(biāo),使用BP神經(jīng)網(wǎng)絡(luò)建立流失預(yù)測(cè)模型[3]。2015年,梁鋒將數(shù)據(jù)挖掘技術(shù)應(yīng)用到壽險(xiǎn)行業(yè)中,利用決策樹算法建立預(yù)測(cè)模型[4]。20世紀(jì)50年代中期,溫德爾提出“客戶細(xì)分”的概念,旨在從龐大的客戶信息中獲取少量精準(zhǔn)信息進(jìn)行客戶分類,方便公司進(jìn)行營(yíng)銷管理,實(shí)現(xiàn)經(jīng)濟(jì)效益最大化??紤]到在壽險(xiǎn)行業(yè)中,甚少有學(xué)者采用對(duì)客戶進(jìn)行先細(xì)分后流失預(yù)測(cè)的建模方法。本文首先用K-Means聚類算法對(duì)壽險(xiǎn)客戶進(jìn)行價(jià)值細(xì)分,獲得不同價(jià)值類別的客戶;其次建立Logistic二分類模型進(jìn)行客戶流失預(yù)測(cè),并比較細(xì)分前、細(xì)分后的預(yù)測(cè)效果。本文提出的方法,可以幫助壽險(xiǎn)公司從宏觀上預(yù)測(cè)客戶流失的人數(shù),從微觀上判斷客戶的狀態(tài),為壽險(xiǎn)行業(yè)的客戶保留提供可行建議。
1 壽險(xiǎn)客戶價(jià)值指標(biāo)體系
實(shí)驗(yàn)數(shù)據(jù)為某壽險(xiǎn)公司網(wǎng)站(http://www.chinalife.com.cn/)2016年1月1日—2018年12月31日的交易數(shù)據(jù)。觀察到原始數(shù)據(jù)的交叉性較強(qiáng):若一位投保人同時(shí)為多位被保險(xiǎn)人支付保險(xiǎn)訂單,且其中的一位被保險(xiǎn)人退保,其他幾位未退保,此時(shí)已發(fā)生客戶流失現(xiàn)象。因此有必要尋找對(duì)應(yīng)關(guān)系(投保人—被保險(xiǎn)人—客戶),整理得到壽險(xiǎn)客戶價(jià)值指標(biāo)體系,如表1所示。
2 壽險(xiǎn)客戶細(xì)分
將處理后的2000條壽險(xiǎn)客戶數(shù)據(jù)導(dǎo)入SPSS20.0中進(jìn)行K-Means聚類分析,最終聚類結(jié)果如表2所示。
通常,在壽險(xiǎn)客戶與公司的業(yè)務(wù)交易中,若客戶的信用水平越高、對(duì)應(yīng)繳費(fèi)金額越大,說(shuō)明該客戶的經(jīng)濟(jì)水平以及對(duì)產(chǎn)品的熱衷度越高,發(fā)生流失現(xiàn)象的可能性越小。由表2觀察到,III客戶群的繳費(fèi)金額最大、信用水平最高,由此識(shí)別為高價(jià)值群體;II客戶群的信用水平一般,且繳費(fèi)金額最小,由此識(shí)別為低價(jià)值群體;I客戶群的繳費(fèi)金額介于II客戶群和III客戶群之間,由此識(shí)別為中價(jià)值群體。最終得到價(jià)值排序:III>I>II。統(tǒng)計(jì)各類客戶的人數(shù)以及所占百分比,發(fā)現(xiàn)高價(jià)值客戶僅占總數(shù)的4.7%,低價(jià)值客戶占總數(shù)最多,為77.3%,差異較大。
3 基于Logistic模型的壽險(xiǎn)客戶流失預(yù)測(cè)
3.1 Logistic二分類回歸預(yù)測(cè)
將原始數(shù)據(jù)中含“退保”字樣的客戶識(shí)別為流失(Y=1),其他為未流失(Y=0),進(jìn)行Logistic二分類回歸預(yù)測(cè),并以細(xì)分前客戶的實(shí)驗(yàn)過(guò)程為例進(jìn)行展示。選取訓(xùn)練數(shù)據(jù)1000條,測(cè)試數(shù)據(jù)700條。
將7個(gè)壽險(xiǎn)客戶價(jià)值指標(biāo)全部用來(lái)擬合Logistic模型,篩選出P值小于0.5的壽險(xiǎn)客戶價(jià)值指標(biāo){年齡、職業(yè)、收入、信用、動(dòng)機(jī)},并作為自變量重新擬合Logistic模型,得到訓(xùn)練集的預(yù)測(cè)結(jié)果,如表3所示。
表3說(shuō)明,使用該Logistic回歸方程對(duì)樣本點(diǎn)進(jìn)行分類,其總計(jì)預(yù)測(cè)精確度為96.4%;實(shí)際未流失的911位客戶中有903位被預(yù)測(cè)出來(lái),有8個(gè)發(fā)生誤判現(xiàn)象,正確率達(dá)到99.1%。這表明該模型在預(yù)測(cè)實(shí)際未流失人數(shù)上精度較高,但實(shí)際流失人數(shù)的預(yù)測(cè)精度僅為68.5%,有待提升。
從表4可以看出,年齡的偏回歸系數(shù)為負(fù)數(shù)且絕對(duì)值最大,這說(shuō)明其與客戶流失的負(fù)相關(guān)性很強(qiáng),年齡越大,客戶越不易流失。動(dòng)機(jī)的偏回歸系數(shù)為正數(shù)且絕對(duì)值較大,說(shuō)明其與客戶流失的正相關(guān)性較強(qiáng):動(dòng)機(jī)越傾向于按需購(gòu)買,客戶狀態(tài)越穩(wěn)定。
動(dòng)機(jī)的OR值最大(為1.920),說(shuō)明它是影響客戶流失的主要危險(xiǎn)因素;收入與職業(yè)的OR值(分別為1.397和1.341)也均大于1,也是影響客戶流失的重要危險(xiǎn)因素。而年齡和信用的OR值均小于1,是保護(hù)因素。由Logistic模型原理[5]和表4中的Exp (B)一列可得式(1)。其中變量X1~X5分別表示“年齡”“職業(yè)”“收入”“信用”和“動(dòng)機(jī)”。
Logistic二分類模型的概率形式如式(2)、式(3)所示。
將700條測(cè)試數(shù)據(jù)帶入式(2)、式(3)檢驗(yàn),得到預(yù)測(cè)結(jié)果如表5所示。
從表5可以看出,使用建立的Logistic模型預(yù)測(cè)訓(xùn)練樣本外的客戶狀態(tài),其預(yù)測(cè)精度高達(dá)98.1%,較之前的96.4%有明顯提升。實(shí)際未流失的639位客戶有634位得到了正確的預(yù)測(cè),有5位錯(cuò)判,預(yù)測(cè)精度達(dá)到99.2%;對(duì)于實(shí)際流失的61位客戶,有53位得到了正確的預(yù)測(cè),預(yù)測(cè)精度高達(dá)86.9%,相比之前訓(xùn)練集的預(yù)測(cè)精度68.5%得到顯著提高,這表明該模型有較好的泛化能力。
3.2 實(shí)驗(yàn)結(jié)果匯總
將細(xì)分后的高價(jià)值客戶、中價(jià)值客戶以及低價(jià)值客戶分別用于Logistic二分類回歸預(yù)測(cè)建模,根據(jù)測(cè)試集預(yù)測(cè)結(jié)果的二分類混淆矩陣計(jì)算準(zhǔn)確率、召回率、F1值,并進(jìn)行細(xì)分前、細(xì)分后的對(duì)比。
從表6可以看出,細(xì)分后三類客戶實(shí)驗(yàn)結(jié)果的準(zhǔn)確率、召回率、F1值均有提高,說(shuō)明客戶細(xì)分有助于流失預(yù)測(cè)效果的提升。其中提升最明顯的是低價(jià)值客戶,準(zhǔn)確率為94.5%、召回率為89.3%、F1值達(dá)到91.8%;提升最不明顯的是高價(jià)值客戶。
4 結(jié)語(yǔ)
對(duì)壽險(xiǎn)行業(yè)而言,客戶是其生存和發(fā)展的重要基礎(chǔ),而客戶細(xì)分和流失預(yù)測(cè)能幫助公司從海量交易中提取出有效的客戶信息,方便公司的營(yíng)銷管理。本文建立壽險(xiǎn)客戶價(jià)值指標(biāo)體系,對(duì)不同價(jià)值類別的壽險(xiǎn)客戶進(jìn)行細(xì)分和研究,并對(duì)細(xì)分前后的客戶運(yùn)用Logistic二分類模型進(jìn)行流失預(yù)測(cè)。實(shí)證表明,細(xì)分后的準(zhǔn)確率、召回率、F1值較細(xì)分前有明顯提高,這表明客戶細(xì)分對(duì)于流失預(yù)測(cè)效果的提升有一定作用。
在實(shí)際經(jīng)營(yíng)中,壽險(xiǎn)公司應(yīng)當(dāng)與時(shí)俱進(jìn),及時(shí)調(diào)整管理策略,不斷提升服務(wù)水平,減少流失客戶,保持現(xiàn)有客戶。公司可以對(duì)客戶進(jìn)行分類管理:對(duì)于購(gòu)買力強(qiáng)、較理性的高價(jià)值客戶,在為其精心策劃壽險(xiǎn)服務(wù)的同時(shí),還應(yīng)當(dāng)給予完善的售后服務(wù),使其盡最大可能保持;對(duì)于人數(shù)比重大的低價(jià)值客戶,公司可以給予該群體中信用評(píng)級(jí)相對(duì)高的客戶一些優(yōu)惠活動(dòng),以增加客戶續(xù)購(gòu)產(chǎn)品的可能性;對(duì)于中價(jià)值客戶,可以綜合前兩者的方案進(jìn)行保留管理。
參考文獻(xiàn)
任紅娟,夏國(guó)恩.客戶流失研究綜述[J].中國(guó)商論,2018(32).
孫紅,朱雷,劉毅婷.決策樹在壽險(xiǎn)企業(yè)客戶流失分析中的應(yīng)用[J].現(xiàn)代商業(yè),2008(20).
周曉瑋.BP神經(jīng)網(wǎng)絡(luò)技術(shù)在壽險(xiǎn)營(yíng)銷系統(tǒng)中的應(yīng)用研究[D].上海:上海交通大學(xué),2014.
梁鋒.數(shù)據(jù)挖掘技術(shù)在壽險(xiǎn)客戶流失中的應(yīng)用[J].電子科學(xué)技術(shù),2015,02(01).
鄭宇晨,呂王勇.基于logistic模型的證券公司客戶流失預(yù)警分析[J].鄭州航空工業(yè)管理學(xué)院學(xué)報(bào),2016,34(05).