四川大學(xué)錦城學(xué)院計(jì)算機(jī)與軟件學(xué)院 肖 蝶 楊 杉
以四川省某保險(xiǎn)公司的續(xù)保數(shù)據(jù)為研究對(duì)象,分別從年齡、婚姻狀況、性別、機(jī)構(gòu)等四個(gè)方面,探究得到忠誠(chéng)度較高的企業(yè)客戶的特征,從而劃分出企業(yè)重點(diǎn)宣傳的受眾人群;對(duì)企業(yè)的優(yōu)勢(shì)險(xiǎn)種進(jìn)行分析,以此得出企業(yè)應(yīng)當(dāng)重點(diǎn)運(yùn)營(yíng)及改進(jìn)的險(xiǎn)種類別;探究與總保費(fèi)具有相關(guān)性的因素并分析出其中的線性方程式,得出增長(zhǎng)總保費(fèi)收益的可行性方案。最終使企業(yè)可從以上三個(gè)方面,來(lái)提升其自身的業(yè)務(wù)效率。
這是一個(gè)經(jīng)濟(jì)高速發(fā)展的時(shí)代,伴隨著科學(xué)技術(shù)發(fā)展的時(shí)代,大數(shù)據(jù)技術(shù)也被廣泛應(yīng)用于各種領(lǐng)域。大數(shù)據(jù)技術(shù)的發(fā)展引發(fā)了金融時(shí)代的改革,保險(xiǎn)業(yè)面臨巨大的競(jìng)爭(zhēng)壓力,因此保險(xiǎn)公司需要在大數(shù)據(jù)分析方面進(jìn)行積極的探索。傳統(tǒng)營(yíng)銷方式導(dǎo)致企業(yè)營(yíng)銷過程中存在市場(chǎng)信息充裕度低、準(zhǔn)確率差、反饋不及時(shí)等問題,結(jié)合大數(shù)據(jù)進(jìn)行營(yíng)銷策略的制定可以很好地解決這些問題。數(shù)據(jù)規(guī)模越大,處理的難度也越大,但對(duì)其進(jìn)行挖掘可能得到的價(jià)值更大,這就是大數(shù)據(jù)熱的原因。因此,對(duì)于保險(xiǎn)公司來(lái)說,可以通過分析優(yōu)勢(shì)客戶特征、優(yōu)勢(shì)險(xiǎn)種等方式,在更節(jié)約財(cái)力物力的情況下,提高公司的業(yè)務(wù)效率;同時(shí),為了得到更高的企業(yè)收益,還可以分析與企業(yè)的總保費(fèi)收益相關(guān)的因素并對(duì)其中的線性相關(guān)關(guān)系進(jìn)行探索??傊瑩碛写髷?shù)據(jù)技術(shù)并能利用大數(shù)據(jù)的保險(xiǎn)公司將擁有壓倒性的競(jìng)爭(zhēng)優(yōu)勢(shì),大數(shù)據(jù)的運(yùn)用能力將成為保險(xiǎn)公司的核心競(jìng)爭(zhēng)力。
以四川省某保險(xiǎn)公司的客戶數(shù)據(jù)為研究對(duì)象,對(duì)該公司的續(xù)保數(shù)據(jù)進(jìn)行數(shù)據(jù)分析。采用Excel、SPSS,對(duì)該公司的續(xù)??蛻暨M(jìn)行了特征分析,使用頻率分析、分類匯總的方法從年齡、婚姻狀況、性別及機(jī)構(gòu)四個(gè)方面,探究企業(yè)忠誠(chéng)度較高的客戶具有的特征;使用分類匯總的方式統(tǒng)計(jì)各類險(xiǎn)種的占比情況,并按照占比對(duì)險(xiǎn)種進(jìn)行降序排序,得出該保險(xiǎn)公司中續(xù)保占比排名前十的優(yōu)勢(shì)險(xiǎn)種;最后,使用相關(guān)分析以及線性分析,探索影響總保費(fèi)的因素,以及總保費(fèi)與其影響較大的因素之間所具有的線性關(guān)系,得出線性方程式。
數(shù)據(jù)來(lái)源于四川省某保險(xiǎn)公司的續(xù)保數(shù)據(jù)表,數(shù)據(jù)表中包含了續(xù)??蛻舻臋C(jī)構(gòu)、險(xiǎn)種、繳費(fèi)方式、繳費(fèi)期限、投保份數(shù)、總保費(fèi)、保額、客戶號(hào)、性別、年齡、婚姻狀況、過去三年平均年收入、職業(yè)、家庭人口等信息字段,累計(jì)共14個(gè)字段,21萬(wàn)多條數(shù)據(jù)。
為提高數(shù)據(jù)分析結(jié)果的準(zhǔn)確性,進(jìn)行了相應(yīng)的數(shù)據(jù)清洗。剔除無(wú)效數(shù)據(jù):刪除續(xù)保數(shù)據(jù)中投保時(shí)間、教育程度、家庭人口等無(wú)效數(shù)據(jù)列;刪除數(shù)據(jù)表中的空行。刪除重復(fù)值:使用Excel工具中“刪除重復(fù)值”功能對(duì)數(shù)據(jù)進(jìn)行去重。刪除異常值:使用Excel工具中“篩選”功能篩選出了年齡大于等于18歲的客戶數(shù)據(jù),并刪除年齡小于18的數(shù)據(jù)。
3.1.1 續(xù)??蛻裟挲g分布特征分析
由圖1可知,在續(xù)??蛻舢?dāng)中,30歲以下及60歲以上的客戶在續(xù)保數(shù)據(jù)當(dāng)中分布最少,45-60歲的客戶在續(xù)保數(shù)據(jù)當(dāng)中分布相對(duì)較多,但續(xù)保數(shù)據(jù)中客戶分布最多的年齡區(qū)間是在30-45,也就是說,30歲以下及60歲以上的客戶對(duì)續(xù)購(gòu)保險(xiǎn)的意愿并不強(qiáng)烈,而年齡在30-45歲區(qū)間的中年人是續(xù)??蛻糁兴碱l率最大的群體。因此,可將年齡分布在30-45歲區(qū)間的客戶定義為該企業(yè)的優(yōu)勢(shì)客戶。
圖1 年齡分布圖
3.1.2 續(xù)??蛻艋橐鰻顩r特征分析
由圖2可知,在續(xù)??蛻羧后w當(dāng)中,離異人士占比0.48%、已婚人士占比73.61%、再婚人士占比0.00%、單身人士占比4.02%、喪偶人士占比0.18%、婚姻狀況未知的占比21.71%,由上述可得,婚姻狀況為已婚的人在續(xù)??蛻羧后w中占比最多,其次是婚姻狀況未知的人士。也就是說,離異、再婚、單身、喪偶等客戶群體續(xù)購(gòu)保險(xiǎn)的意愿并不強(qiáng)烈,婚姻狀況未知的客戶續(xù)購(gòu)保險(xiǎn)的意愿相對(duì)較大,而婚姻狀況為已婚的客戶是續(xù)??蛻糁兴碱l率最大的群體,續(xù)購(gòu)保險(xiǎn)得意愿最大。因此,可將婚姻狀況為已婚的客戶定義為該企業(yè)的優(yōu)勢(shì)客戶。
圖2 婚姻狀況分布圖
3.1.3 續(xù)保客戶性別特征分析
由圖3可得,在續(xù)保數(shù)據(jù)當(dāng)中,客戶的性別特征分布均勻,也就是說,男女所占的比例是相當(dāng)?shù)?,因此,在?duì)續(xù)??蛻暨M(jìn)行客戶畫像時(shí),可以忽略數(shù)據(jù)中的性別因素。
圖3 性別分布圖
3.1.4 續(xù)??蛻魴C(jī)構(gòu)特征分析
由表1可得,使用SPSS工具中分類匯總的方法,可以得到續(xù)保數(shù)據(jù)占比排名前十的機(jī)構(gòu)由高到低依次是:510824、510128、510781、510117、513029,510722,511324,513022,510681,511321。通過互聯(lián)網(wǎng)查詢,可得續(xù)購(gòu)保險(xiǎn)的客戶中,占比前十的機(jī)構(gòu)分別代表的是廣元市蒼溪縣、成都市崇慶縣、江油市、成都市郫都區(qū)、達(dá)州市大竹縣、綿陽(yáng)市三臺(tái)縣、南充市儀隴縣、達(dá)川地區(qū)宣漢縣、廣漢市、南充市南部縣。也就是說,以上十個(gè)地區(qū)的客戶,續(xù)保意愿相對(duì)較大。
表1 機(jī)構(gòu)匯總表
由此可得以下結(jié)論:年齡在30歲以下及60歲以上、婚姻狀況為離異、再婚、單身、喪偶等,此類客戶的續(xù)保意愿不太強(qiáng)烈;同時(shí),年齡在30-45歲區(qū)間的中年人,婚姻狀況為已婚,機(jī)構(gòu)為510824、510128、510781、510117、513029,510722,511324,513022,510681,511321等地的客戶是續(xù)保客戶中的優(yōu)勢(shì)客戶群體,此類客戶的續(xù)保意愿較大。因此,保險(xiǎn)公司可以根據(jù)以上分析所得的客戶畫像,對(duì)該公司不同的客戶群體采取不同的宣傳力度和宣傳方式,比如,企業(yè)可適當(dāng)減小在續(xù)保較少的人群中的宣傳力度,并將其主要精力轉(zhuǎn)移到具有續(xù)保優(yōu)勢(shì)特征的客戶群體上,從而增加客戶的續(xù)保概率,以此提高客戶的忠誠(chéng)度。
由表2可知,使用SPSS工具中頻率統(tǒng)計(jì)的方法得出,在續(xù)保數(shù)據(jù)排名前十的險(xiǎn)種中,S42占比44.2%,S43占比14.3%,S40占比7.8%,S49占比5.6%,S47占比5.1%,S46占比2.8%,S50占比2.6%,S86占比2.2%,B01占比2.2%,S77占比1.7%;除去其中的B01,其余的險(xiǎn)種均是S類險(xiǎn)種,且排名前十的險(xiǎn)種中,S類險(xiǎn)種累計(jì)占比達(dá)到86.3%。
表2 險(xiǎn)種頻率占比表
由以上分析可得,S類開頭的保險(xiǎn)種類續(xù)保人數(shù)相對(duì)較多,以數(shù)字開頭的保險(xiǎn)種類續(xù)保的人數(shù)相對(duì)較少,也就是說,在續(xù)保數(shù)據(jù)中S類保險(xiǎn)占有主要地位,說明客戶對(duì)S類保險(xiǎn)有著長(zhǎng)期的購(gòu)買需求。因此,S類保險(xiǎn)有助于企業(yè)留住客戶,有利于提高客戶的忠誠(chéng)度,企業(yè)可根據(jù)以上分析,加強(qiáng)對(duì)優(yōu)勢(shì)險(xiǎn)種的運(yùn)營(yíng)及改進(jìn),以便及時(shí)提高企業(yè)中優(yōu)勢(shì)險(xiǎn)種的市場(chǎng)競(jìng)爭(zhēng)力。
由表3可得,消費(fèi)者所繳納的總保費(fèi)相關(guān)性較強(qiáng)的因素分別是繳費(fèi)期限、保額、年齡以及過去三年平均年收入;并且以上四個(gè)因素是在顯著性水平為0.01的基礎(chǔ)上,與總保費(fèi)呈顯著相關(guān)。其中,繳費(fèi)期限與總保費(fèi)的關(guān)系是顯著負(fù)相關(guān),相關(guān)系數(shù)為-0.185;保額、年齡及過去三年平均年收入與總保費(fèi)的關(guān)系是顯著正相關(guān),相關(guān)系數(shù)依次為0.267、0.073、0.235。
表3 相關(guān)性分析表
由表4可得,在使用SPSS工具中的線性回歸方法對(duì)總保費(fèi)與繳費(fèi)期限、保額、年齡、過去三年平均年收入之間的線性關(guān)系進(jìn)行分析時(shí),采用了步進(jìn)的方式,對(duì)比依次增加預(yù)測(cè)變量所得的模型當(dāng)中R方的值,選擇擬合效果最好的模型,即R方的值最大的模型4來(lái)進(jìn)行后續(xù)分析。
表4 模型摘要表
由上述分析結(jié)果以及表5的基礎(chǔ)上,總保費(fèi)與繳費(fèi)期限、保額、年齡、過去三年平均年收入之間的線性關(guān)系式為:“總保費(fèi)=0.047*保額-131.633*繳費(fèi)期限+0.011*過去三年平均年收入+21.627*年齡+1483.367”。因此,保險(xiǎn)公司如果想要獲得更高的總保費(fèi),則可面向過去三年平均年收入相對(duì)較高的受眾人群,向其推廣繳費(fèi)期限較短,保額較高的險(xiǎn)種,將有助于增長(zhǎng)企業(yè)所收得的總保費(fèi)的金額。
表5 系數(shù)詳情表
首先,年齡在30歲以下及60歲以上、婚姻狀況為離異、再婚、單身、喪偶等客戶群體屬于忠誠(chéng)度較低的客戶,此類客戶的后期發(fā)掘意義不大,企業(yè)應(yīng)適當(dāng)減少在此類客戶當(dāng)中花費(fèi)的時(shí)間和精力,同時(shí)集中精力在忠誠(chéng)度較高的客戶群體中進(jìn)行大力度的宣傳和推廣,如年齡在30-45歲區(qū)間、婚姻狀況為已婚的中年人群體、機(jī)構(gòu)為510824、510128、510781、510117、513029,510722,511324,513022,510681,511321等地的客戶。
其次,在分析客戶的同時(shí),企業(yè)也應(yīng)當(dāng)增強(qiáng)自身的市場(chǎng)競(jìng)爭(zhēng)力,自身的優(yōu)勢(shì)是與行業(yè)內(nèi)競(jìng)爭(zhēng)對(duì)手競(jìng)爭(zhēng)的有力武器之一,因此,企業(yè)應(yīng)對(duì)S類險(xiǎn)種進(jìn)行長(zhǎng)期的運(yùn)營(yíng)和改進(jìn),以此提高企業(yè)中客戶的續(xù)保概率。
最后,在得出了與總保費(fèi)有關(guān)的影響因素及其中的線性方程式的基礎(chǔ)上,企業(yè)可適當(dāng)選取過去三年平均年收入較高的人群,向其推薦保額大、繳費(fèi)期限短的險(xiǎn)種,從而增加企業(yè)所得總保費(fèi)的收益。