黃山 尹龍威 孫海晨
關(guān)鍵詞:貝葉斯分類(lèi)器 客戶(hù)畫(huà)像 續(xù)保概率 風(fēng)險(xiǎn)因素
0.引言
中國(guó)目前的車(chē)險(xiǎn)費(fèi)率制度,大多數(shù)符合“從車(chē)主義”。即車(chē)險(xiǎn)保費(fèi)多少,主要取決于這輛車(chē)本身的各項(xiàng)情況,如車(chē)的購(gòu)置價(jià)、座位數(shù)、排量、購(gòu)車(chē)年限等,根據(jù)這些數(shù)據(jù)計(jì)算出一個(gè)基本的車(chē)險(xiǎn)保費(fèi)價(jià)格,再根據(jù)這輛車(chē)的上年理賠次數(shù)來(lái)打不同的折扣。這就導(dǎo)致了中國(guó)的車(chē)險(xiǎn)定價(jià)模式非常的單調(diào),相似情況的車(chē)型,保費(fèi)也都差不多。想要改變這種狀況就需要使其變?yōu)椤皬娜酥髁x”。需要對(duì)客戶(hù)進(jìn)行精準(zhǔn)畫(huà)像也需要對(duì)客戶(hù)是否續(xù)保概率進(jìn)行預(yù)測(cè)。
1.客戶(hù)精準(zhǔn)畫(huà)像
本文從三個(gè)大方向車(chē)輛、環(huán)境、人;10個(gè)小方向種類(lèi)、年齡、性別、NCD等對(duì)客戶(hù)進(jìn)行精準(zhǔn)畫(huà)像。針對(duì)重要的文字信息,本文通過(guò)風(fēng)險(xiǎn)厘定將文字信息轉(zhuǎn)化為了數(shù)字信息。下面將選取這些數(shù)字信息以概率統(tǒng)計(jì)的方法對(duì)客戶(hù)進(jìn)行精準(zhǔn)畫(huà)像。
2.貝葉斯分類(lèi)器
在上文我們對(duì)客戶(hù)車(chē)險(xiǎn)的風(fēng)險(xiǎn)因素劃分了風(fēng)險(xiǎn)系數(shù),將以上劃分標(biāo)準(zhǔn)作為類(lèi)別集合,利用貝葉斯分類(lèi)器對(duì)已有數(shù)據(jù)中的客戶(hù)進(jìn)行分類(lèi),得到客戶(hù)的精準(zhǔn)畫(huà)像。利用風(fēng)險(xiǎn)系數(shù)計(jì)算各類(lèi)客戶(hù)的續(xù)保概率。貝葉斯分類(lèi)器是一種分類(lèi)的算法,但他是以概率統(tǒng)計(jì)的方法對(duì)類(lèi)別進(jìn)行劃分。利用概率統(tǒng)計(jì)中的貝葉斯公式進(jìn)行計(jì)算,算法的特點(diǎn)就是不會(huì)確定樣本的類(lèi)別,而是以概率的形式告訴這個(gè)樣本有多大可能屬于這一類(lèi)。本文將續(xù)保不續(xù)保分為兩類(lèi),這樣通過(guò)將所得數(shù)據(jù)輸入分類(lèi)器進(jìn)行學(xué)習(xí)。當(dāng)在輸入客戶(hù)得這些信息時(shí),貝葉斯模型就會(huì)得到該客戶(hù)續(xù)保得概率。
貝葉斯分類(lèi)法基于簡(jiǎn)單的貝葉斯公式(1),即通過(guò)某對(duì)象的先驗(yàn)概率計(jì)算其后驗(yàn)概率,選擇具有最大后驗(yàn)概率的類(lèi)作為該對(duì)象所屬的類(lèi)。
本文以同品牌同車(chē)系的1000組大眾帕塞特客戶(hù)相關(guān)信息輸入貝葉斯分類(lèi)器進(jìn)行學(xué)習(xí)。另找了10個(gè)大眾帕塞特客戶(hù)的信息輸入已經(jīng)訓(xùn)練好的貝葉斯分類(lèi)器模型進(jìn)行檢驗(yàn)。
3.結(jié)論
選取10個(gè)大眾帕塞特客戶(hù)的信息輸入已經(jīng)訓(xùn)練好的貝葉斯分類(lèi)器模型進(jìn)行檢驗(yàn),結(jié)果如下:
從1000組數(shù)據(jù)的訓(xùn)練樣本學(xué)習(xí)后的貝葉斯分類(lèi)器分類(lèi)精準(zhǔn)度可以在80%。而且也成功的從對(duì)客戶(hù)的畫(huà)像中得到了該客戶(hù)續(xù)保的概率。