◆李思佳
(一)問題背景。近年來,車險(xiǎn)在我國(guó)保險(xiǎn)行業(yè)中所占比重最大,投保率也在不斷提高。我國(guó)目前的車險(xiǎn)定價(jià)主要與車自身的情況(車型、車的購置價(jià)、座位數(shù)、排量、購車年限等)有關(guān),因此車型相似,車險(xiǎn)保費(fèi)也差不多。
我們預(yù)見未來車險(xiǎn)的定價(jià)將主要取決于駕駛?cè)俗陨淼那闆r(駕駛行為、年齡、職業(yè)、家庭狀況等),因此車險(xiǎn)保費(fèi)將不再單調(diào)。
我們可以運(yùn)用數(shù)字化技術(shù)建立客戶精準(zhǔn)畫像,來制定不同的營(yíng)銷方案。
(二)問題提出。針對(duì)客戶信息建立能夠刻畫每一位客戶續(xù)保率的數(shù)學(xué)模型。
(一)模型假設(shè)。為了使得問題更易于理解,我們作出以下合理假設(shè):
? 每種品牌的車輛的出險(xiǎn)率是穩(wěn)定不變的。
? 假設(shè)已投保立案后必有已決賠款。
? 假設(shè)附件數(shù)據(jù)為同一個(gè)保險(xiǎn)公司。
?假設(shè)投保類型為“單商業(yè)”時(shí),其交強(qiáng)險(xiǎn)已在其他公司繳納。
(一)數(shù)據(jù)預(yù)處理。題目提供了1個(gè)附件,附件中的數(shù)據(jù)給出了客戶車險(xiǎn)的相關(guān)信息,對(duì)于眾多的客戶信息數(shù)據(jù),我們使用EXCEL對(duì)數(shù)據(jù)做了以下預(yù)處理:
清理數(shù)據(jù),剔除數(shù)據(jù)壞點(diǎn):
①客戶類型為個(gè)人的時(shí)候,被保險(xiǎn)人性別卻是NA等類似其他錯(cuò)誤;②三者未投保后面三者險(xiǎn)保額卻有金額等類似其他錯(cuò)誤;③前面保單性質(zhì)為轉(zhuǎn)保后面是否續(xù)保卻寫的是等類似其他錯(cuò)誤;
利用以上數(shù)據(jù),對(duì)問題進(jìn)行求解分析。
(二)模型建立與求解
1.模型的選取。一般來說,實(shí)際問題中影響因變量的因素可能很多,從應(yīng)用的角度既希望將所有對(duì)因變量影響顯著的自變量都納入回歸模型,又希望最終的模型盡可能簡(jiǎn)單,既不包含那些對(duì)因變量影響不顯著的自變量,這就是所謂“變量選擇”。逐步回歸是一種迭代式的變量選擇方法,通過逐步回歸來選擇變量,建立多元線性回歸模型。
續(xù)保概率逐步回歸程序的最終輸出圖形如下圖所示:
圖1 MATLAB逐步回歸程序運(yùn)行的最終輸出圖形
通過圖1右側(cè)的Export菜單可以傳送輸出數(shù)據(jù),得到的結(jié)果如下表所示:
表1 逐步回歸的最終結(jié)果(=47898)
最終模型為: