亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于Logistic回歸的銀行保險消費行為影響因素分析與預測

        2017-08-08 04:20:54于洪霞
        上海電力大學學報 2017年3期
        關鍵詞:模型研究

        于洪霞, 李 興

        (1.上海電力學院 數(shù)理學院, 上海 201300; 2.華泰財產(chǎn)保險有限公司 個險承保部, 上海 201315)

        ?

        一種基于Logistic回歸的銀行保險消費行為影響因素分析與預測

        于洪霞1, 李 興2

        (1.上海電力學院 數(shù)理學院, 上海 201300; 2.華泰財產(chǎn)保險有限公司 個險承保部, 上海 201315)

        運用Logistic回歸方法分析了銀行保險消費行為的影響因素,并構建了預測模型,然后利用保留樣本進行了實證檢驗.通過對樣本數(shù)據(jù)過離散、空單元、多元共線性、特異值、特殊影響案例的診斷,以及對模型的擬合程度和預測效果的檢驗,驗證了所構建的模型具有較好的擬合程度和預測效果.

        銀行保險; 消費行為分析; 分類變量; Logistic回歸分析

        隨著經(jīng)濟的發(fā)展、人們收入水平的提高以及高新技術的普及,廣大保險消費者的消費需求日趨復雜多樣,對保險產(chǎn)品不僅要求有充足的保障功能,還需要提供周到完善的服務,對保險產(chǎn)品的購買渠道、投保和后續(xù)服務的方式也提出了多樣化、個性化的需求.保險企業(yè)要通過產(chǎn)品和服務為消費者創(chuàng)造出值得回憶的美好體驗,需要加強消費者行為研究,了解和掌握消費者的行為活動特點,為保險產(chǎn)品/服務和主題體驗設計提供依據(jù).

        國內(nèi)外研究人員已經(jīng)對銀行保險消費者行為開展了各種研究,例如:KARL Borch[1]按照購買動機對保險需求進行了分類,并研究了不同保險需求的決策方式;KUUSELA A H和SPENCE M T[2]對消費者如何選擇保險產(chǎn)品進行了研究,并將消費者進行了分類,分析了消費者在決策過程中如何進行信息的排除和選擇,進而如何選擇不同的消費策略;萬晴瑤[3]研究了人口、家庭結構變化對壽險消費需求的影響.對銀行保險的研究可參考文獻[4]和文獻[5].桂林[6]設計了銀行保險消費行為調查問卷,并在重慶市開展了調查,運用Logistic模型對調查問卷的數(shù)據(jù)進行了分析,建立了重慶市銀行保險消費者購買模型.中國工商銀行上海市分行課題組[7]分析了客戶金融消費行為的影響因素和行為特征.

        對消費者行為的研究需要大量可信的數(shù)據(jù)作為基礎.目前的研究或從宏觀角度出發(fā),或以調查問卷的形式,尚未對銀行客戶保險消費的數(shù)據(jù)進行深入的統(tǒng)計分析和研究.為進一步深入分析銀行客戶保險消費的影響因素并構建預測模型,本文對一個零售銀行消費數(shù)據(jù)庫的數(shù)據(jù)進行了研究.該數(shù)據(jù)庫涉及范圍廣,存儲數(shù)據(jù)量大,可以滿足研究需要.然后將Logistic回歸分析方法[8-9]引入銀行客戶保險消費的統(tǒng)計分析研究中.從消費數(shù)據(jù)中選擇了16個因素,運用Logistic回歸分析方法,分析這16個因素與客戶保險購買行為之間的關系,然后建立了預測模型并用實證進行檢驗.

        1 數(shù)據(jù)來源及樣本數(shù)據(jù)診斷

        1.1 數(shù)據(jù)來源

        本文數(shù)據(jù)來自于文獻[10]中的案例數(shù)據(jù),是一個零售銀行的消費數(shù)據(jù),共包括32 264條記錄,47個變量.

        首先,篩選出記錄完整、無空單元的數(shù)據(jù),共20 878條.選取前12 000條,將是否購買保險作為因變量,選取其中的16個自變量進行影響因素分析,并構建預測模型.在剩余的數(shù)據(jù)中選擇5 000條作為保留數(shù)據(jù),進行模型檢驗.

        16個自變量定義如表1所示.訓練樣本數(shù)據(jù)統(tǒng)計結果如表2所示.

        表1 16個自變量的取值和定義

        表2 訓練樣本數(shù)據(jù)統(tǒng)計結果

        1.2 樣本數(shù)據(jù)診斷

        判斷樣本數(shù)據(jù)是否符合Logistic回歸分析的基本條件,主要考慮樣本規(guī)模和樣本結構兩個方面.王濟川和郭志剛[8]指出,Logistic回歸分析的每個參數(shù)至少需要5~10個觀測案例.本文研究的影響因素(自變量)為16個,從表2可以看出各組觀測案例最少為119,因此樣本數(shù)據(jù)滿足樣本規(guī)模的條件.下面將通過對過離散、空單元、多元共線性等方面進行診斷,判斷樣本數(shù)據(jù)是否存在數(shù)據(jù)結構的問題.

        (1) 過離散 本文采用Pearson卡方檢驗所得的卡方值除以相應的自由度來估計離散參數(shù),并使用SPSS中的NOMREG程序來進行計算,結果如下:卡方值為3 494.631;自由度為3 225;P值為0.001;離散參數(shù)為1.084.可以看出,離散參數(shù)近似等于1.0,這說明樣本數(shù)據(jù)過離散可以忽略不計.

        (2) 空單元 從表2可以看出,樣本數(shù)據(jù)不存在空單元問題.

        (3) 多元共線性 可根據(jù)容忍度指標來判斷,當容忍度指標為零時,說明相應自變量與其他自變量完全相關;容忍度小于0.2,可以認為是多元共線性存在的標志;容忍度小于0.1,說明多元共線性很嚴重[8].樣本數(shù)據(jù)多元共線性問題診斷結果如表3所示.表3中所有自變量的容忍度都遠大于0.2,這表明不存在多元共線性問題.

        表3 樣本數(shù)據(jù)多元共線性問題診斷結果

        以上診斷結果說明,抽取的樣本數(shù)據(jù)符合Logistic回歸分析的基本條件.

        2 基于Logistic回歸分析的預測模型

        2.1 Logistic回歸分析及建模

        設P為客戶購買保險的概率,0≤P≤1,則1-P為沒有購買保險的概率.假設Logistic回歸模型為:

        式中:β0——常數(shù)項;βi——回歸系數(shù),i=1,2,3,…,16.

        本文運用基于最大似然估計的向前逐步回歸法進行分析,基于Score檢驗統(tǒng)計量選入自變量,基于最大偏似然估計的似然比檢驗結果來剔除變量,分析軟件選用SPSS.由于存在多分類的自變量,需要將多分類變量轉換為多個啞變量,每個啞變量只代表某兩個級別之間的差異,這樣回歸結果才能有明確而合理的實際意義.各自變量的啞變量編碼如表4所示.

        表4 啞變量編碼

        經(jīng)過程序計算,在迭代12次后,模型中各變量的相應參數(shù)的檢驗結果如表5所示.

        表5 模型的變量及其相應參數(shù)的檢驗結果

        根據(jù)表5的檢驗結果可知,變量X8,X13,X15,X16不具有統(tǒng)計學意義.變量X1,X2,X3,X4,X5,X6,X7,X9,X10,X11,X12,X14具有統(tǒng)計學意義.因此,預測模型可以表示為:

        其中:

        Y=-0.576-0.157X1(1)-0.142X1(2)-

        0.771X2-0.103X3-0.257X4+

        0.625X5+1.060X6+0.737X7-

        0.245X9-0.294X10+0.454X11+

        0.775X12+0.145X14(1)+0.065X14(2)

        2.2 模型擬合程度

        2.2.1 特異值與特殊影響案例

        本文采用Pearson殘差來判斷樣本數(shù)據(jù)是否為特異值,如圖1所示.采用杠桿度來判斷樣本數(shù)據(jù)是否屬于特殊影響案例,如圖2所示.由圖1可以看出,存在Pearson殘差值大于2的樣本數(shù)據(jù),這說明樣本數(shù)據(jù)中存在特異值.由圖2可知,樣本數(shù)據(jù)的杠桿度平均值為(14+1)/12 000=0.001 25,大于2×0.001 25=0.002 5 的觀測值(即杠桿點),因此樣本數(shù)據(jù)中可能存在特殊影響案例.

        圖1 訓練樣本數(shù)據(jù)的Pearson殘差值

        圖2 訓練樣本數(shù)據(jù)的杠桿度值

        為進一步判斷特異值是否為特殊影響案例,將特異值的序號及對應的檢驗指標都查找出來,以便更清晰地觀察檢驗結果.其中,樣本數(shù)據(jù)中共有342個特異值,但杠桿度值小于0.002 5的共15個(詳見表6),其Cook距離都小于最大值0.027 9,并且根據(jù)其各項dfbeta值可以看出,它們對系數(shù)估計的影響不太大,因此它們都不應算作特殊影響案例.

        表6 樣本數(shù)據(jù)特異值的各項檢驗指標值

        注:DFB0_1,DFB1_1,DFB2_1,DFB3_1,DFB4_1,DFB5_1,DFB6_1,DFB7_1,DFB8_1,DFB9_1,DFB10_1,DFB11_1,DFB12_1,DFB13_1,DFB14_1—刪去該案例后對各項系數(shù)估計的影響系數(shù).

        2.2.2 擬合優(yōu)度檢驗與模型預測效果判斷

        本文采用Hosmer和Lemeshow檢驗來判斷模型的擬合優(yōu)度,得出結果:卡方值為15.001;自由度為8;P值為0.059,大于0.05,這表明模型預測概率獲得的期望頻數(shù)與觀測頻數(shù)之間的差異無統(tǒng)計意義,即模型擬合程度較好.

        2.3 模型預測效果

        對保留樣本的5 000條數(shù)據(jù)進行預測準確率判斷,結果見表7.

        其中,模型對樣本數(shù)據(jù)分類情況的綜合預測準確率為68.3%,預測結果較好.

        表7 保留樣本數(shù)據(jù)預測分類情況

        注:判斷值為0.400.

        3 影響因素分析

        3.1 年齡因素

        本文考慮客戶年齡與客戶賬戶年齡(賬戶開戶最長時間)兩個年齡因素.數(shù)據(jù)分析結果表明,客戶年齡因素不具有統(tǒng)計學意義,賬戶年齡因素具有統(tǒng)計學意義.桂林[6]的研究認為,年齡因素對客戶保險購買行為有一定影響.但在本文的研究中,客戶年齡因素對于所研究的保險產(chǎn)品卻不具有統(tǒng)計學意義,此結論是否適用于其他保險產(chǎn)品,有待進一步研究.

        客戶賬戶年齡因素的兩個啞變量的回歸系數(shù)分別為-0.157和-0.142.從回歸系數(shù)可以判斷,賬戶年齡小于2.3年的客戶比大于2.3年的客戶購買保險的概率高.此結論表明,新客戶比老客戶更傾向于購買所研究的保險產(chǎn)品,但該結論是否適用于其他保險產(chǎn)品,有待進一步研究.

        3.2 賬戶或業(yè)務因素

        本文考慮的賬戶或業(yè)務因素有:支票賬戶、直接存款業(yè)務、活期儲蓄賬戶、定期儲蓄帳戶、退休金賬戶、信用卡業(yè)務、投資業(yè)務.這些因素的回歸系數(shù)分別為-0.771,-0.103,0.625,1.060,0.737,0.454,0.775.數(shù)據(jù)表明,這7個因素都具有統(tǒng)計學意義.可以看出,辦理活期存款賬戶、定期存款賬戶、退休金賬戶、信用卡業(yè)務、投資業(yè)務的客戶購買所研究保險產(chǎn)品的概率比未辦理的客戶要高.而未辦理支票賬戶、直接存款業(yè)務的客戶購買所研究保險產(chǎn)品的概率比已辦理的客戶要高.

        3.3 負債因素

        本文考慮的負債因素有:存款不足、免擔?;虻盅航杩?、分期借款、抵押借款.研究表明,免擔?;虻盅嘿J款對所研究保險產(chǎn)品的購買行為不具有統(tǒng)計學意義,而存款不足、分期借款、抵押借款因素具有統(tǒng)計學意義,這3個因素的回歸系數(shù)分別為-0.257,-0.245,-0.294.可以看出,未發(fā)生存款不足、未辦理分期借款或抵押借款的客戶購買所研究保險產(chǎn)品的概率比已發(fā)生或已辦理的客戶要高.

        3.4 信用卡積分因素

        數(shù)據(jù)表明,信用卡積分因素具有統(tǒng)計學意義,兩個啞變量的回歸系數(shù)分別為0.145與0.065.可以發(fā)現(xiàn),積分>646的客戶購買所研究保險產(chǎn)品的概率比積分≤646的客戶要高.此結論表明,與積分低的客戶相比,信用卡積分高的客戶更傾向于購買所研究的保險產(chǎn)品,但該結論是否適用于其他保險產(chǎn)品,有待進一步研究.

        3.5 住址因素

        本文考慮的住址因素有:是否搬家、是否在本地.研究表明,這兩個因素對所研究的保險產(chǎn)品購買行為不具有統(tǒng)計學意義.

        4 結 語

        本文基于一個零售銀行客戶消費數(shù)據(jù)庫中的消費數(shù)據(jù),運用Logistic回歸分析方法分析了5類16個影響因素,構建了客戶購買保險概率的預測模型.所涉及的影響因素范圍較大,構建的模型擬合程度與預測效果較好,可以為保險企業(yè)進行客戶細分和產(chǎn)品細分、研發(fā)滿足不同客戶需求的產(chǎn)品或服務、開展應用于不同客戶的主題體驗設計等方面提供科學參考.

        [1] KARL Borch.The three markets for private insurance[J].The Geneva Papers on Risk and Insurane,1981(20):7-31.

        [2] KUUSELA H,SPENCE M T.How consumer select life insurance policies:a protocol analysis[J].Journal of Professional Services Marketing,1998,18(1):49-63.

        [3] 萬晴瑤.人口、家庭結構變化對壽險消費需求的影響初探[J].上海保險,1999(11):15-17.

        [4] 張洪濤,苗力.銀行保險[M].北京:中國人民大學出版社,2005:1-100.

        [5] 黃金財.中國銀行保險發(fā)展的模式選擇[J].保險研究,2006(11):39-40.

        [6] 桂林.銀行保險消費行為研究——以重慶壽險的銀行保險為例[D].重慶:西南大學,2012.

        [7] 中國工商銀行上海市分行課題組.商業(yè)銀行財富客戶金融消費行為的統(tǒng)計與分析[J].金融論壇,2011(3):58-63.

        [8] 王濟川,郭志剛.Logistic回歸模型——方法與應用[M].北京:高等教育出版社,2001:57-218.

        [9] 于洪霞,季建華,李興.一種基于Logistic回歸的全損飛行事故分析與預測[J].中國安全科學學報,2010,20(3):34-38.

        [10] MIKE Patetta.Predictive modeling using logistic regression[M].Cary:SAS Institute Inc,2008:1-15.

        (編輯 白林雪)

        Analysis and Forecast Model of Bancassurance Consuming Behavior Based on Logistic Regression Method

        YU Hongxia1, LI Xing2

        (1.SchoolofMathematicsandPhysics,ShanghaiUniversityofElectricPower,Shanghai201300,China; 2.UnderwritingDept.ofConsumerLine,HuataiP&CInsuranceCo.Ltd,Shanghai201315,China)

        Logistic regression method is applied to analyze effect factors of bancassurance consuming behavior and build a forecast model.Then the model is tested with reserved sample.Through the diagnosis of overdispersion,zero cell count,multicollinearity,outliers,influential observations and test of level of fitness and predictive accuracy,the model is proved to be adequate and effective,indicating that 12 factors are of significance in statistics science.

        bancassurance; consuming behavior analysis; categorical variables; logistic regression method

        10.3969/j.issn.1006-4729.2017.03.019

        2015-09-09

        于洪霞(1978-),女,博士,講師,遼寧朝陽人.主要研究方向為最優(yōu)化理論及應用.E-mail:yuhongxialx@aliyun.com.

        O212;F842.6

        A

        1006-4729(2017)03-0307-06

        猜你喜歡
        模型研究
        一半模型
        FMS與YBT相關性的實證研究
        2020年國內(nèi)翻譯研究述評
        遼代千人邑研究述論
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權M-估計的漸近分布
        視錯覺在平面設計中的應用與研究
        科技傳播(2019年22期)2020-01-14 03:06:54
        EMA伺服控制系統(tǒng)研究
        新版C-NCAP側面碰撞假人損傷研究
        3D打印中的模型分割與打包
        五十路熟女一区二区三区| 国产精选自拍视频网站| 国产精品三级av及在线观看 | 欧洲-级毛片内射| 久久亚洲国产成人精品v| 亚洲国产高清一区av| 妺妺窝人体色www在线| 国产亚洲精品久久777777| 欧美在线观看一区二区| 久久精品国产亚洲av热九| 手机av在线中文字幕| 国产人妻丰满熟妇嗷嗷叫| 无码不卡高清毛片免费 | 在线视频99| 日本久久精品在线播放| 国产熟人精品一区二区| 亚洲人成人网站在线观看| 亚洲片一区二区三区| 成人性生交c片免费看| 久久精品国产熟女亚洲| 柠檬福利第一导航在线| 加勒比精品久久一区二区三区| 麻豆国产成人av高清在线| 日本添下边视频全过程| 国产成人综合色在线观看网站| 久久久精品456亚洲影院| 加勒比av在线一区二区| 亚洲熟妇色自偷自拍另类| 精品国产精品久久一区免费式| 美女极度色诱视频国产免费| 一区二区中文字幕在线观看污污| 中文字幕一区日韩精品| 麻豆91免费视频| 国产精品高清一区二区三区人妖| 日韩精品 在线 国产 丝袜| 亚洲 自拍 另类 欧美 综合 | 一级无码啪啪| 国产一区二区三区激情视频| 粗壮挺进人妻水蜜桃成熟漫画| 九九久久国产精品大片| 少妇人妻无一区二区三区|