羅明明
【摘要】本文基于數(shù)據(jù)挖掘原理,運(yùn)用邏輯回歸的方法對(duì)電子銀行開(kāi)通率及其相關(guān)因素進(jìn)行分析。運(yùn)用基于熵的離散化算法( EBD)對(duì)連續(xù)型變量進(jìn)行最優(yōu)分段,利用變量IV值進(jìn)行變量篩選,建立邏輯回歸模型。結(jié)果表明,年齡、開(kāi)通第三方支付、動(dòng)賬流水次數(shù)、日均貸款余額、是否代發(fā)工資是影響客戶(hù)開(kāi)通電子銀行的五大個(gè)因素:從預(yù)測(cè)效果上看,所得模型對(duì)客戶(hù)是否開(kāi)通電子銀行具有較好的預(yù)測(cè)效果。
【關(guān)鍵詞】手機(jī)銀行;精準(zhǔn)營(yíng)銷(xiāo);邏輯回歸:證據(jù)權(quán)重
1引言
進(jìn)入21世紀(jì)以來(lái),隨著信息技術(shù)的高速發(fā)展和網(wǎng)絡(luò)技術(shù)的廣泛應(yīng)用,網(wǎng)絡(luò)已日漸成為人們生活中不可或缺的部分。手機(jī)銀行具有效率高、使用便捷、成本低的特點(diǎn),可以滿(mǎn)足廣大客戶(hù)的不同需求,并且可以真正做到“隨時(shí)隨地隨心”的使用。未來(lái)的手機(jī)銀行的發(fā)展趨勢(shì)必然是逐步替代銀行傳統(tǒng)柜臺(tái)業(yè)務(wù)。但是這幾年由于第三方支付和互聯(lián)網(wǎng)金融的沖擊,國(guó)內(nèi)手機(jī)銀行業(yè)務(wù)的發(fā)展勢(shì)頭減緩,如2016年個(gè)人網(wǎng)銀活動(dòng)客戶(hù)比例為79%.白2013年呈逐年下降的趨勢(shì);交易用戶(hù)比例61%,回落到2011-2012年的水平。下降的主要原因是以支付寶、微信支付為代表的第三方支付廣泛應(yīng)用對(duì)電子銀行渠道的替代效應(yīng),用戶(hù)認(rèn)為有一種電子渠道即可,不需要保留電子銀行。面對(duì)市場(chǎng)的沖擊,如何精準(zhǔn)的捕獲潛在的手機(jī)銀行客戶(hù)進(jìn)行精準(zhǔn)營(yíng)銷(xiāo)成為商業(yè)銀行推廣手機(jī)銀行業(yè)務(wù)時(shí)面臨的一個(gè)重要現(xiàn)實(shí)問(wèn)題。
2文獻(xiàn)綜述
學(xué)術(shù)界對(duì)于手機(jī)銀行的采納意向的研究由來(lái)已久,但是比較而言,國(guó)外學(xué)術(shù)界對(duì)于該領(lǐng)域的研究起步較早、研究較深取得了豐富的成果。SylvieLaloret等(2005)對(duì)中國(guó)電子銀行用戶(hù)進(jìn)行研究發(fā)現(xiàn):與西方國(guó)家相比中國(guó)電子銀行用戶(hù)以男性為主,安全是影響客戶(hù)接受電子銀行的最大的障礙,風(fēng)險(xiǎn)感知、信息技術(shù)和中國(guó)傳統(tǒng)的現(xiàn)金支付的觀(guān)念是影響人們采納電子銀行的主要因素。Ja-ChulGu等(2009)利用技術(shù)接受模型(TAM)對(duì)影響手機(jī)銀行采納意向的因素進(jìn)行分析,發(fā)現(xiàn):自我效能是感知易用性的最大影響因素,其間接影響消費(fèi)者采納:結(jié)構(gòu)保證是影響信任的最大因素,信任的增加使得消費(fèi)者采納手機(jī)銀行的可能性大大增加。ITMTiago OI-iveira等(2014)在波蘭對(duì)手機(jī)銀行的采納意向研究中進(jìn)一步擴(kuò)大了組合模型的內(nèi)容,將整合型科技接受模式(U TA U'l')、任務(wù)技術(shù)適配模型(TTF)和最初信任模型(ITM)進(jìn)行整合用于其研究中,研究發(fā)現(xiàn):便利條件和行為意向直接影響手機(jī)銀行的采納,最初的信任、績(jī)效期望、技術(shù)特性和任務(wù)技術(shù)適配度對(duì)行為意向存在顯著性的影響。Daniel Mehrad等(2017)運(yùn)用結(jié)構(gòu)方程和路徑分析的方法在伊朗對(duì)口碑營(yíng)銷(xiāo)對(duì)手機(jī)銀行接受的影響進(jìn)行分析,結(jié)果發(fā)現(xiàn):口碑是影響消費(fèi)者使用手機(jī)銀行態(tài)度的主要因素。
國(guó)內(nèi)對(duì)于該領(lǐng)域的研究起步較晚,且研究的人較少,并且主要以碩士畢業(yè)論文為主。謝濱等( 2009)在技術(shù)技術(shù)模型(TAM)的基礎(chǔ)上,將相容性、速度、自我能力作為外生變量對(duì)手機(jī)銀行的采納意向進(jìn)行研究,發(fā)現(xiàn)有用性對(duì)手機(jī)銀行的采納行為有決定性的影響,易用性和成本因素對(duì)手機(jī)銀行的采納影響不顯著性,風(fēng)險(xiǎn)因素對(duì)手機(jī)銀行的采納具有負(fù)面影響。百璇等(2010)將銀行品牌資產(chǎn)和運(yùn)營(yíng)商服務(wù)質(zhì)量作為T(mén)AM模型的外生變量納入其研究模型中,發(fā)現(xiàn)有用性是影響消費(fèi)者使用手機(jī)銀行意向最直接最顯著的因素:銀行的品牌和手機(jī)運(yùn)營(yíng)商服務(wù)質(zhì)量同消費(fèi)者感知手機(jī)安全存在顯著性正相關(guān),對(duì)手機(jī)銀行的采納意向存在間接影響。俞明南等(2014)從個(gè)人用戶(hù)角度出發(fā)將理性行為理論、技術(shù)接受模型、計(jì)劃行為理論進(jìn)行整合構(gòu)建了影響手機(jī)銀行使用意向的多因素模型,并且將文化價(jià)值觀(guān)作為調(diào)節(jié)變量納入模型中。
通過(guò)研究國(guó)內(nèi)外關(guān)于手機(jī)銀行采納意向的研究成果,我們發(fā)現(xiàn)關(guān)于該領(lǐng)域的研究主要從個(gè)人用戶(hù)的角度出發(fā),依托相關(guān)的理論模型,基于消費(fèi)者的主觀(guān)感受對(duì)影響對(duì)手機(jī)銀行采納意向的因素及路徑進(jìn)行分析,其采取的方法基本為調(diào)查問(wèn)卷法,運(yùn)用結(jié)構(gòu)方程對(duì)相關(guān)假設(shè)進(jìn)行檢驗(yàn)。但是這種方式忽略了消費(fèi)者的其他屬性對(duì)其是否開(kāi)通手機(jī)銀行的影響,如消費(fèi)者的財(cái)務(wù)數(shù)據(jù),行為數(shù)據(jù)等,除此之外目前的研究成果只能對(duì)銀行進(jìn)行理論上的指導(dǎo),缺乏針對(duì)實(shí)踐的應(yīng)用性指導(dǎo)。因此本文從某信用社的數(shù)據(jù)庫(kù)中,利用脫敏后的消費(fèi)者相關(guān)財(cái)務(wù)數(shù)據(jù),基于數(shù)據(jù)挖掘的思想和方法對(duì)銀行客戶(hù)是否開(kāi)通手機(jī)銀行進(jìn)行分析和預(yù)測(cè),希望本次研究的成果對(duì)商業(yè)銀行在手機(jī)銀行營(yíng)銷(xiāo)中的實(shí)踐提供一定的指導(dǎo)。
3數(shù)據(jù)的預(yù)處理
3.1缺失值和極端值的處理
根據(jù)對(duì)數(shù)據(jù)的初步統(tǒng)計(jì)發(fā)現(xiàn)只有城鄉(xiāng)標(biāo)識(shí)變量X3有1007個(gè)缺失值,占樣本總量的比例很小僅為1.07%,因此針對(duì)存在缺失值的樣本進(jìn)行了刪除處理。異常值會(huì)對(duì)模型的結(jié)果產(chǎn)生負(fù)面影響,本文在進(jìn)行異常值處理時(shí),把變量99%百分位數(shù)作為標(biāo)準(zhǔn),大于該標(biāo)準(zhǔn)值的值即為極端值,最后將極端值等于變量的99%百分位數(shù)。這種處理方法能夠涵蓋99%的原有信息,具有信息損失較小的優(yōu)點(diǎn)。
3.2變量的篩選
利用sas9.4軟件根據(jù)基于熵的連續(xù)變量離散化理論對(duì)連續(xù)變量進(jìn)行分組處理。設(shè)置分組數(shù)為100,根據(jù)分組的結(jié)果,運(yùn)行求出變量的IV值,根據(jù)IV值的大小對(duì)變量的預(yù)測(cè)能力進(jìn)行評(píng)價(jià),剔除預(yù)測(cè)能力較差的變量。根據(jù)相關(guān)的文獻(xiàn)研究,當(dāng)IV值低于0.02的變量沒(méi)有預(yù)測(cè)力,可以直接剔除此類(lèi)變量,在本文中經(jīng)過(guò)IV值篩選后還有21個(gè)變量。 3.3數(shù)據(jù)分區(qū) 經(jīng)過(guò)對(duì)數(shù)據(jù)的初步整理與指標(biāo)篩選,剩余樣本量為98993。本文對(duì)樣本進(jìn)行分區(qū),采取的是分層抽樣的方法,抽取樣本的80%作為建立模型的訓(xùn)練集train,剩下的20%的樣本作為檢驗(yàn)?zāi)P途群头€(wěn)定性的測(cè)試集test。
4 Logistie回歸模型的建立
4.1參數(shù)的擬合
利用sas9.4統(tǒng)計(jì)軟件,采取逐步篩選法對(duì)進(jìn)入模型的變量進(jìn)行逐步的篩選,為了矯正模型擬合過(guò)程中因?yàn)榉謱映闃赢a(chǎn)生的偏好問(wèn)題,設(shè)置先驗(yàn)概率為8.63%對(duì)模型進(jìn)行矯正,先驗(yàn)概率是根據(jù)該銀行客戶(hù)中只有8.63%的客戶(hù)開(kāi)通了手機(jī)銀行。具體變量的模型如下
其中l(wèi)ogit=ln(Pp).p指客戶(hù)開(kāi)通手機(jī)銀行的概率。
4.2影響因素的分析
各變量標(biāo)準(zhǔn)化系數(shù)在一定程度上反映各變量影響力的大小。我們選取標(biāo)準(zhǔn)化同歸系數(shù)最大的5個(gè)影響因素。
從表1可以看出對(duì)消費(fèi)者開(kāi)通手機(jī)銀行影響力最大的5個(gè)因素根據(jù)其影響力大小分別為:年齡、是否開(kāi)通第三方支付、動(dòng)賬流水次數(shù)、半年日均貸款余額、是否代發(fā)工資。結(jié)合業(yè)務(wù)現(xiàn)實(shí)情況我們也可以發(fā)現(xiàn)年輕人由于對(duì)新事物具有強(qiáng)烈的好奇心和探索欲,經(jīng)常接觸新事物因此其開(kāi)通手機(jī)銀行的可能性最高,反之老年人由于思想保守,對(duì)新事物缺乏認(rèn)識(shí),學(xué)習(xí)能力下降其對(duì)于手機(jī)銀行開(kāi)通的可能性最小。另外開(kāi)通第三方支付,動(dòng)賬流水次數(shù)等其他4個(gè)因素和手機(jī)銀行的功能高度切合,是消費(fèi)者使用手機(jī)銀行的最大需求之一,因此這4個(gè)因素對(duì)消費(fèi)者開(kāi)通手機(jī)銀行存在這較大的影響。
4.3模型的評(píng)估
本文主要使用混淆矩陣,roc曲線(xiàn),ks值來(lái)評(píng)價(jià)所建立模型的預(yù)測(cè)效果,得出的混淆矩陣如下表2。
由混淆矩陣計(jì)算出指標(biāo)sentivity= 0.4428;speeifieity=0.89;ospv= 0.806;aee= 0.665。模型的ROC曲線(xiàn)的AUC值等于0.768,KS= 0.388,綜合以上評(píng)價(jià)指標(biāo)可以發(fā)現(xiàn)本文建立的邏輯回歸模型對(duì)消費(fèi)者是否開(kāi)通手機(jī)銀行具有較強(qiáng)的預(yù)測(cè)能力。
5結(jié)論和建議
本文研究基于某農(nóng)信社的數(shù)據(jù),借鑒信用評(píng)分卡領(lǐng)域運(yùn)用很成功的證據(jù)權(quán)重對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)化,建立邏輯回歸模型,對(duì)影響客戶(hù)開(kāi)通電子銀行的因素進(jìn)行分析,在此基礎(chǔ)上對(duì)客戶(hù)是否開(kāi)通手機(jī)銀行進(jìn)行預(yù)測(cè)。結(jié)論主要有以下兩點(diǎn):
(1)從各因素與開(kāi)通手機(jī)銀行的關(guān)系上看,年齡、是否開(kāi)通第三方支付的客戶(hù)、動(dòng)賬流水次數(shù)、日均貸款余額,是否代發(fā)工資對(duì)客戶(hù)是否開(kāi)通手機(jī)銀行存在較大的影響。
(2)本文所建立的邏輯回歸模型利用客戶(hù)的財(cái)務(wù)數(shù)據(jù)對(duì)消費(fèi)者是否開(kāi)通手機(jī)銀行具有較強(qiáng)的預(yù)測(cè)效果。
在互聯(lián)網(wǎng)金融飛速發(fā)展的今天,通過(guò)運(yùn)用數(shù)據(jù)挖掘技術(shù),搜集客戶(hù)信息,對(duì)海量的非標(biāo)準(zhǔn)化數(shù)據(jù)進(jìn)行提取、歸類(lèi),對(duì)于商業(yè)銀行低成本、高效地進(jìn)行營(yíng)銷(xiāo),從而更好、更快的提高客戶(hù)電子銀行開(kāi)通率具有很強(qiáng)的現(xiàn)實(shí)意義。由于本次研究所使用的數(shù)據(jù)僅僅來(lái)自某農(nóng)信社,具有一定的區(qū)域性特點(diǎn),所用方法比較單一,存在較多的改進(jìn)空間。
參考文獻(xiàn):
[1]2016中國(guó)電子銀行調(diào)查報(bào)告[EB/OL]( http://www.360doc.com/ content/16/1220/14/828882_616270699.shtml)
[2]賀躍,鄭建軍,朱蕾.一種基于熵的連續(xù)屬性離散化算法[J].計(jì)算機(jī)應(yīng)用,2005,( 03):637-638+651
[3] Sylvie Laforet,Xiaoyan Li Consumers' attitudes towards online and mo- bile banking in China Intemational Journal of Bank Marketing,2005 ,23(5):362-380
[4] Ja-Chul Gu, Sang-Chul Lee, Yung-Ho Suh Determinants of behavioral intention to mohile hanking, Expert Systems with Applications,2009 (36):11605-11616